亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
上下文:無形框架
工程現(xiàn)實(shí)世界情報(bào)
現(xiàn)實(shí)錨定AI
首頁 科技周邊 人工智能 在上下文中餓了,AI在最重要的地方失敗了

在上下文中餓了,AI在最重要的地方失敗了

Jul 30, 2025 am 11:08 AM

在上下文中餓了,AI在最重要的地方失敗了

2024年底,德克薩斯州檢察長(zhǎng)肯·帕克斯頓(Ken Paxton)透露了一個(gè)具有里程碑意義的定居點(diǎn),該定居點(diǎn)是一家總部位于達(dá)拉斯的Health-Tech創(chuàng)業(yè)公司,該公司促進(jìn)了其AI驅(qū)動(dòng)的臨床助理幾乎沒有錯(cuò)誤,并以100,000分之一的價(jià)格宣傳了“嚴(yán)重幻覺率”。

但是,國(guó)家的調(diào)查發(fā)現(xiàn),該公司的主張沒有得到可靠的證據(jù)的支持。當(dāng)局確定,部件誤導(dǎo)了醫(yī)院,以為該工具可以準(zhǔn)確地總結(jié)患者記錄的可靠性,從而可靠性。

盡管沒有病人受傷,也沒有受到處罰,但對(duì)準(zhǔn)確性,風(fēng)險(xiǎn)和適當(dāng)用法的更清晰披露的披露表示同意,這是一個(gè)重要的法律先例,表明理論績(jī)效并不等于現(xiàn)實(shí)世界的有效性。

認(rèn)知科學(xué)家和人工智能評(píng)論家加里·馬庫斯(Gary Marcus)等專家長(zhǎng)期以來一直警告說,當(dāng)前的大型語言模型本質(zhì)上受到了限制。正如他所說,這些系統(tǒng)是“語言使用的近似值” ,而不是真實(shí)的語言理解,這是當(dāng)在高度專業(yè)化的環(huán)境中應(yīng)用通用模型并且無法掌握實(shí)際工作的發(fā)展時(shí),這種差異變得特別冒險(xiǎn)。

根據(jù)Twoford Health的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Gal Steinberg的說法,許多AI缺點(diǎn)的根源不是有缺陷的算法。缺乏背景。他解釋說:“因?yàn)?模型'僅檢測(cè)模式,而不是意圖?!?“ AI可以高精度地預(yù)測(cè)單詞或點(diǎn)擊,但仍然對(duì)定義診所或任何組織的規(guī)定,工作流和不成文規(guī)則視而不見。當(dāng)優(yōu)化忽略這些現(xiàn)實(shí)時(shí),AI會(huì)符合其KPI,但會(huì)忽略重點(diǎn)?!?/p>

上下文:無形框架

Steinberg將上下文定義為“電子表格省略的所有內(nèi)容 - 目標(biāo),邊界,行話,情感語氣,合規(guī)性要求和時(shí)機(jī)”。

當(dāng)AI系統(tǒng)表現(xiàn)不佳時(shí),這很少是由于處理能力不足,而是情況不足。他們?nèi)狈ξ幕R(shí),特定領(lǐng)域的微妙之處或人類專業(yè)人士自然吸收的時(shí)間敏感理解。例如,在治療課程中90秒的沉默可能表明困擾。對(duì)于AI成績(jī)單生成器,它只是空的空間。在財(cái)務(wù)審計(jì)中,缺失的縮寫可能表明欺騙。對(duì)于接受廣泛互聯(lián)網(wǎng)文本培訓(xùn)的模型,這似乎是一個(gè)瑣碎的首字母縮寫詞。

這就是為什么在雙重健康方面,團(tuán)隊(duì)開始問三個(gè)基本問題:誰參與其中?他們想實(shí)現(xiàn)什么?如果AI弄錯(cuò)了什么后果?

斯坦伯格強(qiáng)調(diào),另一個(gè)關(guān)鍵問題是,大多數(shù)組織將上下文視為一次性設(shè)置任務(wù)。但是環(huán)境發(fā)展。政策轉(zhuǎn)移。需求轉(zhuǎn)變。他說:“如果您不斷地完善您的提示并重新訓(xùn)練模型,那么AI會(huì)漂移?!?/p>

這就是為什么這么多早期的AI計(jì)劃現(xiàn)在被遺棄的原因。 Rand Corporation報(bào)告說,超過80%的AI項(xiàng)目失敗或失速 - 不是因?yàn)樵摷夹g(shù)不起作用,而是因?yàn)槭苓^培訓(xùn)的環(huán)境不再反映了運(yùn)營(yíng)現(xiàn)實(shí)。結(jié)果?在紙面上看起來正確但在實(shí)踐中失敗的AI,就像演員在錯(cuò)誤階段背誦線條一樣。

工程現(xiàn)實(shí)世界情報(bào)

Steinberg認(rèn)為,該修復(fù)程序不僅僅是建立更智能的模型,而且還以更深入的環(huán)境意識(shí)嵌入。他說:“這首先是將領(lǐng)域?qū)<抑苯訁⑴cAI開發(fā)過程。雙方的臨床醫(yī)生(而不是工程師)導(dǎo)致工作的關(guān)鍵部分。他們通過生活經(jīng)驗(yàn)向AI傳授了醫(yī)學(xué)語言,道德界限和監(jiān)管框架?!?/p>

然后是一個(gè)很少成為頭條新聞的被忽視,無情的勞動(dòng):確定哪些罕見情況很重要,標(biāo)準(zhǔn)化非正式的言語或意識(shí)到形式的布局比其包含的數(shù)據(jù)更重要。這些選擇似乎很小,直到它們級(jí)聯(lián)陷入系統(tǒng)性錯(cuò)誤。

先前的研究表明,在廣泛數(shù)據(jù)集中訓(xùn)練的AI模型通常會(huì)在利基環(huán)境中行為不可預(yù)測(cè),這是一種稱為域轉(zhuǎn)移的挑戰(zhàn)。在一項(xiàng)著名的研究中,來自Google和Stanford的科學(xué)家觀察到,現(xiàn)代機(jī)器學(xué)習(xí)模型經(jīng)?!爸付ā?,這意味著它們通過了內(nèi)部測(cè)試,但在現(xiàn)實(shí)世界中會(huì)崩潰。

在諸如醫(yī)療保健和金融等高風(fēng)險(xiǎn)領(lǐng)域,決定承擔(dān)法律責(zé)任,即使是小小的不準(zhǔn)確性也是不可接受的。該差距是制定中的訴訟。

甚至META的首席AI科學(xué)家Yann Lecun也公開批評(píng)了急于部署大型模型的情況,而無需將其扎根。萊肯(Lecun)于2025年4月在新加坡國(guó)立大學(xué)發(fā)表講話時(shí),質(zhì)疑更大的模型等于AI的廣泛假設(shè):“您不能假設(shè)更多的數(shù)據(jù)和更多的計(jì)算能力會(huì)自動(dòng)導(dǎo)致更智能的系統(tǒng)?!?/p>

他強(qiáng)調(diào)說,盡管擴(kuò)展有助于完成基本任務(wù),但它不能解決現(xiàn)實(shí)生活中的復(fù)雜性 - 兩身,適應(yīng)和推理。取而代之的是,他呼吁“能夠按照人類的方式進(jìn)行計(jì)劃,推理和理解環(huán)境?!?/p>

然而,根據(jù)思科的2024年AI準(zhǔn)備指數(shù),有98%的業(yè)務(wù)領(lǐng)導(dǎo)者報(bào)告說,采用AI的壓力增加了 - 通常沒有明確的指標(biāo),監(jiān)督或問責(zé)制結(jié)構(gòu)。在這樣的氣候下,背景成為事后的想法也就不足為奇了。

這就是Steinberg想要強(qiáng)調(diào)的危險(xiǎn):不僅是AI可能會(huì)產(chǎn)生虛假信息,而且組織中沒有人準(zhǔn)備在此時(shí)承擔(dān)責(zé)任。他說:“我們過于關(guān)注精確度,而對(duì)所有權(quán)的關(guān)注度太少?!?“上下文不僅知道正確的答案,還知道當(dāng)答案錯(cuò)誤時(shí),誰會(huì)回答損害。首先確定該問責(zé)制,您的人工智能從第一天起就會(huì)得到更豐富,更負(fù)責(zé)任的上下文飲食?!?/p>

現(xiàn)實(shí)錨定AI

上下文不是通過添加更多參數(shù)或GPU功率來創(chuàng)建上下文。它來自將AI視為需要持續(xù)人類指導(dǎo)的動(dòng)態(tài)系統(tǒng),而不僅僅是初步培訓(xùn)。這是由于將人(不僅提示)放置在反饋循環(huán)中。

人工智能本質(zhì)上并不是有缺陷的。但是沒有上下文,它就像是一樣。答案不是盲人信任。更好的營(yíng)養(yǎng),定期進(jìn)行監(jiān)測(cè),并確保當(dāng)AI過度自信時(shí)總會(huì)有人在觀看。

斯坦伯格說:“因?yàn)檫_(dá)到目標(biāo)但錯(cuò)過目標(biāo)的模型不僅浪費(fèi)。這很危險(xiǎn)?!?/p>

以上是在上下文中餓了,AI在最重要的地方失敗了的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請(qǐng)聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

AI投資者停滯不前? 3條購(gòu)買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 AI投資者停滯不前? 3條購(gòu)買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 Jul 02, 2025 am 11:13 AM

投資蓬勃發(fā)展,但僅資本還不夠。隨著估值的上升和獨(dú)特性的衰落,以AI為中心的風(fēng)險(xiǎn)投資的投資者必須做出關(guān)鍵決定:購(gòu)買,建立或合作伙伴才能獲得優(yōu)勢(shì)?這是評(píng)估每個(gè)選項(xiàng)和PR的方法

AGI和AI超級(jí)智能將嚴(yán)重?fù)糁腥祟愄旎ò宓募僭O(shè)障礙 AGI和AI超級(jí)智能將嚴(yán)重?fù)糁腥祟愄旎ò宓募僭O(shè)障礙 Jul 04, 2025 am 11:10 AM

讓我們來談?wù)劇? 對(duì)創(chuàng)新AI突破的分析是我正在進(jìn)行的AI中正在進(jìn)行的福布斯列覆蓋的一部分,包括識(shí)別和解釋各種有影響力的AI復(fù)雜性(請(qǐng)參閱此處的鏈接)。 前往Agi和

Kimi K2:最強(qiáng)大的開源代理模型 Kimi K2:最強(qiáng)大的開源代理模型 Jul 12, 2025 am 09:16 AM

還記得今年早些時(shí)候破壞了Genai行業(yè)的大量開源中國(guó)模型嗎?盡管DeepSeek占據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

未來預(yù)測(cè)從AI到AGI的道路上的大規(guī)模情報(bào)爆炸 未來預(yù)測(cè)從AI到AGI的道路上的大規(guī)模情報(bào)爆炸 Jul 02, 2025 am 11:19 AM

讓我們來談?wù)劇? 對(duì)創(chuàng)新AI突破的分析是我正在進(jìn)行的AI中正在進(jìn)行的福布斯列覆蓋的一部分,包括識(shí)別和解釋各種有影響力的AI復(fù)雜性(請(qǐng)參閱此處的鏈接)。對(duì)于那些讀者

Grok 4 vs Claude 4:哪個(gè)更好? Grok 4 vs Claude 4:哪個(gè)更好? Jul 12, 2025 am 09:37 AM

到2025年中期,AI“軍備競(jìng)賽”正在加熱,XAI和Anthropic都發(fā)布了他們的旗艦車型Grok 4和Claude 4。這兩種模型處于設(shè)計(jì)理念和部署平臺(tái)的相反端,但他們卻在

推理模型的思想鏈可能無法長(zhǎng)期解決 推理模型的思想鏈可能無法長(zhǎng)期解決 Jul 02, 2025 am 11:18 AM

例如,如果您向模型提出一個(gè)問題,例如:“(x)人在(x)公司做什么?”您可能會(huì)看到一個(gè)看起來像這樣的推理鏈,假設(shè)系統(tǒng)知道如何檢索必要的信息:找到有關(guān)CO的詳細(xì)信息

這家初創(chuàng)公司在印度建立了一家醫(yī)院來測(cè)試其AI軟件 這家初創(chuàng)公司在印度建立了一家醫(yī)院來測(cè)試其AI軟件 Jul 02, 2025 am 11:14 AM

臨床試驗(yàn)是藥物開發(fā)中的巨大瓶頸,Kim和Reddy認(rèn)為他們?cè)赑I Health建立的AI-Spainite軟件可以通過擴(kuò)大潛在符合條件的患者的庫來更快,更便宜。但是

參議院殺死了特朗普的預(yù)算法案中的10年州AI禁令 參議院殺死了特朗普的預(yù)算法案中的10年州AI禁令 Jul 02, 2025 am 11:16 AM

參議院星期二早上以99-1投票,殺死了暫停,在倡導(dǎo)團(tuán)體,立法者和成千上萬的美國(guó)人中的最后一分鐘的騷動(dòng)中,他們將其視為危險(xiǎn)的過度。他們沒有保持安靜。參議院傾聽。國(guó)家保持

See all articles