亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
上下文:無形框架
工程現(xiàn)實世界情報
現(xiàn)實錨定AI
首頁 科技週邊 人工智慧 在上下文中餓了,AI在最重要的地方失敗了

在上下文中餓了,AI在最重要的地方失敗了

Jul 30, 2025 am 11:08 AM

在上下文中餓了,AI在最重要的地方失敗了

2024年底,德克薩斯州檢察長肯·帕克斯頓(Ken Paxton)透露了一個具有里程碑意義的定居點,該定居點是一家總部位於達拉斯的Health-Tech創(chuàng)業(yè)公司,該公司促進了其AI驅(qū)動的臨床助理幾乎沒有錯誤,並以100,000分之一的價格宣傳了“嚴重幻覺率”。

但是,國家的調(diào)查發(fā)現(xiàn),該公司的主張沒有得到可靠的證據(jù)的支持。當局確定,部件誤導了醫(yī)院,以為該工具可以準確地總結(jié)患者記錄的可靠性,從而可靠性。

儘管沒有病人受傷,也沒有受到處罰,但對準確性,風險和適當用法的更清晰披露的披露表示同意,這是一個重要的法律先例,表明理論績效並不等於現(xiàn)實世界的有效性。

認知科學家和人工智能評論家加里·馬庫斯(Gary Marcus)等專家長期以來一直警告說,當前的大型語言模型本質(zhì)上受到了限制。正如他所說,這些系統(tǒng)是“語言使用的近似值” ,而不是真實的語言理解,這是當在高度專業(yè)化的環(huán)境中應用通用模型並且無法掌握實際工作的發(fā)展時,這種差異變得特別冒險。

根據(jù)Twoford Health的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Gal Steinberg的說法,許多AI缺點的根源不是有缺陷的算法。缺乏背景。他解釋說:“因為'模型'僅檢測模式,而不是意圖?!?“ AI可以高精度地預測單詞或點擊,但仍然對定義診所或任何組織的規(guī)定,工作流和不成文規(guī)則視而不見。當優(yōu)化忽略這些現(xiàn)實時,AI會符合其KPI,但會忽略重點?!?/p>

上下文:無形框架

Steinberg將上下文定義為“電子表格省略的所有內(nèi)容 - 目標,邊界,行話,情感語氣,合規(guī)性要求和時機”。

AI系統(tǒng)表現(xiàn)不佳時,這很少是由於處理能力不足,而是情況不足。他們?nèi)狈ξ幕R,特定領(lǐng)域的微妙之處或人類專業(yè)人士自然吸收的時間敏感理解。例如,在治療課程中90秒的沉默可能表明困擾。對於AI成績單生成器,它只是空的空間。在財務審計中,缺失的縮寫可能表明欺騙。對於接受廣泛互聯(lián)網(wǎng)文本培訓的模型,這似乎是一個瑣碎的首字母縮寫詞。

這就是為什麼在雙重健康方面,團隊開始問三個基本問題:誰參與其中?他們想實現(xiàn)什麼?如果AI弄錯了什麼後果?

斯坦伯格強調(diào),另一個關(guān)鍵問題是,大多數(shù)組織將上下文視為一次性設(shè)置任務。但是環(huán)境發(fā)展。政策轉(zhuǎn)移。需求轉(zhuǎn)變。他說:“如果您不斷地完善您的提示並重新訓練模型,那麼AI會漂移?!?/p>

這就是為什麼這麼多早期的AI計劃現(xiàn)在被遺棄的原因。 Rand Corporation報告說,超過80%的AI項目失敗或失速 - 不是因為該技術(shù)不起作用,而是因為受過培訓的環(huán)境不再反映了運營現(xiàn)實。結(jié)果?在紙面上看起來正確但在實踐中失敗的AI,就像演員在錯誤階段背誦線條一樣。

工程現(xiàn)實世界情報

Steinberg認為,該修復程序不僅僅是建立更智能的模型,而且還以更深入的環(huán)境意識嵌入。他說:“這首先是將領(lǐng)域?qū)<抑苯訁⑴cAI開發(fā)過程。雙方的臨床醫(yī)生(而不是工程師)導致工作的關(guān)鍵部分。他們通過生活經(jīng)驗向AI傳授了醫(yī)學語言,道德界限和監(jiān)管框架?!?/p>

然後是一個很少成為頭條新聞的被忽視,無情的勞動:確定哪些罕見情況很重要,標準化非正式的言語或意識到形式的佈局比其包含的數(shù)據(jù)更重要。這些選擇似乎很小,直到它們級聯(lián)陷入系統(tǒng)性錯誤。

先前的研究表明,在廣泛數(shù)據(jù)集中訓練的AI模型通常會在利基環(huán)境中行為不可預測,這是一種稱為域轉(zhuǎn)移的挑戰(zhàn)。在一項著名的研究中,來自Google和Stanford的科學家觀察到,現(xiàn)代機器學習模型經(jīng)?!爸付ā?,這意味著它們通過了內(nèi)部測試,但在現(xiàn)實世界中會崩潰。

在諸如醫(yī)療保健和金融等高風險領(lǐng)域,決定承擔法律責任,即使是小小的不準確性也是不可接受的。該差距是製定中的訴訟。

甚至META的首席AI科學家Yann Lecun也公開批評了急於部署大型模型的情況,而無需將其紮根。萊肯(Lecun)於2025年4月在新加坡國立大學發(fā)表講話時,質(zhì)疑更大的模型等於AI的廣泛假設(shè):“您不能假設(shè)更多的數(shù)據(jù)和更多的計算能力會自動導致更智能的系統(tǒng)?!?/p>

他強調(diào)說,儘管擴展有助於完成基本任務,但它不能解決現(xiàn)實生活中的複雜性 - 兩身,適應和推理。取而代之的是,他呼籲“能夠按照人類的方式進行計劃,推理和理解環(huán)境?!?/p>

然而,根據(jù)思科的2024年AI準備指數(shù),有98%的業(yè)務領(lǐng)導者報告說,採用AI的壓力增加了 - 通常沒有明確的指標,監(jiān)督或問責制結(jié)構(gòu)。在這樣的氣候下,背景成為事後的想法也就不足為奇了。

這就是Steinberg想要強調(diào)的危險:不僅是AI可能會產(chǎn)生虛假信息,而且組織中沒有人準備在此時承擔責任。他說:“我們過於關(guān)注精確度,而對所有權(quán)的關(guān)注度太少?!?“上下文不僅知道正確的答案,還知道當答案錯誤時,誰會回答損害。首先確定該問責制,您的人工智能從第一天起就會得到更豐富,更負責任的上下文飲食?!?/p>

現(xiàn)實錨定AI

上下文不是通過添加更多參數(shù)或GPU功率來創(chuàng)建上下文。它來自將AI視為需要持續(xù)人類指導的動態(tài)系統(tǒng),而不僅僅是初步培訓。這是由於將人(不僅提示)放置在反饋循環(huán)中。

人工智能本質(zhì)上並不是有缺陷的。但是沒有上下文,它就像是一樣。答案不是盲人信任。更好的營養(yǎng),定期進行監(jiān)測,並確保當AI過度自信時總會有人在觀看。

斯坦伯格說:“因為達到目標但錯過目標的模型不僅浪費。這很危險。”

以上是在上下文中餓了,AI在最重要的地方失敗了的詳細內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔相應的法律責任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

AI投資者停滯不前? 3條購買,建造或與人工智能供應商合作的戰(zhàn)略途徑 AI投資者停滯不前? 3條購買,建造或與人工智能供應商合作的戰(zhàn)略途徑 Jul 02, 2025 am 11:13 AM

投資蓬勃發(fā)展,但僅資本還不夠。隨著估值的上升和獨特性的衰落,以AI為中心的風險投資的投資者必須做出關(guān)鍵決定:購買,建立或合作夥伴才能獲得優(yōu)勢?這是評估每個選項和PR的方法

AGI和AI超級智能將嚴重擊中人類天花板的假設(shè)障礙 AGI和AI超級智能將嚴重擊中人類天花板的假設(shè)障礙 Jul 04, 2025 am 11:10 AM

讓我們來談談。 對創(chuàng)新AI突破的分析是我正在進行的AI中正在進行的福布斯列覆蓋的一部分,包括識別和解釋各種有影響力的AI複雜性(請參閱此處的鏈接)。 前往Agi和

Kimi K2:最強大的開源代理模型 Kimi K2:最強大的開源代理模型 Jul 12, 2025 am 09:16 AM

還記得今年早些時候破壞了Genai行業(yè)的大量開源中國模型嗎?儘管DeepSeek佔據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

未來預測從AI到AGI的道路上的大規(guī)模情報爆炸 未來預測從AI到AGI的道路上的大規(guī)模情報爆炸 Jul 02, 2025 am 11:19 AM

讓我們來談談。 對創(chuàng)新AI突破的分析是我正在進行的AI中正在進行的福布斯列覆蓋的一部分,包括識別和解釋各種有影響力的AI複雜性(請參閱此處的鏈接)。對於那些讀者

Grok 4 vs Claude 4:哪個更好? Grok 4 vs Claude 4:哪個更好? Jul 12, 2025 am 09:37 AM

到2025年中期,AI“軍備競賽”正在加熱,XAI和Anthropic都發(fā)布了他們的旗艦車型Grok 4和Claude 4。這兩種模型處於設(shè)計理念和部署平臺的相反端,但他們卻在

推理模型的思想鏈可能無法長期解決 推理模型的思想鏈可能無法長期解決 Jul 02, 2025 am 11:18 AM

例如,如果您向模型提出一個問題,例如:“(x)人在(x)公司做什麼?”您可能會看到一個看起來像這樣的推理鏈,假設(shè)系統(tǒng)知道如何檢索必要的信息:找到有關(guān)CO的詳細信息

這家初創(chuàng)公司在印度建立了一家醫(yī)院來測試其AI軟件 這家初創(chuàng)公司在印度建立了一家醫(yī)院來測試其AI軟件 Jul 02, 2025 am 11:14 AM

臨床試驗是藥物開發(fā)中的巨大瓶頸,Kim和Reddy認為他們在PI Health建立的AI-Spainite軟件可以通過擴大潛在符合條件的患者的庫來更快,更便宜。但是

參議院殺死了特朗普的預算法案中的10年州AI禁令 參議院殺死了特朗普的預算法案中的10年州AI禁令 Jul 02, 2025 am 11:16 AM

參議院星期二早上以99-1投票,殺死了暫停,在倡導團體,立法者和成千上萬的美國人中的最後一分鐘的騷動中,他們將其視為危險的過度。他們沒有保持安靜。參議院傾聽。國家保持

See all articles