欧美va亚洲va在线观看,中文字幕高清免费日韩视频在线 ,亚洲欧美成人一区二区三区

上下文：無形框架

工程現(xiàn)實世界情報

現(xiàn)實錨定AI

首頁

科技週邊

人工智慧

在上下文中餓了，AI在最重要的地方失敗了

Barbara Streisand

Jul 30, 2025 am 11:08 AM

在上下文中餓了，AI在最重要的地方失敗了

2024年底，德克薩斯州檢察長肯·帕克斯頓（Ken Paxton）透露了一個具有里程碑意義的定居點，該定居點是一家總部位於達拉斯的Health-Tech創(chuàng)業(yè)公司，該公司促進了其AI驅(qū)動的臨床助理幾乎沒有錯誤，並以100,000分之一的價格宣傳了“嚴重幻覺率”。

但是，國家的調(diào)查發(fā)現(xiàn)，該公司的主張沒有得到可靠的證據(jù)的支持。當局確定，部件誤導了醫(yī)院，以為該工具可以準確地總結(jié)患者記錄的可靠性，從而可靠性。

儘管沒有病人受傷，也沒有受到處罰，但對準確性，風險和適當用法的更清晰披露的披露表示同意，這是一個重要的法律先例，表明理論績效並不等於現(xiàn)實世界的有效性。

認知科學家和人工智能評論家加里·馬庫斯（Gary Marcus）等專家長期以來一直警告說，當前的大型語言模型本質(zhì)上受到了限制。正如他所說，這些系統(tǒng)是“語言使用的近似值” ，而不是真實的語言理解，這是當在高度專業(yè)化的環(huán)境中應用通用模型並且無法掌握實際工作的發(fā)展時，這種差異變得特別冒險。

根據(jù)Twoford Health的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Gal Steinberg的說法，許多AI缺點的根源不是有缺陷的算法。缺乏背景。他解釋說：“因為'模型'僅檢測模式，而不是意圖?！?“ AI可以高精度地預測單詞或點擊，但仍然對定義診所或任何組織的規(guī)定，工作流和不成文規(guī)則視而不見。當優(yōu)化忽略這些現(xiàn)實時，AI會符合其KPI，但會忽略重點?！?/p>

上下文：無形框架

Steinberg將上下文定義為“電子表格省略的所有內(nèi)容 - 目標，邊界，行話，情感語氣，合規(guī)性要求和時機”。

當AI系統(tǒng)表現(xiàn)不佳時，這很少是由於處理能力不足，而是情況不足。他們?nèi)狈ξ幕R，特定領(lǐng)域的微妙之處或人類專業(yè)人士自然吸收的時間敏感理解。例如，在治療課程中90秒的沉默可能表明困擾。對於AI成績單生成器，它只是空的空間。在財務審計中，缺失的縮寫可能表明欺騙。對於接受廣泛互聯(lián)網(wǎng)文本培訓的模型，這似乎是一個瑣碎的首字母縮寫詞。

這就是為什麼在雙重健康方面，團隊開始問三個基本問題：誰參與其中？他們想實現(xiàn)什麼？如果AI弄錯了什麼後果？

斯坦伯格強調(diào)，另一個關(guān)鍵問題是，大多數(shù)組織將上下文視為一次性設(shè)置任務。但是環(huán)境發(fā)展。政策轉(zhuǎn)移。需求轉(zhuǎn)變。他說：“如果您不斷地完善您的提示並重新訓練模型，那麼AI會漂移?！?/p>

這就是為什麼這麼多早期的AI計劃現(xiàn)在被遺棄的原因。 Rand Corporation報告說，超過80％的AI項目失敗或失速 - 不是因為該技術(shù)不起作用，而是因為受過培訓的環(huán)境不再反映了運營現(xiàn)實。結(jié)果？在紙面上看起來正確但在實踐中失敗的AI，就像演員在錯誤階段背誦線條一樣。

工程現(xiàn)實世界情報

Steinberg認為，該修復程序不僅僅是建立更智能的模型，而且還以更深入的環(huán)境意識嵌入。他說：“這首先是將領(lǐng)域?qū)＜抑苯訁⑴cAI開發(fā)過程。雙方的臨床醫(yī)生（而不是工程師）導致工作的關(guān)鍵部分。他們通過生活經(jīng)驗向AI傳授了醫(yī)學語言，道德界限和監(jiān)管框架?！?/p>

然後是一個很少成為頭條新聞的被忽視，無情的勞動：確定哪些罕見情況很重要，標準化非正式的言語或意識到形式的佈局比其包含的數(shù)據(jù)更重要。這些選擇似乎很小，直到它們級聯(lián)陷入系統(tǒng)性錯誤。

先前的研究表明，在廣泛數(shù)據(jù)集中訓練的AI模型通常會在利基環(huán)境中行為不可預測，這是一種稱為域轉(zhuǎn)移的挑戰(zhàn)。在一項著名的研究中，來自Google和Stanford的科學家觀察到，現(xiàn)代機器學習模型經(jīng)?！爸付ā?，這意味著它們通過了內(nèi)部測試，但在現(xiàn)實世界中會崩潰。

在諸如醫(yī)療保健和金融等高風險領(lǐng)域，決定承擔法律責任，即使是小小的不準確性也是不可接受的。該差距是製定中的訴訟。

甚至META的首席AI科學家Yann Lecun也公開批評了急於部署大型模型的情況，而無需將其紮根。萊肯（Lecun）於2025年4月在新加坡國立大學發(fā)表講話時，質(zhì)疑更大的模型等於AI的廣泛假設(shè)：“您不能假設(shè)更多的數(shù)據(jù)和更多的計算能力會自動導致更智能的系統(tǒng)?！?/p>

他強調(diào)說，儘管擴展有助於完成基本任務，但它不能解決現(xiàn)實生活中的複雜性 - 兩身，適應和推理。取而代之的是，他呼籲“能夠按照人類的方式進行計劃，推理和理解環(huán)境?！?/p>

然而，根據(jù)思科的2024年AI準備指數(shù)，有98％的業(yè)務領(lǐng)導者報告說，採用AI的壓力增加了 - 通常沒有明確的指標，監(jiān)督或問責制結(jié)構(gòu)。在這樣的氣候下，背景成為事後的想法也就不足為奇了。

這就是Steinberg想要強調(diào)的危險：不僅是AI可能會產(chǎn)生虛假信息，而且組織中沒有人準備在此時承擔責任。他說：“我們過於關(guān)注精確度，而對所有權(quán)的關(guān)注度太少?！?“上下文不僅知道正確的答案，還知道當答案錯誤時，誰會回答損害。首先確定該問責制，您的人工智能從第一天起就會得到更豐富，更負責任的上下文飲食?！?/p>