69日本人xxxx护士hd,欧美日韩亚洲精品瑜伽裤,а√天堂中文官网在线

上下文：無形框架

工程現(xiàn)實(shí)世界情報(bào)

現(xiàn)實(shí)錨定AI

首頁

科技周邊

人工智能

在上下文中餓了，AI在最重要的地方失敗了

Barbara Streisand

Jul 30, 2025 am 11:08 AM

在上下文中餓了，AI在最重要的地方失敗了

2024年底，德克薩斯州檢察長(zhǎng)肯·帕克斯頓（Ken Paxton）透露了一個(gè)具有里程碑意義的定居點(diǎn)，該定居點(diǎn)是一家總部位于達(dá)拉斯的Health-Tech創(chuàng)業(yè)公司，該公司促進(jìn)了其AI驅(qū)動(dòng)的臨床助理幾乎沒有錯(cuò)誤，并以100,000分之一的價(jià)格宣傳了“嚴(yán)重幻覺率”。

但是，國(guó)家的調(diào)查發(fā)現(xiàn)，該公司的主張沒有得到可靠的證據(jù)的支持。當(dāng)局確定，部件誤導(dǎo)了醫(yī)院，以為該工具可以準(zhǔn)確地總結(jié)患者記錄的可靠性，從而可靠性。

盡管沒有病人受傷，也沒有受到處罰，但對(duì)準(zhǔn)確性，風(fēng)險(xiǎn)和適當(dāng)用法的更清晰披露的披露表示同意，這是一個(gè)重要的法律先例，表明理論績(jī)效并不等于現(xiàn)實(shí)世界的有效性。

認(rèn)知科學(xué)家和人工智能評(píng)論家加里·馬庫斯（Gary Marcus）等專家長(zhǎng)期以來一直警告說，當(dāng)前的大型語言模型本質(zhì)上受到了限制。正如他所說，這些系統(tǒng)是“語言使用的近似值” ，而不是真實(shí)的語言理解，這是當(dāng)在高度專業(yè)化的環(huán)境中應(yīng)用通用模型并且無法掌握實(shí)際工作的發(fā)展時(shí)，這種差異變得特別冒險(xiǎn)。

根據(jù)Twoford Health的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Gal Steinberg的說法，許多AI缺點(diǎn)的根源不是有缺陷的算法。缺乏背景。他解釋說：“因?yàn)?模型'僅檢測(cè)模式，而不是意圖?！?“ AI可以高精度地預(yù)測(cè)單詞或點(diǎn)擊，但仍然對(duì)定義診所或任何組織的規(guī)定，工作流和不成文規(guī)則視而不見。當(dāng)優(yōu)化忽略這些現(xiàn)實(shí)時(shí)，AI會(huì)符合其KPI，但會(huì)忽略重點(diǎn)?！?/p>

上下文：無形框架

Steinberg將上下文定義為“電子表格省略的所有內(nèi)容 - 目標(biāo)，邊界，行話，情感語氣，合規(guī)性要求和時(shí)機(jī)”。

當(dāng)AI系統(tǒng)表現(xiàn)不佳時(shí)，這很少是由于處理能力不足，而是情況不足。他們?nèi)狈ξ幕R(shí)，特定領(lǐng)域的微妙之處或人類專業(yè)人士自然吸收的時(shí)間敏感理解。例如，在治療課程中90秒的沉默可能表明困擾。對(duì)于AI成績(jī)單生成器，它只是空的空間。在財(cái)務(wù)審計(jì)中，缺失的縮寫可能表明欺騙。對(duì)于接受廣泛互聯(lián)網(wǎng)文本培訓(xùn)的模型，這似乎是一個(gè)瑣碎的首字母縮寫詞。

這就是為什么在雙重健康方面，團(tuán)隊(duì)開始問三個(gè)基本問題：誰參與其中？他們想實(shí)現(xiàn)什么？如果AI弄錯(cuò)了什么后果？

斯坦伯格強(qiáng)調(diào)，另一個(gè)關(guān)鍵問題是，大多數(shù)組織將上下文視為一次性設(shè)置任務(wù)。但是環(huán)境發(fā)展。政策轉(zhuǎn)移。需求轉(zhuǎn)變。他說：“如果您不斷地完善您的提示并重新訓(xùn)練模型，那么AI會(huì)漂移?！?/p>

這就是為什么這么多早期的AI計(jì)劃現(xiàn)在被遺棄的原因。 Rand Corporation報(bào)告說，超過80％的AI項(xiàng)目失敗或失速 - 不是因?yàn)樵摷夹g(shù)不起作用，而是因?yàn)槭苓^培訓(xùn)的環(huán)境不再反映了運(yùn)營(yíng)現(xiàn)實(shí)。結(jié)果？在紙面上看起來正確但在實(shí)踐中失敗的AI，就像演員在錯(cuò)誤階段背誦線條一樣。

工程現(xiàn)實(shí)世界情報(bào)

Steinberg認(rèn)為，該修復(fù)程序不僅僅是建立更智能的模型，而且還以更深入的環(huán)境意識(shí)嵌入。他說：“這首先是將領(lǐng)域?qū)＜抑苯訁⑴cAI開發(fā)過程。雙方的臨床醫(yī)生（而不是工程師）導(dǎo)致工作的關(guān)鍵部分。他們通過生活經(jīng)驗(yàn)向AI傳授了醫(yī)學(xué)語言，道德界限和監(jiān)管框架?！?/p>

然后是一個(gè)很少成為頭條新聞的被忽視，無情的勞動(dòng)：確定哪些罕見情況很重要，標(biāo)準(zhǔn)化非正式的言語或意識(shí)到形式的布局比其包含的數(shù)據(jù)更重要。這些選擇似乎很小，直到它們級(jí)聯(lián)陷入系統(tǒng)性錯(cuò)誤。

先前的研究表明，在廣泛數(shù)據(jù)集中訓(xùn)練的AI模型通常會(huì)在利基環(huán)境中行為不可預(yù)測(cè)，這是一種稱為域轉(zhuǎn)移的挑戰(zhàn)。在一項(xiàng)著名的研究中，來自Google和Stanford的科學(xué)家觀察到，現(xiàn)代機(jī)器學(xué)習(xí)模型經(jīng)?！爸付ā?，這意味著它們通過了內(nèi)部測(cè)試，但在現(xiàn)實(shí)世界中會(huì)崩潰。

在諸如醫(yī)療保健和金融等高風(fēng)險(xiǎn)領(lǐng)域，決定承擔(dān)法律責(zé)任，即使是小小的不準(zhǔn)確性也是不可接受的。該差距是制定中的訴訟。

甚至META的首席AI科學(xué)家Yann Lecun也公開批評(píng)了急于部署大型模型的情況，而無需將其扎根。萊肯（Lecun）于2025年4月在新加坡國(guó)立大學(xué)發(fā)表講話時(shí)，質(zhì)疑更大的模型等于AI的廣泛假設(shè)：“您不能假設(shè)更多的數(shù)據(jù)和更多的計(jì)算能力會(huì)自動(dòng)導(dǎo)致更智能的系統(tǒng)?！?/p>

他強(qiáng)調(diào)說，盡管擴(kuò)展有助于完成基本任務(wù)，但它不能解決現(xiàn)實(shí)生活中的復(fù)雜性 - 兩身，適應(yīng)和推理。取而代之的是，他呼吁“能夠按照人類的方式進(jìn)行計(jì)劃，推理和理解環(huán)境?！?/p>

然而，根據(jù)思科的2024年AI準(zhǔn)備指數(shù)，有98％的業(yè)務(wù)領(lǐng)導(dǎo)者報(bào)告說，采用AI的壓力增加了 - 通常沒有明確的指標(biāo)，監(jiān)督或問責(zé)制結(jié)構(gòu)。在這樣的氣候下，背景成為事后的想法也就不足為奇了。

這就是Steinberg想要強(qiáng)調(diào)的危險(xiǎn)：不僅是AI可能會(huì)產(chǎn)生虛假信息，而且組織中沒有人準(zhǔn)備在此時(shí)承擔(dān)責(zé)任。他說：“我們過于關(guān)注精確度，而對(duì)所有權(quán)的關(guān)注度太少?！?“上下文不僅知道正確的答案，還知道當(dāng)答案錯(cuò)誤時(shí)，誰會(huì)回答損害。首先確定該問責(zé)制，您的人工智能從第一天起就會(huì)得到更豐富，更負(fù)責(zé)任的上下文飲食?！?/p>