亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

首頁 科技週邊 人工智慧 大語言模型(LLM)中的幻覺是不可避免的嗎?

大語言模型(LLM)中的幻覺是不可避免的嗎?

Apr 15, 2025 am 11:31 AM

大型語言模型(LLM)和不可避免的幻覺問題

您可能使用了諸如Chatgpt,Claude和Gemini之類的AI模型。這些都是大型語言模型(LLM)的示例,這些示例是在大規(guī)模文本數(shù)據(jù)集中訓練的強大的AI系統(tǒng),以理解和生成類似人類的文本。但是,即使是最先進的LLM也遭受了重大缺陷:幻覺。

最近的研究,尤其是“幻覺是不可避免的:大型語言模型的先天限制”,認為這些幻覺 - 對捏造信息的自信呈現(xiàn) - 是一個固有的限制,而不是僅僅是一個錯誤。本文探討了這項研究及其含義。

大語言模型(LLM)中的幻覺是不可避免的嗎?

了解LLM和幻覺

LLM雖然令人印象深刻,但仍在“幻覺”中掙扎,但產(chǎn)生了合理的聽起來但實際上不正確的信息。這引起了人們對它們的可靠性和道德意義的嚴重關(guān)注。研究論文將幻覺歸類為固有的(矛盾的輸入)或外部(無法通過輸入)。原因是多方面的,這是由於數(shù)據(jù)質(zhì)量問題(偏見,錯誤信息,過時的信息),培訓缺陷(建築限制,暴露偏見)和推理問題(抽樣隨機性)。

幻覺的必然性

該研究的核心論點是,在任何可計算的LLM中都不可避免地幻覺。本文使用數(shù)學證明(定理1、2和3)來證明這一點,表明即使使用完美的訓練數(shù)據(jù)和最佳體系結(jié)構(gòu),可計算性的限制也將不可避免地導致不正確的輸出。即使對於設(shè)計用於多項式時間計算的LLM,這也是如此。研究強調(diào),即使增加模型大小或培訓數(shù)據(jù)也不會消除這種基本限制。

大語言模型(LLM)中的幻覺是不可避免的嗎?

經(jīng)驗證據(jù)和緩解策略

該研究以經(jīng)驗證據(jù)支持其理論主張。使用Llama 2和GPT模型進行的實驗表明他們未能完成簡單的列出任務(wù),進一步支持了幻覺的必然性。

雖然完全根除是不可能的,但本文探討了緩解策略:

  • 較大的模型和更多數(shù)據(jù):雖然有幫助,但這種方法具有固有的限制。
  • 改進的提示:諸如思想鏈之類的技術(shù)可以提高準確性,但不能解決核心問題。
  • 集合方法:組合多個LLM可以減少錯誤,但不能消除錯誤。
  • 安全限制(“護欄”):這些可以減輕有害產(chǎn)出,但不能解決事實不準確的基本問題。
  • 知識整合:合併外部知識來源可以提高特定領(lǐng)域的準確性。

大語言模型(LLM)中的幻覺是不可避免的嗎?

結(jié)論:負責的AI開發(fā)

研究得出結(jié)論,幻覺是LLM的固有特徵。儘管緩解策略可以降低其頻率和影響,但它們不能完全消除它們。這需要轉(zhuǎn)向負責任的AI開發(fā),重點關(guān)注:

  • 透明度:確認LLM的局限性。
  • 安全措施:實施強大的保障措施,以最大程度地降低幻覺的風險。
  • 人類監(jiān)督:維持人類控制和驗證LLM產(chǎn)出,尤其是在關(guān)鍵應(yīng)用中。
  • 繼續(xù)研究:探索新方法以減少幻覺並提高LLM的可靠性。

大語言模型(LLM)中的幻覺是不可避免的嗎?

LLM的未來需要務(wù)實的方法,承認其局限性並專注於負責任的發(fā)展和部署?;糜X的必然性強調(diào)了對正在進行的研究的需求和對其應(yīng)用的批判性評估。這不是放棄LLM的呼籲,而是呼籲負責任的創(chuàng)新。

大語言模型(LLM)中的幻覺是不可避免的嗎?

(經(jīng)常詢問的問題部分將在此處添加,以反映原始輸入的常見問題部分。)

以上是大語言模型(LLM)中的幻覺是不可避免的嗎?的詳細內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔相應(yīng)的法律責任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
Kimi K2:最強大的開源代理模型 Kimi K2:最強大的開源代理模型 Jul 12, 2025 am 09:16 AM

還記得今年早些時候破壞了Genai行業(yè)的大量開源中國模型嗎?儘管DeepSeek佔據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

Grok 4 vs Claude 4:哪個更好? Grok 4 vs Claude 4:哪個更好? Jul 12, 2025 am 09:37 AM

到2025年中期,AI“軍備競賽”正在加熱,XAI和Anthropic都發(fā)布了他們的旗艦車型Grok 4和Claude 4。這兩種模型處於設(shè)計理念和部署平臺的相反端,但他們卻在

今天已經(jīng)在我們中間走了10個驚人的人形機器人 今天已經(jīng)在我們中間走了10個驚人的人形機器人 Jul 16, 2025 am 11:12 AM

但是我們可能甚至不必等10年就可以看到一個。實際上,可以被認為是真正有用的,類人類機器的第一波。 近年來,有許多原型和生產(chǎn)模型從T中走出來

上下文工程是' new'及時的工程 上下文工程是' new'及時的工程 Jul 12, 2025 am 09:33 AM

直到上一年,迅速的工程被認為是與大語言模型(LLM)互動的關(guān)鍵技能。然而,最近,LLM在推理和理解能力方面已經(jīng)顯著提高。自然,我們的期望

建立Langchain健身教練:您的AI私人教練 建立Langchain健身教練:您的AI私人教練 Jul 05, 2025 am 09:06 AM

許多人充滿熱情地打入健身房,並相信自己正在正確實現(xiàn)自己的健身目標。但是由於飲食計劃差和缺乏方向,結(jié)果不存在。僱用私人教練AL

6個任務(wù)Manus AI可以在幾分鐘內(nèi)完成 6個任務(wù)Manus AI可以在幾分鐘內(nèi)完成 Jul 06, 2025 am 09:29 AM

我相信您必須了解通用的AI代理Manus。它是幾個月前推出的,在過去的幾個月中,他們?yōu)橄到y(tǒng)添加了幾個新功能。現(xiàn)在,您可以生成視頻,創(chuàng)建網(wǎng)站並做很多MO

Leia的浸入式移動應(yīng)用將3D深度帶入日常照片 Leia的浸入式移動應(yīng)用將3D深度帶入日常照片 Jul 09, 2025 am 11:17 AM

基於Leia專有的神經(jīng)深度引擎,應(yīng)用程序流程靜止圖像,並添加了自然深度以及模擬運動(例如Pans,Zooms和Alallax Effects),以創(chuàng)建簡短的視頻捲軸,從而給人以踏入SCE的印象

7種AI代理的7種類型是什麼? 7種AI代理的7種類型是什麼? Jul 11, 2025 am 11:08 AM

想像一些複雜的東西,例如AI引擎準備提供有關(guān)米蘭新服裝系列的詳細反饋,或者自動市場分析用於全球運營的企業(yè),或者智能係統(tǒng)管理大型車隊。

See all articles