国产av麻豆mag剧集,亚洲综合激情另类专区,日本中文字幕在线

AISは電気羊の夢を夢見ていますか？

箱の外で考えすぎています

夢をつかむ

ホームページ

テクノロジー周辺機(jī)器

IT業(yè)界

なぜAIはより頻繁にallucatingしているのですか？どうすればそれを止めることができますか？

Christopher Nolan

Jul 08, 2025 am 01:44 AM

なぜAIはより頻繁にallucatingしているのですか？どうすればそれを止めることができますか？

より高度な人工知能（AI）が大きくなるほど、「幻覚」し、誤った情報または不正確な情報を提供する傾向があります。

Openaiの研究によると、その最新かつ強(qiáng)力な推論モデルであるO3およびO4-MINIは、PersonQAベンチマークを使用してテストした場合、それぞれ33％と48％の幻覚率を排出しました。これは、古いO1モデルで見られるレートの2倍以上です。 O3は以前のバージョンと比較してより正確な応答を提供しますが、誤った幻覚への高い傾向も示しています。

この傾向は、AIチャットボットなどの大規(guī)模な言語モデル（LLMS）の正確性と信頼性に関する懸念を引き起こします、とSingularity UniversityのIEEEメンバー兼AI倫理エンジニアであるEleanor Watson氏は述べています。

「システムが、事実上のコンテンツに使用する同じ流encyさとコヒーレンスを備えた、構(gòu)成された事実、引用、またはイベントなど、製造された情報を作成すると、ユーザーを微妙だが重要な方法で誤解させることができます」とワトソンはライブサイエンスに語った。

関連： OpenaiおよびDeepseek Experienceの最先端のAIモデルは、過度に複雑な問題に直面したときに「完全な崩壊」を発見しました、研究では

専門家は、この幻覚の問題は、LLMSおよび推論モデルによって生成された出力を慎重に評価および監(jiān)視することの重要性を強(qiáng)調(diào)していることを強(qiáng)調(diào)しています。

AISは電気羊の夢を夢見ていますか？

推論モデルの重要な特徴は、複雑なタスクを小さな部分に分割し、それぞれを解決するための戦略を開発することにより、複雑なタスクに取り組む能力です。統(tǒng)計的確率のみに依存して回答を生成するモデルとは異なり、推論モデルは人間の思考と同様の問題解決戦略を作成します。

AIが創(chuàng)造的で潛在的に斬新なソリューションを生成するためのライブサイエンスデイリーニュースレッテリンの注文にサインアップするには、あるレベルの幻覚に従事する必要があります。

「幻覚は欠陥ではなく、AIの特徴であることを理解することが重要です」と、Vectra AIのAI研究者であるLive Scienceとのインタビューで、 Sohrob Kazerounian氏は述べています。「同僚がかつて言ったように、「LLMが生成するすべては幻覚です。それらの幻覚のいくつかがたまたま真実であるということです。」 AIがトレーニング中に見たものの正確なコピーのみを作成した場合、AIは大規(guī)模な検索エンジンにすぎません?！?/p>

「これは、以前に書かれたコードのみを書くことを意味し、プロパティが既に知られている分子のみを発見し、以前に尋ねられた宿題の質(zhì)問のみに答えることを意味します。LLMにAIの特異性を中心とした歌詞を書くように頼むことはできません。

効果的に、LLMSと彼らが電力を供給するAIシステムは、単に既存の知識を繰り返すのではなく、元のコンテンツを生成するために幻覚を浴びる必要があります。概念的には、これは人間が新しいアイデアを刺激するシナリオを夢見たり想像したりする方法に似ています。

箱の外で考えすぎています

ただし、特にユーザーが検証なしで出力を受け入れる場合、目標(biāo)が正確で正しい情報を提供することである場合、 AIの幻覚は問題があります。

「これは、薬、法律、金融など、事実上の正確さが重要である分野で特に懸念されています」とワトソンは説明しました。「より高度なモデルは明らかな事実上の誤りを減らす可能性がありますが、微妙な形態(tài)の幻覚は持続します。時間の経過とともに、これらの製造はAIシステムに対する信頼を損ない、ユーザーが未確認(rèn)の情報に基づいて行動すると、現(xiàn)実世界の害につながる可能性があります?！?/p>

さらに、この課題はAIテクノロジーが進(jìn)むにつれて成長するようです。「モデルが改善するにつれて、エラーはそれほど明白ではなく、検出が難しくなります」とワトソンは指摘しました。「現(xiàn)在、製造されたコンテンツは、説得力のある物語と論理的推論チェーンに埋め込まれています。これは獨自の危険を生み出します。ユーザーはエラーがあることに気付かず、出力を決定的なものとして扱うことができます。

Kazerounianはこの見解をサポートしています。「AIの幻覚が時間とともに減少するという広範(fàn)な楽観主義にもかかわらず、新しい推論モデルがより単純なモデルよりも頻繁に幻覚する可能性があることを示唆しています。

LLMがどのように結(jié)論に到達(dá)するかを理解することの難しさにより、狀況はさらに複雑になり、人間の脳がどのように機(jī)能するかを完全に理解していない方法と並行しています。

最近のエッセイで、AI Company AnthropicのCEOであるDario Amodeiは、AISがどのように応答を生成するかに関する透明性の欠如を指摘しました。「生成的AIが財務(wù)文書を要約すると、特定の単語の選択をする理由や、通常正しいものであるにもかかわらず時々誤りを犯す理由について具體的な理解はありません」と彼は書いた。

Kazerounianは、AIが誤った情報を生成する結(jié)果はすでに非常に現(xiàn)実的であると強(qiáng)調(diào)しました。「LLMがアクセスできる特定のデータセットに関する質(zhì)問に正しく答えることを確認(rèn)する信頼できる方法はありません」と彼は言いました。「存在しない參照、カスタマーサービスのチャットボットが會社のポリシーを発明した場合、およびその他の不正確さの事例は、今や驚くほど一般的です?！?/p>

夢をつかむ

KazerounianとWatsonは、AIの幻覚を完全に排除することは難しいかもしれないとライブサイエンスに語った。ただし、その影響を減らす方法があるかもしれません。

ワトソンは、モデルの出力を検証された外部知識ソースに結(jié)び付ける「検索された生成」が、実際にデータの根拠のあるコンテンツを根付かせるのに役立つと提案しました。

「別の戦略には、モデルの推論プロセスの構(gòu)造化が含まれます。獨自の出力を検証したり、異なる視點を比較したり、論理的な手順に従ったりするように促すことにより、足場の推論フレームワークは未チェックの投機(jī)を最小限に抑え、一貫性を高めることになります」とワトソンは説明しました。彼は、これは、モデルが精度を優(yōu)先するように促すように設(shè)計されたトレーニング方法によってサポートされる可能性があると付け加えました。また、人間またはAIの評価者からの補(bǔ)強(qiáng)學(xué)習(xí)を促進(jìn)して、より規(guī)律ある事実に基づいた応答を促進(jìn)しました。

以上がなぜAIはより頻繁にallucatingしているのですか？どうすればそれを止めることができますか？の詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國語 Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明

この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡(luò)ください。