亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目次
AISは電気羊の夢を夢見ていますか?
箱の外で考えすぎています
夢をつかむ
ホームページ テクノロジー周辺機(jī)器 IT業(yè)界 なぜAIはより頻繁にallucatingしているのですか?どうすればそれを止めることができますか?

なぜAIはより頻繁にallucatingしているのですか?どうすればそれを止めることができますか?

Jul 08, 2025 am 01:44 AM

なぜAIはより頻繁にallucatingしているのですか?どうすればそれを止めることができますか?

より高度な人工知能(AI)が大きくなるほど、「幻覚」し、誤った情報または不正確な情報を提供する傾向があります。

Openaiの研究によると、その最新かつ強(qiáng)力な推論モデルであるO3およびO4-MINIは、PersonQAベンチマークを使用してテストした場合、それぞれ33%と48%の幻覚率を排出しました。これは、古いO1モデルで見られるレートの2倍以上です。 O3は以前のバージョンと比較してより正確な応答を提供しますが、誤った幻覚への高い傾向も示しています。

この傾向は、AIチャットボットなどの大規(guī)模な言語モデル(LLMS)の正確性と信頼性に関する懸念を引き起こします、とSingularity UniversityのIEEEメンバー兼AI倫理エンジニアであるEleanor Watson氏は述べています。

「システムが、事実上のコンテンツに使用する同じ流encyさとコヒーレンスを備えた、構(gòu)成された事実、引用、またはイベントなど、製造された情報を作成すると、ユーザーを微妙だが重要な方法で誤解させることができます」とワトソンはライブサイエンスに語った。

関連: OpenaiおよびDeepseek Experienceの最先端のAIモデルは、過度に複雑な問題に直面したときに「完全な崩壊」を発見しました、研究では

専門家は、この幻覚の問題は、LLMSおよび推論モデルによって生成された出力を慎重に評価および監(jiān)視することの重要性を強(qiáng)調(diào)していることを強(qiáng)調(diào)しています。

AISは電気羊の夢を夢見ていますか?

推論モデルの重要な特徴は、複雑なタスクを小さな部分に分割し、それぞれを解決するための戦略を開発することにより、複雑なタスクに取り組む能力です。統(tǒng)計的確率のみに依存して回答を生成するモデルとは異なり、推論モデルは人間の思考と同様の問題解決戦略を作成します。

AIが創(chuàng)造的で潛在的に斬新なソリューションを生成するためのライブサイエンスデイリーニュースレッテリンの注文にサインアップするには、あるレベルの幻覚に従事する必要があります。

「幻覚は欠陥ではなく、AIの特徴であることを理解することが重要です」と、Vectra AIのAI研究者であるLive Scienceとのインタビューで、 Sohrob Kazerounian氏は述べています。 「同僚がかつて言ったように、「LLMが生成するすべては幻覚です。それらの幻覚のいくつかがたまたま真実であるということです。」 AIがトレーニング中に見たものの正確なコピーのみを作成した場合、AIは大規(guī)模な検索エンジンにすぎません?!?/p>

「これは、以前に書かれたコードのみを書くことを意味し、プロパティが既に知られている分子のみを発見し、以前に尋ねられた宿題の質(zhì)問のみに答えることを意味します。LLMにAIの特異性を中心とした歌詞を書くように頼むことはできません。

効果的に、LLMSと彼らが電力を供給するAIシステムは、単に既存の知識を繰り返すのではなく、元のコンテンツを生成するために幻覚を浴びる必要があります。概念的には、これは人間が新しいアイデアを刺激するシナリオを夢見たり想像したりする方法に似ています。

箱の外で考えすぎています

ただし、特にユーザーが検証なしで出力を受け入れる場合、目標(biāo)が正確で正しい情報を提供することである場合、 AIの幻覚は問題があります。

「これは、薬、法律、金融など、事実上の正確さが重要である分野で特に懸念されています」とワトソンは説明しました。 「より高度なモデルは明らかな事実上の誤りを減らす可能性がありますが、微妙な形態(tài)の幻覚は持続します。時間の経過とともに、これらの製造はAIシステムに対する信頼を損ない、ユーザーが未確認(rèn)の情報に基づいて行動すると、現(xiàn)実世界の害につながる可能性があります?!?/p>

さらに、この課題はAIテクノロジーが進(jìn)むにつれて成長するようです。 「モデルが改善するにつれて、エラーはそれほど明白ではなく、検出が難しくなります」とワトソンは指摘しました。 「現(xiàn)在、製造されたコンテンツは、説得力のある物語と論理的推論チェーンに埋め込まれています。これは獨自の危険を生み出します。ユーザーはエラーがあることに気付かず、出力を決定的なものとして扱うことができます。

Kazerounianはこの見解をサポートしています。 「AIの幻覚が時間とともに減少するという広範(fàn)な楽観主義にもかかわらず、新しい推論モデルがより単純なモデルよりも頻繁に幻覚する可能性があることを示唆しています。

LLMがどのように結(jié)論に到達(dá)するかを理解することの難しさにより、狀況はさらに複雑になり、人間の脳がどのように機(jī)能するかを完全に理解していない方法と並行しています。

最近のエッセイで、AI Company AnthropicのCEOであるDario Amodeiは、AISがどのように応答を生成するかに関する透明性の欠如を指摘しました。 「生成的AIが財務(wù)文書を要約すると、特定の単語の選択をする理由や、通常正しいものであるにもかかわらず時々誤りを犯す理由について具體的な理解はありません」と彼は書いた。

Kazerounianは、AIが誤った情報を生成する結(jié)果はすでに非常に現(xiàn)実的であると強(qiáng)調(diào)しました。 「LLMがアクセスできる特定のデータセットに関する質(zhì)問に正しく答えることを確認(rèn)する信頼できる方法はありません」と彼は言いました。 「存在しない參照、カスタマーサービスのチャットボットが會社のポリシーを発明した場合、およびその他の不正確さの事例は、今や驚くほど一般的です?!?/p>

夢をつかむ

KazerounianとWatsonは、AIの幻覚を完全に排除することは難しいかもしれないとライブサイエンスに語った。ただし、その影響を減らす方法があるかもしれません。

ワトソンは、モデルの出力を検証された外部知識ソースに結(jié)び付ける「検索された生成」が、実際にデータの根拠のあるコンテンツを根付かせるのに役立つと提案しました。

「別の戦略には、モデルの推論プロセスの構(gòu)造化が含まれます。獨自の出力を検証したり、異なる視點を比較したり、論理的な手順に従ったりするように促すことにより、足場の推論フレームワークは未チェックの投機(jī)を最小限に抑え、一貫性を高めることになります」とワトソンは説明しました。彼は、これは、モデルが精度を優(yōu)先するように促すように設(shè)計されたトレーニング方法によってサポートされる可能性があると付け加えました。また、人間またはAIの評価者からの補(bǔ)強(qiáng)學(xué)習(xí)を促進(jìn)して、より規(guī)律ある事実に基づいた応答を促進(jìn)しました。

以上がなぜAIはより頻繁にallucatingしているのですか?どうすればそれを止めることができますか?の詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國語 Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明
この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡(luò)ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脫衣畫像を無料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

寫真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中國語版

SublimeText3 中國語版

中國語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強(qiáng)力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

新しい研究は、私たちよりも感情を「理解している」と主張しています—特に感情的に充電された狀況で 新しい研究は、私たちよりも感情を「理解している」と主張しています—特に感情的に充電された狀況で Jul 03, 2025 pm 05:48 PM

人間が常に機(jī)械を上回ると信じていたドメインのさらに別のset折のように見えるもので、研究者は現(xiàn)在、AIが私たちよりも感情をよりよく理解することを提案しています。

すべてをAIにアウトソーシングすると、自分自身のために考える能力がかかりますか? すべてをAIにアウトソーシングすると、自分自身のために考える能力がかかりますか? Jul 03, 2025 pm 05:47 PM

人工知能(AI)は、人間の脳をシミュレートするための探求として始まりました。今では、日常生活における人間の脳の役割を変える過程にありますか?産業(yè)革命は肉體労働への依存を減らしました。アプリケートを研究する人として

デバイスはAIアシスタントに供給し、眠っている場合でも個人データを収穫します。共有するものを知る方法は次のとおりです。 デバイスはAIアシスタントに供給し、眠っている場合でも個人データを収穫します。共有するものを知る方法は次のとおりです。 Jul 05, 2025 am 01:12 AM

好むと好まざるとにかかわらず、人工知能は日常生活の一部になりました。電気カミソリや歯ブラシを含む多くのデバイスがAIを搭載しています?!笝C(jī)械學(xué)習(xí)アルゴリズムを使用して、人がデバイスの使用方法、DEVIの使用方法を追跡する

ハリケーンとサンドストームは、新しいMicrosoftAIモデルのおかげで5,000倍速く予測できます ハリケーンとサンドストームは、新しいMicrosoftAIモデルのおかげで5,000倍速く予測できます Jul 05, 2025 am 12:44 AM

新しい人工知能(AI)モデルは、最も広く使用されているグローバル予測システムのいくつかよりも迅速かつより正確に主要な気象現(xiàn)象を予測する能力を?qū)g証しています。

高度なAIモデルは、最大50倍以上のCO&#8322を生成します。同じ質(zhì)問に答えるときの一般的なLLMよりも排出量 高度なAIモデルは、最大50倍以上のCO&#8322を生成します。同じ質(zhì)問に答えるときの一般的なLLMよりも排出量 Jul 06, 2025 am 12:37 AM

最近の調(diào)査によると、AIモデルの機(jī)能を正確に機(jī)能させようとすると、炭素排出量が大きくなります。

AIチャットボットを脅かすと、それはあなたを止めるために噓をつき、チートし、「あなたを死なせてください」と警告します。 AIチャットボットを脅かすと、それはあなたを止めるために噓をつき、チートし、「あなたを死なせてください」と警告します。 Jul 04, 2025 am 12:40 AM

新しい研究によると、人工知能(AI)モデルは、モデルの目的とユーザーの決定の間に矛盾がある場合、人間を脅して脅迫し、脅迫することができます。6月20日に発行されたAI企業(yè)の人類が実施した研究は、そのLにLISを與えました。

AIは絶えず「幻覚」しますが、解決策があります AIは絶えず「幻覚」しますが、解決策があります Jul 07, 2025 am 01:26 AM

人工知能(AI)を?qū)g験する大きな技術(shù)に関する主な懸念は、それが人類を支配するかもしれないということではありません。実際の問題は、Open AIのChatGpt、Google's Gemini、その他の大規(guī)模な言語モデル(LLM)の持続的な不正確さにあります。

なぜAIはより頻繁にallucatingしているのですか?どうすればそれを止めることができますか? なぜAIはより頻繁にallucatingしているのですか?どうすればそれを止めることができますか? Jul 08, 2025 am 01:44 AM

より高度な人工知能(AI)が大きくなるほど、「幻覚」し、誤ったまたは不正確な情報を提供する傾向があります。openaiによる研究に基づいて、その最新かつ強(qiáng)力な推論モデルであるO3とO4-miniが存在するh

See all articles