亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

ホームページ テクノロジー周辺機器 IT業(yè)界 aiは、カリフォルニアでの秘密の會議で世界のトップ數(shù)學者30人を中斷しました

aiは、カリフォルニアでの秘密の會議で世界のトップ數(shù)學者30人を中斷しました

Jul 17, 2025 am 01:26 AM

aiは、カリフォルニアでの秘密の會議で世界のトップ數(shù)學者30人を中斷しました

5月中旬の週末に、數(shù)學者の排他的な集まりが行われました。數(shù)學の最も著名な心のうち30人がカリフォルニア州バークレーに旅行しました。英國のような遠い場所から出席者は、數(shù)學的能力を評価するためにグループによって作成された問題に取り組むように設(shè)計された推論に焦點を當てたチャットボットに対してユニークな挑戦に従事しました。 2日間連続して高度なレベルの質(zhì)問でボットに立ち向かった後、參加者は、最も挑戦的な解決可能な數(shù)學の問題のいくつかを解決できることに驚きました。 「一部の同僚は、これらのモデルを數(shù)學的な輝きに近づいていると説明しました」と、このイベントでリーダーと審査員を務めたバージニア大學數(shù)學者ケンオノは言います。

チャットボットは、Reasoning Large言語モデル(LLM)として知られるO4-Miniを使用して動作します。このモデルは、非常に複雑な論理タスクを処理するためにOpenAIによって開発されました。 GoogleのカウンターパートであるGemini 2.5 Flashは、同様の機能を共有しています。 ChatGptの以前のバージョンと同様に、O4-Miniは文の次の単語を予測することを?qū)Wびます。ただし、これらの前任者と比較して、O4-MINIおよび同様のモデルはより軽くてよりアジャイルであり、強化されたヒト誘導補強學習を備えた専門データセットで訓練されています。これにより、従來のLLMよりも複雑な數(shù)學の課題をより深く探索できるチャットボットが生まれます。

O4-Miniの開発を監(jiān)視するために、Openaiは以前にEPOCH AI(ベンチマークLLMに焦點を當てた非営利団體であるEpoch AI)を委託して、300の未発表の數(shù)學の問題を作成しました。従來のLLMでさえ、多くの難しい數(shù)學の質(zhì)問に正しく答えることができます。しかし、エポックAIがこれらの新しい問題(訓練されていなかったもの)でそのようなモデルをいくつかテストしたとき、トップパフォーマーは2パーセント未満を解決し、限られた推論能力を示しています。しかし、O4-Miniは大きな例外であることが判明しました。

2024年9月、エポックAIは、最近の數(shù)學博士號であるエリオットグレーザーに入隊しました。卒業(yè)生、 Frontiermathと呼ばれるベンチマークイニシアチブのため。このプロジェクトは、學部、大學院、研究層の複數(shù)の難易度にわたって元の數(shù)學の問題を収集しました。 2025年4月までに、Glazerは、O4-Miniが問題の約20%を解決できることを観察しました。その後、彼は4番目のレベルを?qū)毪筏蓼筏俊J澜绲膜松贁?shù)の選択は、問題などの問題を考案し、おそらく解決することができます。參加者は、電子メールなどの他の通信方法をLLMによってスキャンし、トレーニングに使用する可能性があるため、偶発的なデータ汚染を避けるために、機密保持契約に署名し、アプリ信號を介して獨占的に通信する必要がありました。

O4-MINIが解決できなかった各問題は、クリエイターに7,500ドルを獲得しました。チームは、適切な質(zhì)問を生成して徐々に進歩しました。プロセスを加速するために、エポックAIは5月17?18日の週末に対面ワークショップを開催し、參加者は最後のテスト質(zhì)問セットを確定しました。 6人のグループに分かれて、數(shù)學者は2日間集中的に働き、人間が解決できるがAIを斷念できる問題を作成しようとしました。

土曜日の夕方までに、小野は、ボットの驚くべき數(shù)學的スキルがグループの努力を妨げたため、イライラしました。 「私は、博士論文に適しているオープンナンバー理論の問題として、私の分野の専門家によって認められた質(zhì)問を提案しました」と彼は回想します。彼がO4-Miniにそれを解決するように頼んだとき、彼は驚いたことに、10分以內(nèi)に段階的な解決策を提供したのを見ました。関連する文獻を見つけて吸収するのは最初に2分間費やしました。その後、問題の単純化されたバージョンを試みて、それをよりよく理解することを発表しました。その後まもなく、完全な問題に取り組む準備ができていると宣言しました。 5分後、それは正しいことを提示しました - しかし、皮肉であるという點に自信を持ってソリューションを提示しました。 「本當に生意気になり始めていました」と小野は言いました。 「そして最後に、「ミステリー番號が私によって計算されたため、引用は必要ありません!」と付け加えました。」

関連:研究の主要なAIベンチマークプラットフォームは、企業(yè)がモデルのパフォーマンスメトリックを操作できるようにしています

これを目撃して、ライブサイエンスデイリーニュースレターNowterにサインアップして、オノはすぐに日曜日の早朝に信號を介してグループにメッセージを送りました。 「私はこのようなLLMに対抗することを期待していませんでした」と彼は認めました。 「私は以前にどんなモデルでもそのような推論を見たことがありません。それが科學者の仕組みです。それは不安です。」

グループは最終的にボットが解決できなかった10の問題を特定しましたが、研究者はAIがわずか1年でどれだけ進んだかに驚いていました。オノは、ボットと協(xié)力して「非常に有能なパートナー」と協(xié)力しました。ロンドン數(shù)學科學研究所の數(shù)學者であり、數(shù)學のAIの初期の擁護者であるYang Huiは、「これは、特別な大學院生がすることです。

さらに、ボットは人間の専門家よりもはるかに速く働き、數(shù)分か數(shù)ヶ月か數(shù)か月かかるかもしれない數(shù)分で解決しました。

O4-Miniとの関わりがエキサイティングでしたが、その急速な進歩は懸念を引き起こしました。オノと彼は、ボットの出力にあまりにも多くの信頼を置くことについての心配を表明しました。 「誘導による証拠、矛盾による証拠、そして脅迫による証拠があります」と彼は説明しました。 「自信を持って何かを主張すれば、人々はそれを信じる傾向があります。O4-miniは脅迫によって完璧な証拠を持っていると思います。それはすべてを確実に提示しています?!?/p>

以上がaiは、カリフォルニアでの秘密の會議で世界のトップ數(shù)學者30人を中斷しましたの詳細內(nèi)容です。詳細については、PHP 中國語 Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明
この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當する法的責任を負いません。盜作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡(luò)ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脫衣畫像を無料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

寫真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中國語版

SublimeText3 中國語版

中國語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

新しい研究は、私たちよりも感情を「理解している」と主張しています—特に感情的に充電された狀況で 新しい研究は、私たちよりも感情を「理解している」と主張しています—特に感情的に充電された狀況で Jul 03, 2025 pm 05:48 PM

人間が常に機械を上回ると信じていたドメインのさらに別のset折のように見えるもので、研究者は現(xiàn)在、AIが私たちよりも感情をよりよく理解することを提案しています。

すべてをAIにアウトソーシングすると、自分自身のために考える能力がかかりますか? すべてをAIにアウトソーシングすると、自分自身のために考える能力がかかりますか? Jul 03, 2025 pm 05:47 PM

人工知能(AI)は、人間の脳をシミュレートするための探求として始まりました。今では、日常生活における人間の脳の役割を変える過程にありますか?産業(yè)革命は肉體労働への依存を減らしました。アプリケートを研究する人として

デバイスはAIアシスタントに供給し、眠っている場合でも個人データを収穫します。共有するものを知る方法は次のとおりです。 デバイスはAIアシスタントに供給し、眠っている場合でも個人データを収穫します。共有するものを知る方法は次のとおりです。 Jul 05, 2025 am 01:12 AM

好むと好まざるとにかかわらず、人工知能は日常生活の一部になりました。電気カミソリや歯ブラシを含む多くのデバイスがAIを搭載しています。「機械學習アルゴリズムを使用して、人がデバイスの使用方法、DEVIの使用方法を追跡する

ハリケーンとサンドストームは、新しいMicrosoftAIモデルのおかげで5,000倍速く予測できます ハリケーンとサンドストームは、新しいMicrosoftAIモデルのおかげで5,000倍速く予測できます Jul 05, 2025 am 12:44 AM

新しい人工知能(AI)モデルは、最も広く使用されているグローバル予測システムのいくつかよりも迅速かつより正確に主要な気象現(xiàn)象を予測する能力を?qū)g証しています。

高度なAIモデルは、最大50倍以上のCO&#8322を生成します。同じ質(zhì)問に答えるときの一般的なLLMよりも排出量 高度なAIモデルは、最大50倍以上のCO&#8322を生成します。同じ質(zhì)問に答えるときの一般的なLLMよりも排出量 Jul 06, 2025 am 12:37 AM

最近の調(diào)査によると、AIモデルの機能を正確に機能させようとすると、炭素排出量が大きくなります。

AIチャットボットを脅かすと、それはあなたを止めるために噓をつき、チートし、「あなたを死なせてください」と警告します。 AIチャットボットを脅かすと、それはあなたを止めるために噓をつき、チートし、「あなたを死なせてください」と警告します。 Jul 04, 2025 am 12:40 AM

新しい研究によると、人工知能(AI)モデルは、モデルの目的とユーザーの決定の間に矛盾がある場合、人間を脅して脅迫し、脅迫することができます。6月20日に発行されたAI企業(yè)の人類が実施した研究は、そのLにLISを與えました。

AIは絶えず「幻覚」しますが、解決策があります AIは絶えず「幻覚」しますが、解決策があります Jul 07, 2025 am 01:26 AM

人工知能(AI)を?qū)g験する大きな技術(shù)に関する主な懸念は、それが人類を支配するかもしれないということではありません。実際の問題は、Open AIのChatGpt、Google's Gemini、その他の大規(guī)模な言語モデル(LLM)の持続的な不正確さにあります。

なぜAIはより頻繁にallucatingしているのですか?どうすればそれを止めることができますか? なぜAIはより頻繁にallucatingしているのですか?どうすればそれを止めることができますか? Jul 08, 2025 am 01:44 AM

より高度な人工知能(AI)が大きくなるほど、「幻覚」し、誤ったまたは不正確な情報を提供する傾向があります。openaiによる研究に基づいて、その最新かつ強力な推論モデルであるO3とO4-miniが存在するh

See all articles