999国产精品999久久久久久,欧美成人午夜免费全部完

大きなニュースを聞いたことがありますか？ Openaiは、新しいシリーズのAIモデルであるOpenai O1 （Project Strawberry/Q*とも呼ばれる）のプレビューを展開しました。これらのモデルは、答えを與える前に「考える」時間をもっと費やすため、特別です。つまり、主に高度なOpenAI O1パラメーターのおかげで、以前のモデルと比較して、科學(xué)、コーディング、數(shù)學(xué)などの分野で非常に厳しい問題に取り組む方が良いことを意味します。

Openaiは、O1シリーズで「あなたが話す前に考えてみてください」というモットーを取り入れています！

概要

Openaiの新しいO1モデルシリーズは、數(shù)學(xué)、科學(xué)、コーディングの厳しい問題を通じて推論に優(yōu)れており、以前のバージョンを上回っています。
O1-Previewモデルは、高度なタスクに取り組み、AIME數(shù)學(xué)の問題の93％を解決し、科學(xué)的ベンチマークの人間の専門家を上回ります。この成功の多くは、複雑なタスクを処理するようにOpenai O1パラメーターがどれほど効果的に設(shè)定されているかにかかっています。
OpenaiのO1-Miniは、コストの80％で強力なコーディング機能を提供し、開発者がアクセス可能なツールにします。
安全対策の改善により、O1モデルは、研究者、開発者、教育者に問題解決の強化を提供しながら、責(zé)任あるAIの使用を保証します。

大したことは何ですか？
Openai O1のユースケース
印象的なテスト結(jié)果
- 高度な數(shù)學(xué)競爭
- 科學(xué)の専門知識
- コーディング
- その他のベンチマークと視覚的理解
o1-miniに會います
O1 miniとの數(shù)學(xué)
誰がO1-Previewを使用できますか？
O1-Previewにアクセスする方法は？
安全性も重要です
次は何ですか？
最終的な考え

大したことは何ですか？

O1-Previewモデルは、厳しい問題に直面したときに人間がそうするように、一歩後退し、本當(dāng)に物事を考えるように訓(xùn)練されています。彼らはさまざまなアプローチを検討し、考えを洗練し、途中で自分の間違いをキャッチします。このより深いレベルの思考により、彼らは古いモデルが処理できなかった問題を解決することができます。

Openai O1のユースケース

Openai O1でコーディング

Openai O1でパズルを書きます

Openai O1を備えたHTMLヘビ

印象的なテスト結(jié)果

以前のGPT-4Oモデルと比較してO1がどれほど優(yōu)れているかを確認(rèn)するには、OpenAIは、人間の試験や機械學(xué)習(xí)ベンチマークなど、一連の困難なテストを?qū)g現(xiàn)しました。何を推測しますか？ O1は、これらの推論が多いタスクのほとんどでGPT-4Oを上回りました！

結(jié)果のいくつかを分解しましょう：

高度な數(shù)學(xué)競爭

彼らはAIME（American Invitational Mathematics Examination）のモデルをテストしました。これは、米國のトップ高校生にとって非常に挑戦的な數(shù)學(xué)試験です。

GPT-4O ：問題の約12％を解決しました（15の質(zhì)問のうち約1.8）。
Openai O1 ：1回の問題ごとに1回の試行で74％を解決しました（15のうち約11.1）。彼らがモデルを複數(shù)回試して、最も一般的な答えを得たとき、それは83％を獲得しました。さらに高度な方法を使用して93％に達(dá)し、15の問題のうち約13.9を解きました！

それを視點にするために、13.9のスコアは、米國數(shù)學(xué)オリンピアードの全國的およびカットオフを上回る上位500人の學(xué)生の中にO1を配置します。それはいくつかの深刻な頭脳です！

科學(xué)の専門知識

彼らはまた、化學(xué)、物理學(xué)、生物學(xué)の知識をテストする?yún)棨筏ぅ佶螗隶蕞`クであるGPQA-ダイヤモンドでO1を評価しました。 Openaiは、これらの質(zhì)問に答えるために博士號を持つ専門家を連れてきました。

結(jié)果：O1はこれらの人間の専門家よりも優(yōu)れており、このベンチマークで最初にそれを行うAIモデルになりました！これは、O1が非常に高いレベルで複雑な科學(xué)的問題を解決できることを示しています。

コーディング

CodeForcesなどのコーディング競合では、新しいモデルが89パーセンタイルに達(dá)し、複雑なコードを簡単に生成およびデバッグできることを示しました。

Openai O1：問題に答える前に「考える」新しいモデル

その他のベンチマークと視覚的理解

しかし、それだけではありません！ O1モデルは、他の領(lǐng)域でも大幅な改善を示しました。

視覚情報の理解（ビジョン認(rèn)識）

O1モデルは、畫像を解釈および理解できるようになりました。これは、ビジョン認(rèn)識として知られる機能です。これは、視覚データを分析し、それに関する質(zhì)問に答えることができることを意味します。これは、AIにとって大きな前進(jìn)です。

醫(yī)療イメージングテスト（MMMUベンチマーク）

Openaiは、 MMMUと呼ばれる挑戦的なベンチマークでO1をテストしました（これはマルチモーダル醫(yī)療機械の理解を表しています）。このテストでは、AIが醫(yī)療畫像を理解し、醫(yī)療専門家が実行するタスクと同様に、正確な評価を行うことがどれだけよくできるかを評価します。

結(jié)果：O1はこのテストで78.2％を獲得し、醫(yī)療イメージングの人間の専門家に匹敵するレベルで実行する最初のAIモデルになりました。醫(yī)療畫像を理解して解釈するには、深い知識と精度が必要であるため、これは非常に大きいです。

幅広い知識（MMLUベンチマーク）

O1モデルは、歴史や文學(xué)から數(shù)學(xué)やコンピューターサイエンスに至るまでの57の異なる科目をカバーするMMLU（大規(guī)模なマルチタスク言語理解）ベンチマークでもテストされました。

結(jié)果：O1は57人の被験者のうち54人でGPT-4Oを上回りました！これは、O1が1つの領(lǐng)域に特化しているだけでなく、幅広いトピックにわたって理解の向上を?qū)g証していることを示しています。

Openai O1：問題に答える前に「考える」新しいモデル

簡単に言えば、O1のテキストと畫像の両方を理解する能力は、より多用途で能力が高まっていることを意味します。複雑な醫(yī)療畫像の分析、高度な數(shù)學(xué)の問題の解決、さまざまな科目の質(zhì)問への回答など、O1はAIができることの新しい基準(zhǔn)を設(shè)定しています。

o1-miniに會います

Openaiはまた、 O1-MINIを?qū)毪筏蓼筏?。これは、より小さく、より高速で、より手頃な価格のO1-Previewモデルであり、特にコーディングタスクに適しています。 80％が安く、銀行を壊すことなく強力な推論能力を必要とする開発者にとって素晴らしい選択肢です。

また、STEM、特に數(shù)學(xué)とコーディングに優(yōu)れた費用効率の高い推論モデルであるOpenai O1-Miniもリリースします。https：//t.co/wfvvczifev
- Openai（@openai）2024年9月12日

O1 miniとの數(shù)學(xué)

また読む：OpenaiのO1-MINI：コスト効率の高い推論を備えたSTEMのゲームを変えるモデル

誰がO1-Previewを使用できますか？

これらの新しいモデルは、複雑な問題に対処する人にとってはゲームチェンジャーです。

研究者と科學(xué)者：彼らは、細(xì)胞シーケンスデータに注釈を付けたり、量子物理學(xué)などの分野で必要な複雑な式を生成するのに役立ちます。
開発者：マルチステップワークフローの構(gòu)築と実行は、より簡単で効率的になります。
學(xué)生と教育者：彼らは數(shù)學(xué)と科學(xué)の挑戦的な概念を探求する新しい方法を提供します。

O1-Previewにアクセスする方法は？

ChatGpt Plusおよびチームユーザー：今日からChATGPTでO1-PreviewおよびO1-Miniモデルにアクセスできます。モデルピッカーから選択してください。今のところ毎週のメッセージ制限があります（O1-Previewの30メッセージ、O1-MINIの場合は50）が、Openaiはこれらの制限をすぐに増やすために取り組んでいます。

Openai O1：問題に答える前に「考える」新しいモデル

ChatGpt EnterpriseおよびEDUユーザー：來週から両方のモデルにアクセスできるようになります。
開発者：API使用ティア5にいる場合は、今日APIを介してこれらのモデルの実験を開始できます。関數(shù)呼び出しやストリーミングなどの機能はまだ利用できませんが、途中です。
ChatGpt無料ユーザー：素晴らしいニュース！ Openaiは、すべての無料ユーザーがすぐに利用できるようにする予定です。

安全性も重要です

Openaiは、これらのモデルで安全機能を強化しました。彼らは、會話中に規(guī)則を推論することにより、安全ガイドラインをよりよく理解し、従うように訓(xùn)練されています。これは、彼らがすべきではないことをするようにだまされる可能性が低いことを意味します（「ジェイルブレイク」AIモデルを聞いたことがあるかもしれません）。

厳しい安全性テストでは、GPT-4Oのスコア22と比較して、O1-Previewモデルは100のうち84を獲得しました。それは大幅な改善であり、安全で適切な境界內(nèi)にとどまるのがはるかに優(yōu)れていることを示しています。

Openaiは、米國と英國の安全団體と緊密に協(xié)力しており、これらの機関にモデルへの早期アクセスを與えて、研究を支援し、すべてが標(biāo)準(zhǔn)に達(dá)していることを確認(rèn)しています。

次は何ですか？

これはほんの始まりです。 Openaiは、これらのモデルの定期的な更新と改善を計畫しています。彼らは、Webの閲覧、ファイルや畫像のアップロードなどの機能を追加して、さらに役立つようにしたいと考えています。

また、この新しいO1シリーズと一緒にGPTシリーズでモデルを開発し続けているため、楽しみにしています。

最終的な考え

O1-PreviewおよびO1-Miniモデルの発売は、AIの世界では大したことです。それらは、AIが複雑な問題を通じてどのように推論できるかにおける重要な前進(jìn)を表しています。パフォーマンスが向上し、安全対策が強化されているため、これらのモデルは、挑戦的なタスクに取り組んでいる多くの人々にとってゲームチェンジャーになるように設(shè)定されています。

Analytics Vidhyaブログにご注目ください。O1とO1 Miniの使用について詳しく知りましょう！

以上がOpenai O1：問題に答える前に「考える」新しいモデルの詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國語 Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明

この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡(luò)ください。