日韩一区国产二区欧美三区,亚洲成国产人片在线观看,аⅴ天堂在线

你聽到了大新聞嗎？ Openai剛剛推出了一系列新型AI模型的預覽 - OpenAi O1 （也稱為草莓/Q*）。這些模型很特別，因為它們在給您答案之前花費更多的時間“思考”。這意味著與早期模型相比，他們更好地解決了科學，編碼和數(shù)學等領域的真正棘手問題，這在很大程度上要歸功于先進的OpenAI O1參數(shù)。

Openai以O1系列的方式將座右銘“思考”以“思考” ！

概述

Openai的新O1模型系列在數(shù)學，科學和編碼方面的棘手問題上表現(xiàn)出色，使以前的版本超出了以前的版本。
O1概覽模型可以解決高級任務，解決了93％的AIME數(shù)學問題并超過了科學基準的人類專家。這些成功的大部分取決于如何有效地設置OpenAI O1參數(shù)來處理復雜的任務。
Openai的O1-Mini以80％的成本提供了強大的編碼功能，使其成為開發(fā)人員的可訪問工具。
通過改進的安全措施，O1模型確保了負責的AI使用，同時為研究人員，開發(fā)人員和教育者提供了增強的問題。

有什么大不了的？
Openai O1的用例
令人印象深刻的測試結(jié)果
- 高級數(shù)學比賽
- 科學專業(yè)知識
- 編碼
- 其他基準和視覺理解
認識O1-Mini
使用O1 mini的數(shù)學
誰可以使用O1-preiview？
如何訪問O1-preview？
安全也很重要
接下來是什么？
最后的想法

有什么大不了的？

O1-preiview模型經(jīng)過訓練，可以退后一步，并真正思考事物，就像面臨棘手的問題時人類一樣。他們考慮了不同的方法，完善自己的想法，甚至在此過程中遇到自己的錯誤。這種更深層次的思維水平使他們能夠解決舊模型無法應付的問題。

Openai O1的用例

用Openai O1編碼

用Openai O1編寫難題

HTML蛇與Openai O1

令人印象深刻的測試結(jié)果

要查看與較早的GPT-4O模型相比，O1的更好，OpenAI使他們通過一系列艱難的測試，包括人類考試和機器學習基準。猜猜是什么？ O1在大多數(shù)這些推理的任務中的表現(xiàn)都優(yōu)于GPT-4O！

讓我們分解一些結(jié)果：

高級數(shù)學比賽

他們在AIME（美國邀請賽數(shù)學考試）上測試了模型，這是美國頂尖學生的超級挑戰(zhàn)性數(shù)學考試

GPT-4O ：解決了大約12％的問題（大約15個問題中的1.8個）。
Openai O1 ：每次嘗試僅一嘗試就解決了74％ （大約15個中的11.1）。當他們讓模型多次嘗試并取出最常見的答案時，它得分為83％ 。使用更高級的方法，它達到了93％ ，解決了15個問題中約13.9個！

綜上所述，在全國500名學生中，將獲得13.9的成績，超過美國數(shù)學奧林匹克運動會的臨界。那是一些嚴重的腦力！

科學專業(yè)知識

他們還評估了O1在GPQA-Diamond上的O1，這是一種艱難的基準測試，可測試化學，物理學和生物學方面的知識。 Openai甚至引進了博士學位的專家來回答這些問題。

結(jié)果：O1優(yōu)于這些人類專家，成為第一個在此基準下這樣做的AI模型！這表明O1可以在很高的水平上解決復雜的科學問題。

編碼

在諸如CodeForces之類的編碼競賽中，新模型達到了第89個百分位，表明它們可以輕松生成和調(diào)試復雜的代碼。

Openai O1：一種在回答問題之前'思考”的新模型

其他基準和視覺理解

但這不是全部！ O1模型還顯示了其他領域的顯著改善：

了解視覺信息（視覺感知）

O1模型現(xiàn)在可以解釋和理解圖像 - 一種稱為視覺感知的功能。這意味著它可以分析視覺數(shù)據(jù)并回答有關(guān)它的問題，這對于AI來說是一大步。

醫(yī)學成像測試（MMMU基準）

Openai在一個名為MMMU的具有挑戰(zhàn)性的基準上測試了O1（該基準（該基準）代表了多模式的醫(yī)療機器理解）。該測試評估了AI可以理解醫(yī)學圖像并進行準確評估的程度，類似于醫(yī)療專業(yè)人員執(zhí)行的任務。

結(jié)果：O1在此測試中得分78.2％ ，這使其成為第一個以與人類醫(yī)學成像專家相當?shù)乃綀?zhí)行的AI模型。這很大，因為理解和解釋醫(yī)學圖像需要深厚的知識和精度。

廣泛的知識（MMLU基準）

還對O1模型進行了測試，該模型在MMLU（大量的多任務語言理解）基準上進行了測試，該基準涵蓋了57個不同的主題，從歷史和文學到數(shù)學和計算機科學。

結(jié)果：O1在57名受試者中有54位優(yōu)于GPT-4O！這表明O1不僅在一個領域中專業(yè)，還表明了廣泛主題的理解得到了提高。

Openai O1：一種在回答問題之前'思考”的新模型

用更簡單的話來說，O1能夠同時了解文本和圖像的能力意味著它變得更加通用和有能力。無論是分析復雜的醫(yī)學圖像，解決高級數(shù)學問題還是在各種主題上回答問題，O1都為AI做些什么制定了新的標準。

認識O1-Mini

Openai還推出了O1-Mini ，這是O1-Preigiew模型的較小，更快，更實惠的版本，特別擅長編碼任務。它便宜80％ ，這是對于需要強大推理能力的開發(fā)人員而無需破壞銀行的開發(fā)人員的絕佳選擇。

我們還發(fā)布了Openai O1-Mini，這是一種具有成本效益的推理模型，在STEM上表現(xiàn)出色，尤其是數(shù)學和編碼。
- 2024年9月12日Openai（@Openai）

使用O1 mini的數(shù)學

另請閱讀：Openai的O1-Mini：具有成本效益推理的STEM的改變游戲規(guī)則的模型

誰可以使用O1-preiview？

這些新型號是針對任何處理復雜問題的人的游戲規(guī)則改變者：

研究人員和科學家：它們可以幫助注釋細胞測序數(shù)據(jù)或在量子物理等領域中產(chǎn)生所需的復雜公式。
開發(fā)人員：構(gòu)建和執(zhí)行多步驟工作流變得更加容易，更高效。
學生和教育工作者：他們提供了一種探索數(shù)學和科學中具有挑戰(zhàn)性概念的新方法。

如何訪問O1-preview？

Chatgpt Plus和團隊用戶：您可以從今天開始訪問ChatGPT中的O1-preview和O1-Mini模型。只需從模型選擇器中選擇它們即可。目前有每周的消息限制（O1-preiview的30條消息，O1-Mini的50條消息），但Openai正在努力盡快增加這些限制。

Openai O1：一種在回答問題之前'思考”的新模型

CHATGPT Enterprise和EDU用戶：從下周開始，您將可以訪問這兩種型號。
開發(fā)人員：如果您處于API使用層5，則可以立即通過API開始嘗試這些模型。某些功能諸如函數(shù)調(diào)用和流媒體之類的功能尚不可用，但是它們正在路上。
chatgpt免費用戶：好消息！ OpenAI計劃使所有自由用戶都可以使用O1-Mini。