国产精品一区二区久久不卡,亚洲国产精品成人午夜在线观看,亚洲国产精品一区二区久久hs

你聽到了大新聞嗎？ Openai剛剛推出了一系列新型AI模型的預(yù)覽 - OpenAi O1 （也稱為草莓/Q*）。這些模型很特別，因?yàn)樗鼈冊(cè)诮o您答案之前花費(fèi)更多的時(shí)間“思考”。這意味著與早期模型相比，他們更好地解決了科學(xué)，編碼和數(shù)學(xué)等領(lǐng)域的真正棘手問(wèn)題，這在很大程度上要?dú)w功於先進(jìn)的OpenAI O1參數(shù)。

Openai以O(shè)1系列的方式將座右銘“思考”以“思考” ！

概述

Openai的新O1模型系列在數(shù)學(xué)，科學(xué)和編碼方面的棘手問(wèn)題上表現(xiàn)出色，使以前的版本超出了以前的版本。
O1概覽模型可以解決高級(jí)任務(wù)，解決了93％的AIME數(shù)學(xué)問(wèn)題並超過(guò)了科學(xué)基準(zhǔn)的人類專家。這些成功的大部分取決於如何有效地設(shè)置OpenAI O1參數(shù)來(lái)處理複雜的任務(wù)。
Openai的O1-Mini以80％的成本提供了強(qiáng)大的編碼功能，使其成為開發(fā)人員的可訪問(wèn)工具。
通過(guò)改進(jìn)的安全措施，O1模型確保了負(fù)責(zé)的AI使用，同時(shí)為研究人員，開發(fā)人員和教育者提供了增強(qiáng)的問(wèn)題。

有什麼大不了的？
Openai O1的用例
令人印象深刻的測(cè)試結(jié)果
- 高級(jí)數(shù)學(xué)比賽
- 科學(xué)專業(yè)知識(shí)
- 編碼
- 其他基準(zhǔn)和視覺(jué)理解
認(rèn)識(shí)O1-Mini
使用O1 mini的數(shù)學(xué)
誰(shuí)可以使用O1-preiview？
如何訪問(wèn)O1-preview？
安全也很重要
接下來(lái)是什麼？
最後的想法

有什麼大不了的？

O1-preiview模型經(jīng)過(guò)訓(xùn)練，可以退後一步，並真正思考事物，就像面臨棘手的問(wèn)題時(shí)人類一樣。他們考慮了不同的方法，完善自己的想法，甚至在此過(guò)程中遇到自己的錯(cuò)誤。這種更深層次的思維水平使他們能夠解決舊模型無(wú)法應(yīng)付的問(wèn)題。

Openai O1的用例

用Openai O1編碼

用Openai O1編寫難題

HTML蛇與Openai O1

令人印象深刻的測(cè)試結(jié)果

要查看與較早的GPT-4O模型相比，O1的更好，OpenAI使他們通過(guò)一系列艱難的測(cè)試，包括人類考試和機(jī)器學(xué)習(xí)基準(zhǔn)。猜猜是什麼？ O1在大多數(shù)這些推理的任務(wù)中的表現(xiàn)都優(yōu)於GPT-4O！

讓我們分解一些結(jié)果：

高級(jí)數(shù)學(xué)比賽

他們?cè)?strong>AIME（美國(guó)邀請(qǐng)賽數(shù)學(xué)考試）上測(cè)試了模型，這是美國(guó)頂尖學(xué)生的超級(jí)挑戰(zhàn)性數(shù)學(xué)考試

GPT-4O ：解決了大約12％的問(wèn)題（大約15個(gè)問(wèn)題中的1.8個(gè)）。
Openai O1 ：每次嘗試僅一嚐試就解決了74％ （大約15個(gè)中的11.1）。當(dāng)他們讓模型多次嘗試並取出最常見的答案時(shí)，它得分為83％ 。使用更高級(jí)的方法，它達(dá)到了93％ ，解決了15個(gè)問(wèn)題中約13.9個(gè)！

綜上所述，在全國(guó)500名學(xué)生中，將獲得13.9的成績(jī)，超過(guò)美國(guó)數(shù)學(xué)奧林匹克運(yùn)動(dòng)會(huì)的臨界。那是一些嚴(yán)重的腦力！

科學(xué)專業(yè)知識(shí)

他們還評(píng)估了O1在GPQA-Diamond上的O1，這是一種艱難的基準(zhǔn)測(cè)試，可測(cè)試化學(xué)，物理學(xué)和生物學(xué)方面的知識(shí)。 Openai甚至引進(jìn)了博士學(xué)位的專家來(lái)回答這些問(wèn)題。

結(jié)果：O1優(yōu)於這些人類專家，成為第一個(gè)在此基準(zhǔn)下這樣做的AI模型！這表明O1可以在很高的水平上解決複雜的科學(xué)問(wèn)題。

編碼

在諸如CodeForces之類的編碼競(jìng)賽中，新模型達(dá)到了第89個(gè)百分位，表明它們可以輕鬆生成和調(diào)試複雜的代碼。

Openai O1：一種在回答問(wèn)題之前'思考”的新模型

其他基準(zhǔn)和視覺(jué)理解

但這不是全部！ O1模型還顯示了其他領(lǐng)域的顯著改善：

了解視覺(jué)信息（視覺(jué)感知）

O1模型現(xiàn)在可以解釋和理解圖像 - 一種稱為視覺(jué)感知的功能。這意味著它可以分析視覺(jué)數(shù)據(jù)並回答有關(guān)它的問(wèn)題，這對(duì)於AI來(lái)說(shuō)是一大步。

醫(yī)學(xué)成像測(cè)試（MMMU基準(zhǔn)）

Openai在一個(gè)名為MMMU的具有挑戰(zhàn)性的基準(zhǔn)上測(cè)試了O1（該基準(zhǔn)（該基準(zhǔn)）代表了多模式的醫(yī)療機(jī)器理解）。該測(cè)試評(píng)估了AI可以理解醫(yī)學(xué)圖像並進(jìn)行準(zhǔn)確評(píng)估的程度，類似於醫(yī)療專業(yè)人員執(zhí)行的任務(wù)。

結(jié)果：O1在此測(cè)試中得分78.2％ ，這使其成為第一個(gè)以與人類醫(yī)學(xué)成像專家相當(dāng)?shù)乃綀?zhí)行的AI模型。這很大，因?yàn)槔斫夂徒忉屷t(yī)學(xué)圖像需要深厚的知識(shí)和精度。

廣泛的知識(shí)（MMLU基準(zhǔn)）

還對(duì)O1模型進(jìn)行了測(cè)試，該模型在MMLU（大量的多任務(wù)語(yǔ)言理解）基準(zhǔn)上進(jìn)行了測(cè)試，該基準(zhǔn)涵蓋了57個(gè)不同的主題，從歷史和文學(xué)到數(shù)學(xué)和計(jì)算機(jī)科學(xué)。

結(jié)果：O1在57名受試者中有54位優(yōu)於GPT-4O！這表明O1不僅在一個(gè)領(lǐng)域中專業(yè)，還表明了廣泛主題的理解得到了提高。

Openai O1：一種在回答問(wèn)題之前'思考”的新模型

用更簡(jiǎn)單的話來(lái)說(shuō)，O1能夠同時(shí)了解文本和圖像的能力意味著它變得更加通用和有能力。無(wú)論是分析複雜的醫(yī)學(xué)圖像，解決高級(jí)數(shù)學(xué)問(wèn)題還是在各種主題上回答問(wèn)題，O1都為AI做些什麼制定了新的標(biāo)準(zhǔn)。

認(rèn)識(shí)O1-Mini

Openai還推出了O1-Mini ，這是O1-Preigiew模型的較小，更快，更實(shí)惠的版本，特別擅長(zhǎng)編碼任務(wù)。它便宜80％ ，這是對(duì)於需要強(qiáng)大推理能力的開發(fā)人員而無(wú)需破壞銀行的開發(fā)人員的絕佳選擇。

我們還發(fā)布了Openai O1-Mini，這是一種具有成本效益的推理模型，在STEM上表現(xiàn)出色，尤其是數(shù)學(xué)和編碼。
- 2024年9月12日Openai（@Openai）

使用O1 mini的數(shù)學(xué)

另請(qǐng)閱讀：Openai的O1-Mini：具有成本效益推理的STEM的改變遊戲規(guī)則的模型

誰(shuí)可以使用O1-preiview？

這些新型號(hào)是針對(duì)任何處理複雜問(wèn)題的人的遊戲規(guī)則改變者：

研究人員和科學(xué)家：它們可以幫助註釋細(xì)胞測(cè)序數(shù)據(jù)或在量子物理等領(lǐng)域中產(chǎn)生所需的複雜公式。
開發(fā)人員：構(gòu)建和執(zhí)行多步驟工作流變得更加容易，更高效。
學(xué)生和教育工作者：他們提供了一種探索數(shù)學(xué)和科學(xué)中具有挑戰(zhàn)性概念的新方法。

如何訪問(wèn)O1-preview？

Chatgpt Plus和團(tuán)隊(duì)用戶：您可以從今天開始訪問(wèn)ChatGPT中的O1-preview和O1-Mini模型。只需從模型選擇器中選擇它們即可。目前有每週的消息限制（O1-preiview的30條消息，O1-Mini的50條消息），但Openai正在努力盡快增加這些限制。

Openai O1：一種在回答問(wèn)題之前'思考”的新模型

CHATGPT Enterprise和EDU用戶：從下週開始，您將可以訪問(wèn)這兩種型號(hào)。
開發(fā)人員：如果您處?kù)禔PI使用層5，則可以立即通過(guò)API開始嘗試這些模型。某些功能諸如函數(shù)調(diào)用和流媒體之類的功能尚不可用，但是它們正在路上。
chatgpt免費(fèi)用戶：好消息！ OpenAI計(jì)劃使所有自由用戶都可以使用O1-Mini。

安全也很重要

Openai還通過(guò)這些型號(hào)提高了安全功能。他們已經(jīng)接受了培訓(xùn)，以更好地理解和遵循安全指南，通過(guò)對(duì)對(duì)話期間的規(guī)則進(jìn)行推理。這意味著他們不太可能被欺騙去做他們不應(yīng)該做的事情（您可能聽說(shuō)過(guò)“越獄”的AI模型）。

在艱難的安全測(cè)試中，O1-preview模型得分為100分，而GPT-4O的得分為22 。這是一個(gè)重大的改進(jìn)，表明他們傾向在安全和適當(dāng)?shù)慕缦薰?fàn)圍內(nèi)更好。

Openai與美國(guó)和英國(guó)的安全組織緊密合作，他們甚至鑑於這些機(jī)構(gòu)的早期訪問(wèn)模型，以幫助研究並確保一切都達(dá)到標(biāo)準(zhǔn)。