亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
目錄
GPT 5和GPT 4O:快速提醒
GPT-5
GPT-4O
GPT 5與GPT 4O:功能比較
GPT 5與GPT 4O:任務(wù)比較
任務(wù)1:內(nèi)容創(chuàng)建
觀察:
任務(wù)2:圖像生成
任務(wù)3:編碼
任務(wù)4:圖像分析
任務(wù)5:推理
GPT-5 vs GPT-4O:最終裁決
結(jié)論
首頁 科技周邊 IT業(yè)界 GPT 5與GPT 4O:哪個(gè)更好?

GPT 5與GPT 4O:哪個(gè)更好?

Sep 18, 2025 am 03:21 AM

GPT-5的最新版本席卷了世界。 Openai的最新旗艦?zāi)J绞盏搅瞬煌脑u(píng)論,而有些人贊揚(yáng)其能力,而另一些則強(qiáng)調(diào)了其缺點(diǎn)。這讓我感到奇怪:GPT-5是否真的優(yōu)于原始最喜歡的GPT-4O?

就個(gè)人而言,GPT-4O是我的首選LLM,從文本摘要到圖像生成和數(shù)據(jù)分析。既然OpenAI已將其替換為GPT-5,我決定將這兩種型號(hào)進(jìn)行測(cè)試。這種升級(jí)是真正的進(jìn)化,還是可能會(huì)降低Chatgpt吸引力的匆忙舉動(dòng)?

讓GPT之戰(zhàn)開始!

目錄

  • GPT 5和GPT 4O:快速提醒
  • GPT 5與GPT 4O:功能比較
  • GPT 5與GPT 4O:任務(wù)比較
    • 任務(wù)1:內(nèi)容創(chuàng)建
    • 任務(wù)2:圖像生成
    • 任務(wù)3:編碼
    • 任務(wù)4:圖像分析
    • 任務(wù)5:推理
  • GPT-5 vs GPT-4O:最終裁決
  • 結(jié)論

GPT 5和GPT 4O:快速提醒

讓我們快速研究有關(guān)我們將在此博客中測(cè)試的兩種ChatGpt模型的詳細(xì)信息:GPT-5和GPT 4O

GPT-5

GPT-5上周發(fā)行的GPT-5現(xiàn)在是Chatgpt最先進(jìn)的車型。 OpenAI的最新多模式LLM引入了代理功能和“統(tǒng)一系統(tǒng)”,以進(jìn)行任務(wù)評(píng)估。該系統(tǒng)會(huì)自動(dòng)確定查詢是需要深層推理還是基本處理。與以前的型號(hào)不同,GPT-5遵循一種“學(xué)習(xí)”方法。它顯示出更多的同理心,而比其前任不那么同意。除此GPT-5外,還具有增強(qiáng)的編碼,寫作和氛圍的功能

在我上一篇有關(guān)GPT-5的文章中找到更多。

GPT-4O

GPT-4O(其中“ O”的意思是“ Omni”)是去年發(fā)行的。這個(gè)Multimodalchange是人們使用的方式。 ModelCamewith增強(qiáng)了編碼和視覺分析功能。GPT-4 COMEM具有語音識(shí)別和語音分析功能。該模型的處理速度提高和響應(yīng)延遲降低。 OpenAI的GPT-4O產(chǎn)生了更自然和明智的響應(yīng),并且能夠訪問工具并提供實(shí)時(shí)信息。

要了解更多信息,請(qǐng)?jiān)贕PT 4O上查看本文。

GPT 5與GPT 4O:功能比較

特征 GPT-4O GPT-5
發(fā)布日期 2024年5月 2025年8月
方式 文本,圖像,音頻 文字,圖像,音頻,視頻
上下文窗口(chatgpt) ?128K令牌 256K令牌
上下文窗口(API) ?128K令牌 400k令牌
推理模式 單型 雙模式:快速深度推理
幻覺率 低的 在Openai模型中最低
個(gè)性化 沒有任何 個(gè)性預(yù)設(shè)語調(diào)控制
工具集成 有限的 Gmail,日歷,代碼工具,更多
安全完成 是的 - 有限的,有用的答案
SWE板凳經(jīng)過驗(yàn)證 30.8%的精度 74.9%的精度
Aime 2025(數(shù)學(xué)) 71% 94.6%(沒有工具)
videmmmu 58.8% 81.1%
Healthbench 31.6% 46.2%
目標(biāo)用例 實(shí)時(shí)互動(dòng),創(chuàng)意任務(wù) 復(fù)雜的推理,企業(yè)工作流程

GPT 5與GPT 4O:任務(wù)比較

現(xiàn)在,讓我們通過評(píng)估其在以下任務(wù)上的性能來對(duì)兩個(gè)模型進(jìn)行測(cè)試:

  1. 內(nèi)容創(chuàng)建
  2. 圖像生成
  3. 編碼
  4. 圖像分析
  5. 推理

讓GPT-5與GPT-4O戰(zhàn)斗開始!

任務(wù)1:內(nèi)容創(chuàng)建

閱讀Athttps://www.analyticsvidhya.com/blog/2024/07/building-agentic-gation-agentic-rag-systems-with-langgraph/langgraph/,以了解為Wikipedia數(shù)據(jù)創(chuàng)建向量數(shù)據(jù)庫的過程。然后,簡(jiǎn)要摘要有關(guān)關(guān)鍵步驟?!?/p>

GPT-5響應(yīng):

GPT 5與GPT 4O:哪個(gè)更好?

GPT-4O響應(yīng):

GPT 5與GPT 4O:哪個(gè)更好?

觀察:

GPT-5產(chǎn)生的響應(yīng)是一個(gè)簡(jiǎn)明的摘要,即一個(gè)人知道該主題所需的。這些步驟均以適當(dāng)?shù)捻樞蛄谐?,并帶有足夠的上下文。另一方面,GPT-4O的響應(yīng)是博客中提到的所有步驟的摘要。它以與討論相同的方式列出了博客中涵蓋的步驟。兩種模型的方法的差異:GPT-5合并了點(diǎn)以生成整個(gè)過程的簡(jiǎn)明摘要,而GPT-4O則對(duì)博客中涵蓋的所有步驟進(jìn)行了簡(jiǎn)明的摘要。

任務(wù)2:圖像生成

圖像是語音代理的工作。它有3個(gè)主要部分
語音到文本(STT):捕獲并將您的口語轉(zhuǎn)換為文本。
代理邏輯:這是您的代碼(或您的代理),它可以弄清楚適當(dāng)?shù)捻憫?yīng)
文本到語音(TTS):將代理的文本回復(fù)轉(zhuǎn)換為大聲說出的音頻。
將此基本圖像轉(zhuǎn)換為充滿活力的圖像。

GPT-5響應(yīng)

GPT 5與GPT 4O:哪個(gè)更好?

GPT-4O響應(yīng):

GPT 5與GPT 4O:哪個(gè)更好?

觀察:

該任務(wù)很簡(jiǎn)單,并且將其二級(jí)用品很好地完成了。從GPT-5開始,它創(chuàng)建了帶有顏色的充滿活力的圖像。它生成的圖像具有文本和圖標(biāo);但是,存在一個(gè)較小的錯(cuò)誤 - 將麥克風(fēng)圖標(biāo)與TTS框連接的小箭頭。至于GPT-4O生成的圖像,它使用了玻璃顏色,使其越來越活力。 GPT-4O的圖像是音頻輸入和輸出源。

任務(wù)3:編碼

單詞計(jì)數(shù)網(wǎng)站的基本HTML代碼。

GPT-5響應(yīng):

GPT 5與GPT 4O:哪個(gè)更好?

GPT-4O響應(yīng):

GPT 5與GPT 4O:哪個(gè)更好?

觀察:

GPT-5花了一些時(shí)間來生成此查詢的代碼,特別是針對(duì)counter網(wǎng)站的代碼。但是,最終產(chǎn)出令人印象深刻。 UI/UX和功能共同創(chuàng)建功能齊全的單詞計(jì)數(shù)網(wǎng)頁。另一方面,GPT-4O的輸出相比令人沮喪。 UI/UX是基本的,僅提供核心文字計(jì)數(shù)功能,沒有其他細(xì)化。它的設(shè)計(jì)看起來也有些過時(shí)

任務(wù)4:圖像分析

計(jì)算此電路圖的輸出。

GPT 5與GPT 4O:哪個(gè)更好?

GPT-5響應(yīng):

GPT 5與GPT 4O:哪個(gè)更好?

GPT-4O響應(yīng):

GPT 5與GPT 4O:哪個(gè)更好?

觀察:

GPT-5迅速回答了這個(gè)問題,有效地分析了圖像及其組件。它正確識(shí)別了半波整流器,讀取圖表上標(biāo)記的值,并應(yīng)用了適當(dāng)?shù)倪壿媮碛?jì)算輸出電流和電壓值。相比之下,GPT-4O在這項(xiàng)任務(wù)上掙扎。盡管它識(shí)別出輸出波形,但未能處理其他關(guān)鍵因素。最值得注意的是,GPT-4O無法從圖像中提取必要的值以執(zhí)行任何計(jì)算。

任務(wù)5:推理

解決以下sudoku并將最終解決方案作為圖像提供。

GPT 5與GPT 4O:哪個(gè)更好?

GPT-5響應(yīng):

GPT 5與GPT 4O:哪個(gè)更好?

GPT-4O響應(yīng):

GPT 5與GPT 4O:哪個(gè)更好?

觀察:

GPT-5最初在圖像解釋中掙扎,花費(fèi)三分鐘以上來處理輸入。它不是獨(dú)立求解拼圖,而是要求確認(rèn)圖像中多個(gè)值。在我手動(dòng)提供了所有行值后,該模型成功處理和解決了拼圖,盡管需要大量的用戶幫助,但產(chǎn)生了正確的解決方案。

相比之下,GPT-4O未能完全解決難題。它簡(jiǎn)單地用零填充了所有缺失值,并將其作為其輸出解決方案。

GPT-5 vs GPT-4O:最終裁決

選擇明顯的贏家從未有過挑戰(zhàn)。這是兩個(gè)LLM在不同任務(wù)中執(zhí)行的方式:

任務(wù) GPT-5 GPT-4O
內(nèi)容創(chuàng)建 更簡(jiǎn)潔 更好的總結(jié)
圖像生成 更充滿活力 更具創(chuàng)造力
編碼 偉大的 功能有限
圖像分析 平均的 平均的
推理 出色的 基本能力

兩者之間有明顯的贏家嗎?答案是否定的。績(jī)效因任務(wù)而有很大差異:

  • GPT-5在編碼和推理中占主導(dǎo)地位
  • GPT-4O在內(nèi)容創(chuàng)建和圖像生成/分析中擁有自己
  • 速度與深度:GPT-4O提供更快的響應(yīng),而GPT-5有時(shí)會(huì)猶豫不決地分析和快速生成

上下文事項(xiàng):請(qǐng)記住,GPT-4O年齡大了。雖然GPT-5受益于最新的培訓(xùn)數(shù)據(jù)和代理優(yōu)化,但與其前任相比,它是否真的是開創(chuàng)性的?不完全是。

結(jié)論

由于世界要求GPT-4O的復(fù)出,我全心全意地同意。

雖然GPT-5自第1天以來有所改善(現(xiàn)在勝過第3天的結(jié)果),但其匆忙的發(fā)布使用戶努力適應(yīng)。事實(shí)是,GPT-5僅在特定任務(wù)上略超過GPT-4O,這使得放棄我們心愛的GPT-4O的痛苦很難讓人感覺“更好”。也許Openai需要在發(fā)布前進(jìn)行更嚴(yán)格的測(cè)試。但是現(xiàn)在它已經(jīng)活躍了,我們只能觀看它的進(jìn)化。

今天?我會(huì)簽署任何請(qǐng)?jiān)笗?,以帶回GPT-4O。 Chatgpt發(fā)生了變化,而不是更好。在評(píng)論部分中讓我知道您的想法。

PS:我從以前的博客中獲取了GPT 4O輸出:

  • 雙子座2.0 vs GPT-4O
  • GPT-4O圖像生成
  • O1 vs GPT-4O

以上是GPT 5與GPT 4O:哪個(gè)更好?的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請(qǐng)聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Stock Market GPT

Stock Market GPT

人工智能驅(qū)動(dòng)投資研究,做出更明智的決策

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

熱門話題

Google Notebooklm的AI播客主持人現(xiàn)在可以通過您的筆記進(jìn)行參數(shù) Google Notebooklm的AI播客主持人現(xiàn)在可以通過您的筆記進(jìn)行參數(shù) Sep 16, 2025 am 07:12 AM

Notebooklm由Google Now具有新的音頻概述格式:簡(jiǎn)短,批評(píng)和辯解的添加物帶來活潑的互動(dòng)和結(jié)構(gòu)化討論來上傳內(nèi)容,增強(qiáng)功能使工具更接近互動(dòng),播客風(fēng)格的AI

AI意味著數(shù)據(jù)泄露現(xiàn)在的成本要低得多 - 但它們?nèi)匀粚?duì)企業(yè)構(gòu)成巨大威脅 AI意味著數(shù)據(jù)泄露現(xiàn)在的成本要低得多 - 但它們?nèi)匀粚?duì)企業(yè)構(gòu)成巨大威脅 Sep 21, 2025 am 12:24 AM

人工智能正在縮短檢測(cè)和響應(yīng)數(shù)據(jù)泄露和響應(yīng)的時(shí)間。

Microsoft警告緩慢的Azure流量 Microsoft警告緩慢的Azure流量 Sep 17, 2025 am 05:33 AM

微軟發(fā)出了警告,警告網(wǎng)絡(luò)潛伏期,影響了紅海中的海底電纜的中斷,影響了Azure服務(wù),迫使公司通過替代路線重定向流量。

AI信托悖論:受監(jiān)管行業(yè)如何在AI驅(qū)動(dòng)的世界中保持可信度 AI信托悖論:受監(jiān)管行業(yè)如何在AI驅(qū)動(dòng)的世界中保持可信度 Sep 21, 2025 am 12:36 AM

如果您在五年前告訴一個(gè)充滿風(fēng)險(xiǎn)的保險(xiǎn)高管的房間,即將近一半的英國(guó)消費(fèi)者歡迎AI的健??康建議,那么您會(huì)受到嚴(yán)重的懷疑,即使不是完全笑聲。我們的最新報(bào)告S

GPT 5與GPT 4O:哪個(gè)更好? GPT 5與GPT 4O:哪個(gè)更好? Sep 18, 2025 am 03:21 AM

GPT-5的最新版本席卷了世界。 Openai的最新旗艦?zāi)J绞盏搅瞬煌脑u(píng)論,而有些人贊揚(yáng)其能力,而另一些則強(qiáng)調(diào)了其缺點(diǎn)。這讓我感到奇怪:是GPT-

Codex Cli vs Gemini Cli vs Claude代碼:哪個(gè)是最好的? Codex Cli vs Gemini Cli vs Claude代碼:哪個(gè)是最好的? Sep 18, 2025 am 04:06 AM

在2025年,多款可直接從終端訪問的AI編程助手相繼發(fā)布。Codex CLI、Gemini CLI 和 Claude Code 是其中一些熱門工具,它們將大型語言模型嵌入到命令行工作流中。這些編程工具能夠通過自然語言指令生成和修復(fù)代碼,功能十分強(qiáng)大。我們對(duì)這三款工具在不同任務(wù)中的表現(xiàn)進(jìn)行了詳細(xì)評(píng)測(cè),以確定哪一款更具實(shí)用性。每款助手都基于先進(jìn)的AI模型,例如 o4-mini、Gemini 2.5 Pro 或 Claude Sonnet 4,旨在提升開發(fā)效率。我們將三者置于相同的環(huán)境中,使用具體指標(biāo)

GCX將盧卡·西蒙內(nèi)利(Luca Simonelli)稱為渠道和全球聯(lián)盟的SVP GCX將盧卡·西蒙內(nèi)利(Luca Simonelli)稱為渠道和全球聯(lián)盟的SVP Sep 20, 2025 am 02:12 AM

GCX托管服務(wù)是網(wǎng)絡(luò)解決方案的領(lǐng)先提供商,已公布任命盧卡·西蒙內(nèi)利(Luca Simonelli)為渠道和全球聯(lián)盟的新高級(jí)副總裁。這項(xiàng)戰(zhàn)略雇用是托管服務(wù)提供商 - 服務(wù)客戶

是否希望Chatgpt可以安排您的一天并提醒您有關(guān)遺忘的電子郵件?您很快就可以將其與您的Google帳戶鏈接 是否希望Chatgpt可以安排您的一天并提醒您有關(guān)遺忘的電子郵件?您很快就可以將其與您的Google帳戶鏈接 Sep 20, 2025 am 12:51 AM

OpenAI與GPT-5一起推出了一個(gè)主要的新集成,使Chatgpt Pro用戶可以將其Gmail,Google Calendar和Google聯(lián)系人直接連接到具有訪問Google Apps的AI助手,Chatgpt可以總結(jié)您的一天,生成P

See all articles