亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
目錄
GPT 5和GPT 4O:快速提醒
GPT-5
GPT-4O
GPT 5與GPT 4O:功能比較
GPT 5與GPT 4O:任務(wù)比較
任務(wù)1:內(nèi)容創(chuàng)建
觀察:
任務(wù)2:圖像生成
任務(wù)3:編碼
任務(wù)4:圖像分析
任務(wù)5:推理
GPT-5 vs GPT-4O:最終裁決
結(jié)論
首頁 科技週邊 IT業(yè)界 GPT 5與GPT 4O:哪個更好?

GPT 5與GPT 4O:哪個更好?

Sep 18, 2025 am 03:21 AM

GPT-5的最新版本席捲了世界。 Openai的最新旗艦?zāi)J绞盏搅瞬煌脑u論,而有些人讚揚(yáng)其能力,而另一些則強(qiáng)調(diào)了其缺點(diǎn)。這讓我感到奇怪:GPT-5是否真的優(yōu)於原始最喜歡的GPT-4O?

就個人而言,GPT-4O是我的首選LLM,從文本摘要到圖像生成和數(shù)據(jù)分析。既然OpenAI已將其替換為GPT-5,我決定將這兩種型號進(jìn)行測試。這種升級是真正的進(jìn)化,還是可能會降低Chatgpt吸引力的匆忙舉動?

讓GPT之戰(zhàn)開始!

目錄

  • GPT 5和GPT 4O:快速提醒
  • GPT 5與GPT 4O:功能比較
  • GPT 5與GPT 4O:任務(wù)比較
    • 任務(wù)1:內(nèi)容創(chuàng)建
    • 任務(wù)2:圖像生成
    • 任務(wù)3:編碼
    • 任務(wù)4:圖像分析
    • 任務(wù)5:推理
  • GPT-5 vs GPT-4O:最終裁決
  • 結(jié)論

GPT 5和GPT 4O:快速提醒

讓我們快速研究有關(guān)我們將在此博客中測試的兩種ChatGpt模型的詳細(xì)信息:GPT-5和GPT 4O

GPT-5

GPT-5上週發(fā)行的GPT-5現(xiàn)在是Chatgpt最先進(jìn)的車型。 OpenAI的最新多模式LLM引入了代理功能和“統(tǒng)一系統(tǒng)”,以進(jìn)行任務(wù)評估。該系統(tǒng)會自動確定查詢是需要深層推理還是基本處理。與以前的型號不同,GPT-5遵循一種“學(xué)習(xí)”方法。它顯示出更多的同理心,而比其前任不那麼同意。除此GPT-5外,還具有增強(qiáng)的編碼,寫作和氛圍的功能

在我上一篇有關(guān)GPT-5的文章中找到更多。

GPT-4O

GPT-4O(其中“ O”的意思是“ Omni”)是去年發(fā)行的。這個Multimodalchange是人們使用的方式。 ModelCamewith增強(qiáng)了編碼和視覺分析功能。 GPT-4 COMEM具有語音識別和語音分析功能。該模型的處理速度提高和響應(yīng)延遲降低。 OpenAI的GPT-4O產(chǎn)生了更自然和明智的響應(yīng),並且能夠訪問工具並提供實時信息。

要了解更多信息,請在GPT 4O上查看本文。

GPT 5與GPT 4O:功能比較

特徵 GPT-4O GPT-5
發(fā)布日期 2024年5月 2025年8月
方式 文本,圖像,音頻 文字,圖像,音頻,視頻
上下文窗口(chatgpt) ?128K令牌 256K令牌
上下文窗口(API) ?128K令牌 400k令牌
推理模式 單型 雙模式:快速深度推理
幻覺率 低的 在Openai模型中最低
個性化 沒有任何 個性預(yù)設(shè)語調(diào)控制
工具集成 有限的 Gmail,日曆,代碼工具,更多
安全完成 是的 - 有限的,有用的答案
SWE板凳經(jīng)過驗證 30.8%的精度 74.9%的精度
Aime 2025(數(shù)學(xué)) 71% 94.6%(沒有工具)
videmmmu 58.8% 81.1%
Healthbench 31.6% 46.2%
目標(biāo)用例 實時互動,創(chuàng)意任務(wù) 複雜的推理,企業(yè)工作流程

GPT 5與GPT 4O:任務(wù)比較

現(xiàn)在,讓我們通過評估其在以下任務(wù)上的性能來對兩個模型進(jìn)行測試:

  1. 內(nèi)容創(chuàng)建
  2. 圖像生成
  3. 編碼
  4. 圖像分析
  5. 推理

讓GPT-5與GPT-4O戰(zhàn)鬥開始!

任務(wù)1:內(nèi)容創(chuàng)建

閱讀Athttps://www.analyticsvidhya.com/blog/2024/07/building-agentic-gation-agentic-rag-systems-with-langgraph/langgraph/,以了解為Wikipedia數(shù)據(jù)創(chuàng)建向量數(shù)據(jù)庫的過程。然後,簡要摘要有關(guān)關(guān)鍵步驟。 ”

GPT-5響應(yīng):

GPT 5與GPT 4O:哪個更好?

GPT-4O響應(yīng):

GPT 5與GPT 4O:哪個更好?

觀察:

GPT-5產(chǎn)生的響應(yīng)是一個簡明的摘要,即一個人知道該主題所需的。這些步驟均以適當(dāng)?shù)捻樞蛄谐?,並帶有足夠的上下文。另一方面,GPT-4O的響應(yīng)是博客中提到的所有步驟的摘要。它以與討論相同的方式列出了博客中涵蓋的步驟。兩種模型的方法的差異:GPT-5合併了點(diǎn)以生成整個過程的簡明摘要,而GPT-4O則對博客中涵蓋的所有步驟進(jìn)行了簡明的摘要。

任務(wù)2:圖像生成

圖像是語音代理的工作。它有3個主要部分
語音到文本(STT):捕獲並將您的口語轉(zhuǎn)換為文本。
代理邏輯:這是您的代碼(或您的代理),它可以弄清楚適當(dāng)?shù)捻憫?yīng)
文本到語音(TTS):將代理的文本回復(fù)轉(zhuǎn)換為大聲說出的音頻。
將此基本圖像轉(zhuǎn)換為充滿活力的圖像。

GPT-5響應(yīng)

GPT 5與GPT 4O:哪個更好?

GPT-4O響應(yīng):

GPT 5與GPT 4O:哪個更好?

觀察:

該任務(wù)很簡單,並且將其二級用品很好地完成了。從GPT-5開始,它創(chuàng)建了帶有顏色的充滿活力的圖像。它生成的圖像具有文本和圖標(biāo);但是,存在一個較小的錯誤 - 將麥克風(fēng)圖標(biāo)與TTS框連接的小箭頭。至於GPT-4O生成的圖像,它使用了玻璃顏色,使其越來越活力。 GPT-4O的圖像是音頻輸入和輸出源。

任務(wù)3:編碼

單詞計數(shù)網(wǎng)站的基本HTML代碼。

GPT-5響應(yīng):

GPT 5與GPT 4O:哪個更好?

GPT-4O響應(yīng):

GPT 5與GPT 4O:哪個更好?

觀察:

GPT-5花了一些時間來生成此查詢的代碼,特別是針對counter網(wǎng)站的代碼。但是,最終產(chǎn)出令人印象深刻。 UI/UX和功能共同創(chuàng)建功能齊全的單詞計數(shù)網(wǎng)頁。另一方面,GPT-4O的輸出相比令人沮喪。 UI/UX是基本的,僅提供核心文字計數(shù)功能,沒有其他細(xì)化。它的設(shè)計看起來也有些過時

任務(wù)4:圖像分析

計算此電路圖的輸出。

GPT 5與GPT 4O:哪個更好?

GPT-5響應(yīng):

GPT 5與GPT 4O:哪個更好?

GPT-4O響應(yīng):

GPT 5與GPT 4O:哪個更好?

觀察:

GPT-5迅速回答了這個問題,有效地分析了圖像及其組件。它正確識別了半波整流器,讀取圖表上標(biāo)記的值,並應(yīng)用了適當(dāng)?shù)倪壿媮碛嬎爿敵鲭娏骱碗妷褐?。相比之下,GPT-4O在這項任務(wù)上掙扎。儘管它識別出輸出波形,但未能處理其他關(guān)鍵因素。最值得注意的是,GPT-4O無法從圖像中提取必要的值以執(zhí)行任何計算。

任務(wù)5:推理

解決以下sudoku並將最終解決方案作為圖像提供。

GPT 5與GPT 4O:哪個更好?

GPT-5響應(yīng):

GPT 5與GPT 4O:哪個更好?

GPT-4O響應(yīng):

GPT 5與GPT 4O:哪個更好?

觀察:

GPT-5最初在圖像解釋中掙扎,花費(fèi)三分鐘以上來處理輸入。它不是獨(dú)立求解拼圖,而是要求確認(rèn)圖像中多個值。在我手動提供了所有行值後,該模型成功處理和解決了拼圖,儘管需要大量的用戶幫助,但產(chǎn)生了正確的解決方案。

相比之下,GPT-4O未能完全解決難題。它簡單地用零填充了所有缺失值,並將其作為其輸出解決方案。

GPT-5 vs GPT-4O:最終裁決

選擇明顯的贏家從未有過挑戰(zhàn)。這是兩個LLM在不同任務(wù)中執(zhí)行的方式:

任務(wù) GPT-5 GPT-4O
內(nèi)容創(chuàng)建 更簡潔 更好的總結(jié)
圖像生成 更充滿活力 更具創(chuàng)造力
編碼 偉大的 功能有限
圖像分析 平均的 平均的
推理 出色的 基本能力

兩者之間有明顯的贏家嗎?答案是否定的??冃б蛉蝿?wù)而有很大差異:

  • GPT-5在編碼和推理中占主導(dǎo)地位
  • GPT-4O在內(nèi)容創(chuàng)建和圖像生成/分析中擁有自己
  • 速度與深度:GPT-4O提供更快的響應(yīng),而GPT-5有時會猶豫不決地分析和快速生成

上下文事項:請記住,GPT-4O年齡大了。雖然GPT-5受益於最新的培訓(xùn)數(shù)據(jù)和代理優(yōu)化,但與其前任相比,它是否真的是開創(chuàng)性的?不完全是。

結(jié)論

由於世界要求GPT-4O的複出,我全心全意地同意。

雖然GPT-5自第1天以來有所改善(現(xiàn)在勝過第3天的結(jié)果),但其匆忙的發(fā)布使用戶努力適應(yīng)。事實是,GPT-5僅在特定任務(wù)上略超過GPT-4O,這使得放棄我們心愛的GPT-4O的痛苦很難讓人感覺“更好”。也許Openai需要在發(fā)布前進(jìn)行更嚴(yán)格的測試。但是現(xiàn)在它已經(jīng)活躍了,我們只能觀看它的進(jìn)化。

今天?我會簽署任何請願書,以帶回GPT-4O。 Chatgpt發(fā)生了變化,而不是更好。在評論部分中讓我知道您的想法。

PS:我從以前的博客中獲取了GPT 4O輸出:

  • 雙子座2.0 vs GPT-4O
  • GPT-4O圖像生成
  • O1 vs GPT-4O

以上是GPT 5與GPT 4O:哪個更好?的詳細(xì)內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Stock Market GPT

Stock Market GPT

人工智慧支援投資研究,做出更明智的決策

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Google Notebooklm的AI播客主持人現(xiàn)在可以通過您的筆記進(jìn)行參數(shù) Google Notebooklm的AI播客主持人現(xiàn)在可以通過您的筆記進(jìn)行參數(shù) Sep 16, 2025 am 07:12 AM

Notebooklm由Google Now具有新的音頻概述格式:簡短,批評和辯解的添加物帶來活潑的互動和結(jié)構(gòu)化討論來上傳內(nèi)容,增強(qiáng)功能使工具更接近互動,播客風(fēng)格的AI

AI意味著數(shù)據(jù)洩露現(xiàn)在的成本要低得多 - 但它們?nèi)匀粚ζ髽I(yè)構(gòu)成巨大威脅 AI意味著數(shù)據(jù)洩露現(xiàn)在的成本要低得多 - 但它們?nèi)匀粚ζ髽I(yè)構(gòu)成巨大威脅 Sep 21, 2025 am 12:24 AM

人工智能正在縮短檢測和響應(yīng)數(shù)據(jù)洩露和響應(yīng)的時間。

Microsoft警告緩慢的Azure流量 Microsoft警告緩慢的Azure流量 Sep 17, 2025 am 05:33 AM

微軟發(fā)出了警告,警告網(wǎng)絡(luò)潛伏期,影響了紅海中的海底電纜的中斷,影響了Azure服務(wù),迫使公司通過替代路線重定向流量。

AI信託悖論:受監(jiān)管行業(yè)如何在AI驅(qū)動的世界中保持可信度 AI信託悖論:受監(jiān)管行業(yè)如何在AI驅(qū)動的世界中保持可信度 Sep 21, 2025 am 12:36 AM

如果您在五年前告訴一個充滿風(fēng)險的保險高管的房間,即將近一半的英國消費(fèi)者歡迎AI的健????康建議,那麼您會受到嚴(yán)重的懷疑,即使不是完全笑聲。我們的最新報告S

GPT 5與GPT 4O:哪個更好? GPT 5與GPT 4O:哪個更好? Sep 18, 2025 am 03:21 AM

GPT-5的最新版本席捲了世界。 Openai的最新旗艦?zāi)J绞盏搅瞬煌脑u論,而有些人讚揚(yáng)其能力,而另一些則強(qiáng)調(diào)了其缺點(diǎn)。這讓我感到奇怪:是GPT-

Codex Cli vs Gemini Cli vs Claude代碼:哪個是最好的? Codex Cli vs Gemini Cli vs Claude代碼:哪個是最好的? Sep 18, 2025 am 04:06 AM

在2025年,多款可直接從終端訪問的AI編程助手相繼發(fā)布。 Codex CLI、Gemini CLI 和 Claude Code 是其中一些熱門工具,它們將大型語言模型嵌入到命令行工作流中。這些編程工具能夠通過自然語言指令生成和修復(fù)代碼,功能十分強(qiáng)大。我們對這三款工具在不同任務(wù)中的表現(xiàn)進(jìn)行了詳細(xì)評測,以確定哪一款更具實用性。每款助手都基於先進(jìn)的AI模型,例如 o4-mini、Gemini 2.5 Pro 或 Claude Sonnet 4,旨在提升開發(fā)效率。我們將三者置於相同的環(huán)境中,使用具體指標(biāo)

GCX將盧卡·西蒙內(nèi)利(Luca Simonelli)稱為渠道和全球聯(lián)盟的SVP GCX將盧卡·西蒙內(nèi)利(Luca Simonelli)稱為渠道和全球聯(lián)盟的SVP Sep 20, 2025 am 02:12 AM

GCX託管服務(wù)是網(wǎng)絡(luò)解決方案的領(lǐng)先提供商,已公佈任命盧卡·西蒙內(nèi)利(Luca Simonelli)為渠道和全球聯(lián)盟的新高級副總裁。這項戰(zhàn)略僱用是託管服務(wù)提供商 - 服務(wù)客戶

是否希望Chatgpt可以安排您的一天並提醒您有關(guān)遺忘的電子郵件?您很快就可以將其與您的Google帳戶鏈接 是否希望Chatgpt可以安排您的一天並提醒您有關(guān)遺忘的電子郵件?您很快就可以將其與您的Google帳戶鏈接 Sep 20, 2025 am 12:51 AM

OpenAI與GPT-5一起推出了一個主要的新集成,使Chatgpt Pro用戶可以將其Gmail,Google Calendar和Google聯(lián)繫人直接連接到具有訪問Google Apps的AI助手,Chatgpt可以總結(jié)您的一天,生成P

See all articles