国产成人精品久久亚洲高清不卡 ,亚洲www啪成人一区二区

什么是Grok 4？

什么是克勞德4？

Grok 4 vs Claude 4：基于績(jī)效的比較

任務(wù)1：SecurePay UI原型

比較分析

任務(wù)2：物理問(wèn)題

Grok 4的回應(yīng)

克勞德4的響應(yīng)

任務(wù)3：網(wǎng)絡(luò)中的關(guān)鍵連接

首頁(yè)

科技周邊

人工智能

Grok 4 vs Claude 4：哪個(gè)更好？

Joseph Gordon-Levitt

Jul 12, 2025 am 09:37 AM

到2025年中，AI“軍備競(jìng)賽”正在加熱，Xai和Anthropic都發(fā)布了他們的旗艦車(chē)型Grok 4和Claude 4。這兩種模型處于設(shè)計(jì)理念和部署平臺(tái)的相反端，但是他們?cè)诟?jìng)爭(zhēng)推理和編碼基準(zhǔn)標(biāo)準(zhǔn)方面互相比較。盡管Grok 4位居學(xué)術(shù)表格，但Claude 4正在以其編碼性能打破天花板。因此，燃燒的問(wèn)題是 - Grok 4或Claude 4 - 哪種型號(hào)更好？

在此博客中，我們將在三個(gè)不同的任務(wù)上測(cè)試Grok 4和Claude 4的性能，并比較結(jié)果以找到最終的贏家！

什么是Grok 4？

Grok 4是XAI發(fā)布的最新多模式大型語(yǔ)言模型，可通過(guò)X訪問(wèn)，可通過(guò)Grok App/網(wǎng)站使用。 Grok 4是一種已通過(guò)工具使用訓(xùn)練的代理LLM。該模型非常擅長(zhǎng)解決所有學(xué)科的學(xué)術(shù)問(wèn)題，并在不同基準(zhǔn)測(cè)試的幾乎所有其他LLM上都超越了所有其他LLM。隨之而來(lái)的是，Grok 4還結(jié)合了一個(gè)大的上下文窗口，其容量為256K令牌，實(shí)時(shí)網(wǎng)絡(luò)搜索以及增強(qiáng)的語(yǔ)音模式，該模式與人類保持平靜。 Grok 4包含出色的推理和類似人類的思維功能，使其成為迄今為止最有力的模型之一。

要了解有關(guān)Grok 4的所有信息，您可以閱讀此博客：Grok 4在這里，這很棒。

什么是克勞德4？

Claude 4是迄今為止擬人化的最先進(jìn)的大型語(yǔ)言模型。這種多模式LLM具有混合推理，高級(jí)思維和代理建設(shè)能力。該模型顯示了簡(jiǎn)單查詢的閃電響應(yīng)，而對(duì)于復(fù)雜的查詢，它轉(zhuǎn)移到了更深的推理，通常將多步任務(wù)分解為小任務(wù)。它具有效率的性能，并記錄了編碼問(wèn)題的出色結(jié)果。

前往此博客，詳細(xì)閱讀有關(guān)Claude 4的信息：Claude 4已經(jīng)淘汰，這太神奇了！

Grok 4 vs Claude 4：基于績(jī)效的比較

現(xiàn)在我們已經(jīng)了解了這兩種模型的細(xì)微差別，讓我們首先看一下這兩個(gè)模型的性能比較：

Grok 4 vs Claude 4：哪個(gè)更好？

從圖表中，很明顯，克勞德4在響應(yīng)時(shí)間甚至每任務(wù)的成本方面都擊敗了Grok 4。但是我們不一定總是按數(shù)字進(jìn)行。讓我們測(cè)試兩個(gè)模型的不同任務(wù)，看看以上統(tǒng)計(jì)數(shù)據(jù)是否成立！

任務(wù)1：SecurePay UI原型

提示： “使用HTML，CSS和JavaScript創(chuàng)建一個(gè)交互式且視覺(jué)上吸引人的付款網(wǎng)站網(wǎng)頁(yè)。”

Grok 4的回應(yīng)

克勞德4的響應(yīng)

比較分析

Claude 4提供了一個(gè)全面的用戶界面，其中包含拋光元素，其中包括卡，PayPal和Apple Pay功能。它還支持動(dòng)畫(huà)和用戶界面的實(shí)時(shí)驗(yàn)證。 Claude 4模型的布局真實(shí)應(yīng)用，例如Stripe或Razorpay。

Grok 4也是移動(dòng)優(yōu)先的，但剝離得多。它僅支持具有一些基本驗(yàn)證功能的卡輸入。它具有非常簡(jiǎn)單，干凈且響應(yīng)迅速的布局。

結(jié)論：兩個(gè)用戶界面都有不同的用例，因?yàn)镃laude 4最適合豐富的演示和展示柜。 Grok 4最適合學(xué)習(xí)和構(gòu)建快速，交互式移動(dòng)應(yīng)用程序。

任務(wù)2：物理問(wèn)題

提示： “兩張質(zhì)量為m和4m的兩張薄圓盤(pán)，分別具有A和2a的半徑，由無(wú)質(zhì)量的，長(zhǎng)度的右桿固定在其中心。該組件放置在牢固而平坦的表面上，并在表面上滾動(dòng)，而不會(huì)滑倒，而無(wú)需在桿子上繞過(guò)鏡頭的軸向。圖）。

答：組件圍繞其質(zhì)量中心的角動(dòng)量的大小為17 ma2Ω / 2
B. L的Z組分的大小為55 ma2為
C.圍繞點(diǎn)O的組件質(zhì)量中心的角動(dòng)量的大小為81 ma2為
D.組件的質(zhì)量中心以ω/5的角速度圍繞z軸旋轉(zhuǎn)

Grok 4 vs Claude 4：哪個(gè)更好？

Grok 4的回應(yīng)

Grok 4考慮了兩個(gè)顏色m和4m圓盤(pán)的圓盤(pán)，由長(zhǎng)度√24a附著的4m。它找到了質(zhì)量的中心，傾斜的傾斜角度，并使用可靠的來(lái)源，Vedantu和Fiitjee驗(yàn)證JEE Advanced 2016的問(wèn)題。GrooveDriuce groove將正確的答案推論為A和D，使用邏輯上的扣除和有效的確認(rèn)，從現(xiàn)實(shí)世界上下文中的虛擬來(lái)源中獲得有效的確認(rèn)

Grok 4 vs Claude 4：哪個(gè)更好？

克勞德4的響應(yīng)

克勞德4通過(guò)逐步思考過(guò)程使用基于物理的分析指南。它發(fā)展了質(zhì)量的中心，提出了如何滾動(dòng)的方式，使用平行軸定理評(píng)估慣性的時(shí)刻，提供了更多的細(xì)節(jié)和解釋，比單獨(dú)的解決方案在一方面和理論上更適合教育目的。 Claude得出結(jié)論所有選項(xiàng)AD都是正確的，這是不正確的，因?yàn)镃laude透支了結(jié)論，然后在其響應(yīng)中得出準(zhǔn)確性。

Grok 4 vs Claude 4：哪個(gè)更好？

比較分析

判決：如果您正在尋求對(duì)迭代的準(zhǔn)確性和效率，那么Grok的推理和現(xiàn)實(shí)是否可以使用更好的邏輯，而不是希望僅參考文學(xué)支持的答案?？藙诘拢–laude）在概念清晰度方面提供了更好的理論，但最終的準(zhǔn)確性失敗了。

任務(wù)3：網(wǎng)絡(luò)中的關(guān)鍵連接

提示： “有n個(gè)服務(wù)器從0到n – 1編號(hào)，通過(guò)無(wú)向服務(wù)器到服務(wù)器連接形成一個(gè)網(wǎng)絡(luò)，其中連接[i] = [ai，bi]代表服務(wù)器AI和BI之間的連接。任何服務(wù)器都可以通過(guò)網(wǎng)絡(luò)直接或間接地到達(dá)其他服務(wù)器。

關(guān)鍵連接是一個(gè)連接，如果刪除，將使一些服務(wù)器無(wú)法到達(dá)其他服務(wù)器。

按任何順序返回網(wǎng)絡(luò)中的所有關(guān)鍵連接。

輸入：n = 4，連接= [[0,1]，[1,2]，[2,0]，[1,3]]

輸出：[[1,3]]

說(shuō)明：[[3,1]]也被接受。

示例2：輸入：n = 2，連接= [[0,1]]輸出：[[0,1]]”

Grok 4的回應(yīng)

＃包括<bits .h>
使用名稱空間性std;
類解決方案{
民眾：
   向量<vector> > crigity Connections（int n，向量<vector> >＆Connections）{
       向量<vector> > adj（n）;
       for（自動(dòng)和連接）{
           adj [conn [0]]。push_back（conn [1]）;
           adj [conn [1]]。push_back（conn [0]）;
       }
       向量<int> 光盤(pán)（n，-1），低（n，-1），父（n，-1）;
       向量<vector> >橋梁；
       int time = 0;
       功能<void> dfs = [＆]（int u）{
           光盤(pán)[u] = low [u] =時(shí)間;
           for（int v：adj [u]）{
               if（disc [v] == -1）{//未訪問(wèn)
                   父[v] = u;
                   dfs（v）;
                   低[u] = min（低[u]，low [v]）;
                   if（low [v]> disc [u]）{
                       bridges.push_back（{u，v}）;
                   }
               } else if（v！= parent [u]）{
                   低[u] = min（低[u]，disc [v]）;
               }
           }
       };
      
       for（int i = 0; i <n i if dfs><h4>克勞德4的響應(yīng)</h4>
<pre class="brush:php;toolbar:false">類解決方案{
民眾：
   向量<vector> > crigity Connections（int n，向量<vector> >＆Connections）{
       //建立鄰接列表
       向量<vector> >圖（n）;
       for（自動(dòng)和連接）{
           Graph [Conn [0]]。push_back（conn [1]）;
           Graph [Conn [1]]。push_back（conn [0]）;
       }
       //初始化Tarjan算法的陣列
       向量<int> 發(fā)現(xiàn)（n，-1）; //發(fā)現(xiàn)時(shí)間
       向量<int> 低（n，-1）; //低鏈接值
       向量<int> 父（n，-1）; // DFS樹(shù)中的父母
       向量<vector> >橋梁； //商店橋梁
       int time = 0; //全球時(shí)間計(jì)數(shù)器
       //為所有未訪問(wèn)的節(jié)點(diǎn)運(yùn)行DFS
       for（int i = 0; i <n i if dfs void u> >＆Graph，向量<int>＆發(fā)現(xiàn)，
            向量<int>＆Low，矢量<int>＆父母，矢量<vector> >＆橋接，int＆time）{
       //將訪問(wèn)的電流節(jié)點(diǎn)標(biāo)記
       發(fā)現(xiàn)[u] = low [u] =時(shí)間;
       //探索所有相鄰的頂點(diǎn)
       for（int v：graph [u]）{
           if（discovery [v] == -1）{//如果未訪問(wèn)v
               父[v] = u;
               DFS（V，Graph，Discovery，Low，Parts，Bridges，Time）;
               //更新低鏈接值
               低[u] = min（低[u]，low [v]）;
               //檢查邊緣紫外線是否是橋梁
               if（low [v]> discover [u]）{
                   bridges.push_back（{u，v}）;
               }
           }
           否則if（v！= parent [u]）{// back edge（不是父）
               低[u] = min（低[u]，發(fā)現(xiàn)[v]）;
           }}}}};
int main（）{
   溶液溶液；


   int n = 5;
   向量<vector> >連接= {
       {0，1}，{1，2}，{2，0}，{1，3}，{3，4}
   };


   向量<vector> >結(jié)果= sol.CriticalConnections（n，Connections）;


   cout <h3>比較分析</h3>
<p>Grok 4和Claude 4在C中實(shí)現(xiàn)Tarjan Trunk-Query算法，但以不同的方式實(shí)現(xiàn)。 Claude 4使用了標(biāo)準(zhǔn)面向?qū)ο蟮姆椒āＫ鼘FS邏輯進(jìn)一步分為第二個(gè)輔助方法，該方法有助于模塊化，并最終使其更容易遵循。這種樣式非常適合教學(xué)目的，或者在調(diào)試或?qū)⒔鉀Q方案擴(kuò)展到其他圖形問(wèn)題時(shí)。</p>
<p> Grok 4在主要方法內(nèi)使用了lambda函數(shù)進(jìn)行探索。這是最簡(jiǎn)潔和現(xiàn)代的風(fēng)格。它特別適合競(jìng)爭(zhēng)編程或小型工具。它可以保持邏輯范圍的范圍并最大程度地降低全局副作用，但是閱讀可能會(huì)更難閱讀，尤其是對(duì)于那些新手編程的人來(lái)說(shuō)。</p>
<p><strong>最終判決：</strong>當(dāng)您嘗試編寫(xiě)可讀和可維護(hù)的代碼時(shí)，您可以依靠Claude 4。另一方面，您可以依靠Grok 4在優(yōu)先級(jí)更快且代碼較短時(shí)依靠Grok 4。</p>
<h2>總體分析</h2>
<p>Grok 4專注于所有三個(gè)任務(wù)中的準(zhǔn)確性，速度和功能。無(wú)論是通過(guò)成功解決問(wèn)題，它還高度精通現(xiàn)實(shí)世界的適用性。至于克勞德4，其優(yōu)勢(shì)依賴于理論的深度，封閉和結(jié)構(gòu)，使其更適合于教育或可維護(hù)的設(shè)計(jì)。也就是說(shuō)，克勞德有時(shí)會(huì)在分析中過(guò)度角度，這也會(huì)影響準(zhǔn)確性水平。</p>
<table>
<thead><tr>
<td><strong>方面</strong></td>
<td><strong>Grok 4</strong></td>
<td><strong>克勞德4</strong></td>
</tr></thead>
<tbody>
<tr>
<td> <strong>UI設(shè)計(jì)</strong>
</td>
<td>干凈，移動(dòng)優(yōu)先，最小；學(xué)習(xí)和MVP的理想</td>
<td>豐富，動(dòng)畫(huà)，多選ui；非常適合演示和拋光</td>
</tr>
<tr>
<td><strong>物理問(wèn)題</strong></td>
<td>準(zhǔn)確，邏輯，源驗(yàn)證；正確答案A＆D</td>
<td>從概念上強(qiáng)但是不正確（所有A標(biāo)記）</td>
</tr>
<tr>
<td><strong>圖算法</strong></td>
<td>簡(jiǎn)潔的基于lambda的代碼；最適合快速編碼方案</td>
<td>模塊化，可讀的代碼；更適合教育/調(diào)試</td>
</tr>
<tr>
<td><strong>準(zhǔn)確性</strong></td>
<td>高的</td>
<td>中等（由于過(guò)度籠統(tǒng)）</td>
</tr>
<tr>
<td><strong>代碼清晰度</strong></td>
<td>中等效率但密集</td>
<td>高度易于閱讀和擴(kuò)展</td>
</tr>
<tr>
<td><strong>現(xiàn)實(shí)世界的使用</strong></td>
<td>優(yōu)秀（CP，快速工具，準(zhǔn)確的答案）</td>
<td>好（但較慢，容易過(guò)度分析）</td>
</tr>
<tr>
<td><strong>最好的</strong></td>
<td>速度，準(zhǔn)確性，緊湊的邏輯</td>
<td>教育，可讀性和可擴(kuò)展性</td>
</tr>
</tbody>
</table>
<h2>Grok 4 vs Claude 4：基準(zhǔn)比較</h2>
<p>在本節(jié)中，我們將在一些可用的公共基準(zhǔn)上對(duì)比4和克勞德4。下表說(shuō)明了它們的差異和一些重要的性能指標(biāo)。包括推理，編碼，延遲和上下文窗口大小。這使我們能夠衡量哪些模型在特定任務(wù)（例如技術(shù)問(wèn)題解決，軟件開(kāi)發(fā)和實(shí)時(shí)互動(dòng)）等特定任務(wù)中表現(xiàn)出色。</p>
<table>
<thead><tr>
<td><strong>公制/功能</strong></td>
<td><strong>Grok 4（xai）</strong></td>
<td><strong>克勞德4（十四行詩(shī)4和作品4）</strong></td>
</tr></thead>
<tbody>
<tr>
<td><strong>發(fā)布</strong></td>
<td>2025年7月</td>
<td>2025年5月（十四行詩(shī)4＆Opus 4）</td>
</tr>
<tr>
<td> <strong>I/O模式</strong>
</td>
<td>文本，代碼，語(yǔ)音，圖像</td>
<td>文本，代碼，圖像（視覺(jué)）；沒(méi)有內(nèi)置的聲音</td>
</tr>
<tr>
<td><strong>HLE（人類的最后考試）</strong></td>
<td>
<em>使用工具：</em> 50.7％（新記錄）<em>無(wú)工具：</em> 26.9％</td>
<td>
<em>無(wú)工具：</em>約15–22％（GPT-4的典型范圍，Gemini，Claude Opus報(bào)道） <em>：（</em>未報(bào)道）</td>
</tr>
<tr>
<td> <strong>mmlu</strong>
</td>
<td> 86.6％</td>
<td>十四行詩(shī)：83.7％；作品：86.0％</td>
</tr>
<tr>
<td> <strong>SWE基礎(chǔ)（編碼）</strong>
</td>
<td> 72–75％（通過(guò)@1）</td>
<td>十四行詩(shī)：72.7％；作品：72.5％</td>
</tr>
<tr>
<td><strong>其他學(xué)者</strong></td>
<td>Aime（數(shù)學(xué)）：100％； GPQA（物理）：87％</td>
<td>可比較的基準(zhǔn)未公開(kāi)發(fā)布； Claude 4專注于編碼/代理任務(wù)</td>
</tr>
<tr>
<td><strong>潛伏期和速度</strong></td>
<td>75.3 tok/s; ?5.7 s到先令牌</td>
<td>十四行詩(shī)：85.3 tok/s，1.68 s ttft; opus：64.9 tok/s，2.58 s ttft</td>
</tr>
<tr>
<td><strong>定價(jià)</strong></td>
<td>$ 30/mo（標(biāo)準(zhǔn)）; $ 300/mo（重）</td>
<td>十四行詩(shī)：每100萬(wàn)代幣（輸入/輸出）$ 3/$ 15（可用于十四行詩(shī)4）；作品：每100萬(wàn)美元$ 15/$ 75</td>
</tr>
<tr>
<td> <strong>API和平臺(tái)</strong>
</td>
<td>xai api可通過(guò)x.com/grok應(yīng)用訪問(wèn)</td>
<td>人類API；同樣在AWS Bedrock和Google Vertex AI上</td>
</tr>
</tbody>
</table>
<h2>結(jié)論</h2>
<p>將Grok 4與Claude 4進(jìn)行比較時(shí)，我看到了兩個(gè)為不同值構(gòu)建的模型。 Grok 4是快速，精確的，并且與現(xiàn)實(shí)世界中的用例保持一致。因此，非常適合技術(shù)編程，快速原型制作以及解決問(wèn)題的正確性和速度。它總是在UI設(shè)計(jì)，工程問(wèn)題以及基于功能編程的算法等領(lǐng)域提供清晰，簡(jiǎn)潔且高效的響應(yīng)。</p>
<p>相比之下，克勞德4提供了清晰，結(jié)構(gòu)和深度的強(qiáng)度。它以教育為中心和設(shè)計(jì)的可讀性編碼樣式使其更適合可維護(hù)的項(xiàng)目。幫助傳授概念理解，以及教學(xué)和調(diào)試目的。但是，我看到克勞德有時(shí)可能在分析中走得太遠(yuǎn)，影響了對(duì)問(wèn)題的回答的質(zhì)量。</p>
<p>因此，如果您的優(yōu)先級(jí)是原始性能和現(xiàn)實(shí)世界應(yīng)用，則Grok 4是更好的選擇。如果您的優(yōu)先級(jí)是干凈的體系結(jié)構(gòu)，概念清晰度和/或教學(xué)，那么Claude 4是您最好的選擇。</p>
<h2>常見(jiàn)問(wèn)題</h2>
<strong>Q1?？傮w而言，哪種型號(hào)更準(zhǔn)確？</strong><p> A. Grok 4在執(zhí)行的任務(wù)中具有更好的最終答案，尤其是在技術(shù)解決方案或現(xiàn)實(shí)世界中的物理問(wèn)題中。</p> <strong>Q2。哪個(gè)對(duì)UI或前端編碼更好？</strong><p> A. Claude 4提供了動(dòng)畫(huà)和多種方法的更豐富，拋光的UI輸出。 Grok 4更適合移動(dòng)優(yōu)先和快速原型。</p> <strong>Q3。誰(shuí)應(yīng)該使用Grok 4？</strong><p>答：在競(jìng)爭(zhēng)性編程，數(shù)學(xué)或快速實(shí)用工具等任務(wù)中，開(kāi)發(fā)人員，研究人員或?qū)W生對(duì)速度，簡(jiǎn)潔和正確性有興趣或需求。</p> <strong>Q4。哪種模型在編碼基準(zhǔn)測(cè)試方面表現(xiàn)更好？</strong><p>答：兩種模型在SWE基礎(chǔ)上（?72-75％）的表現(xiàn)類似，并且Grok 4在某些推理基準(zhǔn)上（略微）向前拉（略微），并且在任務(wù)完成范圍內(nèi)的一致性，除了繪圖框。</p> <strong>Q5。兩種模型都可以通過(guò)API使用嗎？</strong><p>答：是的，Grok 4可通過(guò)XAI的API和Grok應(yīng)用程序獲得。 Claude 4可通過(guò)擬人化的API獲得。</p></vector></vector></vector></int></int></int></n></vector></int></int></int></vector></vector></vector>

以上是Grok 4 vs Claude 4：哪個(gè)更好？的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章！

本站聲明

本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn)，版權(quán)歸原作者所有，本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容，請(qǐng)聯(lián)系admin@php.cn