亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
#△實(shí)測ChatGPT(GPT-3.5)
△實(shí)測Bard
#△實(shí)測文心一言
關(guān)鍵在於token
△實(shí)測GPT-4
甚至有了token文學(xué)
首頁 科技週邊 人工智慧 吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

Jun 03, 2023 pm 09:27 PM
ai token

沒想到時(shí)至今日,ChatGPT竟然會犯下低階錯(cuò)誤?

吳恩達(dá)大神最新開課就指出來了:

ChatGPT不會反轉(zhuǎn)單字!

例如讓它反轉(zhuǎn)下lollipop這個(gè)詞,輸出是pilollol,完全混亂。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

哦豁,這確實(shí)有點(diǎn)大跌眼鏡。

以至於聽課網(wǎng)友在Reddit上發(fā)文後,立刻引來大量圍觀,貼文熱度火速衝到6k。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

而且這不是偶然bug,網(wǎng)友們發(fā)現(xiàn)ChatGPT確實(shí)無法完成這個(gè)任務(wù),我們親測結(jié)果也是如此。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

#△實(shí)測ChatGPT(GPT-3.5)

#甚至包括Bard、Bing、文心一言在內(nèi)等一眾產(chǎn)品都不行。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

△實(shí)測Bard

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

#△實(shí)測文心一言

還有人緊跟著吐槽, ChatGPT在處理這些簡單的單字任務(wù)就是很糟糕。

例如玩先前曾經(jīng)爆火的文字遊戲Wordle簡直就是一場災(zāi)難,從來沒有做對過。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

誒?這到底是為啥?

關(guān)鍵在於token

之所以有這樣的現(xiàn)象,關(guān)鍵在於token。大型模型通常使用token來處理文本,因?yàn)閠oken是文本中最常見的字元序列。

它可以是整個(gè)單字,也可以是單字一個(gè)片段。大型模型熟悉這些 Token 之間的統(tǒng)計(jì)關(guān)係,並能夠熟練地產(chǎn)生下一個(gè) Token。

因此在處理單字反轉(zhuǎn)這個(gè)小任務(wù)時(shí),它可能只是將每個(gè)token翻轉(zhuǎn)過來,而不是字母。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

這點(diǎn)放在中文語境下體現(xiàn)就更為明顯:一個(gè)字是一個(gè)token,也可能是一個(gè)字是一個(gè)token。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

針對開頭的例子,有人嘗試了解下ChatGPT的推理過程。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

為了更直覺的了解,OpenAI甚至還出了個(gè)GPT-3的Tokenizer。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

例如像lollipop這個(gè)詞,GPT-3會將其理解成I、oll、ipop這三個(gè)部分。

根據(jù)經(jīng)驗(yàn)總結(jié),也就誕生出這樣一些不成文法。

  • 1個(gè)token≈4個(gè)英文字元≈四分之三個(gè)字;
  • 100個(gè)token≈75個(gè)單字;
  • 1-2句話≈30個(gè)token;
  • 一段話≈100個(gè)token,1500個(gè)單字≈2048個(gè)token;
##單字如何分割還取決於語言。先前有人統(tǒng)計(jì)過,中文要用的token數(shù)是英文數(shù)量的1.2到2.7倍。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界


token-to-char(token到單字)比例越高,處理成本也越高。因此處理中文tokenize要比英文更貴。

可以這樣理解,token是大模型認(rèn)識理解人類現(xiàn)實(shí)世界的方式。它非常簡單,還能大幅降低記憶體和時(shí)間複雜度。

但將單字token化有一個(gè)問題,就會使模型很難學(xué)習(xí)到有意義的輸入表示,最直觀的表示就是不能理解單字的意思。

當(dāng)時(shí)Transformers有做過相應(yīng)優(yōu)化,例如一個(gè)複雜、不常見的單字分成一個(gè)有意義的token和一個(gè)獨(dú)立token。

就如同 "annoyingly" 被分成 "annoying" 和 "ly" 兩個(gè)部分一樣,前一個(gè)保留了其本身的意義,而後一個(gè)則更加常見。

這也成就瞭如今ChatGPT及其他大模型產(chǎn)品的驚艷效果,能很好地理解人類的語言。

至於無法處理單字反轉(zhuǎn)這樣一個(gè)小任務(wù),自然也有解決之道。

最簡單直接的,就是你先自己把單字分開嘍~

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

#或者也可以讓ChatGPT一步一步來,先tokenize每個(gè)字母。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

又或讓它寫一個(gè)反轉(zhuǎn)字母的程序,然後程式的結(jié)果對了。 (狗頭)

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

不過也可以使用GPT-4,實(shí)測沒有這樣的問題。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

△實(shí)測GPT-4

總之,token就是AI理解自然語言的基石。

而作為AI理解人類自然語言的橋樑,token的重要性也越來越明顯。

它已經(jīng)成為AI模型表現(xiàn)優(yōu)劣的關(guān)鍵決定因素,還是大模型的計(jì)費(fèi)標(biāo)準(zhǔn)。

甚至有了token文學(xué)

如前文所言,token能方便模型捕捉到更細(xì)緻的語意訊息,如詞義、詞序、語法結(jié)構(gòu)等。在序列建模任務(wù)(如語言建模、機(jī)器翻譯、文字生成等)中,位置和順序?qū)赌P偷慕⒎浅V匾?

模型只有在準(zhǔn)確了解每個(gè)token在序列中的位置和上下文情況,才能更好正確預(yù)測內(nèi)容,給出合理輸出。

因此,token的品質(zhì)、數(shù)量對模型效果有直接影響。

今年開始,越來越多大模型發(fā)佈時(shí),都會著重強(qiáng)調(diào)token數(shù)量,例如GooglePaLM 2曝光細(xì)節(jié)中提到,它訓(xùn)練用到了3.6萬億個(gè)token。

以及許多業(yè)界大佬也紛紛表示,token真的很關(guān)鍵!

今年從特斯拉跳槽到OpenAI的AI科學(xué)家安德烈·卡帕斯(Andrej Karpathy)就曾在演講中表示:

更多token能讓模型更好思考。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

而且他強(qiáng)調(diào),模型的效能並不只由參數(shù)規(guī)模來決定。

例如LLaMA的參數(shù)規(guī)模遠(yuǎn)小於GPT-3(65B vs 175B),但由於它用更多token進(jìn)行訓(xùn)練(1.4T vs 300B),所以LLaMA更強(qiáng)大。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

而憑藉著對模型表現(xiàn)的直接影響,token還是AI模型的計(jì)費(fèi)標(biāo)準(zhǔn)。

以O(shè)penAI的定價(jià)標(biāo)準(zhǔn)為例,他們以1K個(gè)token為單位進(jìn)行計(jì)費(fèi),不同模型、不同類型的token價(jià)格不同。

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

總之,踏進(jìn)AI大模型領(lǐng)域的大門後,就會發(fā)現(xiàn)token是繞不開的知識點(diǎn)。

嗯,甚至衍生出了token文學(xué)……

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

不過值得一提的是,token在中文世界裡到底該翻譯成啥,現(xiàn)在還沒有完全定下來。

直譯「令牌」總是有點(diǎn)怪怪的。

GPT-4覺得叫「詞元」或「標(biāo)記」比較好,你覺得呢?

吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界

參考連結(jié):
[1]https://www.reddit.com/r/ChatGPT/comments/13xxehx/chatgpt_is_unable_to_reverse_words/
[2]https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them
[3]https://openai.com /pricing

以上是吳恩達(dá)ChatGPT課爆火:AI放棄了倒寫單詞,但理解了整個(gè)世界的詳細(xì)內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
PHP調(diào)用AI智能語音助手 PHP語音交互系統(tǒng)搭建 PHP調(diào)用AI智能語音助手 PHP語音交互系統(tǒng)搭建 Jul 25, 2025 pm 08:45 PM

用戶語音輸入通過前端JavaScript的MediaRecorderAPI捕獲並發(fā)送至PHP後端;2.PHP將音頻保存為臨時(shí)文件後調(diào)用STTAPI(如Google或百度語音識別)轉(zhuǎn)換為文本;3.PHP將文本發(fā)送至AI服務(wù)(如OpenAIGPT)獲取智能回復(fù);4.PHP再調(diào)用TTSAPI(如百度或Google語音合成)將回復(fù)轉(zhuǎn)為語音文件;5.PHP將語音文件流式返回前端播放,完成交互。整個(gè)流程由PHP主導(dǎo)數(shù)據(jù)流轉(zhuǎn)與錯(cuò)誤處理,確保各環(huán)節(jié)無縫銜接。

如何用PHP搭建社交分享功能 PHP分享接口集成實(shí)戰(zhàn) 如何用PHP搭建社交分享功能 PHP分享接口集成實(shí)戰(zhàn) Jul 25, 2025 pm 08:51 PM

在PHP中搭建社交分享功能的核心方法是通過動(dòng)態(tài)生成符合各平臺要求的分享鏈接。 1.首先獲取當(dāng)前頁面或指定的URL及文章信息;2.使用urlencode對參數(shù)進(jìn)行編碼;3.根據(jù)各平臺協(xié)議拼接生成分享鏈接;4.在前端展示鏈接供用戶點(diǎn)擊分享;5.動(dòng)態(tài)生成頁面OG標(biāo)籤優(yōu)化分享內(nèi)容展示;6.務(wù)必對用戶輸入進(jìn)行轉(zhuǎn)義以防止XSS攻擊。該方法無需複雜認(rèn)證,維護(hù)成本低,適用於大多數(shù)內(nèi)容分享需求。

如何用PHP結(jié)合AI實(shí)現(xiàn)文本糾錯(cuò) PHP語法檢測與優(yōu)化 如何用PHP結(jié)合AI實(shí)現(xiàn)文本糾錯(cuò) PHP語法檢測與優(yōu)化 Jul 25, 2025 pm 08:57 PM

要實(shí)現(xiàn)PHP結(jié)合AI進(jìn)行文本糾錯(cuò)與語法優(yōu)化,需按以下步驟操作:1.選擇適合的AI模型或API,如百度、騰訊API或開源NLP庫;2.通過PHP的curl或Guzzle調(diào)用API並處理返回結(jié)果;3.在應(yīng)用中展示糾錯(cuò)信息並允許用戶選擇是否採納;4.使用php-l和PHP_CodeSniffer進(jìn)行語法檢測與代碼優(yōu)化;5.持續(xù)收集反饋並更新模型或規(guī)則以提升效果。選擇AIAPI時(shí)應(yīng)重點(diǎn)評估準(zhǔn)確率、響應(yīng)速度、價(jià)格及對PHP的支持。代碼優(yōu)化應(yīng)遵循PSR規(guī)範(fàn)、合理使用緩存、避免循環(huán)查詢、定期審查代碼,並藉助X

PHP實(shí)現(xiàn)商品庫存管理變現(xiàn) PHP庫存同步與報(bào)警機(jī)制 PHP實(shí)現(xiàn)商品庫存管理變現(xiàn) PHP庫存同步與報(bào)警機(jī)制 Jul 25, 2025 pm 08:30 PM

PHP通過數(shù)據(jù)庫事務(wù)與FORUPDATE行鎖確保庫存扣減原子性,防止高並發(fā)超賣;2.多平臺庫存一致性需依賴中心化管理與事件驅(qū)動(dòng)同步,結(jié)合API/Webhook通知及消息隊(duì)列保障數(shù)據(jù)可靠傳遞;3.報(bào)警機(jī)制應(yīng)分場景設(shè)置低庫存、零/負(fù)庫存、滯銷、補(bǔ)貨週期和異常波動(dòng)策略,並按緊急程度選擇釘釘、短信或郵件通知責(zé)任人,且報(bào)警信息需完整明確,以實(shí)現(xiàn)業(yè)務(wù)適配與快速響應(yīng)。

如何用PHP調(diào)用AI寫作輔助工具 PHP提升內(nèi)容產(chǎn)出效率 如何用PHP調(diào)用AI寫作輔助工具 PHP提升內(nèi)容產(chǎn)出效率 Jul 25, 2025 pm 08:18 PM

選擇AI寫作API需考察穩(wěn)定性、價(jià)格、功能匹配度及是否有免費(fèi)試用;2.PHP用Guzzle發(fā)送POST請求並用json_decode處理返回的JSON數(shù)據(jù),注意捕獲異常和錯(cuò)誤碼;3.將AI內(nèi)容融入項(xiàng)目需建立審核機(jī)制並支持個(gè)性化定制;4.優(yōu)化性能可採用緩存、異步隊(duì)列和限流技術(shù),避免高並發(fā)下瓶頸。

全球最權(quán)威的加密貨幣行情網(wǎng)站Top10(2025最新版) 全球最權(quán)威的加密貨幣行情網(wǎng)站Top10(2025最新版) Jul 29, 2025 pm 12:48 PM

2025年十大權(quán)威加密貨幣行情與數(shù)據(jù)分析平臺為:1. CoinMarketCap,提供全面的市值排名和基礎(chǔ)市場數(shù)據(jù);2. CoinGecko,以獨(dú)立性和信任分?jǐn)?shù)提供多維度項(xiàng)目評估;3. TradingView,擁有最專業(yè)的K線圖表和技術(shù)分析工具;4. 幣安行情,作為最大交易所提供最直接的實(shí)時(shí)數(shù)據(jù);5. 歐易行情,突出衍生品關(guān)鍵指標(biāo)如持倉量和資金費(fèi)率;6. Glassnode,專注於鏈上數(shù)據(jù)如活躍地址和巨鯨動(dòng)向;7. Messari,提供機(jī)構(gòu)級研究報(bào)告和嚴(yán)格標(biāo)準(zhǔn)化數(shù)據(jù);8. CryptoCompa

Twilio通話保持與恢復(fù):會議模式與獨(dú)立呼叫腿處理 Twilio通話保持與恢復(fù):會議模式與獨(dú)立呼叫腿處理 Jul 25, 2025 pm 08:42 PM

本文詳細(xì)闡述了在Twilio中實(shí)現(xiàn)通話保持(hold)與恢復(fù)(unhold)的兩種主要方法。首選方案是利用Twilio的會議(Conference)功能,通過更新會議參與者資源輕鬆實(shí)現(xiàn)通話保持和恢復(fù),並可自定義保持音樂。另一種方法是處理獨(dú)立的呼叫腿(calllegs),這需要更複雜的TwiML邏輯,通過、和到來管理,但相比會議模式更為繁瑣。文章提供了具體的代碼示例和操作步驟,旨在幫助開發(fā)者高效實(shí)現(xiàn)Twilio通話控制。

以太坊是什麼幣?以太坊ETH獲得的方式有哪些? 以太坊是什麼幣?以太坊ETH獲得的方式有哪些? Jul 31, 2025 pm 11:00 PM

以太坊是一個(gè)基於智能合約的去中心化應(yīng)用平臺,其原生代幣ETH可通過多種方式獲取。 1、通過Binance必安、歐意ok等中心化平臺註冊賬戶、完成KYC認(rèn)證並用穩(wěn)定幣購買ETH;2、通過去中心化平臺連接數(shù)字儲存,使用穩(wěn)定幣或其他代幣直接兌換ETH;3、參與網(wǎng)絡(luò)質(zhì)押,可選擇獨(dú)立質(zhì)押(需32個(gè)ETH)、流動(dòng)性質(zhì)押服務(wù)或在中心化平臺一鍵質(zhì)押以獲取獎(jiǎng)勵(lì);4、通過為Web3項(xiàng)目提供服務(wù)、完成任務(wù)或獲得空投等方式賺取ETH。建議初學(xué)者從主流中心化平臺入手,逐步過渡到去中心化方式,並始終重視資產(chǎn)安全與自主研究,以

See all articles