亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
AI策略類型 - 雙子座變冷,Openai保持溫暖
AI策略不是記憶,這是判斷
每個(gè)模型都以不同的方式做出決定
我認(rèn)為因此我是AI - 機(jī)器心理學(xué)的誕生
首頁 科技週邊 人工智慧 這些AI模型沒有學(xué)習(xí)語言,他們學(xué)習(xí)了策略

這些AI模型沒有學(xué)習(xí)語言,他們學(xué)習(xí)了策略

Jul 09, 2025 am 11:16 AM

這些AI模型沒有學(xué)習(xí)語言,他們學(xué)習(xí)了策略

倫敦國王學(xué)院和牛津大學(xué)的研究人員的新研究分享了Openai,Google和Anthropic在基於迭代囚犯的困境的一場cutthroat競爭中所發(fā)生的結(jié)果。這不是聊天機(jī)器人的瑣事。這是決心互相超越的戰(zhàn)略代理人之間的合作,復(fù)仇和生存。

測試很簡單。將AI模型放在幾個(gè)囚犯的困境游戲中,以應(yīng)對(duì)諸如Tit-for-Tat , Grim Trigger和Winstay-lose-Shift等舊策略。引入噪音,隨機(jī)性和遊戲長度可變性,以確保任何簡單的勝利都不會(huì)記住。然後看誰蓬勃發(fā)展。最重要的是,如何。

AI策略類型 - 雙子座變冷,Openai保持溫暖

結(jié)果令人不安。 Google的雙子座表現(xiàn)出殘酷的狡猾。它在幫助時(shí)合作。它在沒有時(shí)叛逃。它很快學(xué)到了。 Openai的模型仍在嘗試結(jié)交朋友,即使這些朋友在數(shù)字背上刺傷了他們。雙子座受到懲罰。 Openai原諒??藙诘拢–laude)來自眾人,原諒他們倆。

這些AI模型不僅在玩遊戲。他們合理化了自己的舉動(dòng)。這項(xiàng)研究湧入了近32,000個(gè)散文合理化。一些人透露了對(duì)他們的對(duì)手以及遊戲可能持久的可能性的思考。有些犯了錯(cuò)誤。有些適應(yīng)。雙子座最重要的是根據(jù)預(yù)期遊戲的時(shí)間來改變策略。那不僅僅是模仿。那是戰(zhàn)略性的。

倫敦國王學(xué)院戰(zhàn)略教授,研究的作者肯·佩恩(Ken Payne)說,研究人員試圖將模型行為與培訓(xùn)數(shù)據(jù)區(qū)分開。 “我們正在尋找一個(gè)環(huán)境,??我們可以探索模型是否具有類似人類的能力,”他在電子郵件交流中寫道。 “最令人驚訝的事情之一就是它們之間的差異。並非所有LLM都認(rèn)為。”

AI策略不是記憶,這是判斷

雙子座的戰(zhàn)略簽名是革命性的。它向後推。它大寫。它適應(yīng)了。 Openai的模型?更幼稚。更可預(yù)測。即使遊戲的世界確實(shí)需要LLM才能缺陷,Openai也發(fā)現(xiàn)自己想合作。佩恩(Payne)將其描述為提醒這些是“新穎的外星人智慧”。

要點(diǎn):語言模型正在使用策略。有些與人類思維一致。其他人不是。佩恩說:“我們需要克服這些事情不聰明的想法?!?“越來越多的證據(jù)表明這裡有更多的工作?!?/p>

這包括能夠反映對(duì)手思想的能力。當(dāng)LLM預(yù)測反對(duì)者的行為時(shí),他們會(huì)改編自己的行為。佩恩寫道,這讓人聯(lián)想到羅伯特·特弗斯(Robert Trivers)的互惠利他主義理論??紤]在政治中的生物學(xué)或聲譽(yù)投資回報(bào)遊戲中的tit tat。

克勞德(Claude)傾向於寬恕。背叛後很快回到合作。在更長的遊戲中,該方法獲得了回報(bào)。雙子座的Machiavellian Streak在短暫的,動(dòng)蕩的環(huán)境中效果最好,信任很快就會(huì)破裂。相比之下,Openai充滿希望的樂觀情緒使它在敵對(duì)的環(huán)境中被消滅了。

每個(gè)模型都以不同的方式做出決定

為什麼要這麼重要?因?yàn)閬K非所有模型都是中性工具。每個(gè)模型都有個(gè)性。決策風(fēng)格。世界觀。正如佩恩所說:“語言是其自己的世界模式?!边@些模型吸收了我們的啟發(fā)式方法,我們的心理捷徑並反映了它們。但是有時(shí)不能以可預(yù)測的方式。

其中一些可能是設(shè)計(jì)。佩恩(Payne)懷疑Openai的合作偏見可能源於微調(diào),儘管沒有內(nèi)部訪問權(quán)力,他無法確定。無論如何,用戶和開發(fā)人員需要了解的行為。但目前不大。在敵對(duì)的談判環(huán)境中過度合作的模型無濟(jì)於事。利用對(duì)敏感領(lǐng)域的信任的模型可能很危險(xiǎn)。

我認(rèn)為因此我是AI - 機(jī)器心理學(xué)的誕生

這就是行為測試的來源。佩恩稱這種研究的早期階段為“機(jī)器心理學(xué)”。他認(rèn)為,在測試邊緣AI時(shí),必須與業(yè)務(wù)相同。不僅是乾淨(jìng),受控的實(shí)驗(yàn)室設(shè)置。他想看看模型在不干淨(jìng)的條件下如何在部分?jǐn)?shù)據(jù)下進(jìn)行壓力。

未來的工作已經(jīng)在進(jìn)行中。佩恩暗示了升級(jí)動(dòng)力學(xué)和混合人機(jī)策略的實(shí)驗(yàn)。其中一位作者正在調(diào)查人類和模型一起做出決定時(shí)會(huì)發(fā)生什麼。

佩恩認(rèn)為這不是新興的魔術(shù)。他認(rèn)為它是嵌入的。推理是用語言的,這些模型已經(jīng)消耗了很多。當(dāng)他們進(jìn)行戰(zhàn)略性行動(dòng)時(shí),它們的行為就像我們一樣,依靠腳本,心理啟發(fā)式方法和武器規(guī)則融入文本中。

有時(shí)看起來很熟悉。有時(shí)看起來很陌生。這個(gè)中間空間是現(xiàn)在最大的問題。

Forbes5 Chatgpt Hacks,以幫助MBA的Tor Constantino到勞動(dòng)節(jié)到勞動(dòng)節(jié)減掉15磅

以上是這些AI模型沒有學(xué)習(xí)語言,他們學(xué)習(xí)了策略的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)程式碼編輯軟體(SublimeText3)

熱門話題

Laravel 教程
1597
29
PHP教程
1488
72
Kimi K2:最強(qiáng)大的開源代理模型 Kimi K2:最強(qiáng)大的開源代理模型 Jul 12, 2025 am 09:16 AM

還記得今年早些時(shí)候破壞了Genai行業(yè)的大量開源中國模型嗎?儘管DeepSeek佔(zhàn)據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

Grok 4 vs Claude 4:哪個(gè)更好? Grok 4 vs Claude 4:哪個(gè)更好? Jul 12, 2025 am 09:37 AM

到2025年中期,AI“軍備競賽”正在加熱,XAI和Anthropic都發(fā)布了他們的旗艦車型Grok 4和Claude 4。這兩種模型處於設(shè)計(jì)理念和部署平臺(tái)的相反端,但他們卻在

今天已經(jīng)在我們中間走了10個(gè)驚人的人形機(jī)器人 今天已經(jīng)在我們中間走了10個(gè)驚人的人形機(jī)器人 Jul 16, 2025 am 11:12 AM

但是我們可能甚至不必等10年就可以看到一個(gè)。實(shí)際上,可以被認(rèn)為是真正有用的,類人類機(jī)器的第一波。 近年來,有許多原型和生產(chǎn)模型從T中走出來

上下文工程是' new'及時(shí)的工程 上下文工程是' new'及時(shí)的工程 Jul 12, 2025 am 09:33 AM

直到上一年,迅速的工程被認(rèn)為是與大語言模型(LLM)互動(dòng)的關(guān)鍵技能。然而,最近,LLM在推理和理解能力方面已經(jīng)顯著提高。自然,我們的期望

建立Langchain健身教練:您的AI私人教練 建立Langchain健身教練:您的AI私人教練 Jul 05, 2025 am 09:06 AM

許多人充滿熱情地打入健身房,並相信自己正在正確實(shí)現(xiàn)自己的健身目標(biāo)。但是由於飲食計(jì)劃差和缺乏方向,結(jié)果不存在。僱用私人教練AL

6個(gè)任務(wù)Manus AI可以在幾分鐘內(nèi)完成 6個(gè)任務(wù)Manus AI可以在幾分鐘內(nèi)完成 Jul 06, 2025 am 09:29 AM

我相信您必須了解通用的AI代理Manus。它是幾個(gè)月前推出的,在過去的幾個(gè)月中,他們?yōu)橄到y(tǒng)添加了幾個(gè)新功能?,F(xiàn)在,您可以生成視頻,創(chuàng)建網(wǎng)站並做很多MO

Leia的浸入式移動(dòng)應(yīng)用將3D深度帶入日常照片 Leia的浸入式移動(dòng)應(yīng)用將3D深度帶入日常照片 Jul 09, 2025 am 11:17 AM

基於Leia專有的神經(jīng)深度引擎,應(yīng)用程序流程靜止圖像,並添加了自然深度以及模擬運(yùn)動(dòng)(例如Pans,Zooms和Alallax Effects),以創(chuàng)建簡短的視頻捲軸,從而給人以踏入SCE的印象

7種AI代理的7種類型是什麼? 7種AI代理的7種類型是什麼? Jul 11, 2025 am 11:08 AM

想像一些複雜的東西,例如AI引擎準(zhǔn)備提供有關(guān)米蘭新服裝系列的詳細(xì)反饋,或者自動(dòng)市場分析用於全球運(yùn)營的企業(yè),或者智能係統(tǒng)管理大型車隊(duì)。

See all articles