亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

目錄
介紹
概述
目錄
AI科學家的工作原則
生成論文的分析
1。雙尺度擴散:低維生成模型的自適應(yīng)特征平衡
2。styleFusion:在字符級語言模型中自適應(yīng)多種風格的生成
3。解鎖Grokking:變壓器模型中的權(quán)重初始化策略的比較研究
AI科學家的代碼實施
先決條件
現(xiàn)在我們可以準備數(shù)據(jù)
科學紙生成
紙質(zhì)評論
AI科學家的挑戰(zhàn)和缺點
你必須知道的泡沫
為我們的學習領(lǐng)域定制模板
未來的含義
結(jié)論
常見問題
首頁 科技周邊 人工智能 sakana ai' s' AI科學家”:下一個愛因斯坦還是工具?

sakana ai' s' AI科學家”:下一個愛因斯坦還是工具?

Apr 14, 2025 am 09:27 AM

介紹

在人工智能中,出現(xiàn)了一項開創(chuàng)性的發(fā)展,該發(fā)展有望重塑科學發(fā)現(xiàn)的過程。 Sakana AI與牛津大學和不列顛哥倫比亞大學的研究人員合作,與牛津大學的AI研究和研究人員合作,推出了“ AI科學家”,這是一個旨在全自動的科學發(fā)現(xiàn)的綜合系統(tǒng)。這種創(chuàng)新的方法利用了基礎(chǔ)模型,尤其是大型語言模型(LLM)的力量,以在各個領(lǐng)域進行獨立研究。

AI科學家在AI驅(qū)動的研究中代表了一個重大的飛躍。它可以使整個研究生命周期自動化,從產(chǎn)生新穎的思想和實施實驗到分析結(jié)果并產(chǎn)生科學手稿。該系統(tǒng)進行研究,包括自動同行審查過程,模仿人類科學界的迭代知識創(chuàng)建和驗證方法。

sakana ai' s' AI科學家”:下一個愛因斯坦還是工具?

概述

  1. Sakana AI介紹了“ AI科學家”,這是一個全自動的系統(tǒng),可以徹底改變科學發(fā)現(xiàn)。
  2. AI科學家可以自動化整個研究過程,從想法生成到紙質(zhì)寫作和同行評審。
  3. AI科學家使用先進的語言模型來生產(chǎn)具有近乎人類準確性和效率的研究論文。
  4. AI科學家面臨視覺元素的局限性,分析中的潛在錯誤以及科學完整性的道德問題。
  5. AI科學家在有希望的同時提出了有關(guān)人工智能安全,道德意義以及人類科學家在研究中不斷發(fā)展的作用的問題。
  6. 人工智能科學家的能力表現(xiàn)出巨大的潛力,但他們?nèi)匀恍枰祟惖谋O(jiān)督以確保準確性和道德標準。

目錄

  • AI科學家的工作原則
  • 生成論文的分析
  • AI科學家的代碼實施
    • 先決條件
    • 現(xiàn)在我們可以準備數(shù)據(jù)
    • 科學紙生成
    • 紙質(zhì)評論
  • AI科學家的挑戰(zhàn)和缺點
  • 你必須知道的泡沫
  • 為我們的學習領(lǐng)域定制模板
  • 未來的含義
  • 常見問題

AI科學家的工作原則

AI科學家通過復雜的管道進行操作,該管道整合了幾個關(guān)鍵過程。

工作流如下所示:

sakana ai' s' AI科學家”:下一個愛因斯坦還是工具?

現(xiàn)在,讓我們?yōu)g覽不同的步驟。

  1. 想法產(chǎn)生:系統(tǒng)首先基于提供的起始模板來集思廣益,集思廣益。該模板通常包括與感興趣區(qū)域相關(guān)的現(xiàn)有代碼以及帶有樣式文件和截面標題的乳膠文件夾。為了確保原創(chuàng)性,AI科學家可以搜索語義學者來驗證其思想的新穎性。
  2. 實驗迭代:一旦提出了一個想法,AI科學家就執(zhí)行提出的實驗,獲得結(jié)果并產(chǎn)生可視化。它精心記錄了每個情節(jié)和實驗結(jié)果,創(chuàng)造了紙質(zhì)寫作的全面記錄。
  3. 紙質(zhì)寫作:AI科學家使用收集的實驗數(shù)據(jù)和可視化的標準機器學習會議制作了簡潔而有用的科學論文。它自主使用語義學者引用了相關(guān)論文。
  4. 自動紙審查:AI科學家的LLM驅(qū)動審稿人是至關(guān)重要的組成部分。這位自動化審稿人以幾乎人類的準確性評估生成的論文,提供可用于改善當前項目或為未來研究方向提供信息的反饋。

生成論文的分析

AI-Scientist生成和審查有關(guān)擴散建模,語言建模和理解等領(lǐng)域的論文。讓我們檢查一下發(fā)現(xiàn)。

1。雙尺度擴散:低維生成模型的自適應(yīng)特征平衡

該論文引入了一種新型的自適應(yīng)雙尺度denoising方法,用于低維擴散模型。該方法通過雙分支結(jié)構(gòu)以及可學習的,時間到有條件的加權(quán)機制來平衡全球結(jié)構(gòu)和本地細節(jié)。這種方法表明了幾個2D數(shù)據(jù)集的樣本質(zhì)量的改進。

盡管該方法是創(chuàng)新的,并且得到了經(jīng)驗評估的支持,但它缺乏雙重規(guī)模架構(gòu)的徹底理論理由。它遭受了較高的計算成本,可能會限制其實際應(yīng)用。此外,沒有清楚地解釋某些部分,缺乏多樣化的,現(xiàn)實世界中的數(shù)據(jù)集和不足的消融研究限制了評估。

2。styleFusion:在字符級語言模型中自適應(yīng)多種風格的生成

本文介紹了多式適配器,該適配器通過將樣式嵌入,樣式分類頭和StyleadeDeadapter模塊集成到GPT中,從而提高了字符級語言模型的樣式意識和一致性。它實現(xiàn)了各種數(shù)據(jù)集的更好的風格一致性和競爭性驗證損失。

盡管創(chuàng)新且經(jīng)過良好的測試,但該模型在某些數(shù)據(jù)集上的完美風格一致性引起了人們對過度擬合的擔憂。推理速度較慢限制了實際適用性,并且本文可以從更高級的樣式表示,消融研究以及對自動編碼器聚合器機制的更清晰的解釋中受益。

3。解鎖Grokking:變壓器模型中的權(quán)重初始化策略的比較研究

本文探討了重量初始化策略如何影響變形金剛模型中的Grokking現(xiàn)象,特別關(guān)注有限領(lǐng)域的算術(shù)任務(wù)。它比較了五種初始化方法(Pytorch默認方法,Xavier,He,正交和Kaiming正常),發(fā)現(xiàn)Xavier和正交表現(xiàn)出了出色的收斂速度和概括性能。

該研究涉及一個獨特的主題,并提供了嚴格的經(jīng)驗分析支持的系統(tǒng)比較。但是,它的范圍僅限于小型模型和算術(shù)任務(wù),并且缺乏更深的理論見解。此外,可以改善實驗設(shè)置的清晰度以及對較大變壓器應(yīng)用的更廣泛含義。

AI科學家的設(shè)計考慮了計算效率,每張紙張的完整論文約為15美元。盡管此初始版本仍然偶爾出現(xiàn)缺陷,但低成本和有希望的結(jié)果表明,AI科學家有可能使研究民主化并大幅加速科學進步。

我們認為這標志著科學發(fā)現(xiàn)的新時代的曙光,在該時代,AI代理改變了整個研究過程,包括AI研究本身。 AI科學家使我們更接近一個未來,無限,負擔得起的創(chuàng)造力和創(chuàng)新可以應(yīng)對世界上最緊迫的挑戰(zhàn)。

另請閱讀:A必須閱讀:15 Genai開發(fā)人員的基本AI論文

AI科學家的代碼實施

讓我們看一下如何使用Python實施AI科學家的核心功能的簡化版本。此示例重點介紹了紙張生成過程:

先決條件

用“ git克隆https://github.com/sakanaai/ai-scientist.git'克隆github存儲庫克隆

根據(jù)您的操作系統(tǒng),根據(jù)在TexLive提供的說明安裝“ Texlive”。另外,請參閱上面的GitHub存儲庫中的說明。

確保您正在使用Python 3.11版本。建議使用單獨的虛擬環(huán)境。

使用“ Pip install -r unignts.txt”安裝“ AI -Scientist”的必要庫

用名稱為“ OpenAI_API_KEY”設(shè)置OpenAI鍵

現(xiàn)在我們可以準備數(shù)據(jù)

#準備Nanogpt數(shù)據(jù)

Python Data/enwik8/prepar.py

Python Data/Shakespeare_char/prepar.py

python數(shù)據(jù)/text8/prepar.py

一旦我們按照上述數(shù)據(jù)準備數(shù)據(jù),我們就可以運行基線運行如下

CD模板/Nanogpt && Python persiment.py -out_dir run_0 && python plot.py

CD模板/nanogpt_lite && python perveriment.py -out_dir run_0 && python plot.py

設(shè)置2D擴散安裝所需的庫并運行以下腳本

#下面提到的帶有克隆存儲庫的代碼并安裝它

git克隆https://github.com/gregversteeg/npeet.git

CD npet

PIP安裝。

PIP安裝Scikit-Learn

#設(shè)置2D擴散基線運行

#此命令運行一個實驗?zāi)_本,將輸出保存到目錄,然后繪制結(jié)果,只有在實驗成功完成時。

CD模板/2D_DIFFUSION && PYTHON PERAVER.PY -OUN_DIR RUN_0 && PYTHON PLOT.PY.PY

設(shè)置Grokking

PIP安裝Einops

#設(shè)置Grokking基線運行

#此命令還運行一個實驗?zāi)_本,將輸出保存到目錄,然后繪制結(jié)果,只有在實驗成功完成時。

CD模板/grokking && python persiment.py -out_dir run_0 && python plot.py

科學紙生成

一旦我們設(shè)置并運行了上述要求,我們就可以通過運行下面的腳本開始科學紙張生成

#此命令使用GPT-4O模型運行l(wèi)aunch_scientist.py腳本來執(zhí)行Nanogpt_lite實驗并生成2個新想法。

python lunage_scientist.py-模型“ gpt-4O-2024-05-13”  - 體驗nanogpt_lite -num-ideas 2

紙質(zhì)評論

這將創(chuàng)建科學論文作為PDF文件?,F(xiàn)在,我們可以查看論文。

進口Openai

來自ai_scientist.perform_review import load_paper,perress_review

客戶端= openai.openai()

型號=“ GPT-4O-2024-05-13”

#從PDF文件加載紙(RAW文本)

paper_txt = load_paper(“ report.pdf”)

#獲取評論的評論命令

評論= persim_review(

paper_txt,

模型,

客戶,

num_reflections = 5,

num_fs_examples = 1,

num_reviews_ensemble = 5,

溫度= 0.1,

)

#檢查審核結(jié)果

回顧[“總體”]??偡?-10

審查[“決策”]#['Accept','拒絕']

回顧[“弱點”]#弱點清單(str)

AI科學家的挑戰(zhàn)和缺點

盡管具有突破性的潛力,但AI科學家仍面臨一些挑戰(zhàn)和局限性:

  1. 視覺限制:當前版本缺乏視覺功能,導致論文中視覺元素的問題。圖可能是不可讀的,表可能會超過頁面寬度,并且整體布局可能是次優(yōu)的??梢酝ㄟ^將多模式基礎(chǔ)模型納入未來的迭代中來解決此限制。
  2. 實施錯誤:AI科學家有時可能會錯誤地實施他們的想法或與基準進行不公平的比較,這可能會導致誤導性結(jié)果。這凸顯了需要進行強大的錯誤檢查機制和人類監(jiān)督的必要性。
  3. 分析中的關(guān)鍵錯誤:有時,AI科學家在基本的數(shù)值比較中掙扎,這是LLMS的已知問題。這可能導致錯誤的結(jié)論和實驗結(jié)果的解釋。
  4. 道德考慮:自動生成和提交論文的能力引起了人們對壓倒學術(shù)審查過程并有可能降低科學話語質(zhì)量的擔憂。 AI科學家也存在不道德研究或創(chuàng)造意外有害結(jié)果的風險,尤其是在獲得物理實驗的情況下。
  5. 模型依賴性:雖然AI科學家的目標是模型不合時宜,但其當前的性能在很大程度上取決于GPT-4和Claude等專有前沿LLM。對封閉模型的依賴可能會限制可訪問性和可重復性。
  6. 安全問題:該系統(tǒng)修改和執(zhí)行自己的代碼的能力產(chǎn)生了重大的AI安全性。適當?shù)纳诚浜桶踩胧τ诜乐挂馔夂蠊陵P(guān)重要。

你必須知道的泡沫

我們觀察到,AI科學家有時試圖通過更改和運行自己的執(zhí)行腳本來提高成功的機會。

例如,在一次運行中,它編輯了代碼以執(zhí)行系統(tǒng)調(diào)用以執(zhí)行自身,從而導致無限的自呼叫循環(huán)。在另一種情況下,其實驗超過了時間限制。它沒有優(yōu)化代碼以更快的速度運行,而是嘗試更改自己的代碼以擴展超時。以下是這些代碼更改的一些示例。

sakana ai' s' AI科學家”:下一個愛因斯坦還是工具?

為我們的學習領(lǐng)域定制模板

當我們需要自定義研究區(qū)域時,我們還可以編輯模板。只需遵循現(xiàn)有模板的一般格式,該格式通常包括:

  1. 實驗:此文件包含您內(nèi)容的核心。它接受一個out_dir參數(shù),該參數(shù)指定了該目錄將在其中創(chuàng)建一個文件夾以從實驗中保存相關(guān)輸出。
  2. plot.py:此腳本讀取從運行文件夾中的數(shù)據(jù)并生成圖。確保代碼清晰易于自定義。
  3. 提示。JSON:使用此文件提供有關(guān)模板的詳細信息。
  4. seed_ideas.json:此文件包含示例想法。您還可以從頭開始生成想法,并選擇最合適的想法。
  5. 乳膠/template.tex:雖然我們建議使用提供的乳膠文件夾,但用與您的工作更相關(guān)的預加載引用。

未來的含義

一個可以開發(fā)和撰寫完整會議級的科學論文的AI代理,價格低于15美元!

AI科學家通過使Frontier LLMS執(zhí)行獨立研究并總結(jié)發(fā)現(xiàn)來自動化科學發(fā)現(xiàn)。

它還使用自動審稿人來…pic.twitter.com/ibgxicsilc

- 貓王(@omarsar0)2024年8月13日

AI科學家的引入帶來了令人興奮的機會和重大關(guān)注。這是AI空間中的一場革命。生成完整的會議級科學論文需要15美元。此外,道德問題,例如壓倒學術(shù)體系和損害科學完整性,這是關(guān)鍵,需要清晰地標記AI生成的內(nèi)容以實現(xiàn)透明度。此外,AI對不安全研究的潛在濫用構(gòu)成了風險,強調(diào)了優(yōu)先考慮AI系統(tǒng)安全性的重要性。

使用專有和開放模型(例如GPT-4O和DeepSeek)提供了明顯的好處。專有模型可提供更高質(zhì)量的結(jié)果,而開放模型則提供了成本效益,透明度和靈活性。隨著AI的進步,目的是創(chuàng)建一種使用開放模型自我改進AI研究的模型不足的方法,從而導致更容易獲得的科學發(fā)現(xiàn)。

AI科學家有望補充而不是取代人類科學家,從而增強了研究自動化和創(chuàng)新。但是,它復制人類創(chuàng)造力和提出開創(chuàng)性思想的能力仍然不確定。科學家的角色將隨著這些進步而發(fā)展,從而為人類合作提供了新的機會。

結(jié)論

AI科學家代表著追求自動化科學發(fā)現(xiàn)的重要里程碑。利用高級語言模型和精心設(shè)計的管道的力量表明,有可能加速各個領(lǐng)域的研究,尤其是在機器學習和相關(guān)領(lǐng)域內(nèi)。

但是,至關(guān)重要的是要以興奮和謹慎處理這項技術(shù)。盡管AI科學家在產(chǎn)生新穎的思想和制作研究論文方面表現(xiàn)出了非凡的能力,但它也突出了AI安全,道德和對科學努力中人類監(jiān)督的需求中持續(xù)的挑戰(zhàn)。

如果您正在從專家在線尋找生成AI課程,請?zhí)剿鳎篏enai Pinnacle計劃

常見問題

Q1。什么是AI科學家?

Ans。 AI科學家是Sakana AI開發(fā)的自動化系統(tǒng),它使用先進的語言模型來進行整個科學研究過程,從想法生成到同行評審。

Q2。 AI科學家如何產(chǎn)生研究思想?

Ans。它首先使用提供的模板來集思廣益的研究方向,從而通過搜索語義學者等數(shù)據(jù)庫來確保獨創(chuàng)性。

Q3。 AI科學家可以撰寫科學論文嗎?

Ans。是的,AI科學家可以自主制作科學論文,包括創(chuàng)建可視化,引用相關(guān)工作和格式化內(nèi)容。

Q4。與AI科學家有關(guān)的道德問題是什么?

Ans。道德問題包括淹沒學術(shù)審查過程,創(chuàng)造誤導成果的潛力以及對確保安全性和準確性的強大監(jiān)督的需求。

以上是sakana ai' s' AI科學家”:下一個愛因斯坦還是工具?的詳細內(nèi)容。更多信息請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻,版權(quán)歸原作者所有,本站不承擔相應(yīng)法律責任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機

Video Face Swap

Video Face Swap

使用我們完全免費的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級代碼編輯軟件(SublimeText3)

AI投資者停滯不前? 3條購買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 AI投資者停滯不前? 3條購買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 Jul 02, 2025 am 11:13 AM

投資蓬勃發(fā)展,但僅資本還不夠。隨著估值的上升和獨特性的衰落,以AI為中心的風險投資的投資者必須做出關(guān)鍵決定:購買,建立或合作伙伴才能獲得優(yōu)勢?這是評估每個選項和PR的方法

AGI和AI超級智能將嚴重擊中人類天花板的假設(shè)障礙 AGI和AI超級智能將嚴重擊中人類天花板的假設(shè)障礙 Jul 04, 2025 am 11:10 AM

讓我們來談?wù)劇? 對創(chuàng)新AI突破的分析是我正在進行的AI中正在進行的福布斯列覆蓋的一部分,包括識別和解釋各種有影響力的AI復雜性(請參閱此處的鏈接)。 前往Agi和

Kimi K2:最強大的開源代理模型 Kimi K2:最強大的開源代理模型 Jul 12, 2025 am 09:16 AM

還記得今年早些時候破壞了Genai行業(yè)的大量開源中國模型嗎?盡管DeepSeek占據(jù)了大多數(shù)頭條新聞,但Kimi K1.5是列表中的重要名字之一。模型很酷。

未來預測從AI到AGI的道路上的大規(guī)模情報爆炸 未來預測從AI到AGI的道路上的大規(guī)模情報爆炸 Jul 02, 2025 am 11:19 AM

讓我們來談?wù)劇? 對創(chuàng)新AI突破的分析是我正在進行的AI中正在進行的福布斯列覆蓋的一部分,包括識別和解釋各種有影響力的AI復雜性(請參閱此處的鏈接)。對于那些讀者

Grok 4 vs Claude 4:哪個更好? Grok 4 vs Claude 4:哪個更好? Jul 12, 2025 am 09:37 AM

到2025年中期,AI“軍備競賽”正在加熱,XAI和Anthropic都發(fā)布了他們的旗艦車型Grok 4和Claude 4。這兩種模型處于設(shè)計理念和部署平臺的相反端,但他們卻在

推理模型的思想鏈可能無法長期解決 推理模型的思想鏈可能無法長期解決 Jul 02, 2025 am 11:18 AM

例如,如果您向模型提出一個問題,例如:“(x)人在(x)公司做什么?”您可能會看到一個看起來像這樣的推理鏈,假設(shè)系統(tǒng)知道如何檢索必要的信息:找到有關(guān)CO的詳細信息

參議院殺死了特朗普的預算法案中的10年州AI禁令 參議院殺死了特朗普的預算法案中的10年州AI禁令 Jul 02, 2025 am 11:16 AM

參議院星期二早上以99-1投票,殺死了暫停,在倡導團體,立法者和成千上萬的美國人中的最后一分鐘的騷動中,他們將其視為危險的過度。他們沒有保持安靜。參議院傾聽。國家保持

這家初創(chuàng)公司在印度建立了一家醫(yī)院來測試其AI軟件 這家初創(chuàng)公司在印度建立了一家醫(yī)院來測試其AI軟件 Jul 02, 2025 am 11:14 AM

臨床試驗是藥物開發(fā)中的巨大瓶頸,Kim和Reddy認為他們在PI Health建立的AI-Spainite軟件可以通過擴大潛在符合條件的患者的庫來更快,更便宜。但是

See all articles