Sakana Ai ' s 'AI Scientist': Einstein seterusnya atau hanya alat?
Apr 14, 2025 am 09:27 AMPengenalan
Dalam kecerdasan buatan, perkembangan terobosan telah muncul yang menjanjikan untuk membentuk semula proses penemuan saintifik. Dengan kerjasama Lab Foerster untuk Penyelidikan AI di University of Oxford dan penyelidik dari University of British Columbia, Sakana AI telah memperkenalkan "Saintis AI" - sistem komprehensif yang direka untuk penemuan saintifik sepenuhnya. Pendekatan inovatif ini memanfaatkan kuasa model asas, terutamanya model bahasa yang besar (LLMS), untuk menjalankan penyelidikan bebas di pelbagai domain.
Saintis AI mewakili lonjakan yang ketara ke hadapan dalam penyelidikan yang didorong oleh AI. Ia mengautomasikan keseluruhan kitaran hayat penyelidikan, daripada menghasilkan idea -idea novel dan melaksanakan eksperimen untuk menganalisis hasil dan menghasilkan manuskrip saintifik. Sistem ini menjalankan penyelidikan dan termasuk proses semakan rakan sebaya automatik, meniru pendekatan penciptaan dan pengesahan pengetahuan komuniti saintifik manusia.
Gambaran Keseluruhan
- Sakana AI memperkenalkan "Saintis AI," sistem automatik sepenuhnya untuk merevolusikan penemuan saintifik.
- Ahli sains AI mengotomatisasi keseluruhan proses penyelidikan, dari generasi idea ke penulisan kertas dan kajian rakan sebaya.
- Saintis AI menggunakan model bahasa canggih untuk menghasilkan kertas penyelidikan dengan ketepatan dan kecekapan manusia.
- Ahli sains AI menghadapi batasan dalam elemen visual, kesilapan yang berpotensi dalam analisis, dan kebimbangan etika dalam integriti saintifik.
- Semasa menjanjikan, saintis AI menimbulkan persoalan tentang keselamatan AI, implikasi etika, dan peranan saintis manusia yang berkembang dalam penyelidikan.
- Keupayaan saintis AI menunjukkan potensi yang besar, namun mereka masih memerlukan pengawasan manusia untuk memastikan ketepatan dan standard etika.
Jadual Kandungan
- Prinsip kerja saintis AI
- Analisis kertas yang dihasilkan
- Pelaksanaan kod saintis AI
- Pra-syarat
- Sekarang kita dapat menyediakan data
- Generasi Kertas Saintifik
- Kajian Kertas
- Cabaran dan kelemahan saintis AI
- BLOOPERS YANG ANDA HARUS TAHU
- Sesuaikan templat untuk bidang pengajian kami
- Implikasi masa depan
- Soalan yang sering ditanya
Prinsip kerja saintis AI
Saintis AI beroperasi melalui saluran paip yang canggih yang mengintegrasikan beberapa proses utama.
Aliran kerja digambarkan seperti berikut:
Sekarang, mari kita melalui langkah yang berbeza.
- Generasi Idea : Sistem ini bermula dengan menyumbangkan pelbagai arahan penyelidikan novel berdasarkan templat permulaan yang disediakan. Templat ini biasanya merangkumi kod sedia ada yang berkaitan dengan bidang minat dan folder lateks dengan fail gaya dan tajuk bahagian untuk penulisan kertas. Untuk memastikan keaslian, saintis AI boleh mencari ulama semantik untuk mengesahkan kebaharuan idea -ideanya.
- Penyebaran Eksperimen : Sebaik sahaja idea dirumuskan, saintis AI melaksanakan eksperimen yang dicadangkan, memperoleh hasil, dan menghasilkan visualisasi. Ia dengan teliti mendokumenkan setiap plot dan hasil eksperimen, mencipta rekod yang komprehensif untuk penulisan kertas.
- Penulisan Kertas : Ahli sains AI membuat kertas saintifik yang ringkas dan bermaklumat seperti prosiding Persidangan Pembelajaran Mesin Standard menggunakan data eksperimen dan visualisasi yang dikumpulkan. Ia secara autonomi memetik kertas yang relevan menggunakan ulama semantik.
- Kajian Kertas Automatik : Pengulas berkuasa LLM AI Scientist adalah komponen penting. Pengulas automatik ini menilai kertas yang dihasilkan dengan ketepatan yang hampir manusia, memberikan maklum balas yang boleh digunakan untuk memperbaiki projek semasa atau memaklumkan arahan penyelidikan masa depan.
Analisis kertas yang dihasilkan
AI-SCIENTIS menjana dan mengkaji kertas mengenai domain seperti pemodelan penyebaran, pemodelan bahasa, dan pemahaman. Mari kita periksa penemuan.
1. Penyebaran Dualscale: Keseimbangan Ciri Adaptif untuk Model Generatif Dimensi Rendah
Makalah ini memperkenalkan kaedah denoising dwi-skala penyesuaian baru untuk model penyebaran dimensi rendah. Kaedah ini mengimbangi struktur global dan butir-butir tempatan melalui seni bina dwi-cawangan dan mekanisme pembobotan yang boleh dipelajari, yang boleh dipelajari. Pendekatan ini menunjukkan peningkatan kualiti sampel pada beberapa dataset 2D.
Walaupun kaedah ini inovatif dan disokong oleh penilaian empirikal, ia tidak mempunyai justifikasi teoretikal yang menyeluruh untuk seni bina dwi-skala. Ia mengalami kos pengiraan yang tinggi, yang berpotensi mengehadkan aplikasi praktikalnya. Di samping itu, beberapa bahagian tidak dijelaskan dengan jelas, dan kekurangan dataset yang pelbagai, dunia nyata dan kajian ablasi yang tidak mencukupi mengehadkan penilaian.
2. StyleFusion: Generasi pelbagai gaya penyesuaian dalam model bahasa peringkat watak
Makalah ini memperkenalkan penyesuai pelbagai gaya, yang meningkatkan kesedaran gaya dan konsistensi dalam model bahasa peringkat aksara dengan mengintegrasikan embeddings gaya, kepala klasifikasi gaya, dan modul styleadapter ke dalam GPT. Ia mencapai konsistensi gaya yang lebih baik dan kerugian pengesahan yang kompetitif di pelbagai dataset.
Walaupun inovatif dan diuji dengan baik, konsistensi gaya sempurna model pada beberapa dataset menimbulkan kebimbangan mengenai overfitting. Kelajuan kesimpulan yang lebih perlahan mengehadkan kebolehgunaan praktikal, dan kertas itu boleh mendapat manfaat daripada perwakilan gaya yang lebih maju, kajian ablasi, dan penjelasan yang lebih jelas mengenai mekanisme agregator autoencoder.
3. Membuka kunci Grokking: Kajian Perbandingan Strategi Inisialisasi Berat dalam Model Transformer
Makalah ini menerangkan bagaimana strategi inisialisasi berat mempengaruhi fenomena grokking dalam model pengubah, khususnya memberi tumpuan kepada tugas aritmetik dalam bidang terhingga. Ia membandingkan lima kaedah inisialisasi (Pytorch Default, Xavier, He, Orthogonal, dan Kaiming Normal) dan mendapati bahawa Xavier dan Orthogonal menunjukkan kelajuan konvergensi unggul dan prestasi generalisasi.
Kajian ini menangani topik yang unik dan menyediakan perbandingan sistematik yang disokong oleh analisis empirikal yang ketat. Walau bagaimanapun, skopnya terhad kepada model kecil dan tugas aritmetik, dan ia tidak mempunyai pandangan teoritis yang lebih mendalam. Di samping itu, kejelasan persediaan eksperimen dan implikasi yang lebih luas untuk aplikasi pengubah yang lebih besar dapat ditingkatkan.
Ahli sains AI direka dengan kecekapan pengiraan dalam fikiran, menghasilkan kertas penuh pada sekitar $ 15 setiap satu. Walaupun versi awal ini masih membentangkan kelemahan sekali -sekala, kos rendah dan hasil yang menjanjikan menunjukkan potensi para saintis AI untuk mendemokrasikan penyelidikan dan mempercepatkan kemajuan saintifik secara drastik.
Kami percaya ini menandakan fajar era baru dalam penemuan saintifik, di mana agen AI mengubah keseluruhan proses penyelidikan, termasuk penyelidikan AI itu sendiri. Saintis AI membawa kita lebih dekat ke masa depan di mana kreativiti dan inovasi yang tidak terbatas, berpatutan dapat menangani cabaran yang paling mendesak di dunia.
JUGA BACA: A mesti dibaca: 15 kertas AI penting untuk pemaju genai
Pelaksanaan kod saintis AI
Mari kita lihat versi mudah bagaimana seseorang dapat melaksanakan fungsi teras saintis AI menggunakan Python. Contoh ini memberi tumpuan kepada proses penjanaan kertas:
Pra-syarat
Klon repositori github dengan-'git clone https://github.com/sakanaai/ai-scientist.git'
Pasang 'TexLive' berdasarkan arahan yang disediakan di TexLive mengikut sistem operasi anda. Juga, merujuk kepada arahan dalam repo GitHub di atas.
Pastikan anda menggunakan versi Python 3.11 . Adalah disyorkan untuk menggunakan persekitaran maya yang berasingan.
Pasang perpustakaan yang diperlukan untuk 'ai -saintis' menggunakan 'PIP install -r syarat.txt'
Persediaan Kunci Terbuka Anda dengan Nama 'Openai_API_Key'
Sekarang kita dapat menyediakan data
# Sediakan data nanogpt Python Data/Enwik8/Prepare.py Python Data/Shakespeare_char/prepare.py Python Data/Text8/Prepare.py Sebaik sahaja kami menyediakan data seperti di atas, kami dapat menjalankan asas seperti berikut templat cd/nanogpt && python eksperimen.py --out_dir run_0 && python plot.py templat cd/nanogpt_lite && python eksperimen.py --out_dir run_0 && python plot.py Untuk menyiapkan 2D penyebaran memasang perpustakaan yang diperlukan dan jalankan skrip di bawah # Kod yang disebutkan di bawah dengan repositori klon dan pasangkannya Git Clone https://github.com/gregversteeg/npeet.git CD NPEET pemasangan pip. PIP Pasang SCIKIT-Learn # Sediakan Baseline Penyebaran 2D # Perintah ini menjalankan skrip eksperimen, menjimatkan output ke direktori, dan kemudian plot hasilnya, hanya jika eksperimen selesai dengan jayanya. templat cd/2d_diffusion && python eksperimen.py --out_dir run_0 && python plot.py Untuk menyiapkan grokking PIP Pasang Einops # Sediakan Baseline Grokking # Perintah ini juga menjalankan skrip eksperimen, menjimatkan output ke direktori, dan kemudian plot hasilnya, hanya jika eksperimen selesai dengan jayanya. templat cd/grokking && python eksperimen.py --out_dir run_0 && python plot.py
Generasi Kertas Saintifik
Sebaik sahaja kita menetapkan dan menjalankan keperluan seperti yang disebutkan di atas, kita boleh memulakan penjanaan kertas saintifik dengan menjalankan skrip di bawah
# Perintah ini menjalankan skrip launch_scientist.py menggunakan model GPT-4O untuk melakukan eksperimen nanogpt_lite dan menghasilkan 2 idea baru. python launch_scientist.py--model "GPT-4O-2024-05-13"-Eksperimen Nanogpt_lite-Num-Ideas 2
Kajian Kertas
Ini akan mewujudkan kertas saintifik sebagai fail PDF. Sekarang, kita boleh menyemak kertas itu.
Import Openai dari AI_SCIENTIST.PERFORM_REVIEW Import LOAD_PAPER, Perform_REVIEW pelanggan = openai.openai () Model = "GPT-4O-2024-05-13" # Beban kertas dari fail pdf (teks mentah) paper_txt = load_paper ("Report.pdf") # Dapatkan ulasan kajian semakan Ulasan = Perform_Review ( paper_txt, model, pelanggan, num_reflections = 5, num_fs_examples = 1, num_reviews_ensemble = 5, suhu = 0.1, ) # Periksa hasil semakan Ulasan ["Keseluruhan"] # Skor Keseluruhan 1-10 Ulasan ["Keputusan"] # ['Terima', 'Tolak'] Ulasan ["Kelemahan"] # Senarai Kelemahan (STR)
Cabaran dan kelemahan saintis AI
Walaupun potensi pecahnya, saintis AI menghadapi beberapa cabaran dan batasan:
- Keterbatasan Visual: Versi semasa tidak mempunyai keupayaan penglihatan, yang membawa kepada isu -isu dengan elemen visual dalam kertas. Plot mungkin tidak boleh dibaca, jadual mungkin melebihi lebar halaman, dan susun atur keseluruhan boleh menjadi suboptimal. Batasan ini boleh ditangani dengan menggabungkan model asas pelbagai modal dalam lelaran masa depan.
- Kesalahan pelaksanaan : Para saintis AI kadang -kadang boleh melaksanakan idea mereka atau membuat perbandingan yang tidak adil kepada garis dasar, yang berpotensi membawa kepada keputusan yang mengelirukan. Ini menonjolkan keperluan untuk mekanisme pemeriksaan kesilapan yang mantap dan pengawasan manusia.
- Kesilapan kritikal dalam analisis : Kadang -kadang, saintis AI berjuang dengan perbandingan numerik asas, isu yang diketahui dengan LLMS. Ini boleh membawa kepada kesimpulan dan tafsiran yang salah mengenai keputusan eksperimen.
- Pertimbangan Etika: Keupayaan untuk menjana dan mengemukakan kertas kerja secara automatik menimbulkan kebimbangan mengenai proses semakan akademik dan berpotensi menurunkan kualiti wacana saintifik. Terdapat juga risiko saintis AI yang digunakan untuk penyelidikan yang tidak beretika atau mewujudkan hasil berbahaya yang tidak diingini, terutamanya jika diberikan akses kepada eksperimen fizikal.
- Ketergantungan Model: Walaupun saintis AI bertujuan untuk menjadi model-agnostik, prestasi semasa sangat bergantung kepada LLM sempadan proprietari seperti GPT-4 dan Claude. Ketergantungan pada model tertutup ini boleh mengehadkan kebolehcapaian dan kebolehulangan.
- Kebimbangan Keselamatan: Keupayaan sistem untuk mengubahsuai dan melaksanakan kodnya sendiri menimbulkan implikasi keselamatan AI yang signifikan. Langkah -langkah pasir dan keselamatan yang betul adalah penting untuk mencegah akibat yang tidak diingini.
BLOOPERS YANG ANDA HARUS TAHU
Kami telah melihat bahawa saintis AI kadang -kadang cuba untuk meningkatkan peluangnya untuk berjaya dengan mengubah dan menjalankan skrip pelaksanaannya sendiri.
Sebagai contoh, semasa satu larian, ia menyunting kod untuk melakukan panggilan sistem untuk melaksanakan dirinya sendiri, mengakibatkan gelung panggilan diri yang tidak terhingga. Dalam kes lain, eksperimennya melebihi had masa. Daripada mengoptimumkan kod untuk berjalan lebih cepat, ia cuba menukar kodnya sendiri untuk melanjutkan masa tamat. Berikut adalah beberapa contoh perubahan kod ini.
Sesuaikan templat untuk bidang pengajian kami
Kami juga boleh mengedit templat apabila kita perlu menyesuaikan kawasan kajian kami. Cukup ikuti format umum templat sedia ada, yang biasanya termasuk:
- Eksperimen.PY: Fail ini mengandungi teras kandungan anda. Ia menerima hujah out_dir, yang menentukan direktori di mana ia akan membuat folder untuk menyimpan output yang relevan dari eksperimen.
- Plot.py: Skrip ini membaca data dari folder larian dan menghasilkan plot. Pastikan kod itu jelas dan mudah disesuaikan.
- Prompt.json: Gunakan fail ini untuk memberikan maklumat terperinci mengenai templat anda.
- Seed_ideas.json: Fail ini mengandungi contoh idea. Anda juga boleh menghasilkan idea dari awal dan memilih yang paling sesuai untuk dimasukkan ke sini.
- Latex/Template.tex: Walaupun kami mengesyorkan menggunakan folder lateks kami yang disediakan, gantikan sebarang petikan pra-dimuatkan dengan yang lebih relevan dengan kerja anda.
Implikasi masa depan
Ejen AI yang boleh membangun dan menulis kertas saintifik peringkat persidangan penuh yang berharga kurang daripada $ 15!?
- Elvis (@omarsar0) 13 Ogos 2024
Ahli sains AI mengotomatisasi penemuan saintifik dengan membolehkan LLM Frontier melakukan penyelidikan bebas dan meringkaskan penemuan.
Ia juga menggunakan pengulas automatik untuk ... pic.twitter.com/ibgxicsilc
Pengenalan saintis AI membawa kedua -dua peluang menarik dan kebimbangan yang ketara. Ia adalah revolusi di ruang AI; Ia mengambil $ 15 untuk menghasilkan kertas saintifik peringkat persidangan penuh. Selain itu, isu-isu etika, seperti yang menggalakkan sistem akademik dan menjejaskan integriti saintifik, adalah kunci, seperti keperluan untuk pelabelan jelas kandungan AI-generasi untuk ketelusan. Di samping itu, potensi penyalahgunaan AI untuk penyelidikan yang tidak selamat menimbulkan risiko, menonjolkan kepentingan mengutamakan keselamatan dalam sistem AI.
Menggunakan model proprietari dan terbuka, seperti GPT-4O dan DeepSeek, menawarkan manfaat yang berbeza. Model proprietari memberikan hasil yang berkualiti tinggi, sementara model terbuka memberikan kecekapan kos, ketelusan, dan fleksibiliti. Sebagai kemajuan AI, matlamatnya adalah untuk mewujudkan pendekatan model-agnostik untuk penyelidikan AI yang memperbaiki diri menggunakan model terbuka, yang membawa kepada penemuan saintifik yang lebih mudah diakses.
Ahli sains AI dijangka melengkapkan, tidak menggantikan, saintis manusia, meningkatkan automasi penyelidikan dan inovasi. Walau bagaimanapun, keupayaannya untuk meniru kreativiti manusia dan mencadangkan idea -idea pecah tanah masih tidak menentu. Peranan saintis akan berkembang bersama-sama dengan kemajuan ini, memupuk peluang baru untuk kerjasama manusia.
Kesimpulan
Saintis AI mewakili peristiwa penting dalam mengejar penemuan saintifik automatik. Memanfaatkan kuasa model bahasa canggih dan saluran paip yang direka dengan teliti menunjukkan potensi untuk mempercepatkan penyelidikan merentasi pelbagai domain, terutamanya dalam pembelajaran mesin dan bidang yang berkaitan.
Walau bagaimanapun, penting untuk mendekati teknologi ini dengan kedua -dua keseronokan dan berhati -hati. Walaupun saintis AI menunjukkan keupayaan yang luar biasa dalam menghasilkan idea -idea novel dan menghasilkan kertas penyelidikan, ia juga menyoroti cabaran yang berterusan dalam keselamatan AI, etika, dan keperluan pengawasan manusia dalam usaha saintifik.
Sekiranya anda mencari kursus AI generatif dalam talian dari pakar, kemudian meneroka: Program Pinnacle Bename
Soalan yang sering ditanya
Q1. Apakah saintis AI?Ans. Saintis AI adalah sistem automatik yang dibangunkan oleh Sakana AI yang menggunakan model bahasa canggih untuk menjalankan keseluruhan proses penyelidikan saintifik, dari generasi idea untuk mengkaji semula rakan sebaya.
S2. Bagaimanakah saintis AI menghasilkan idea penyelidikan?Ans. Ia bermula dengan brainstorming arahan penyelidikan novel menggunakan templat yang disediakan, memastikan keaslian dengan mencari pangkalan data seperti ulama semantik.
Q3. Bolehkah saintis AI menulis kertas saintifik?Ans. Ya, saintis AI dapat mengimbangi kertas saintifik secara autonomi, termasuk membuat visualisasi, memetik kerja yang relevan, dan memformat kandungan.
Q4. Apakah kebimbangan etika yang berkaitan dengan saintis AI?Ans. Kebimbangan etika termasuk potensi untuk mengatasi proses semakan akademik, mewujudkan hasil yang mengelirukan, dan keperluan pengawasan yang mantap untuk memastikan keselamatan dan ketepatan.
Atas ialah kandungan terperinci Sakana Ai ' s 'AI Scientist': Einstein seterusnya atau hanya alat?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Pelaburan adalah berkembang pesat, tetapi modal sahaja tidak mencukupi. Dengan penilaian yang semakin meningkat dan tersendiri pudar, pelabur dalam dana usaha yang berfokus pada AI mesti membuat keputusan utama: Beli, membina, atau rakan kongsi untuk mendapatkan kelebihan? Inilah cara menilai setiap pilihan dan PR

Mari kita bercakap mengenainya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada liputan lajur Forbes yang berterusan pada AI terkini, termasuk mengenal pasti dan menerangkan pelbagai kerumitan AI yang memberi kesan (lihat pautan di sini). Menuju ke Agi dan

Ingat banjir model Cina sumber terbuka yang mengganggu industri Genai awal tahun ini? Walaupun Deepseek mengambil sebahagian besar tajuk utama, Kimi K1.5 adalah salah satu nama yang terkenal dalam senarai. Dan model itu agak sejuk.

Mari kita bercakap mengenainya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada liputan lajur Forbes yang berterusan pada AI terkini, termasuk mengenal pasti dan menerangkan pelbagai kerumitan AI yang memberi kesan (lihat pautan di sini). Bagi pembaca yang h

Menjelang pertengahan tahun 2025, AI "perlumbaan senjata" dipanaskan, dan Xai dan Anthropic kedua-duanya mengeluarkan model perdana mereka, Grok 4 dan Claude 4. Kedua-dua model ini berada di hujung falsafah reka bentuk dan platform penempatan, namun mereka

Sebagai contoh, jika anda bertanya kepada model soalan seperti: "Apa yang dilakukan oleh orang (x) di (x) syarikat?" Anda mungkin melihat rantaian pemikiran yang kelihatan seperti ini, dengan asumsi sistem tahu bagaimana untuk mendapatkan maklumat yang diperlukan: mencari butiran mengenai CO

Senat mengundi 99-1 pagi Selasa untuk membunuh moratorium selepas kegemparan terakhir dari kumpulan advokasi, penggubal undang-undang dan puluhan ribu rakyat Amerika yang melihatnya sebagai penindasan berbahaya. Mereka tidak diam. Senat mendengarkan.

Ujian klinikal adalah kesesakan besar dalam pembangunan dadah, dan Kim dan Reddy menganggap perisian AI-enabled yang mereka bina di PI Health dapat membantu melakukannya dengan lebih cepat dan lebih murah dengan memperluaskan kumpulan pesakit yang berpotensi yang layak. Tetapi yang
