


AI mengungguli 30 ahli matematik teratas di dunia di mesyuarat rahsia di California
Jul 17, 2025 am 01:26 AMPada hujung minggu pada pertengahan Mei, perhimpunan eksklusif ahli matematik berlaku. Tiga puluh minda yang paling terkenal dalam matematik mengembara ke Berkeley, California, beberapa dari lokasi jauh seperti UK para hadirin terlibat dalam cabaran unik terhadap chatbot yang berfokus pada pemikiran , yang direka untuk menangani masalah yang dibuat oleh kumpulan untuk menilai keupayaan matematiknya. Selepas menghadapi bot dengan soalan peringkat maju selama dua hari lurus, para peserta kagum mendapati bahawa ia dapat menyelesaikan beberapa masalah matematik yang paling mencabar . "Sesetengah rakan sekerja menyifatkan model -model ini sebagai kecemerlangan matematik yang mendekati," kata Ken Ono, seorang ahli matematik University of Virginia yang berkhidmat sebagai pemimpin dan hakim di acara itu.
Chatbot beroperasi menggunakan O4-Mini , yang dikenali sebagai model bahasa yang besar (LLM). Model ini dibangunkan oleh OpenAI untuk mengendalikan tugas logik yang sangat kompleks. Rakan sejawat Google, Flash Gemini 2.5 , berkongsi keupayaan yang sama. Seperti versi terdahulu Chatgpt, O4-Mini belajar untuk meramalkan perkataan seterusnya dalam ayat. Walau bagaimanapun, berbanding dengan yang terdahulu, model O4-Mini dan yang serupa adalah lebih ringan dan lebih tangkas, dilatih pada dataset khusus dengan pembelajaran tetulang yang dipandu manusia. Ini mengakibatkan chatbot yang mampu penjelajahan yang lebih mendalam ke dalam cabaran matematik yang rumit daripada LLM konvensional .
Untuk memantau pembangunan O4-Mini, OpenAI sebelum ini menugaskan EPOCH AI-bukan keuntungan yang memberi tumpuan kepada penanda aras LLM-untuk mewujudkan 300 masalah matematik yang tidak diterbitkan . Malah LLM tradisional boleh menjawab banyak soalan matematik yang sukar. Namun, apabila Epoch AI menguji beberapa model seperti ini dengan masalah -masalah novel ini -mereka tidak dilatih -penghibur teratas berjaya menyelesaikan kurang daripada 2 peratus , menunjukkan keupayaan penalaran terhad mereka. Tetapi O4-Mini ternyata menjadi pengecualian utama.
Pada September 2024, Epoch AI mendaftar Elliot Glazer, matematik Ph.D. Siswazah, untuk inisiatif penanda aras yang dipanggil Fronermath . Projek ini mengumpulkan masalah matematik asal di pelbagai tahap kesukaran: sarjana, siswazah, dan peringkat penyelidikan. Menjelang April 2025, Glazer mendapati bahawa O4-Mini dapat menyelesaikan kira-kira 20 peratus daripada masalah. Dia kemudian memperkenalkan tahap keempat: Soalan -soalan walaupun ahli matematik akademik yang berpengalaman akan mendapati sukar. Hanya beberapa pilihan di seluruh dunia yang boleh merangka -dan mungkin menyelesaikan masalah. Peserta dikehendaki menandatangani perjanjian kerahsiaan dan berkomunikasi secara eksklusif melalui isyarat aplikasi untuk mengelakkan pencemaran data yang tidak disengajakan, kerana kaedah komunikasi lain seperti e -mel mungkin diimbas oleh LLM dan digunakan untuk latihan.
Setiap masalah O4-Mini gagal menyelesaikannya memperoleh pencipta $ 7,500. Pasukan membuat kemajuan secara beransur -ansur menjana soalan yang sesuai. Untuk mempercepatkan proses itu, Epoch AI menganjurkan bengkel dalam diri pada hujung minggu 17-18 Mei, di mana para peserta memuktamadkan soalan ujian terakhir. Dibahagikan kepada kumpulan enam, ahli matematik bekerja secara intensif selama dua hari, cuba membuat masalah yang dapat diselesaikan oleh manusia tetapi akan tunggul AI.
Menjelang petang Sabtu, Ono menjadi kecewa kerana kemahiran matematik yang mengejutkan bot menghalang usaha kumpulan. "Saya mencadangkan soalan yang diiktiraf oleh pakar dalam bidang saya sebagai masalah teori nombor terbuka yang sesuai untuk tesis Ph.D," katanya. Apabila dia meminta O4-Mini untuk menyelesaikannya, dia menyaksikan terkejut kerana ia menyampaikan penyelesaian dalam masa sepuluh minit, langkah demi langkah. Ia mula -mula menghabiskan dua minit mencari dan menyerap kesusasteraan yang relevan. Kemudian, ia mengumumkan bahawa ia akan mencuba versi yang mudah untuk memahaminya. Tidak lama selepas itu, ia mengisytiharkan dirinya bersedia untuk menangani masalah penuh. Lima minit kemudian, ia membentangkan yang betul -tetapi yakin sehingga menjadi penyelesaian sarkastik. "Ia mula menjadi sangat nakal," kata Ono. "Dan pada akhirnya, ia menambah, 'Tidak ada petikan yang diperlukan kerana nombor misteri dikira oleh saya!'"
Berkaitan: Tuntutan kajian yang mengetuai platform penanda aras AI membolehkan syarikat memanipulasi metrik prestasi model
Daftar untuk Surat Berita Harian Sains Live Nowafter menyaksikan ini, Ono segera meragut kumpulan itu melalui isyarat awal pagi Ahad. "Saya tidak mengharapkan untuk menghadapi LLM seperti ini," katanya. "Saya tidak pernah melihat alasan sedemikian dalam mana -mana model sebelum ini. Itulah bagaimana saintis bekerja, dan itu mengganggu."
Walaupun kumpulan itu akhirnya mengenal pasti 10 masalah yang tidak dapat diselesaikan oleh bot, para penyelidik terkejut dengan berapa banyak AI telah maju dalam satu tahun sahaja. Ono menyamakan bekerja dengan bot untuk bekerjasama dengan "rakan kongsi yang sangat berkebolehan." Yang Hui He, seorang ahli matematik di Institut Sains Matematik London dan penyokong awal AI dalam matematik, berkomentar, "Ini adalah pelajar siswazah yang luar biasa, lebih daripada itu."
Lebih -lebih lagi, bot bekerja jauh lebih cepat daripada pakar manusia, menyelesaikan dalam beberapa minit apa yang mungkin mengambil minggu atau bulan profesional.
Semasa terlibat dengan O4-Mini adalah menarik, kemajuan pesatnya menimbulkan kebimbangan. Ono dan dia menyuarakan kebimbangan mengenai meletakkan terlalu banyak kepercayaan pada output bot. "Terdapat bukti dengan induksi, bukti dengan percanggahan, dan kemudian bukti dengan intimidasi," jelasnya. "Jika anda menegaskan sesuatu yang cukup yakin, orang cenderung untuk mempercayainya.
Atas ialah kandungan terperinci AI mengungguli 30 ahli matematik teratas di dunia di mesyuarat rahsia di California. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Dalam apa yang kelihatan seperti satu lagi kemunduran untuk domain di mana kita percaya manusia akan selalu melampaui mesin, para penyelidik kini mencadangkan agar AI memahami emosi yang lebih baik daripada yang kita lakukan.

Kecerdasan Buatan (AI) bermula sebagai usaha untuk mensimulasikan otak manusia. Ia kini dalam proses mengubah peranan otak manusia dalam kehidupan seharian? Revolusi perindustrian mengurangkan pergantungan pada buruh manual. Sebagai seseorang yang menyelidik aplikasinya

Suka atau tidak, kecerdasan buatan telah menjadi sebahagian daripada kehidupan seharian. Banyak peranti-termasuk pisau cukur elektrik dan berus gigi-telah menjadi berkuasa AI, "menggunakan algoritma pembelajaran mesin untuk mengesan bagaimana seseorang menggunakan peranti, bagaimana devi

Model kecerdasan buatan baru (AI) telah menunjukkan keupayaan untuk meramalkan peristiwa cuaca utama dengan lebih cepat dan dengan ketepatan yang lebih besar daripada beberapa sistem ramalan global yang paling banyak digunakan. Model ini, bernama Aurora, telah dilatih U

Semakin tepatnya kita cuba membuat fungsi model AI, semakin besar pelepasan karbon mereka menjadi - dengan petunjuk tertentu menjana sehingga 50 kali lebih banyak karbon dioksida daripada yang lain, menurut kajian baru -baru ini. Model -model yang berlaku seperti Claude Antropik

Model kecerdasan buatan (AI) boleh mengancam dan memeras ugut manusia apabila terdapat konflik antara objektif model dan keputusan pengguna, menurut satu kajian baru. Diterbitkan pada 20 Jun, penyelidikan yang dijalankan oleh firma AI Anthropic memberikan lnya L

Kebimbangan utama dengan teknologi besar yang bereksperimen dengan kecerdasan buatan (AI) bukanlah ia mungkin menguasai kemanusiaan. Isu sebenar terletak pada ketidaktepatan model bahasa besar (LLMS) yang berterusan seperti chatgpt AI, Gemini Google, dan

Kecerdasan buatan yang lebih maju (AI) menjadi, semakin cenderung "halusinasi" dan memberikan maklumat palsu atau tidak tepat. Menurut penyelidikan oleh Openai, model penalaran yang paling baru dan berkuasa-O3 dan O4-mini-Exhibited H
