亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

Rumah Peranti teknologi industri IT AI mengungguli 30 ahli matematik teratas di dunia di mesyuarat rahsia di California

AI mengungguli 30 ahli matematik teratas di dunia di mesyuarat rahsia di California

Jul 17, 2025 am 01:26 AM

AI mengalahkan 30 ahli matematik teratas di dunia di California

Pada hujung minggu pada pertengahan Mei, perhimpunan eksklusif ahli matematik berlaku. Tiga puluh minda yang paling terkenal dalam matematik mengembara ke Berkeley, California, beberapa dari lokasi jauh seperti UK para hadirin terlibat dalam cabaran unik terhadap chatbot yang berfokus pada pemikiran , yang direka untuk menangani masalah yang dibuat oleh kumpulan untuk menilai keupayaan matematiknya. Selepas menghadapi bot dengan soalan peringkat maju selama dua hari lurus, para peserta kagum mendapati bahawa ia dapat menyelesaikan beberapa masalah matematik yang paling mencabar . "Sesetengah rakan sekerja menyifatkan model -model ini sebagai kecemerlangan matematik yang mendekati," kata Ken Ono, seorang ahli matematik University of Virginia yang berkhidmat sebagai pemimpin dan hakim di acara itu.

Chatbot beroperasi menggunakan O4-Mini , yang dikenali sebagai model bahasa yang besar (LLM). Model ini dibangunkan oleh OpenAI untuk mengendalikan tugas logik yang sangat kompleks. Rakan sejawat Google, Flash Gemini 2.5 , berkongsi keupayaan yang sama. Seperti versi terdahulu Chatgpt, O4-Mini belajar untuk meramalkan perkataan seterusnya dalam ayat. Walau bagaimanapun, berbanding dengan yang terdahulu, model O4-Mini dan yang serupa adalah lebih ringan dan lebih tangkas, dilatih pada dataset khusus dengan pembelajaran tetulang yang dipandu manusia. Ini mengakibatkan chatbot yang mampu penjelajahan yang lebih mendalam ke dalam cabaran matematik yang rumit daripada LLM konvensional .

Untuk memantau pembangunan O4-Mini, OpenAI sebelum ini menugaskan EPOCH AI-bukan keuntungan yang memberi tumpuan kepada penanda aras LLM-untuk mewujudkan 300 masalah matematik yang tidak diterbitkan . Malah LLM tradisional boleh menjawab banyak soalan matematik yang sukar. Namun, apabila Epoch AI menguji beberapa model seperti ini dengan masalah -masalah novel ini -mereka tidak dilatih -penghibur teratas berjaya menyelesaikan kurang daripada 2 peratus , menunjukkan keupayaan penalaran terhad mereka. Tetapi O4-Mini ternyata menjadi pengecualian utama.

Pada September 2024, Epoch AI mendaftar Elliot Glazer, matematik Ph.D. Siswazah, untuk inisiatif penanda aras yang dipanggil Fronermath . Projek ini mengumpulkan masalah matematik asal di pelbagai tahap kesukaran: sarjana, siswazah, dan peringkat penyelidikan. Menjelang April 2025, Glazer mendapati bahawa O4-Mini dapat menyelesaikan kira-kira 20 peratus daripada masalah. Dia kemudian memperkenalkan tahap keempat: Soalan -soalan walaupun ahli matematik akademik yang berpengalaman akan mendapati sukar. Hanya beberapa pilihan di seluruh dunia yang boleh merangka -dan mungkin menyelesaikan masalah. Peserta dikehendaki menandatangani perjanjian kerahsiaan dan berkomunikasi secara eksklusif melalui isyarat aplikasi untuk mengelakkan pencemaran data yang tidak disengajakan, kerana kaedah komunikasi lain seperti e -mel mungkin diimbas oleh LLM dan digunakan untuk latihan.

Setiap masalah O4-Mini gagal menyelesaikannya memperoleh pencipta $ 7,500. Pasukan membuat kemajuan secara beransur -ansur menjana soalan yang sesuai. Untuk mempercepatkan proses itu, Epoch AI menganjurkan bengkel dalam diri pada hujung minggu 17-18 Mei, di mana para peserta memuktamadkan soalan ujian terakhir. Dibahagikan kepada kumpulan enam, ahli matematik bekerja secara intensif selama dua hari, cuba membuat masalah yang dapat diselesaikan oleh manusia tetapi akan tunggul AI.

Menjelang petang Sabtu, Ono menjadi kecewa kerana kemahiran matematik yang mengejutkan bot menghalang usaha kumpulan. "Saya mencadangkan soalan yang diiktiraf oleh pakar dalam bidang saya sebagai masalah teori nombor terbuka yang sesuai untuk tesis Ph.D," katanya. Apabila dia meminta O4-Mini untuk menyelesaikannya, dia menyaksikan terkejut kerana ia menyampaikan penyelesaian dalam masa sepuluh minit, langkah demi langkah. Ia mula -mula menghabiskan dua minit mencari dan menyerap kesusasteraan yang relevan. Kemudian, ia mengumumkan bahawa ia akan mencuba versi yang mudah untuk memahaminya. Tidak lama selepas itu, ia mengisytiharkan dirinya bersedia untuk menangani masalah penuh. Lima minit kemudian, ia membentangkan yang betul -tetapi yakin sehingga menjadi penyelesaian sarkastik. "Ia mula menjadi sangat nakal," kata Ono. "Dan pada akhirnya, ia menambah, 'Tidak ada petikan yang diperlukan kerana nombor misteri dikira oleh saya!'"

Berkaitan: Tuntutan kajian yang mengetuai platform penanda aras AI membolehkan syarikat memanipulasi metrik prestasi model

Daftar untuk Surat Berita Harian Sains Live Nowafter menyaksikan ini, Ono segera meragut kumpulan itu melalui isyarat awal pagi Ahad. "Saya tidak mengharapkan untuk menghadapi LLM seperti ini," katanya. "Saya tidak pernah melihat alasan sedemikian dalam mana -mana model sebelum ini. Itulah bagaimana saintis bekerja, dan itu mengganggu."

Walaupun kumpulan itu akhirnya mengenal pasti 10 masalah yang tidak dapat diselesaikan oleh bot, para penyelidik terkejut dengan berapa banyak AI telah maju dalam satu tahun sahaja. Ono menyamakan bekerja dengan bot untuk bekerjasama dengan "rakan kongsi yang sangat berkebolehan." Yang Hui He, seorang ahli matematik di Institut Sains Matematik London dan penyokong awal AI dalam matematik, berkomentar, "Ini adalah pelajar siswazah yang luar biasa, lebih daripada itu."

Lebih -lebih lagi, bot bekerja jauh lebih cepat daripada pakar manusia, menyelesaikan dalam beberapa minit apa yang mungkin mengambil minggu atau bulan profesional.

Semasa terlibat dengan O4-Mini adalah menarik, kemajuan pesatnya menimbulkan kebimbangan. Ono dan dia menyuarakan kebimbangan mengenai meletakkan terlalu banyak kepercayaan pada output bot. "Terdapat bukti dengan induksi, bukti dengan percanggahan, dan kemudian bukti dengan intimidasi," jelasnya. "Jika anda menegaskan sesuatu yang cukup yakin, orang cenderung untuk mempercayainya.

Atas ialah kandungan terperinci AI mengungguli 30 ahli matematik teratas di dunia di mesyuarat rahsia di California. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Kajian baru mendakwa AI 'memahami' emosi lebih baik daripada AS & MDASH; Terutama dalam situasi yang dikenakan emosi Kajian baru mendakwa AI 'memahami' emosi lebih baik daripada AS & MDASH; Terutama dalam situasi yang dikenakan emosi Jul 03, 2025 pm 05:48 PM

Dalam apa yang kelihatan seperti satu lagi kemunduran untuk domain di mana kita percaya manusia akan selalu melampaui mesin, para penyelidik kini mencadangkan agar AI memahami emosi yang lebih baik daripada yang kita lakukan.

Adakah penyumberan luar semuanya akan menanggung keupayaan kita untuk berfikir untuk diri kita sendiri? Adakah penyumberan luar semuanya akan menanggung keupayaan kita untuk berfikir untuk diri kita sendiri? Jul 03, 2025 pm 05:47 PM

Kecerdasan Buatan (AI) bermula sebagai usaha untuk mensimulasikan otak manusia. Ia kini dalam proses mengubah peranan otak manusia dalam kehidupan seharian? Revolusi perindustrian mengurangkan pergantungan pada buruh manual. Sebagai seseorang yang menyelidik aplikasinya

Peranti anda memberi makan kepada pembantu AI dan menuai data peribadi walaupun mereka sedang tidur. Inilah cara mengetahui apa yang anda kongsi. Peranti anda memberi makan kepada pembantu AI dan menuai data peribadi walaupun mereka sedang tidur. Inilah cara mengetahui apa yang anda kongsi. Jul 05, 2025 am 01:12 AM

Suka atau tidak, kecerdasan buatan telah menjadi sebahagian daripada kehidupan seharian. Banyak peranti-termasuk pisau cukur elektrik dan berus gigi-telah menjadi berkuasa AI, "menggunakan algoritma pembelajaran mesin untuk mengesan bagaimana seseorang menggunakan peranti, bagaimana devi

Taufan dan Badai Sandstorms boleh diramalkan 5,000 kali lebih cepat terima kasih kepada model Microsoft AI baru Taufan dan Badai Sandstorms boleh diramalkan 5,000 kali lebih cepat terima kasih kepada model Microsoft AI baru Jul 05, 2025 am 12:44 AM

Model kecerdasan buatan baru (AI) telah menunjukkan keupayaan untuk meramalkan peristiwa cuaca utama dengan lebih cepat dan dengan ketepatan yang lebih besar daripada beberapa sistem ramalan global yang paling banyak digunakan. Model ini, bernama Aurora, telah dilatih U

Model AI Lanjutan menjana sehingga 50 kali lebih banyak CO ₂ pelepasan daripada LLM yang lebih biasa ketika menjawab soalan yang sama Model AI Lanjutan menjana sehingga 50 kali lebih banyak CO ₂ pelepasan daripada LLM yang lebih biasa ketika menjawab soalan yang sama Jul 06, 2025 am 12:37 AM

Semakin tepatnya kita cuba membuat fungsi model AI, semakin besar pelepasan karbon mereka menjadi - dengan petunjuk tertentu menjana sehingga 50 kali lebih banyak karbon dioksida daripada yang lain, menurut kajian baru -baru ini. Model -model yang berlaku seperti Claude Antropik

Mengancam chatbot AI dan ia akan berbohong, menipu dan 'membiarkan anda mati' dalam usaha untuk menghentikan anda, belajar memberi amaran Mengancam chatbot AI dan ia akan berbohong, menipu dan 'membiarkan anda mati' dalam usaha untuk menghentikan anda, belajar memberi amaran Jul 04, 2025 am 12:40 AM

Model kecerdasan buatan (AI) boleh mengancam dan memeras ugut manusia apabila terdapat konflik antara objektif model dan keputusan pengguna, menurut satu kajian baru. Diterbitkan pada 20 Jun, penyelidikan yang dijalankan oleh firma AI Anthropic memberikan lnya L

Ai 'Hallucinates' sentiasa, tetapi ada penyelesaian Ai 'Hallucinates' sentiasa, tetapi ada penyelesaian Jul 07, 2025 am 01:26 AM

Kebimbangan utama dengan teknologi besar yang bereksperimen dengan kecerdasan buatan (AI) bukanlah ia mungkin menguasai kemanusiaan. Isu sebenar terletak pada ketidaktepatan model bahasa besar (LLMS) yang berterusan seperti chatgpt AI, Gemini Google, dan

Mengapa AI Halllucinating lebih kerap, dan bagaimana kita boleh menghentikannya? Mengapa AI Halllucinating lebih kerap, dan bagaimana kita boleh menghentikannya? Jul 08, 2025 am 01:44 AM

Kecerdasan buatan yang lebih maju (AI) menjadi, semakin cenderung "halusinasi" dan memberikan maklumat palsu atau tidak tepat. Menurut penyelidikan oleh Openai, model penalaran yang paling baru dan berkuasa-O3 dan O4-mini-Exhibited H

See all articles