亚洲国产日韩欧美一区二区三区,精品亚洲国产成人av在线,国产99视频精品免视看7,99国产精品久久久久久久成人热,欧美日韩亚洲国产综合乱

Jadual Kandungan
Gambaran Keseluruhan
Jadual Kandungan
Apa masalahnya?
Gunakan kes Openai O1
Hasil ujian yang mengagumkan
Pertandingan Matematik Lanjutan
Kepakaran sains
Pengekodan
Penanda aras lain dan pemahaman visual
Memahami maklumat visual (persepsi penglihatan)
Ujian Pencitraan Perubatan (penanda aras MMMU)
Pelbagai pengetahuan (penanda aras mmlu)
Bertemu O1-Mini
Matematik dengan O1 Mini
Siapa yang boleh menggunakan O1-Preview?
Bagaimana untuk mengakses O1-Preview?
Keselamatan juga penting
Apa yang seterusnya?
Pemikiran terakhir
Rumah Peranti teknologi AI Openai O1: Model baru yang 'berfikir' sebelum menjawab masalah

Openai O1: Model baru yang 'berfikir' sebelum menjawab masalah

Apr 13, 2025 am 09:26 AM

Pernahkah anda mendengar berita besar? OpenAI hanya melancarkan pratonton siri baru model AI - OpenAI O1 (juga dikenali sebagai Projek Strawberry/Q*). Model -model ini istimewa kerana mereka menghabiskan lebih banyak masa "berfikir" sebelum mereka memberi anda jawapan. Ini bermakna mereka lebih baik menangani masalah yang sangat sukar di kawasan seperti sains, pengekodan, dan matematik berbanding dengan model terdahulu, sebahagian besarnya terima kasih kepada parameter Openai O1 yang maju.

Openai mengambil moto "berfikir sebelum anda bercakap" dengan hati dengan siri O1!

Gambaran Keseluruhan

  • Siri model O1 Openai yang baru cemerlang dalam alasan melalui masalah yang sukar dalam matematik, sains, dan pengekodan, mengatasi versi terdahulu.
  • Model O1-Preview menangani tugas-tugas lanjutan, menyelesaikan 93% masalah matematik AIME dan melampaui pakar manusia dalam penanda aras saintifik. Kebanyakan kejayaan ini datang kepada bagaimana parameter Openai O1 yang berkesan ditetapkan untuk mengendalikan tugas -tugas yang kompleks.
  • Openai's O1-Mini menawarkan keupayaan pengekodan yang kuat pada 80% daripada kos, menjadikannya alat yang boleh diakses untuk pemaju.
  • Dengan langkah-langkah keselamatan yang lebih baik, model O1 memastikan penggunaan AI yang bertanggungjawab semasa menyediakan penyelesaian masalah yang dipertingkatkan untuk penyelidik, pemaju, dan pendidik.

Jadual Kandungan

  • Apa masalahnya?
  • Gunakan kes Openai O1
  • Hasil ujian yang mengagumkan
    • Pertandingan Matematik Lanjutan
    • Kepakaran sains
    • Pengekodan
    • Penanda aras lain dan pemahaman visual
  • Bertemu O1-Mini
  • Matematik dengan O1 Mini
  • Siapa yang boleh menggunakan O1-Preview?
  • Bagaimana untuk mengakses O1-Preview?
  • Keselamatan juga penting
  • Apa yang seterusnya?
  • Pemikiran terakhir

Apa masalahnya?

Model O1-Preview dilatih untuk mengambil langkah mundur dan benar-benar berfikir perkara-perkara melalui, seperti manusia ketika menghadapi masalah yang sukar. Mereka menganggap pendekatan yang berbeza, memperbaiki pemikiran mereka, dan juga menangkap kesilapan mereka sendiri di sepanjang jalan. Tahap pemikiran yang lebih mendalam ini membolehkan mereka menyelesaikan masalah yang tidak dapat dikendalikan oleh model -model yang lebih tua.

Gunakan kes Openai O1

Pengekodan dengan Openai O1

Menulis teka -teki dengan Openai O1

Ular HTML dengan Openai O1

Hasil ujian yang mengagumkan

Untuk melihat betapa lebih baik O1 dibandingkan dengan model GPT-4O yang terdahulu, OpenAI meletakkan mereka melalui satu siri ujian sukar, termasuk peperiksaan manusia dan penanda aras pembelajaran mesin. Dan teka apa? O1 mengatasi GPT-4O pada kebanyakan tugas-tugas yang berat!

Mari merosakkan beberapa hasil:

Pertandingan Matematik Lanjutan

Mereka menguji model AIME (Peperiksaan Matematik Undangan Amerika) , yang merupakan peperiksaan matematik yang sangat mencabar untuk pelajar sekolah menengah teratas di AS

  • GPT-4O : Menyelesaikan kira-kira 12% daripada masalah (kira-kira 1.8 daripada 15 soalan).
  • Openai O1 : Diselesaikan 74% dengan hanya satu percubaan setiap masalah (sekitar 11.1 daripada 15). Apabila mereka membiarkan model cuba beberapa kali dan mengambil jawapan yang paling biasa, ia menjaringkan 83% . Menggunakan kaedah yang lebih maju, ia mencapai 93% , menyelesaikan kira -kira 13.9 daripada 15 masalah!

Untuk meletakkan perspektif itu, skor 13.9 akan meletakkan O1 di antara 500 pelajar teratas secara nasional dan di atas potongan untuk Olimpik Matematik Amerika Syarikat . Itu adalah kuasa otak yang serius!

Kepakaran sains

Mereka juga menilai O1 pada GPQA-Diamond , penanda aras yang sukar yang menguji pengetahuan dalam kimia, fizik, dan biologi. Openai juga membawa pakar dengan PhD untuk menjawab soalan -soalan ini.

  • Keputusan : O1 mengatasi pakar -pakar manusia ini, menjadi model AI pertama untuk melakukannya pada penanda aras ini! Ini menunjukkan bahawa O1 dapat menyelesaikan masalah saintifik yang kompleks pada tahap yang sangat tinggi.

Pengekodan

Dalam pertandingan pengekodan seperti Codeforces, model baru mencapai persentil ke -89 , menunjukkan mereka boleh menjana dan debug kod kompleks dengan mudah.

Openai O1: Model baru yang 'berfikir' sebelum menjawab masalah

Penanda aras lain dan pemahaman visual

Tetapi itu bukan semua! Model O1 juga menunjukkan peningkatan yang ketara dalam bidang lain:

Memahami maklumat visual (persepsi penglihatan)

Model O1 kini boleh mentafsir dan memahami imej -keupayaan yang dikenali sebagai persepsi penglihatan . Ini bermakna ia boleh menganalisis data visual dan menjawab soalan mengenainya, yang merupakan langkah besar untuk AI.

Ujian Pencitraan Perubatan (penanda aras MMMU)

OpenAI diuji O1 pada penanda aras yang mencabar yang dipanggil MMMU (yang bermaksud pemahaman mesin perubatan multimodal ). Ujian ini menilai seberapa baik AI dapat memahami imej perubatan dan membuat penilaian yang tepat, sama seperti tugas yang dilakukan oleh profesional perubatan.

Keputusan : O1 menjaringkan 78.2% pada ujian ini, menjadikannya model AI pertama untuk melaksanakan pada tahap yang setanding dengan pakar manusia dalam pengimejan perubatan. Ini sangat besar kerana memahami dan menafsirkan imej perubatan memerlukan pengetahuan dan ketepatan yang mendalam.

Pelbagai pengetahuan (penanda aras mmlu)

Model O1 juga diuji pada penanda aras MMLU (pemahaman bahasa multitask) , yang meliputi 57 subjek yang berbeza dari sejarah dan kesusasteraan kepada matematik dan sains komputer.

Keputusan : O1 mengatasi GPT-4O dalam 54 daripada 57 subjek! Ini menunjukkan bahawa O1 bukan hanya khusus di satu kawasan -ia menunjukkan pemahaman yang lebih baik merentasi spektrum topik yang luas.

Openai O1: Model baru yang 'berfikir' sebelum menjawab masalah

Dalam istilah yang lebih mudah, keupayaan O1 untuk memahami kedua -dua teks dan imej bermakna ia menjadi lebih serba boleh dan mampu. Sama ada ia menganalisis imej perubatan yang kompleks, menyelesaikan masalah matematik lanjutan, atau menjawab soalan di pelbagai subjek, O1 menetapkan piawaian baru untuk apa yang boleh dilakukan AI.

Bertemu O1-Mini

OpenAI juga telah memperkenalkan O1-Mini , versi yang lebih kecil, lebih cepat, dan lebih murah dari model O1-Preview yang sangat baik pada tugas pengekodan. Ia lebih murah 80% , menjadikannya pilihan yang baik untuk pemaju yang memerlukan kebolehan pemikiran yang kuat tanpa melanggar bank.

Kami juga melepaskan Openai O1-Mini, model penalaran kos yang cekap yang cemerlang di STEM, terutamanya matematik dan coding.https: //t.co/wfvczifev

- Openai (@openai) 12 September 2024

Matematik dengan O1 Mini

Juga Baca: Openai's O1-Mini: Model Permainan yang Mengubah Untuk STEM dengan Penalaran Kos yang Berkesan

Siapa yang boleh menggunakan O1-Preview?

Model-model baru ini adalah penukar permainan bagi sesiapa yang menghadapi masalah yang rumit:

  • Penyelidik dan saintis : Mereka boleh membantu menghidupkan data penjujukan sel atau menghasilkan formula kompleks yang diperlukan dalam bidang seperti fizik kuantum.
  • Pemaju : Membina dan melaksanakan aliran kerja pelbagai langkah menjadi lebih mudah dan lebih cekap.
  • Pelajar dan pendidik : Mereka menawarkan cara baru untuk meneroka konsep yang mencabar dalam matematik dan sains.

Bagaimana untuk mengakses O1-Preview?

CHATGPT Plus dan pengguna pasukan : Anda boleh mengakses model O1-Preview dan O1-Mini di CHATGPT bermula hari ini. Hanya pilih mereka dari pemetik model. Terdapat had mesej mingguan untuk sekarang (30 mesej untuk O1-Preview dan 50 untuk O1-Mini), tetapi OpenAI sedang berusaha untuk meningkatkan had ini tidak lama lagi.

Openai O1: Model baru yang 'berfikir' sebelum menjawab masalah

  • CHATGPT Enterprise dan pengguna EDU : Anda akan mendapat akses kepada kedua -dua model bermula minggu depan.
  • Pemaju : Jika anda berada di API Penggunaan Tahap 5, anda boleh mula bereksperimen dengan model -model ini melalui API hari ini. Sesetengah ciri seperti fungsi panggilan dan streaming belum tersedia, tetapi mereka sedang dalam perjalanan.
  • Pengguna Percuma Chatgpt : Berita Hebat! Openai merancang untuk menjadikan O1-mini tersedia untuk semua pengguna percuma tidak lama lagi.

Keselamatan juga penting

Openai juga telah meningkatkan ciri keselamatan dengan model -model ini. Mereka telah dilatih untuk lebih memahami dan mengikuti garis panduan keselamatan dengan memikirkan peraturan semasa perbualan. Ini bermakna mereka kurang cenderung untuk ditipu untuk melakukan sesuatu yang tidak sepatutnya (anda mungkin pernah mendengar model "jailbreaking" AI).

Dalam ujian keselamatan yang sukar, model O1-Preview menjaringkan 84 daripada 100 , berbanding skor GPT-4O sebanyak 22 . Itulah peningkatan yang ketara, menunjukkan mereka lebih baik tinggal di dalam sempadan yang selamat dan sesuai.

Openai bekerjasama rapat dengan organisasi keselamatan di Amerika Syarikat dan UK, mereka bahkan telah memberikan institusi awal kepada model -model ini untuk membantu penyelidikan dan memastikan segala -galanya sampai par.

Apa yang seterusnya?

Ini hanya permulaan. Openai merancang kemas kini dan penambahbaikan secara tetap kepada model -model ini. Mereka ingin menambah ciri -ciri seperti melayari web, memuat naik fail dan imej, dan banyak lagi untuk menjadikannya lebih membantu.

Mereka juga terus membangunkan model dalam siri GPT bersama siri O1 baru ini, jadi banyak yang perlu diingini.

Pemikiran terakhir

Pelancaran model O1-Preview dan O1-Mini adalah masalah besar di dunia AI. Mereka mewakili langkah penting dalam bagaimana AI boleh membuat alasan melalui masalah yang rumit. Dengan prestasi yang lebih baik dan langkah-langkah keselamatan yang lebih baik, model-model ini ditetapkan untuk menjadi penukar permainan bagi ramai orang yang bekerja pada tugas yang mencabar.

Tinggal di Analytics Vidhya Blog untuk mengetahui lebih lanjut mengenai penggunaan O1 dan O1 Mini!

Atas ialah kandungan terperinci Openai O1: Model baru yang 'berfikir' sebelum menjawab masalah. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial PHP
1488
72
Kimi K2: Model agentik sumber terbuka yang paling kuat Kimi K2: Model agentik sumber terbuka yang paling kuat Jul 12, 2025 am 09:16 AM

Ingat banjir model Cina sumber terbuka yang mengganggu industri Genai awal tahun ini? Walaupun Deepseek mengambil sebahagian besar tajuk utama, Kimi K1.5 adalah salah satu nama yang terkenal dalam senarai. Dan model itu agak sejuk.

Grok 4 vs Claude 4: Mana yang lebih baik? Grok 4 vs Claude 4: Mana yang lebih baik? Jul 12, 2025 am 09:37 AM

Menjelang pertengahan tahun 2025, AI "perlumbaan senjata" dipanaskan, dan Xai dan Anthropic kedua-duanya mengeluarkan model perdana mereka, Grok 4 dan Claude 4. Kedua-dua model ini berada di hujung falsafah reka bentuk dan platform penempatan, namun mereka

10 robot humanoid yang menakjubkan sudah berjalan di antara kita hari ini 10 robot humanoid yang menakjubkan sudah berjalan di antara kita hari ini Jul 16, 2025 am 11:12 AM

Tetapi kita mungkin tidak perlu menunggu 10 tahun untuk melihatnya. Malah, apa yang boleh dianggap sebagai gelombang pertama yang benar-benar berguna, mesin seperti manusia sudah ada di sini. Tahun -tahun kebelakangan ini telah melihat beberapa prototaip dan model pengeluaran melangkah keluar dari T

Kejuruteraan Konteks adalah ' baru ' Kejuruteraan segera Kejuruteraan Konteks adalah ' baru ' Kejuruteraan segera Jul 12, 2025 am 09:33 AM

Sehingga tahun sebelumnya, kejuruteraan segera dianggap sebagai kemahiran penting untuk berinteraksi dengan model bahasa yang besar (LLM). Walau bagaimanapun, baru -baru ini, LLM telah maju dengan ketara dalam kebolehan pemikiran dan pemahaman mereka. Sememangnya, jangkaan kami

6 tugas Manus Ai boleh lakukan dalam beberapa minit 6 tugas Manus Ai boleh lakukan dalam beberapa minit Jul 06, 2025 am 09:29 AM

Saya pasti anda mesti tahu mengenai ejen AI umum, Manus. Ia dilancarkan beberapa bulan yang lalu, dan selama bulan -bulan, mereka telah menambah beberapa ciri baru kepada sistem mereka. Sekarang, anda boleh menjana video, membuat laman web, dan melakukan banyak

Bina Jurulatih Kecergasan Langchain: Jurulatih Peribadi AI Anda Bina Jurulatih Kecergasan Langchain: Jurulatih Peribadi AI Anda Jul 05, 2025 am 09:06 AM

Ramai individu memukul gim dengan semangat dan percaya mereka berada di jalan yang betul untuk mencapai matlamat kecergasan mereka. Tetapi hasilnya tidak ada kerana perancangan diet yang tidak baik dan kekurangan arah. Menyewa Jurulatih Peribadi Al

Aplikasi mudah alih Immersity Leia membawa kedalaman 3D ke foto sehari -hari Aplikasi mudah alih Immersity Leia membawa kedalaman 3D ke foto sehari -hari Jul 09, 2025 am 11:17 AM

Dibina di atas enjin kedalaman saraf proprietari Leia, aplikasinya memproses imej dan menambah kedalaman semula jadi bersama -sama dengan gerakan simulasi -seperti kuali, zum, dan kesan paralaks -untuk membuat gulungan video pendek yang memberikan kesan melangkah ke SCE

Model AI ini tidak belajar bahasa, mereka belajar strategi Model AI ini tidak belajar bahasa, mereka belajar strategi Jul 09, 2025 am 11:16 AM

Satu kajian baru dari penyelidik di King's College London dan University of Oxford berkongsi hasil apa yang berlaku ketika Openai, Google dan Anthropic dibuang bersama dalam pertandingan cutthroat berdasarkan dilema banduan berulang. Ini tidak

See all articles