SK Telecom melepaskan LLM berdaulat Korea yang dibina dari awal
Jul 17, 2025 am 11:11 AMDibuat di Korea, dibangunkan dari bawah
Banyak model bahasa tempatan adalah versi yang disesuaikan dengan rangka kerja antarabangsa yang lebih besar. Bukan yang ini. Pasukan SK Telecom mencipta AX 3.1 Lite sepenuhnya secara dalaman, melatihnya pada 1.65 trilion token berbilang bahasa dengan penekanan yang kuat terhadap kandungan bahasa Korea. Projek itu dijalankan di superkomputer Titan SKT, dan setiap peringkat diuruskan oleh syarikat itu, dari Tokenizer ke kesimpulan.
Hasilnya? Sistem yang menyimpan data di dalam negara dan meminimumkan pergantungan kepada teknologi asing.
"Berdasarkan kepakaran pembangunan LLM Korea yang kami telah dibina dengan mantap, kami akan berusaha untuk meningkatkan kemerdekaan ekosistem AI dan menyumbang untuk meningkatkan daya saing AI negara," kata Kim Tae-yoon, Pengurus Model Yayasan di SK Telecom.
Teknologi di belakang model
Tujuh bilion parameter mungkin tidak kelihatan besar pada tahun 2025 piawaian, tetapi itulah niatnya. Model yang lebih kecil memuat lebih cepat, mengambil kuasa yang kurang, dan lebih berpatutan untuk mempersembahkan masalah untuk aplikasi mudah alih, perniagaan kecil, dan makmal penyelidikan.
Untuk mencapai keseimbangan ini, jurutera SKT mengembangkan pengubah 32-lapisan dengan 32 kepala perhatian, saiz tersembunyi 4,096 dimensi, dan panjang konteks 32,768 token. Pendek kata: Ia cekap, cepat, dan berfungsi dengan baik.
Hasilnya mengesahkan ini. Mengenai penanda aras penalaran KMMLU untuk Korea, AX 3.1 Lite menjaringkan 61.7, kira -kira 96% daripada model Lite AX 4.0 yang lebih besar SKT. Pada ujian kecerdasan kebudayaan klik, ia mengatasi rakan sejawatannya yang lebih besar: 71.22 vs 69.97. Dan pada Kobalt-700, penanda aras QA Korea yang lebih luas, ia menjaringkan 27.43, model yang sepadan berkali-kali saiznya.
Ia juga menjana tindak balas menggunakan kira -kira satu token yang lebih sedikit daripada model GPT yang sama untuk arahan Korea. Ini membawa kepada kependaman yang dikurangkan dan hayat bateri mudah alih yang dilanjutkan.
Model ini adalah sumber terbuka, boleh diakses pada GitHub dan memeluk muka, di bawah lesen Apache 2.0.
Sudah digunakan
SK Telecom bukan hanya bereksperimen dengan AX 3.1 lite dalam tetapan makmal. Ia sudah menguasai pembantu suara A.dot syarikat, yang mampu meringkaskan panggilan dalam masa nyata. Pemaju boleh mengintegrasikan teknologi yang sama ke dalam aplikasi terjemahan, alat perkhidmatan pelanggan, atau antara muka sembang luar talian, semuanya tanpa bergantung pada pusat data atau API luaran.
Untuk pelaksanaan berskala besar, SKT juga menawarkan pilihan kontena berasaskan API dan Docker yang boleh digunakan di premis. Ini amat penting untuk bank, hospital, dan agensi awam yang mesti menyimpan maklumat sensitif di sempadan negara.
Strategi ganda: lite dan bersaiz penuh
Pelan SKT mengikuti pendekatan dwi-laluan. Siri Ax 3, seperti 3.1 lite, dibina sepenuhnya dari awal, memberi tumpuan kepada kedaulatan, kekompakan, dan kelajuan. Sebaliknya, siri 4 lebih besar dan dioptimumkan untuk prestasi melalui pretraining yang berterusan.
Ini memberikan organisasi Korea pilihan: Gunakan model Lite yang cepat dan ringan untuk tugas harian atau skala dengan siri Ax 4 yang lebih kuat, semuanya tanpa penyedia beralih.
AX 3.1 Lite bukan versi akhir sama ada. SKT berhasrat untuk melepaskan versi 34 bilion-parameter, juga dibangunkan secara dalaman, menjelang akhir bulan Ogos 2025. Model itu bertujuan untuk meningkatkan penulisan kreatif dan penjanaan kod sambil mengekalkan kecekapan bahasa Korea.
Pergerakan utama Korea Selatan ke arah kemerdekaan AI
Inisiatif SK Telecom adalah sebahagian daripada usaha kebangsaan yang lebih luas. Kerajaan Korea Selatan telah melabur berbilion won untuk membangunkan model AI asasnya sendiri. Kontrak sedang berjalan, dan SKT, bersama pesaing Naver dan Kakao, dijangka bersaing untuknya.
Objektif? Mengurangkan pergantungan kepada API dan model asing dengan mencipta alat yang mencerminkan bahasa Korea -baik secara linguistik dan politik.
Pergerakan ini tidak eksklusif ke Korea. Mistral AI Perancis adalah model latihan secara tempatan menggunakan superkomputer 18,000-GPU. Institut Inovasi Teknologi UAE telah mengeluarkan Falcon 180B dan siri Falcon 3 yang lebih ringan, kedua-duanya sumber terbuka sepenuhnya. Di India, Bharatgpt, dibangunkan dengan bantuan dari Google Cloud, menyokong lebih kurang sedozen bahasa serantau. Arab Saudi membiayai Humain, model bahasa Arab yang disokong oleh dana kekayaan kerajaan kerajaan.
Mesej itu jelas: Sovereign AI tidak lagi hanya kata kunci.
Untuk SKT, AX 3.1 Lite bukan hanya produk lain. Ia adalah satu peristiwa penting, membuktikan bahawa Korea Selatan dapat membangunkan model bahasa yang mampu dan kompetitif secara dalaman, dan mengendalikannya pada peranti yang sudah dibawa oleh orang -orang di dalam kantong mereka.
Atas ialah kandungan terperinci SK Telecom melepaskan LLM berdaulat Korea yang dibina dari awal. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Pelaburan adalah berkembang pesat, tetapi modal sahaja tidak mencukupi. Dengan penilaian yang semakin meningkat dan tersendiri pudar, pelabur dalam dana usaha yang berfokus pada AI mesti membuat keputusan utama: Beli, membina, atau rakan kongsi untuk mendapatkan kelebihan? Inilah cara menilai setiap pilihan dan PR

Mari kita bercakap mengenainya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada liputan lajur Forbes yang berterusan pada AI terkini, termasuk mengenal pasti dan menerangkan pelbagai kerumitan AI yang memberi kesan (lihat pautan di sini). Menuju ke Agi dan

Ingat banjir model Cina sumber terbuka yang mengganggu industri Genai awal tahun ini? Walaupun Deepseek mengambil sebahagian besar tajuk utama, Kimi K1.5 adalah salah satu nama yang terkenal dalam senarai. Dan model itu agak sejuk.

Mari kita bercakap mengenainya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada liputan lajur Forbes yang berterusan pada AI terkini, termasuk mengenal pasti dan menerangkan pelbagai kerumitan AI yang memberi kesan (lihat pautan di sini). Bagi pembaca yang h

Menjelang pertengahan tahun 2025, AI "perlumbaan senjata" dipanaskan, dan Xai dan Anthropic kedua-duanya mengeluarkan model perdana mereka, Grok 4 dan Claude 4. Kedua-dua model ini berada di hujung falsafah reka bentuk dan platform penempatan, namun mereka

Sebagai contoh, jika anda bertanya kepada model soalan seperti: "Apa yang dilakukan oleh orang (x) di (x) syarikat?" Anda mungkin melihat rantaian pemikiran yang kelihatan seperti ini, dengan asumsi sistem tahu bagaimana untuk mendapatkan maklumat yang diperlukan: mencari butiran mengenai CO

Senat mengundi 99-1 pagi Selasa untuk membunuh moratorium selepas kegemparan terakhir dari kumpulan advokasi, penggubal undang-undang dan puluhan ribu rakyat Amerika yang melihatnya sebagai penindasan berbahaya. Mereka tidak diam. Senat mendengarkan.

Ujian klinikal adalah kesesakan besar dalam pembangunan dadah, dan Kim dan Reddy menganggap perisian AI-enabled yang mereka bina di PI Health dapat membantu melakukannya dengan lebih cepat dan lebih murah dengan memperluaskan kumpulan pesakit yang berpotensi yang layak. Tetapi yang
