Pada akhir tahun 2024, Peguam Negara Texas Ken Paxton mendedahkan penyelesaian mercu tanda dengan Pieces Technologies, sebuah permulaan berteknologi kesihatan yang berpangkalan di Dallas yang telah mempromosikan pembantu klinikal yang berkuasa AI sebagai hampir tanpa kesilapan yang menyalahkan "kadar halusinasi yang teruk" di bawah satu dalam 100,000.
Walau bagaimanapun, siasatan oleh kerajaan mendapati tuntutan syarikat itu tidak disokong oleh bukti kukuh. Pihak berkuasa memutuskan bahawa kepingan telah menyesatkan hospital -hospital untuk mempercayai alat itu dapat meringkaskan rekod pesakit dengan tepat dengan kebolehpercayaan yang sebenarnya tidak disampaikan.
Walaupun tiada pesakit yang cedera dan tiada penalti yang dikenakan, kepingan-kepingan yang bersetuju untuk mendapatkan pendedahan yang lebih jelas mengenai ketepatan, risiko, dan penggunaan yang betul-preseden undang-undang yang signifikan menunjukkan bahawa prestasi teoritis tidak sama dengan keberkesanan dunia nyata.
Pakar -pakar seperti saintis kognitif dan pengkritik AI, Gary Marcus telah lama memberi amaran bahawa model bahasa besar semasa dikekang. Seperti yang dikatakannya, sistem ini adalah "perkiraan penggunaan bahasa" , bukan pemahaman bahasa yang benar-perbezaan penting yang menjadi sangat berisiko apabila model tujuan umum digunakan dalam tetapan yang sangat khusus dan gagal memahami bagaimana kerja sebenar berlaku.
Menurut Gal Steinberg, pengasas bersama dan Ketua Pegawai Eksekutif Twofold Health , akar banyak kekurangan AI bukan algoritma yang cacat. Ini kekurangan konteks. "Kerana 'model' hanya mengesan corak, bukan niat," jelasnya. "AI boleh meramalkan kata -kata atau klik dengan ketepatan yang tinggi, namun tetap buta terhadap peraturan, aliran kerja, dan peraturan yang tidak tertulis yang menentukan klinik -atau mana -mana organisasi. Apabila pengoptimuman mengabaikan realiti tersebut, AI memenuhi KPInya tetapi merindui titik."
Konteks: rangka kerja yang tidak kelihatan
Steinberg mentakrifkan konteks sebagai "segala -galanya spreadsheet menghilangkan -objektif, sempadan, jargon, nada emosi, keperluan pematuhan, dan masa."
Apabila sistem AI kurang baik , ia jarang disebabkan oleh kuasa pemprosesan yang tidak mencukupi, tetapi kesedaran keadaan yang tidak mencukupi. Mereka tidak mempunyai pengetahuan budaya, kehalusan khusus domain, atau pemahaman sensitif masa yang profesional manusia menyerap secara semulajadi. Sebagai contoh, 90 saat kesunyian dalam sesi terapi mungkin menandakan kesusahan. Untuk penjana transkrip AI, ia hanya ruang kosong. Dalam audit kewangan, singkatan yang hilang dapat menunjukkan penipuan. Untuk model yang terlatih di teks internet yang luas, ia mungkin kelihatan seperti akronim remeh.
Itulah sebabnya, pada Twofold Health, pasukan bermula dengan meminta tiga soalan asas: siapa yang terlibat? Apa yang mereka cuba capai? Dan apakah akibatnya jika AI mendapat salah?
Satu lagi isu utama, Steinberg menekankan, adalah bahawa kebanyakan organisasi merawat konteks sebagai tugas persediaan sekali. Tetapi persekitaran berkembang. Polisi beralih. Memerlukan transformasi. "Jika anda tidak terus memperbaiki arahan anda dan melatih semula model anda, AI hanyut," katanya.
Inilah sebabnya mengapa begitu banyak inisiatif AI awal sekarang duduk ditinggalkan. Rand Corporation melaporkan bahawa lebih daripada 80% projek AI gagal atau gerai -bukan kerana teknologi tidak berfungsi, tetapi kerana konteks di mana mereka dilatih tidak lagi mencerminkan realiti operasi. Hasilnya? AI yang kelihatan betul di atas kertas tetapi gagal dalam amalan -seperti pelakon membaca garis pada peringkat yang salah.
Kejuruteraan Perisikan Dunia Sebenar
Pembetulan, Steinberg berhujah, bukan hanya membina model yang lebih bijak, tetapi membenamkannya dengan kesedaran alam sekitar yang lebih mendalam. "Ia bermula dengan melibatkan pakar -pakar domain secara langsung dalam proses pembangunan AI. Pada dua kali ganda, para doktor -bukan jurutera -membentangkan bahagian kritikal kerja, mereka mengajar AI mengenai bahasa perubatan, sempadan etika, dan rangka kerja pengawalseliaan melalui pengalaman hidup," katanya.
Kemudian ada buruh yang tidak diingini, yang jarang membuat tajuk utama: menentukan kes -kes yang jarang berlaku, menyeragamkan ucapan tidak formal, atau menyedari bahawa susun atur bentuk boleh menjadi lebih penting daripada data yang terkandung di dalamnya. Pilihan -pilihan ini mungkin kelihatan kecil -sehingga mereka melangkah ke dalam kesilapan sistemik.
Kajian terdahulu telah menunjukkan bahawa model AI yang dilatih pada dataset yang luas sering berkelakuan tidak dapat diramal apabila diletakkan dalam persekitaran khusus -cabaran yang dikenali sebagai peralihan domain . Dalam kajian yang terkenal, saintis dari Google dan Stanford mendapati bahawa model pembelajaran mesin moden sering "tidak ditentukan", yang bermaksud mereka lulus ujian dalaman tetapi memecah di bawah keadaan dunia nyata.
Dalam bidang yang tinggi seperti penjagaan kesihatan dan kewangan, di mana keputusan membawa tanggungjawab undang-undang, walaupun ketidaktepatan kecil tidak dapat diterima. Jurang itu adalah tuntutan undang -undang dalam pembuatan.
Malah ketua saintis AI Meta, Yann Lecun, secara terbuka mengkritik tergesa -gesa untuk menggunakan model besar -besaran tanpa mendasari mereka dalam domain sebenar. Bercakap di Universiti Nasional Singapura pada bulan April 2025, Lecun mencabar andaian yang meluas bahawa model yang lebih besar sama dengan AI yang lebih pintar : "Anda tidak boleh mengambil lebih banyak data dan lebih banyak kuasa pengkomputeran secara automatik membawa kepada sistem yang lebih pintar."
Beliau menegaskan bahawa semasa berskala membantu dengan tugas -tugas asas, ia tidak menyelesaikan kerumitan kehidupan sebenar -kebiasaan, penyesuaian, dan penalaran. Sebaliknya, beliau menyeru "sistem AI yang mampu merancang, memikirkan, dan memahami persekitaran cara manusia."
Namun, menurut Indeks Kesediaan AI 2024 Cisco, 98% pemimpin perniagaan melaporkan peningkatan tekanan untuk mengadopsi AI -sering tanpa metrik, pengawasan, atau struktur akauntabiliti yang jelas. Dalam iklim sedemikian, tidak menghairankan bahawa konteks menjadi satu peringatan.
Itulah bahaya Steinberg mahu menyerlahkan: bukan hanya AI yang mungkin menghasilkan maklumat palsu, tetapi tidak ada seorang pun dalam organisasi yang bersedia untuk mengambil tanggungjawab apabila ia berlaku. "Kami memberi tumpuan terlalu banyak pada ketepatan dan terlalu sedikit pemilikan," katanya. "Konteks bukan hanya mengetahui jawapan yang betul -ia mengetahui siapa yang menjawab kerosakan apabila jawapannya salah.
Menambat AI dalam realiti
Konteks tidak dicipta dengan menambah lebih banyak parameter atau kuasa GPU. Ia datang dari merawat AI sebagai sistem dinamik yang memerlukan bimbingan manusia yang berterusan -bukan hanya latihan awal. Dan ia datang dari meletakkan orang -bukan hanya meminta -ke dalam gelung maklum balas.
AI tidak semestinya cacat. Tetapi tanpa konteks, ia bertindak seolah -olah ia. Jawapannya bukan kepercayaan buta. Ia adalah makanan yang lebih baik, pemantauan biasa, dan memastikan selalu ada seseorang yang menonton ketika AI tumbuh terlalu yakin.
"Kerana model yang mencecah sasarannya tetapi merindui tujuannya bukan hanya membazir, ia berbahaya," kata Steinberg.
Atas ialah kandungan terperinci Kebuluran konteks, AI gagal di mana ia paling penting. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Pelaburan adalah berkembang pesat, tetapi modal sahaja tidak mencukupi. Dengan penilaian yang semakin meningkat dan tersendiri pudar, pelabur dalam dana usaha yang berfokus pada AI mesti membuat keputusan utama: Beli, membina, atau rakan kongsi untuk mendapatkan kelebihan? Inilah cara menilai setiap pilihan dan PR

Mari kita bercakap mengenainya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada liputan lajur Forbes yang berterusan pada AI terkini, termasuk mengenal pasti dan menerangkan pelbagai kerumitan AI yang memberi kesan (lihat pautan di sini). Menuju ke Agi dan

Ingat banjir model Cina sumber terbuka yang mengganggu industri Genai awal tahun ini? Walaupun Deepseek mengambil sebahagian besar tajuk utama, Kimi K1.5 adalah salah satu nama yang terkenal dalam senarai. Dan model itu agak sejuk.

Mari kita bercakap mengenainya. Analisis terobosan AI yang inovatif ini adalah sebahagian daripada liputan lajur Forbes yang berterusan pada AI terkini, termasuk mengenal pasti dan menerangkan pelbagai kerumitan AI yang memberi kesan (lihat pautan di sini). Bagi pembaca yang h

Menjelang pertengahan tahun 2025, AI "perlumbaan senjata" dipanaskan, dan Xai dan Anthropic kedua-duanya mengeluarkan model perdana mereka, Grok 4 dan Claude 4. Kedua-dua model ini berada di hujung falsafah reka bentuk dan platform penempatan, namun mereka

Sebagai contoh, jika anda bertanya kepada model soalan seperti: "Apa yang dilakukan oleh orang (x) di (x) syarikat?" Anda mungkin melihat rantaian pemikiran yang kelihatan seperti ini, dengan asumsi sistem tahu bagaimana untuk mendapatkan maklumat yang diperlukan: mencari butiran mengenai CO

Ujian klinikal adalah kesesakan besar dalam pembangunan dadah, dan Kim dan Reddy menganggap perisian AI-enabled yang mereka bina di PI Health dapat membantu melakukannya dengan lebih cepat dan lebih murah dengan memperluaskan kumpulan pesakit yang berpotensi yang layak. Tetapi yang

Senat mengundi 99-1 pagi Selasa untuk membunuh moratorium selepas kegemparan terakhir dari kumpulan advokasi, penggubal undang-undang dan puluhan ribu rakyat Amerika yang melihatnya sebagai penindasan berbahaya. Mereka tidak diam. Senat mendengarkan.
