


Pembelajaran Mesin dalam PHP: Bina Pengelas Berita Menggunakan Rubix ML
Nov 03, 2024 am 03:33 AMpengenalan
Pembelajaran mesin ada di mana-mana—mengesyorkan filem, menandai imej dan kini juga mengklasifikasikan artikel berita. Bayangkan jika anda boleh melakukannya dalam PHP! Dengan Rubix ML, anda boleh membawa kuasa pembelajaran mesin kepada PHP dengan cara yang mudah dan boleh diakses. Panduan ini akan membimbing anda membina pengelas berita mudah yang menyusun artikel ke dalam kategori seperti "Sukan" atau "Teknologi." Pada akhirnya, anda akan mempunyai pengelas berfungsi yang boleh meramalkan kategori untuk artikel baharu berdasarkan kandungannya.
Projek ini sesuai untuk pemula yang ingin menyelami pembelajaran mesin menggunakan PHP dan anda boleh mengikuti kod lengkap di GitHub.
Jadual Kandungan
- Apakah itu Rubix ML?
- Menyediakan Projek
- Mencipta Kelas Klasifikasi Berita
- Melatih Model
- Meramalkan Sampel Baharu
- Pemikiran Akhir
Apakah Rubix ML?
Rubix ML ialah perpustakaan pembelajaran mesin untuk PHP yang membawa alatan dan algoritma ML ke dalam persekitaran mesra PHP. Sama ada anda sedang mengusahakan klasifikasi, regresi, pengelompokan atau pemprosesan bahasa semula jadi, Rubix ML telah membantu anda. Ia membolehkan anda memuatkan dan mempraproses data, melatih model dan menilai prestasi—semuanya dalam PHP.
Rubix ML menyokong pelbagai tugas pembelajaran mesin, seperti:
- Klasifikasi: Mengkategorikan data, seperti melabelkan e-mel sebagai spam atau bukan spam.
- Regression: Meramalkan nilai berterusan, seperti harga perumahan.
- Pengumpulan: Mengumpulkan data tanpa label, seperti mencari segmen pelanggan.
- Pemprosesan Bahasa Asli (NLP): Bekerja dengan data teks, seperti token dan mengubahnya menjadi format yang boleh digunakan untuk ML.
Mari kita mendalami cara anda boleh menggunakan Rubix ML untuk membina pengelas berita mudah dalam PHP!
Menyediakan Projek
Kami akan mulakan dengan menyediakan projek PHP baharu dengan Rubix ML dan mengkonfigurasi autoloading.
Langkah 1: Mulakan Direktori Projek
Buat direktori projek baharu dan navigasi ke dalamnya:
mkdir NewsClassifier cd NewsClassifier
Langkah 2: Pasang Rubix ML dengan Komposer
Pastikan anda telah memasang Komposer, kemudian tambah Rubix ML pada projek anda dengan menjalankan:
composer require rubix/ml
Langkah 3: Konfigurasikan Autoloading dalam composer.json
Untuk automuat kelas daripada direktori src projek kami, buka atau cipta fail composer.json dan tambahkan konfigurasi berikut:
{ "autoload": { "psr-4": { "NewsClassifier\": "src/" } }, "require": { "rubix/ml": "^2.5" } }
Ini memberitahu Komposer untuk memuatkan secara automatik mana-mana kelas dalam folder src di bawah ruang nama NewsClassifier.
Langkah 4: Jalankan Dump Autoload Komposer
Selepas menambah konfigurasi autoload, jalankan arahan berikut untuk menjana semula autoloader Komposer:
mkdir NewsClassifier cd NewsClassifier
Langkah 5: Struktur Direktori
Direktori projek anda sepatutnya kelihatan seperti ini:
composer require rubix/ml
- src/: Mengandungi skrip PHP anda.
- storan/: Tempat model terlatih akan disimpan.
- vendor/: Mengandungi kebergantungan yang dipasang oleh Komposer.
Mencipta Kelas Klasifikasi Berita
Dalam src/, buat fail yang dipanggil Classification.php. Fail ini akan mengandungi kaedah untuk melatih model dan meramalkan kategori berita.
{ "autoload": { "psr-4": { "NewsClassifier\": "src/" } }, "require": { "rubix/ml": "^2.5" } }
Kelas Pengelasan ini mengandungi kaedah untuk:
- Latih: Cipta dan latih model berasaskan saluran paip.
- Simpan Model: Simpan model terlatih ke laluan yang ditentukan.
- Ramalkan: Muatkan model yang disimpan dan ramalkan kategori untuk sampel baharu.
Melatih Model
Buat skrip dipanggil train.php dalam src/ untuk melatih model.
composer dump-autoload
Jalankan skrip ini untuk melatih model:
NewsClassifier/ ├── src/ │ ├── Classification.php │ └── train.php ├── storage/ ├── vendor/ ├── composer.json └── composer.lock
Jika berjaya, anda akan melihat:
<?php namespace NewsClassifier; use Rubix\ML\Classifiers\KNearestNeighbors; use Rubix\ML\Datasets\Labeled; use Rubix\ML\Datasets\Unlabeled; use Rubix\ML\PersistentModel; use Rubix\ML\Pipeline; use Rubix\ML\Tokenizers\Word; use Rubix\ML\Transformers\TfIdfTransformer; use Rubix\ML\Transformers\WordCountVectorizer; use Rubix\ML\Persisters\Filesystem; class Classification { private $modelPath; public function __construct($modelPath) { $this->modelPath = $modelPath; } public function train() { // Sample data and corresponding labels $samples = [ ['The team played an amazing game of soccer'], ['The new programming language has been released'], ['The match between the two teams was incredible'], ['The new tech gadget has been launched'], ]; $labels = [ 'sports', 'technology', 'sports', 'technology', ]; // Create a labeled dataset $dataset = new Labeled($samples, $labels); // Set up the pipeline with a text transformer and K-Nearest Neighbors classifier $estimator = new Pipeline([ new WordCountVectorizer(10000, 1, 1, new Word()), new TfIdfTransformer(), ], new KNearestNeighbors(4)); // Train the model $estimator->train($dataset); // Save the model $this->saveModel($estimator); echo "Training completed and model saved.\n"; } private function saveModel($estimator) { $persister = new Filesystem($this->modelPath); $model = new PersistentModel($estimator, $persister); $model->save(); } public function predict(array $samples) { // Load the saved model $persister = new Filesystem($this->modelPath); $model = PersistentModel::load($persister); // Predict categories for new samples $dataset = new Unlabeled($samples); return $model->predict($dataset); } }
Meramalkan Sampel Baharu
Buat skrip lain, predict.php, dalam src/ untuk mengklasifikasikan artikel baharu berdasarkan model terlatih.
<?php require __DIR__ . '/../vendor/autoload.php'; use NewsClassifier\Classification; // Define the model path $modelPath = __DIR__ . '/../storage/model.rbx'; // Initialize the Classification object $classifier = new Classification($modelPath); // Train the model and save it $classifier->train();
Jalankan skrip ramalan untuk mengklasifikasikan sampel:
php src/train.php
Output hendaklah menunjukkan setiap teks sampel dengan kategori ramalannya.
Fikiran Akhir
Dengan panduan ini, anda telah berjaya membina pengelas berita mudah dalam PHP menggunakan Rubix ML! Ini menunjukkan bagaimana PHP boleh menjadi lebih serba boleh daripada yang anda fikirkan, membawa masuk keupayaan pembelajaran mesin untuk tugas seperti klasifikasi teks, sistem pengesyoran dan banyak lagi. Kod penuh untuk projek ini tersedia di GitHub.
Percubaan dengan algoritma atau data yang berbeza untuk mengembangkan pengelas. Siapa tahu PHP boleh melakukan pembelajaran mesin? Sekarang anda melakukannya.
Selamat mengekod!
Atas ialah kandungan terperinci Pembelajaran Mesin dalam PHP: Bina Pengelas Berita Menggunakan Rubix ML. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Masalah dan penyelesaian biasa untuk skop pembolehubah PHP termasuk: 1. Pembolehubah global tidak dapat diakses dalam fungsi, dan ia perlu diluluskan menggunakan kata kunci atau parameter global; 2. Pembolehubah statik diisytiharkan dengan statik, dan ia hanya dimulakan sekali dan nilai dikekalkan antara pelbagai panggilan; 3. Pembolehubah hyperglobal seperti $ _get dan $ _post boleh digunakan secara langsung dalam mana -mana skop, tetapi anda perlu memberi perhatian kepada penapisan yang selamat; 4. Fungsi Anonymous perlu memperkenalkan pembolehubah skop induk melalui kata kunci penggunaan, dan apabila mengubah suai pembolehubah luaran, anda perlu lulus rujukan. Menguasai peraturan ini boleh membantu mengelakkan kesilapan dan meningkatkan kestabilan kod.

Untuk mengendalikan muat naik fail PHP dengan selamat, anda perlu mengesahkan sumber dan jenis, mengawal nama fail dan laluan, menetapkan sekatan pelayan, dan memproses fail media dua kali. 1. Sahkan sumber muat naik untuk mengelakkan CSRF melalui token dan mengesan jenis mime sebenar melalui finfo_file menggunakan kawalan putih; 2. Namakan semula fail ke rentetan rawak dan tentukan pelanjutan untuk menyimpannya dalam direktori bukan web mengikut jenis pengesanan; 3. Konfigurasi PHP mengehadkan saiz muat naik dan direktori sementara Nginx/Apache melarang akses ke direktori muat naik; 4. Perpustakaan GD menyambung semula gambar -gambar untuk membersihkan data yang berpotensi.

Terdapat tiga kaedah umum untuk kod komen PHP: 1. Use // atau # untuk menyekat satu baris kod, dan disyorkan untuk menggunakan //; 2. Gunakan /.../ untuk membungkus blok kod dengan pelbagai baris, yang tidak boleh bersarang tetapi boleh diseberang; 3. Komen -komen kemahiran gabungan seperti menggunakan / jika () {} / untuk mengawal blok logik, atau untuk meningkatkan kecekapan dengan kunci pintasan editor, anda harus memberi perhatian kepada simbol penutupan dan mengelakkan bersarang apabila menggunakannya.

Ageneratorinphpisamemory-efficientwaytoiterateOverlargedatasetsbyieldingvaluesonateatimeNsteadofreturningthemallatonce.1.GeneratorSuseTheyEldeyWorderWorderToProducevaluuesondemand,

Kunci untuk menulis komen PHP adalah untuk menjelaskan tujuan dan spesifikasi. Komen harus menjelaskan "mengapa" dan bukannya "apa yang dilakukan", mengelakkan redundansi atau terlalu kesederhanaan. 1. Gunakan format bersatu, seperti docblock (/*/) untuk deskripsi kelas dan kaedah untuk meningkatkan keserasian dan keserasian alat; 2. Menekankan sebab -sebab di sebalik logik, seperti mengapa JS melompat perlu dikeluarkan secara manual; 3. Tambahkan gambaran keseluruhan gambaran sebelum kod kompleks, terangkan proses dalam langkah -langkah, dan membantu memahami idea keseluruhan; 4. Gunakan Todo dan Fixme secara rasional untuk menandakan item dan masalah untuk memudahkan penjejakan dan kerjasama berikutnya. Anotasi yang baik dapat mengurangkan kos komunikasi dan meningkatkan kecekapan penyelenggaraan kod.

Toinstallphpquickly, usexampponwindowsorhomeBrewonmacos.1.onwindows, downloadandInstallxampp, selectcomponents, startapache, andplaceFilesinhtdocs.2.alternative, secara manualstallphpfromphp.netandsheBerver.3

Dalam PHP, anda boleh menggunakan kurungan persegi atau pendakap keriting untuk mendapatkan aksara indeks spesifik rentetan, tetapi kurungan persegi disyorkan; Indeks bermula dari 0, dan akses di luar julat mengembalikan nilai null dan tidak dapat diberikan nilai; MB_SUBSTR dikehendaki mengendalikan watak multi-bait. Sebagai contoh: $ str = "hello"; echo $ str [0]; output h; dan watak -watak Cina seperti MB_SUBSTR ($ str, 1,1) perlu mendapatkan hasil yang betul; Dalam aplikasi sebenar, panjang rentetan perlu diperiksa sebelum gelung, rentetan dinamik perlu disahkan untuk kesahihan, dan projek berbilang bahasa mengesyorkan menggunakan fungsi keselamatan multi-bait secara seragam.

Tolearnphpeffectively, startbysettingupalocalverenvironmentusingToolsLikexamppandaCodeDitorLikevscode.1) InstallXamppforapa Che, MySql, danPhp.2) UseAcodeeditorForsyntaxSupport.3) testyoursetupwithasimplephpfile.next, learnphpbasicsincludingvariables, ech
