Kebanyakan laman web mempunyai arahan tidak merangkak, yang bertujuan untuk memeriksa aktiviti crawler laman web dengan menentukan bahagian laman web yang mereka dibenarkan merangkak. Contoh yang baik dari arahan no-crawl laman web sedemikian adalah robots.txt, yang dokumen teks dalam direktori akar laman web yang mengandungi senarai peraturan untuk aktiviti crawler laman web.
Sama seperti crawlers Google memerlukan crawler laman web (GoogleBot) untuk membaca halaman web dan kandungan hadir untuk pengguna carian Google, kebingungan juga menggunakan crawler laman webnya (PerplexityBot) untuk mengakses kandungan laman web. Dari sudut pandang etika, semua crawler harus menghormati peraturan robots.txt dan garis panduan lain kerana kebanyakan laman web mempunyai bahagian di mana merangkak tidak dibenarkan. Cloudflare mendakwa bahawa setiap kali PerplexityBot dibentangkan dengan peraturan untuk tidak membenarkan merangkak di laman web, ia menggunakan taktik yang licik untuk mengelakkan peraturan ini dan merangkak laman web dengan kuat.

Cloudflare juga dilaporkan menemui bukti kukuh yang menunjukkan bahawa kebingungan mengubah ejen penggunanya. Ejen pengguna lebih seperti rentetan atau nama yang digunakan oleh laman web untuk meminta laman web dari pelayan web. Oleh itu, apabila ejen pengguna kebingungan disekat daripada mengakses laman web, ia didakwa menyamar sebagai pengguna rawak dengan menggunakan ejen pengguna generik.
Jika anda memeriksa jadual di bawah, anda akan melihat perbezaan ejen pengguna apabila kebingungan menggunakan crawler web rasmi dan apabila ia didakwa menggunakan satu yang tidak diisytiharkan untuk menyamar sebagai pengguna Google Chrome secara rawak pada sistem operasi macOS.

Kebimbangan bahawa syarikat menggunakan kandungan yang tidak dibenarkan untuk melatih model AI mereka terus berkembang. Sebagai contoh, tahun lepas, Reddit memberitahu Microsoft untuk membayar untuk mengikis datanya atau disekat. Penemuan baru -baru ini membakar kebimbangan yang meluas bahawa syarikat -syarikat utama AI secara terbuka komited untuk menjalankan amalan etika, sementara didakwa berlatih sebaliknya.
Gambar ihsan Cloudflare
Atas ialah kandungan terperinci CloudFlare mendedahkan taktik web merangkak yang menipu. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Stock Market GPT
Penyelidikan pelaburan dikuasakan AI untuk keputusan yang lebih bijak

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

The Belkin yang membawa kes untuk Nintendo Switch 2 telah meninggalkan ciri bank kuasa terbina dalam yang saya dikagumi banyak tentang Switch 2 Case Brethren. Tetapi walaupun dalam bentuk yang paling mudah, saya tidak dapat membantu tetapi menjadi peminat. Aksesori suis kelihatan hampir identiti

Beaver yang bersemangat di pasukan web Amazon membalikkan suis pada penyenaraian runcit untuk Asus Rog Xbox Ally Ally yang akan datang sebelum ia dijadualkan dibebaskan. Kami tahu ia berjalan minggu lebih awal kerana dalam masa yang singkat penyenaraian itu

Industri paparan mendorong kadar penyegaran semula ke ekstrem baru yang tidak masuk akal, dan HKC baru sahaja mengambil langkah berani ke hadapan dengan ant eSports ANT257PF, GA pertama di dunia

Apple Music adalah salah satu aplikas

Peranti BICS BICS FLAS 512GB Kioxia, memanfaatkan struktur NAND 3D 120-lapisan dan integrasi array terikat CMOS, kini berada dalam PHA penghantaran sampel

Dalam iOS 26, terjemahan langsung membolehkan komunikasi bebas tangan dengan membenarkan pengguna yang tidak berkongsi bahasa yang sama untuk bercakap secara semulajadi semasa memakai AirPods. Untuk perbualan dengan pengguna bukan udara, iPhone boleh memaparkan transkripsi secara langsung mendatar

Tidak jelas betapa meluasnya masalah ini sebenarnya, tetapi sesetengah pengguna -dan bukan hanya overclockers gila -pasti mengalami masalah di mana CPU AMD gagal dalam fesyen yang luar biasa, menjatuhkan bahagian bawah pakej CPU dan

Musim 3.5 pesaing Marvel akhirnya di sini, dan saya tidak sabar untuk membuang hujung minggu ini mencuba bilah dan memotong jalan saya melalui pasukan musuh. Namun sebelum saya terbawa -bawa, saya akan memastikan persediaan Sony saya bersenjata dengan PS5 Accessori
