


Cloudflare expose les tactiques trompeuses d'exploration du Web de Perplexity
Oct 16, 2025 am 11:57 AMLa plupart des sites Web ont des directives de non-exploration, qui visent à mettre en échec les activités des robots d'exploration de sites Web en spécifiant quelle partie d'un site Web ils sont autorisés à explorer. Un bon exemple d'une telle directive de non-exploration d'un site Web est robots.txt, un document texte situé dans le répertoire racine d'un site Web qui contient une liste de règles pour les activités des robots d'exploration de sites Web.
Tout comme les robots d'exploration de Google ont besoin de robots d'exploration de sites Web (Googlebot) pour lire les pages Web et présenter le contenu aux utilisateurs de recherche Google, Perplexity utilise également son robot d'exploration de sites Web (PerplexityBot) pour accéder au contenu du site Web. D'un point de vue éthique, tous les robots d'exploration doivent respecter les réglementations robots.txt et autres directives, car la plupart des sites Web comportent des parties où l'exploration est interdite. Cloudflare allègue que chaque fois que PerplexityBot se voit présenter une règle interdisant l'exploration d'un site Web, il utilise une tactique sournoise pour contourner ces règles et explore le site Web avec force.

Cloudflare aurait également découvert des preuves solides suggérant que Perplexity modifie ses agents utilisateurs. Un agent utilisateur ressemble davantage à une cha?ne ou à un nom qu'un site Web utilise pour demander des pages Web aux serveurs Web. Ainsi, chaque fois que l'agent utilisateur de Perplexity est empêché d'accéder à un site Web, il usurpe l'identité d'un utilisateur aléatoire en utilisant un agent utilisateur générique.
Si vous examinez le tableau ci-dessous, vous verrez la différence entre les agents utilisateurs lorsque Perplexity utilise son robot d'exploration Web officiel et lorsqu'il en utilise un non déclaré pour usurper l'identité d'un utilisateur aléatoire de Google Chrome sur un système d'exploitation macOS.

Les craintes que les entreprises utilisent du contenu non autorisé pour entra?ner leurs modèles d’IA continuent de cro?tre. Par exemple, l’année dernière, Reddit a demandé à Microsoft de payer pour récupérer ses données ou être bloqué. Cette récente découverte alimente l’inquiétude largement répandue selon laquelle les grandes sociétés d’IA s’engagent publiquement à mettre en ?uvre des pratiques éthiques, alors qu’elles pratiqueraient apparemment le contraire.
Images gracieuseté de Cloudflare
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Stock Market GPT
Recherche d'investissement basée sur l'IA pour des décisions plus intelligentes

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le cas de transport de Belkin pour le Nintendo Switch 2 a laissé de c?té la fonctionnalité de banque d'alimentation intégrée que j'ai tellement admirée sur ses frères de cas Switch 2. Mais même dans sa forme la plus simple, je ne peux pas m'empêcher d'être un ventilateur. L'accessoire de commutateur semble presque identique

Un castor impatiente de l'équipe Web d'Amazon a renversé le changement de vente au détail pour le prochain allié ASUS ROG Xbox Allhed des semaines avant qu'il ne soit prévu. Nous savons que cela a été mis en ligne des semaines plus t?t parce que dans le court laps de temps où la liste était

L'industrie de l'affichage pousse les taux de rafra?chissement vers de nouveaux extrêmes ridicules, et HKC vient de faire un pas audacieux avec les Ant Esports ANT257PF, le premier GA du monde

Apple Music est l'une des applications qui a obtenu une refonte de conception de verre liquide notable dans iOS 26, mais Apple a également ajouté une nouvelle fonctionnalité utile qui rationalise les transitions de la chanson.

Les appareils BICS Flash 512 Go de Kioxia, les appareils TLC Flash 512 Go, tirant parti d'une structure NAND 3D à 120 couches et d'une intégration de la matrice de CMOS, sont maintenant dans l'échantillon d'expédition Phas

Dans iOS 26, la traduction en direct permet une communication mains libres en permettant aux utilisateurs qui ne partagent pas la même langue de parler naturellement tout en portant des AirPods. Pour les conversations avec les utilisateurs non AirPods, l'iPhone peut afficher des transcriptions en direct horizontales

Il n'est pas clair à quel point ce problème est réellement répandu, mais certains utilisateurs - et pas seulement des overclockers fous - ont définitivement connu un problème où les processeurs AMD échouent de fa?on spectaculaire, br?lant le bas du package CPU et le

La saison 3.5 de Marvel Rivals est enfin là, et j'ai hate de perdre ce week-end en essayant la lame et en me frayant un chemin à travers l'équipe ennemie. Pourtant, avant de me laisser emporter, je vais m'assurer que ma configuration Sony est armée d'accessoires PS5
