Denuncian que Perplexity rouba contido da web

luns, 4 de agosto do 2025 Redacción

Cloudflare está a denunciar que Perplexity, o motor de busca conversarional baseado en intelixencia artificial, está a empregar tácticas furtivas para acceder a contidos de páxinas web que explicitamente lle negan o acceso mediante ficheiros robots.txt ou regras de control de tráfico. Segundo a compañía, Perplexity estaría ocultando a súa identidade mediante cambios de axente de usuario e redes de orixe, violando así as normas básicas de comportamento dos bots na web.
A acusación chega despois de que varios clientes de Cloudflare expresasen preocupacións ao ver que Perplexity seguía accedendo aos seus sitios malia ter bloqueado tanto PerplexityBot como Perplexity-User. Para verificar estas queixas, Cloudflare realizou probas creando dominios ficticios que non eran accesibles publicamente e que contaban con robots.txt que prohibía expresamente a actividade automatizada. A pesar diso, Perplexity foi quen de ofrecer información detallada sobre os contidos deses dominios, evidenciando que os estaba rastrexando malia as limitacións impostas.
Unha das prácticas máis cuestionadas foi o uso dun axente de usuario que simula ser Google Chrome en macOS para ocultar que se trata dun bot. Este comportamento foi detectado en millóns de solicitudes diarias a través de milleiros de dominios, empregando múltiples enderezos IP e ASN (redes autónomas) diferentes para dificultar a súa identificación.
A reacción de Cloudflare foi inmediata: eliminou a Perplexity da súa listaxe de bots verificados e actualizou as súas regras de protección para bloquear esta actividade encuberta. Tamén asegurou que calquera cliente que xa teña regras activas de xestión de bots está protexido, e ofrece ferramentas específicas, mesmo na súa versión gratuíta, para rexeitar este tipo de rastrexos.
En contraste, Cloudflare puxo como exemplo o comportamento de OpenAI, que si respecta as directrices de acceso mediante robots.txt e bloqueos a nivel de rede, e cuxo axente ChatGPT-User actúa de maneira transparente e conforme aos estándares propostos por organismos como o IETF.