Cloudflare facilita pór cancelas aos rastrexadores web dos modelos de IA
martes, 1 de xullo do 2025
Hai preto dun par de semanas Matthew Prince alertaba da ameaza da IA para os medios de comunicación, e agora sabemos que iso era o anticipo de novos servizos da súa compañÃa, Cloudflare, que xa non só protexerá a páxinas web de ataques informáticos, senón que tamén permitirá impedir o rastrexo por parte de rastrexadores que captan información para alimentar modelos de linguaxe roubando contido e reducindo radicalmente o tráfico web.
Matthew Prince publicou hoxe un manifesto no que proclama o DÃa da Independencia do Contido e esixe que non haxa exploración sen compensación por parte dos sistemas de IA.
Lembra que plataformas como Google crearon un modelo de negocio no que se alimentan do contido das páxinas web, pero despois achegan tráfico a esas páxinas, que dese xeito poden comercializar publicidade ou subscricións, pero a IA está a rachar o equilibrio, e agora tanto sistemas como ChatGPT como os propios resultados de Google responden ás nosas dúbidas directamente sen que teñamos que ler o contido das súas páxinas web orixinais e, aÃnda que en moitos casos se acheguen ligazóns para acceder a tal contido, os usuarios non premen nas ligazóns, polo que o tráfico web achegado por buscadores está a precipitarse a unha velocidade alarmante.
Prince di que hoxe é o DÃa da Independencia do Contido, xa que é cando Cloudflare estrea en probas o servizo Pay per crawl, unha solución que permite aos editores de contido o control sobre o mesmo, de xeito que cando detecte un rastrexador permitirá tres comportamentos: permitirlle o acceso de balde aos contidos, requirirlle un pagamento para poder acceder aos contidos ou bloquearlle o acceso completamente.
Cómpre salientar que o apartado económico está totalmente desligado de Cloudflare, ou sexa, que dependerÃa de acordos que poidan pechar os editores coas empresas de IA, e Cloudflare simplemente achega unha tecnoloxÃa efectiva que atende ao desprezo dos rastrexadores de IA aos estándares aceptados na web para limitar o acceso aos contidos en público (como é o ficheiro robots.txt).

- Dende Cloudflare detallan o moito que está a medrar o tráfico web procedente dos rastrexadores de IA
