A Perplexity foi acusada de indexar e extrair conteúdo até mesmo de páginas que não autorizam esse tipo de varredura, segundo denúncia da Cloudflare. A acusação faz parte de uma pesquisa publicada pela provedora de infraestrutura web na última segunda-feira (04).
“Estamos observando um comportamento de rastreamento furtivo do Perplexity, um mecanismo de busca e resposta com inteligência artificial”, afirmou a Cloudflare. “Embora a Perplexity inicialmente rastreie a partir do agente de usuário declarado, quando recebe um bloqueio de rede, parece ocultar sua identidade de rastreamento na tentativa de burlar as preferências do site”, completou.
- Leia mais: Perplexity Max é o novo plano de assinatura de IA que custa mais de R$ 1 mil; confira os benefícios
A Cloudflare acusa a empresa de realizar web crawling e web scraping — respectivamente, os processos automatizados de indexação de páginas e extração de dados online.
De acordo com a Cloudflare, há “evidências contínuas” de que a Perplexity está modificando seu agente de usuário e alterando seu ASN (Número de Sistema Autônomo) para esconder sua identidade. A atividade foi observada em dezenas de milhares de domínios e milhões de requisições por dia.
“Nós fomos capazes de identificar o crawler usando a combinação de sinais de aprendizagem de máquina e rede”, completou a empresa.
Web crawling e scraping são naturais, mas precisam de autorização
Embora seja esperado que produtos baseados em IA realizem crawling e scraping como parte de seu funcionamento, o problema apontado está no uso de métodos para burlar restrições intencionais dos sites. Segundo a Cloudflare, a Perplexity teria usado navegadores genéricos disfarçados de Chrome no macOS quando seu próprio bot era bloqueado.
Em resposta ao TechCrunch, a Perplexity negou as acusações. A empresa afirmou que os registros apresentados pela Cloudflare não comprovam o acesso a conteúdo protegido e que o bot identificado não pertence a ela.
Atualmente, a Cloudflare trava uma batalha mais ampla contra rastreadores de serviços de IA. Em julho, a empresa lançou ferramentas para que donos de sites bloqueiem o acesso de bots automatizados.
Essa não é a primeira acusação contra a Perplexity: em 2024, veículos como a Wired denunciaram que o buscador estaria plagiando seus conteúdos por meio de scraping não autorizado.
Quer acompanhar mais polêmicas e avanços no mundo da inteligência artificial? Continue no TecMundo e fique por dentro de tudo que envolve tecnologia, privacidade e o futuro da web.