Cloudflare acusa IA Perplexity de acessar sites mesmo sem autorização

A Perplexity foi acusada de indexar e extrair conteúdo até mesmo de páginas que não autorizam esse tipo de varredura, segundo denúncia da Cloudflare. A acusação faz parte de uma pesquisa publicada pela provedora de infraestrutura web na última segunda-feira (04).

“Estamos observando um comportamento de rastreamento furtivo do Perplexity, um mecanismo de busca e resposta com inteligência artificial”, afirmou a Cloudflare. “Embora a Perplexity inicialmente rastreie a partir do agente de usuário declarado, quando recebe um bloqueio de rede, parece ocultar sua identidade de rastreamento na tentativa de burlar as preferências do site”, completou.

A Cloudflare acusa a empresa de realizar web crawling e web scraping — respectivamente, os processos automatizados de indexação de páginas e extração de dados online.

Nos testes, o Cloudflare pediu informações de sites que não deveriam ser captados pelo Perplexity. (Fonte: Cloudflare/Reprodução)

De acordo com a Cloudflare, há “evidências contínuas” de que a Perplexity está modificando seu agente de usuário e alterando seu ASN (Número de Sistema Autônomo) para esconder sua identidade. A atividade foi observada em dezenas de milhares de domínios e milhões de requisições por dia.

“Nós fomos capazes de identificar o crawler usando a combinação de sinais de aprendizagem de máquina e rede”, completou a empresa.

Web crawling e scraping são naturais, mas precisam de autorização

Embora seja esperado que produtos baseados em IA realizem crawling e scraping como parte de seu funcionamento, o problema apontado está no uso de métodos para burlar restrições intencionais dos sites. Segundo a Cloudflare, a Perplexity teria usado navegadores genéricos disfarçados de Chrome no macOS quando seu próprio bot era bloqueado.

Em resposta ao TechCrunch, a Perplexity negou as acusações. A empresa afirmou que os registros apresentados pela Cloudflare não comprovam o acesso a conteúdo protegido e que o bot identificado não pertence a ela.

Atualmente, a Cloudflare trava uma batalha mais ampla contra rastreadores de serviços de IA. Em julho, a empresa lançou ferramentas para que donos de sites bloqueiem o acesso de bots automatizados.

Essa não é a primeira acusação contra a Perplexity: em 2024, veículos como a Wired denunciaram que o buscador estaria plagiando seus conteúdos por meio de scraping não autorizado.

Quer acompanhar mais polêmicas e avanços no mundo da inteligência artificial? Continue no TecMundo e fique por dentro de tudo que envolve tecnologia, privacidade e o futuro da web.

Related posts

Cibercriminosos intensificam ataques no fim de ano com golpes de Natal

Protótipo de ‘carro voador’ de startup da Embraer realiza voo inaugural

Vírus invade sistemas via apps piratas e vídeos do YouTube