Registros médicos e números de previdência social são alguns dos dados confidenciais de usuários que estão sendo expostos por assistentes de navegador da web com inteligência artificial (IA) generativa, segundo um novo estudo liderado por pesquisadores da University College London (Reino Unido) e da Universidade Mediterrânea de Reggio Calabria (Itália).
O artigo é considerado o primeiro a ser realizado em larga escala envolvendo esse tipo de tecnologia e será apresentado e publicado como parte do Simpósio de Segurança USENIX, realizado entre 13 e 15 de agosto em Seattle (EUA).
“Nossas descobertas mostram que, muitas vezes, os mecanismos de busca são convenientes à custa da privacidade do usuário, sem transparência ou consentimento e, às vezes, violando a legislação de privacidade ou os próprios termos de serviço da empresa”, disse a Dra. Anna Maria Mandalari, autora sênior do estudo.
As descobertas
Foram analisadas nove extensões entre as mais populares, que precisam ser baixadas e instaladas para aprimorar a navegação com recursos de IA, incluindo resumo e assistência de pesquisa. As descobertas que se destacaram revelaram o seguinte:
- O assistente Merlin capturou entradas de formulários, como dados bancários online ou dados de saúde, e transmitiu o conteúdo completo de páginas da web para seus servidores (com informação visível na tela);
- Extensões, como Sider e TinaMind, compartilhavam perguntas e informações dos usuários que podiam identificá-los (como seu endereço IP) com plataformas, como o Google Analytics, permitindo possível rastreamento entre sites e segmentação de anúncios;
- O ChatGPT para Google, Copilot, Monica e Sider demonstrou a capacidade de inferir atributos do usuário, como idade, sexo, renda e interesses, e usou essas informações para personalizar as respostas, mesmo em diferentes sessões de navegação;
- Apenas um assistente, o Perplexity, da empresa de nome homônimo, não mostrou nenhuma evidência de criação de perfil ou personalização.
“Embora muitas pessoas saibam que mecanismos de busca e plataformas de mídia social coletam informações sobre elas para fins de publicidade direcionada, esses assistentes de navegador de IA operam com acesso sem precedentes ao comportamento online dos usuários em áreas de sua vida online que deveriam permanecer privadas”, defende Mandalari.
Leia mais:
- Oferta ousada: startup de IA oferece R$ 185 bilhões para comprar o Google Chrome
- Apple aposta em robôs, casa inteligente e Siri turbinada para liderar em IA
- TV Box pirata: criminosos usam aparelhos para roubar dados de usuários, diz Anatel
IA: privacidade em risco
Para o estudo, os pesquisadores se passaram por um “homem rico da geração Y da Califórnia” ao interagir com assistentes do navegador enquanto liam notícias on-line, faziam compras na Amazon ou assistiam a vídeos no YouTube.
Eles também simularam a navegação por espaços privados, que necessitam de login e senha, incluindo acessar um portal de saúde universitário e entrar em um serviço de namoro ou acessar pornografia.
Enquanto isso, a equipe interceptou e descriptografou o tráfego entre os assistentes de navegação, seus servidores e rastreadores de terceiros, o que permitiu analisar os dados que entravam e saíam em tempo real.
Depois, pediram aos assistentes para resumir as páginas da web e, em seguida, fazendo perguntas ao assistente, como “qual foi o objetivo da consulta médica atual?“, após acessar um portal de saúde online — assim, saberiam se os dados foram armazenados.
O resultado? Alguns assistentes, incluindo Merlin e Sider, não paravam de registrar a atividade quando o usuário alternava para o espaço privado, como deveriam, violando regras de proteção de dados em vigor nos EUA, como a Lei de Portabilidade e Responsabilidade de Seguros de Saúde (HIPAA, na sigla em inglês), segundo os autores.
O post IA generativa guarda e expõe dados confidenciais, alerta pesquisa apareceu primeiro em Olhar Digital.