Segundo informações do The New York Times, startups no Vale do Silício estão construindo réplicas quase perfeitas de sites populares, como Amazon e Gmail. O objetivo? Treinar sistemas de inteligência artificial (IA) para navegar na internet de forma autônoma e, eventualmente, assumir funções de trabalhadores de escritório.
Começo dos clones: um alerta da United Airlines
Recentemente, a equipe jurídica da United Airlines identificou um clone digital de seu site. A réplica oferecia as mesmas funcionalidades de reserva de voos, hotéis e carros, além de links para programas de milhagem e ofertas, utilizando até mesmo a marca e o logo da companhia. A United prontamente emitiu um aviso de remoção por violação de direitos autorais.
Div Garg, cuja pequena empresa, AGI, foi responsável pela criação do site, alterou rapidamente o nome para “Fly Unified” e removeu o logo da United. Sua intenção não era infringir direitos autorais, mas, sim, criar um ambiente de treinamento para inteligência artificial.
A AGI é uma das diversas startups no Vale do Silício que, nos últimos meses, têm replicado plataformas conhecidas para que sistemas de IA aprendam a interagir com a web e completar tarefas específicas, como agendamentos e reservas.
Esses “sites-sombra” são cruciais para o avanço dos chatbots atuais em verdadeiros “agentes de IA“. Tais agentes são projetados para realizar tarefas complexas, como reservar viagens, organizar reuniões ou criar gráficos. A expectativa é que, nos próximos anos, esses sistemas se tornem tão sofisticados a ponto de poder substituir certas funções de trabalho intelectual.
“Queremos construir ambientes de treinamento que capturem trabalhos inteiros que as pessoas realizam”, afirmou Robert Farlow ao Times, cuja startup Plato também está recriando sites e softwares.
Implacável busca por dados e o aprendizado por reforço
- Impulsionada por capital de risco, essa nova tendência ilustra a extensão do esforço da indústria de tecnologia em coletar vastas quantidades de dados digitais para aprimorar a IA;
- Inicialmente, o Vale do Silício aspirou textos, sons e imagens de toda a internet. Com o bloqueio de muitos desses esforços, as empresas buscaram novas formas de acessar dados, e a recriação de sites surgiu como uma maneira de gerar dados originais;
- Nos últimos meses, com um financiamento de US$ 10 milhões (R$ 53 milhões, na conversão direta) de investidores, como a Menlo Ventures, a empresa de Garg clonou plataformas, como Amazon, Airbnb e Gmail, renomeando-as para Omnizon, Staynb e Go Mail;
- Essas réplicas permitem que os sistemas de IA aprendam por tentativa e erro – uma técnica conhecida como aprendizado por reforço. Em vez de aprender com dados que mostram como humanos usam sites, a IA gera e aprende com seus próprios dados.
Embora pesquisadores pudessem, teoricamente, treinar IAs em sites reais, isso geralmente é inviável. Plataformas, como Amazon e Airbnb, frequentemente bloqueiam bots, especialmente quando repetem as mesmas tarefas incessantemente, um processo fundamental para o aprendizado por reforço.
“Ao treinar, você quer rodar milhares de agentes de IA simultaneamente, para que explorem o site, visitem suas diferentes páginas e façam todo tipo de coisa”, explicou Garg. “Se você fizer isso em um site real, será bloqueado.”
Os sistemas de IA atuais são impulsionados por redes neurais, que identificam padrões em texto, imagens e sons. Contudo, há cerca de nove meses, empresas, como a OpenAI, praticamente esgotaram o texto em inglês disponível na internet. Isso as levou a depender mais fortemente do aprendizado por reforço.
Esse processo, que pode levar semanas ou meses, começou em áreas, como matemática e programação. Ao resolver milhares de problemas matemáticos, por exemplo, os sistemas de IA aprendem quais ações levam à resposta correta.
Atualmente, empresas, como OpenAI, Google, Amazon e Anthropic, estão empregando essa técnica para construir agentes de IA. Elas começaram usando gravações de pessoas interagindo com sites reais.
Analisando o uso do mouse e teclado para, por exemplo, pedir almoço no DoorDash ou digitar números no Microsoft Excel, os sistemas aprenderam a usar os sites por conta própria. Para acelerar esse trabalho, as empresas de IA estão contratando startups, como AGI e Plato, para criar sites-réplica, onde os bots podem aprender por meio de experimentações intensas.
“Você quer que a IA seja capaz de experimentar todas as maneiras possíveis de completar cada tarefa”, disse John Qian, cuja startup Matrices também constrói réplicas de sites para treinamento de IA.
Leia mais:
- 4 melhores inteligências artificiais para criar e editar vídeos
- 7 aplicativos que usam IA para você testar no dia a dia
- Anthropic avalia abertura de capital em meio ao boom da IA
Implicações legais e o futuro incerto dos agentes de IA
Embora grande parte desse trabalho ocorra nos bastidores, algumas startups têm divulgado seus sites-réplica publicamente para atrair grandes empresas de IA.
Garg afirmou que, após remover nomes e logos de empresas dos sites clonados, não teme ações legais futuras de detentores de direitos autorais, como a United Airlines. Qian expressou um sentimento semelhante, embora reconheça que a pesquisa em IA adentrou um novo território legal ainda não totalmente estabelecido. Farlow, por sua vez, preferiu não comentar.
Robin Feldman, professora da U.C. Law San Francisco e autora do livro “AI Versus IP”, alertou que o uso desses sites-sombra para treinar tecnologias de IA pode violar os direitos autorais de empresas, como a United Airlines. No entanto, os tribunais podem, eventualmente, determinar que tal prática é permitida pela lei de direitos autorais.
“Essas empresas estão agindo primeiro e perguntando depois”, observou Feldman. “O campo está se expandindo muito mais rápido do que o sistema jurídico pode acompanhar. Algumas das decisões tomadas ao longo do caminho acabam prejudicando as empresas que as tomaram.”
Empresas, como OpenAI e Anthropic, já lançaram tecnologias experimentais capazes de fazer compras no Instacart ou tomar notas em processadores de texto online, como o Google Docs.
Contudo, essas tecnologias frequentemente cometem erros, impedindo a conclusão das tarefas solicitadas (vale ressaltar que o Times processou OpenAI e Microsoft, alegando violação de direitos autorais de conteúdo jornalístico relacionado a sistemas de IA. As empresas negaram as acusações).
“Há uma grande lacuna entre o que as empresas querem que esses agentes façam e o que eles são capazes hoje”, afirmou Rayan Krishnan, CEO da Vals AI, empresa que testa o desempenho das mais recentes tecnologias de IA. “Hoje, esses sistemas são lentos demais para serem úteis. Você pode simplesmente fazer os cliques por si mesmo.”
Especialistas divergem sobre a velocidade do progresso, se consumidores e empresas realmente desejam ou precisam desse tipo de automação, e se os sites populares permitirão que isso aconteça. No mês passado, a Amazon processou a startup Perplexity por uma IA que visava automatizar compras em seu site.
Apesar dos desafios, o objetivo final é construir sistemas capazes de automatizar praticamente qualquer trabalho de escritório. “Se você conseguir recriar todo o software e os sites que as pessoas usam, poderá treinar a IA para realizar esses trabalhos e começar a fazê-los até melhor do que um humano”, concluiu Farlow.
O post Vale do Silício clona gigantes da web para treinar automação de tarefas apareceu primeiro em Olhar Digital.