A OpenAI chamou atenção do mundo inteiro no final de 2022, com o lançamento do ChatGPT. Passados quase três anos, a startup avançou: a empresa agora aposta em agentes de inteligência artificial que executam tarefas complexas no computador – e por conta própria.
Enquanto o chatbot impressionou usuários rapidamente, o desenvolvimento dos agentes de IA demorou anos, mas está dando resultados. Entenda como essa tecnologia foi desenvolvida.
OpenAI aposta nos agentes há anos
Em 2022, o pesquisador Hunter Lightman foi contratado pela OpenAI. Algum tempo depois, em novembro daquele ano, o ChatGPT foi lançado.
Mas Lightman não fazia parte da equipe por trás do chatbot. Na verdade, ele participava de uma divisão que ensinava os modelos da empresa a resolver competições matemáticas do ensino médio. Hoje, a equipe é conhecida como MathGen e considerada essencial no desenvolvimento dos modelos de raciocínio de IA da OpenAI, a tecnologia que possibilitou a criação dos agentes.
Segundo Lightman ao site TechCrunch, naquela época a tarefa era melhorar o raciocínio matemático dos modelos, algo em que eles não eram nada bons. Até hoje, as ferramentas da desenvolvedora tem falhas, como alucinações (quando inventam respostas sem embasamento) ou dificuldades com tarefas mais complexas. Mesmo assim, elas avançaram significativamente.
Um exemplo disso é que um pesquisador da OpenAI revelou no X que um modelo de IA desenvolvido pela startup alcançou uma pontuação que equivaleria à medalha de ouro na Olimpíada Internacional de Matemática deste ano. A empresa não chegou a entrar na competição e, por isso, não ganhou oficialmente.
A desenvolvera espera que esse desempenho positivo seja aplicado em outras disciplinas e ajude a melhorar os agentes de IA.
Os primeiros modelos de raciocínio da OpenAI
Vamos dar um passo atrás. Os modelos de raciocínio são aqueles que conseguem estruturar uma cadeia de pensamento antes de realizar uma tarefa. Assim, durante o processo, eles conseguem “pensar” em cada etapa logicamente – mais ou menos como os humanos fazem.
Esses modelos são criados a partir de uma técnica de aprendizado por reforço. Nessa técnica, os programadores oferecem feedbacks à IA durante a realização das tarefas, indicando se elas estão corretas ou no que podem melhorar.
Já os agentes de IA são softwares que existem em um certo ambiente online para realizar determinada demanda por conta própria. Eles são alimentados com os modelos de raciocínio, justamente para conseguirem ‘pensar’ nas etapas necessárias para a conclusão da tarefa, sem interferência humana.
É nisso que a OpenAI quer chegar. No final do ano passado, a empresa anunciou o o1, seu primeiro modelo de raciocínio. Hoje, os 21 pesquisadores que participaram dessa invenção são alguns dos mais cobiçados do mercado de tecnologia (e inclusive foram ‘roubados’ por outras empresas, como a Meta).
O o1 foi resultado de anos de pesquisa e desenvolvimento. Em 2023, a empresa tinha dois projetos secretos, o Q* e o Strawberry, que combinavam técnicas de treinamento para chegar aos agentes de IA. As técnicas já existiam, mas foram testadas em combinações até então únicas.
As tentativas permitiram a criação de uma nova abordagem: a cadeia de pensamento, que incentiva as ferramentas de IA a gerarem explicações sobre o que estão fazendo antes de chegarem à reposta final. Isso também ajuda a checar se o processo está correto.
A cadeia de pensamento melhorou o desempenho da tecnologia em desafios matemáticos. Segundo El Kishky, pesquisador da OpenAI, era possível ver o modelo “começando a raciocinar”, o que pavimentou o caminho para a criação dos agentes de IA.
Como escalar essa tecnologia?
De acordo com as fontes consultadas pelo TechCrunch, o foco da OpenAI não era apenas criar os modelos de IA, mas também em como escalonar suas aplicações.
Após o lançamento do Strawberry, em 2023, a empresa criou uma divisão específica para os “Agentes”, focada em como tornar os sistemas de IA capazes de realizar tarefas complexas por conta própria. Essa divisão participou do o1.
Além disso, a startup não estava tão focada em desenvolver produtos em si, mas sim os modelos mais inteligentes possíveis – um tipo de pensamento que não é tão comum no setor de tecnologia.
A decisão se provou acertada: hoje, os agentes de IA são a grande promessa do setor e a OpenAI está na vanguarda.
Leia mais:
- Espionagem? Anthropic bloqueia OpenAI por usar Claude para melhorar ChatGPT
- O que é e o que faz um agente de IA?
- 5 dicas para fazer brainstorming no ChatGPT
Uma IA que faz coisas por você
Como os próprios pesquisadores da OpenAI destacaram, o conceito por trás dos modelos de raciocínio não é um consenso na indústria. Alguns ainda têm ressalvas sobre o que significa para uma IA ‘raciocinar’.
Mesmo assim, os agentes de IA disponíveis no mercado dão conta de ‘raciocínios’ em diversas áreas. A desenvolvedora já tem dois produtos nesse sentido:
- O Codex, um agente de codificação que promete automatizar tarefas de engenharia de software com mais precisão e segurança;
- E o ChatGPT Agent, um agente capaz de conduzir tarefas mais gerais de forma autônoma.
A empresa quer focar em agentes de IA para tarefas subjetivas. Mas agora a OpenAI também tem competição. Google, Anthropic e Perplexity são algumas das companhias que também entraram nessa corrida.
O post Como a OpenAI criou uma IA que faz tarefas por você? apareceu primeiro em Olhar Digital.