Uma nova startup chamada Prime Intellect está treinando um grande modelo de linguagem de IA, o INTELLECT-3, utilizando uma abordagem descentralizada de aprendizagem. A empresa busca criar uma alternativa ao atual duopólio de modelos de inteligência artificial, dividido entre os sistemas fechados dos Estados Unidos e as opções de código aberto da China.
A empresa utiliza um novo tipo de aprendizado por reforço distribuído para refinar seu modelo de IA, com o objetivo de demonstrar uma nova maneira de construir IAs competitivas sem depender das grandes empresas de tecnologia.
Leia mais:
- Como a inteligência artificial do Google já impacta sua vida no Brasil
- Teste revela qual é a melhor IA para responder perguntas sem “inventar”
- 14 perguntas e respostas sobre Inteligência Artificial (IA)
Prime Intellect quer democratizar a IA
Vincent Weisser, CEO da Prime Intellect, afirmou ao Wired que a tecnologia que sua empresa está desenvolvendo tem o potencial de democratizar a IA, permitindo que mais pessoas construam e modifiquem sistemas avançados por conta própria.
Segundo ele, o aprimoramento dos modelos de IA não depende mais apenas do aumento de dados e computação. O gargalo atual estaria nos ambientes de aprendizado por reforço (reinforcement learning), processo que melhora as capacidades dos modelos em tarefas específicas, como matemática ou resolução de quebra-cabeças, após o treinamento inicial.
O que é aprendizado por reforço em IA?
Para entender melhor esse modelo de aprendizagem de IA, imagine que você está ensinando um cachorro a fazer um truque, como “sentar”. Você não mostra a ele um manual de instruções. Em vez disso, o processo é o seguinte:
- O cachorro tenta fazer algo (uma ação).
- Se ele senta, você dá a ele um petisco (uma recompensa positiva).
- Se ele late ou deita, você não dá nada ou diz “não” (uma recompensa negativa ou ausência de recompensa).
Com o tempo, através de tentativa e erro, o cachorro aprende que a ação “sentar” leva à melhor recompensa (o petisco). Ele desenvolve uma estratégia para maximizar o número de petiscos que recebe. O aprendizado por reforço em inteligência artificial funciona exatamente da mesma maneira.
Um ambiente de aprendizado por reforço personalizado seria a solução
Para resolver essa questão, a Prime Intellect criou uma estrutura que permite a qualquer pessoa desenvolver um ambiente de aprendizado por reforço personalizado. A empresa está combinando os melhores ambientes criados por sua equipe e pela comunidade para treinar o INTELLECT-3.
O Wired relata ter testado um desses ambientes, criado pelo pesquisador Will Brown, para resolver quebra-cabeças do jogo Wordle. Normalmente, o aprendizado por reforço é um processo complexo e realizado a portas fechadas pelas gigantes da tecnologia, mas a iniciativa da Prime Intellect pode permitir que startups criem novos produtos de software e agentes de IA especializados.
A abordagem da empresa já recebeu elogios de especialistas. Conforme o Wired, Andrej Karpathy, ex-chefe da equipe de IA da Tesla, descreveu os ambientes de aprendizado por reforço da Prime Intellect como “um grande esforço e ideia”. Ele incentivou a comunidade de código aberto a adaptar esses ambientes para novas tarefas.
A Prime Intellect já demonstrou a viabilidade de seus métodos distribuídos anteriormente. No final de 2024, a empresa anunciou o INTELLECT-1, um modelo de 10 bilhões de parâmetros e treinado com hardware distribuído. Em março de 2025, revelou o INTELLECT-2, um modelo maior e com capacidades de raciocínio habilitadas por aprendizado por reforço distribuído.
O cenário da IA de código aberto já mudou drasticamente. Após o sucesso inicial do modelo Llama da Meta em 2023, a oferta mais recente da empresa em abril de 2025 foi considerada uma “grande decepção”.
Enquanto isso, modelos chineses ganharam popularidade, começando com a DeepSeek em janeiro de 2025, seguida por outros como o Qwen da Alibaba e o Kimi da Moonshot, que são fáceis de modificar. Weisser, em declaração ao Wired, diz: “É quase como se os EUA estivessem sem opções quando se trata de modelos de fronteira abertos. Essa é uma das coisas que estamos tentando mudar”.
O post Startup quer ser “DeepSeek americana” e democratizar IA com novo modelo apareceu primeiro em Olhar Digital.