Startup quer ser “DeepSeek americana” e democratizar IA com novo modelo

Uma nova startup chamada Prime Intellect está treinando um grande modelo de linguagem de IA, o INTELLECT-3, utilizando uma abordagem descentralizada de aprendizagem. A empresa busca criar uma alternativa ao atual duopólio de modelos de inteligência artificial, dividido entre os sistemas fechados dos Estados Unidos e as opções de código aberto da China.

A empresa utiliza um novo tipo de aprendizado por reforço distribuído para refinar seu modelo de IA, com o objetivo de demonstrar uma nova maneira de construir IAs competitivas sem depender das grandes empresas de tecnologia.

Leia mais:

Prime Intellect quer democratizar a IA

Vincent Weisser, CEO da Prime Intellect, afirmou ao Wired que a tecnologia que sua empresa está desenvolvendo tem o potencial de democratizar a IA, permitindo que mais pessoas construam e modifiquem sistemas avançados por conta própria.

Segundo ele, o aprimoramento dos modelos de IA não depende mais apenas do aumento de dados e computação. O gargalo atual estaria nos ambientes de aprendizado por reforço (reinforcement learning), processo que melhora as capacidades dos modelos em tarefas específicas, como matemática ou resolução de quebra-cabeças, após o treinamento inicial.

Treinamento de modelos de linguagem de IA (Imagem: Anggalih Prasetya/Shutterstock)

O que é aprendizado por reforço em IA?

Para entender melhor esse modelo de aprendizagem de IA, imagine que você está ensinando um cachorro a fazer um truque, como “sentar”. Você não mostra a ele um manual de instruções. Em vez disso, o processo é o seguinte:

  1. O cachorro tenta fazer algo (uma ação).
  2. Se ele senta, você dá a ele um petisco (uma recompensa positiva).
  3. Se ele late ou deita, você não dá nada ou diz “não” (uma recompensa negativa ou ausência de recompensa).

Com o tempo, através de tentativa e erro, o cachorro aprende que a ação “sentar” leva à melhor recompensa (o petisco). Ele desenvolve uma estratégia para maximizar o número de petiscos que recebe. O aprendizado por reforço em inteligência artificial funciona exatamente da mesma maneira.

Um ambiente de aprendizado por reforço personalizado seria a solução

Para resolver essa questão, a Prime Intellect criou uma estrutura que permite a qualquer pessoa desenvolver um ambiente de aprendizado por reforço personalizado. A empresa está combinando os melhores ambientes criados por sua equipe e pela comunidade para treinar o INTELLECT-3.

O Wired relata ter testado um desses ambientes, criado pelo pesquisador Will Brown, para resolver quebra-cabeças do jogo Wordle. Normalmente, o aprendizado por reforço é um processo complexo e realizado a portas fechadas pelas gigantes da tecnologia, mas a iniciativa da Prime Intellect pode permitir que startups criem novos produtos de software e agentes de IA especializados.

Aprendizagem de IA (Imagem: WANAN YOSSINGKUM/iStock)

A abordagem da empresa já recebeu elogios de especialistas. Conforme o Wired, Andrej Karpathy, ex-chefe da equipe de IA da Tesla, descreveu os ambientes de aprendizado por reforço da Prime Intellect como “um grande esforço e ideia”. Ele incentivou a comunidade de código aberto a adaptar esses ambientes para novas tarefas.

A Prime Intellect já demonstrou a viabilidade de seus métodos distribuídos anteriormente. No final de 2024, a empresa anunciou o INTELLECT-1, um modelo de 10 bilhões de parâmetros e treinado com hardware distribuído. Em março de 2025, revelou o INTELLECT-2, um modelo maior e com capacidades de raciocínio habilitadas por aprendizado por reforço distribuído.

O cenário da IA de código aberto já mudou drasticamente. Após o sucesso inicial do modelo Llama da Meta em 2023, a oferta mais recente da empresa em abril de 2025 foi considerada uma “grande decepção”.

Enquanto isso, modelos chineses ganharam popularidade, começando com a DeepSeek em janeiro de 2025, seguida por outros como o Qwen da Alibaba e o Kimi da Moonshot, que são fáceis de modificar. Weisser, em declaração ao Wired, diz: “É quase como se os EUA estivessem sem opções quando se trata de modelos de fronteira abertos. Essa é uma das coisas que estamos tentando mudar”.

O post Startup quer ser “DeepSeek americana” e democratizar IA com novo modelo apareceu primeiro em Olhar Digital.

Related posts

OpenAI quer ChatGPT sem viés político ’em nenhuma direção’

Review: Pokémon Legends Z-A é o palco perfeito para rinhas de Pokémon

Home office: 53 vagas para trabalho remoto internacional [14/10]