A chinesa DeepSeek está trabalhando no desenvolvimento do que chamou de “próxima geração” dos modelos de inteligência artificial. Enquanto isso não se torna realidade, a startup vai apresentando algumas novidades.
A mais recente é o lançamento de uma versão “intermediária” da tecnologia. Segundo a empresa, o DeepSeek-V3.2-Exp é mais eficiente no processamento de longas sequências de texto do que as ferramentas anteriores.
Passo intermediário, diz startup chinesa
Segundo reportagem da Reuters, o novo modelo inclui um mecanismo chamado DeepSeek Sparse Attention. A empresa chinesa afirma que este recurso possibilita reduzir os custos de computação e aumentar o desempenho da IA.
A startup ainda afirmou que o DeepSeek-V3.2-Exp é “um passo intermediário em direção à arquitetura de próxima geração” que já está sendo desenvolvida. Este será provavelmente o lançamento mais importante da companhia desde que sacudiu o mercado no início deste ano.
Apesar de termos poucas informações disponíveis sobre as verdadeiras capacidades da nova geração de inteligência artificial do DeepSeek, a publicação ressalta que a nova ferramenta vai aumentar a pressão sobre as rivais do setor. Basta observar quais serão as reações da OpenAI, dona do ChatGPT, por exemplo.
Leia mais
- DeepSeek revela quanto gastou para treinar seu modelo de IA
- DeepSeek deve lançar agente de IA até o final do ano
- EUA vs China: DeepSeek tem plano para acelerar na corrida tech
Lançamento do DeepSeek foi um marco
- A IA do DeepSeek foi projetada para lidar com tarefas complexas de raciocínio e tem apresentado resultados surpreendentes.
- O grande diferencial é o baixo custo da tecnologia, o que pode ameaçar a posição dominante dos principais players.
- Para se ter uma ideia, o modelo chinês foi treinado ao custo de aproximadamente US$ 6 milhões, enquanto ferramentas como o Llama 3.1, da Meta, custaram mais de US$ 60 milhões para serem desenvolvidos.
- A empresa chinesa adota estratégias como o chamado aprendizado por reforço, que permite que os modelos aprendam por tentativa e erro.
- Além disso, ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando recursos computacionais.
- E melhora a capacidade dos modelos de processar dados e identificar padrões complexos.
- A startup ainda adota um modelo parcialmente aberto, permitindo que pesquisadores acessem seus algoritmos.
- Isso democratiza o acesso à IA avançada e promove maior colaboração na comunidade global de pesquisa.
O post DeepSeek lança modelo ‘intermediário’ e promete ‘próxima geração’ da IA apareceu primeiro em Olhar Digital.