As empresas de tecnologia chinesas têm uma importante decisão a tomar: utilizar os chips semicondutores desenvolvidos no próprio país ou voltar para os produtos da Nvidia. Lembrando que a comercialização do modelo H20 para o território chinês foi liberada pelos Estados Unidos.
Pequim pressiona para que a primeira opção seja a escolhida. No entanto, o atraso no lançamento da nova inteligência artificial da chinesa DeepSeek pode acabar incentivando as companhias a preferirem os produtos ocidentais.

Chips da Huawei foram usados para treinar modelo R2
De acordo com a Financial Times, o novo modelo do DeepSeek foi treinado usando chips da Huawei. A escolha se deu justamente em função das restrições impostas pela Casa Branca para aquisição dos dispositivos da Nvidia.
Dessa forma, o próprio governo chinês incentivou o uso do processador Ascend para o desenvolvimento do modelo R2. O problema é que a empresa encontrou dificuldades técnicas durante o processo de treinamento da IA.

A reportagem não cita quais obstáculos foram esses. De qualquer forma, as autoridades chinesas esperam que os problemas sejam superados e que o lançamento da nova IA ocorra nas próximas semanas. O DeepSeek não se pronunciou oficialmente sobre o assunto.
Leia mais
- Nova rival da OpenAI lança IA mais barata que a DeepSeek
- DeepSeek: IA é expulsa de lojas de aplicativos na Alemanha
- Novos DeepSeeks? China deve experimentar boom de IAs

Lançamento do DeepSeek foi um marco
- A IA do DeepSeek foi projetada para lidar com tarefas complexas de raciocínio e tem apresentado resultados surpreendentes.
- O grande diferencial é o baixo custo da tecnologia, o que pode ameaçar a posição dominante dos principais players.
- Para se ter uma ideia, o modelo chinês foi treinado ao custo de aproximadamente US$ 6 milhões, enquanto ferramentas como o Llama 3.1, da Meta, custaram mais de US$ 60 milhões para serem desenvolvidos.
- A empresa chinesa adota estratégias como o chamado aprendizado por reforço, que permite que os modelos aprendam por tentativa e erro.
- Além disso, ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando recursos computacionais.
- E melhora a capacidade dos modelos de processar dados e identificar padrões complexos.
- A startup ainda adota um modelo parcialmente aberto, permitindo que pesquisadores acessem seus algoritmos.
- Isso democratiza o acesso à IA avançada e promove maior colaboração na comunidade global de pesquisa.
O post DeepSeek usa chips chineses e lançamento de nova versão da IA atrasa apareceu primeiro em Olhar Digital.