DeepSeek usa chips chineses e lançamento de nova versão da IA atrasa

As empresas de tecnologia chinesas têm uma importante decisão a tomar: utilizar os chips semicondutores desenvolvidos no próprio país ou voltar para os produtos da Nvidia. Lembrando que a comercialização do modelo H20 para o território chinês foi liberada pelos Estados Unidos.

Pequim pressiona para que a primeira opção seja a escolhida. No entanto, o atraso no lançamento da nova inteligência artificial da chinesa DeepSeek pode acabar incentivando as companhias a preferirem os produtos ocidentais.

Atualização da IA pode ser lançada nas próximas semanas (Imagem: Mojahid Mottakin/Shutterstock)

Chips da Huawei foram usados para treinar modelo R2

De acordo com a Financial Times, o novo modelo do DeepSeek foi treinado usando chips da Huawei. A escolha se deu justamente em função das restrições impostas pela Casa Branca para aquisição dos dispositivos da Nvidia.

Dessa forma, o próprio governo chinês incentivou o uso do processador Ascend para o desenvolvimento do modelo R2. O problema é que a empresa encontrou dificuldades técnicas durante o processo de treinamento da IA.

Empresa trocou chips da Nvidia pelos da Huawei (Imagem: JRdes e Kapi Ng/Shutterstock)

A reportagem não cita quais obstáculos foram esses. De qualquer forma, as autoridades chinesas esperam que os problemas sejam superados e que o lançamento da nova IA ocorra nas próximas semanas. O DeepSeek não se pronunciou oficialmente sobre o assunto.

Leia mais

DeepSeek virou um dos principais concorrentes do ChatGPT, financiado pela Microsoft (Imagem: Koshiro K/Shutterstock)

Lançamento do DeepSeek foi um marco

  • A IA do DeepSeek foi projetada para lidar com tarefas complexas de raciocínio e tem apresentado resultados surpreendentes.
  • O grande diferencial é o baixo custo da tecnologia, o que pode ameaçar a posição dominante dos principais players.
  • Para se ter uma ideia, o modelo chinês foi treinado ao custo de aproximadamente US$ 6 milhões, enquanto ferramentas como o Llama 3.1, da Meta, custaram mais de US$ 60 milhões para serem desenvolvidos.
  • A empresa chinesa adota estratégias como o chamado aprendizado por reforço, que permite que os modelos aprendam por tentativa e erro.
  • Além disso, ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando recursos computacionais.
  • E melhora a capacidade dos modelos de processar dados e identificar padrões complexos.
  • A startup ainda adota um modelo parcialmente aberto, permitindo que pesquisadores acessem seus algoritmos.
  • Isso democratiza o acesso à IA avançada e promove maior colaboração na comunidade global de pesquisa.

O post DeepSeek usa chips chineses e lançamento de nova versão da IA atrasa apareceu primeiro em Olhar Digital.

Related posts

Cupom C&A | 80% off – Agosto 25

Águas-vivas invadem usina nuclear na França e paralisam reatores

Nem a terra do Papai Noel está imune ao calor extremo na Europa