Durante a conferência AI Infra Summit, a Nvidia anunciou seu novo acelerador de IA para criação de vídeos, softwares e codificação. Chamada de Rubin CPX, a tecnologia é desenvolvida com objetivo de trabalhar com linguagens de IA massivas e acompanha incríveis 128 GB de memória.
Esse chip será fabricado com a tecnologia Rubin, que sucede os atuais aceleradores Blackwell da Nvidia. A ideia da fabricante é trabalhar com tecnologias ainda mais sofisticadas, já que otimizou essa GPU para processar sequências longas com maior eficiência energética.
O modelo será usado em casos de inferência de alto valor, como desenvolvimento de aplicativos e geração de vídeo artificial. Esse novo chip será integrado com várias etapas de processamento em uma arquitetura mais desagregada, e por mais que mire a inferência de “Super IAs”, será considerado um produto relativamente barato.

A própria Nvidia aponta que o investimento de US$ 100 milhões (R$ 541 milhões) nesse tipo de equipamento poderia fazer com que as empresas obtivessem uma receita de US$ 5 bilhões (R$ 27 bilhões), e estabelecer um novo padrão na indústria.
Quais as características técnicas da Rubin CPX?
Um dos grandes destaques da Rubin CPX é a quantidade de memória inserida no chip. Serão 128 GB de memória VRAM no novo protocolo GDDR7, algo já esperado, mas que consegue gerar uma alta largura de banda e não é tão cara quando memórias HBM usadas geralmente nessas plataformas.
- O chip Rubin CPX possui 30 petaFLOPS de computação NVFP4;
- A tecnologia estará disponível nos racks de servidores Nvidia Vera Rubin NVL144 CPX;
- Esse hack tem 144 GPUs Rubin CPX, 144 GPUs Rubin e 36 CPUs Vera, com um total de oito exaFLOPS de potência teórica;
- Todo o sistema oferece ainda 100 TB de memória VRAM e largura de banda na casa dos 1,7 petabytes;
- A soma dos recursos chega a ser quase oito vezes mais rápida do que a Blackwell Ultra, atual plataforma mais veloz da empresa.
A plataforma Vera Rubin terá opções com e sem a tecnologia CPX, mas que reduz o poder teórico para 3,5 exaFLOPS. Essas tecnologias serão lançadas para grandes empresas somente a partir do fim de 2026.
Para mais informações sobre servidores, data centers e outras tecnologias disruptivas, fique de olho no site do TecMundo.