A CPU NVIDIA Vera ‘Chega com Força Total’ Contra a Concorrência

No novo benchmark da Phoronix, a Vera entrega resultados superiores de desempenho e memória para IA baseada em agentes.
por



No novo benchmark da Phoronix, a Vera apresenta resultados superiores de desempenho e memória para IA agêntica.

A transição para a IA agêntica cria um novo requisito de CPU para a fábrica de IA: núcleos rápidos, enorme largura de banda de memória e a capacidade de manter alto desempenho com todos os núcleos ativos.

Os primeiros resultados de benchmarks publicados hoje pela Phoronix mostram que a CPU NVIDIA Vera atende a essa necessidade. Para este primeiro olhar público, o escopo do benchmark foi centrado nas cargas de trabalho agênticas para as quais a Vera foi projetada no data center moderno.

A CPU Vera entrega o throughput que as fábricas de IA precisam enquanto otimiza a potência da plataforma. Oitenta e oito núcleos NVIDIA Olympus personalizados, 1,2 TB/s de largura de banda de memória e um fabric de alta velocidade integrado no chip resultam em uma plataforma de CPU que combina desempenho de núcleos e largura de banda de memória em um envelope de potência eficiente.

NVIDIA Olympus Oferece Desempenho Agressivo

No coração da Vera estão os núcleos de CPU NVIDIA Olympus personalizados. Totalmente compatíveis com a arquitetura de conjunto de instruções Armv9.2, o Olympus é projetado para o trabalho sequencial de CPU que fundamenta a IA agêntica: runtimes com muitas ramificações, código em sandbox, processamento de dados e orquestração.

O die monolítico da Vera, seus núcleos amplos, a predição avançada de ramificações e o NVIDIA Scalable Coherency Fabric de segunda geração ajudam a Vera a manter o fluxo de dados por todos os 88 núcleos.

Os testes da Phoronix com uma CPU Vera de soquete único — com TDP de 450 watts e menos de 30 watts de potência de memória — mostraram que ela entrega desempenho excepcional dentro desse perfil de potência, além de ganhos geracionais em uma ampla variedade de cargas de trabalho, abrangendo compilação de código, compressão de arquivos, transcodificação de vídeo, Python, Java e gerenciamento de banco de dados.

Essas são exatamente as tarefas com uso intensivo de CPU que agentes e fábricas de IA executam diariamente: compilar código, executar runtimes, comprimir dados, consultar bancos de dados e coordenar grandes pilhas de software.

“Quando comecei, realmente não sabia o que esperar da Vera da NVIDIA com os novos núcleos Olympus”, escreveu Michael Larabel, fundador e autor principal da Phoronix. “Mas no final percebi que esta é a competição mais formidável para os processadores Intel e AMD x86_64 já vista.”

‘Vantagem Incrível’ no Desempenho de Memória

As cargas de trabalho agênticas não são limitadas apenas pela contagem de núcleos. Elas precisam de alta utilização de núcleos e largura de banda de memória sustentada, tornando o desempenho de memória por watt uma parte crítica da eficiência geral da CPU.

A Vera incorpora um subsistema de memória LPDDR5X de segunda geração, permitindo um consumo de energia por bit dramaticamente menor em comparação com DDR5. Isso permite que a Vera ofereça até 1,2 TB/s de largura de banda — até 2x a largura de banda de memória de pico em comparação com CPUs tradicionais, com menos de 30 watts de potência de memória, versus mais de 100 watts para DDR5 tradicional.

Nos testes Phoronix STREAM TRIAD, a Vera sustentou 90% de sua largura de banda de memória de pico — atingindo o maior percentual da largura de banda de pico nominal de qualquer CPU testada pela Phoronix — e entregou mais de 4x a largura de banda de memória por núcleo em comparação com CPUs x86 tradicionais.

“A NVIDIA Vera com sua memória LPDDR5X mostrava sua incrível vantagem no desempenho de memória sobre os atuais processadores Intel Xeon e AMD EPYC”, escreveu Larabel.

No entanto, a largura de banda de pico é apenas parte da história. As cargas de trabalho de fábricas de IA executam muitos sandboxes, chamadas de ferramentas e serviços de dados ao mesmo tempo. Em testes separados com a Vera, a Prime Intellect descobriu que a Vera mantinha alta largura de banda e baixa e consistente latência de memória à medida que mais cargas de trabalho eram executadas em paralelo — o tipo de desempenho previsível necessário para a IA agêntica.

Um Grande Salto Geracional — e Liderança nos Testes da Phoronix

Em comparação com a CPU NVIDIA Grace da geração anterior, a Vera entregou um aumento de 1,6x na média geométrica nos testes da Phoronix — um incrível ganho de geração para geração.

“A diferença do Grace para o Vera superava consistentemente minhas expectativas para o desempenho geracional que normalmente vemos nos processadores”, escreveu Larabel. “A CPU NVIDIA Vera com seus núcleos Olympus projetados internamente acaba desferindo um golpe poderoso com competitividade frente às CPUs Intel/AMD x86_64 que nunca vi em nenhum outro processador ARM ou não x86_64.”

A Vera liderou o campo de CPUs testadas, entregando uma vantagem de desempenho geral de 1,5x em comparação com um processador x86 de 128 núcleos de última geração. Os ganhos apareceram em cargas de trabalho práticas para desenvolvedores. A Vera de soquete único compilou um kernel Linux padrão em apenas 20 segundos, o resultado mais rápido medido pela Phoronix nesse teste. A Vera entregou compilação do kernel Linux 2x mais rápida por núcleo em comparação com um processador de 128 núcleos.

“Em termos de média [geométrica], a NVIDIA Vera entregou 10% melhor desempenho do que o processador AMD EPYC 9575F de 5,0 GHz de alta frequência”, escreveu Larabel.

Vera em Testes com Clientes, Em Breve Disponível dos Parceiros

Na NVIDIA GTC, a NVIDIA anunciou amplo suporte do ecossistema para Vera, abrangendo empresas nativas de IA, centros de supercomputação, provedores de serviços em nuvem e provedores de infraestrutura.

A NVIDIA também entregou as primeiras CPUs Vera para as principais empresas de IA e provedores de nuvem, marcando um marco importante à medida que a Vera avança para a disponibilidade junto aos parceiros no segundo semestre do ano.

A Vera estará disponível dos parceiros em sistemas de soquete duplo e único, com opções de resfriamento a ar e resfriamento a líquido para suportar implantações de fábricas de IA, desde data centers empresariais padrão até infraestrutura de IA agêntica de alta densidade.

Saiba mais sobre NVIDIA Vera.