Luz Verde: CPU NVIDIA Grace Abre Caminho para Computação com Eficiência Energética para Todo Data Center

As aplicações convencionais obtêm ganhos de 2 vezes em relação ao x86 em desempenho com eficiência energética em microsserviços, análises, simulações e muito mais.
por Ivan Goldwasser

Os resultados chegaram e apontam para uma nova era na computação com eficiência energética.

Em testes de cargas de trabalho reais, a CPU NVIDIA Grace Superchip obteve ganhos de desempenho duas vezes maiores em relação aos processadores x86 com o mesmo envelope de energia nas principais aplicações de CPU de data center. Isso abre um novo conjunto de oportunidades.

Isso significa que os data centers podem lidar com o dobro do tráfego de pico. Eles podem cortar suas contas de energia pela metade. Eles podem colocar mais força nos espaços confinados no edge de suas redes ou qualquer combinação dos itens acima.

Eficiência Energética: Uma Prioridade do Data Center

Os administradores de data center precisam dessas opções para prosperar na era atual de eficiência energética.

A lei de Moore está efetivamente morta. A física não permite mais que os engenheiros coloquem mais transistores no mesmo espaço com a mesma potência.

É por isso que as novas CPUs x86 normalmente oferecem ganhos de menos de 30% em relação às gerações anteriores. É também por isso que um número crescente de data centers tem limite de energia.

Com a ameaça adicional do aquecimento global, os data centers não podem se dar ao luxo de expandir sua potência, mas ainda precisam responder às crescentes demandas por computação.

Procura-se: Mesma Potência, Mais Desempenho

A demanda de computação está crescendo 10% ao ano nos EUA e dobrará nos oito anos entre 2022 a 2030, de acordo com um estudo da McKinsey.

“A pressão para tornar os data centers sustentáveis é, portanto, alta, e alguns reguladores e governos estão impondo padrões de sustentabilidade aos data centers recém-construídos”, afirmou.

Com o fim da lei de Moore, o progresso do data center na eficiência da computação estagnou, de acordo com uma pesquisa citada pela McKinsey (veja o gráfico abaixo).

Power efficiency gains have stalled in data centers, McKinsey said.

No ambiente atual, os ganhos dobrados oferecidos pela NVIDIA Grace são o equivalente impressionante de um salto multigeracional. Ele atende aos requisitos dos atuais executivos de data center.

Zac Smith, chefe de infraestrutura no edge da Equinix, um provedor de serviços global que gerencia mais de 240 data centers, articulou essas necessidades em um artigo sobre computação com eficiência energética.

“O desempenho que você obtém pelo impacto de carbono que você tem é o que precisamos buscar”, disse ele.

“Temos 10.000 clientes que contam conosco para ajudar nessa jornada. Eles exigem mais dados e mais inteligência, muitas vezes com IA, e querem isso de forma sustentável”, acrescentou.

Um Trio de Inovações de CPU

A CPU Grace oferece esse desempenho eficiente graças a três inovações.

Ela usa uma malha ultrarrápida para conectar 72 núcleos Arm Neoverse V2 em uma única matriz que ostenta 3,2 terabytes por segundo na largura de banda da bisseção da malha, uma medida padrão de taxa de transferência. Em seguida, ela conecta duas dessas matrizes em um pacote de superchip com a interconexão NVIDIA NVLink-C2C, fornecendo 900 GB/s de largura de banda.

Por fim, é a primeira CPU de data center a usar memória LPDDR5X de classe de servidor. Isso fornece até 50% mais largura de banda de memória a um custo semelhante, mas um oitavo do poder da memória de servidor típica. E seu tamanho compacto permite dobrar a densidade de designs típicos de memória baseada em cartão.

Em comparação com as atuais CPUs x86, a NVIDIA Grace tem um design mais simples que oferece mais largura de banda e consome menos energia.

Os Primeiros Resultados

Os engenheiros da NVIDIA estão executando cargas de trabalho de data center reais na Grace hoje.

Eles descobriram que, em comparação com as principais CPUs x86 em data centers que usam o mesmo consumo de energia, a Grace é:

  • 2,3 vezes mais rápida para microsserviços,
  • 2 vezes mais rápida no processamento de dados com uso intensivo de memória
  • e 1,9 vezes mais rápida em dinâmica de fluidos computacional, usado em muitas aplicações de computação técnica.

Os data centers geralmente precisam esperar duas ou mais gerações de CPU para obter esses benefícios, resumidos no gráfico abaixo.

Os ganhos líquidos (em verde claro) são o produto de avanços de servidor para servidor (em verde escuro) e servidores Grace adicionais que se encaixam no mesmo envelope de energia x86 (barra do meio).

Mesmo antes desses resultados em CPUs funcionais, os usuários responderam às inovações da Grace.

O Laboratório Nacional de Los Alamos anunciou em maio que usará a Grace no Venado, um supercomputador de IA de 10 exaflops que avançará o trabalho do laboratório em áreas como ciência de materiais e energia renovável. Enquanto isso, data centers na Europa e na Ásia estão avaliando a Grace para suas cargas de trabalho.

A NVIDIA Grace está sendo testada agora. ASUS, Atos, GIGABYTE, Hewlett Packard Enterprise, QCT, Supermicro, Wistron e ZT Systems estão construindo servidores que a utilizam.

Aprofunde-se na Computação Sustentável

Para mergulhar nos detalhes, leia este whitepaper sobre a arquitetura Grace.

Saiba mais sobre computação sustentável nesta sessão no NVIDIA GTC (20 a 23 de março, gratuito com registro): Three Strategies to Maximize Your Organization’s Sustainability and Success in an End-to-End AI World.

Leia um whitepaper sobre a DPU NVIDIA BlueField para descobrir como construir redes energeticamente eficientes.

E assista à apresentação de abertura do GTC do fundador e CEO da NVIDIA, Jensen Huang, para obter uma visão geral.