Mais Sustentável: Nova Geração de Sistemas com Tecnologia NVIDIA Mostra o Caminho a Seguir

por Chintan Patel

Com o fim da lei de Moore, abordagens tradicionais para atender à demanda insaciável por aumento do desempenho de computação exigirão aumentos desproporcionais de custos e energia.

Ao mesmo tempo, a necessidade de desacelerar os efeitos das mudanças climáticas exigirá data centers mais eficientes, que já consomem mais de 200 terawatts-hora de energia a cada ano, ou cerca de 2% do uso de energia do mundo.

Lançada hoje, a nova lista Green500 dos supercomputadores mais eficientes do mundo demonstra a eficiência energética da computação acelerada, que já é usada em todos os 30 principais sistemas da lista. Seu impacto na eficiência energética é impressionante.

Estimamos que os sistemas TOP500 exigem mais de 5 terawatts-hora de energia por ano, ou 750 milhões de dólares em energia, para operar.

Mas isso poderia ser reduzido em mais de 80%, para apenas US$150 milhões, economizando quatro terawatts-hora de energia, se esses sistemas fossem tão eficientes quanto os 30 sistemas mais verdes da lista TOP500.

Ao mesmo tempo, com o mesmo orçamento de energia dos sistemas TOP500 atuais e a eficiência dos 30 principais sistemas, esses supercomputadores poderiam oferecer um desempenho 5 vezes maior que o atual.

Os ganhos de eficiência destacados pelos mais atuais sistemas Green500 são apenas o começo. A NVIDIA está correndo para oferecer melhorias energéticas contínuas em suas CPUs, GPUs, software e portfólio de sistemas.

Estreia da Hopper na Green500

As tecnologias da NVIDIA já impulsionam 23 dos 30 melhores sistemas da lista Green500 mais atual.

Entre os destaques, o Instituto Flatiron, em Nova York, liderou a lista Green500 dos supercomputadores mais eficientes, com um ThinkSystem resfriado por ar desenvolvido pela Lenovo com GPUs NVIDIA Rochester H100.

O supercomputador, apelidado de Henri, produz 65 bilhões de operações de ponto flutuante de precisão dupla por watt, de acordo com a Green500, e será usado para enfrentar problemas em astrofísica computacional, biologia, matemática, neurociência e física quântica.

A GPU NVIDIA H100 Tensor Core, baseada na arquitetura de GPU NVIDIA Hopper, tem um desempenho de AI até 6 vezes maior e um desempenho de HPC até 3 vezes maior que o da GPU A100 da geração anterior. Foi projetada para funcionar com uma eficiência incrível. Sua tecnologia de GPU multi-instância de segunda geração pode dividir a GPU em unidades de computação menores, aumentando significativamente o número de clientes de GPU disponíveis para usuários de data center.

O salão de exposições da conferência SC22 deste ano apresenta novos sistemas que contam com as tecnologias mais atuais da NVIDIA da ASUS, Atos, Dell Technologies, GIGABYTE, Hewlett Packard Enterprise, Lenovo, QCT e Supermicro.

O novo computador mais rápido da lista TOP500, Leonardo, hospedado e gerenciado pelo consórcio sem fins lucrativos Cineca e com a tecnologia de quase 14 mil GPUs NVIDIA A100, garantiu o 4º lugar, além de ser o 13º sistema com maior eficiência energética.

A lista TOP500 mais atual tem o maior número de tecnologias da NVIDIA até hoje.

No total, as tecnologias da NVIDIA impulsionam 361 dos sistemas da lista TOP500, incluindo 90% dos novos sistemas (consulte o gráfico).

O Data Center Acelerado de Última Geração

A NVIDIA também está desenvolvendo novas arquiteturas de computação para oferecer eficiência energética e desempenho ainda maiores ao data center acelerado.

CPU Grace e os Superchips Grace Hopper, anunciados no início deste ano, oferecerão o próximo grande impulso na eficiência energética da plataforma de computação acelerada da NVIDIA. O Superchip de CPU Grace oferece até o dobro do desempenho por watt de uma CPU tradicional, graças à incrível eficiência da CPU Grace e à memória LPDDR5X de baixa potência.

Por exemplo, um data center de HPC de 1 megawatt com 20% da energia alocada para a partição de CPU e 80% para a parte acelerada usando Grace e Grace Hopper pode fazer 1,8 vez mais trabalho com o mesmo orçamento de energia em comparação com um data center baseado em x86 igualmente particionado.

DPUs Impulsionando Ganhos Adicionais de Eficiência

Com Grace e Grace Hopper, a tecnologia de rede da NVIDIA está turbinando a supercomputação nativa do cloud, assim como o aumento do uso de simulações está acelerando a demanda por serviços de supercomputação.

Baseada na DPU BlueField-3 da NVIDIA, a plataforma NVIDIA Quantum-2 InfiniBand oferece desempenho extremo, ampla acessibilidade e forte segurança necessária por provedores de computação em cloud e centros de supercomputação.

O esforço, descrito em um white paper recente, demonstrou como as DPUs podem ser usadas para descarregar e acelerar as funções de rede, segurança, armazenamento ou outras funções de infraestrutura e aplicações de plano de controle, reduzindo o consumo de energia do servidor em até 30%.

A quantidade de economia de energia aumenta à medida que a carga do servidor aumenta e pode facilmente economizar US$5 milhões em custos de eletricidade para um grande data center com 10.000 servidores ao longo de três anos de vida dos servidores, além de economias adicionais em resfriamento, entrega de energia, espaço em rack e custos de capital do servidor.

computação acelerada com DPUs para tarefas de rede, segurança e armazenamento é um dos próximos grandes passos para tornar os data centers mais eficientes em termos de energia.

Faça Mais com Menos

Avanços como esses vêm à medida que o método científico se transforma rapidamente em uma abordagem impulsionada pela análise de dados, AI e simulação baseada em física, tornando os computadores mais eficientes fundamentais para a próxima geração de avanços científicos.

Ao fornecer aos pesquisadores uma plataforma de computação multidisciplinar de alto desempenho otimizada para essa nova abordagem e capaz de oferecer desempenho e eficiência, a NVIDIA oferece aos cientistas um instrumento para fazer importantes descobertas que beneficiarão a todos nós.

Mais Recursos