NVIDIA Eos Revelado: Dê Uma Olhada nas Operações de um Supercomputador Top 10

Um modelo para empresas em todo o mundo, o inovador supercomputador DGX AI da NVIDIA foi projetado para impulsionar a próxima fronteira em inovação em IA.
por Charlie Boyle

Dando uma olhada na arquitetura que alimenta as AI factories avançadas, a NVIDIA divulgou na quinta-feira, dia 15 de fevereiro, um vídeo que oferece a primeira visão pública do Eos, seu mais recente supercomputador em escala de data center.

Um NVIDIA DGX SuperPOD de escala extremamente grande, o Eos é onde os desenvolvedores da NVIDIA criam seus avanços de IA usando infraestrutura de computação acelerada e software totalmente otimizado.

O Eos é construído com 576 sistemas NVIDIA DGX H100, rede NVIDIA Quantum-2 InfiniBand e software, fornecendo um total de 18,4 exaflops de desempenho FP8 AI. Este sistema é irmão de um Eos DGX SuperPOD separado com 10.752 GPUs NVIDIA H100, usado para treinamento MLPerf em novembro.

Revelado em novembro na feira Supercomputing 2023, Eos, nome da deusa grega que diz abrir os portões do amanhecer todos os dias, reflete o compromisso da NVIDIA com o avanço da tecnologia de IA.

Supercomputador Eos Impulsiona a Inovação

Cada sistema DGX H100 está equipado com oito GPUs NVIDIA H100 Tensor Core. O Eos possui um total de 4.608 GPUs H100.

Como resultado, o Eos pode lidar com as maiores cargas de trabalho de IA para treinar grandes modelos de linguagem, sistemas de recomendação, simulações quânticas e muito mais.

É uma vitrine do que as tecnologias da NVIDIA podem fazer, quando trabalham em escala.

Eos está chegando no momento perfeito. As pessoas estão mudando o mundo com IA generativa, da descoberta de medicamentos a chatbots, máquinas autônomas e muito mais.

Para alcançar esses avanços, eles precisam de mais do que experiência em IA e habilidades de desenvolvimento. Eles precisam de uma AI factory, um mecanismo de IA construído especificamente que esteja sempre disponível e possa ajudar a aumentar sua capacidade de construir modelos de IA em escala

Eos entrega. Classificado em 9º lugar na lista TOP500 dos supercomputadores mais rápidos do mundo, o Eos ultrapassa os limites da tecnologia e infraestrutura de IA.

Ele inclui a computação acelerada avançada e a rede da NVIDIA, juntamente com ofertas sofisticadas de software, como o NVIDIA Base Command e o NVIDIA AI Enterprise.

A arquitetura da Eos é otimizada para cargas de trabalho de IA que exigem interconectividade de latência ultrabaixa e alta taxa de transferência em um grande cluster de nós de computação acelerados, tornando-a uma solução ideal para empresas que desejam escalar seus recursos de IA.

Baseada na NVIDIA Quantum-2 InfiniBand com tecnologia de computação em rede, sua arquitetura de rede suporta velocidades de transferência de dados de até 400Gb/s, facilitando a rápida movimentação de grandes conjuntos de dados essenciais para o treinamento de modelos complexos de IA.

No coração do Eos está a inovadora arquitetura DGX SuperPOD impulsionada pelos sistemas DGX H100 da NVIDIA.

A arquitetura é construída para fornecer aos campos de IA e computação sistemas full-stack fortemente integrados capazes de computação em uma escala enorme.

À medida que empresas e desenvolvedores em todo o mundo buscam aproveitar o poder da IA, o Eos se destaca como um recurso fundamental, prometendo acelerar a jornada em direção a aplicativos com infusão de IA que impulsionam todas as empresas.