Geração Hopper em Ascensão: GPUs NVIDIA H100 Agora Disponíveis em Várias Nuvens.

NVIDIA e parceiros trazem ofertas baseadas em Hopper ao mercado para atender à crescente demanda pela plataforma de computação mais poderosa do mundo para IA; Meta lança versão inicial do supercomputador H100 para suas equipes de produção e pesquisa de IA.
por Ian Buck

A GPU para IA mais poderosa do mundo, a GPU NVIDIA H100 Tensor Core, agora está disponível em uma variedade de novos produtos e serviços, ajudando a atender à crescente demanda por treinamento e inferência de IA generativa.

O Microsoft Azure e vários outros provedores de nuvem agora oferecem instâncias H100.  Os supercomputadores de IA NVIDIA DGX H100 estão em plena produção e serão lançados em breve para empresas em todo o mundo.

E o Meta lançou para uso interno uma versão inicial de sua plataforma Grand Teton, um supercomputador de IA baseado em H100 anunciado em outubro no OCP Global Summit de 2022. Ainda este ano, a Meta está planejando tornar o Grand Teton uma plataforma de disponibilidade geral para o Open Compute Project (OCP).

Scott Guthrie, vice-presidente executivo do grupo Cloud+AI da Microsoft, disse: “A IA está mudando a forma como cada empresa opera e obtém sucesso à medida que sua adoção continua a acelerar. A arquitetura Hopper da NVIDIA está trazendo desempenho, escala e funcionalidade de computação sem precedentes para um número crescente de empresas que estão inovando com o Microsoft Azure”.

A Arquitetura Hopper Acelera a IA

A H100, baseada na mais recente arquitetura de computação GPU Hopper da NVIDIA com Motores Transformer integrados, é otimizada para desenvolver, treinar e implantar IA generativa, modelos de linguagem grande (LLMs) e sistemas de recomendação. Essa tecnologia faz uso da precisão FP8 da H100 e oferece treinamento de IA 9 vezes mais rápido e inferência de IA até 30 vezes mais rápida em LLMs em comparação com a A100 da geração anterior. A H100 começou a ser comercializada no outono em unidades de placa individuais e selecionadas de fabricantes globais.

A NVIDIA DGX H100 possui oito GPUs H100 conectadas com interconexões de alta velocidade NVIDIA NVLink e rede integrada NVIDIA Quantum InfiniBand e Spectrum Ethernet. Essa plataforma fornece 32 petaflops de desempenho de computação com precisão FP8, com rede 2 vezes mais rápida que a geração DGX A100 anterior, ajudando a maximizar a eficiência energética no processamento de grandes cargas de trabalho de IA.

A DGX H100 também apresenta o pacote completo de software NVIDIA AI, permitindo que as empresas executem e gerenciem perfeitamente suas cargas de trabalho de IA em escala. Esta oferta inclui a versão mais recente do NVIDIA AI Enterprise, anunciado separadamente hoje, bem como o NVIDIA Base Command, o sistema operacional do data center DGX, que coordena o treinamento e as operações de IA na plataforma NVIDIA DGX para simplificar e agilizar o desenvolvimento de IA.

Primeiros Usuários Impulsionando a Inovação da IA em Todo o Mundo

Entre os primeiros a usar GPUs H100 na nuvem está Anlatan, fornecendo uma aplicação de assinatura paga, NovelAI para escrita de histórias assistida por IA e síntese de texto para imagem e um cliente do parceiro de nuvem NVIDIA CoreWeave.

“Estamos totalmente focados na inovação da IA e em produtos que priorizam a IA”, disse o CEO da Anlatan, Eren Doğan. “As GPUs NVIDIA H100 são aceleradoras de machine learning de última geração, dando-nos uma vantagem competitiva significativa na indústria de machine learning para uma ampla variedade de aplicações, desde treinamento até inferência de modelo.”

Entre os líderes da indústria que recebem a primeira onda de sistemas DGX H100 estão:

  • A Mitsui, um dos principais grupos empresariais do Japão, que diversifica e desenvolve uma ampla variedade de negócios em áreas como energia, bem-estar, TI e comunicação, está construindo o primeiro supercomputador de IA generativa do mundo para descoberta de medicamentos, impulsionado por DGX H100.
  • O Laboratório de Física Aplicada da Universidade Johns Hopkins, o maior centro de pesquisa afiliado a uma universidade do país, usará a DGX H100 para treinamento de LLMs.
  • O KTH Royal Institute of Technology, uma universidade técnica e de engenharia líder na Europa com sede em Estocolmo, usará a DGX H100 para fornecer programas de ciência da computação de última geração para o ensino superior.
  • A Telconet, uma provedora líder de telecomunicações no Equador, está desenvolvendo análise de vídeo inteligente para cidades seguras e serviços linguísticos para oferecer suporte aos clientes em todos os dialetos espanhóis.
  • A CyberAgent, empresa líder em publicidade digital e serviços de Internet com sede no Japão, está criando anúncios digitais produzidos por IA e avatares de gêmeos digitais de celebridades, utilizando totalmente as tecnologias generativas de IA e LLM.

Disponibilidade

Os supercomputadores NVIDIA DGX H100 estão em plena produção e em breve estarão disponíveis nos parceiros da NVIDIA em todo o mundo. Os clientes podem testar o DGX H100 hoje com NVIDIA DGX Cloud. Os preços estão disponíveis nos parceiros NVIDIA DGX em todo o mundo.

NVIDIA H100 na nuvem está disponível no Microsoft Azure em visualização privada. Cirrascale e CoreWeave anunciaram a disponibilidade geral de instâncias H100. Outros parceiros de nuvem que planejam oferecer o H100 incluem AWS, Google Cloud, Oracle Cloud Infrastructure, Lambda, Paperspace e Vultr.

Preços e outros detalhes estão disponíveis diretamente nos parceiros de nuvem da NVIDIA.

Assista Huang apresentar a arquitetura NVIDIA Hopper em sua palestra no GTC.