GPUs NVIDIA H100 Disponíveis na AWS Cloud

A nova instância P5 do Amazon EC2 usa os aceleradores mais recentes da NVIDIA para oferecer desempenho líder do setor para IA generativa e muito mais.
por Dave Salvator

Os usuários da AWS agora podem acessar o desempenho líder demonstrado em benchmarks do setor de treinamento e inferência de IA.

A gigante da nuvem ativou oficialmente uma nova instância P5 do Amazon EC2 impulsionada por GPUs NVIDIA H100 Tensor Core. O serviço permite que os usuários utilizem IA generativa, computação de alto desempenho (HPC) e outras aplicações com um clique de um navegador.

A notícia veio na esteira do momento iPhone da IA. Desenvolvedores e pesquisadores estão usando grandes modelos de linguagem (LLMs) para descobrir novas aplicações para IA quase diariamente. Trazer esses novos casos de uso para o mercado requer a eficiência da computação acelerada.

A GPU NVIDIA H100 oferece desempenho de classe de supercomputação por meio de inovações arquitetônicas, incluindo Núcleos Tensor de quarta geração, um novo Transformer Engine para acelerar LLMs e a mais recente tecnologia NVLink que permite que as GPUs conversem entre si a 900GB/seg.

Dimensionamento com Instâncias P5

As instâncias P5 do Amazon EC2 são ideais para treinamento e execução de inferência para LLMs e modelos de visão computacional cada vez mais complexos. Essas redes neurais impulsionam as aplicações de IA generativa mais exigentes e intensivas em computação, incluindo resposta a perguntas, geração de código, geração de vídeo e imagem, reconhecimento de fala e muito mais.

As instâncias P5 podem ser implantadas em clusters de hiperescala, chamados EC2 UltraClusters, compostos por computação, rede e armazenamento de alto desempenho na nuvem. Cada EC2 UltraCluster é um supercomputador poderoso, permitindo que os clientes executem seus treinamentos de IA mais complexos e cargas de trabalho de HPC distribuídas em vários sistemas.

Para que os clientes possam executar aplicações em escala que exigem altos níveis de comunicação entre nós de computação, a instância P5 possui redes sem bloqueio em escala de petabit, impulsionadas pelo AWS EFA, uma interface de rede de 3.200 Gbps para instâncias do Amazon EC2.

Com instâncias P5, as aplicações de machine learning podem usar a NVIDIA Collective Communications Library para empregar até 20.000 GPUs H100.

O NVIDIA AI Enterprise ajuda os usuários a aproveitar ao máximo as instâncias P5 com um pacote completo de software que inclui mais de 100 frameworks, modelos pré-treinados, workflows de IA e ferramentas para ajustar a infraestrutura de IA.

Projetado para agilizar o desenvolvimento e a implantação de aplicações de IA, o NVIDIA AI Enterprise aborda as complexidades da criação e manutenção de uma plataforma de software de IA de alto desempenho, segura e nativa da nuvem. Disponível no AWS Marketplace, ele oferece monitoramento contínuo de segurança, correção regular e oportuna de vulnerabilidades e exposições comuns, estabilidade de API e suporte corporativo, bem como acesso a especialistas em IA da NVIDIA.

O Que os Clientes Estão Dizendo

A NVIDIA e a AWS colaboram há muitos anos para trazer a aceleração da GPU para a nuvem. As novas instâncias P5, o exemplo mais recente dessa colaboração, representam um grande passo à frente para oferecer o desempenho de ponta que permite aos desenvolvedores inventar a próxima geração de IA.

Aqui estão alguns exemplos do que os clientes já estão dizendo:

A Anthropic constrói sistemas de IA confiáveis, interpretáveis e direcionáveis que terão muitas oportunidades de criar valor comercialmente e para benefício público.

“Embora os grandes sistemas gerais de IA de hoje possam ter benefícios significativos, eles também podem ser imprevisíveis, não confiáveis e opacos, então nosso objetivo é progredir nessas questões e implantar sistemas que as pessoas considerem úteis”, disse Tom Brown, cofundador da Anthropic. “Esperamos que as instâncias P5 ofereçam benefícios substanciais de preço-desempenho em relação às instâncias P4d, e elas estarão disponíveis na escala massiva necessária para a criação de LLMs de próxima geração e produtos relacionados.”

A Cohere, pioneira líder em IA de linguagem, capacita todos os desenvolvedores e empresas a criar produtos com a tecnologia líder mundial de processamento de linguagem natural (NLP), mantendo seus dados privados e seguros.

“A Cohere lidera a tarefa de ajudar todas as empresas a aproveitar o poder da IA para explorar, gerar, pesquisar e agir sobre as informações de maneira natural e intuitiva, implantando em várias plataformas de nuvem no ambiente de dados que funciona melhor para cada cliente”, disse Aidan Gomez, CEO da Cohere. “As instâncias do Amazon EC2 P5 com tecnologia NVIDIA H100 liberarão a capacidade das empresas de criar, crescer e escalar mais rapidamente com seu poder de computação combinado com os recursos de LLM e IA generativa de última geração da Cohere.”

Por sua vez, a Hugging Face tem a missão de democratizar o machine learning.

“Como a comunidade de código aberto de crescimento mais rápido para machine learning, agora fornecemos mais de 150.000 modelos pré-treinados e 25.000 conjuntos de dados em nossa plataforma para PNL, visão computacional, biologia, aprendizado por reforço e muito mais”, disse Julien Chaumond, diretor de tecnologia e cofundador da Hugging Face. “Estamos ansiosos para usar instâncias P5 do Amazon EC2 por meio do Amazon SageMaker em escala no UltraClusters com a EFA para acelerar a entrega de novos modelos de IA de base para todos.”

Hoje, mais de 450 milhões de pessoas em todo o mundo usam o Pinterest como uma plataforma de inspiração visual para comprar produtos personalizados ao seu gosto, encontrar ideias e descobrir criadores inspiradores.

“Usamos o deep learning extensivamente em nossa plataforma para casos de uso, como rotular e categorizar bilhões de fotos que são carregadas em nossa plataforma e pesquisa visual que fornece aos nossos usuários a capacidade de ir da inspiração à ação”, disse David Chaiken, arquiteto-chefe do Pinterest. “Estamos ansiosos para usar instâncias P5 do Amazon EC2 com GPUs NVIDIA H100, AWS EFA e UltraClusters para acelerar nosso desenvolvimento de produtos e trazer novas experiências empáticas baseadas em IA para nossos clientes.”

Saiba mais sobre as instâncias do AWS P5 com tecnologia NVIDIA H100.