“Criamos um Processador para a Era da IA Generativa”, diz CEO da NVIDIA

Dando início à maior conferência GTC até agora, o fundador e CEO da NVIDIA, Jensen Huang, revela NVIDIA Blackwell, microsserviços NIM, APIs Omniverse Cloud e muito mais.
por Brian Caulfield

A IA generativa promete revolucionar todos os setores em que toca: tudo o que tem sido necessário é a tecnologia para enfrentar o desafio.

O fundador e CEO da NVIDIA, Jensen Huang, apresentou na segunda-feira essa tecnologia, a nova plataforma de computação Blackwell da empresa, enquanto delineava os principais avanços que o aumento do poder de computação pode oferecer para tudo, desde software a serviços, robótica a tecnologia médica e muito mais.

“A computação acelerada atingiu o ponto de inflexão: a computação de uso geral ficou sem fôlego”, disse Huang a mais de 11.000 participantes do GTC reunidos pessoalmente, e muitas dezenas de milhares mais online, para seu discurso na cavernosa arena SAP Center do Vale do Silício.

“Precisamos de outra maneira de fazer computação para que possamos continuar a escalar, para que possamos continuar a reduzir o custo da computação, para que possamos continuar a consumir cada vez mais computação enquanto somos sustentáveis. A computação acelerada é uma aceleração significativa em relação à computação de uso geral, em todos os setores.”

Huang falou diante de imagens enormes em uma tela de resolução de 8K e 40 metros de altura, do tamanho de uma quadra de tênis, para uma multidão repleta de CEOs e desenvolvedores, entusiastas de IA e empresários, que caminharam juntos 20 minutos até a arena do Centro de Convenções de San Jose em um deslumbrante dia de primavera.

Oferecendo uma atualização massiva para a infraestrutura de IA do mundo, Huang apresentou a plataforma NVIDIA Blackwell para liberar IA generativa em tempo real em grandes modelos de linguagem de trilhões de parâmetros.

Huang apresentou o NVIDIA NIM, uma referência aos microsserviços de inferência da NVIDIA, uma nova maneira de empacotar e fornecer software que conecta desenvolvedores com centenas de milhões de GPUs para implantar IA personalizada de todos os tipos.

E trazendo a IA para o mundo físico, Huang introduziu as APIs de nuvem do Omniverse para fornecer recursos avançados de simulação.

Huang pontuou esses grandes anúncios com demonstrações poderosas, parcerias com algumas das maiores empresas do mundo e mais de uma série de anúncios detalhando sua visão.

O GTC, que em 15 anos cresceu dos confins de um salão de festas de um hotel local para a conferência de IA mais importante do mundo, está retornando a um evento físico pela primeira vez em cinco anos.

A deste ano tem mais de 900 sessões, incluindo um painel de discussão sobre transformadores moderado por Huang com os oito pioneiros que desenvolveram a tecnologia pela primeira vez, mais de 300 exposições e mais de 20 workshops técnicos.

É um evento que está na interseção da IA e quase tudo. Em um impressionante ato de abertura da palestra, Refik Anadol, o principal artista de IA do mundo, mostrou uma enorme escultura de dados de IA em tempo real com redemoinhos semelhantes a ondas em verdes, azuis, amarelos e vermelhos, batendo, torcendo e se desenrolando pela tela.

Ao iniciar sua palestra, Huang explicou que o surgimento da IA multimodal, capaz de processar diversos tipos de dados manipulados por diferentes modelos, dá à IA maior adaptabilidade e poder. Ao aumentar seus parâmetros, esses modelos podem lidar com análises mais complexas.

Mas isso também significa um aumento significativo na necessidade de poder de computação. E à medida que esses sistemas colaborativos e multimodais se tornam mais intrincados, com até um trilhão de parâmetros, a demanda por infraestrutura de computação avançada se intensifica.

“Precisamos de modelos ainda maiores”, disse Huang. “Vamos treiná-lo com dados multimodalidade, não apenas texto na internet, vamos treiná-lo em textos e imagens, gráficos e tabelas, e assim como aprendemos assistindo TV, haverá um monte de assistir a vídeos.”

A Próxima Geração de Computação Acelerada

Em suma, Huang disse que “precisamos de GPUs maiores”. A plataforma Blackwell foi criada para enfrentar esse desafio. Huang tirou um chip Blackwell de seu bolso e o segurou lado a lado com um chip Hopper, que ele diminuiu.

Batizada em homenagem a David Harold Blackwell, matemático da Universidade da Califórnia em Berkeley especializado em teoria dos jogos e estatística, e o primeiro acadêmico negro introduzido na Academia Nacional de Ciências, a nova arquitetura sucede a arquitetura NVIDIA Hopper, lançada há dois anos.

A Blackwell entrega 2,5 vezes o desempenho de seu antecessor no TL8 para treinamento, por chip, e 5 vezes com o TL4 para inferência. Ela possui uma interconexão NVLink de quinta geração que é duas vezes mais rápida que o Hopper e escala até 576 GPUs.

E o Superchip NVIDIA GB200 Grace Blackwell conecta duas GPUs Blackwell NVIDIA B200 Tensor Core à CPU NVIDIA Grace por meio de uma interconexão chip a chip NVLink de ultrabaixa potência de 900GB/s.

Huang ergueu uma placa com o sistema. “Este computador é o primeiro de seu tipo em que essa quantidade de computação se encaixa neste pequeno espaço”, disse Huang. “Como isso é coerente com a memória, eles sentem que é uma grande família feliz trabalhando juntas em uma aplicação.”

Para obter o mais alto desempenho de IA, os sistemas impulsionados por GB200 podem ser conectados com as plataformas NVIDIA Quantum-X800 InfiniBand e Spectrum-X800 Ethernet, também anunciadas hoje, que oferecem redes avançadas em velocidades de até 800Gb/s.

“A quantidade de energia que economizamos, a quantidade de largura de banda de rede que economizamos, a quantidade de tempo desperdiçado que economizamos, será tremenda”, disse Huang. “O futuro é gerador (…) É por isso que esta é uma indústria totalmente nova. A forma como calculamos é fundamentalmente diferente. Criamos um processador para a era da IA generativa.”

Para aumentar a escala da Blackwell, a NVIDIA construiu um novo chip chamado Switch NVLink. Cada um pode conectar quatro interconexões NVLink a 1,8 terabytes por segundo e eliminar o tráfego fazendo a redução na rede.

O NVIDIA Switch e o GB200 são componentes-chave do que Huang descreveu como “uma GPU gigante”, o NVIDIA GB200 NVL72, um sistema multinó, refrigerado a líquido e em escala de rack que aproveita a Blackwell para oferecer computação sobrecarregada para modelos de trilhões de parâmetros, com 720 petaflops de desempenho de treinamento de IA e 1,4 exaflops de desempenho de inferência de IA em um único rack.

“Há apenas duas, talvez três máquinas exaflop no planeta enquanto falamos”, disse Huang sobre a máquina, que embala 600.000 peças e pesa 1.300 kgs. “E, portanto, este é um sistema de IA exaflop em um único rack. Bem, vamos dar uma olhada na parte de trás dele.”

Indo ainda maior, a NVIDIA também anunciou hoje seu supercomputador de IA de próxima geração, o NVIDIA DGX SuperPOD impulsionado por Superchips NVIDIA GB200 Grace Blackwell, para processar modelos de trilhões de parâmetros com tempo de atividade constante para treinamento de IA generativa em superescala e cargas de trabalho de inferência.

Apresentando uma nova arquitetura de rack altamente eficiente e refrigerada a líquido, o novo DGX SuperPOD é construído com sistemas NVIDIA DG GB200 e fornece 11,5 exaflops de supercomputação de IA com precisão FP4 e 240 terabytes de memória rápida, escalando para mais com racks adicionais.

“No futuro, os data centers serão pensados… como fábricas de IA”, disse Huang. “O objetivo deles na vida é gerar receitas, no caso, inteligência.”

A indústria já abraçou a Blackwell.

O comunicado à imprensa anunciando a Blackwell inclui endossos da Alphabet e do CEO do Google, Sundar Pichai, do CEO da Amazon, Andy Jassy, do CEO da Dell, Michael Dell, do CEO do Google DeepMind, Demis Hassabis, do CEO da Meta, Mark Zuckerberg, do CEO da Microsoft, Satya Nadella, do CEO da OpenAI, Sam Altman, do presidente da Oracle, Larry Ellison, e do CEO da Tesla e da xAI, Elon Musk.

A Blackwell está sendo adotada por todos os principais provedores globais de serviços em nuvem, empresas pioneiras de IA, fornecedores de sistemas e servidores e provedores regionais de serviços em nuvem e empresas de telecomunicações em todo o mundo.

“Toda a indústria está se preparando para a Blackwell”, que Huang disse que seria o lançamento mais bem-sucedido da história da empresa.

Uma Nova Maneira de Criar Software

A IA generativa muda a maneira como as aplicações são escritas, disse Huang.

Em vez de escrever software, explicou, as empresas montarão modelos de IA, darão missões, darão exemplos de produtos de trabalho, revisarão planos e intermediarão resultados.

Esses pacotes, NVIDIA NIMs, são construídos a partir das bibliotecas de computação acelerada e modelos de IA generativa da NVIDIA, explicou Huang.

“Como construir software no futuro? É improvável que você escreva do zero ou escreva um monte de código Python ou qualquer coisa assim”, disse Huang. “É muito provável que você monte uma equipe de IAs.”

Os microsserviços suportam APIs padrão do setor para que sejam fáceis de conectar, funcionem em toda a grande base CUDA instalada da NVIDIA, sejam reotimizados para novas GPUs e sejam constantemente verificados em busca de vulnerabilidades e exposições de segurança.

Huang disse que os clientes podem usar microsserviços NIM de prateleira, ou a NVIDIA pode ajudar a construir IA proprietária e copilotos, ensinando a um modelo habilidades especializadas que apenas uma empresa específica saberia para criar novos serviços inestimáveis.

“O setor de IT empresarial está sentado em uma mina de ouro”, disse Huang. “Eles têm todas essas ferramentas (e dados) incríveis que foram criados ao longo dos anos. Se eles pudessem pegar essa mina de ouro e transformá-la em copilotos, esses copilotos podem nos ajudar a fazer as coisas.”

Grandes players de tecnologia já estão colocando isso para funcionar. Huang detalhou como a NVIDIA já está ajudando a Cohesity, NetApp, SAP, ServiceNow e Snowflake a construir copilots e assistentes virtuais. E as indústrias também estão entrando.

Nas telecomunicações, Huang anunciou o NVIDIA 6G Research Cloud, uma plataforma de IA generativa e Omniverse para avançar na próxima era das comunicações. Ele é construído com o framework de rádio neural Sionna da NVIDIA, a rede de acesso de rádio acelerada por CUDA da NVIDIA Aerial e o NVIDIA Aerial Omniverse Digital Twin para 6G.

No projeto e fabricação de semicondutores, Huang anunciou que, em colaboração com a TSMC e a Synopsys, a NVIDIA está trazendo sua inovadora plataforma de litografia computacional, cuLitho, para produção. Essa plataforma acelerará a carga de trabalho mais intensiva em computação na manufatura de semicondutores em 40-60 vezes.

Huang também anunciou o NVIDIA Earth Climate Digital Twin. A plataforma na nuvem, disponível agora, permite a simulação interativa e de alta resolução para acelerar a previsão do clima e do tempo.

O maior impacto da IA será na área da saúde, disse Huang, explicando que a NVIDIA já está em sistemas de imagem, em instrumentos de sequenciamento genético e trabalhando com empresas líderes de robótica cirúrgica.

A NVIDIA está lançando um novo tipo de software de biologia. A NVIDIA lançou hoje mais de 20 novos microsserviços que permitem que empresas da área de saúde em todo o mundo aproveitem os mais recentes avanços em IA generativa de qualquer lugar e em qualquer nuvem. Eles oferecem imagens avançadas, linguagem natural e reconhecimento de fala, e geração, previsão e simulação de biologia digital.

Omniverse Traz IA para o Mundo Físico

A próxima onda de IA será o aprendizado de IA sobre o mundo físico, disse Huang.

“Precisamos de um mecanismo de simulação que represente o mundo digitalmente para o robô para que o robô tenha uma academia para ir aprender a ser um robô”, disse ele. “Chamamos esse mundo virtual de Omniverso.”

É por isso que a NVIDIA anunciou hoje que o NVIDIA Omniverse Cloud estará disponível como APIs, ampliando o alcance da plataforma líder mundial para a criação de aplicações e workflows de gêmeos digitais industriais em todo o ecossistema de fabricantes de software.

As cinco novas interfaces de programação de aplicações Omniverse Cloud permitem que os desenvolvedores integrem facilmente as principais tecnologias Omniverse diretamente em aplicações de software de design e automação existentes para gêmeos digitais, ou seus workflows de simulação para testar e validar máquinas autônomas, como robôs ou veículos autônomos.

Para mostrar como isso funciona, Huang compartilhou uma demonstração de um armazém robótico, usando percepção e rastreamento de várias câmeras, vigiando os trabalhadores e orquestrando empilhadeiras robóticas, que estão dirigindo de forma autônoma com o stack  robótico completo funcionando.

Huang também anunciou que a NVIDIA está trazendo o Omniverse para o Apple Vision Pro, com as novas APIs do Omniverse Cloud permitindo que os desenvolvedores transmitam gêmeos digitais industriais interativos para os fones de ouvido VR.

Alguns dos maiores fabricantes de software industrial do mundo estão adotando APIs do Omniverse Cloud, incluindo Ansys, Cadence, Dassault Systèmes para sua marca 3DEXCITE, Hexagon, Microsoft, Rockwell Automation, Siemens e Trimble.

Robótica

Tudo o que se move será robótico, disse Huang. A indústria automotiva será uma grande parte disso. Os computadores da NVIDIA já estão em carros, caminhões, bots de entrega e robotaxis.

Huang anunciou que a BYD, a maior empresa de veículos autônomos do mundo, selecionou o computador de próxima geração da NVIDIA para seu AV, construindo suas frotas de EV de próxima geração no DRIVE Thor.

Para ajudar os robôs a ver melhor seu ambiente, Huang também anunciou o kit de desenvolvimento de software Isaac Perceptor com odometria visual multicâmera de última geração, reconstrução 3D e mapa de ocupação e percepção de profundidade.

E para ajudar a tornar os manipuladores, ou braços robóticos, mais adaptáveis, a NVIDIA está anunciando o Isaac Manipulator, uma biblioteca de percepção de braço robótico, planejamento de caminho e controle cinemático de última geração.

Finalmente, Huang anunciou o Projeto GR00T, um modelo base de uso geral para robôs humanoides, projetado para promover o trabalho da empresa impulsionando avanços em robótica e IA incorporada.

Apoiando esse esforço, Huang revelou um novo computador, Jetson Thor, para robôs humanoides baseados no sistema NVIDIA Thor em um chip e atualizações significativas para a plataforma robótica NVIDIA Isaac.

Em seus minutos finais, Huang trouxe ao palco um par de diminutos robôs movidos a NVIDIA da Disney Research.

“A alma da NVDIA: a intersecção de computação gráfica, física, inteligência artificial”, disse ele. “Tudo se deu certo neste momento.”