“A IA generativa está remodelando as indústrias e abrindo novas oportunidades de inovação e crescimento”, disse o fundador e CEO da NVIDIA, Jensen Huang, em uma apresentação antes da conferência de tecnologia COMPUTEX desta semana em Taipei.
“Hoje, estamos à beira de uma grande mudança na computação”, disse Huang ao público, vestido com sua jaqueta de couro preta de marca registrada. “A interseção de IA e computação acelerada está pronta para redefinir o futuro.”
Huang falou antes de uma das principais conferências de tecnologia do mundo para uma audiência de mais de 6.500 líderes da indústria, imprensa, empresários, gamers, criadores e entusiastas de IA reunidos no Centro Esportivo da Universidade Nacional de Taiwan, com cúpula de vidro, situado no coração verdejante de Taipei.
O tema: as plataformas aceleradas da NVIDIA estão em plena produção, seja por meio de PCs de IA e dispositivos de consumo com uma série de recursos impulsionados pela NVIDIA RTX ou empresas construindo e implantando AI factories com a plataforma de computação full-stack da NVIDIA.
“O futuro da computação está acelerado”, disse Huang. “Com nossas inovações em IA e computação acelerada, estamos ultrapassando os limites do que é possível e impulsionando a próxima onda de avanço tecnológico.”
‘Ritmo De Um Ano’
Está chegando cada vez mais, com Huang revelando um roteiro para novos semicondutores que chegarão em um ritmo de um ano. Revelada pela primeira vez, a plataforma Rubin sucederá a próxima plataforma Blackwell, com novas GPUs, uma nova CPU baseada em Arm, Vera, e redes avançadas com NVLink 6, CX9 SuperNIC e o switch convergente InfiniBand/Ethernet X1600.
“Nossa empresa tem um ritmo de um ano. Nossa filosofia básica é muito simples: construir toda a escala do data center, desagregar e vender peças para você em um ritmo de um ano e levar tudo aos limites da tecnologia”, explicou Huang.
A equipe criativa da NVIDIA usou ferramentas de IA de membros do programa de startups NVIDIA Inception, construído sobre NVIDIA NIM e computação acelerada da NVIDIA, para criar a apresentação da COMPUTEX. Repleto de demonstrações, este showcase destacou essas ferramentas inovadoras e o impacto transformador da tecnologia da NVIDIA.
‘Computação Acelerada É Computação Sustentável’
A NVIDIA está reduzindo o custo de transformar dados em inteligência, explicou Huang ao iniciar sua apresentação.
“A computação acelerada é a computação sustentável”, enfatizou, destacando como a combinação de GPUs e CPUs pode entregar até 100 vezes de aceleração, aumentando o consumo de energia apenas por um fator de três, alcançando 25 vezes mais desempenho por Watt em relação às CPUs.
“Quanto mais você compra, mais você economiza”, observou Huang, destacando a significativa economia de custos e energia dessa abordagem.
Indústria Se Une à NVIDIA para Construir AI Factories para Impulsionar Uma Nova Revolução Industrial
Os principais fabricantes de computadores, particularmente de Taiwan, o centro global de IT, adotaram GPUs NVIDIA e soluções de rede. As principais empresas incluem ASRock Rack, ASUS, GIGABYTE, Ingrasys, Inventec, Pegatron, QCT, Supermicro, Wistron e Wiwynn, que estão criando sistemas de IA na nuvem, locais e no edge.
A plataforma de design de referência modular NVIDIA MGX agora suporta Blackwell, incluindo a plataforma GB200 NVL2, projetada para desempenho ideal em inferência de grandes modelos de linguagem, geração aumentada de recuperação e processamento de dados.
A AMD e a Intel estão apoiando a arquitetura MGX com planos de entregar, pela primeira vez, seus próprios projetos de módulo de processador host de CPU. Qualquer integrador de sistemas de servidor pode usar esses designs de referência para economizar tempo de desenvolvimento e, ao mesmo tempo, garantir consistência no design e no desempenho.
Rede de Última Geração com Spectrum-X
Em redes, Huang revelou planos para o lançamento anual de produtos Spectrum-X para atender à crescente demanda por redes Ethernet de alto desempenho para IA.
O NVIDIA Spectrum-X, o primeiro fabric Ethernet criado para IA, melhora o desempenho da rede em 1,6 vezes mais do que os fabrics Ethernet tradicionais. Ele acelera o processamento, análise e execução de cargas de trabalho de IA e, por sua vez, o desenvolvimento e a implantação de soluções de IA.
CoreWeave, GMO Internet Group, Lambda, Scaleway, STPX Global e Yotta estão entre os primeiros provedores de serviços de nuvem de IA que adotam o Spectrum-X para trazer desempenho de rede extremo para suas infraestruturas de IA.
NVIDIA NIM Transformará Milhões em Desenvolvedores de IA Generativa
Com o NVIDIA NIM, os 28 milhões de desenvolvedores do mundo agora podem criar facilmente aplicações de IA generativa. O NIM, microsserviços de inferência que fornecem modelos como contêineres otimizados, pode ser implantado em nuvens, data centers ou workstations.
O NIM também permite que as empresas maximizem seus investimentos em infraestrutura. Por exemplo, executar o Meta Llama 3-8B em um NIM produz até 3 vezes mais tokens de IA generativa em infraestrutura acelerada do que sem o NIM.
Quase 200 parceiros de tecnologia, incluindo Cadence, Cloudera, Cohesity, DataStax, NetApp, Scale AI e Synopsys, estão integrando o NIM em suas plataformas para acelerar implantações de IA generativa para aplicações específicas de domínio, como copilotos, assistentes de código, avatares humanos digitais e muito mais. A Hugging Face agora está oferecendo NIM, começando com o Meta Llama 3.
“Hoje acabamos de postar no Hugging Face o Llama 3 totalmente otimizado, está disponível lá para você experimentar. Você pode até levá-lo com você”, disse Huang. “Assim, você pode executá-lo na nuvem, executá-lo em qualquer nuvem, fazer download desse contêiner, colocá-lo em seu próprio data center e hospedá-lo para disponibilizá-lo para seus clientes.”
NVIDIA Dá Vida aos Assistentes de IA com PCs GeForce RTX AI
Os PCs RTX AI da NVIDIA, equipados com tecnologias RTX, estão prontos para revolucionar as experiências do consumidor com mais de 200 laptops RTX AI e mais de 500 aplicações e games impulsionados por IA.
O RTX AI Toolkit e os microsserviços de inferência NIM baseados em PC recém-disponíveis para a plataforma de humanos digitais NVIDIA ACE ressaltam o compromisso da NVIDIA com a acessibilidade de IA.
O Project G-Assist, uma demonstração de tecnologia de assistente de IA com RTX, também foi anunciado, apresentando assistência sensível ao contexto para games e aplicações de PC.
E a Microsoft e a NVIDIA estão colaborando para ajudar os desenvolvedores a trazer novos recursos de IA generativa para suas aplicações web e nativas do Windows com fácil acesso à API para SLMs acelerados por RTX que habilitam recursos RAG executados no dispositivo como parte do Tempo de Execução do Windows Copilot.
NVIDIA Robotics Adotada por Líderes do Setor
A NVIDIA está liderando a mudança de digitalização industrial de US$ 50 trilhões, com setores adotando operações autônomas e gêmeos digitais, modelos virtuais que aumentam a eficiência e reduzem custos. Por meio de seu Programa para Desenvolvedores, a NVIDIA oferece acesso ao NIM, fomentando a inovação em IA.
Os fabricantes taiwaneses estão transformando suas fábricas usando a tecnologia da NVIDIA, com Huang mostrando o uso da Foxconn do NVIDIA Omniverse, Isaac e Metropolis para criar gêmeos digitais, combinando IA de visão e ferramentas de desenvolvimento de robôs para instalações robóticas aprimoradas.
“A próxima onda de IA é a IA física. IA que entende as leis da física, IA que pode trabalhar entre nós”, disse Huang, enfatizando a importância da robótica e da IA em desenvolvimentos futuros.
A plataforma NVIDIA Isaac fornece um kit de ferramentas robusto para desenvolvedores construírem robôs de IA, incluindo AMRs, braços industriais e humanoides, impulsionados por modelos de IA e supercomputadores como Jetson Orin e Thor.
“A robótica está aqui. A IA física está aqui. Isso não é ficção científica, e está sendo usado em toda Taiwan. É muito, muito emocionante”, acrescentou Huang.
Gigantes globais da eletrônica estão integrando a robótica autônoma da NVIDIA em suas fábricas, aproveitando a simulação no Omniverse para testar e validar essa nova onda de IA para o mundo físico. Isso inclui mais de 5 milhões de robôs pré-programados em todo o mundo.
“Todas as fábricas serão robóticas. As fábricas orquestrarão robôs, e esses robôs construirão produtos robóticos”, explicou Huang.
Huang enfatizou o papel do NVIDIA Isaac em aumentar a eficiência da fábrica e do armazém, com líderes globais como BYD Electronics, Siemens, Teradyne Robotics e Intrinsic adotando suas bibliotecas avançadas e modelos de IA.
O NVIDIA AI Enterprise na plataforma IGX, com parceiros como ADLINK, Advantech e ONYX, oferece soluções de IA de ponta atendendo a rígidos padrões regulatórios, essenciais para a tecnologia médica e outras indústrias.
Huang terminou sua palestra com a mesma nota em que começou, prestando homenagem a Taiwan e aos muitos parceiros da NVIDIA lá. “Obrigado”, disse Huang. “Eu amo vocês.”