NVIDIA Lança Modelos Abertos e Dados para Acelerar a Inovação em IA nas Áreas de Linguagem, Biologia e Robótica

As famílias de modelos abertos da NVIDIA, incluindo NVIDIA Nemotron para IA digital, Cosmos para IA física, Isaac GR00T para robótica e Clara para IA biomédica, fornecem aos desenvolvedores a base para construir agentes inteligentes especializados para aplicações no mundo real.
por Bryan Catanzaro

Reforçando seu profundo compromisso com o código aberto, a NVIDIA está revelando novas tecnologias de IA de código aberto para linguagem, robótica e biologia, contribuindo para um ecossistema aberto que amplia o acesso à IA e impulsiona a inovação nos EUA.

Essas tecnologias abertas impulsionarão desenvolvedores ao redor do mundo e fortalecerão o crescimento econômico por meio de raciocínio eficiente, geração de mundos de alta fidelidade e sistemas físicos interativos de IA acelerados na infraestrutura NVIDIA.

Os novos modelos abertos, dados e ferramentas fazem parte da família NVIDIA Nemotron para raciocínio em IA, da plataforma NVIDIA Cosmos para IA física,  NVIDIA Isaac GR00T para robótica e NVIDIA Clara para IA biomédica.

A NVIDIA está contribuindo com esses modelos, dados e frameworks de treinamento para o Hugging Face para tornar a pesquisa e desenvolvimento de IA mais acessíveis. Como uma das principais colaboradoras do Hugging Face, com mais de 650 modelos abertos e 250 conjuntos de dados abertos agora disponíveis, a NVIDIA continua ampliando o acesso a recursos de IA de ponta para a comunidade global de desenvolvedores.

“Modelos abertos são catalisadores da inovação em IA, tornando a IA acessível, transparente e responsável”, disse Clément Delangue, CEO do Hugging Face. “As contribuições da NVIDIA para o ecossistema de modelos abertos, o compromisso com a pesquisa aberta em IA e o ecossistema do Hugging Face vão capacitar milhões de desenvolvedores a construir IA avançada, juntos e abertamente.”

NVIDIA Nemotron Traz Raciocínio Ultraeficiente para Agentes Especializados em IA

Agentes de IA usam múltiplos modelos para ver, recuperar, gerar e raciocinar. Os modelos abertos mais recentes da família NVIDIA Nemotron unificam essas capacidades, permitindo que desenvolvedores criem agentes especializados e inteligentes.

  • O Nemotron Nano 3 utiliza uma arquitetura híbrida de especialistas para melhorar o throughput de raciocínio em áreas como desenvolvimento de software, atendimento ao cliente e suporte de IT.
  • O Nemotron Nano 2 VL fornece inteligência documental, raciocínio de imagens e análise de vídeo.
  • O Nemotron Parse extrai texto e tabelas de documentos para obter insights acionáveis.
  • O Nemotron Safety Guard adiciona capacidades de moderação multilíngue culturalmente consciente, detectando conteúdos nocivos em 23 categorias de segurança em nove idiomas.
  • Os modelos de geração aumentada por recuperação (RAG) do Nemotron agora apresentam extração avançada de documentos e recuperação unificada entre fontes de texto, imagens, áudio e vídeo.

A NVIDIA também lançou novos conjuntos de dados Nemotron de código aberto, incluindo sobre treinamento multimodal, personas multilíngues e informações pessoais sintéticas que preservam a privacidade para desenvolvimento especializado de modelos. Além disso, novas ferramentas do NVIDIA NeMo, incluindo NeMo Data Designer para geração de dados sintéticos e NeMo-RL para pós-treinamento avançado e aprendizado por reforço, dá aos desenvolvedores maior controle sobre a personalização do modelo.

Empresas Líderes de Software Desenvolvendo IA Baseada em Agente no Nemotron

Modelos de código aberto permitem que desenvolvedores construam e adaptem IA para seus domínios, transformando softwares em sistemas baseados em agentes que utilizam ferramentas, não apenas as fornecem. Empresas líderes de software e serviços estão desenvolvendo plataformas de software baseado em agentes usando NVIDIA Nemotron.

Aproveitando o sucesso da família de modelos Apriel Nemotron, que foi treinada com dados fornecidos pela NVIDIA e ServiceNow, a ServiceNow lançou seu novo modelo de raciocínio multimodal Apriel 2.0, que traz inteligência para workflows interempresariais em todos os setores, incluindo setores regulados como serviços financeiros, área da saúde e telecomunicações.

“Modelos abertos estão impulsionando a próxima onda de transformação empresarial”, disse Joe Davis, vice-presidente executivo de engenharia de plataforma e IA da ServiceNow. “O Apriel 2.0 representa um dos primeiros modelos de raciocínio multimodal de peso aberto construídos para o setor empresarial, combinando entendimento de texto, documento e dados para impulsionar workflows reais em diversos setores. Junto com a NVIDIA, estamos unindo transparência de raciocínio com eficiência de desempenho, trazendo IA explicável, segura e escalável para setores onde confiança e conformidade são mais importantes.”

Outras empresas líderes de software estão adotando os modelos de raciocínio mais recentes da NVIDIA para impulsionar suas aplicações de IA de próxima geração:

  • A Palantir está disponibilizando o Nemotron por meio de sua Ontology em Foundry e AIP para suportar um stack tecnológico integrado com a NVIDIA para IA operacional.
  • A Cadence está acelerando a produtividade dos projetistas de chips com suas tecnologias abertas JedAI Platform e Nemotron.
  • A CrowdStrike está construindo agentes de IA autônomos e continuamente aprendentes em sua Agentic Security Platform com a NVIDIA Nemotron.
  • O PayPal está aumentando o throughput e a eficiência de custos de seus serviços de IA em 50% com o Nemotron.
  • A Synopsys está colaborando com a NVIDIA para desenvolver agentes de design de chips com o NVIDIA NeMo Agent Toolkit e modelos abertos e dados Nemotron, usados por engenheiros da NVIDIA.
  • O Zoom está utilizando o Nemotron para capacidades personalizadas baseadas em agentes que se alinham com os workflows específicos de seus clientes.

Modelos Abertos Cosmos e Isaac GR00T e Dados para IA Física e Robótica

Para acelerar o treinamento de sistemas robóticos com raciocínio e cognição semelhantes aos humanos, a NVIDIA introduziu grandes atualizações em seus modelos abertos para IA física, incluindo world foundation models Cosmos e modelos base de robótica Isaac GR00T:

  • Cosmos Predict 2.5: Unifica três modelos em um para simulação rápida do mundo, gerando vídeos de 30 segundos a partir de um único quadro.
  • Cosmos Transfer 2.5: Produz dados fotorrealistas de maior qualidade de cenas 3D com um terço do tamanho do Cosmos Transfer 1.
  • Cosmos Reason: Um modelo de linguagem de visão de raciocínio, agora disponível como microserviço NIM da NVIDIA, para compreensão multimodal avançada.
  • Busca de Conjuntos de Dados Cosmos: Permite a recuperação instantânea de cenários de treinamento, reduzindo os ciclos pós-treinamento de meses para dias.
  • Isaac GR00T N1.6: Aprimora o raciocínio, a generalização e o controle do corpo inteiro para robôs humanóides.

A NVIDIA também lançou o maior conjunto de dados open-source do mundo para IA física, agora apresentando 1.700 horas de dados de sensores multimodais de direção de todo os EUA e Europa, além de dados de treinamento GR00T, que subiram para o top 10 dos conjuntos de dados do Hugging Face com mais downloads de todos os tempos.

Empresas líderes, incluindo Agility Robotics, Amazon Robotics, Figure AI, Skild AI, Milestone Systems e Uber, estão adotando modelos Cosmos ou Isaac GR00T N para gerar dados sintéticos, ensinar robôs novos comportamentos e implantar agentes de IA reais e físicos em larga escala.

Modelos Abertos NVIDIA Clara para Área da Saúde e Ciências da Vida

Novos modelos abertos que se juntam ao NVIDIA Clara, uma família de modelos, ferramentas e receitas criadas para acelerar descobertas científicas, análise de imagens médicas e muito mais, incluem:

  • Clara CodonFM: Aprende as regras do RNA para revelar como mudanças em seu código podem melhorar o desenho de terapias e medicamentos. A NVIDIA contribuirá com modelos abertos como o CodonFM para a plataforma de células virtuais da Iniciativa Chan Zuckerberg, acelerando a colaboração e avaliação de modelos em código aberto.
  • Clara La-Proteina: Cria estruturas proteicas 3D átomo por átomo, com o dobro do comprimento e complexidade dos modelos anteriores, possibilitando o desenvolvimento de medicamentos, enzimas e materiais melhores.
  • Clara Reason: Um modelo de linguagem visual que permite raciocínio por cadeia de pensamento para radiologia e imagem médica para avançar pesquisas médicas explicáveis em IA.

Comece Com os Modelos Abertos da NVIDIA

Modelos abertos selecionados NVIDIA Nemotron e Cosmos, treinados com NVIDIA DGX Cloud, estão disponíveis no build.nvidia.com, Hugging Face, OpenRouter e Microsoft Azure AI Foundry, e em breve chegam à Google Vertex AI Platform e outros provedores de serviços em nuvem. NVIDIA Clara e Isaac GR00T estão disponíveis na Hugging Face.

Os modelos estão disponíveis como microsserviços NVIDIA NIM para implantação segura e escalável na DGX Cloud ou qualquer infraestrutura acelerada pela NVIDIA, garantindo máxima privacidade e controle.