Modelos e Frameworks Abertos de IA Física Avançam Robôs e Sistemas Autônomos

por Akhil Docca

O código aberto tornou-se essencial para impulsionar a inovação em robótica e autonomia. Ao fornecer acesso a infraestruturas críticas,  desde frameworks de simulação até modelos de IA, a NVIDIA está possibilitando o desenvolvimento colaborativo que acelera o caminho para sistemas autônomos mais seguros e capazes.

Recentemente, a NVIDIA apresentou um novo conjunto de modelos e frameworks de IA física abertos para acelerar o desenvolvimento de humanoides, veículos autônomos e outras incorporações físicas de IA. Essas ferramentas abrangem todo o ciclo de vida do desenvolvimento robótico, desde simulação de mundos de alta fidelidade e geração de dados sintéticos até orquestração nativa em nuvem e implantação no edge, oferecendo aos desenvolvedores um kit modular para construir sistemas autônomos que podem raciocinar, aprender e agir no mundo real.

O OpenUSD fornece o framework comum que padroniza como os dados 3D são compartilhados entre essas ferramentas de IA física, permitindo que desenvolvedores construam gêmeos digitais precisos e os reutilizem de forma fluida da simulação até a implantação. As bibliotecas NVIDIA Omniverse, construídas sobre OpenUSD, servem como fonte de simulação groundtruth que alimenta todo o stack.

Dos Laboratórios ao Salão de Exposições

Na CES 2026, desenvolvedores trouxeram a stack de IA física da NVIDIA para fora do laboratório e para o salão de exposições, estreando máquinas que vão desde equipamentos pesados e assistentes de fábrica até robôs sociais e de serviço.

O stack acessa world models do NVIDIA Cosmos; Tecnologias NVIDIA Isaac, incluindo o novo framework de código aberto Isaac Lab-Arena para avaliação de políticas; o portfólio aberto NVIDIA Alpamayo de modelos de IA, frameworks de simulação e conjuntos físicos de IA para veículos autônomos; e o framework NVIDIA OSMO para orquestrar treinamentos em ambientes computacionais.

O Cat AI Assistant da Caterpillar, impulsionado por modelos abertos NVIDIA Nemotron para IA baseada em agentes e rodando no módulo de IA no edge NVIDIA Jetson Thor, traz a interação em linguagem natural diretamente para a cabine de veículos pesados. Os operadores podem fazer perguntas no estilo “Hey Cat” e receber orientações passo a passo, além de ajustar parâmetros de segurança por voz.

Nos bastidores, a Caterpillar utiliza bibliotecas do Omniverse para construir gêmeos digitais em fábricas e locais de trabalho que podem ajudar a simular layouts, padrões de tráfego e workflows multimáquinas. Esses insights são reintroduzidos em equipamentos e frotas antes que as mudanças sejam enviadas para os locais de trabalho, tornando as operações assistidas por IA mais seguras e eficientes.

A LEM Surgical apresentou seu Sistema Cirúrgico Robótico Dynamis, aprovado pela FDA e em uso clínico rotineiro para procedimentos de coluna. O sistema de próxima geração utiliza NVIDIA Jetson AGX Thor para computação, NVIDIA Holoscan para processamento de sensores em tempo real e NVIDIA Isaac para Área da Saúde para treinar seus braços autônomos.

A LEM Surgical também utiliza o NVIDIA Cosmos Transfer, um world model aberto e totalmente personalizável que permite geração física de dados sintéticos, para gerar dados sintéticos de treinamento e o framework NVIDIA Isaac Sim para simulação de gêmeos digitais. Projetado como um robô cirúrgico humanoide de dois braços para cirurgia de tecidos duros, o sistema Dynamis imita a destreza do cirurgião humano e possibilita procedimentos complexos na coluna com precisão aprimorada, aliviando exigências físicas intensas para cirurgiões e assistentes cirúrgicos.

Vitrine cirúrgica do LEM.

A NEURA Robotics está construindo robôs cognitivos sobre um stack completo da NVIDIA, usando Isaac Sim e Isaac Lab para treinar seus robôs humanoides 4NE1 e de serviço MiPA em gêmeos digitais baseados em OpenUSD antes de serem implantados em ambientes domésticos e locais de trabalho. A empresa utilizou o NVIDIA Isaac GR00TMimic para pós-treinar o modelo base Isaac GR00T para suas plataformas.

Além disso, a NEURA Robotics está colaborando com SAP e NVIDIA para integrar os agentes Joule da SAP com seus robôs, utilizando o Mega NVIDIA Omniverse Blueprint para simular e refinar o comportamento dos robôs em cenários operacionais complexos e realistas antes que esses agentes e comportamentos sejam implantados no ecossistema Neuraverse da empresa, bem como em frotas reais.

O AgiBot usa o NVIDIA Cosmos Predict 2 como espinha dorsal de world modeling para sua plataforma Genie Envisioner (GE-Sim), permitindo que a plataforma gere vídeos condicionados à ação baseados em fortes aspectos visuais e físicos. Combinar esses dados com o Isaac Sim e o Isaac Lab, assim como o pós-treinamento com os próprios dados do AgiBot, permite que as políticas desenvolvidas no Genie Envisioner sejam transferidas de forma mais confiável para humanoides Genie2 e robôs compactos de mesa movidos a Jetson Thor.

A Intbot está usando o modelo aberto NVIDIA Cosmos Reason 2 para dar aos seus robôs sociais um “sexto sentido” para o mundo real, usando as capacidades de raciocínio do modelo para identificar pistas sociais simples e contextos de segurança que vão além de simples tarefas roteirizadas. Em sua receita Cosmos Cookbook, a Intbot demonstra como modelos de linguagem raciocínio e visão podem ajudar robôs a decidir quando falar e como interagir de forma mais natural com os humanos.

Como os Desenvolvedores de Robótica Estão Utilizando Novos Kits de Ferramentas e Frameworks

A NVIDIA lançou recentemente o Agile, um motor baseado no Isaac Lab para locomomanipulação humanoide que empacota um workflow completo e simtoverificado para treinar políticas robustas de aprendizado por reforço em plataformas como Unitree G1 e LimX Dynamics TRON.

Desenvolvedores de robótica podem usar as configurações de tarefas integradas do Agile, modelos matemáticos do Processo de Decisão Markov para tomada de decisão, utilitários de treinamento e ferramentas de avaliação determinística para ajustar políticas. Os desenvolvedores podem então testar essas políticas no Isaac Lab e transferir a locomoção e os comportamentos do corpo inteiro para robôs do mundo real de forma mais confiável e eficiente.

Hugging Face e NVIDIA estão reunindo suas comunidades de robótica ao integrar modelos NVIDIA Isaac GR00T N e frameworks de simulação no ecossistema LeRobot. Os desenvolvedores agora podem acessar os modelos N1.6 do Isaac GR00T e o Isaac LabArena diretamente dentro do LeRobot para agilizar o treinamento e a avaliação de políticas.

Além disso, o humanoide open  source Reachy 2 de Hugging Face agora é totalmente interoperável com o NVIDIA Jetson Thor, permitindo a implantação direta de modelos avançados de ação em linguagem de visão (VLA) para um desempenho robusto no mundo real.

A ROBOTIS, uma das principais desenvolvedoras de servos inteligentes, atuadores industriais, manipuladores, plataformas humanoides de código aberto e kits robóticos educacionais, construiu um pipeline de simulação para real de código aberto usando tecnologias NVIDIA Isaac. O workflow começa com a geração de dados de alta fidelidade no Isaac Sim, escala conjuntos de treinamento usando GR00TMimic para aumento e então ajusta um modelo Isaac GR00T N baseado em VLA que é implantado diretamente em hardware, acelerando a transição da simulação para tarefas robustas no mundo real.

Conecte-se

Saiba mais sobre o OpenUSD e o desenvolvimento de robótica explorando estes recursos: