A Solução de Três Computadores: Impulsionando a Próxima Onda de Robótica de IA

Sistemas industriais e físicos baseados em IA, de humanóides a fábricas, estão sendo acelerados por meio de treinamento, simulação e inferência.
por Madison Huang

O ChatGPT marcou o momento big bang da IA generativa. As respostas podem ser geradas em resposta a praticamente qualquer consulta, ajudando a transformar o trabalho digital, como criação de conteúdo, atendimento ao cliente, desenvolvimento de software e operações de negócios para trabalhadores do conhecimento.

A IA física, a personificação da inteligência artificial em humanóides, fábricas e outros dispositivos dentro de sistemas industriais, ainda não experimentou seu momento de avanço.

Isso atrasou setores como transporte e mobilidade, manufatura, logística e robótica. Mas isso está prestes a mudar graças a três computadores que reúnem treinamento avançado, simulação e inferência.

A Ascensão da IA Física Multimodal

Por 60 anos, o “Software 1.0”, código serial escrito por programadores humanos, rodou em computadores de uso geral impulsionados por CPUs.

Então, em 2012, Alex Krizhevsky, orientado por Ilya Sutskever e Geoffrey Hinton, venceu a competição de reconhecimento de imagem de computador ImageNet com o AlexNet, um modelo revolucionário de deep learning para classificação de imagens.

Isso marcou o primeiro contato da indústria com a IA. O avanço do machine learning, redes neurais executadas em GPUs, deu início à era do Software 2.0.

Hoje, o software escreve software. As cargas de trabalho de computação do mundo estão mudando da computação de uso geral em CPUs para a computação acelerada em GPUs, deixando a lei de Moore muito para trás.

Com  a IA generativa, os modelos de transformação e difusão multimodais foram treinados para gerar respostas.

Grandes modelos de linguagem são unidimensionais, capazes de prever o próximo token, em modos como letras ou palavras. Os modelos de geração de imagem e vídeo são bidimensionais, capazes de prever o próximo pixel.

Nenhum desses modelos pode entender ou interpretar o mundo tridimensional. E é aí que entra a IA física.

Os modelos de IA física podem perceber, entender, interagir e navegar no mundo físico com IA generativa. Com a computação acelerada, os avanços da IA física multimodal e as simulações físicas em larga escala estão permitindo que o mundo perceba o valor da IA física por meio de robôs.

Um robô é um sistema que pode perceber, raciocinar, planejar, agir e aprender. Os robôs são frequentemente considerados robôs móveis autônomos (AMRs), braços manipuladores ou humanóides. Mas existem muitos outros tipos de formas de realização robóticas.

Em um futuro próximo, tudo o que se move, ou que monitora as coisas que se movem, serão sistemas robóticos autônomos. Esses sistemas serão capazes de detectar e responder aos seus ambientes.

Tudo, desde salas cirúrgicas a data centers, armazéns a fábricas, até mesmo sistemas de controle de tráfego ou cidades inteligentes inteiras se transformarão de sistemas estáticos operados manualmente em sistemas autônomos e interativos incorporados por IA física.

A Próxima Fronteira: Robôs Humanóides

Os robôs humanóides são uma manifestação robótica ideal de uso geral porque podem operar com eficiência em ambientes construídos para humanos, exigindo ajustes mínimos para implantação e operação.

O mercado global de robôs humanóides deve chegar a US$ 38 bilhões até 2035, um aumento de mais de seis vezes em relação aos cerca de US$ 6 bilhões previstos para o período previsto há quase dois anos, de acordo com o Goldman Sachs.

Pesquisadores e desenvolvedores de todo o mundo estão correndo para construir essa próxima onda de robôs.

Três Computadores para Desenvolver IA Física

Para desenvolver robôs humanóides, três sistemas de computador acelerados são necessários para lidar com IA física e treinamento, simulação e tempo de execução de robôs. Dois avanços na computação estão acelerando o desenvolvimento de robôs humanóides: modelos de base multimodais e simulações escaláveis e baseadas em física de robôs e seus mundos.

Os avanços na IA generativa estão trazendo percepção, controle, planejamento de habilidades e inteligência 3D para os robôs. A simulação de robôs em escala permite que os desenvolvedores refinem, testem e otimizem as habilidades dos robôs em um mundo virtual que imita as leis da física, ajudando a reduzir os custos de aquisição de dados do mundo real e garantindo que eles possam funcionar em ambientes seguros e controlados.

A NVIDIA construiu três computadores e acelerou plataformas de desenvolvimento para permitir que os desenvolvedores criem IA física.

Primeiro, os modelos são treinados em um supercomputador. Os desenvolvedores podem usar o NVIDIA NeMo na  plataforma NVIDIA DGX para treinar e ajustar modelos poderosos de IA generativa e de base. Eles também podem aproveitar  o NVIDIA Project GR00T, uma iniciativa para desenvolver modelos base de uso geral para robôs humanóides para permitir que eles entendam a linguagem natural e emulem movimentos observando as ações humanas.

Em segundo lugar, o NVIDIA Omniverse, executado em servidores NVIDIA OVX, fornece a plataforma de desenvolvimento e o ambiente de simulação para testar e otimizar a IA física com interfaces e frameworks de programação de aplicações como o NVIDIA Isaac Sim.

Os desenvolvedores podem usar o Isaac Sim para simular e validar modelos de robôs ou gerar grandes quantidades de dados sintéticos baseados em física para inicializar o treinamento de modelos de robôs. Pesquisadores e desenvolvedores também podem usar o NVIDIA Isaac Lab, um framework de aprendizado de robôs de código aberto que potencializa o aprendizado por reforço de robôs e o aprendizado de imitação, para ajudar a acelerar o treinamento e o refinamento de políticas de robôs.

Por fim, os modelos de IA treinados são implantados em um computador de tempo de execução. Os computadores robóticos NVIDIA Jetson Thor são projetados especificamente para necessidades compactas de computação integrada. Um conjunto de modelos que consiste em modelos de política de controle, visão e linguagem compõe o cérebro do robô e é implantado em um sistema de computação no edge integrado com baixo consumo de energia.

Dependendo de seus workflows e áreas de desafio, os fabricantes de robôs e desenvolvedores de modelos base podem usar quantas plataformas e sistemas de computação acelerada forem necessários.

Construindo a Próxima Onda de Instalações Autônomas

As instalações robóticas resultam da culminação de todas essas tecnologias.

Fabricantes como a Foxconn ou empresas de logística como a Amazon Robotics podem orquestrar equipes de robôs autônomos para trabalhar ao lado de trabalhadores humanos e monitorar as operações da fábrica por meio de centenas ou milhares de sensores.

Esses armazéns, fábricas e fábricas autônomas terão gêmeos digitais. Os gêmeos digitais são usados para planejamento e otimização de layout, simulação de operações e, o mais importante, testes de software em loop de frota de robôs.

Construído no Omniverse, o “Mega” é um projeto para gêmeos digitais de fábrica que permite que as empresas industriais testem e otimizem suas frotas de robôs em simulação antes de implantá-las em fábricas físicas. Isso ajuda a garantir uma integração perfeita, desempenho ideal e interrupção mínima.

O Mega permite que os desenvolvedores preencham seus gêmeos digitais de fábrica com robôs virtuais e seus modelos de IA, ou os cérebros dos robôs. Os robôs no gêmeo digital executam tarefas percebendo seu ambiente, raciocinando, planejando seu próximo movimento e, finalmente, concluindo as ações planejadas.

Essas ações são simuladas no ambiente digital pelo simulador de mundo no Omniverse, e os resultados são percebidos pelos cérebros dos robôs por meio da simulação do sensor Omniverse.

Com simulações de sensores, os cérebros dos robôs decidem a próxima ação e o loop continua, enquanto o Mega rastreia meticulosamente o estado e a posição de cada elemento dentro do gêmeo digital de fábrica.

Essa metodologia avançada de teste de software em loop permite que as empresas industriais simulem e validem mudanças dentro dos limites seguros do gêmeo digital Omniverse, ajudando-as a antecipar e mitigar possíveis problemas para reduzir riscos e custos durante a implantação no mundo real.

Capacitando o Ecossistema de Desenvolvedores com a Tecnologia NVIDIA

A NVIDIA acelera o trabalho do ecossistema global de desenvolvedores de robótica e construtores de modelos base de robôs com três computadores.

A Universal Robots, uma empresa da Teradyne Robotics, usou o NVIDIA Isaac Manipulator, bibliotecas aceleradas Isaac e modelos de IA e NVIDIA Jetson Orin para criar o UR AI Accelerator, um kit de ferramentas de hardware e software pronto para uso que permite que os desenvolvedores de cobots criem aplicações, acelerem o desenvolvimento e reduzam o tempo de lançamento de produtos de IA no mercado.

A RGo Robotics usou  o NVIDIA Isaac Perceptor para ajudar seus wheel.me AMRs a trabalhar em qualquer lugar, o tempo todo, e tomar decisões inteligentes, dando-lhes percepção semelhante à humana e informações visuais-espaciais.

Fabricantes de robôs humanóides, incluindo 1X Technologies, Agility Robotics, Apptronik, Boston Dynamics, Fourier, Galbot, Mentee, Sanctuary AI, Unitree Robotics e XPENG Robotics, estão adotando a plataforma de desenvolvimento de robótica da NVIDIA.

A Boston Dynamics está usando Isaac Sim e Isaac Lab para construir quadrúpedes e robôs humanóides para aumentar a produtividade humana, combater a escassez de mão de obra e priorizar a segurança nos armazéns.

A Fourier está aproveitando Isaac Sim para treinar robôs humanóides para operar em campos que exigem altos níveis de interação e adaptabilidade, como pesquisa científica, saúde e manufatura.

Usando Isaac Lab e Isaac Sim, a Galbot avançou no desenvolvimento de um conjunto de dados robóticos de preensão hábil em larga escala chamado DexGraspNet, que pode ser aplicado a diferentes mãos robóticas hábeis, bem como um ambiente de simulação para avaliar modelos de preensão hábeis.

A Field AI desenvolveu modelos de base multitarefa e multiuso com limite de risco para que os robôs operem com segurança em ambientes de campo externos, usando a plataforma Isaac e o Isaac Lab.

A era da IA física está aqui, e está transformando as indústrias pesadas e a robótica do mundo.

Comece a usar a NVIDIA Robotics.