Tornando Espaços Mais Seguros: NVIDIA e Parceiros Trazem IA Física para Cidades e Infraestrutura Industrial

Projetos avançados, modelos de linguagem de visão e extensões de geração de dados sintéticos acelerados pelas GPUs NVIDIA RTX PRO 6000 Blackwell aumentam a produtividade e melhoram a segurança em todos os ambientes.
por Adam Scraba

A IA física está se tornando a base de cidades, instalações e processos industriais inteligentes em todo o mundo.

A NVIDIA está trabalhando com empresas como Accenture, Avathon, Belden, DeepHow, Milestone Systems e Telit Cinterion para aprimorar as operações em todo o mundo com percepção e raciocínio físicos baseados em IA.

O ciclo contínuo de simulação, treinamento e implantação de IA física oferece recursos sofisticados de automação industrial, tornando as cidades e a infraestrutura mais seguras, inteligentes e eficientes.

Por exemplo, aplicações de IA física podem automatizar tarefas potencialmente perigosas para os trabalhadores, como trabalhar com máquinas pesadas. A IA física também pode melhorar os serviços de transporte e a segurança pública, detectar produtos defeituosos em fábricas e muito mais.

A necessidade disso é maior do que nunca. Os números contam a história:

Statistics in infographic: $7 Trillion lost annually due to poor quality and defects in manufacturing. ~2.8 Million workers die annually from occupational accidents and work-related diseases. 514,000 industrial robots installed worldwide in 2024. $300 billion spent per year on public order and safety in the EU. By 2030, projected global labor shortage of 50 million.

A infraestrutura que pode perceber, raciocinar e agir depende de sensores de vídeo e dos mais recentes recursos de IA de visão. Usando a plataforma NVIDIA Metropolis, que simplifica o desenvolvimento, a implantação e o dimensionamento de agentes de IA de análise de vídeo e serviços do edge à nuvem, os desenvolvedores podem criar percepção visual em suas instalações mais rapidamente para aumentar a produtividade e melhorar a segurança em todos os ambientes.

Abaixo estão cinco empresas líderes no avanço da IA física e cinco atualizações importantes do NVIDIA Metropolis, anunciadas recentemente na conferência de computação gráfica SIGGRAPH, tornando esses avanços possíveis.

Cinco Empresas Que Promovem a IA Física

A Accenture, empresa global de serviços profissionais, está colaborando com a Belden, fornecedora líder de soluções completas de conexão, para aumentar a segurança do trabalhador, criando cercas virtuais inteligentes que as fábricas podem colocar ao redor de grandes robôs para evitar acidentes com operadores humanos.

Smart fence image.
Imagem cortesia da Accenture e Belden.

A cerca virtual inteligente é um sistema de segurança físico de IA que usa um gêmeo digital baseado em OpenUSD e simulação baseada na física para modelar ambientes industriais complexos. Usando mapeamento baseado em visão computacional e inteligência espacial 3D, o sistema é adaptável ao aumento da variabilidade nas interações dinâmicas homem-robô que ocorrem em um ambiente moderno de chão de fábrica.

A Accenture aproveita a  plataforma NVIDIA Omniverse e o Metropolis para construir e simular essas cercas inteligentes. Com o Omniverse, a Accenture criou um gêmeo digital de um braço robótico e trabalhadores se movendo em um espaço. E com o Metropolis, a empresa treinou seus modelos de IA e os implantou no edge com ingestão de vídeo e os recursos de inferência em tempo real do kit de desenvolvimento de software (SDK) NVIDIA DeepStream.

A Avathon, fornecedora de plataforma de automação industrial, usa o NVIDIA Blueprint para pesquisa e resumo de vídeo (VSS), parte do NVIDIA Metropolis, para fornecer às instalações de manufatura e energia insights em tempo real que melhoram a eficiência operacional e a segurança do trabalhador.

A Reliance British Petroleum Mobility Limited, líder no setor de combustível e mobilidade da Índia, usou o produto de inteligência de vídeo Avathon durante a construção de seus postos de gasolina para alcançar padrões mais altos de conformidade de segurança, redução de incidentes de não conformidade de segurança e maior produtividade, economizando milhares de horas de trabalho.

A DeepHow desenvolveu um “Smart Know-How Companion” para funcionários da manufatura e de outras indústrias. O companheiro usa o projeto Metropolis VSS para transformar os principais workflows em vídeos multilíngues e instruções digitais, melhorando a integração, a segurança e a eficiência do operador de chão.

Enfrentando necessidades de qualificação e trabalhadores qualificados aposentados, a empresa de bebidas Anheuser-Busch InBev recorreu à plataforma DeepHow para converter procedimentos operacionais padrão em guias visuais fáceis de entender. Isso reduziu o tempo de integração em 80%, aumentou a consistência do treinamento e melhorou a retenção de conhecimento a longo prazo para os funcionários.

A Milestone Systems, que oferece uma das maiores plataformas do mundo para gerenciar dados de sensores de vídeo IP em implantações industriais e urbanas complexas, está criando a maior biblioteca de dados de visão computacional do mundo real por meio de sua plataforma, o Projeto Hafnia. Entre seus recursos, a plataforma fornece aos desenvolvedores de IA física acesso a modelos de linguagem de visão (VLMs) personalizados.

Aproveitando o NVIDIA NeMo Curator, a Milestone Systems criou um VLM ajustado para sistemas de transporte inteligentes para uso no projeto VSS para ajudar a desenvolver agentes de IA que gerenciam melhor as estradas da cidade. A Milestone Systems também está procurando usar o novo VLM NVIDIA Cosmos Reason aberto e personalizável para IA física.

Empresa de Internet das Coisas Telit Cinterion integrou Kit de Ferramentas NVIDIA TAO 6.0 em sua plataforma de inspeção visual alimentada por IA, que usa modelos de base de visão como o FoundationPose, juntamente com outros modelos da NVIDIA, para oferecer suporte à IA multimodal e fornecer inferência de alto desempenho. O TAO traz recursos de IA de baixo código para a plataforma Telit, permitindo que os fabricantes desenvolvam e implantem rapidamente modelos de IA precisos e personalizados para detecção de defeitos e controle de qualidade.

Cinco Atualizações do NVIDIA Metropolis para IA Física

As principais atualizações do NVIDIA Metropolis estão aprimorando os recursos dos desenvolvedores para criar aplicações de IA física com mais rapidez e facilidade:

Cosmos Reason VLM

A versão mais recente do Cosmos Reason, o VLM avançado de raciocínio aberto, personalizável e de 7 bilhões de parâmetros da NVIDIA para IA física, permite a compreensão contextual de vídeo e o raciocínio de eventos temporais para casos de uso do Metropolis. Seu tamanho compacto facilita a implantação do edge à nuvem e é ideal para automatizar o monitoramento de tráfego, segurança pública, inspeção visual e tomada de decisão inteligente.

VSS Blueprint 2.4

O VSS 2.4 facilita o aumento rápido das aplicações de IA de visão existentes com o Cosmos Reason e fornece novos recursos poderosos para a infraestrutura inteligente. Um conjunto expandido de interfaces de programação de aplicações no blueprint oferece aos usuários mais flexibilidade direta na escolha de componentes e recursos VSS específicos para aumentar pipelines de visão computacional com IA generativa.

Novos Modelos Base de Visão

O NVIDIA TAO Toolkit inclui um novo conjunto de modelos de base de visão, juntamente com métodos avançados de ajuste fino, aprendizado auto-supervisionado e recursos de destilação de conhecimento, para otimizar a implantação de soluções físicas de IA em ambientes de edge e nuvem. O SDK NVIDIA DeepStream inclui um novo Construtor de Inferência para permitir a implantação perfeita de modelos TAO 6.

Empresas em todo o mundo, incluindo Advex AI, Instrumental AI e Spingence, estão experimentando esses novos modelos e o NVIDIA TAO para criar soluções inteligentes que otimizam as operações industriais e aumentam a eficiência.

Extensões NVIDIA Isaac Sim

Novas extensões na aplicação de referência NVIDIA Isaac Sim ajudam a resolver desafios comuns no desenvolvimento de IA de visão, como dados rotulados limitados e cenários raros de casos extremos. Essas ferramentas simulam interações humanas e robóticas, geram conjuntos de dados avançados de detecção de objetos e criam cenas baseadas em incidentes e pares de legendas de imagem para treinar VLMs, acelerando o desenvolvimento e melhorando o desempenho da IA em condições do mundo real.

Suporte de Hardware Expandido

Todos esses componentes do Metropolis agora podem ser executados em GPUs NVIDIA RTX PRO 6000 Blackwell, no supercomputador de desktop NVIDIA DGX Spark e na plataforma NVIDIA Jetson Thor para IA física e robótica humanóide para que os usuários possam desenvolver e implantar do edge para a nuvem.

Cosmos Reason 1 e NVIDIA TAO 6.0 já estão disponíveis para download. Inscreva-se para ser informado quando o VSS 2.4, a atualização de ajuste fino do Cosmos Reason VLM e o NVIDIA DeepStream 8.0 estiverem disponíveis.