Superpoderes de Supercomputação: NVIDIA Leva Simulação de Digital Twin para Operadores de Data Center de HPC

Além dos workflows científicos e industriais, o NVIDIA Omniverse permite que designers, desenvolvedores e operadores das instalações mais complexas do mundo se beneficiem da potência dos mundos virtuais.
por MARC HAMILTON

As tecnologias que alimentam os 7 milhões de data centers do mundo estão mudando rapidamente, sendo que as mais atuais delas permitiram às empresas de TI reduzir os custos mesmo enquanto lidavam com um crescimento exponencial de dados.

Simulação e digital twins podem ajudar designers de data centers, desenvolvedores e operadores a criar instalações altamente eficientes e de alto desempenho. Porém, construir um digital twin que possa representar com precisão todos os componentes de uma instalação de supercomputação de AI é uma tarefa enorme e complexa.

A plataforma de simulação NVIDIA Omniverse ajuda a enfrentar esse desafio simplificando o processo de design virtual colaborativo. Uma demonstração do Omniverse na SC22 mostrou como as pessoas por trás dos data centers podem usar essa plataforma aberta de desenvolvimento aberto para aprimorar o design e o desenvolvimento de instalações complexas de supercomputação.

Com o Omniverse, pela primeira vez, os operadores de data centers podem agregar dados em tempo real fazendo uso das principais aplicações de design, simulação e monitoramento auxiliado por computador para que possam ver e trabalhar com os conjuntos de dados completos em tempo real.

A demonstração mostra como o Omniverse permite que os usuários aproveitem o poder da computação acelerada, da simulação e dos digital twins operacionais conectados à AI e ao monitoramento em tempo real. Isso permite que as equipes simplifiquem o design das instalações, acelerem a construção e a implantação e otimizem as operações em andamento.

A demonstração também destacou o NVIDIA Air, uma plataforma de simulação de data center desenvolvida para funcionar em conjunto com o Omniverse para simular a rede, o sistema nervoso central do data center. Com a NVIDIA Air, as equipes podem modelar todo o pacote de rede, permitindo automatizar e validar o hardware e o software de rede antes do uso.

Criando Digital Twins para Elevar o Design e a Simulação

No planejamento e na construção de um dos supercomputadores de AI mais atuais da NVIDIA, vários conjuntos de dados de CAD de engenharia foram coletados de ferramentas de terceiros do setor, como Autodesk Revit, o Creo da PTC e o SketchUp da Trimble. Isso permitiu que designers e engenheiros visualizassem o modelo baseado no Universal Scene Description com fidelidade total e pudessem fazer iterações colaborativas sobre o design em tempo real.

O PATCH MANAGER é uma aplicação de software empresarial para planejamento de cabeamentos, ativos e conectividade física entre camadas ponto a ponto em domínios de rede. Com o PATCH MANAGER conectado ao Omniverse, a topologia complexa de conexões entre portas, os layouts de rack e nó e o cabeamento podem ser integrados diretamente ao modelo ao vivo. Isso permite que os engenheiros de data center tenham a visão completa do modelo e de suas dependências.

Para prever transferências de fluxo ar e calor, os engenheiros usaram o Cadence 6SigmaDCX, um software para dinâmica de fluidos computacionais. Os engenheiros também podem usar substitutos de AI treinados com o NVIDIA Modulus para análise de cenários “e se”, quase em tempo real. Isso permite que as equipes simulem mudanças em temperaturas e resfriamento complexas, e elas podem ver os resultados instantaneamente.

Com o NVIDIA Air, a topologia exata da rede, incluindo protocolos, monitoramento e automação, pode ser simulada e pré-validada.

Depois que a construção de um data center é concluída, seus sensores, sistema de controle e telemetria podem ser conectados ao digital twin no Omniverse, possibilitando o monitoramento em tempo real das operações.

Com um digital twin perfeitamente sincronizado, os engenheiros podem simular perigos comuns, como picos de energia ou falhas do sistema de resfriamento. Os operadores podem se beneficiar de mudanças recomendadas por AI que otimizam as maiores prioridades, como aumentar a eficiência energética e reduzir a pegada de carbono. O digital twin também permite testar e validar upgrades de software e componentes antes de serem implantados no data center físico.

Acompanhe os anúncios mais recentes assistindo à apresentação especial da NVIDIA na SC22 e saiba mais sobre o NVIDIA Omniverse.