Projetar, simular e criar data centers modernos é incrivelmente complexo, envolvendo várias considerações como desempenho, eficiência energética e escalabilidade.
Também requer reunir uma equipe de engenheiros altamente qualificados em computação e projeto de rede, modelagem CAD (computer-aided design) e projeto mecânico, elétrico e térmico.
A NVIDIA constrói os supercomputadores de IA mais avançados do mundo e no GTC revelou seu mais recente: um grande cluster baseado no sistema NVIDIA GB200 NVL72 refrigerado a líquido. Ele consiste em dois racks, cada um contendo 18 CPUs NVIDIA Grace e 36 GPUs NVIDIA Blackwell, conectados por switches NVIDIA NVLink de quarta geração .
No showfloor, a NVIDIA demonstrou este data center totalmente operacional como um gêmeo digital no NVIDIA Omniverse, uma plataforma para conectar e construir pipelines, ferramentas, aplicações e serviços 3D habilitados para IA generativa.
Para criar novos data centers o mais rápido possível, a NVIDIA primeiro construiu seu gêmeo digital com ferramentas de software conectadas pelo Omniverse. Os engenheiros unificaram e visualizaram vários conjuntos de dados CAD em total precisão física e fotorrealismo no Universal Scene Description (OpenUSD) usando a plataforma de gêmeos digitais Cadence Reality, impulsionada por APIs NVIDIA Omniverse.
Projete, Simule e Otimize com Maior Eficiência e Precisão
O novo cluster GB200 está substituindo um cluster existente em um dos data centers legados da NVIDIA. Para iniciar a construção digital, a empresa de tecnologia Kinetic Vision escaneou a instalação usando o scanner lidar vestível NavVis VLX para produzir dados na nuvem de pontos e fotos panorâmicas altamente precisas.
Em seguida, o software Prevu3D foi usado para remover os clusters existentes e converter a nuvem de pontos em uma malha 3D. Isso forneceu um modelo 3D fisicamente preciso da instalação, no qual o novo data center digital poderia ser simulado.
Os engenheiros combinaram e visualizaram vários conjuntos de dados CAD com precisão e realismo aprimorados usando a plataforma Cadence Reality. A integração da plataforma com o Omniverse forneceu uma plataforma de computação poderosa que permitiu que as equipes desenvolvessem ferramentas, workflows e aplicações 3D baseados em OpenUSD.
As APIs do Omniverse Cloud também adicionaram interoperabilidade com mais ferramentas, incluindo PATCH MANAGER e NVIDIA Air. Com o PATCH MANAGER, a equipe projetou o layout físico de seu cluster e infraestrutura de rede, garantindo que os comprimentos de cabeamento fossem precisos e o roteamento fosse configurado corretamente.
A equipe usou os solvers Reality Digital Twin da Cadence, acelerados pelas APIs NVIDIA Modulus e NVIDIA Grace Hopper, para simular os fluxos de ar, bem como o desempenho dos novos sistemas de resfriamento líquido de parceiros como Vertiv e Schneider Electric. Os sistemas integrados de refrigeração das bandejas GB200 foram simulados e otimizados usando soluções da Ansys, que trouxe dados de simulação para o gêmeo digital.
A demonstração mostrou como os gêmeos digitais podem permitir que os usuários testem, otimizem e validem totalmente os projetos de data centers antes de produzir um sistema físico. Ao visualizar o desempenho do data center no gêmeo digital, as equipes podem otimizar melhor seus projetos e planejar cenários hipotéticos.
Os usuários também podem aprimorar os projetos de data center e cluster equilibrando conjuntos diferentes de condições de contorno, como comprimentos de cabeamento, energia, resfriamento e espaço, de maneira integrada, permitindo que engenheiros e equipes de projeto coloquem os clusters on-line muito mais rápido e com mais eficiência e otimização do que antes.
Saiba mais sobre os sistemas NVIDIA GB200 NVL72 e NVIDIA Omniverse.