Proteja Data Centers de AI em Escala: DGX SuperPOD de Próxima Geração Inaugura a Era da Supercomputação Nativa do Cloud

por Tony Paikeday

À medida que as empresas estendem o poder da AI e da ciência de dados a todos os desenvolvedores, a IT precisa oferecer acesso perfeito e dimensionável à supercomputação com a simplicidade e a segurança do cloud.

No GTC21, apresentamos o mais novo NVIDIA DGX SuperPOD, que oferece às empresas, à IT e aos usuários uma plataforma para proteger e dimensionar AI em toda a empresa, com o software necessário para gerenciá-la, bem como uma experiência de serviços atenciosa para ajudar na operacionalização.

Solucionando Desafios de AI de Todos os Tamanhos, em Grande Escala

Desde seu lançamento, o DGX SuperPOD permitiu que as empresas dimensionassem seu desenvolvimento em infraestrutura para poder enfrentar problemas de tamanho e complexidade que antes eram insolúveis em um tempo razoável. É uma infraestrutura de AI construída e gerenciada da maneira como a NVIDIA faz com a sua própria.

À medida que a AI é incluída em quase todos os aspectos das empresas modernas, a necessidade de oferecer acesso quase ilimitado a recursos computacionais que potencializam o desenvolvimento tem aumentado exponencialmente. Esse aumento na demanda é exemplificado por aplicações essenciais para os negócios, como processamento de linguagem natural, sistemas de recomendação e pesquisa clínica.

As organizações costumam explorar o poder do DGX SuperPOD de duas formas. Algumas o utilizam para resolver problemas enormes e monolíticos, como a AI conversacional, em que a potência computacional de um DGX SuperPOD inteiro é utilizada para acelerar o treinamento de modelos complexos de processamento de linguagem natural.

Outras utilizam o DGX SuperPOD para atender a uma empresa inteira, fornecendo acesso ao sistema para várias equipes para lidar com necessidades flutuantes em uma ampla variedade de projetos. Desse modo, a IT corporativa muitas vezes atua como um provedor de serviços, gerenciando essa infraestrutura de AI como serviço, com vários usuários (talvez até concorrentes) que necessitam e esperam isolamento completo do trabalho e dos dados uns dos outros.

DGX SuperPOD com DPU BlueField

Cada vez mais, as empresas precisam trazer o mundo da supercomputação de AI de alto desempenho para um modo operacional no qual muitos desenvolvedores podem ter a certeza de que seu trabalho está seguro e isolado como acontece no cloud. E onde a IT pode gerenciar o ambiente de forma muito parecida com um cloud privado, com a capacidade de fornecer recursos para tarefas, com o tamanho certo para a tarefa, em um ambiente seguro e multilocatário.

Isso é chamado de supercomputação nativa do cloud, e ela é habilitada pelas DPUs NVIDIA BlueField-2, que trazem serviços de rede, armazenamento, segurança e gerenciamento do data center acelerados e definidos por software para a infraestrutura de AI.

Com uma unidade de processamento de dados otimizada para implantação empresarial e conectividade de rede de 200 Gbps, as empresas ganham redes de última geração, aceleradas e totalmente programáveis que implementam segurança de confiança zero para proteger contra violações e isolar usuários e dados, com desempenho bare-metal.

Cada DGX SuperPOD agora tem esse recurso com a integração de duas DPUs NVIDIA BlueField-2 em cada nó da DGX A100 em seu interior. Os administradores de IT podem usar os recursos de descarregamento, aceleração e isolamento das DPUs NVIDIA BlueField para implementar segurança multilocatário para infraestrutura de AI compartilhada sem afetar o desempenho de AI do DGX SuperPOD.

Gerenciamento de Infraestrutura com o Base Command Manager

Todas as semanas, a NVIDIA gerencia milhares de cargas de trabalho de AI executadas em nossa infraestrutura interna DGX SATURNV, que inclui mais de 2.000 sistemas DGX. Até o momento, já executamos mais de 1,2 milhão de tarefas, apoiando mais de 2.500 desenvolvedores em mais de 200 equipes. Também desenvolvemos software de gerenciamento de infraestrutura de última geração que garante que todos os desenvolvedores da NVIDIA são totalmente produtivos enquanto executam suas pesquisas e desenvolvem nossa tecnologia de sistemas autônomos, robótica, simulações e muito mais.

O software auxilia em todo esse trabalho, simplifica e otimiza o gerenciamento e permite que nossa equipe de IT monitore a integridade, a utilização, o desempenho e muito mais. Estamos adicionando esse mesmo software, chamado de Base Command Manager da NVIDIA, ao DGX SuperPOD para que as empresas possam executar seus ambientes da maneira como nós fazemos. Melhoraremos o Base Command Manager de forma contínua, oferecendo as inovações mais atuais aos clientes automaticamente.

Serviços Especializados

A implantação de infraestrutura de AI é mais do que simplesmente instalar servidores e armazenamento em racks de data center. Quando uma empresa decide dimensionar a AI, eles precisam de uma experiência especializada que as oriente desde o design até a implantação e a operacionalização, sem sobrecarregar a equipe de IT para descobrir como utilizar depois que as “chaves” são entregues.

Com os Serviços Especializados DGX SuperPOD, os clientes desfrutam de uma experiência completa de serviços de ciclo de vida que é apoiada por expertise comprovada, desde a instalação até as operações. Os clientes beneficiam-se do desempenho pré-entrega certificado no próprio cluster de aceitação da NVIDIA, que valida que o sistema implantado está sendo executado de acordo com as especificações antes de ser entregue.

Os Serviços Especializados também incluem uma equipe multidisciplinar dedicada da NVIDIA que abrange tudo, desde a instalação até o gerenciamento de infraestrutura e workflow, a resolução de gargalos que impactam o desempenho e otimizações. Os serviços foram projetados para oferecer aos líderes de IT tranquilidade e confiança ao levarem seus negócios para o DGX SuperPOD.

DGX SuperPOD no GTC21

Para saber mais sobre o DGX SuperPOD e como você pode consolidar a infraestrutura de AI e centralizar o desenvolvimento em toda a empresa, confira nossa sessão apresentada por Charlie Boyle, vice-presidente e gerente-geral de Sistemas DGX, que apresentou nossas novidades do DGX SuperPOD e muito mais em duas sessões separadas no GTC:

Saiba mais: