Chegou a Supercomputação Nativa do Cloud: Afinal, o Que É um Supercomputador Nativo do Cloud?

A Universidade de Cambridge, no Reino Unido, e um NVIDIA DGX SuperPOD apontam o caminho para a próxima geração de clouds seguros e eficientes de HPC.
por Rick Merritt

A supercomputação nativa do cloud é a próxima grande novidade do setor. Ela já chegou e está pronta para lidar com as cargas de trabalho de HPC e AI mais difíceis.

A Universidade de Cambridge está construindo um supercomputador nativo do cloud no Reino Unido. Duas equipes de pesquisadores dos Estados Unidos estão desenvolvendo separadamente elementos importantes do software para esse tipo de supercomputação.

O Los Alamos National Laboratory, em uma colaboração contínua com o UCF Consortium, está ajudando a oferecer recursos que aceleram os algoritmos de dados. A Universidade Estadual de Ohio está atualizando softwares com o padrão Message Passing Interface para aprimorar simulações científicas.

A NVIDIA disponibiliza supercomputadores nativos do cloud para usuários em todo o mundo na forma do DGX SuperPOD mais atual. Ele apresenta componentes importantes, como a unidade de processamento de dados (DPU – Data Processing Unit) NVIDIA BlueField-2, que já está em produção.

Afinal, o Que É Supercomputação Nativa do Cloud?

Assim como um Bis, com o crocante biscoito e a macia cobertura de chocolate, os supercomputadores nativos do cloud oferecem o melhor dos dois mundos.

Eles combinam a potência da computação de alto desempenho com a segurança e a facilidade de uso dos serviços de computação no cloud.

Em outras palavras, a supercomputação nativa do cloud oferece um cloud de HPC com um sistema tão potente quanto um supercomputador TOP500 que vários usuários podem compartilhar com segurança, sem sacrificar o desempenho das aplicações.

cloud-native supercomputer chart
A DPU BlueField é dedicada a tarefas de segurança, comunicação e gerenciamento, o que contribui para a criação de um supercomputador nativo do cloud eficiente.

 

O Que os Supercomputadores Nativos do Cloud Podem Fazer?

Os supercomputadores nativos do cloud oferecem dois principais recursos.

Eles permitem que vários usuários compartilhem um supercomputador, além de garantir a segurança e a privacidade da carga de trabalho de cada usuário. É um recurso conhecido como “isolamento multilocatário”, que está disponível nos serviços comerciais de computação em cloud de hoje. Porém, geralmente ele não se encontra em sistemas de HPC usados para cargas de trabalho técnicas e científicas, em que o desempenho bruto é a maior prioridade e os serviços de segurança deixam as operações lentas.

Além disso, os supercomputadores nativos do cloud usam DPUs para realizar tarefas como as de armazenamento, segurança para isolamento de locatários e gerenciamento de sistemas. Com isso, a CPU fica livre para se dedicar ao processamento de tarefas, maximizando o desempenho geral do sistema.

O resultado é um supercomputador que proporciona serviços nativos do cloud sem a perda de desempenho. No futuro, as DPUs poderão se dedicar à realização de mais tarefas, e os sistemas poderão manter a eficiência máxima ao executar cargas de trabalho de HPC e AI.

Como Funcionam os Supercomputadores Nativos do Cloud?

Os supercomputadores atuais têm dois tipos de cérebro: CPUs e aceleradores, geralmente GPUs.

Os aceleradores reúnem milhares de núcleos de processamento para acelerar operações paralelas que são a base de muitas cargas de trabalho de AI e HPC. As CPUs são destinadas às partes dos algoritmos que exigem processamento serial rápido. Porém, com o tempo, elas ficaram sobrecarregadas com cada vez mais camadas de tarefas de comunicação necessárias para gerenciar sistemas complexos e em constante crescimento.

Os supercomputadores nativos do cloud têm um terceiro cérebro que deixa os sistemas mais rápidos e mais eficientes. Além disso, eles têm DPUs, componentes dedicados às tarefas de segurança, comunicação e armazenamento, entre outras, que os sistemas modernos precisam realizar.

Uma Faixa Rápida para Supercomputadores

Nos supercomputadores tradicionais, às vezes uma tarefa de computação precisa esperar a CPU terminar de realizar uma tarefa de comunicação. É um problema comum que gera o chamado ruído do sistema.

Nos supercomputadores nativos do cloud, a computação e a comunicação ocorrem em paralelo. É como se houvesse uma terceira faixa na pista para ajudar o trânsito a fluir melhor.

Testes iniciais mostram que esses supercomputadores podem realizar tarefas de HPC 1,4 vez mais rápido que os tradicionais, de acordo com a pesquisa do laboratório MVAPICH da Universidade Estadual de Ohio, que é especialista em comunicação de HPC. O laboratório também mostrou que os supercomputadores nativos do cloud atingem uma sobreposição de 100% das funções de computação e comunicação, 99% maior que a dos sistemas de HPC existentes.

Especialistas Falam sobre Supercomputação Nativa do Cloud

É por isso que a supercomputação nativa do cloud está começando a ser usada ao redor do mundo.

“Estamos construindo o primeiro supercomputador acadêmico nativo do cloud da Europa a oferecer desempenho bare-metal com serviços InfiniBand nativos do cloud.

“Esse sistema, que figuraria entre os 100 melhores na lista TOP500 de novembro de 2020, permitirá que os pesquisadores otimizem aplicações usando os avanços mais atuais em arquitetura de supercomputação”, disse Paul Calleja, Diretor de Computação da Universidade de Cambridge.

Especialistas em HPC estão abrindo o caminho para outros avanços em supercomputadores nativos do cloud.

“O UCF Consortium, que reúne líderes acadêmicos e do setor, está criando os frameworks de comunicação de nível de produção e os padrões abertos necessários para possibilitar o futuro da supercomputação nativa do cloud”, afirmou Steve Poole, Diretor do Unified Communication Framework, que tem entre seus membros representantes da Arm, da IBM e da NVIDIA, além de laboratórios e universidades dos EUA.

“Nossos testes mostram que os supercomputadores nativos do cloud têm a eficiência arquitetônica para elevar os supercomputadores a um novo patamar de HPC, além de possibilitar novos recursos de segurança”, declarou Dhabaleswar K. (DK) Panda, Professor de Ciência da Computação e Engenharia da Universidade Estadual de Ohio e Líder do Network-Based Computing Laboratory.

Saiba Mais Sobre Supercomputadores Nativos do Cloud

Para saber mais, confira nossa visão geral técnica sobre supercomputação nativa do cloud. Também é possível encontrar mais informações on-line sobre o novo sistema da Universidade de Cambridge e o supercomputador nativo do cloud da NVIDIA.

Para saber mais sobre os avanços mais atuais em HPC, AI e muito mais, assista à apresentação de abertura do GTC deste ano.