Em toda a Europa e nos EUA, os desenvolvedores de HPC estão carregando supercomputadores com o poder de núcleos Arm e aceleradores dentro das DPUs NVIDIA BlueField-2.
No Los Alamos National Laboratory (LANL) esse trabalho é uma parte de uma ampla colaboração de vários anos com a NVIDIA que visa velocidades de 30 vezes em aplicações multi-físicas computacionais.
Os pesquisadores da LANL prevêem ganhos significativos de desempenho usando unidades de processamento de dados (DPUs) rodando em redes NVIDIA Quantum InfiniBand. Eles serão pioneiros em técnicas de armazenamento computacional, correspondência de padrões e muito mais usando BlueField e seu framework de software NVIDIA DOCA.
Uma API Aberta para DPUs
Os esforços também ajudarão a definir ainda mais o OpenSNAPI, uma interface de aplicação que qualquer pessoa pode usar para aproveitar DPUs. Poole preside o projeto OpenSNAPI no Unified Computing Framework, um consórcio cujos membros incluem Arm, IBM, NVIDIA, laboratórios nacionais dos EUA e universidades dos EUA.
O LANL já está sentindo o poder da computação em rede graças a um sistema de armazenamento impulsionado por DPU.
O Accelerated Box of Flash combina armazenamento de estado sólido com aceleradores DPU e InfiniBand para acelerar partes críticas de desempenho de um sistema de arquivos Linux. Ele é até 30 vezes mais rápido do que sistemas de armazenamento semelhantes e deve se tornar um componente-chave na infraestrutura do LANL.
O ABoF coloca a computação próxima ao armazenamento para minimizar a movimentação de dados e melhorar a eficiência dos pipelines de simulação e análise de dados”, disse um pesquisador em um blog recente da LANL.
Texas é um Supernativo do Cloud
O Texas Advanced Computing Center (TACC) é o mais atual adotante da BlueField-2. Ele usará as DPUs em uma rede InfiniBand para tornar seu sistema Lonestar6 uma plataforma de desenvolvimento para supercomputação nativa do cloud.
A Lonestar6 do TACC atende uma ampla faixa de desenvolvedores de HPC na Texas A&M University, Universidade de Tecnologia do Texas e Universidade do Norte do Texas, bem como vários centros de pesquisa e o corpo docente.
A MPI é Acelerada
Mil e duzentos quilômetros ao nordeste, Pesquisadores da Universidade Estadual de Ohio mostraram como as DPUs podem fazer com que um dos modelos de programação mais populares de HPC seja executado até 26% mais rápido.
Ao descarregar partes críticas da Message Passing Interface (MPI), as DPUs aceleraram a P3DFFT, uma biblioteca usada em muitas simulações de HPC em larga escala.
“As DPUs são como assistentes que lidam com o trabalho de executivos ocupados e vão se popularizar porque podem fazer com que todas as cargas de trabalho sejam executadas mais rápido”, disse Dhabaleswar K. (DK) Panda, Professor de Ciência da Computação e Engenharia na Universidade Estadual de Ohio que liderou o trabalho de DPU usando o software de código aberto MVAPICH da sua equipe.
DPUs em Centros de HPC, Clouds
Impulsos de dois dígitos são enormes para supercomputadores que executam simulações de HPC, como descoberta de medicamentos ou design de aeronaves. Além disso, os serviços em cloud podem usar esses ganhos para aumentar a produtividade de seus clientes, afirmou Panda, que teve pedidos de vários centros de HPC para seu código.
Redes Quantum InfiniBand com recursos como o NVIDIA SHARP ajudam a tornar seu trabalho possível.
“Outros estão falando sobre computação em rede, mas a InfiniBand é compatível com isso hoje”, disse ele.
Durham Faz Balanceamento de Carga
Várias equipes de pesquisa na Europa estão acelerando a MPI e outras cargas de trabalho de HPC com as DPUs BlueField.
A Universidade de Durham, no norte da Inglaterra, por exemplo, está desenvolvendo softwares para tarefas de MPI de balanceamento de carga usando DPUs BlueField em um servidor Dell EMC de 16 nós. Seu trabalho abrirá o caminho para um processamento mais eficiente de algoritmos melhores para instalações de HPC em todo o mundo, disse Tobias Weinzierl, principal investigador do projeto.
DPUs em Cambridge, Munique
Pesquisadores de Cambridge, Londres e Munique também estão usando DPUs.
Por sua vez, a University College London está explorando como agendar tarefas para um sistema host em DPUs BlueField-2. É um recurso que pode ser usado, por exemplo, para mover dados entre processadores host para que estejam lá quando forem necessários.
As DPUs BlueField do Cambridge Service for Data Driven Discovery liberam políticas de segurança, frameworks de armazenamento e outras tarefas das CPUs do host, maximizando o desempenho do sistema.
Enquanto isso, pesquisadores da Universidade Técnica de Munique estão buscando maneiras de descarregar as tarefas da MPI e do sistema operacional com DPUs como parte de um projeto EuroHPC.
Nos EUA, pesquisadores da Georgia Tech estão colaborando com os Sandia National Laboratories para acelerar o trabalho de dinâmica molecular usando DPUs BlueField-2. Um artigo que descreveu seu trabalho até agora mostra que os algoritmos podem ser acelerados em até 20% sem nenhuma perda na precisão das simulações.
Uma Rede em Expansão
No início do mês, pesquisadores no Japão anunciaram um sistema que usa as GPUs NVIDIA H100 Tensor Core mais atuais com nossa rede mais rápida e inteligente, a plataforma NVIDIA Quantum-2 InfiniBand.
A NEC criará o supercomputador de 6,14 PFLOPS, baseado em H100, para o Centro de Ciências Computacionais da Universidade de Tsukuba. Os pesquisadores usarão a tecnologia para a previsão do tempo e do clima, bem como para a astrofísica.
Enquanto isso, pesquisadores como Panda já estão pensando em como usarão os núcleos nas DPUs BlueField-3.
“Será como contratar assistentes executivos com diplomas universitários em vez de com diplomas de ensino médio, então espero que mais e mais descarregamentos sejam feitos”, brincou.