O Planeta É Grande, mas os Dados São Maiores: Como um Centro de Pesquisa do Reino Unido Impulsiona a Ciência Ambiental com AI

O NERC Earth Observation Data Acquisition and Analysis Service reduz de meses para dias o tempo de treinamento com sistemas NVIDIA DGX.
por Emily Bryce

Mudanças climáticas são um grande problema, e, para entender grandes problemas, precisamos de grandes dados, ou “big data”.

Poucos centros de pesquisa têm uma visão tão abrangente da ciência ambiental quanto o NERC Earth Observation Data Acquisition and Analysis Service (NEODAAS). Desde os anos 1990, o serviço, que faz parte do Natural Environment Research Council (NERC) do Reino Unido e é supervisionado pelo National Centre for Earth Observation (NCEO), tem disponibilizado gratuitamente aos pesquisadores dados de observação da Terra coletados por centenas de satélites.

Com a ajuda dos sistemas NVIDIA DGX como parte do Massive Graphical Processing Unit Cluster for Earth Observation (MAGEO), a equipe do NEODAAS, que trabalha no Plymouth Marine Laboratory, no Reino Unido, realiza pesquisas inovadoras que possibilitam novas formas de analisar dados de observação da Terra com deep learning.

Agora, graças à plataforma de computação acelerada da NVIDIA, a equipe consegue analisar esses grandes volumes de dados com uma agilidade inédita.

A Terra sob Observação

Mais de 10 TB de dados observacionais da Terra são coletados diariamente por sensores de mais de 150 satélites na órbita do planeta. Processar e analisar esse volume de dados exige uma potência computacional enorme.

Para facilitar a aplicação de deep learning a esses dados e obter informações valiosas sobre a saúde do planeta, o NEODAAS instalou o MAGEO. O grande cluster de computação acelerada é formado por cinco sistemas NVIDIA DGX-1, interconectados com redes NVIDIA Mellanox InfiniBand e conectados a 0,5 PB de armazenamento dedicado.

O MAGEO foi fundado com o financiamento de uma licitação transformadora do NERC, em 2019, para oferecer ao NEODAAS a capacidade de aplicar deep learning e outros algoritmos aprimorados por muitos núcleos de GPU da NVIDIA a dados observacionais da Terra. O cluster funciona como um serviço que pode ser utilizado por pesquisadores para aproveitar a potência computacional e a expertise da equipe do NEODAAS.

“O MAGEO oferece a excelente oportunidade de acelerar a pesquisa em AI e inteligência ambiental. Sua proximidade ao arquivo do NEODAAS permite a prototipagem e o treinamento rápidos usando grandes volumes de dados de satélites, o que, em última instância, mudará a forma como usamos e compreendemos os dados observacionais da Terra”, disse Stephen Goult, cientista de dados do Plymouth Marine Laboratory.

Com sistemas NVIDIA DGX, a equipe do NEODAAS pode realizar tipos de análises antes impraticáveis. Os sistemas também permitem que a equipe acelere radicalmente a pesquisa, reduzindo de meses para dias o tempo de treinamento.

Além disso, o NEODAAS recebeu financiamento para possibilitar a realização de um curso do Deep Learning Institute da NVIDIA, disponibilizado aos membros do NCEO em março, para incentivar o desenvolvimento e o treinamento de AI nas áreas de meio ambiente e observação da Terra.

“O curso foi um grande sucesso. No final, os participantes estavam bem informados e confiantes para aplicar a AI a suas áreas de pesquisa. As discussões que aconteceram no curso resultaram na geração de vários novos projetos que usam AI para resolver problemas no espaço de observação da Terra”, disse Goult.

Transformando a Detecção de Clorofila

Com o MAGEO, a equipe do NEODAAS também colaborou em novas abordagens que destacaram informações essenciais sobre a natureza dos dados observacionais da Terra.

Um desses êxitos foi o desenvolvimento de um novo detector de clorofila para ajudar a monitorar as concentrações de fitoplâncton nos oceanos da Terra.

O fitoplâncton microscópico é fonte de alimento para diversas formas de vida marinha, sustentando desde o pequeno zooplâncton até as gigantescas baleias-azuis. Mas ele também serve a outro propósito que é vantajoso para a saúde do planeta.

Como toda planta terrestre, o fitoplâncton usa clorofila para capturar a luz do sol e transformá-la em energia química por meio da fotossíntese. Nesse processo, o fitoplâncton consome dióxido de carbono. Quando o fitoplâncton morre, o subproduto de carbono desse processo é levado ao fundo do oceano e, quando o fitoplâncton é consumido, o composto é levado para outras camadas.

Todo ano, o fitoplâncton transfere cerca de 10 gigatoneladas de carbono da atmosfera para as profundezas do oceano. O alto nível de CO2 é um dos principais causadores de mudanças climáticas. Dessa forma, o fitoplâncton é crucial para a redução de CO2 da atmosfera e dos efeitos das mudanças climáticas. Até mesmo uma pequena redução no crescimento de fitoplâncton pode ter graves consequências.

Com o MAGEO, o NEODAAS trabalhou com cientistas para desenvolver e treinar uma rede neural que possibilitou um novo tipo de detector de clorofila para estudar a abundância de fitoplâncton em escala mundial. A técnica usa dados do coeficiente de absorção de feixe de partículas, calculado pela perda de energia, devido a partículas suspensas, de um feixe de luz que atravessa a água do mar.

O uso da técnica permite que cientistas façam medições de clorofila precisas, mais baratas, mais rápidas e com mais dados que com a abordagem baseada em laboratório já existente, considerada o “padrão-ouro” da cromatografia líquida de alto desempenho.

“Graças ao ambiente altamente paralelo e ao desempenho computacional proporcionado pela NVIDIA NVLink e pela arquitetura Tensor Core dos sistemas NVIDIA DGX, um processo que levaria 16 meses em uma única GPU levou 10 dias no MAGEO. A rede neural treinada resultante pode estimar a clorofila com uma precisão muito alta e oferece aos especialistas um método aprimorado e mais rápido de monitoramento de fitoplâncton”, disse Sebastián Graban, estagiário do Plymouth Marine Laboratory.

Saiba mais sobre os sistemas NVIDIA DGX e como a computação de GPU está acelerando a ciência.

Crédito da imagem em destaque: Plymouth Marine Laboratory. Contém dados modificados do Copernicus Sentinel [2016]