A arquitetura de GPU Pascal de próxima geração da NVIDIA deve proporcionar 10x mais velocidade para aplicativos de aprendizado …

A arquitetura de GPU Pascal da NVIDIA, com lançamento definido para o próximo ano, vai acelerar aplicativos de aprendizado profundo em 10x a velocidade da geração atual de seus Maxwell processors.

Jen-Hsun Huang, CEO e cofundador da NVIDIA, revelou detalhes da arquitetura Pascal e o roteiro atualizado para processadores da empresa diante de 4.000 pessoas durante sua apresentação de abertura na Conferência de Tecnologia de GPUs, no Silicon Valley.

“Ela vai se beneficiar com refinamentos no valor de um bilhão de dólares que P&D realizou nos últimos três anos”, disse ele ao público.

O crescimento do aprendizado profundo – processo pelo qual computadores usam redes neurais para ensinarem a si próprios – levou a NVIDIA a avançar o projeto de Pascal, que foi anunciado originalmente na GTC do ano passado.

As GPUs Pascal terão três características de design importantes que resultarão no treinamento extremamente mais rápido e preciso de redes neurais profundas mais ricas – estruturas de dados parecidas com o córtex humano que servem como base para a pesquisa de aprendizado profundo.

Com até 32 GB de memória – 2,7x mais que o topo de linha recentemente lançado da NVIDIA, GeForce GTX TITAN X – Pascal oferecerá computação de precisão mista. Terá memória 3D, o que resulta em uma melhoria de até 5x nos aplicativos de aprendizado profundo. E apresentará NVLink – a interconexão de alta velocidade da NVIDIA, que conecta duas ou mais GPUs – que levará a uma melhoria total de 10x em aprendizado profundo.

Text
Pascal oferecerá performance melhor que Maxwell em tarefas importantes de aprendizado profundo.

Computação de precisão mista para maior exatidão

A computação de precisão mista permite que GPUs baseadas na arquitetura funcionem com precisão de ponto flutuante de 16 bits a duas vezes a taxa de precisão de ponto flutuante de 32 bits.

O aumento da performance de ponto flutuante beneficia principalmente a classificação e convolução – duas atividades importantes em aprendizado profundo – enquanto alcança a precisão necessária.

Memória 3Dpara velocidade mais rápida de comunicação e eficiência de energia

Restrições de largura de banda de memória limitam a velocidade em que dados podem ser entregues à GPU. A introdução da memória 3D proporcionará 3x a largura de banda e quase 3x a capacidade de buffer de quadros de Maxwell. Isso permitirá que desenvolvedores criem redes neurais ainda maiores e acelerem as partes de maior consumo de largura de banda do treinamento de aprendizado profundo.

Pascal terá chips de memória empilhados um sobre o outro, e colocados ao lado da GPU, e não muito abaixo das placas de processador. Isso reduz de polegadas para milímetros a distância que os bits precisam se deslocar ao passar da memória para a GPU e voltar. O resultado é comunicação drasticamente acelerada e aumento da eficiência de energia.

NVLink – para movimentação de dados mais rápida

A adição de NVLink à arquitetura Pascal permitirá que os dados se movimentem entre GPUs e CPUs de cinco a 12 vezes mais rápido do que é possível hoje com o padrão atual, PCI-Express. Isso beneficia muito aplicativos, como aprendizado profundo, que demandam muita comunicação entre GPUs.

A NVLink permite o dobro de GPUs em um sistema para trabalhar com computações de aprendizado profundo. Além disso, CPUs e GPUs podem se conectar de novas maneiras, para permitir mais flexibilidade e eficiência de energia no design de servidor em relação ao PCI-E.

Transmissão de vídeo ao vivo on Ustream