Decodificando como a revolução da IA ​​Generativa começou

A demonstração GauGAN da NVIDIA Research preparou o cenário para uma nova onda de aplicações de IA Generativa que potencializam fluxos de trabalho criativos.
por Larissa Machado

Nota do editor: Esta postagem faz parte da série IA Decodificadaque desmistifica a IA ao tornar a tecnologia mais acessível e que apresenta novos hardware, software, ferramentas e acelerações para usuários de PC RTX.

Os modelos generativos transformaram completamente o cenário da IA ​​— liderados por aplicativos populares como ChatGPT e Stable Diffusion.

Abrindo caminho para esse crescimento estavam modelos fundamentais de IA e redes adversárias generativas (GANs), que desencadearam um salto na produtividade e na criatividade.

O GauGAN da NVIDIA, que alimenta o aplicativo NVIDIA Canvas, é um desses modelos que usa IA para transformar esboços em obras de arte fotorrealistas.

Como tudo começou

GANs são modelos de aprendizado profundo que envolvem duas redes neurais complementares: um gerador e um discriminador.

Essas redes neurais competem entre si. O gerador tenta criar imagens realistas e realistas, enquanto o discriminador tenta diferenciar o que é real do que é gerado. À medida que suas redes neurais continuam desafiando umas às outras, as GANs ficam cada vez melhores em fazer amostras com aparência realista.

GANs se destacam na compreensão de padrões de dados complexos e na criação de resultados de alta qualidade. Elas são usadas em aplicações que incluem síntese de imagens, transferência de estilo, aumento de dados e tradução de imagem para imagem.

O GauGAN da NVIDIA, nomeado em homenagem ao pintor pós-impressionista Paul Gauguin, é uma demonstração de IA para geração de imagens fotorrealistas. Construído pela NVIDIA Research, ele levou diretamente ao desenvolvimento do aplicativo NVIDIA Canvas — e pode ser experimentado gratuitamente por meio do NVIDIA AI Playground.

O GauGAN se tornou muito popular desde sua estreia no NVIDIA GTC em 2019 — usado por professores de arte, agências criativas, museus e milhões de pessoas online.

Dando um Gogh ao esboço do cenário

Desenvolvido pela GauGAN e GPUs NVIDIA RTX locais, o NVIDIA Canvas usa IA para transformar pinceladas simples em paisagens realistas, exibindo resultados em tempo real.

Os usuários podem começar esboçando linhas e formas simples com uma paleta de elementos do mundo real, como grama ou nuvens — chamados no aplicativo de “materiais”.

O modelo de IA então gera a imagem aprimorada na outra metade da tela em tempo real. Por exemplo, algumas formas triangulares esboçadas usando o material “montanha” aparecerão como uma faixa fotorrealística impressionante. Ou os usuários podem selecionar o material “nuvem” e com alguns cliques do mouse transformar ambientes de ensolarados para nublados.

As possibilidades criativas são infinitas — esboce um lago, e outros elementos na imagem, como árvores e pedras, refletirão na água. Mude o material de neve para grama, e a cena muda de um aconchegante cenário de inverno para um paraíso tropical.

O Canvas oferece nove estilos diferentes, cada um com 10 variações e 20 materiais para você experimentar.

O Canvas apresenta um modo Panorama que permite que artistas criem imagens de 360 ​​graus para uso em aplicativos 3D. O YouTuber Greenskull AI demonstrou o modo Panorama pintando uma enseada oceânica, antes de importá-la para o Unreal Engine 5.

Baixe a aplicação NVIDIA Canvas para começar.

Considere explorar o NVIDIA Broadcast, outra aplicação de criação de conteúdo com tecnologia de IA que transforma qualquer cômodo em um estúdio doméstico. O Broadcast é gratuito para proprietários de GPU RTX.

A  IA generativa está transformando jogos, videoconferências e experiências interativas de todos os tipos. Entenda o que há de novo e o que vem por aí assinando a newsletter de IA Decodificada.