O que é GauGAN? Como a AI Transforma Suas Palavras e Fotos em Magníficas Artes

por Isha Salian

O GauGAN, uma demonstração de AI para geração de imagens fotorrealistas, permite que qualquer pessoa crie paisagens impressionantes usando redes adversárias generativas. Em homenagem ao pintor pós-impressionista, Paul Gauguin, ele foi criado pela Pesquisa na NVIDIA e pode ser experimentado gratuitamente por meio de Demonstrações da AI da NVIDIA.

Como Criar com o GauGAN

A versão mais atual da demonstração, GauGAN2, transforma qualquer combinação de palavras e desenhos em uma imagem realista. Os usuários podem simplesmente digitar uma frase como “lago em frente a uma montanha” e pressionar um botão para gerar uma cena em tempo real. Ao ajustar o texto para um “lago em frente a uma montanha coberta de neve” ou “floresta em frente a uma montanha”, o modelo de AI modifica instantaneamente a imagem.

Os artistas que preferirem desenhar uma cena sozinhos podem usar o pincel inteligente da demonstração para modificar essas cenas incitadas por texto ou começar do zero, desenhando pedregulhos, árvores ou nuvens fofas. Clicar em um filtro (ou fazer upload de uma imagem personalizada) permite que os usuários experimentem iluminação diferente ou apliquem um estilo de pintura específico às suas criações.

AI por Trás da Demonstração do GauGAN2

No centro do GauGAN2 estão redes adversárias generativas (GANs – Generative Adversarial Networks), uma espécie de modelo de deep learning que envolve um par de redes neurais: um gerador e um discriminador. O gerador cria imagens sintéticas. O discriminador, treinado com milhões de imagens de paisagens reais, dá ao gerador feedback pixel a pixel de rede sobre como tornar as imagens sintéticas mais realistas.

Com o tempo, o modelo de GAN aprende a criar imitações convincentes do mundo real, com montanhas refletidas em lagos e árvores perdendo suas folhas gerados por AI quando uma cena é modificada com a palavra “inverno”.

Landscape generated by GauGAN2

Quando os usuários fazem rabiscos próprios ou modificam uma cena existente na demonstração do GauGAN2, eles estão trabalhando com mapas de segmentação, esboços de alto nível que registram a localização de objetos em uma cena. Cada área é rotulada com características como areia, rio, grama ou flor, dando ao modelo de AI instruções sobre como preencher a cena.

O GauGAN tem sido extremamente popular desde que foi lançado no NVIDIA GTC em 2019 — ele é usado por professores de arte nas escolas, em museus como uma exposição de arte interativa e por milhões de pessoas on-line.

Diretores artísticos e artistas conceituais dos principais estúdios de cinema e empresas de videogames estavam entre os profissionais criativos interessados no GauGAN como uma ferramenta para prototipar ideias para seu trabalho. Por isso, o NVIDIA Studio, uma plataforma para auxiliar criadores, surgiu com uma aplicação para desktop o: NVIDIA Canvas.

O NVIDIA Canvas traz a tecnologia por trás do GauGAN para profissionais em um formato compatível com ferramentas existentes, como o Adobe Photoshop, e permite que os artistas usem GPUs NVIDIA RTX para uma experiência mais fluida e interativa.

Saiba mais sobre a Pesquisa na NVIDIA no GTC, que será realizado on-line dos dias 21 a 24 de março. Para saber as novidades em pesquisas em AI, confira a apresentação do CEO da NVIDIA, Jensen Huang, no dia 22 de março às 13h (Horário de Brasília).

Obtenha informações mais aprofundadas das tecnologias da Pesquisa na NVIDIA no Blog Técnico da NVIDIA.