Com o lançamento das tecnologias RTX em 2018 e a primeira GPU para consumidores construída para IA — a GeForce RTX —, a NVIDIA acelerou a mudança para a computação em IA. Desde então, a IA nos PCs e workstations RTX se transformou em um ecossistema próspero, com mais de 100 milhões de usuários e 500 aplicativos de IA.
A IA generativa está inaugurando uma nova onda de capacidades, indo do PC para a nuvem. E a rica história e expertise da NVIDIA em IA estão garantindo que todos os usuários tenham o desempenho necessário para lidar com uma ampla gama de recursos de IA.
Os usuários em casa e no escritório já estão aproveitando a IA nos RTX com softwares que melhoram a produtividade e o entretenimento. Os jogadores sentem os benefícios da IA nas GPUs GeForce RTX, com taxas de quadros mais altas e resoluções impressionantes em seus jogos favoritos. Os criadores podem focar na criatividade, em vez de ficarem presos em tarefas monótonas. E os desenvolvedores podem otimizar fluxos de trabalho usando IA generativa para prototipagem e automação de depuração.
O campo da IA está avançando rapidamente. À medida que a pesquisa avança, a IA enfrentará tarefas mais complexas. E as exigências de desempenho serão atendidas pelos RTX.
O que é IA?
Em sua forma mais fundamental, a inteligência artificial é um tipo mais inteligente de computação. É a capacidade de um programa de computador ou de uma máquina pensar, aprender e tomar ações sem ser explicitamente codificado com comandos para fazê-lo, ou um usuário ter que controlar cada comando.
A IA pode ser pensada como a capacidade de um dispositivo de executar tarefas autonomamente, ao ingerir e analisar enormes quantidades de dados, e depois reconhecer padrões nesses dados — frequentemente referidos como sendo “treinados”.
O desenvolvimento de IA está sempre orientado para o desenvolvimento de sistemas que realizam tarefas que, de outra forma, exigiriam inteligência humana e, muitas vezes, níveis significativos de entrada para serem concluídas — apenas em velocidades além das capacidades de qualquer indivíduo ou grupo. Por esse motivo, a IA é amplamente vista como disruptiva e altamente transformadora.
Um benefício chave dos sistemas de IA é a capacidade de aprender com experiências ou padrões dentro dos dados, ajustando conclusões por conta própria quando alimentados com novos inputs ou dados. Esse auto aprendizado permite que os sistemas de IA realizem uma variedade impressionante de tarefas, incluindo reconhecimento de imagem, reconhecimento de fala, tradução de idiomas, diagnósticos médicos, navegação de carro, aprimoramento de imagem e vídeo, e centenas de outros casos de uso.
O próximo passo na evolução da IA é a geração de conteúdo — chamada de IA generativa (generative AI). Ela permite aos usuários criar rapidamente novo conteúdo e iterar sobre ele, com base em uma variedade de inputs, que podem incluir texto, imagens, sons, animação, modelos 3D ou outros tipos de dados. Em seguida, gera novo conteúdo na mesma ou em uma nova forma.
Aplicativos de linguagem populares, como o Chat GPT baseado em nuvem, permitem que os usuários gerem texto longo com base em uma solicitação de texto curto. Geradores de imagem, como o Stable Diffusion, transformam inputs de texto descritivo na imagem desejada. Novos aplicativos estão transformando texto em vídeo e imagens 2D em renderizações 3D.
PCs e Workstations com IA RTX
Os PCs de IA são computadores com hardware dedicado projetado para ajudar a IA a rodar mais rápido. É a diferença entre esperar que uma imagem 3D seja carregada e vê-la ser atualizada instantaneamente com um denoiser de IA.
Nas GPUs RTX, esses aceleradores de IA especializados são chamados de Tensor Cores. Eles aceleram dramaticamente o desempenho da IA nas aplicações mais exigentes para trabalho e entretenimento.
Uma maneira de medir o desempenho da IA é em teraops, ou trilhões de operações por segundo (TOPS). Semelhante à classificação de cavalos de potência de um motor, TOPS pode dar aos usuários uma ideia do desempenho de IA de um PC com uma única métrica. A geração atual de GPUs GeForce RTX oferece opções de desempenho que variam de cerca de 200 TOPS de IA a mais de 1.300 TOPS, com muitas opções entre laptops e desktops. Profissionais obtêm ainda mais desempenho de IA com a GPU NVIDIA RTX 6000 Ada Generation.
Para colocar isso em perspectiva, a geração atual de PCs de IA sem GPUs varia de 10 a 45 TOPS.
Cada vez mais tipos de aplicativos de IA exigirão os benefícios de ter um PC capaz de realizar certas tarefas de IA localmente — ou seja, no dispositivo em vez de rodar na nuvem. Os benefícios de executar em um PC de IA incluem que a computação está sempre disponível, mesmo sem uma conexão com a internet; os sistemas oferecem baixa latência para alta responsividade; e aumento da privacidade para que os usuários não precisem enviar materiais sensíveis para um banco de dados online antes que ele se torne utilizável por uma IA.
IA para todos
As GPUs RTX trazem mais do que apenas desempenho. Elas introduzem capacidades apenas possíveis com a tecnologia RTX. Muitos desses recursos de IA são acessíveis — e impactantes — para milhões de pessoas, independentemente do nível de habilidade individual.
Desde a melhoria da escalabilidade até a videoconferência aprimorada até chatbots inteligentes e personalizáveis, existem ferramentas para beneficiar todos os tipos de usuários.
O RTX Video usa IA para aumentar a resolução do vídeo transmitido e exibi-lo em HDR. Levando vídeo de baixa resolução em faixa dinâmica padrão para alta resolução de até 4K em alta faixa dinâmica. Os usuários RTX podem desfrutar do recurso com ativação com um único clique em quase qualquer vídeo transmitido em um navegador Chrome ou Edge.
O NVIDIA Broadcast, Um aplicativo gratuito para usuários RTX com uma interface de usuário simples, possui uma série de recursos de IA que melhoram videoconferências e transmissões ao vivo. Ele remove sons indesejados de fundo como teclados barulhentos, aspiradores de pó e crianças gritando com Remoção de Ruído e Eco. Pode substituir ou desfocar fundos com melhor detecção de borda usando Fundo Virtual. Ele suaviza imagens de câmera de baixa qualidade com Remoção de Ruído de Vídeo. E pode se manter centralizado na tela com os olhos olhando para a câmera, não importa para onde o usuário se mova, usando Auto Enquadramento e Contato Visual.
O Chat com RTX é um demo de chatbot de IA local e personalizado que é fácil de usar e gratuito para baixar.
A demo técnica, originalmente lançado em janeiro, receberá uma atualização com o Gemma do Google em breve. Os usuários podem facilmente conectar arquivos locais em um PC a um modelo de linguagem grande suportado, simplesmente arrastando os arquivos para uma única pasta e apontando o demo para a localização. Isso permite consultas para respostas rápidas e contextualmente relevantes.
Como o Chat com RTX é executado localmente no Windows com PCs GeForce RTX e workstations NVIDIA RTX, os resultados são rápidos — e os dados do usuário permanecem no dispositivo. Em vez de depender de serviços baseados em nuvem, o Chat com RTX permite que os usuários processem dados sensíveis em um PC local sem a necessidade de compartilhá-los com terceiros ou ter uma conexão com a internet.
IA para Gamers
Nos últimos seis anos, o desempenho dos jogos deu os maiores saltos com a aceleração da IA. Os jogadores começaram a ativar o NVIDIA DLSS desde 2019, aumentando as taxas de quadros e melhorando a qualidade da imagem. É uma técnica que utiliza a IA para gerar pixels em jogos de vídeo automaticamente. Com melhorias contínuas, agora aumenta as taxas de quadros em até 4 vezes.
E com a introdução do Ray Reconstruction (Reconstrução de Raios) na última versão, DLSS 3.5, a qualidade visual é ainda mais aprimorada em alguns dos principais títulos do mundo, estabelecendo um novo padrão para jogabilidade visualmente mais rica e imersiva.
Agora existem mais de 500 jogos e aplicativos que revolucionaram as maneiras como as pessoas jogam e criam com o rastreamento de raios, DLSS e tecnologias alimentadas por IA.
Além das taxas de quadros, a IA está pronta para melhorar a forma como os jogadores interagem com personagens e remasterizam jogos clássicos.
Os microservices ACE da NVIDIA — incluindo modelos de fala e animação alimentados por IA generativa — estão capacitando desenvolvedores a adicionar avatares digitais inteligentes e dinâmicos aos jogos. Demonstrado na CES, o ACE ganhou múltiplos prêmios por sua capacidade de dar vida aos personagens do jogo como um vislumbre do futuro dos jogos de PC.
O NVIDIA RTX Remix, uma plataforma para modders criarem remasterizações RTX impressionantes de jogos clássicos, oferece ferramentas de IA generativa que podem transformar texturas básicas de jogos clássicos em materiais de renderização modernos, com resolução de 4K e baseados em física. Vários projetos já foram lançados ou estão em andamento, incluindo Half-Life 2 RTX e Portal com RTX.
IA para Criadores
A IA está desbloqueando o potencial criativo ao reduzir ou automatizar tarefas tediosas, liberando tempo para pura criatividade. Esses recursos funcionam mais rapidamente ou exclusivamente em PCs com GPUs NVIDIA RTX ou GeForce RTX.
A ferramenta Enhance Speech do Adobe Premiere Pro é acelerada pelo RTX, utilizando IA para remover ruídos indesejados e melhorar a qualidade dos trechos de diálogo, para que soem profissionalmente gravados. É até 4,5 vezes mais rápido no RTX em comparação com o Mac. Outro recurso do Premiere, Auto Reframe, utiliza aceleração GPU para identificar e rastrear os elementos mais relevantes em um vídeo e reenquadrar inteligentemente o conteúdo do vídeo para diferentes proporções.
Outro recurso de IA que economiza tempo para editores de vídeo é o Magic Mask do DaVinci Resolve. Anteriormente, se os editores precisassem ajustar a cor/brilho de um objeto em uma cena ou remover um objeto indesejado, eles teriam que usar uma combinação de técnicas de rotoscopia ou janelas e máscaras básicas para isolar o objeto do fundo.
O Magic Mask mudou completamente esse fluxo de trabalho. Com ele, basta desenhar uma linha sobre o objeto e a IA processará por um momento antes de revelar a seleção. E os laptops GeForce RTX podem executar o recurso 2,5 vezes mais rápido do que os laptops não-RTX mais rápidos.
Este é apenas um exemplo de como a IA está aumentando a velocidade da criatividade. Agora existem mais de 125 aplicativos de IA acelerados pelo RTX.
IA para Desenvolvedores
A IA está aprimorando a maneira como os desenvolvedores constroem aplicativos de software por meio de ambientes escaláveis, otimizações de hardware e software e novas APIs.
O NVIDIA AI Workbench ajuda os desenvolvedores a criar, testar e personalizar rapidamente modelos de IA generativa pré-treinados e LLMs usando desempenho e pegada de memória de classe de PC. É um conjunto de ferramentas unificado e fácil de usar que pode ser escalado desde a execução local em PCs RTX até praticamente qualquer centro de dados, nuvem pública ou NVIDIA DGX Cloud.
Após a construção de modelos de IA para casos de uso de PC, os desenvolvedores podem otimizá-los usando o NVIDIA TensorRT — o software que ajuda os desenvolvedores a aproveitarem ao máximo os Tensor Cores nas GPUs RTX.
A aceleração do TensorRT agora está disponível em aplicativos baseados em texto com o TensorRT-LLM para Windows. A biblioteca de código aberto aumenta o desempenho do LLM e inclui checkpoints pré-otimizados para modelos populares, incluindo o Gemma do Google, o Meta Llama 2, o Mistral e o Microsoft Phi-2.
Os desenvolvedores também têm acesso a um wrapper do TensorRT-LLM para a API de chat da OpenAI. Com apenas uma linha de alteração de código, o continue.dev — um piloto automático de código aberto para VS Code e JetBrains que utiliza um LLM — pode usar o TensorRT-LLM localmente em um PC RTX para inferência LLM rápida e local usando esta ferramenta popular.
Todas as semanas, vamos desmistificar a IA tornando a tecnologia mais acessível e vamos mostrar novos hardwares, softwares, ferramentas e acelerações para os usuários de PC RTX AI.
O momento “iPhone” da IA está aqui, e é apenas o começo. Bem-vindo ao AI Decoded.Receba atualizações semanais diretamente em sua caixa de entrada assinando a newsletter AI Decoded.