Decodificando como PCs NVIDIA RTX com IA e Workstations aproveitam a nuvem para turbinar a IA generativa

As ferramentas e tecnologias baseadas em IA da NVIDIA oferecem suporte a fluxos de trabalho de IA híbrida.
por lmachado

A IA generativa está possibilitando novos recursos para aplicativos e jogos do Windows. Ele está alimentando NPCs dinâmicos e improvisados, permitindo que os criadores gerem novas obras de arte e ajudando os jogadores a aumentar as taxas de quadros em até 4x. Mas isto é apenas o começo.

À medida que as capacidades e os casos de uso da IA ​​generativa continuam a crescer, também aumenta a demanda por computação para apoiá-la.

A IA híbrida combina a aceleração de IA integrada da NVIDIA RTX com GPUs escalonáveis ​​e baseadas em nuvem para atender de maneira eficaz e eficiente às demandas das cargas de trabalho de IA.

IA híbrida, uma história de amor

Com a crescente adoção da IA, os desenvolvedores de aplicativos estão procurando opções de implantação: a IA executada localmente em GPUs RTX oferece alto desempenho e baixa latência e está sempre disponível, mesmo quando não está conectado à Internet. Por outro lado, a IA executada na nuvem pode executar modelos maiores e escalar em muitas GPUs, atendendo vários clientes simultaneamente. Em muitos casos, um único aplicativo usará ambos.

A IA híbrida é uma espécie de matchmaker que harmoniza a computação local do PC e da workstation com a escalabilidade da nuvem. Ele fornece flexibilidade para otimizar cargas de trabalho de IA com base em casos de uso, custo e desempenho específicos. Ele ajuda os desenvolvedores a garantir que as tarefas de IA sejam executadas onde fizerem mais sentido para seus aplicativos específicos.

Esteja a IA sendo executada localmente ou na nuvem, ela é acelerada pelas GPUs NVIDIA e pelo stack de IA da NVIDIA, incluindo TensorRT e TensorRT-LLM. Isso significa menos tempo olhando para cata-ventos da morte e mais oportunidades de fornecer recursos de ponta alimentados por IA aos usuários.

Uma variedade de ferramentas e tecnologias da NVIDIA oferecem suporte a fluxos de trabalho híbridos de IA para criadores, jogadores e desenvolvedores.

Sonhe com nuvem, dê vida com RTX

A IA generativa demonstrou sua capacidade de ajudar artistas a idealizar, prototipar e debater novas criações. Uma dessas soluções, o Generative AI baseado em nuvem da iStock — desenvolvido pela NVIDIA Edify — é um serviço de fotografia generativa que foi desenvolvido para e com artistas, treinando apenas em conteúdo licenciado e com remuneração para artistas colaboradores.

A IA generativa da iStock vai além da geração de imagens, fornecendo aos artistas ferramentas abrangentes para explorar estilos, variações, modificar partes de uma imagem ou expandir a tela. Com todas essas ferramentas, os artistas podem idealizar inúmeras vezes e ainda assim dar vida às ideias rapidamente.

Assim que o conceito criativo estiver pronto, os artistas podem trazê-lo de volta aos seus sistemas locais. PCs e workstations com tecnologia RTX oferecem aos artistas aceleração de IA em mais de 125 dos principais aplicativos criativos para concretizar a visão completa – seja criando uma obra de arte incrível no Photoshop com ferramentas de IA locais, animando a imagem com um efeito de paralaxe no DaVinci Resolve , ou construir uma cena 3D com a imagem de referência no Blender com aceleração de traçado de raio e remoção de ruído de IA no Optix.

Hybrid ACE dá vida aos NPCs

A IA híbrida também está possibilitando um novo domínio de jogos interativos para PC com NVIDIA ACE, permitindo que desenvolvedores de jogos e criadores digitais integrem modelos de IA generativos de última geração em avatares digitais em PCs RTX AI.

Alimentado por redes neurais de IA, o NVIDIA ACE permite que desenvolvedores e designers criem personagens não jogáveis ​​(NPCs) que podem compreender e responder ao texto e à fala do jogador humano. Ele aproveita modelos de IA, incluindo modelos de fala para texto, para lidar com a linguagem natural falada em voz alta, para gerar respostas dos NPCs em tempo real.

Uma ferramenta de desenvolvedor híbrida que roda em qualquer lugar

O Hybrid também ajuda os desenvolvedores a construir e ajustar novos modelos de IA. NVIDIA AI Workbench ajuda os desenvolvedores a criar, testar e personalizar rapidamente modelos de IA generativos pré-treinados e LLMs em GPUs RTX. Ele oferece acesso simplificado a repositórios populares como Hugging Face, GitHub e NVIDIA NGC, juntamente com uma interface de usuário simplificada que permite que cientistas de dados e desenvolvedores reproduzam, colaborem e migrem projetos facilmente.

Os projetos podem ser facilmente ampliados quando for necessário desempenho adicional – seja para o data center, uma nuvem pública ou nuvem NVIDIA DGX – e depois trazidos de volta para sistemas RTX locais em um PC ou workstation para inferência e personalização leve. Cientistas de dados e desenvolvedores podem aproveitar projetos pré-construídos do Workbench para conversar com documentos usando geração aumentada de recuperação ( RAG ), personalizar LLMs usando ajuste fino, acelerar cargas de trabalho de ciência de dados com transições perfeitas de CPU para GPU e muito mais.

projeto Hybrid RAG Workbench fornece um aplicativo RAG personalizável que os desenvolvedores podem executar e adaptar por conta própria. Eles podem incorporar seus documentos localmente e executar inferências em um sistema RTX local, em um endpoint de nuvem hospedado no catálogo de API da NVIDIA ou usando microsserviços NVIDIA NIM . O projeto pode ser adaptado para usar vários modelos, endpoints e contêineres, e fornece aos desenvolvedores a capacidade de quantizar modelos para rodar na GPU de sua escolha.

As GPUs NVIDIA alimentam soluções de IA notáveis ​​localmente em PCs NVIDIA GeForce RTX e workstations RTX e na nuvem. Criadores, jogadores e desenvolvedores podem obter o melhor dos dois mundos com fluxos de trabalho de IA híbridos crescentes.

A IA generativa está transformando jogos, videoconferências e experiências interativas de todos os tipos. Entenda o que há de novo e o que vem por aí assinando a newsletter IA Decodificada .