A NVIDIA Aprimora os Agentes de IA Locais em PCs RTX e DGX Spark

Os agentes pessoais estão explodindo em popularidade, com projetos de código aberto como OpenClaw e Hermes sendo rapidamente adotados pelas comunidades de desenvolvedores de IA no GitHub. Construídos para se adaptarem às preferências e fluxos de trabalho individuais, esses agentes podem interagir com aplicações, gerar conteúdo, automatizar processos repetitivos e gerenciar tarefas complexas — tudo isso enquanto são executados localmente no dispositivo.

Hoje, na NVIDIA GTC Taipei da COMPUTEX, a NVIDIA apresentou o NVIDIA RTX Spark — uma nova classe de PCs com Windows desenvolvida especificamente para agentes pessoais — juntamente com uma série de atualizações que expandem os agentes locais para os ecossistemas NVIDIA RTX e DGX em geral.

Executar agentes de forma segura e privada exige hardware à altura da tarefa. O RTX Spark, com seu 1 petaflop de poder computacional para IA e 128 GB de memória unificada, atende às demandas de processamento de agentes em dispositivos, oferecendo uma nova classe de computadores que se transforma de ferramenta em parceiro de equipe. Projetado para IA, criação e jogos, o RTX Spark traz os 30 anos de inovação tecnológica da NVIDIA para Notebooks Windows ultrafinos com bateria de longa duração e PCs desktop ultraeficientes.

A parceria da NVIDIA com o Windows abrange desde soluções pessoais até corporativas. Também foi apresentado no evento o NVIDIA DGX Station para Windows, o supercomputador de IA definitivo para profissionais, que oferece uma GPU e uma CPU de nível de data center para inferência em um sistema desktop equipado com Windows para gerenciamento, segurança e compatibilidade.

Outros anúncios incluem:

O ambiente de execução NVIDIA OpenShell chegará ao Windows, baseado nas novas primitivas de segurança da Microsoft para agentes — oferecendo aos desenvolvedores um pacote fácil de implantar para agentes seguros em dispositivos. O Hermes Agent e o OpenClaw também integrarão o OpenShell e as primitivas de segurança da Microsoft em suas novas aplicações para Windows.
O modelo NVIDIA NemoClaw está sendo expandido para toda a linha de IA local da NVIDIA — GeForce RTX, RTX PRO, RTX e DGX Spark e DGX Station — com novos instaladores simplificados e suporte para o Hermes Agent.
Desempenho de inferência 2x maior nos principais modelos agentivos com previsão de múltiplos tokens em llama.cpp e vLLM, além de novas otimizações multi-GPU para llama.cpp e ComfyUI.
A H Company está lançando ferramentas para uso em computador — incluindo novos modelos e um futuro agente de desktop — otimizadas para PCs com RTX e DGX.
A Adobe está reformulando a arquitetura de seus aplicativos Photoshop e Premiere, o Blender está adicionando o NVIDIA DLSS 4.5 Ray Reconstruction e a NVIDIA apresentou o RTX Video Frame Generation, que chegará à ComfyUI. Todas essas atualizações chegam neste outono com o RTX Spark.
A atualização do NVIDIA Broadcast 2.2 traz otimizações para o recurso Studio Voice e suporte para o Elgato Stream Deck. O NVIDIA Project G-Assist também adiciona integração com o Stream Deck.

IA local e ativa: pessoal, privada e rápida em PCs com Windows RTX.

A ampla adoção de agentes tem sido limitada pela incapacidade de executá-los de forma segura e privada nos computadores principais dos usuários.

A NVIDIA e a Microsoft estão trabalhando em conjunto para enfrentar esse desafio, fornecendo uma plataforma Windows robusta e segura para agentes em dispositivos.

A colaboração começa com uma base sólida — novas primitivas de segurança do Windows e o ambiente de execução NVIDIA OpenShell — para garantir que os agentes sejam executados com segurança e sob total controle do usuário.

Os novos recursos básicos do Windows oferecem funcionalidades de identidade, contenção, políticas e segurança de ponta a ponta para criar e executar agentes nativamente. O NVIDIA OpenShell fornece recursos adicionais de política para que o usuário defina o que os agentes podem e não podem fazer, a capacidade de rotear consultas de forma inteligente para modelos locais com base nas políticas de privacidade do usuário e a capacidade de disfarçar informações pessoais em consultas enviadas a modelos na nuvem.

Essa robusta camada de segurança e privacidade está sendo adotada por desenvolvedores líderes de agentes, como Hermes Agent e OpenClaw, em seus novos aplicativos para Windows. Esses novos aplicativos facilitarão e tornarão seguro o acesso dos usuários a poderosos agentes instalados em seus dispositivos, capazes de executar tarefas em aplicativos do Windows, analisar workflows entre aplicações, gerar imagens e vídeos, programar plug-ins e apps e realizar buscas semânticas em arquivos locais.

Para executar agentes em dispositivos locais, é necessário oferecer segurança robusta e hardware de alto desempenho. O RTX Spark apresenta até 1 petaflop de poder computacional de IA e 128 GB de memória unificada para atender às demandas de processamento de agentes em dispositivos.

A NVIDIA também está acelerando o ecossistema de modelos abertos locais do qual esses agentes dependem.

A NVIDIA colaborou com a comunidade llama.cpp para habilitar recursos e otimizações como a predição de múltiplos tokens (MTP) — uma técnica de decodificação especulativa na qual um modelo de rascunho menor propõe múltiplos tokens simultaneamente, que o modelo alvo verifica em uma única passagem. Isso, aliado a outras otimizações como o lançamento dependente de programação, proporciona um aumento de desempenho de 2x no Qwen 3.6 e 3.5 27B, e um aumento de 1,6x no Qwen 3.6 e 3.5 35B. Essas atualizações estão disponíveis por meio da interface web do llama.cpp e do LM Studio .

Os ganhos de desempenho são demonstrados com as otimizações mais recentes da NVIDIA para llama.cpp: Qwen3.6-27B oferece até 2x mais throughput e Qwen3.6-35B até 1,6x em placas GeForce RTX 5090, acelerando cargas de trabalho de IA com agentes locais por meio da colaboração da comunidade de código aberto.

Para os entusiastas de IA que utilizam configurações com múltiplas GPUs, a NVIDIA colaborou com a comunidade de código aberto para aprimorar duas das ferramentas de IA locais mais populares:

O arquivo llama.cpp adiciona paralelismo de tensores, permitindo até 2x mais memória e 1,8x mais poder computacional em duas GPUs equivalentes.
O ComfyUI ganha um novo método de orientação sem classificador para desempenho até 2x maior em duas GPUs equivalentes, além da opção de dividir as cadeias de modelos entre as GPUs para aproveitar a memória combinada.

Mostra as melhorias de desempenho na geração de tokens para a técnica Tensor Parallel Multi-GPU em comparação com a inferência paralela em pipeline e a inferência em GPU única no arquivo llama.cpp.

Mostra as melhorias de desempenho em tempo de geração para técnicas multi-GPU no ComfyUI.

A NVIDIA também está expandindo os recursos dos agentes com o H Company. O sistema de interação com o computador do H Company permite que os agentes naveguem em um PC visualizando a tela e operando um mouse e teclado como um usuário, mesmo em aplicações sem interfaces de programação de aplicativos (APIs), e estará disponível em breve para PCs RTX e DGX com suporte local.

A NVIDIA colaborou com a H Company para quantizar seus modelos de última geração do Holo Computer Use, além de acelerar seu desempenho — proporcionando um aumento de velocidade de 2x nas GPUs NVIDIA e uma redução de 35% no consumo de memória. Os modelos já estão disponíveis para download e a aplicação Holo Desktop estará disponível em breve.

Otimizações de agentes para Linux

Para desenvolvedores que precisam de agentes locais sempre acessíveis, o NVIDIA DGX Spark é o computador de IA para agentes pessoais mais poderoso para desenvolvedores que necessitam de um ambiente Linux — unindo grande capacidade de memória, computação rápida e compatibilidade com o ecossistema NVIDIA CUDA.

A versão deste mês do DGX Spark OS traz a experiência mais simplificada e pronta para uso, com um instalador NemoClaw otimizado, além de inferência mais rápida nos principais modelos de agentes.

O NemoClaw agora está disponível para todos os PCs com NVIDIA RTX e DGX no Linux e no Subsistema Windows para Linux. Implante agentes locais com segurança no Linux com novos instaladores simplificados, que oferecem isolamento automático e suporte adicional para o Agente Hermes.

A NVIDIA colaborou com a vLLM para otimizar a inferência para agentes, com otimizações na vLLM e novos checkpoints NVFP4 otimizados para o Qwen 3.6 35B. As atualizações oferecem um desempenho 2,6 vezes maior no DGX Spark em comparação com os checkpoints NVFP4 anteriormente disponíveis da Unsloth, e incluem melhorias no kernel, além de suporte a precisão mista e CUDA Graph para MTP.

Leia o blog da vLLM para obter um passo a passo completo de como servir modelos NVFP4 de mistura de especialistas no DGX Spark — desde o ajuste unificado de memória até uma configuração de referência NVIDIA Nemotron 3 Super em funcionamento.

Criando experiências criativas impactantes com a Adobe

A NVIDIA está em parceria com a Adobe para reformular a arquitetura do Adobe Premiere e do Photoshop para o RTX Spark. O Preenchimento Generativo com tecnologia Firefly no Photoshop e a Extensão Generativa no Premiere estão entre as centenas de ferramentas aceleradas que oferecem poder criativo, precisão e controle. O RTX Spark leva esses recursos ainda mais longe, proporcionando IA, edição, colorização e efeitos até 2 vezes mais rápidos em fluxos de trabalho criativos.

O Adobe Premiere contará com um novo pipeline de vídeo que utiliza a memória unificada do RTX Spark, a GPU Blackwell e o software TensorRT, oferecendo desempenho em tempo real para edição e correção de cores, desempenho de IA acelerado por GPU e renderização mais eficiente de linhas de tempo complexas. Além disso, o Adobe Substance 3D Painter e o Stager serão executados nativamente no RTX Spark para fluxos de trabalho de texturização 3D e criação de cenas mais fluidos e responsivos.

O mecanismo de próxima geração do Photoshop da Adobe será otimizado para composição acelerada por GPU, permitindo filtros ao vivo, alto alcance dinâmico e pinceladas naturais modernas. O pipeline nativo de IA foi desenvolvido para aproveitar todo o poder do RTX Spark, incluindo o TensorRT.

A Adobe expandirá ainda mais o Premiere e o Photoshop para permitir que os usuários criem, editem e projetem com agentes do Windows, fornecendo aos criadores um parceiro colaborativo para acelerar seus fluxos de trabalho.

Espera-se que as atualizações para as aplicações criativos da Adobe, como Premiere, Photoshop e Substance, comecem a ser lançadas juntamente com a disponibilidade do RTX Spark.

Novas ferramentas e atualizações de aplicações para criadores

Novas atualizações da plataforma NVIDIA e otimizações de aplicativos de parceiros estão sendo implementadas em todo o ecossistema RTX — algumas já disponíveis e outras chegando com o RTX Spark neste outono.

O NVIDIA Broadcast 2.2 lança hoje o Studio Voice, um recurso de IA que transforma qualquer microfone em um som com qualidade de estúdio. O Studio Voice agora funciona em GPUs GeForce RTX 3060 e superiores com desempenho aprimorado. O aplicativo também conta com integração ao Elgato Stream Deck e atalhos de teclado configuráveis.

O Project G-Assist também adiciona suporte ao Stream Deck através do servidor Elgato MCP, permitindo que os usuários habilitem recursos de assistente de IA para sua configuração de transmissão.

Além disso, o Blender Cycles está integrando o DLSS 4.5 Ray Reconstruction como um novo denoiser, transformando a viewport de path tracing em um visualizador interativo em tempo real. Isso permite que artistas 3D naveguem pela cena enquanto visualizam uma qualidade de renderização próxima à final, transformando o fluxo de trabalho de iluminação e desenvolvimento visual. A atualização será lançada com o Blender 5.3 neste outono, juntamente com o RTX Spark.

Lançado também com o RTX Spark, o RTX Video Frame Generation é um novo efeito de IA que dobra ou quadruplica a taxa de quadros de vídeo em tempo real — ideal para aprimorar as saídas de 15 a 20 quadros por segundo (fps) que os modelos de IA normalmente geram. Ele chega como um pacote Python e um nó ComfyUI, permitindo que artistas de IA gerem vídeos mais rapidamente com baixa taxa de quadros e, em seguida, interpolem para taxas de reprodução suaves.

#ParaQuemPerdeu: As últimas novidades do RTX AI Garage

Leia o anúncio completo do NVIDIA RTX Spark para obter detalhes sobre o superchip, o trabalho da NVIDIA com o Windows em agentes e laptops e desktops compactos de parceiros.

Os notebooks para criadores ASUS ProArt agora vêm com o FLUX.2 Klein 4B da Black Forest Labs — um modelo de imagem otimizado pré-instalado através do aplicativo MuseTree, otimizado com o formato NVFP4 e o kit de desenvolvimento de software NVIDIA TensorRT para RTX. Os criadores obtêm um aumento de velocidade de até 2,5x e uma redução de 560% no consumo de memória, com a experiência inicial permitindo a geração de imagens localmente desde a abertura da caixa — sem necessidade de downloads de modelos ou configuração do ComfyUI.

O kit de desenvolvimento de software NVIDIA AI for Media está recebendo atualizações, incluindo novos microsserviços NVIDIA NIM LipSync otimizados para francês, alemão e espanhol. O microsserviço NIM de Detecção Ativa de Locutor também adiciona suporte a múltiplas câmeras com correlação de locutor entre vídeos.

Confira a publicação mais recente do blog RTX AI Garage sobre o Hermes Agent e a IA de autoaperfeiçoamento em PCs RTX e DGX Spark.

Conecte-se ao RTX Spark no Facebook, Instagram, TikTok e X e mantenha-se informado assinando a newsletter do RTX Spark .

Consulte o aviso referente às informações do produto de software.