Os dados corporativos estão explodindo: petabytes de e-mails, relatórios, mensagens do Slack e bancos de dados se acumulam mais rápido do que qualquer um pode ler. Os funcionários ficam em busca de respostas em um mar de informações, pois “68% dos dados disponíveis em uma organização não são utilizados”, de acordo com a empresa de pesquisa de mercado Gartner1.
Isso agora é possível com a disponibilidade atual do AI-Q, um blueprint da NVIDIA de código aberto que coloca seu conhecimento de negócios ao seu alcance. AI-Q é uma implementação de referência gratuita para a criação de agentes gerais artificiais (AGA) que se conectam aos dados da sua empresa; raciocinar em fontes de dados multimodais usando os modelos AGI mais recentes; e forneça respostas abrangentes, rápidas e precisas, com segurança e em escala.
O AI-Q fornece um exemplo de workflow amigável ao desenvolvedor para criar um agente com inteligência artificial que pode:
- Extrair dados multimodais de diversas fontes (texto, PDFs, imagens, tabelas, bancos de dados)
- Recuperar e entender informações usando pesquisa semântica rápida, geração aumentada por recuperação (RAG) e pesquisa na web com tecnologia Tavily
- Raciocinar, planejar e agir com workflows avançados baseadas em agentes
- Fornecer insights acionáveis aos funcionários, com segurança e eficiência
Neste blog, descreveremos os recursos e componentes do AI-Q NVIDIA Blueprint, incluindo exemplos de casos de uso.
O AI-Q Blueprint inclui três bases principais: 1) NVIDIA NIM otimizado para desempenho, 2) microsserviços NVIDIA NeMo Retriever e 3) o kit de ferramentas NVIDIA NeMo Agent. Essas bases de IA são usadas para criar agentes de IA robustos, escaláveis e confiáveis para qualquer domínio ou setor.
Para demonstrar como criar um agente de IA com o AI-Q Blueprint, criamos o AI-Q Research Assistant Blueprint. Ele mostra como um agente de IA pode sintetizar horas de pesquisa em minutos. Usando as bases do AI-Q Blueprint, os agentes de IA podem se conectar a muitas fontes de dados, raciocinar e ajudar nas funções de negócios da empresa, incluindo vendas, IT, desenvolvimento de software, marketing, recursos humanos e finanças.
Os agentes de IA também podem ajudar a melhorar o processo de descoberta de medicamentos. Para demonstrar isso, a NVIDIA criou um Biomedical AI-Q Research Agent Blueprint para desenvolvedores que usam o AI-Q Blueprint. Com o agente de pesquisa biomédica de IA, horas de estudos de pesquisa médica podem ser sintetizadas mais rapidamente, reduzindo o tempo necessário para P&D farmacêutico.
Componentes e Recursos do Workflow do AI-Q Blueprint
Os principais componentes e recursos do AI-Q Blueprint incluem:
- Extração de dados PDF multimodal
- RAG para recuperação de dados
- Raciocínio avançado de IA
- Personalização e integração de IA corporativa
- Observabilidade e otimização de IA para sistemas multiagentes
Extração de Dados de PDF Multimodal de Diversas Fontes

O workflow começa com a ingestão de dados PDF multimodal. Os dados corporativos são armazenados em vários formatos: documentos de texto, PDFs, imagens, tabelas e muito mais. O AI-Q Blueprint usa microsserviços de extração NVIDIA NeMo Retriever para ingerir e indexar dados estruturados, semiestruturados e não estruturados, usando computação acelerada para fazer isso até 15 vezes mais rápido e em escala de petabytes.
RAG para Recuperação de Dados Eficiente e Precisa
Com o NVIDIA NeMo Retriever e o RAG, os dados corporativos são continuamente extraídos, incorporados e indexados para que o sistema sempre opere usando as informações mais atuais. Os vetores são armazenados em um banco de dados acelerado NVIDIA cuVS gerenciado por meio do Docker Compose, oferecendo suporte a implantações escaláveis e eficientes. Essa arquitetura garante que as consultas do usuário sejam respondidas com respostas baseadas em dados e que os controles de privacidade sejam aplicados em todo o pipeline.
Raciocínio Avançado de IA para Tomada de Decisão e Planejamento Autônomos
Usando um modelo Llama Nemotron, o AI-Q Blueprint fornece recursos avançados de raciocínio, aprimorando a recuperação e a reclassificação por meio da decomposição dinâmica de problemas, refinamento iterativo e tomada de decisão com reconhecimento de contexto. Esse processo de reflexão contínua melhora a qualidade e a confiabilidade dos resultados gerados, permitindo que os agentes de IA forneçam insights mais precisos, diferenciados e acionáveis de fontes de dados heterogêneas. Os modelos NVIDIA Llama Nemotron têm a capacidade única de ativar ou desativar dinamicamente o raciocínio para equilibrar desempenho e eficiência de custos, ao mesmo tempo em que fornecem velocidades de inferência até 5 vezes mais rápidas.
Personalização e Integração de IA Empresarial para Desenvolvimento Flexível
Para fornecer aos desenvolvedores uma base flexível para a criação de agentes de IA específicos de domínio que aproveitam dados corporativos privados, o AI-Q se integra a uma ampla variedade de fontes de dados, como ERP, CRM, data warehouses, documentos, imagens e registros de bate-papo. Isso capacita os agentes de IA a fornecer insights profundamente contextualizados para as necessidades exclusivas de uma organização. O AI-Q inclui guias de desenvolvimento abrangentes que simplificam a configuração, incluindo instruções passo a passo para configurar ambientes Python, implantar com o Docker e gerenciar serviços de front-end e back-end.
O kit de ferramentas NVIDIA NeMo Agent é independente de estrutura, permitindo a integração com uma ampla variedade de plataformas e ferramentas agenciais populares. Ele suporta e fornece nativamente plug-ins primários para Agno (anteriormente Phidata), CrewAI, LangChain, LlamaIndex, MemO, Semantic Kernel, Weave e Zep Cloud, entre outros. Essas integrações são gerenciadas por meio de pacotes de plug-ins modulares, permitindo que os desenvolvedores ampliem os recursos do kit de ferramentas de acordo com seus requisitos de workflow. Como o kit de ferramentas do Agente é aberto, outras pessoas na comunidade podem estender ainda mais as integrações do kit de ferramentas.
O kit de ferramentas também oferece suporte a conexões diretas com APIs de grandes modelos de linguagem (LLM), incluindo NVIDIA NIM e OpenAI, e é compatível com o Model Context Protocol (MCP), que permite a interoperabilidade com ferramentas atendidas por servidores MCP. Essa arquitetura flexível permite que o kit de ferramentas do Agente orquestre e otimize workflows complexos e multiagentes em diversos stacks de tecnologia sem exigir que as equipes reformulem a plataforma, tornando-o uma camada unificadora para o desenvolvimento de IA corporativa.
Observabilidade e Otimização de IA para Sistemas Multiagentes Escaláveis
Para implantação e orquestração escaláveis, o kit de ferramentas do Agente, incluído no AI-Q Blueprint, fornece APIs REST sem estado que gerenciam o estado em processos principais, como geração de consultas, geração de resumo e perguntas e respostas sobre artefatos. Telemetria refinada, registro em log configurável, rastreamento e coleta de métricas em tempo real fornecidos com o kit de ferramentas do Agente convertem estatísticas de uso no formato OpenTelemetry para integração com ferramentas de monitoramento padrão do setor. Isso permite a rastreabilidade total do sistema, permitindo que as empresas monitorem o desempenho, identifiquem gargalos e obtenham uma visão profunda de como a inteligência de negócios é gerada.
O criador de perfil do kit de ferramentas rastreia métricas detalhadas, como uso de token, tempos de resposta e latência nos níveis de agente e ferramenta, facilitando o ajuste dinâmico de desempenho e a previsão de especificação de workflow. Esses recursos capacitam as empresas a avaliar, depurar e refinar continuamente os workflows dos agentes de IA para obter maior precisão e eficiência, oferecendo suporte a sistemas confiáveis de IA baseada em agentes, transparentes e de alto desempenho em escala.
O Kit de Ferramentas de IA Baseada em Agentes Otimiza os Agentes de IA Para a Área da Saúde
O Maia da Therapyside evoluiu de um simples assistente de IA que responde às perguntas dos terapeutas para um poderoso agente de raciocínio que automatiza as principais tarefas administrativas, como agendamento, rastreamento de pagamentos e entrega de recursos, diretamente na plataforma. Isso economiza até 22 minutos por paciente por dia e permite que eles se concentrem mais no atendimento ao paciente. O loop de raciocínio de Maia foi criado com o kit de ferramentas NVIDIA NeMo Agent, que orquestra chamadas de ferramentas e tratamento de erros, e RAG com NVIDIA NeMo Retriever.
A Pangaea Data construiu uma plataforma que usa IA para analisar dados estruturados e não estruturados de pacientes em relação às diretrizes clínicas estabelecidas. Trabalhando com a Alexion, a divisão de doenças raras da AstraZeneca, a Pangaea Data está acelerando a detecção de pacientes com doenças raras. Usando o kit de ferramentas do Agente, os dois alcançaram 98% de precisão na recuperação de pontos de dados críticos e otimizaram seu workflow de desenvolvimento, reduzindo o tempo de configuração das calculadoras de pontuação clínica de semanas para dias.
Do Feedback à Previsão: Capacitando os Agentes de IA a Aprender e Melhorar
Para garantir que os agentes de IA forneçam resultados confiáveis na produção, a avaliação e a otimização contínuas são essenciais. O kit de ferramentas do agente oferece aos desenvolvedores acesso a dados detalhados de telemetria e criação de perfil, facilitando o monitoramento do desempenho do agente e identificando áreas de melhoria. Usando o NVIDIA Blueprint para criar flywheels, uma arquitetura de referência criada nos microsserviços NVIDIA NeMo, os desenvolvedores podem permitir que os agentes aprendam e se adaptem continuamente, automatizando o processo de coleta de feedback e otimizando modelos para melhorar o desempenho do sistema baseado em agentes. Confira o notebook da NVIDIA para integrar os recursos de avaliação e criação de perfil do kit de ferramentas com um volante de dados.
Com o AI-Q Blueprint, as empresas podem encontrar significado em suas plataformas de dados de IA, sistemas de armazenamento acelerados de provedores de armazenamento certificados pela NVIDIA. Por exemplo, o sistema operacional de IA da VAST Data se integra ao NVIDIA AI-Q para permitir pipelines de IA multimodais em tempo real que aprendem continuamente com os dados corporativos, impulsionando soluções inovadoras de IA em todos os setores. A VAST está trabalhando com a CACEIS, uma das maiores empresas de serviços de ativos da Europa, para criar uma plataforma de IA em tempo real para capturar, transcrever e analisar reuniões com clientes com segurança, transformando instantaneamente esses insights em ação.
Comece Hoje Mesmo
Pronto para liberar todo o potencial dos dados da sua empresa? O AI-Q NVIDIA Blueprint já está disponível no GitHub, com tudo o que você precisa para começar:
- Configuração passo a passo do ambiente
- Guias de implantação para serviços RAG, modelos LLM e sistemas front-end/back-end
- Instruções de desenvolvimento e teste local
- Solução de problemas e perguntas frequentes
- NVIDIA Launchable para ambiente de desenvolvimento de GPU implantável com um clique para ajudá-lo a começar a trabalhar com o exemplo do AI-Q Research Assistant
Transforme a forma como sua èmpresa acessa o conhecimento. Crie agentes de pesquisa robustos e inteligentes que capacitam a tomada de decisões e impulsionam a inovação a partir de hoje.
Precisa de ajuda para começar? Os parceiros de integração da NVIDIA, incluindo Deloitte, EY, Quantiphi, SoftServe e Tech Mahindra, estão criando soluções usando os componentes do AI-Q Blueprint para ajudar as empresas a implantar aplicações de IA baseada em agentes em produção.
- Gartner®, Predicts 2025: Privacy in the Age of AI and the Dawn of Quantum, janeiro de 2025. GARTNER® é uma marca registrada e mercado de serviços da Gartner Inc. e/ou de suas afiliadas nos EUA e internacionalmente e é usada aqui com permissão. Todos os direitos reservados.