Como Criar Agentes de IA Personalizados com a Biblioteca de Código Aberto do Kit de Ferramentas do NVIDIA NeMo Agent

por Nicola Sessions

Os agentes de IA estão revolucionando a força de trabalho digital, transformando as operações de negócios, automatizando tarefas complexas e desbloqueando novas eficiências. Com a capacidade de colaborar, esses agentes agora podem trabalhar juntos para resolver problemas complexos e gerar um impacto ainda maior.

O kit de ferramentas NVIDIA NeMo Agent é uma biblioteca de código aberto que simplifica a integração de agentes, independentemente do framework em que são construídos. Este kit de ferramentas permite que os desenvolvedores criem um ambiente unificado onde diferentes fontes de dados e ferramentas podem ser facilmente combinadas e reutilizadas. A integração da interface do usuário e do ambiente de desenvolvimento integrado (IDE) fornece uma interface amigável para desenvolvedores, facilitando o gerenciamento e a implantação de agentes.

Observação: o kit de ferramentas NVIDIA Agent Intelligence (AIQ) foi recentemente renomeado para o kit de ferramentas NVIDIA NeMo Agent. As principais tecnologias, desempenho e roteiro permanecem inalterados.

Neste vídeo, mostramos como usar a biblioteca de software livre para criar agentes de IA personalizados que podem raciocinar sobre problemas complexos e extrair informações de várias fontes.

Você aprenderá as etapas para criar agentes de IA personalizados com o kit de ferramentas, incluindo:

  1. Configurando seu projeto com o utilitário scaffolding: Para começar a usar o kit de ferramentas NVIDIA NeMo Agent, você pode usar o comando workflow create para gerar um scaffold de projeto. Esse comando fornece um arquivo pyproject.toml que especifica todas as partes que serão plug-ins, juntamente com um arquivo config.yaml que define os componentes do seu agente. O kit de ferramentas fornece maneiras flexíveis de hospedar o agente, inclusive como um servidor MCP e um microsserviço FastAPI. Este vídeo demonstra o uso da opção FastAPI, permitindo que você faça solicitações POST para chamar o agente. Esse microsserviço pode ser configurado para usar um modelo específico de LLM e incorporação, que são cruciais para as ferramentas RAG.
  2. Criando um agente multi-RAG: Veja o processo de criação de um agente multi-RAG, que é um agente que pode acessar vários RAGs para raciocinar sobre problemas e extrair as informações necessárias. Os RAGs são ferramentas que podem ser hospedadas local ou remotamente e são definidos na seção de função do arquivo config.yaml. Por exemplo, o vídeo mostra a criação de RAGs para código de vestimenta, folha de pagamento e políticas de PTO. Esses RAGs são implementados usando o mesmo plug-in subjacente, mas com parâmetros diferentes, mostrando a flexibilidade do kit de ferramentas.
  3. Instanciando e configurando um agente ReAct: Para implementar um agente personalizado, o vídeo percorre as importações e configurações necessárias. O agente recebe uma lista de ferramentas, um cliente LLM e um prompt. O cliente LLM se comunica com um LLM remoto e o prompt é usado para orientar as respostas do agente. O executor do agente é configurado para gerenciar as interações do agente, incluindo o gerenciamento do histórico de bate-papo e mensagens recentes. Essa configuração garante que o agente possa usar efetivamente as ferramentas RAG para fornecer respostas precisas e sensíveis ao contexto.
  4. Configurando um microsserviço FastAPI: a etapa final do processo é configurar um microsserviço FastAPI. Esse microsserviço atua como o principal ponto de entrada para invocar o agente. O arquivo de configuração é atualizado para corresponder à nova função definida como o ponto de entrada, e o utilitário de linha de comandos toolkit info components é usado para garantir que os parâmetros necessários sejam especificados corretamente. O microsserviço é então ativado e o agente está pronto para responder às consultas do usuário chamando as ferramentas RAG.

Comece a usar o kit de ferramentas NVIDIA NeMo Agent assistindo a este novo vídeo de instruções ou fazendo o download no GitHub.