As cadeias de suprimentos modernas operam sob as pressões constantes de demanda flutuante, custos voláteis, capacidade limitada e tomada de decisão interdependente. Tradicionalmente, equipes especializadas em pesquisa operacional (PO) resolviam esses problemas traduzindo questões de negócios em modelos matemáticos. Esse processo pode levar semanas e frequentemente produz soluções frágeis que têm dificuldade de se adaptar quando as condições mudam.
A IA agêntica está mudando esse paradigma. Combinando as capacidades de raciocínio de LLMs com o poder computacional de solvers acelerados por GPU, os agentes de IA podem interpretar problemas de negócios expressos em linguagem natural e traduzi-los em decisões rigorosas e otimizadas em segundos.
No centro dessa abordagem estão as skills de agentes — um formato aberto para estender agentes com conhecimentos e fluxos de trabalho especializados. As skills servem como mecanismo de empacotamento, carregando dinamicamente o contexto procedural correto e melhorando o desempenho do agente em tarefas específicas.
Este post descreve as principais skills de agentes NVIDIA cuOpt, sua importância e como funcionam juntas para acelerar um caso de uso de planejamento de cadeia de suprimentos de múltiplos períodos, convertendo problemas de negócios em linguagem natural em modelos matemáticos e resolvendo-os com o solver de otimização de decisões NVIDIA cuOpt.
Como usar as skills de agentes NVIDIA cuOpt
O NVIDIA cuOpt é um motor de otimização de decisões acelerado por GPU que resolve problemas de programação linear (PL), programação inteira mista (PIM) e problemas de roteamento em ordens de magnitude mais rápido do que solvers baseados em CPU. Ao disponibilizar o cuOpt como uma skill de agente, o LLM pode transferir o trabalho matemático pesado para a GPU, enquanto se concentra em entender o problema de negócios, coletar dados e retornar resultados acionáveis.
As etapas a seguir descrevem como configurar e usar o fluxo de trabalho de referência do agente de cadeia de suprimentos NVIDIA cuOpt, que usa skills de agentes cuOpt para realizar otimização de cadeia de suprimentos acelerada por GPU usando fluxos de trabalho orientados por agentes.
Etapa 1: Configurar o ambiente
Provisione um sistema com uma GPU NVIDIA e instale o NVIDIA Container Toolkit, que habilita o acesso à GPU dentro de cargas de trabalho em contêineres. Execute em sua própria infraestrutura ou implante um Brev Launchable para um ambiente de GPU pré-configurado na nuvem com NVIDIA CUDA, Docker e outros pré-requisitos já instalados.
Em seguida, instale o pacote do agente cuOpt junto com suas dependências. O aplicativo de demonstração já está em contêiner, garantindo reprodutibilidade e simplificando a implantação em ambientes de desenvolvimento, homologação e produção.
Etapa 2: Inicializar o agente
O agente usa o MiniMax M2.5 como modelo de raciocínio. Use os endpoints hospedados publicamente ou, para melhor desempenho, implante o NVIDIA NIM localmente.
O restante do processo de implantação é direto. Como o aplicativo está em contêiner, um simples comando Docker Compose inicializa a UI e o rastreamento Phoenix nas portas específicas, que você pode abrir em novas abas.
O código-fonte inclui algumas skills que o agente pode usar. Essas skills atuam como assinaturas de função bem definidas que o LLM pode invocar. Cada uma encapsula uma capacidade de otimização específica (por exemplo, planejamento de produção, otimização de estoque ou otimização de rotas) juntamente com esquemas de entrada/saída. Registrar skills dessa forma permite que o LLM as descubra e as chame dinamicamente com base na intenção do usuário.
Etapa 3: Fornecer os dados da cadeia de suprimentos
Forneça ao agente os dados específicos do domínio necessários para a otimização. Para um problema de planejamento de múltiplos períodos, isso normalmente inclui:
- Previsões de demanda por produto, região e período de tempo.
- Capacidade de produção e custos unitários nas instalações.
- Custos de manutenção de estoque e limites de armazenamento.
- Custos de transporte e lead times.
- Restrições de negócios, como acordos de nível de serviço ou lotes mínimos de produção.
Em uma implantação de produção, esses dados são extraídos diretamente dos sistemas de planejamento. Para fins de demonstração, o fluxo de trabalho de referência usa datasets simulados que espelham a estrutura do mundo real.
Etapa 4: Invocar as skills do agente
Instrua o agente com um objetivo operacional em linguagem natural, como “Gere um plano de produção e estoque de 12 semanas que minimize o custo total enquanto atende à demanda prevista em todos os centros de distribuição.”
Por baixo dos panos, o fluxo de trabalho usa o LangChain Deep Agents para criar uma hierarquia de sub-agentes, cada um responsável por uma parte do fluxo de trabalho. O agente orquestrador raciocina sobre o objetivo, o decompõe em etapas e delega tarefas. Um sub-agente pode extrair e validar dados de entrada, outro pode formular o modelo matemático e outro pode invocar a skill cuOpt.
Quando a skill cuOpt é chamada, o agente passa um payload estruturado contendo variáveis de decisão, função objetivo e restrições para o solver cuOpt.
Etapa 5: Recuperar a solução e agir com base nela
O cuOpt executa a otimização na GPU usando paralelismo massivo para avaliar o espaço de soluções mais rápido do que os solvers tradicionais baseados em CPU. Uma vez encontrada uma solução, o agente recebe as variáveis de decisão otimizadas (por exemplo, quanto de cada produto produzir em cada período, quanto estoque manter ou para onde enviá-lo) e as traduz de volta em um resumo legível por humanos. Isso geralmente inclui métricas-chave como custo total, utilização da capacidade e folga nas restrições.
O resultado é um plano acionável que os tomadores de decisão podem revisar, refinar por meio de prompts de acompanhamento ou enviar diretamente para sistemas de execução downstream.
Assista ao tutorial a seguir para saber mais sobre como configurar e executar o fluxo de trabalho de referência do agente de cadeia de suprimentos cuOpt usando o NVIDIA Brev Launchable.
Arquitetura agêntica extensível
O fluxo de trabalho de referência do agente de cadeia de suprimentos cuOpt é um ponto de partida simplificado. Você pode estendê-lo com skills de agentes adicionais e padrões de orquestração para melhor atender às suas cargas de trabalho empresariais de produção. O diagrama de arquitetura abaixo mostra um padrão extensível para adicionar coordenação, governança, confiabilidade e robustez de nível empresarial em torno do fluxo de trabalho central do agente.

Links rápidos para o dataset e o repositório GitHub
Comece com este fluxo de trabalho do agente cuOpt no GitHub. Siga o guia de início rápido para executar o exemplo localmente, ou use um NVIDIA Brev Launchable para inicializar uma instância de GPU na nuvem com um Jupyter Notebook pré-carregado que orienta você na implantação deste exemplo.
Pré-requisitos técnicos:
- Implantar o Minimax LLM com vLLM em GPUs NVIDIA (por exemplo, oito NVIDIA A100 Tensor Core GPUs).
- Docker e Docker Compose (com o NVIDIA Container Toolkit).
- Chave de API NVIDIA do nvidia.com.
Comece agora
Implante o fluxo de trabalho de referência do NVIDIA cuOpt Agent usando o NVIDIA NeMo Agent Toolkit e use as skills de otimização integradas ou crie as suas próprias. Execute consultas estruturadas e integre restrições específicas do domínio nos fluxos de trabalho, e estenda as skills cuOpt para métricas de benchmark e otimize seus próprios casos de uso específicos de domínio.
Mantenha-se atualizado sobre o NVIDIA cuOpt assinando as novidades da NVIDIA e seguindo a NVIDIA AI no LinkedIn, X, Discord e YouTube.
Acesse a página de início do cuOpt para recursos no Google Colab, no NVIDIA API Catalog, no GitHub e no NVIDIA AI Enterprise.
Participe da comunidade de desenvolvedores no fórum NVIDIA e no Discord.
