Os agentes de IA impulsionados por grandes modelos de linguagem (LLMs) superaram o início do chatbot de perguntas frequentes para se tornarem verdadeiros colegas de equipe digitais capazes de planejar, raciocinar e agir e receber feedback corretivo ao longo do caminho.
Graças aos modelos de IA de raciocínio, os agentes podem aprender a pensar criticamente e lidar com tarefas complexas. Essa nova classe de “agentes de raciocínio” pode resolver problemas complicados, pesar opções e tomar decisões informadas usando apenas a quantidade de computação e tantos tokens quanto necessário.
Os agentes de raciocínio estão causando impacto em setores onde as decisões dependem de vários fatores. Essas indústrias variam de atendimento ao cliente e saúde a manufatura e serviços financeiros.
Raciocínio Ligado vs. Raciocínio Desligado
Os agentes de IA modernos podem ativar e desativar o raciocínio, permitindo que eles usem computação e tokens com eficiência.
Uma passagem completa de cadeia de pensamento realizada durante o raciocínio pode levar até 100 vezes mais computação e tokens do que uma resposta rápida e única. Portanto, ela só deve ser usada quando necessário. Pense nisso como acender os faróis: acender os faróis altos apenas quando está escuro e colocá-los novamente para baixo quando estiver claro o suficiente.
As respostas únicas são ótimas para consultas simples, como verificar o número de um pedido, redefinir uma senha ou responder a uma pergunta frequente rápida. O raciocínio pode ser necessário para tarefas complexas e de várias etapas, como reconciliar cronogramas de depreciação de impostos ou orquestrar os assentos em um casamento de 120 convidados.
Os novos modelos NVIDIA Llama Nemotron, com recursos avançados de raciocínio, expõem um sinalizador system-prompt simples para habilitar ou desabilitar o raciocínio, para que os desenvolvedores possam decidir programaticamente por consulta. Isso permite que os agentes executem o raciocínio apenas quando as apostas exigirem, economizando tempo de espera dos usuários e minimizando os custos.
Agentes de IA de Raciocínio em Ação
Os agentes de IA de raciocínio já estão sendo usados para resolução de problemas complexos em todos os setores, incluindo:
- Área da Saúde: Aprimorando o diagnóstico e o planejamento do tratamento.
- Atendimento ao Cliente: Automatizando e personalizando interações complexas com o cliente, desde a resolução de disputas de cobrança até a recomendação de produtos personalizados.
- Finanças: Análise autônoma de dados de mercado e fornecimento de estratégias de investimento.
- Logística e Supply Chain: Otimizando rotas de entrega, redirecionando remessas em resposta a interrupções e simulando possíveis cenários para antecipar e mitigar riscos.
- Robótica: Impulsionando robôs de armazém e veículos autônomos, permitindo que eles planejem, adaptem e naveguem com segurança em ambientes dinâmicos.
Muitos clientes já estão experimentando workflows e benefícios aprimorados usando agentes de raciocínio.
A Amdocs usa agentes de IA baseados em raciocínio para transformar o envolvimento do cliente para operadoras de telecomunicações. Sua plataforma amAIz GenAI, aprimorada com modelos avançados de raciocínio, como NVIDIA Llama Nemotron e verticalização amAIz Telco, permite que os agentes lidem de forma autônoma com jornadas complexas e de várias etapas do cliente, abrangendo vendas, faturamento e atendimento ao cliente.
A EY está usando agentes de raciocínio para melhorar significativamente a qualidade das respostas a consultas relacionadas a impostos. A empresa comparou modelos genéricos com modelos de raciocínio específicos de impostos, que revelaram uma melhoria de até 86% na qualidade da resposta para perguntas fiscais ao usar uma abordagem de raciocínio.
Os agentes Joule da SAP, que serão equipados com recursos de raciocínio da Llama Nemotron, podem interpretar solicitações complexas de usuários, revelar insights relevantes de dados corporativos e executar processos de negócios multifuncionais de forma autônoma.
Projetando um Agente de Raciocínio de IA
Alguns componentes principais são necessários para criar um agente de IA, incluindo ferramentas, memória e módulos de planejamento. Cada um desses componentes aumenta a capacidade do agente de interagir com o mundo exterior, criar e executar planos detalhados e agir de forma semi ou totalmente autônoma.
Os recursos de raciocínio podem ser adicionados aos agentes de IA em vários locais do processo de desenvolvimento. A maneira mais natural de fazer isso é aumentando os módulos de planejamento com um grande modelo de raciocínio, como Llama Nemotron Ultra ou DeepSeek-R1. Isso permite que mais tempo e esforço de raciocínio sejam usados durante a fase inicial de planejamento do workflow agente, o que tem um impacto direto nos resultados gerais dos sistemas.
O AI-Q NVIDIA AI Blueprint e o kit de ferramentas NVIDIA Agent Intelligence podem ajudar as empresas a quebrar silos, simplificar workflows complexos e otimizar o desempenho da IA baseada em agentes em escala.
O projeto AI-Q fornece um workflow de referência para a criação de sistemas avançados da IA baseada em agentes, facilitando a conexão com computação, armazenamento e ferramentas acelerados da NVIDIA para equipes de trabalho digitais de alta precisão e alta velocidade. O AI-Q integra extração e recuperação rápida de dados multimodais usando NVIDIA NeMo Retriever, microsserviços NIM e agentes de IA.
Além disso, o kit de ferramentas NVIDIA Agent Intelligence de código aberto permite conectividade perfeita entre agentes, ferramentas e dados. Disponível no GitHub, este kit de ferramentas permite que os usuários conectem, criem perfis e otimizem equipes de agentes de IA, com rastreabilidade total do sistema e perfil de desempenho para identificar ineficiências e melhorar os resultados. É independente de estrutura, simples de integrar e pode ser integrado a sistemas multiagentes existentes, conforme necessário.
Construa e Teste Agentes de Raciocínio com Llama Nemotron
Saiba mais sobre o Llama Nemotron, que recentemente esteve no topo das tabelas de classificação de referência do setor para tarefas avançadas de ciência, codificação e matemática. Junte-se à comunidade que molda o futuro da IA baseada em agentes e baseada em raciocínio.
Além disso, explore e ajuste usando o conjunto de dados de pós-treinamento aberto do Llama Nemotron para criar agentes de raciocínio personalizados. Experimente ativar e desativar o raciocínio para otimizar o custo e o desempenho.
E teste workflows baseados em agentes com tecnologia NIM, incluindo geração aumentada por recuperação e o NVIDIA AI Blueprint para pesquisa e resumo de vídeo, para prototipar e implantar rapidamente soluções avançadas de IA.