No Seu Microsserviço: NVIDIA Facilita a Jornada das Empresas para a IA Generativa

O NVIDIA AI Enterprise 5.0 inclui APIs de nuvem para inferência e outros serviços, abrindo caminho para aplicações impulsionadas por IA.
por Anne Hecht

A plataforma de IA da NVIDIA está disponível para qualquer empresa com visão de futuro, e é mais fácil de usar do que nunca.

Lançado hoje, o NVIDIA AI Enterprise 5.0 inclui microsserviços NVIDIA, contêineres de software para download para implantar aplicações de IA generativa e computação acelerada. Ele está disponível nos principais provedores de serviços de nuvem, integradores de sistemas e fornecedores de software, e está em uso em clientes como a Uber.

“Nossa adoção do software de inferência NVIDIA AI Enterprise é importante para atender ao alto desempenho que nossos usuários esperam”, disse Albert Greenberg, vice-presidente de engenharia de plataforma da Uber. “A Uber se orgulha de estar na vanguarda da adoção e uso das mais recentes e avançadas inovações de IA para oferecer uma plataforma de atendimento ao cliente que define o padrão da indústria para eficácia e excelência.”

Microsserviços Aceleram o Desenvolvimento de Aplicações

Os desenvolvedores estão se voltando para os microsserviços como uma maneira eficiente de criar aplicações corporativas modernas em escala global. Trabalhando a partir de um navegador, eles usam APIs de nuvem, ou interfaces de programação de aplicações, para compor aplicações que podem ser executados em sistemas e atender usuários em todo o mundo.

O NVIDIA AI Enterprise 5.0 agora inclui uma ampla gama de microsserviços: NVIDIA NIM para implantar modelos de IA em produção e a  coleção de microsserviços NVIDIA CUDA-X, que inclui o NVIDIA cuOpt.

Os microsserviços NIM otimizam a inferência para dezenas de modelos populares de IA da NVIDIA e seu ecossistema de parceiros.

Impulsionado pelo software de inferência NVIDIA, incluindo o Servidor de Inferência Triton, TensorRT e TensorRT-LLM, o NIM reduz os tempos de implantação de semanas para minutos. Ele fornece segurança e capacidade de gerenciamento com base nos padrões do setor, bem como compatibilidade com ferramentas de gerenciamento de nível empresarial.

O NVIDIA cuOpt é um microsserviço de IA acelerado por GPU que estabeleceu recordes mundiais de otimização de rotas e pode capacitar a tomada de decisões dinâmicas que reduzem custos, tempo e pegada de carbono. É um dos microsserviços CUDA-X que ajudam as indústrias a colocar IA em produção.

Mais recursos estão em andamento. Por exemplo, o operador NVIDIA RAG LLM, agora em acesso antecipado e descrito com mais detalhes aqui, moverá copilotos e outras aplicações de IA generativa que usam geração aumentada de recuperação da fase de testes para a produção sem reescrever nenhum código.

Os microsserviços NVIDIA estão sendo adotados pelos principais provedores de aplicações e plataformas de cibersegurança, incluindo CrowdStrike, IBM, SAP e ServiceNow.

Mais Ferramentas e Recursos

Três outras atualizações na versão 5.0 merecem destaque.

A plataforma agora inclui o NVIDIA AI Workbench, um kit de ferramentas para desenvolvedores para fazer download, personalizar e executar rapidamente projetos de IA generativa. O software agora está disponível para o público em geral e é suportado com uma licença NVIDIA AI Enterprise.

A versão 5.0 agora também oferece suporte à Plataforma Red Hat OpenStack, o ambiente que a maioria das empresas da Fortune 500 usa para criar serviços de nuvem pública e privada. Mantido pela Red Hat, ela fornece aos desenvolvedores uma opção familiar para a criação de ambientes de computação virtual. A IBM Consulting ajudará os clientes a implementar esses novos recursos.

Além disso, a versão 5.0 expande o suporte para cobrir uma ampla gama das GPUs NVIDIA mais recentes, hardware de rede e software de virtualização.

Disponível para Executar em Qualquer Lugar

A plataforma aprimorada de IA da NVIDIA é mais fácil de acessar do que nunca.

Os microsserviços NIM e CUDA-X e todos os recursos 5.0 estarão disponíveis em breve nos marketplaces da AWS, Google Cloud, Microsoft Azure e Oracle Cloud.

Para aqueles que preferem executar código em seus próprios data centers, o VMware Private AI Foundation com NVIDIA suportará o software, para que ele possa ser implantado nos data centers virtualizados dos  clientes da Broadcom.

As empresas têm a opção de executar o NVIDIA AI Enterprise no Red Hat OpenShift, permitindo que elas implantem em ambientes bare-metal ou virtualizados. Também é suportado no  Canonical Ubuntu e Charmed Kubernetes.

Além disso, a plataforma de IA fará parte do software disponível nos servidores HPE ProLiant da Hewlett Packard Enterprise (HPE). A solução de computação corporativa da HPE para IA generativa lida com inferência e ajuste fino de modelos usando NVIDIA AI Enterprise.

Além disso, Anyscale, Dataiku e DataRobot, três fornecedores líderes do software para gerenciar operações de machine learning (MLOps), darão suporte ao NIM em suas plataformas. Eles se juntam a um ecossistema NVIDIA de centenas de parceiros MLOps, incluindo Microsoft Azure Machine Learning, Dataloop AI, Domino Data Lab e Weights & Biases.

Independentemente do acesso, os usuários do NVIDIA AI Enterprise 5.0 podem aproveitar um software seguro, pronto para produção e otimizado para desempenho. Ele pode ser implantado de forma flexível para aplicações no data center, na nuvem, em workstations ou no edge da rede.

O NVIDIA AI Enterprise está disponível através dos principais fornecedores de sistemas, incluindo Cisco, Dell Technologies, HP, HPE, Lenovo e Supermicro.

Ouça Histórias de Sucesso no GTC

Os usuários compartilharão suas experiências com o software no NVIDIA GTC, uma conferência global de IA, que acontece de 18 a 21 de março no San Jose Convention Center.

Por exemplo,  o diretor de informações digitais da ServiceNow, Chris Bedi, falará em um painel sobre como aproveitar o potencial da IA generativa. Em uma palestra separada, o vice-presidente de produtos de IA da ServiceNow, Jeremy Barnes, compartilhará sobre o uso da NVIDIA AI Enterprise para alcançar a máxima produtividade do desenvolvedor.

Executivos da BlackRock, Medtronic, SAP e Uber discutirão  seu trabalho em finanças, saúde, software corporativo e operações de negócios usando a plataforma de IA da NVIDIA.

Além disso, executivos da ControlExpert, fornecedora global de aplicações para seguradoras de carros com sede na Alemanha, compartilharão como desenvolveram uma solução de gerenciamento de sinistros impulsionada por IA usando o software NVIDIA AI Enterprise.

Eles estão entre um conjunto crescente de empresas que se beneficiam do trabalho da NVIDIA avaliando centenas de projetos de IA generativa internos e externos, todos integrados em um único pacote que foi testado quanto à estabilidade e segurança.

E assista à palestra completa do fundador e CEO da NVIDIA, Jensen Huang, em sua apresentação de abertura no GTC.