O Novo GPT-5.5 da OpenAI Impulsiona o Codex na Infraestrutura NVIDIA, e a NVIDIA Já Está Colocando-o em Uso

Mais de 10.000 colaboradores da NVIDIA em diversas funções tiveram acesso antecipado ao mais recente modelo de fronteira da OpenAI. Os resultados, disse um engenheiro, estão "me deixando de boca aberta".
por Justin Boitano

Os agentes de IA revolucionaram os workflows dos desenvolvedores, e sua próxima fronteira é o trabalho do conhecimento: processar informações, resolver problemas complexos, gerar novas ideias e impulsionar a inovação.

O Codex, aplicativo de programação baseada em agentes da OpenAI, está habilitando essa nova fronteira. Ele agora é alimentado pelo GPT-5.5, o mais recente modelo de fronteira da OpenAI, que roda em sistemas rack-scale NVIDIA GB200 NVL72.

Mais de 10.000 colaboradores da NVIDIA, em engenharia, produto, jurídico, marketing, finanças, vendas, RH, operações e programas para desenvolvedores, já estão usando o Codex alimentado pelo GPT-5.5 para alcançar, em suas próprias palavras, resultados “que estão me deixando de boca aberta” e “que mudam a vida”.

Os engenheiros da NVIDIA tiveram acesso ao GPT-5.5 por meio do aplicativo Codex por algumas semanas, e os ganhos são mensuráveis. Servido no GB200 NVL72, capaz de oferecer um custo por milhão de tokens 35x menor e uma taxa de saída de tokens por segundo por megawatt 50 vezes maior em comparação com sistemas da geração anterior — economia que torna a inferência de modelos de fronteira viável em escala empresarial.

Ciclos de depuração que antes se estendiam por dias estão sendo concluídos em horas. Experimentações que antes exigiam semanas estão se transformando em progresso overnight em bases de código complexas e com múltiplos arquivos. As equipes estão entregando funcionalidades completas a partir de prompts em linguagem natural, com maior confiabilidade e menos ciclos desperdiçados do que nos modelos anteriores.

O progresso impressionante da OpenAI é apenas o exemplo mais recente do trabalho da NVIDIA com todas as empresas de modelos de fronteira, não apenas para acelerar o uso de agentes de IA dentro da NVIDIA, mas para ajudar os parceiros da empresa a construir os melhores modelos do mundo, com o menor custo e maior eficiência energética para todos.

Como disse o fundador e CEO da NVIDIA, Jensen Huang, aos funcionários em um e-mail para toda a empresa, incentivando todos a usarem o Codex: “Vamos saltar para a velocidade da luz. Bem-vindos à era da IA”.

Uma Implantação Construída para Segurança Empresarial

Assim como os humanos, cada agente precisa do seu próprio computador dedicado.

Para garantir uma operação fluida em ambientes empresariais seguros, o aplicativo Codex oferece suporte a conexões remotas via Secure Shell (SSH) para máquinas virtuais em nuvem aprovadas, permitindo que os agentes trabalhem com dados reais da empresa sem expô-los externamente.

Portanto, para garantir máxima segurança e auditabilidade, o departamento de TI da NVIDIA disponibilizou máquinas virtuais (VMs) em nuvem para todos os funcionários executarem seu agente com segurança. Isso fornece um sandbox dedicado para o agente operar em sua capacidade máxima, mantendo total auditabilidade. Os usuários podem controlar o agente Codex em execução na VM em nuvem por meio de uma interface familiar a todos os funcionários.

Uma política de retenção zero de dados rege a implantação da NVIDIA, e os agentes acessam sistemas de produção com permissões somente de leitura por meio de interfaces de linha de comando e Skills, o mesmo kit de ferramentas baseadas em agentes que a NVIDIA usa para executar workflows de automação em toda a empresa.

Uma Década de Colaboração Full-Stack

O lançamento do GPT-5.5 e a implantação do Codex refletem mais de 10 anos de colaboração entre a NVIDIA e a OpenAI. A parceria começou em 2016, quando o fundador e CEO da NVIDIA, Jensen Huang, entregou pessoalmente o primeiro supercomputador de IA NVIDIA DGX-1 à sede da OpenAI em San Francisco.

Desde então, as duas empresas trabalharam em estreita colaboração em toda a pilha de IA.

A NVIDIA foi parceira no dia zero do lançamento do modelo de peso aberto gpt-oss da OpenAI, otimizando os pesos do modelo para o NVIDIA TensorRT-LLM e frameworks do ecossistema, incluindo vLLM e Ollama.

A OpenAI se comprometeu a implantar mais de 10 gigawatts de sistemas NVIDIA para sua infraestrutura de IA de próxima geração, uma expansão que colocará milhões de GPUs NVIDIA na base do treinamento e da inferência de modelos da OpenAI pelos próximos anos.

A OpenAI e a NVIDIA são parceiros iniciais de silício e codesign: a OpenAI fornece feedback que orienta o roadmap de hardware da NVIDIA e, em troca, obtém acesso antecipado a novas arquiteturas. Essa relação produziu um marco concreto, a inicialização conjunta do primeiro cluster GB200 NVL72 com 100.000 GPUs. O cluster concluiu múltiplas execuções de treinamento em grande escala e estabeleceu um novo benchmark de confiabilidade em nível de sistema em escala de fronteira.

O GPT-5.5 é o produto dessa infraestrutura operando em plena capacidade.

Saiba mais no anúncio da OpenAI.