Desbloqueie o Futuro da Videoconferência e Edição com o NVIDIA Maxine

por Greg Jones

A versão mais recente do NVIDIA Maxine traz recursos novos e atualizados que melhoram a comunicação em tempo real e elevam a edição de vídeo de alto impacto com IA.

A plataforma de desenvolvedores Maxine redefine a videoconferência e a edição, fornecendo aos desenvolvedores e empresas serviços de IA acelerados por GPU na nuvem, para que possam aprimorar os fluxos de vídeo e áudio em tempo real. Com o lançamento da produção do Maxine, agora disponível exclusivamente no NVIDIA AI Enterprise, os usuários podem acessar recursos avançados em realidade aumentada, efeitos de áudio e efeitos de vídeo.

A Nova Face dos Avatares

Avatares digitais têm sido usados há décadas, muitas vezes vistos como representações animadas estilizadas de uma pessoa ou personagem.

Agora, com o recurso Live Portrait do NVIDIA Maxine, os usuários podem escolher a foto perfeita de si mesmos e animá-la com uma webcam padrão. O Live Portrait sincroniza o movimento da cabeça e as expressões faciais de uma pessoa com a foto escolhida pelo usuário. Os usuários também podem escolher representações de caracteres estilizados 2D de si mesmos.

O Live Portrait agora está disponível como um recurso de produção no Maxine e pode usar saídas de modelo de alta resolução de até 1024×1024.

Encontrando Sua Voz

A voz de uma pessoa pode transmitir emoção e nuances comunicativas. O novo recurso Voice Font do NVIDIA Maxine, disponível em acesso antecipado, permite que os usuários gerem uma voz única para si mesmos, quase como um avatar digital para voz.

O recurso pode converter amostras de áudio em uma voz digital com apenas 30 segundos de áudio de referência.

A fonte de voz pode ser útil para pessoas que têm impedimentos de fala ou que querem ajustar o som de sua própria voz. O Voice Font está disponível para avaliação e teste na versão de acesso antecipado do Maxine.

Vendo Olho no Olho

O recurso Eye Contact da NVIDIA Maxine usa IA e um feed de webcam para direcionar o olhar do usuário para a câmera em tempo real. Da mesma forma, ele pode repousar os olhos em vídeos off-line para criar vídeos mais envolventes e impactantes.

Estudos mostraram que manter contato visual durante as conversas incentiva a conexão pessoal, a compreensão e o engajamento. O Maxine Eye Contact melhora a comunicação, garantindo que o usuário esteja sempre olhando para seu público, seja em uma videoconferência ou por meio de vídeo pré-gravado.

A nova versão do Maxine Eye Contact preserva o movimento natural dos micro-olhos e tem a capacidade adicional de “desviar o olhar” periodicamente, criando uma experiência mais realista em videoconferências. A frequência e a duração da função “olhar para longe” também são ajustáveis.

A versão mais recente do Eye Contact também traz melhorias de qualidade, incluindo maior estabilidade do olhar, manuseio de oclusão mais robusto e latência muito menor quando usado com GPUs NVIDIA da Geração Ada.

Melhor Que os Demais

A mais nova versão da Maxine também oferece recursos novos e atualizados em tempo real em realidade aumentada, efeitos de áudio e efeitos de vídeo para aprimorar os recursos de videoconferência e edição. Estes incluem:

  • 3D Body Pose, para estimativa de pose quando apenas a parte superior do corpo está na visão da câmera, introduzindo uma nova dimensão às interações virtuais.
  • Suporte para GPUs NVIDIA L4 Tensor Core e L40, impulsionadas pela arquitetura NVIDIA Ada Lovelace, trazendo aumentos de desempenho de até 1,75x em comparação com GPUs de famílias anteriores.
  • Suporte ao Servidor de Inferência NVIDIA Triton para AI Green Screen, Eye Contact, Landmark Detection e Face Detection, permitindo maior taxa de transferência para workflows de GPU única e múltipla.
  • Melhorias no desempenho de superresolução de áudio.
Melhorias no desempenho do Eye Contact usando NVIDIA Triton (ganho de taxa de transferência com base em fluxos simultâneos.
Melhorias de desempenho da tela verde da IA usando NVIDIA Triton (ganho de taxa de transferência com base em fluxos simultâneos).

Parceria para o Sucesso

Muitos parceiros e clientes da NVIDIA, como Quicklink e CoPilot AI, já estão experimentando videoconferência e edição de alta qualidade com a Maxine.

A Quicklink é uma fornecedora líder global de soluções de produção remota para as indústrias de mídia, transmissão, produção e esportes. A ferramenta de produção de vídeo Cre8 da empresa permite que os usuários ofereçam eventos profissionais, virtuais, presenciais e híbridos.

“Nossa parceria com a NVIDIA foi impulsionada por desafios do setor de transmissão, começando com a contribuição remota de convidados”, disse Richard Rees, CEO da Quicklink. “Nossa integração do NVIDIA Maxine ao Quicklink Cre8 resolve esses desafios com a adição dos recursos Auto Framing, Remoção de Ruído de Vídeo, Cancelamento de Ruído e Eco e Contato Ocular do Maxine. Esses recursos tiveram uma recepção incrível em toda a indústria.”

Imagem cortesia de Quicklink

A CoPilot AI, uma startup de software como serviço baseada em Vancouver que opera na seção transversal entre IA e habilitação de vendas, incorpora a Maxine para fornecer soluções confiáveis para criadores de conteúdo.

“Usando microsserviços NVIDIA Maxine, capacitamos os usuários a gravar no capricho e se destacar na multidão”, disse Jackson Chao, cofundador do CoPilot AI Video. “O recurso Eye Contact da Maxine permite que os usuários gravem um roteiro sem comprometer a conexão com os espectadores. Mesmo os criadores de conteúdo novatos são capazes de adotar a divulgação em vídeo com confiança e humanizar a maneira como se envolvem com seus contatos.”

O Maxine oferece uma coleção de efeitos de IA que aprimoram o áudio e o vídeo em tempo real e podem ser incorporados às infraestruturas existentes do cliente. E a solução pode ser implantada na nuvem, no local ou na borda, permitindo uma comunicação de qualidade de praticamente qualquer lugar.

Disponibilidade

Desde o aprimoramento das necessidades diárias de videoconferência até a integração da tecnologia de IA, o NVIDIA Maxine oferece comunicações de vídeo de alta qualidade para todos os profissionais.

A versão de produção mais recente do Maxine está incluído exclusivamente no NVIDIA AI Enterprise 4.1, permitindo que os usuários aproveitem os recursos prontos para produção, como o Servidor de Inferência Triton, suporte corporativo e muito mais.

Para clientes que precisam de acesso ao programa de acesso antecipado limitado do NVIDIA Maxine, preencha o formulário on-line nas páginas do Programa de Acesso Antecipado Maxine Microservices ou do Programa de Acesso Antecipado ao SDK Maxine.

Para ajudar a melhorar os recursos nas próximas versões, os participantes podem fornecer comentários contribuindo para a pesquisa NVIDIA Maxine e Aplicação NVIDIA Broadcast.