Prometendo ajudar a processar imagens com mais rapidez e eficiência em grande escala, a NVIDIA apresentou o CV-CUDA, uma biblioteca de código aberto para a construção acelerada de visão computacional de ponta a ponta e pipelines de processamento de imagem.
A maioria do tráfego da internet é de vídeo. Cada vez mais, este vídeo será aumentado por efeitos especiais de IA e gráficos de computador.
Para aumentar essa complexidade, os serviços de mídia social e compartilhamento de vídeo em rápido crescimento estão enfrentando custos crescentes de computação no cloud e gargalos em seus pipelines de processamento de imagens e visão computacional baseados em IA.
O CV-CUDA acelera efeitos especiais de IA, como reiluminação, reposicionamento, desfoque de fundos e super-resolução.
As GPUs NVIDIA já aceleram a parte de inferência dos pipelines de visão computacional de IA. Mas o pré e o pós-processamento usando ferramentas tradicionais de visão computacional consomem tempo e poder de computação.
O CV-CUDA oferece aos desenvolvedores mais de 50 algoritmos de visão computacional de alto desempenho, um framework de desenvolvimento que facilita a implementação de kernels personalizados e interfaces de cópia zero para remover gargalos no pipeline de IA.
O resultado é maior rendimento e menores custos de computação no cloud. O CV-CUDA pode processar 10 vezes mais fluxos em uma única GPU.
Tudo isso ajuda os desenvolvedores a lidar com a criação de conteúdo de vídeo, mundos 3D, sistemas de recomendação baseados em imagem, reconhecimento de imagem e videoconferência a se moverem muito mais rapidamente.
As plataformas de criação de conteúdo de vídeo devem processar, aprimorar e moderar milhões de streams de vídeo diariamente e garantir que os usuários baseados em dispositivos móveis tenham a melhor experiência ao executar suas aplicações em qualquer telefone.
- Para aqueles que criam mundos 3D ou aplicações no metaverso, o CV-CUDA permite tarefas como estrutura de movimento, formas baseadas em estéreo e fluxo óptico para ajudar a construir ou estender mundos 3D e seus componentes.
- Na compreensão e reconhecimento de imagens, o CV-CUDA pode acelerar significativamente os pipelines de reconhecimento executados em hiperescala, permitindo que os usuários móveis desfrutem de aplicações de reconhecimento de imagem sofisticados e responsivos.
- E em videoconferência, o CV-CUDA pode suportar recursos sofisticados baseados em realidade aumentada. Esses recursos podem envolver pipelines de IA complexos que exigem várias etapas de pré e pós-processamento.
O CV-CUDA acelera os pipelines de pré e pós-processamento por meio de kernels CUDA otimizados manualmente e integra-se nativamente a C/C++, Python e frameworks comuns de deep learning, como PyTorch.
O CV-CUDA será uma das principais tecnologias que podem acelerar os fluxos de trabalho de IA no NVIDIA Omniverse, uma plataforma de colaboração e simulação de mundo virtual para fluxos de trabalho 3D.
Os desenvolvedores podem obter acesso antecipado ao código em dezembro de 2022, com uma versão beta para março de 2023.
Para saber mais, visite nossa página de interesse de acesso antecipado em developer.nvidia.com/cv-cuda-early-access.