Imagine tentar ensinar a uma criança o que é um unicórnio. Um bom lugar para começar pode ser mostrando para a criança imagens da criatura e descrevendo suas características únicas.
Agora, imagine tentar ensinar a uma máquina artificialmente inteligente o que é um unicórnio. Por onde você começaria?
Modelos de AI pré-treinados oferecem uma solução.
Um modelo de AI pré-treinado é um modelo de deep learning, uma expressão de um algoritmo neural similar ao cérebro que encontra padrões ou faz previsões baseadas em dados, treinado com grandes conjuntos de dados para realizar uma tarefa específica. Ele pode ser usado como foi criado ou pode ser ajustado para atender às necessidades específicas de uma aplicação.
Por que os Modelos de AI Pré-Treinados são Usados?
Em vez de criar um modelo de AI do zero, os desenvolvedores podem usar modelos pré-treinados e personalizá-los para atender às suas exigências.
Para criar uma aplicação de AI, os desenvolvedores precisam primeiro de um modelo de AI que possa realizar uma tarefa específica, seja identificar um cavalo mítico, detectar um risco de segurança para um veículo autônomo ou diagnosticar um câncer com diagnóstico por imagens. Esse modelo precisa de muitos dados representativos para aprender.
Esse processo de aprendizado envolve analisar várias camadas de dados recebidos e enfatizar características relevantes para metas em cada camada.
Para criar um modelo que possa reconhecer um unicórnio, por exemplo, pode-se primeiro alimentá-lo com imagens de unicórnios, cavalos, gatos, tigres e outros animais. Esses são os dados recebidos.
Depois, camadas de traços de dados representativos são construídas, começando com o simples, como linhas e cores, e avançando para características estruturais complexas. Essas características recebem diferentes graus de relevância pelo cálculo de probabilidades.
Ao contrário de um gato ou tigre, por exemplo, quanto mais parecido com um cavalo uma criatura se parece, maior a probabilidade de ser um unicórnio. Esses valores probabilísticos são armazenados em cada camada de rede neural no modelo de AI e, à medida que as camadas são adicionadas, sua compreensão sobre a representação melhora.
Para criar esse modelo do zero, os desenvolvedores precisam de enormes conjuntos de dados, muitas vezes com bilhões de linhas de dados. Eles podem ser caros e difíceis de obter, mas sem os dados adequados o desempenho do modelo pode ser ruim.
Representações probabilísticas de pré-computação, conhecidas como pesos, economizam tempo, dinheiro e esforço. Um modelo pré-treinado já foi desenvolvido e treinado com esses pesos.
O uso de um modelo pré-treinado de alta qualidade com um grande número de pesos representativos precisos leva a maiores chances de sucesso na implantação da AI. Os pesos podem ser modificados, e mais dados podem ser adicionados ao modelo para personalizá-lo ou ajustá-lo ainda mais.
Os desenvolvedores de modelos pré-treinados podem criar aplicações de AI mais rapidamente, sem se preocupar em lidar com montanhas de dados de entrada ou probabilidades de computação para camadas densas.
Em outras palavras, usar um modelo de AI pré-treinado é como comprar um vestido ou uma camisa e, em seguida, ajustar a peça para atender às suas necessidades, em vez de começar com tecido, linha e agulha.
Os modelos de AI pré-treinados geralmente são usados para transfer learning e podem ser baseados em vários tipos de arquitetura de modelos. Um tipo comum de arquitetura é o modelo transformer, uma rede neural que aprende o contexto e o significado com o monitoramento de relações em dados sequenciais.
De acordo com Alfredo Ramos, vice-presidente sênior de plataforma na empresa de AI Clarifai, parceiro Premier do programa NVIDIA Inception para startups, os modelos pré-treinados podem reduzir o tempo de desenvolvimento de aplicações de AI em até um ano e levar a uma economia de custos de centenas de milhares de dólares.
Como os Modelos Pré-Treinados Avançam a AI?
Como os modelos pré-treinados simplificam e aceleram o desenvolvimento de AI, muitos desenvolvedores e empresas os usam para acelerar vários casos de uso de AI.
As principais áreas nas quais os modelos pré-treinados estão avançando a AI incluem:
- Processamento de linguagem natural. Modelos pré-treinados são usados para tradução, chatbots e outras aplicações de processamento de linguagem natural. Modelos de linguagem grandes, muitas vezes baseados na arquitetura do modelo transformer, são uma extensão dos modelos pré-treinados. Um exemplo de um LLM pré-treinado é o NVIDIA NeMo Megatron, um dos maiores modelos de AI do mundo.
- AI de fala. Modelos pré-treinados podem ajudar as aplicações de fala de AI a estarem prontas para diferentes idiomas. Os casos de uso incluem automação de centros de atendimento, assistentes de AI e tecnologias de reconhecimento de voz.
- Visão computacional. Assim como no exemplo do unicórnio acima, modelos pré-treinados podem ajudar a AI a reconhecer rapidamente criaturas, objetos, lugares e pessoas. Dessa forma, os modelos pré-treinados aceleram a visão computacional, oferecendo às aplicações recursos de visão humana em esportes, cidades inteligentes e muito mais.
- Área da saúde. No caso de aplicações da área da saúde, modelos pré-treinados de AI como o MegaMolBART, que faz parte do serviço e framework NVIDIA BioNeMo, compreendem a linguagem da química e aprendem as relações entre átomos em moléculas do mundo real, oferecendo à comunidade científica uma ferramenta avançada para a descoberta mais rápida de medicamentos.
- Cibersegurança. Os modelos pré-treinados oferecem um ponto de partida para implementar soluções de cibersegurança baseadas em AI e ampliar os recursos dos analistas de segurança humana para detectar ameaças mais rapidamente. Os exemplos incluem impressões digitais de humanos e máquinas, detecção de anomalias, informações confidenciais e phishing.
- Workflows de criação e arte. Reforçando a recente onda de arte de AI, modelos pré-treinados podem ajudar a acelerar os workflows de criação com ferramentas como GauGAN e NVIDIA Canva.
Modelos de AI pré-treinados podem ser aplicados em setores além desses, pois sua personalização e ajustes podem levar a possibilidades infinitas de casos de uso.
Onde Encontrar Modelos de AI Pré-Treinados
Empresas como Google, Meta, Microsoft e NVIDIA estão inventando arquiteturas e frameworks de modelos de ponta para construir modelos de AI.
Às vezes, eles são lançados em hubs de modelos ou como código aberto, permitindo que os desenvolvedores ajustem os modelos de AI pré-treinados, melhorem sua precisão e expandam os repositórios de modelos.
O NVIDIA NGC, um hub de softwares, modelos e exemplos de Notebooks Jupyter de AI otimizados por GPU, inclui modelos pré-treinados, benchmarks de AI e receitas de treinamento otimizadas para uso com a plataforma de AI da NVIDIA.
O NVIDIA AI Enterprise, um pacote totalmente gerenciado, seguro e nativo do cloud de softwares de AI e análise de dados, inclui modelos pré-treinados sem criptografia. Isso permite que desenvolvedores e empresas que procuram integrar modelos pré-treinados da NVIDIA em suas aplicações de AI personalizadas visualizem os pesos e as parcialidades do modelo, além de melhorarem a explicabilidade e a depuração com facilidade.
Milhares de modelos de código aberto também estão disponíveis em hubs como GitHub, Hugging Face e outros.
É importante que modelos pré-treinados sejam treinados usando dados éticos transparentes e explicáveis, em conformidade com a privacidade e obtidos com consentimento e sem parcialidade.
Modelos Pré-Treinados de AI da NVIDIA
Para ajudar mais desenvolvedores a passar a AI do protótipo para a produção, a NVIDIA oferece vários modelos pré-treinados que podem ser implementados imediatamente, incluindo:
- NVIDIA SegFormer, um modelo transformer para segmentação semântica simples, eficiente e poderosa, disponível no GitHub.
- Os modelos de visão computacional desenvolvidos especificamente pela NVIDIA, treinados com milhões de imagens para cidades inteligentes, gerenciamento de estacionamento e outras aplicações.
- O NVIDIA NeMo Megatron, maior modelo de linguagem personalizável do mundo, faz parte do NVIDIA NeMo, um framework de código aberto para a criação de aplicações flexíveis e de alto desempenho para AI conversacional, a AI de fala e a biologia.
- NVIDIA StyleGAN, uma arquitetura de gerador baseada em estilo para redes adversárias generativas (GANs – Generative Adversarial Networks). Ele usa transfer learning para gerar pinturas infinitas em uma variedade de estilos.
Além disso, o NVIDIA Riva, um kit de desenvolvimento de software acelerado por GPU para criar e implementar aplicações de AI de fala, inclui modelos pré-treinados em dez idiomas.
O MONAI, um framework de AI de código aberto para pesquisa na área da saúde desenvolvido pela NVIDIA e pela King’s College London, inclui modelos pré-treinados para diagnósticos por imagens.
Saiba mais sobre os modelos pré-treinados de AI da NVIDIA.