O Que é um Modelo de Machine Learning?

Alimentados por dados, os modelos de ML são os motores matemáticos da AI, expressões de algoritmos que encontram padrões e fazem previsões mais rápido do que um ser humano.
por Chris Parsons

Antes de comprar um carro, você precisa escolher um modelo: um Honda Civic, para um deslocamento mais barato, um Chevy Corvette, para um visual impressionante e velocidade, ou um Ford F-150, para cargas pesadas.

Para a viagem rumo à AI, a tecnologia mais transformadora desta era, o motor de que você precisa é um modelo de machine learning.

O Que é um Modelo de ML?

Um modelo de machine learning é a expressão de um algoritmo que examina grandes volumes de dados para identificar padrões ou fazer previsões. Alimentados por dados, os modelos de ML são os mecanismos matemáticos da AI.

Um modelo de ML para a visão computacional, por exemplo, consegue identificar automóveis e pedestres em um vídeo em tempo real. Já um modelo para processamento de linguagem natural pode traduzir palavras e frases.

Basicamente, um modelo de machine learning é uma representação matemática de objetos e das relações entre eles. Os objetos podem ser desde curtidas em uma publicação em uma rede social até moléculas em um experimento de laboratório, entre outros.

Modelos de ML para Todos os Fins

Como não há restrição quanto aos objetos que podem ser transformados em recursos em um modelo de ML, não há limites para o uso na AI. Há infinitas combinações.

Os cientistas de dados já criaram famílias de modelos de machine learning para diferentes usos, e o desenvolvimento continua.

Uma Breve Taxonomia de Modelos de ML
Tipo do Modelo de MLCasos de Uso
Regressão/classificação linearPadrões em dados numéricos, como planilhas financeiras
Modelos gráficosDetecção de fraude ou consciência de sentimento
Árvores de decisão/Florestas aleatóriasPrevisão de resultados
Redes neurais de deep learningVisão computacional, processamento de linguagem natural e muito mais

Os modelos lineares, por exemplo, usam a álgebra para prever relações entre variáveis em projeções financeiras. Os modelos gráficos expressam uma probabilidade em forma de diagramas, como a chance de um consumidor comprar um produto. Recorrendo a uma metáfora da natureza, alguns modelos de ML têm a forma de árvores de decisão ou conjuntos de árvores, chamados de florestas aleatórias.

No Big Bang da AI, em 2012, pesquisadores descobriram que o deep learning era uma das técnicas mais bem-sucedidas para identificar padrões e fazer previsões. Ele usa uma espécie de modelo de machine learning chamado de rede neural, inspirado nos padrões e funções das células do cérebro.

Um Modelo de ML para o Público Geral

O nome deep learning vem da estrutura dos modelos de machine learning. Esses modelos empilham camada sobre camada de características e das relações entre elas, formando um “sanduíche” matemático.

Graças à precisão impressionante de identificação de padrões, dois tipos de modelos de deep learning, descritos em outra seção, estão surgindo em todo lugar.

As redes neurais convolucionais (CNNs), geralmente usadas na visão computacional, funcionam como os olhos dos veículos autônomos e ajudam a detectar doenças em diagnósticos por imagens. As redes neurais recorrentes (RNNs) e os transformadores, usados para analisar a língua falada e escrita, são os engines presentes na Alexa, da Amazon, no Google Assistente e na Siri, da Apple.

Diagram showing how a deep neural network sees.
As redes neurais de deep learning recebem esse nome devido à estrutura multicamada que apresentam.

Dica: Escolha um Modelo Pré-Treinado

Escolher a família certa de modelos, como CNNs, RNNs ou transformadores, é um ótimo primeiro passo,  mas é só o começo.

Se você quisesse participar do Baja 500, poderia modificar um buggy de rally comum usando amortecedores reforçados e pneus robustos, ou comprar um carro feito especialmente para essa corrida.

Em machine learning, é isso que chamamos de modelo pré-treinado. São modelos ajustados a partir de grandes conjuntos de dados de treinamento semelhantes aos dados do seu caso de uso. As relações entre os dados, chamadas de pesos e vieses (biases), são otimizadas para a aplicação pretendida.

Para treinar um modelo, são necessários um enorme conjunto de dados, muita experiência em AI e muita potência computacional. Os consumidores experientes compram modelos pré-treinados para economizar tempo e dinheiro.

Quem Você Vai Chamar?

Quando for adquirir um modelo pré-treinado, procure um fornecedor confiável.

A NVIDIA criou uma biblioteca on-line chamada de catálogo NGC, com diversos modelos aprovados e pré-treinados. Eles englobam uma gama de tarefas de AI, desde a visão computacional até a AI de conversação e muito mais.

Os usuários sabem o que estão adquirindo, porque os modelos do catálogo vêm com currículos. São como as qualificações de uma pessoa cotada para contratação.

O currículo do modelo mostra o domínio para o qual foi treinado, o conjunto de dados com que foi treinado e o desempenho esperado. Eles passam a transparência e a confiança de que você está optando pelo modelo certo para o seu caso de uso.

Outros Recursos para Modelos de ML

Além de tudo, os modelos do NGC estão prontos para transfer learning. É o último ajuste de motor que prepara os modelos para as condições do terreno que atravessarão: os dados da sua aplicação.

A NVIDIA também oferece a ferramenta para ajustar o modelo do NGC, chamada TAO (Train Adapt and Optimize). Você já pode se inscrever para o acesso antecipado hoje mesmo.

Para saber mais, confira: