O comércio online disparou para trilhões de dólares em todo o mundo na última década, atendendo bilhões de consumidores. Nos bastidores desse crescimento explosivo nas vendas on-line está a personalização impulsionada por mecanismos de recomendação.
Os recomendadores tornam as compras profundamente personalizadas. Ao pesquisar produtos em sites de comércio eletrônico, eles encontram você. Ou sugestões podem simplesmente aparecer. Este canto extremamente delicioso da internet é impulsionado por conjuntos de dados e modelos cada vez mais massivos.
O NVIDIA Merlin é o combustível de foguete dos recomendadores. Impulsionando o treinamento e a inferência, ele permite que empresas de todos os tipos aproveitem melhor os dados para criar recomendações aceleradas por GPUs NVIDIA.
As apostas são mais altas do que nunca para negócios online. Espera-se que as vendas online em 2021 atinjam quase US$ 5 trilhões em todo o mundo, de acordo com a eMarketer, um aumento de quase 17% em relação ao ano anterior.
Em alguns dos maiores sites on-line do mundo, mesmo um ganho de 1% na precisão da relevância das recomendações pode gerar bilhões de vendas a mais.
O investimento em sistemas de recomendação tornou-se uma das maiores vantagens competitivas dos gigantes da internet atualmente.
Espera-se que o mercado de recomendações atinja US$ 15,13 bilhões até 2026, acima dos US$ 2,12 bilhões em 2020, de acordo com a Mordor Intelligence. O maior e mais rápido segmento do mercado de motores de recomendação está na região Ásia-Pacífico, de acordo com a empresa de pesquisa.
Mas um desafio do setor é que a relevância aprimorada requer mais dados e processamento. Esses dados consistem em trilhões de interações entre usuários e produtos (cliques, visualizações) em bilhões de produtos e perfis de consumidores.
Dados dessa escala podem levar dias para treinar modelos. No entanto, quanto mais rápido você puder criar novos modelos informados por mais dados, melhor será sua relevância.
A coleção de modelos, métodos e bibliotecas do Merlin inclui ferramentas para construir sistemas baseados em deep learning capazes de lidar com terabytes de dados que podem fornecer melhores previsões e aumentar os cliques.
SNAP usa Merlin e GPUs para Vantagem em Inferência
A publicidade digital dos EUA deve atingir US$ 191,1 bilhões em 2021, um aumento de 25,5% em relação ao ano anterior, segundo a eMarketer.
A Snap, empresa controladora do aplicativo de mídia social Snapchat, está sediada em Santa Monica, Califórnia, e tem mais de 300 milhões de usuários ativos diariamente. Ele cria receita de anúncios de seu serviço de mensagens de fotos e vídeos sociais.
“Continuaremos focados em fornecer resultados sólidos para nossos parceiros de publicidade e inovar para expandir os recursos de nossa plataforma e atender melhor nossa comunidade”, disse o CEO da Snap, Evan Spiegel, em seu relatório de resultados do terceiro trimestre.
O obstáculo técnico para a Snap é que ela busca continuar desenvolvendo os modelos de classificação de custo mais alto de sua carga de trabalho e expandir para modelos mais complexos, reduzindo custos.
A empresa usou GPUs NVIDIA e Merlin para aumentar seus recursos de classificação de conteúdo.
“A Snap usou GPUs NVIDIA e software Merlin para melhorar a eficiência de custo de inferência de machine learning em 50% e diminuir a latência de serviço em 2 vezes, fornecendo espaço computacional para experimentar e implantar modelos de classificação de conteúdo e anúncios mais pesados e precisos”, disse Nima Khajehnouri, VP de engenharia da Snap.
Tencent Impulsiona o Treinamento de Modelos com o HugeCTR da Merlin
A gigante do entretenimento Tencent, que opera o serviço de mensagens extremamente popular WeChat e a plataforma de pagamentos WeChat Pay, é a maior empresa da China por capitalização de mercado.
Seus engenheiros precisam iterar rapidamente em modelos para seu sistema de recomendação de publicidade, colocando demandas crescentes em seu desempenho de treinamento.
“A publicidade é um negócio relativamente importante dentro da Tencent e o sistema de recomendação é usado para aumentar a receita geral de publicidade”, disse Xiangting Kong, engenheiro especialista da Tencent.
O problema é que a precisão da recomendação de publicidade só pode ser melhorada treinando mais dados de amostra, incluindo mais recursos de amostra, mas isso leva a tempos de treinamento mais longos que afetam a frequência de atualização do modelo.
“O HugeCTR, um framework integrado ao sistema de treinamento de recomendação de publicidade, torna a frequência de atualização do treinamento de modelo mais rápida, e mais amostras podem ser treinadas para melhorar os efeitos online”, disse ele.
Depois que o desempenho do modelo de treinamento for aprimorado, mais dados podem ser treinados para melhorar a precisão do modelo, aumentando a receita de publicidade, acrescentou.
Meituan Reduz os Custos com as GPUs NVIDIA A100
Os negócios da Meituan estão em um cruzamento movimentado de alimentação, entretenimento e serviços sob demanda, entre suas 200 categorias de serviços. A gigante chinesa da internet tem mais de 667 milhões de usuários ativos e 8,3 milhões de comerciantes ativos.
Jun Huang, especialista técnico sênior da Meituan, disse que, se sua equipe pode melhorar muito o desempenho, geralmente prefere treinar mais amostras e modelos mais complexos.
O problema para Meituan era que, à medida que seus modelos se tornavam cada vez mais complexos, tornava-se difícil otimizar profundamente o framework de treinamento, disse Huang.
“Estamos trabalhando na integração do NVIDIA HugeCTR em nosso sistema de treinamento baseado nas GPUs A100. O custo também é bastante reduzido. Este é um resultado preliminar de otimização e ainda há muito espaço para otimizar no futuro”, disse ele.
A Meituan informou recentemente que seu número médio de transações por usuários aumentou para 32,8 nos últimos 12 meses do segundo trimestre de 2021, em comparação com 25,7 nos últimos 12 meses do segundo trimestre de 2020.
Saiba mais sobre o NVIDIA Merlin. Saiba mais sobre o NVIDIA Triton.