Nielsen Sports constate une réduction de 75 % des coûts d'analyse vidéo grâce aux points de terminaison multimodèles Amazon SageMaker

Republié par Platon

Suiveurs: 0

Ceci est un article invité co-écrit avec Tamir Rubinsky et Aviad Aranias de Nielsen Sports.

Sports Nielsen façonne les médias et le contenu du monde entier en tant que leader mondial en matière d'informations, de données et d'analyses sur l'audience. Grâce à notre compréhension des personnes et de leurs comportements sur tous les canaux et plateformes, nous donnons à nos clients des informations indépendantes et exploitables afin qu'ils puissent se connecter et interagir avec leur public, maintenant et à l'avenir.

Chez Nielsen Sports, notre mission est de fournir à nos clients (marques et titulaires de droits) la possibilité de mesurer le retour sur investissement (ROI) et l'efficacité d'une campagne publicitaire de sponsoring sportif sur tous les canaux, y compris la télévision, en ligne, les médias sociaux et même les journaux, et de fournir un ciblage précis aux niveaux local, national et international.

Dans cet article, nous décrivons comment Nielsen Sports a modernisé un système exécutant des milliers de modèles d'apprentissage automatique (ML) différents en production en utilisant Amazon Sage Maker points de terminaison multimodèles (MME) et réduction des coûts opérationnels et financiers de 75 %.

Défis liés à la segmentation vidéo des chaînes

Notre technologie est basée sur l'intelligence artificielle (IA) et plus particulièrement sur la vision par ordinateur (CV), qui nous permet de suivre l'exposition de la marque et d'identifier sa localisation avec précision. Par exemple, nous identifions si la marque est sur une bannière ou sur une chemise. De plus, nous identifions l'emplacement de la marque sur l'article, comme le coin supérieur d'une pancarte ou la pochette. La figure suivante montre un exemple de notre système de marquage.

exemple de système de marquage Nielsen

Pour comprendre nos défis en matière d'évolutivité et de coûts, examinons quelques chiffres représentatifs. Chaque mois, nous identifions plus de 120 millions d'impressions de marque sur différents canaux, et le système doit prendre en charge l'identification de plus de 100,000 6 marques et variantes de différentes marques. Nous avons construit l'une des plus grandes bases de données d'impressions de marque au monde avec plus de XNUMX milliards de points de données.

Notre processus d'évaluation des médias comprend plusieurs étapes, comme l'illustre la figure suivante :

Premièrement, nous enregistrons des milliers de chaînes à travers le monde à l’aide d’un système d’enregistrement international.
Nous diffusons le contenu en combinaison avec le calendrier de diffusion (Guide de programmation électronique) jusqu'à l'étape suivante, qui est la segmentation et la séparation entre les diffusions de jeux elles-mêmes et d'autres contenus ou publicités.
Nous effectuons une surveillance des médias, où nous ajoutons des métadonnées supplémentaires à chaque segment, telles que les scores de la ligue, les équipes concernées et les joueurs.
Nous effectuons une analyse d'exposition de la visibilité des marques puis combinons les informations d'audience pour calculer la valorisation de la campagne.
Les informations sont fournies au client par un tableau de bord ou des rapports d'analystes. L'analyste a un accès direct aux données brutes ou via notre entrepôt de données.

étapes d'évaluation des médias

Parce que nous opérons à une échelle de plus d’un millier de chaînes et des dizaines de milliers d’heures de vidéo par an, nous devons disposer d’un système d’automatisation évolutif pour le processus d’analyse. Notre solution segmente automatiquement la diffusion et sait isoler les clips vidéo pertinents du reste du contenu.

Pour ce faire, nous utilisons des algorithmes et des modèles dédiés développés par nos soins pour analyser les caractéristiques spécifiques des canaux.

Au total, nous exécutons des milliers de modèles différents en production pour soutenir cette mission, qui est coûteuse, entraîne des frais opérationnels, est sujette aux erreurs et est lente. Il a fallu des mois pour mettre en production des modèles dotés d’une nouvelle architecture de modèle.

C'est là que nous avons voulu innover et réarchitecturer notre système.

Mise à l'échelle rentable pour les modèles de CV à l'aide des SageMaker MME

Notre ancien système de segmentation vidéo était difficile à tester, à modifier et à maintenir. Certains des défis incluent le travail avec un ancien framework ML, les interdépendances entre les composants et un flux de travail difficile à optimiser. En effet, nous étions basés sur RabbitMQ pour le pipeline, qui était une solution avec état. Pour déboguer un composant, tel que l'extraction de fonctionnalités, nous avons dû tester l'ensemble du pipeline.

Le diagramme suivant illustre l’architecture précédente.

architecture précédente

Dans le cadre de notre analyse, nous avons identifié des goulots d'étranglement en termes de performances, tels que l'exécution d'un seul modèle sur une machine, qui présentait une faible utilisation du GPU de 30 à 40 %. Nous avons également découvert des exécutions de pipeline et des algorithmes de planification inefficaces pour les modèles.

Par conséquent, nous avons décidé de créer une nouvelle architecture multi-tenant basée sur SageMaker, qui mettrait en œuvre des améliorations d'optimisation des performances, prendrait en charge des tailles de lots dynamiques et exécuterait plusieurs modèles simultanément.

Chaque exécution du flux de travail cible un groupe de vidéos. Chaque vidéo dure entre 30 et 90 minutes et chaque groupe dispose de plus de cinq modèles à exécuter.

Examinons un exemple : une vidéo peut durer 60 minutes, composée de 3,600 12 images, et chaque image doit être déduite par trois modèles ML différents au cours de la première étape. Avec les MME SageMaker, nous pouvons exécuter des lots de 2 images en parallèle, et le lot complet se termine en moins de 20 secondes. Au cours d'une journée normale, nous avons plus de 100 groupes de vidéos, et lors d'une journée de week-end bien remplie, nous pouvons avoir plus de XNUMX groupes de vidéos.

Le diagramme suivant montre notre nouvelle architecture simplifiée utilisant un SageMaker MME.

architecture simplifiée utilisant un SageMaker MME

Résultats

Avec la nouvelle architecture, nous avons atteint bon nombre des résultats souhaités et certains avantages inédits par rapport à l’ancienne architecture :

Meilleure autonomie – En augmentant la taille des lots (12 vidéos en parallèle) et en exécutant plusieurs modèles simultanément (cinq modèles en parallèle), nous avons réduit la durée d'exécution globale de notre pipeline de 33 %, de 1 heure à 40 minutes.
Infrastructure améliorée – Avec SageMaker, nous avons mis à niveau notre infrastructure existante et nous utilisons désormais des instances AWS plus récentes avec des GPU plus récents tels que g5.xlarge. L'un des plus grands avantages de ce changement est l'amélioration immédiate des performances grâce à l'utilisation des optimisations TorchScript et CUDA.
Utilisation optimisée des infrastructures – En disposant d'un seul point de terminaison pouvant héberger plusieurs modèles, nous pouvons réduire à la fois le nombre de points de terminaison et le nombre de machines que nous devons entretenir, et également augmenter l'utilisation d'une seule machine et de son GPU. Pour une tâche spécifique comportant cinq vidéos, nous n'utilisons désormais que cinq machines d'instances g5, ce qui nous permet de bénéficier d'un bénéfice de 75 % par rapport à la solution précédente. Pour une charge de travail typique pendant la journée, nous utilisons un seul point de terminaison avec une seule machine de g5.xlarge avec une utilisation GPU de plus de 80 %. À titre de comparaison, la solution précédente avait un taux d'utilisation inférieur à 40 %.
Agilité et productivité accrues – L'utilisation de SageMaker nous a permis de passer moins de temps à migrer des modèles et plus de temps à améliorer nos algorithmes et modèles de base. Cela a augmenté la productivité de nos équipes d’ingénierie et de science des données. Nous pouvons désormais rechercher et déployer un nouveau modèle ML en moins de 7 jours, au lieu de plus d'un mois auparavant. Il s'agit d'une amélioration de 1 % en termes de vitesse et de planification.
Meilleure qualité et confiance – Grâce aux capacités de test A/B de SageMaker, nous pouvons déployer nos modèles de manière progressive et pouvoir revenir en arrière en toute sécurité. Le cycle de vie plus rapide jusqu'à la production a également augmenté la précision et les résultats de nos modèles ML.

La figure suivante montre notre utilisation du GPU avec l'architecture précédente (30-40 % d'utilisation du GPU).

Utilisation du GPU avec l'architecture précédente

La figure suivante montre notre utilisation du GPU avec la nouvelle architecture simplifiée (utilisation du GPU à 90 %).

Utilisation du GPU avec la nouvelle architecture simplifiée

Conclusion

Dans cet article, nous avons expliqué comment Nielsen Sports a modernisé un système exécutant des milliers de modèles différents en production en utilisant les MME SageMaker et a réduit leurs coûts opérationnels et financiers de 75 %.

Pour en savoir plus, reportez-vous à ce qui suit :

À propos des auteurs

Eitan Sela est un architecte de solutions spécialisé en IA générative et en apprentissage automatique chez Amazon Web Services. Il travaille avec les clients AWS pour leur fournir des conseils et une assistance technique, les aidant à créer et à exploiter des solutions d'IA générative et d'apprentissage automatique sur AWS. Dans ses temps libres, Eitan aime faire du jogging et lire les derniers articles sur l'apprentissage automatique.

Gal Goldman est un ingénieur logiciel senior et un architecte de solutions senior d'entreprise chez AWS avec une passion pour les solutions de pointe. Il se spécialise et a développé de nombreux services et solutions distribués de Machine Learning. Gal s'efforce également d'aider les clients AWS à accélérer et à surmonter leurs défis d'ingénierie et d'IA générative.

Tal Panchek est responsable principal du développement commercial pour l'intelligence artificielle et l'apprentissage automatique chez Amazon Web Services. En tant que spécialiste BD, il est responsable de l'adoption, de l'utilisation et des revenus croissants des services AWS. Il rassemble les besoins des clients et du secteur et s'associe aux équipes de produits AWS pour innover, développer et fournir des solutions AWS.

Tamir Rubinsky dirige l'ingénierie R&D mondiale chez Nielsen Sports, apportant une vaste expérience dans la création de produits innovants et la gestion d'équipes hautement performantes. Son travail a transformé l’évaluation des médias de parrainage sportif grâce à des solutions innovantes basées sur l’IA.

Aviad Aranias est chef d'équipe MLOps et architecte d'analyse sportive Nielsen, spécialisé dans la création de pipelines complexes pour l'analyse de vidéos d'événements sportifs sur de nombreux canaux. Il excelle dans la création et le déploiement de modèles d'apprentissage profond pour gérer efficacement des données à grande échelle. Dans ses temps libres, il aime préparer de délicieuses pizzas napolitaines.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
PlatonESG. Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
La source: https://aws.amazon.com/blogs/machine-learning/nielsen-sports-sees-75-cost-reduction-in-video-analysis-with-amazon-sagemaker-multi-model-endpoints/

Horodatage: 4 avril 2024

Horodatage: 25 avril 2024

Republié par Platon

Expériences Amazon SageMaker de nouvelle génération – Organisez, suivez et comparez vos formations de machine learning à grande échelle

Créez de puissantes expériences en libre-service avec Amazon Lex sur le centre de contact Talkdesk CX Cloud

Traduire des documents en temps réel avec Amazon Translate | Services Web Amazon

Résolvez efficacement les problèmes de convergence de la formation distribuée avec Amazon SageMaker Hyperband Automatic Model Tuning | Services Web Amazon

Créez un pipeline d'inférence d'IA en imagerie médicale avec MONAI Deploy sur AWS | Services Web Amazon

Annonce de la mise à jour du connecteur Microsoft OneDrive (V2) pour Amazon Kendra

Créez des applications conversationnelles basées sur la connaissance à l'aide de LlamaIndex et Llama 2-Chat | Services Web Amazon

Déployer un modèle de diarisation des locuteurs Hugging Face (PyAnnote) sur Amazon SageMaker en tant que point de terminaison asynchrone | Services Web Amazon

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte