Nielsen Sports verzeichnet mit Amazon SageMaker Multi-Model Endpoints eine Kostenreduzierung von 75 % bei der Videoanalyse

Neuauflage von Plato

Verfolger: 0

Dies ist ein Gastbeitrag, der gemeinsam mit Tamir Rubinsky und Aviad Aranias von Nielsen Sports verfasst wurde.

Nielsen Sport prägt die Medien und Inhalte der Welt als weltweit führender Anbieter von Zielgruppeneinblicken, Daten und Analysen. Durch unser Verständnis der Menschen und ihres Verhaltens auf allen Kanälen und Plattformen versorgen wir unsere Kunden mit unabhängigen und umsetzbaren Informationen, damit sie mit ihren Zielgruppen in Kontakt treten und interagieren können – jetzt und in der Zukunft.

Unsere Mission bei Nielsen Sports besteht darin, unseren Kunden – Marken und Rechteinhabern – die Möglichkeit zu bieten, den Return on Investment (ROI) und die Wirksamkeit einer Sport-Sponsoring-Werbekampagne über alle Kanäle, einschließlich TV, Online, soziale Medien usw., zu messen sogar Zeitungen, und um eine genaue Ausrichtung auf lokaler, nationaler und internationaler Ebene zu ermöglichen.

In diesem Beitrag beschreiben wir, wie Nielsen Sports ein System modernisierte, auf dem Tausende verschiedener Modelle für maschinelles Lernen (ML) in der Produktion ausgeführt werden Amazon Sage Maker Multi-Modell-Endpunkte (MMEs) und reduzierte Betriebs- und Finanzkosten um 75 %.

Herausforderungen bei der Kanalvideosegmentierung

Unsere Technologie basiert auf künstlicher Intelligenz (KI) und insbesondere Computer Vision (CV), die es uns ermöglicht, die Markenpräsenz zu verfolgen und ihren Standort genau zu identifizieren. Wir erkennen beispielsweise, ob sich die Marke auf einem Banner oder einem T-Shirt befindet. Darüber hinaus identifizieren wir die Position der Marke auf dem Artikel, beispielsweise in der oberen Ecke eines Schildes oder auf der Hülle. Die folgende Abbildung zeigt ein Beispiel unseres Tagging-Systems.

Beispiel eines Nielsen-Tagging-Systems

Um unsere Skalierungs- und Kostenherausforderungen zu verstehen, schauen wir uns einige repräsentative Zahlen an. Jeden Monat ermitteln wir über 120 Millionen Markenimpressionen über verschiedene Kanäle hinweg, und das System muss die Identifizierung von über 100,000 Marken und Variationen verschiedener Marken unterstützen. Wir haben mit über 6 Milliarden Datenpunkten eine der größten Datenbanken für Markeneindrücke weltweit aufgebaut.

Unser Medienbewertungsprozess umfasst mehrere Schritte, wie in der folgenden Abbildung dargestellt:

Zunächst zeichnen wir mithilfe eines internationalen Aufzeichnungssystems Tausende von Kanälen auf der ganzen Welt auf.
Wir streamen die Inhalte in Kombination mit dem Sendeplan (Electronic Programming Guide) in die nächste Phase, nämlich die Segmentierung und Trennung zwischen den Spielübertragungen selbst und anderen Inhalten oder Werbung.
Wir führen eine Medienüberwachung durch, bei der wir jedem Segment zusätzliche Metadaten hinzufügen, wie z. B. Ligaergebnisse, relevante Teams und Spieler.
Wir führen eine Expositionsanalyse der Sichtbarkeit der Marken durch und kombinieren dann die Zielgruppeninformationen, um die Bewertung der Kampagne zu berechnen.
Die Informationen werden dem Kunden über ein Dashboard oder Analystenberichte bereitgestellt. Der Analyst erhält direkten Zugriff auf die Rohdaten oder über unser Data Warehouse.

Schritte zur Medienbewertung

Da wir in einer Größenordnung von über tausend Kanälen und Zehntausenden Stunden Video pro Jahr tätig sind, benötigen wir ein skalierbares Automatisierungssystem für den Analyseprozess. Unsere Lösung segmentiert die Übertragung automatisch und versteht es, die relevanten Videoclips vom Rest des Inhalts zu isolieren.

Dies erreichen wir mithilfe spezieller, von uns entwickelter Algorithmen und Modelle zur Analyse der spezifischen Eigenschaften der Kanäle.

Insgesamt betreiben wir Tausende verschiedener Modelle in der Produktion, um diese Mission zu unterstützen, die kostspielig ist, einen betrieblichen Mehraufwand verursacht sowie fehleranfällig und langsam ist. Es dauerte Monate, bis Modelle mit neuer Modellarchitektur in Produktion gingen.

Hier wollten wir unser System erneuern und neu gestalten.

Kostengünstige Skalierung für CV-Modelle mit SageMaker MMEs

Unser altes Videosegmentierungssystem war schwierig zu testen, zu ändern und zu warten. Zu den Herausforderungen gehören die Arbeit mit einem alten ML-Framework, gegenseitige Abhängigkeiten zwischen Komponenten und ein schwer zu optimierender Workflow. Dies liegt daran, dass wir für die Pipeline auf RabbitMQ basierten, was eine zustandsbehaftete Lösung war. Um eine Komponente zu debuggen, beispielsweise die Feature-Extraktion, mussten wir die gesamte Pipeline testen.

Das folgende Diagramm veranschaulicht die bisherige Architektur.

bisherige Architektur

Im Rahmen unserer Analyse haben wir Leistungsengpässe identifiziert, beispielsweise die Ausführung eines einzelnen Modells auf einer Maschine, die eine geringe GPU-Auslastung von 30–40 % aufwies. Wir haben auch ineffiziente Pipeline-Läufe und Planungsalgorithmen für die Modelle entdeckt.

Aus diesem Grund haben wir uns entschieden, eine neue mandantenfähige Architektur auf Basis von SageMaker zu erstellen, die Leistungsoptimierungsverbesserungen implementiert, dynamische Stapelgrößen unterstützt und mehrere Modelle gleichzeitig ausführt.

Jede Ausführung des Workflows zielt auf eine Gruppe von Videos ab. Jedes Video ist zwischen 30 und 90 Minuten lang und jede Gruppe muss mehr als fünf Modelle vorführen.

Sehen wir uns ein Beispiel an: Ein Video kann 60 Minuten lang sein und aus 3,600 Bildern bestehen, und jedes Bild muss in der ersten Phase von drei verschiedenen ML-Modellen abgeleitet werden. Mit SageMaker-MMEs können wir Stapel von 12 Bildern parallel ausführen, und der vollständige Stapel ist in weniger als 2 Sekunden abgeschlossen. An einem normalen Tag haben wir mehr als 20 Videogruppen und an einem vollen Wochenendtag können wir mehr als 100 Videogruppen haben.

Das folgende Diagramm zeigt unsere neue, vereinfachte Architektur mithilfe einer SageMaker MME.

vereinfachte Architektur mit einem SageMaker MME

Die Ergebnisse

Mit der neuen Architektur haben wir viele unserer gewünschten Ergebnisse und einige unsichtbare Vorteile gegenüber der alten Architektur erreicht:

Bessere Laufzeit – Durch die Erhöhung der Batch-Größen (12 Videos parallel) und die gleichzeitige Ausführung mehrerer Modelle (fünf Modelle parallel) haben wir die Gesamtlaufzeit unserer Pipeline um 33 % von 1 Stunde auf 40 Minuten verkürzt.
Verbesserte Infrastruktur – Mit SageMaker haben wir unsere bestehende Infrastruktur aktualisiert und verwenden jetzt neuere AWS-Instanzen mit neueren GPUs wie g5.xlarge. Einer der größten Vorteile der Änderung ist die sofortige Leistungsverbesserung durch die Verwendung von TorchScript- und CUDA-Optimierungen.
Optimierte Infrastrukturnutzung – Indem wir über einen einzigen Endpunkt verfügen, der mehrere Modelle hosten kann, können wir sowohl die Anzahl der Endpunkte als auch die Anzahl der zu wartenden Maschinen reduzieren und außerdem die Auslastung einer einzelnen Maschine und ihrer GPU erhöhen. Für eine bestimmte Aufgabe mit fünf Videos verwenden wir jetzt nur noch fünf Maschinen mit g5-Instanzen, was uns einen Kostenvorteil von 75 % gegenüber der vorherigen Lösung verschafft. Für eine typische Arbeitslast während des Tages verwenden wir einen einzelnen Endpunkt mit einer einzelnen Maschine von g5.xlarge mit einer GPU-Auslastung von mehr als 80 %. Zum Vergleich: Die vorherige Lösung hatte eine Auslastung von weniger als 40 %.
Erhöhte Agilität und Produktivität – Durch die Verwendung von SageMaker konnten wir weniger Zeit mit der Migration von Modellen verbringen und konnten uns mehr auf die Verbesserung unserer Kernalgorithmen und -modelle konzentrieren. Dies hat die Produktivität unserer Engineering- und Data-Science-Teams gesteigert. Wir können jetzt ein neues ML-Modell in weniger als 7 Tagen erforschen und bereitstellen, statt wie zuvor in über einem Monat. Dies ist eine 1-prozentige Verbesserung der Geschwindigkeit und Planung.
Mehr Qualität und Vertrauen – Mit den A/B-Testfunktionen von SageMaker können wir unsere Modelle schrittweise bereitstellen und ein sicheres Rollback durchführen. Der schnellere Lebenszyklus bis zur Produktion steigerte auch die Genauigkeit und Ergebnisse unserer ML-Modelle.

Die folgende Abbildung zeigt unsere GPU-Auslastung mit der vorherigen Architektur (30-40 % GPU-Auslastung).

GPU-Auslastung mit der vorherigen Architektur

Die folgende Abbildung zeigt unsere GPU-Auslastung mit der neuen vereinfachten Architektur (90 % GPU-Auslastung).

GPU-Auslastung mit der neuen vereinfachten Architektur

Zusammenfassung

In diesem Beitrag haben wir erzählt, wie Nielsen Sports mithilfe von SageMaker-MMEs ein System modernisiert hat, auf dem Tausende verschiedener Modelle in der Produktion laufen, und wie die Betriebs- und Finanzkosten um 75 % gesenkt wurden.

Zum Weiterlesen sei auf Folgendes verwiesen:

Über die Autoren

Eitan Sela ist ein spezialisierter Lösungsarchitekt für generative KI und maschinelles Lernen bei Amazon Web Services. Er arbeitet mit AWS-Kunden zusammen, um ihnen Beratung und technische Unterstützung zu bieten und sie beim Aufbau und Betrieb von Lösungen für generative KI und maschinelles Lernen auf AWS zu unterstützen. In seiner Freizeit joggt Eitan gerne und liest die neuesten Artikel zum maschinellen Lernen.

Gal Goldman ist Senior Software Engineer und Enterprise Senior Solution Architect bei AWS mit einer Leidenschaft für innovative Lösungen. Er ist auf zahlreiche verteilte Dienste und Lösungen für maschinelles Lernen spezialisiert und hat diese entwickelt. Gal konzentriert sich auch darauf, AWS-Kunden dabei zu helfen, ihre technischen und generativen KI-Herausforderungen zu beschleunigen und zu meistern.

Tal Panchek ist Senior Business Development Manager für künstliche Intelligenz und maschinelles Lernen bei Amazon Web Services. Als BD-Spezialist ist er für die wachsende Akzeptanz, Nutzung und den Umsatz von AWS-Services verantwortlich. Er erfasst Kunden- und Branchenbedürfnisse und arbeitet mit AWS-Produktteams zusammen, um AWS-Lösungen zu innovieren, zu entwickeln und bereitzustellen.

Tamir Rubinsky leitet Global R&D Engineering bei Nielsen Sports und bringt umfangreiche Erfahrung in der Entwicklung innovativer Produkte und der Leitung leistungsstarker Teams mit. Seine Arbeit veränderte die Medienbewertung im Sportsponsoring durch innovative, KI-gestützte Lösungen.

Aviad Aranias ist ein MLOps-Teamleiter und Nielsen Sports Analysis Architect, der sich auf die Erstellung komplexer Pipelines für die Analyse von Sportereignisvideos über zahlreiche Kanäle hinweg spezialisiert hat. Er zeichnet sich durch die Entwicklung und Bereitstellung von Deep-Learning-Modellen aus, um große Datenmengen effizient zu verarbeiten. In seiner Freizeit backt er gerne köstliche neapolitanische Pizzen.

SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
PlatoData.Network Vertikale generative KI. Motiviere dich selbst. Hier zugreifen.
PlatoAiStream. Web3-Intelligenz. Wissen verstärkt. Hier zugreifen.
PlatoESG. Kohlenstoff, CleanTech, Energie, Umwelt, Solar, Abfallwirtschaft. Hier zugreifen.
PlatoHealth. Informationen zu Biotechnologie und klinischen Studien. Hier zugreifen.
Quelle: https://aws.amazon.com/blogs/machine-learning/nielsen-sports-sees-75-cost-reduction-in-video-analysis-with-amazon-sagemaker-multi-model-endpoints/

Zeitstempel: 4. April 2024

Zeitstempel: 6. September 2023

Neuauflage von Plato

Verteiltes Training mit Amazon EKS und Torch Distributed Elastic

Generieren Sie mit Amazon Bedrock | individuelle, konforme IaC-Anwendungsskripte für AWS Landing Zone Amazon Web Services

Erstellen, trainieren und implementieren Sie mit TensorFlow und Amazon SageMaker ein Sprachmodell mit Milliarden Parametern auf Terabytes von Daten

Erstellen Sie mit Amazon Textract eine nachvollziehbare, benutzerdefinierte Pipeline zur Analyse von Dokumenten in mehreren Formaten

Ankündigung der Einführung der Modellkopierfunktion für Amazon Rekognition Custom Labels

Wie man die Qualität der synthetischen Daten bewertet – gemessen aus der Perspektive von Treue, Nützlichkeit und Datenschutz

Über uns

Vertikale Suche & Ai

Plattform

Bleiben Sie in Verbindung

Konto