Wraz z wejściem w życie nowych przepisów dotyczących prywatności danych, takich jak RODO (ogólne rozporządzenie o ochronie danych, 2017), klienci są pod coraz większą presją, aby zarabiać na zasobach medialnych przy jednoczesnym przestrzeganiu nowych zasad. Zarabianie na mediach przy jednoczesnym poszanowaniu przepisów dotyczących prywatności wymaga możliwości automatycznego wyodrębniania szczegółowych metadanych z zasobów, takich jak tekst, obrazy, pliki wideo i audio na skalę internetową. Wymaga również skalowalnego sposobu mapowania zasobów medialnych do taksonomii branżowych, które ułatwiają odkrywanie i monetyzację treści. Ten przypadek użycia jest szczególnie istotny dla branży reklamowej, ponieważ zasady prywatności danych powodują odejście od targetowania behawioralnego z wykorzystaniem plików cookie stron trzecich.
Pliki cookie innych firm pomagają włączyć spersonalizowane reklamy dla użytkowników internetu i umożliwić reklamodawcom dotarcie do docelowych odbiorców. Tradycyjnym rozwiązaniem do wyświetlania reklam bez plików cookie stron trzecich jest reklama kontekstowa, która umieszcza reklamy na stronach internetowych na podstawie treści publikowanych na stronach. Jednak reklama kontekstowa stanowi wyzwanie polegające na wyodrębnieniu kontekstu z zasobów medialnych na dużą skalę, a także wykorzystaniu tego kontekstu do zarabiania na zasobach.
W tym poście omawiamy, w jaki sposób można zbudować rozwiązanie do uczenia maszynowego (ML), które nazywamy Contextual Intelligence Taxonomy Mapper (CITM), aby wyodrębnić kontekst z treści cyfrowych i zmapować go do standardowych taksonomii w celu wygenerowania wartości. Chociaż stosujemy to rozwiązanie do reklamy kontekstowej, możesz go używać do rozwiązywania innych przypadków użycia. Na przykład firmy zajmujące się technologiami edukacyjnymi mogą używać go do mapowania swoich treści do taksonomii branżowych w celu ułatwienia adaptacyjnego uczenia się, które zapewnia spersonalizowane doświadczenia edukacyjne oparte na indywidualnych potrzebach uczniów.
Omówienie rozwiązania
Rozwiązanie składa się z dwóch elementów: Analiza mediów AWS (AWS MI) możliwości ekstrakcji kontekstu z treści na stronach internetowych oraz CITM do inteligentnego mapowania treści do taksonomii branżowej. Możesz uzyskać dostęp do rozwiązania repozytorium kodu aby uzyskać szczegółowy obraz tego, jak wdrażamy jego komponenty.
Analiza mediów AWS
Możliwości AWS MI umożliwiają automatyczne wyodrębnianie metadanych, które zapewniają kontekstowe zrozumienie zawartości strony internetowej. Możesz łączyć techniki ML, takie jak widzenie komputerowe, mowa na tekst i przetwarzanie języka naturalnego (NLP), aby automatycznie generować metadane z tekstu, filmów, obrazów i plików audio do wykorzystania w dalszym przetwarzaniu. Zarządzane usługi AI, takie jak Amazon Rekognition, Amazon Transcribe, Amazon Comprehend, Ekstrakt z amazonki udostępnij te techniki ML za pomocą wywołań API. Eliminuje to narzuty potrzebne do trenowania i budowania modeli ML od podstaw. W tym poście zobaczysz, jak wykorzystanie Amazon Comprehend i Amazon Rekognition do analizy mediów umożliwia ekstrakcję metadanych na dużą skalę.
Maper taksonomii inteligencji kontekstowej
Po wyodrębnieniu metadanych z treści multimedialnych potrzebujesz sposobu na mapowanie tych metadanych do taksonomii branżowej, aby ułatwić kierowanie kontekstowe. Aby to zrobić, budujesz Contextual Intelligence Taxonomy Mapper (CITM), który jest zasilany przez transformator zdań BERT firmy Hugging Face.
Transformator zdań BERT umożliwia CITM kategoryzowanie treści internetowych za pomocą kontekstowo powiązanych słów kluczowych. Na przykład może kategoryzować artykuł internetowy na temat zdrowego stylu życia za pomocą słów kluczowych z taksonomii branżowej, takich jak „Zdrowe gotowanie i jedzenie”, „Bieganie i jogging” i nie tylko, na podstawie napisanego tekstu i obrazów użytych w artykule. CITM zapewnia również możliwość wyboru zmapowanych terminów taksonomii, które będą używane w procesie licytowania reklam na podstawie Twoich kryteriów.
Poniższy diagram ilustruje koncepcyjny widok architektury z CITM.
Taksonomia treści IAB (Interactive Advertising Bureau)
Do tego postu używamy Taksonomia treści IAB Tech Lab jako standardową taksonomię branżową dla przypadku użycia reklamy kontekstowej. Z założenia taksonomia IAB pomaga twórcom treści dokładniej opisywać ich treść i zapewnia wspólny język dla wszystkich stron w procesie reklamowania programatycznego. Użycie wspólnej terminologii ma kluczowe znaczenie, ponieważ wybór reklam dla odwiedzanej przez użytkownika strony musi nastąpić w ciągu milisekund. Taksonomia IAB służy jako ustandaryzowany sposób kategoryzowania treści z różnych źródeł, będąc jednocześnie protokołem branżowym używanym przez platformy do ustalania stawek w czasie rzeczywistym do wyboru reklam. Ma strukturę hierarchiczną, która zapewnia szczegółowość terminów taksonomicznych i rozszerzony kontekst dla reklamodawców.
Przepływ pracy rozwiązania
Poniższy schemat ilustruje przepływ pracy rozwiązania.
Kroki są następujące:
- Usługa Amazon Simple Storage (Amazon S3) przechowuje taksonomię treści IAB i wyodrębnioną treść internetową.
- Amazon Comprehend przeprowadza modelowanie tematyczne w celu wyodrębnienia wspólnych tematów ze zbioru artykułów.
- Uznanie Amazonii API etykiet obiektów wykrywa etykiety na obrazach.
- CITM mapuje zawartość do standardowej taksonomii.
- Opcjonalnie możesz przechowywać zawartość do mapowania taksonomii w magazynie metadanych.
W kolejnych sekcjach szczegółowo omówimy każdy krok.
Amazon S3 przechowuje taksonomię treści IAB i wyodrębnione treści internetowe
Przechowujemy wyodrębniony tekst i obrazy z kolekcji artykułów internetowych w wiadrze S3. Przechowujemy również taksonomię treści IAB. W pierwszym kroku łączymy różne poziomy taksonomii, aby utworzyć połączone terminy taksonomii. Takie podejście pomaga zachować hierarchiczną strukturę taksonomii, gdy transformator zdań BERT tworzy osadzania dla każdego słowa kluczowego. Zobacz następujący kod:
Poniższy diagram ilustruje taksonomię kontekstową IAB z połączonymi warstwami.
Amazon Comprehend przeprowadza modelowanie tematów, aby wyodrębnić wspólne tematy ze zbioru artykułów
Za pomocą interfejsu API modelowania tematów Amazon Comprehend analizujesz wszystkie teksty artykułów przy użyciu modelu Latent Dirichlet Allocation (LDA). Model analizuje każdy artykuł w korpusie i grupuje słowa kluczowe w ten sam temat na podstawie kontekstu i częstotliwości ich pojawiania się w całym zbiorze artykułów. Aby upewnić się, że model LDA wykrywa wysoce spójne tematy, przed wywołaniem API Amazon Comprehend wykonujesz etap wstępnego przetwarzania. Możesz użyć biblioteka gensim CoherenceModel do określenia optymalnej liczby tematów do wykrycia ze zbioru artykułów lub plików tekstowych. Zobacz następujący kod:
Po uzyskaniu optymalnej liczby tematów używasz tej wartości do zadania modelowania tematów Amazon Comprehend. Dostarczanie różnych wartości dla parametru NumberOfTopics w Amazon Comprehend StartTematyWykrywanie Operacja zadania powoduje zmiany w rozkładzie słów kluczowych umieszczonych w każdej grupie tematycznej. Zoptymalizowana wartość parametru NumberOfTopics reprezentuje liczbę tematów, które zapewniają najbardziej spójne grupowanie słów kluczowych o wyższym znaczeniu kontekstowym. Możesz przechowywać dane wyjściowe modelowania tematu z Amazon Comprehend w jego surowym formacie w Amazon S3.
Interfejs API etykiet obiektów Amazon Rekognition wykrywa etykiety na obrazach
Analizujesz każdy obraz wyodrębniony ze wszystkich stron internetowych za pomocą Działanie Amazon Rekognition DetectLabels. Dla każdego obrazu operacja zapewnia odpowiedź JSON ze wszystkimi etykietami wykrytymi w obrazie, w połączeniu z oceną ufności dla każdego z nich. W naszym przypadku użycia arbitralnie wybieramy wynik ufności wynoszący 60% lub wyższy jako próg dla etykiet obiektów do użycia w następnym kroku. Przechowujesz etykiety obiektów w ich surowym formacie w Amazon S3. Zobacz następujący kod:
CITM mapuje zawartość do standardowej taksonomii
CITM porównuje wyodrębnione metadane treści (tematy z tekstu i etykiety z obrazów) ze słowami kluczowymi w taksonomii IAB, a następnie mapuje metadane treści do słów kluczowych z taksonomii, które są ze sobą powiązane semantycznie. W tym celu CITM wykonuje następujące trzy kroki:
- Generuj osadzania neuronowe dla taksonomii treści, słów kluczowych tematów i etykiet obrazów za pomocą transformatora zdań BERT firmy Hugging Face. Dostęp do modelu transformatora zdań uzyskujemy z Amazon Sage Maker. W tym poście używamy parafraza-MiniLM-L6-v2 model, który odwzorowuje słowa kluczowe i etykiety na 384-wymiarową gęstą przestrzeń wektorową.
- Oblicz wynik podobieństwa cosinusów między słowami kluczowymi taksonomii a słowami kluczowymi tematycznymi, korzystając z ich osadzeń. Oblicza również podobieństwo cosinusowe między słowami kluczowymi taksonomii a etykietami obiektów obrazu. Używamy podobieństwa kosinusowego jako mechanizmu punktacji, aby znaleźć semantycznie podobne dopasowania między metadanymi treści a taksonomią. Zobacz następujący kod:
- Zidentyfikuj pary z wynikami podobieństwa, które przekraczają próg zdefiniowany przez użytkownika, i użyj ich do odwzorowania treści na powiązane semantycznie słowa kluczowe w taksonomii treści. W naszym teście wybieramy wszystkie słowa kluczowe z par, które mają cosinusowy wynik podobieństwa równy co najmniej 0.5. Zobacz następujący kod:
Częstym wyzwaniem podczas pracy z reprezentacją języka w skali internetowej (na przykład w tym przypadku użycia) jest to, że potrzebny jest model, który może pasować do większości treści — w tym przypadku słów w języku angielskim. Transformator BERT Hugging Face został wstępnie przeszkolony przy użyciu dużego zbioru postów z Wikipedii w języku angielskim, aby przedstawić semantyczne znaczenie słów w odniesieniu do siebie. Dostrajasz wstępnie wytrenowany model za pomocą określonego zestawu danych zawierającego słowa kluczowe tematyczne, etykiety obrazów i słowa kluczowe taksonomii. Kiedy umieścisz wszystkie osadzania w tej samej przestrzeni funkcji i zwizualizujesz je, zobaczysz, że BERT logicznie reprezentuje semantyczne podobieństwo między terminami.
Poniższy przykład wizualizuje słowa kluczowe taksonomii treści IAB dla klasy Automotive reprezentowane jako wektory przy użyciu BERT. BERT umieszcza słowa kluczowe Automotive z taksonomii blisko podobnych semantycznie terminów.
Wektory cech umożliwiają CITM porównywanie etykiet metadanych i słów kluczowych taksonomii w tej samej przestrzeni cech. W tej przestrzeni cech CITM oblicza podobieństwo cosinusów między każdym wektorem cech dla słów kluczowych taksonomii i każdym wektorem cech dla słów kluczowych tematu. W osobnym kroku CITM porównuje wektory cech taksonomii i wektory cech dla etykiet obrazów. Pary z wynikami cosinus najbliższymi 1 są identyfikowane jako semantycznie podobne. Zwróć uwagę, że połączenie może być albo słowem kluczowym tematu i słowem kluczowym taksonomii, albo etykietą obiektu i słowem kluczowym taksonomii.
Poniższy zrzut ekranu przedstawia przykładowe pary słów kluczowych tematów i słów kluczowych taksonomii przy użyciu podobieństwa cosinus obliczonego za pomocą osadzania BERT.
Aby odwzorować treść na słowa kluczowe taksonomii, CITM wybiera słowa kluczowe z par z wynikami cosinusowymi, które spełniają próg zdefiniowany przez użytkownika. Są to słowa kluczowe, które będą używane na platformach do ustalania stawek w czasie rzeczywistym do wybierania reklam do zasobów witryny. Rezultatem jest bogate mapowanie treści online do taksonomii.
Opcjonalnie przechowuj zawartość do mapowania taksonomii w magazynie metadanych
Gdy zidentyfikujesz kontekstowo podobne terminy taksonomiczne z CITM, potrzebujesz sposobu, aby interfejsy API o niskim opóźnieniu mogły uzyskać dostęp do tych informacji. W zautomatyzowanym licytowaniu reklam, krótki czas odpowiedzi i wysoka współbieżność odgrywają ważną rolę w zarabianiu na treści. Schemat magazynu danych musi być elastyczny, aby pomieścić dodatkowe metadane w razie potrzeby wzbogacenia zapytań ofertowych. Amazon DynamoDB może dopasować wzorce dostępu do danych i wymagania operacyjne dla takiej usługi.
Wnioski
W tym poście dowiedziałeś się, jak zbudować oparte na taksonomii rozwiązanie do kierowania kontekstowego przy użyciu narzędzia Contextual Intelligence Taxonomy Mapper (CITM). Dowiedziałeś się, jak używać Amazon Comprehend i Amazon Rekognition do wyodrębniania szczegółowych metadanych z zasobów multimedialnych. Następnie za pomocą CITM zmapowałeś zasoby do standardowej taksonomii branżowej, aby ułatwić zautomatyzowane określanie stawek dla reklam powiązanych kontekstowo. Możesz zastosować te ramy do innych przypadków użycia, które wymagają użycia standardowej taksonomii w celu zwiększenia wartości istniejących zasobów multimedialnych.
Aby poeksperymentować z CITM, możesz uzyskać dostęp do jego repozytorium kodu i użyj go z wybranym zestawem danych tekstowych i graficznych.
Zalecamy zapoznanie się z komponentami rozwiązania przedstawionymi w tym poście. Dowiedz się więcej o Analiza mediów AWS do wyodrębniania metadanych z treści multimedialnych. Dowiedz się również więcej o tym, jak używać Modele Hugging Face dla NLP przy użyciu Amazon SageMaker.
O autorach
aramidowy kehinde jest starszym architektem rozwiązań partnerskich w AWS w dziedzinie uczenia maszynowego i sztucznej inteligencji. Jej kariera obejmowała obszary Business Intelligence i Advanced Analytics w wielu branżach. Pracuje, aby umożliwić partnerom tworzenie rozwiązań z usługami AWS AI/ML, które zaspokajają potrzeby klientów w zakresie innowacji. Lubi też budować skrzyżowanie AI i kreatywnych aren oraz spędzać czas z rodziną.
Anuj Gupta jest głównym architektem rozwiązań współpracującym z firmami hiperrozwojowymi w ich natywnej podróży do chmury. Pasjonuje go wykorzystywanie technologii do rozwiązywania trudnych problemów i współpracował z klientami przy tworzeniu aplikacji o dużej dystrybucji i niskich opóźnieniach. Wnosi wkład w rozwiązania typu open source Serverless i Machine Learning. Poza pracą uwielbia podróżować z rodziną oraz pisać wiersze i blogi filozoficzne.
- AI
- ai sztuka
- generator sztuki ai
- masz robota
- Amazon Comprehend
- Amazon Rekognition
- Amazon Sage Maker
- sztuczna inteligencja
- certyfikacja sztucznej inteligencji
- sztuczna inteligencja w bankowości
- robot sztucznej inteligencji
- roboty sztucznej inteligencji
- oprogramowanie sztucznej inteligencji
- Uczenie maszynowe AWS
- blockchain
- konferencja blockchain ai
- pomysłowość
- sztuczna inteligencja konwersacyjna
- konferencja kryptograficzna
- Dall's
- głęboka nauka
- google to
- uczenie maszynowe
- Marketing i reklama
- plato
- Platon Ai
- Analiza danych Platona
- Gra Platona
- PlatoDane
- platogaming
- skala ai
- składnia
- Instrukcje techniczne
- myśl przywództwo
- zefirnet