Przewiduj odejście klientów dzięki uczeniu maszynowemu bez kodu, korzystając z Amazon SageMaker Canvas

Opublikowane ponownie przez Plato

Obserwuje: 0

Zrozumienie zachowań klientów jest dziś najważniejsze w każdej firmie. Uzyskanie wglądu w to, dlaczego i jak klienci kupują, może pomóc w zwiększeniu przychodów. Jednak utrata klientów (nazywana również odchodzeniem klientów) zawsze stanowi ryzyko, a wgląd w to, dlaczego klienci odchodzą, może być równie ważny dla utrzymania przychodów i zysków. Uczenie maszynowe (ML) może pomóc w uzyskiwaniu wglądu, ale do tej pory potrzebni byli eksperci ML do tworzenia modeli do przewidywania rezygnacji, których brak może opóźnić działania oparte na wglądach firm w celu utrzymania klientów.

W tym poście pokazujemy, jak analitycy biznesowi mogą zbudować model churn ML z Płótno Amazon SageMaker, kod nie jest wymagany. Canvas zapewnia analitykom biznesowym wizualny interfejs typu „wskaż i kliknij”, który umożliwia samodzielne budowanie modeli i generowanie dokładnych prognoz ML — bez konieczności korzystania z ML ani konieczności pisania pojedynczej linii kodu.

Przegląd rozwiązania

W tym poście wcielamy się w analityka marketingowego w dziale marketingu operatora telefonii komórkowej. Otrzymaliśmy zadanie zidentyfikowania klientów, którzy są potencjalnie zagrożeni odejściem. Mamy dostęp do danych o korzystaniu z usług i innych danych o zachowaniach klientów i chcemy wiedzieć, czy te dane mogą pomóc wyjaśnić, dlaczego klient odszedł. Jeśli uda nam się zidentyfikować czynniki, które wyjaśniają churn, możemy podjąć działania naprawcze, aby zmienić przewidywane zachowanie, takie jak prowadzenie kampanii ukierunkowanych na utrzymanie.

W tym celu wykorzystujemy dane, które posiadamy w pliku CSV, który zawiera informacje o wykorzystaniu i rezygnacji klientów. Używamy Canvas do wykonania następujących kroków:

Importuj zbiór danych rezygnacji z Usługa Amazon Simple Storage (Amazonka S3).
Trenuj i buduj model rezygnacji.
Przeanalizuj wyniki modelu.
Przetestuj prognozy względem modelu.

W naszym zbiorze danych używamy a syntetyczny zbiór danych od telekomunikacyjnego operatora telefonii komórkowej. Ten przykładowy zestaw danych zawiera 5,000 rekordów, z których każdy wykorzystuje 21 atrybutów do opisania profilu klienta. Atrybuty są następujące:

Stan – stan USA, w którym zamieszkuje klient, wskazany dwuliterowym skrótem; na przykład OH lub NJ
Długość konta – Liczba dni, przez które to konto było aktywne
Numer kierunkowy – Trzycyfrowy numer kierunkowy numeru telefonu klienta
Telefon – Pozostały siedmiocyfrowy numer telefonu
Plan międzynarodowy – Czy klient ma plan taryfowy międzynarodowy (tak/nie)
Plan VMmail – Czy klient posiada funkcję poczty głosowej (tak/nie)
Wiadomość VMmail – Średnia liczba wiadomości głosowych na miesiąc
Minuty dnia – Całkowita liczba minut rozmów wykorzystanych w ciągu dnia
Połączenia dzienne – Całkowita liczba połączeń wykonanych w ciągu dnia
Opłata dzienna – Rozliczany koszt połączeń w ciągu dnia
Ewa Mins, Ewa wzywa, Ewa Szarża – Rozliczony koszt za rozmowy wieczorne
Minuty nocne, Rozmowy w nocy, Nocna opłata – Rozliczany koszt połączeń nocnych
Min. zewn, Połączenia międzynarodowe, Opłata międzynarodowa – Naliczany koszt połączeń międzynarodowych
Połączenia CustServ – Liczba połączeń do obsługi klienta
Maselnica? – Czy klient opuścił usługę (prawda/fałsz)

Ostatni atrybut, Churn?, to atrybut, który ma przewidywać model ML. Atrybut target jest binarny, co oznacza, że nasz model przewiduje dane wyjściowe jako jedną z dwóch kategorii (True or False).

Wymagania wstępne

Administrator chmury z Konto AWS z odpowiednimi uprawnieniami jest wymagane do spełnienia następujących warunków wstępnych:

Wdróż plik Amazon Sage Maker Aby uzyskać instrukcje, zobacz Na pokładzie do domeny Amazon SageMaker.
Wdróż kanwę. Aby uzyskać instrukcje, zobacz Konfigurowanie i zarządzanie Amazon SageMaker Canvas (dla administratorów IT).
Skonfiguruj zasady udostępniania zasobów między źródłami (CORS) dla kanwy. Aby uzyskać instrukcje, zobacz Daj swoim użytkownikom możliwość przesyłania plików lokalnych.

Utwórz model odpływu klientów

Najpierw pobierzmy zbiór danych rezygnacji i przejrzyj plik, aby upewnić się, że są tam wszystkie dane. Następnie wykonaj następujące czynności:

Zaloguj się do Konsola zarządzania AWS, używając konta z odpowiednimi uprawnieniami dostępu do kanwy.
Zaloguj się do konsoli Canvas.

To tutaj możemy zarządzać naszymi zbiorami danych i tworzyć modele.

Dodaj import.

Wybierz przycisk importu płótna

Dodaj Prześlij I wybierz opcję churn.csv plik.
Dodaj Importuj daty aby przesłać go do Canvas.

Płótno wybierz dane z s3

Proces importowania trwa około 10 sekund (może się to różnić w zależności od rozmiaru zestawu danych). Po zakończeniu widzimy, że zbiór danych jest w Ready stan.

Zbiór danych gotowy na płótno

Aby wyświetlić podgląd pierwszych 100 wierszy zestawu danych, najedź myszą na ikonę oka.

Zbiór danych widoku kanwy

Pojawi się podgląd zbioru danych. Tutaj możemy zweryfikować poprawność naszych danych.

Płótno Sprawdź dane

Po potwierdzeniu, że zaimportowany zestaw danych jest gotowy, tworzymy nasz model.

Dodaj Nowy model.

Nowe modele na płótnie

Wybierz zbiór danych churn.csv i wybierz Wybierz zbiór danych.

Płótno Wybierz zbiór danych

Teraz konfigurujemy proces budowania modelu.

W razie zamówieenia projektu Kolumny docelowe, Wybierz Churn? Kolumna.

W razie zamówieenia projektu Typ modelu, Canvas automatycznie zaleca typ modelu, w tym przypadku 2 prognozy kategorii (co specjalista od danych nazwałby klasyfikacją binarną). Jest to odpowiednie dla naszego przypadku użycia, ponieważ mamy tylko dwie możliwe wartości przewidywania: True or False, więc idziemy z rekomendacją Canvas made.

Model na płótnie

Teraz potwierdzamy niektóre założenia. Chcemy uzyskać szybki wgląd w to, czy nasza kolumna docelowa może być przewidziana przez inne kolumny. Możemy uzyskać szybki wgląd w szacowaną dokładność modelu i wpływ kolumny (szacowane znaczenie każdej kolumny w przewidywaniu kolumny docelowej).

Wybierz wszystkie 21 kolumn i wybierz Podgląd modelu.

Ta funkcja wykorzystuje podzbiór naszego zbioru danych i tylko jedno przejście podczas modelowania. W naszym przypadku użycia model podglądu zajmuje około 2 minut.

Model podglądu płótna

Jak pokazano na poniższym zrzucie ekranu, Phone i State kolumny mają znacznie mniejszy wpływ na naszą prognozę. Chcemy być ostrożni podczas usuwania tekstu wejściowego, ponieważ może on zawierać ważne, dyskretne, kategoryczne cechy przyczyniające się do naszego przewidywania. W tym przypadku numer telefonu jest po prostu odpowiednikiem numeru konta — nie ma wartości w przewidywaniu prawdopodobieństwa rezygnacji z innych kont, a stan klienta nie ma dużego wpływu na nasz model.

Usuwamy te kolumny, ponieważ nie mają większego znaczenia dla funkcji.
Po usunięciu Phone i State kolumn, uruchommy ponownie podgląd.

Jak pokazano na poniższym zrzucie ekranu, dokładność modelu wzrosła o 0.1%. Nasz model podglądu ma szacowaną dokładność 95.9%, a kolumny o największym wpływie to Night Calls, Eve Mins, Night Charge. Daje nam to wgląd w to, jakie kolumny mają największy wpływ na wydajność naszego modelu. Tutaj musimy być ostrożni przy wyborze cech, ponieważ jeśli pojedyncza cecha ma ogromny wpływ na wynik modelu, jest to główny wskaźnik docelowy wyciek, a funkcja nie będzie dostępna w czasie prognozy. W tym przypadku kilka kolumn wykazało bardzo podobny wpływ, więc kontynuujemy budowanie naszego modelu.

Inżynieria funkcji płótna po

Canvas oferuje dwie opcje budowania:

Wersja standardowa – Buduje najlepszy model ze zoptymalizowanego procesu wspieranego przez AutoML; prędkość jest wymieniana na największą dokładność
Szybka budowa – Buduje model w ułamku czasu w porównaniu do standardowej budowy; potencjalna dokładność jest wymieniana na prędkość.

W tym poście wybieramy Wersja standardowa opcja, ponieważ chcemy mieć najlepszy model i jesteśmy gotowi poświęcić dodatkowy czas na oczekiwanie na wynik.

Płótno Standardowe Build

Proces kompilacji może zająć 2–4 godziny. W tym czasie Canvas testuje setki potoków kandydatów, wybierając najlepszy model do zaprezentowania. Na poniższym zrzucie ekranu możemy zobaczyć oczekiwany czas i postęp budowy.

Model analizy płótna

Oceń wydajność modelu

Po zakończeniu procesu budowania modelu przewidywane przez model odejścia w 97.9% przypadków. Wydaje się to w porządku, ale jako analitycy chcemy zanurkować głębiej i sprawdzić, czy możemy zaufać modelowi w podejmowaniu na jego podstawie decyzji. Na Punktacja , możemy przejrzeć graficzną wykres naszych prognoz zmapowanych na ich wyniki. Pozwala nam to na głębszy wgląd w nasz model.

Canvas dzieli zbiór danych na zbiory szkoleniowe i testowe. Treningowy zestaw danych to dane używane przez kanwę do budowania modelu. Zestaw testowy służy do sprawdzenia, czy model działa dobrze z nowymi danymi. Diagram Sankeya na poniższym zrzucie ekranu pokazuje, jak model działał na zbiorze testowym. Aby dowiedzieć się więcej, zapoznaj się z Ocena wydajności Twojego modelu w Amazon SageMaker Canvas.

Aby uzyskać bardziej szczegółowe informacje wykraczające poza to, co jest wyświetlane na diagramie Sankeya, analitycy biznesowi mogą użyć matryca zamieszania analizy pod kątem ich rozwiązań biznesowych. Na przykład chcemy lepiej zrozumieć prawdopodobieństwo, że model dokona fałszywych prognoz. Widzimy to na diagramie Sankeya, ale chcemy uzyskać więcej informacji, więc wybieramy Zaawansowane metryki. Otrzymaliśmy macierz pomyłek, która wyświetla wydajność modelu w formacie wizualnym z następującymi wartościami, charakterystycznymi dla klasy pozytywnej — mierzymy na podstawie tego, czy rzeczywiście będą się one odchodziły, więc nasza klasa pozytywna to True w tym przykładzie:

Prawdziwie pozytywne (TP) - Liczba True wyniki, które zostały prawidłowo przewidziane jako True
Prawdziwie negatywna (TN) - Liczba False wyniki, które zostały prawidłowo przewidziane jako False
Fałszywy wynik pozytywny (FP) - Liczba False wyniki, które zostały błędnie przewidziane jako True
Fałszywy negatywny (FN) - Liczba True wyniki, które zostały błędnie przewidziane jako False

Możemy użyć tego wykresu macierzowego, aby określić nie tylko, jak dokładny jest nasz model, ale także kiedy jest niepoprawny, jak często może to być i jak jest niepoprawny.

Płótno Matryca F1

Zaawansowane metryki wyglądają dobrze. Możemy zaufać wynikowi modelu. Widzimy bardzo niskie wyniki fałszywie dodatnie i fałszywie ujemne. Dzieje się tak, jeśli model uważa, że klient w zbiorze danych odejdzie, a tak naprawdę nie (fałszywie dodatnie) lub jeśli model uważa, że klient odejdzie, a faktycznie tak (fałszywie ujemny). Wysokie liczby dla obu z nich mogą skłonić nas do zastanowienia się, jeśli możemy użyć modelu do podejmowania decyzji.

Wróćmy do Przegląd , aby przejrzeć wpływ każdej kolumny. Te informacje mogą pomóc zespołowi marketingowemu uzyskać wgląd, który prowadzi do podjęcia działań w celu zmniejszenia rotacji klientów. Na przykład widzimy, że zarówno niski, jak i wysoki CustServ Calls zwiększyć prawdopodobieństwo rezygnacji. Zespół marketingowy może podjąć działania, aby zapobiec odejściu klientów na podstawie tych informacji. Przykłady obejmują tworzenie szczegółowych często zadawanych pytań na stronach internetowych w celu zmniejszenia liczby telefonów do obsługi klienta oraz prowadzenie kampanii edukacyjnych z klientami na temat najczęściej zadawanych pytań, które mogą podtrzymać zaangażowanie.

Nasz model wygląda całkiem dokładnie. Możemy bezpośrednio przeprowadzić interaktywną prognozę na Przewiduj zakładka, w prognozie zbiorczej lub pojedynczej (w czasie rzeczywistym). W tym przykładzie wprowadziliśmy kilka zmian w niektórych wartościach kolumn i przeprowadziliśmy prognozę w czasie rzeczywistym. Canvas pokazuje nam wynik prognozy wraz z poziomem ufności.

Wnioskowanie przewidywania kanwy

Załóżmy, że mamy istniejącego klienta, który ma następujące zastosowanie: Night Mins to 40 i Eve Mins wynosi 40. Możemy przeprowadzić prognozę, a nasz model zwraca wynik ufności 93.2%, że ten klient odejdzie (True). Możemy teraz zaoferować zniżki promocyjne, aby zatrzymać tego klienta.

Uruchamianie jednej prognozy jest świetne do indywidualnej analizy warunkowej, ale musimy również przeprowadzać prognozy na wielu rekordach jednocześnie. Płótno jest w stanie uruchom prognozy wsadowe, który umożliwia przeprowadzanie prognoz na dużą skalę.

Wnioski

W tym poście pokazaliśmy, jak analityk biznesowy może stworzyć model churnu klientów za pomocą SageMaker Canvas, korzystając z przykładowych danych. Canvas umożliwia analitykom biznesowym tworzenie dokładnych modeli uczenia maszynowego i generowanie prognoz za pomocą interfejsu wizualnego typu „wskaż i kliknij” bez kodu. Analityk marketingowy może teraz wykorzystać te informacje do prowadzenia ukierunkowanych kampanii utrzymania i szybszego testowania nowych strategii kampanii, co prowadzi do zmniejszenia rotacji klientów.

Analitycy mogą przenieść to na wyższy poziom, udostępniając swoje modele współpracownikom zajmującym się danymi. Analitycy danych mogą wyświetlić model Canvas w Studio Amazon SageMaker, gdzie mogą zapoznać się z wyborami dokonanymi przez Canvas AutoML, weryfikować wyniki modelu, a nawet za pomocą kilku kliknięć przeprowadzić produkcję modelu. Może to przyspieszyć tworzenie wartości w oparciu o ML i pomóc w szybszym skalowaniu lepszych wyników.

Aby dowiedzieć się więcej o korzystaniu z Canvas, zobacz Buduj, udostępniaj, wdrażaj: jak analitycy biznesowi i analitycy danych osiągają szybszy czas wprowadzania produktów na rynek, korzystając z bezkodowej ML i Amazon SageMaker Canvas. Aby uzyskać więcej informacji na temat tworzenia modeli ML za pomocą rozwiązania bez kodu, zobacz Przedstawiamy Amazon SageMaker Canvas — wizualną możliwość uczenia maszynowego bez kodu dla analityków biznesowych.

O autorze

Henryk Robalino jest architektem rozwiązań w AWS z siedzibą w NJ. Pasjonuje się chmurą i uczeniem maszynowym oraz rolą, jaką mogą odegrać w społeczeństwie. Osiąga to, pracując z klientami, aby pomóc im osiągnąć cele biznesowe za pomocą AWS Cloud. Poza pracą możesz znaleźć Henry'ego podróżującego lub odkrywającego plener ze swoją futrzaną córką Arly.

Przewiduj odejścia klientów dzięki uczeniu maszynowemu bez kodu, korzystając z Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI. Chaorana Wanga jest architektem rozwiązań w AWS z siedzibą w Dallas w Teksasie. Pracuje w AWS od ukończenia University of Texas w Dallas w 2016 roku z tytułem magistra informatyki. Chaoran pomaga klientom tworzyć skalowalne, bezpieczne i ekonomiczne aplikacje oraz znajdować rozwiązania, które rozwiązują ich wyzwania biznesowe w chmurze AWS. Poza pracą Chaoran uwielbia spędzać czas z rodziną i dwoma psami, Biubiu i Coco.

Znak czasu: 5 maja 2022 r.

Znak czasu: Kwiecień 13, 2023

Opublikowane ponownie przez Plato

Podstawowa ochrona danych dla akceleracji LLM w przedsiębiorstwie dzięki Protopia AI | Usługi internetowe Amazona

Przekształcenie badań jakościowych poprzez automatyzację mowy w analizę zamiany tekstu na tekst

Jak Sophos szkoli potężny, lekki wykrywacz złośliwego oprogramowania PDF na ultra skalę za pomocą Amazon SageMaker

Zautomatyzuj klasyfikację zgłoszeń serwisowych za pomocą niestandardowego klasyfikatora Amazon Comprehend

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto