Zrozumienie zachowań klientów jest dziś najważniejsze w każdej firmie. Uzyskanie wglądu w to, dlaczego i jak klienci kupują, może pomóc w zwiększeniu przychodów. Jednak utrata klientów (nazywana również odchodzeniem klientów) zawsze stanowi ryzyko, a wgląd w to, dlaczego klienci odchodzą, może być równie ważny dla utrzymania przychodów i zysków. Uczenie maszynowe (ML) może pomóc w uzyskiwaniu wglądu, ale do tej pory potrzebni byli eksperci ML do tworzenia modeli do przewidywania rezygnacji, których brak może opóźnić działania oparte na wglądach firm w celu utrzymania klientów.
W tym poście pokazujemy, jak analitycy biznesowi mogą zbudować model churn ML z Płótno Amazon SageMaker, kod nie jest wymagany. Canvas zapewnia analitykom biznesowym wizualny interfejs typu „wskaż i kliknij”, który umożliwia samodzielne budowanie modeli i generowanie dokładnych prognoz ML — bez konieczności korzystania z ML ani konieczności pisania pojedynczej linii kodu.
Przegląd rozwiązania
W tym poście wcielamy się w analityka marketingowego w dziale marketingu operatora telefonii komórkowej. Otrzymaliśmy zadanie zidentyfikowania klientów, którzy są potencjalnie zagrożeni odejściem. Mamy dostęp do danych o korzystaniu z usług i innych danych o zachowaniach klientów i chcemy wiedzieć, czy te dane mogą pomóc wyjaśnić, dlaczego klient odszedł. Jeśli uda nam się zidentyfikować czynniki, które wyjaśniają churn, możemy podjąć działania naprawcze, aby zmienić przewidywane zachowanie, takie jak prowadzenie kampanii ukierunkowanych na utrzymanie.
W tym celu wykorzystujemy dane, które posiadamy w pliku CSV, który zawiera informacje o wykorzystaniu i rezygnacji klientów. Używamy Canvas do wykonania następujących kroków:
- Importuj zbiór danych rezygnacji z Usługa Amazon Simple Storage (Amazonka S3).
- Trenuj i buduj model rezygnacji.
- Przeanalizuj wyniki modelu.
- Przetestuj prognozy względem modelu.
W naszym zbiorze danych używamy a syntetyczny zbiór danych od telekomunikacyjnego operatora telefonii komórkowej. Ten przykładowy zestaw danych zawiera 5,000 rekordów, z których każdy wykorzystuje 21 atrybutów do opisania profilu klienta. Atrybuty są następujące:
- Stan – stan USA, w którym zamieszkuje klient, wskazany dwuliterowym skrótem; na przykład OH lub NJ
- Długość konta – Liczba dni, przez które to konto było aktywne
- Numer kierunkowy – Trzycyfrowy numer kierunkowy numeru telefonu klienta
- Telefon – Pozostały siedmiocyfrowy numer telefonu
- Plan międzynarodowy – Czy klient ma plan taryfowy międzynarodowy (tak/nie)
- Plan VMmail – Czy klient posiada funkcję poczty głosowej (tak/nie)
- Wiadomość VMmail – Średnia liczba wiadomości głosowych na miesiąc
- Minuty dnia – Całkowita liczba minut rozmów wykorzystanych w ciągu dnia
- Połączenia dzienne – Całkowita liczba połączeń wykonanych w ciągu dnia
- Opłata dzienna – Rozliczany koszt połączeń w ciągu dnia
- Ewa Mins, Ewa wzywa, Ewa Szarża – Rozliczony koszt za rozmowy wieczorne
- Minuty nocne, Rozmowy w nocy, Nocna opłata – Rozliczany koszt połączeń nocnych
- Min. zewn, Połączenia międzynarodowe, Opłata międzynarodowa – Naliczany koszt połączeń międzynarodowych
- Połączenia CustServ – Liczba połączeń do obsługi klienta
- Maselnica? – Czy klient opuścił usługę (prawda/fałsz)
Ostatni atrybut, Churn?
, to atrybut, który ma przewidywać model ML. Atrybut target jest binarny, co oznacza, że nasz model przewiduje dane wyjściowe jako jedną z dwóch kategorii (True
or False
).
Wymagania wstępne
Administrator chmury z Konto AWS z odpowiednimi uprawnieniami jest wymagane do spełnienia następujących warunków wstępnych:
- Wdróż plik Amazon Sage Maker Aby uzyskać instrukcje, zobacz Na pokładzie do domeny Amazon SageMaker.
- Wdróż kanwę. Aby uzyskać instrukcje, zobacz Konfigurowanie i zarządzanie Amazon SageMaker Canvas (dla administratorów IT).
- Skonfiguruj zasady udostępniania zasobów między źródłami (CORS) dla kanwy. Aby uzyskać instrukcje, zobacz Daj swoim użytkownikom możliwość przesyłania plików lokalnych.
Utwórz model odpływu klientów
Najpierw pobierzmy zbiór danych rezygnacji i przejrzyj plik, aby upewnić się, że są tam wszystkie dane. Następnie wykonaj następujące czynności:
- Zaloguj się do Konsola zarządzania AWS, używając konta z odpowiednimi uprawnieniami dostępu do kanwy.
- Zaloguj się do konsoli Canvas.
To tutaj możemy zarządzać naszymi zbiorami danych i tworzyć modele.
- Dodaj import.
- Dodaj Prześlij I wybierz opcję
churn.csv
plik. - Dodaj Importuj daty aby przesłać go do Canvas.
Proces importowania trwa około 10 sekund (może się to różnić w zależności od rozmiaru zestawu danych). Po zakończeniu widzimy, że zbiór danych jest w Ready
stan.
- Aby wyświetlić podgląd pierwszych 100 wierszy zestawu danych, najedź myszą na ikonę oka.
Pojawi się podgląd zbioru danych. Tutaj możemy zweryfikować poprawność naszych danych.
Po potwierdzeniu, że zaimportowany zestaw danych jest gotowy, tworzymy nasz model.
- Dodaj Nowy model.
- Wybierz zbiór danych churn.csv i wybierz Wybierz zbiór danych.
Teraz konfigurujemy proces budowania modelu.
- W razie zamówieenia projektu Kolumny docelowe, Wybierz
Churn?
Kolumna.
W razie zamówieenia projektu Typ modelu, Canvas automatycznie zaleca typ modelu, w tym przypadku 2 prognozy kategorii (co specjalista od danych nazwałby klasyfikacją binarną). Jest to odpowiednie dla naszego przypadku użycia, ponieważ mamy tylko dwie możliwe wartości przewidywania: True
or False
, więc idziemy z rekomendacją Canvas made.
Teraz potwierdzamy niektóre założenia. Chcemy uzyskać szybki wgląd w to, czy nasza kolumna docelowa może być przewidziana przez inne kolumny. Możemy uzyskać szybki wgląd w szacowaną dokładność modelu i wpływ kolumny (szacowane znaczenie każdej kolumny w przewidywaniu kolumny docelowej).
- Wybierz wszystkie 21 kolumn i wybierz Podgląd modelu.
Ta funkcja wykorzystuje podzbiór naszego zbioru danych i tylko jedno przejście podczas modelowania. W naszym przypadku użycia model podglądu zajmuje około 2 minut.
Jak pokazano na poniższym zrzucie ekranu, Phone
i State
kolumny mają znacznie mniejszy wpływ na naszą prognozę. Chcemy być ostrożni podczas usuwania tekstu wejściowego, ponieważ może on zawierać ważne, dyskretne, kategoryczne cechy przyczyniające się do naszego przewidywania. W tym przypadku numer telefonu jest po prostu odpowiednikiem numeru konta — nie ma wartości w przewidywaniu prawdopodobieństwa rezygnacji z innych kont, a stan klienta nie ma dużego wpływu na nasz model.
- Usuwamy te kolumny, ponieważ nie mają większego znaczenia dla funkcji.
- Po usunięciu
Phone
iState
kolumn, uruchommy ponownie podgląd.
Jak pokazano na poniższym zrzucie ekranu, dokładność modelu wzrosła o 0.1%. Nasz model podglądu ma szacowaną dokładność 95.9%, a kolumny o największym wpływie to Night Calls
, Eve Mins
, Night Charge
. Daje nam to wgląd w to, jakie kolumny mają największy wpływ na wydajność naszego modelu. Tutaj musimy być ostrożni przy wyborze cech, ponieważ jeśli pojedyncza cecha ma ogromny wpływ na wynik modelu, jest to główny wskaźnik docelowy wyciek, a funkcja nie będzie dostępna w czasie prognozy. W tym przypadku kilka kolumn wykazało bardzo podobny wpływ, więc kontynuujemy budowanie naszego modelu.
Canvas oferuje dwie opcje budowania:
- Wersja standardowa – Buduje najlepszy model ze zoptymalizowanego procesu wspieranego przez AutoML; prędkość jest wymieniana na największą dokładność
- Szybka budowa – Buduje model w ułamku czasu w porównaniu do standardowej budowy; potencjalna dokładność jest wymieniana na prędkość.
- W tym poście wybieramy Wersja standardowa opcja, ponieważ chcemy mieć najlepszy model i jesteśmy gotowi poświęcić dodatkowy czas na oczekiwanie na wynik.
Proces kompilacji może zająć 2–4 godziny. W tym czasie Canvas testuje setki potoków kandydatów, wybierając najlepszy model do zaprezentowania. Na poniższym zrzucie ekranu możemy zobaczyć oczekiwany czas i postęp budowy.
Oceń wydajność modelu
Po zakończeniu procesu budowania modelu przewidywane przez model odejścia w 97.9% przypadków. Wydaje się to w porządku, ale jako analitycy chcemy zanurkować głębiej i sprawdzić, czy możemy zaufać modelowi w podejmowaniu na jego podstawie decyzji. Na Punktacja , możemy przejrzeć graficzną wykres naszych prognoz zmapowanych na ich wyniki. Pozwala nam to na głębszy wgląd w nasz model.
Canvas dzieli zbiór danych na zbiory szkoleniowe i testowe. Treningowy zestaw danych to dane używane przez kanwę do budowania modelu. Zestaw testowy służy do sprawdzenia, czy model działa dobrze z nowymi danymi. Diagram Sankeya na poniższym zrzucie ekranu pokazuje, jak model działał na zbiorze testowym. Aby dowiedzieć się więcej, zapoznaj się z Ocena wydajności Twojego modelu w Amazon SageMaker Canvas.
Aby uzyskać bardziej szczegółowe informacje wykraczające poza to, co jest wyświetlane na diagramie Sankeya, analitycy biznesowi mogą użyć matryca zamieszania analizy pod kątem ich rozwiązań biznesowych. Na przykład chcemy lepiej zrozumieć prawdopodobieństwo, że model dokona fałszywych prognoz. Widzimy to na diagramie Sankeya, ale chcemy uzyskać więcej informacji, więc wybieramy Zaawansowane metryki. Otrzymaliśmy macierz pomyłek, która wyświetla wydajność modelu w formacie wizualnym z następującymi wartościami, charakterystycznymi dla klasy pozytywnej — mierzymy na podstawie tego, czy rzeczywiście będą się one odchodziły, więc nasza klasa pozytywna to True
w tym przykładzie:
- Prawdziwie pozytywne (TP) - Liczba
True
wyniki, które zostały prawidłowo przewidziane jakoTrue
- Prawdziwie negatywna (TN) - Liczba
False
wyniki, które zostały prawidłowo przewidziane jakoFalse
- Fałszywy wynik pozytywny (FP) - Liczba
False
wyniki, które zostały błędnie przewidziane jakoTrue
- Fałszywy negatywny (FN) - Liczba
True
wyniki, które zostały błędnie przewidziane jakoFalse
Możemy użyć tego wykresu macierzowego, aby określić nie tylko, jak dokładny jest nasz model, ale także kiedy jest niepoprawny, jak często może to być i jak jest niepoprawny.
Zaawansowane metryki wyglądają dobrze. Możemy zaufać wynikowi modelu. Widzimy bardzo niskie wyniki fałszywie dodatnie i fałszywie ujemne. Dzieje się tak, jeśli model uważa, że klient w zbiorze danych odejdzie, a tak naprawdę nie (fałszywie dodatnie) lub jeśli model uważa, że klient odejdzie, a faktycznie tak (fałszywie ujemny). Wysokie liczby dla obu z nich mogą skłonić nas do zastanowienia się, jeśli możemy użyć modelu do podejmowania decyzji.
Wróćmy do Przegląd , aby przejrzeć wpływ każdej kolumny. Te informacje mogą pomóc zespołowi marketingowemu uzyskać wgląd, który prowadzi do podjęcia działań w celu zmniejszenia rotacji klientów. Na przykład widzimy, że zarówno niski, jak i wysoki CustServ Calls
zwiększyć prawdopodobieństwo rezygnacji. Zespół marketingowy może podjąć działania, aby zapobiec odejściu klientów na podstawie tych informacji. Przykłady obejmują tworzenie szczegółowych często zadawanych pytań na stronach internetowych w celu zmniejszenia liczby telefonów do obsługi klienta oraz prowadzenie kampanii edukacyjnych z klientami na temat najczęściej zadawanych pytań, które mogą podtrzymać zaangażowanie.
Nasz model wygląda całkiem dokładnie. Możemy bezpośrednio przeprowadzić interaktywną prognozę na Przewiduj zakładka, w prognozie zbiorczej lub pojedynczej (w czasie rzeczywistym). W tym przykładzie wprowadziliśmy kilka zmian w niektórych wartościach kolumn i przeprowadziliśmy prognozę w czasie rzeczywistym. Canvas pokazuje nam wynik prognozy wraz z poziomem ufności.
Załóżmy, że mamy istniejącego klienta, który ma następujące zastosowanie: Night Mins
to 40 i Eve Mins
wynosi 40. Możemy przeprowadzić prognozę, a nasz model zwraca wynik ufności 93.2%, że ten klient odejdzie (True
). Możemy teraz zaoferować zniżki promocyjne, aby zatrzymać tego klienta.
Załóżmy, że mamy istniejącego klienta, który ma następujące zastosowanie: Night Mins
to 40 i Eve Mins
wynosi 40. Możemy przeprowadzić prognozę, a nasz model zwraca wynik ufności 93.2%, że ten klient odejdzie (True
). Możemy teraz zaoferować zniżki promocyjne, aby zatrzymać tego klienta.
Uruchamianie jednej prognozy jest świetne do indywidualnej analizy warunkowej, ale musimy również przeprowadzać prognozy na wielu rekordach jednocześnie. Płótno jest w stanie uruchom prognozy wsadowe, który umożliwia przeprowadzanie prognoz na dużą skalę.
Wnioski
W tym poście pokazaliśmy, jak analityk biznesowy może stworzyć model churnu klientów za pomocą SageMaker Canvas, korzystając z przykładowych danych. Canvas umożliwia analitykom biznesowym tworzenie dokładnych modeli uczenia maszynowego i generowanie prognoz za pomocą interfejsu wizualnego typu „wskaż i kliknij” bez kodu. Analityk marketingowy może teraz wykorzystać te informacje do prowadzenia ukierunkowanych kampanii utrzymania i szybszego testowania nowych strategii kampanii, co prowadzi do zmniejszenia rotacji klientów.
Analitycy mogą przenieść to na wyższy poziom, udostępniając swoje modele współpracownikom zajmującym się danymi. Analitycy danych mogą wyświetlić model Canvas w Studio Amazon SageMaker, gdzie mogą zapoznać się z wyborami dokonanymi przez Canvas AutoML, weryfikować wyniki modelu, a nawet za pomocą kilku kliknięć przeprowadzić produkcję modelu. Może to przyspieszyć tworzenie wartości w oparciu o ML i pomóc w szybszym skalowaniu lepszych wyników.
Aby dowiedzieć się więcej o korzystaniu z Canvas, zobacz Buduj, udostępniaj, wdrażaj: jak analitycy biznesowi i analitycy danych osiągają szybszy czas wprowadzania produktów na rynek, korzystając z bezkodowej ML i Amazon SageMaker Canvas. Aby uzyskać więcej informacji na temat tworzenia modeli ML za pomocą rozwiązania bez kodu, zobacz Przedstawiamy Amazon SageMaker Canvas — wizualną możliwość uczenia maszynowego bez kodu dla analityków biznesowych.
O autorze
Henryk Robalino jest architektem rozwiązań w AWS z siedzibą w NJ. Pasjonuje się chmurą i uczeniem maszynowym oraz rolą, jaką mogą odegrać w społeczeństwie. Osiąga to, pracując z klientami, aby pomóc im osiągnąć cele biznesowe za pomocą AWS Cloud. Poza pracą możesz znaleźć Henry'ego podróżującego lub odkrywającego plener ze swoją futrzaną córką Arly.
Chaorana Wanga jest architektem rozwiązań w AWS z siedzibą w Dallas w Teksasie. Pracuje w AWS od ukończenia University of Texas w Dallas w 2016 roku z tytułem magistra informatyki. Chaoran pomaga klientom tworzyć skalowalne, bezpieczne i ekonomiczne aplikacje oraz znajdować rozwiązania, które rozwiązują ich wyzwania biznesowe w chmurze AWS. Poza pracą Chaoran uwielbia spędzać czas z rodziną i dwoma psami, Biubiu i Coco.
- Coinsmart. Najlepsza w Europie giełda bitcoinów i kryptowalut.
- Platoblockchain. Web3 Inteligencja Metaverse. Wzmocniona wiedza. DARMOWY DOSTĘP.
- CryptoJastrząb. Radar Altcoin. Bezpłatna wersja próbna.
- Źródło: https://aws.amazon.com/blogs/machine-learning/predicting-customer-churn-with-no-code-machine-learning-using-amazon-sagemaker-canvas/
- "
- 000
- 10
- 100
- 11
- 2016
- 7
- 9
- O nas
- przyśpieszyć
- dostęp
- Konto
- dokładny
- działania
- Dodatkowy
- Admin
- Administratorzy
- zaawansowany
- Wszystkie kategorie
- Amazonka
- analiza
- analityk
- aplikacje
- właściwy
- w przybliżeniu
- POWIERZCHNIA
- atrybuty
- dostępny
- średni
- AWS
- BEST
- Poza
- Najwyższa
- granica
- budować
- Budowanie
- Buduje
- biznes
- biznes
- kupować
- wezwanie
- Kampania
- Kampanie
- Może uzyskać
- kandydat
- brezentowy
- Kategoria
- pewien
- wyzwania
- zmiana
- opłata
- wybory
- Dodaj
- klasa
- klasyfikacja
- Chmura
- kod
- koledzy
- Kolumna
- w porównaniu
- komputer
- Computer Science
- pewność siebie
- zamieszanie
- Konsola
- zawiera
- kontynuować
- opłacalne
- mógłby
- Stwórz
- Tworzenie
- tworzenie
- klient
- Obsługa klienta
- Klientów
- Dallas
- dane
- naukowiec danych
- głębiej
- opóźnienie
- W zależności
- rozwijać
- szczegółowe
- Ustalać
- bezpośrednio
- wyświetlacze
- Nie
- Edukacja
- zaręczynowy
- Inżynieria
- szacunkowa
- przykład
- Przede wszystkim system został opracowany
- spodziewany
- doświadczenie
- eksperci
- odkryj
- oko
- Czynniki
- członków Twojej rodziny
- FAQ
- FAST
- szybciej
- Cecha
- Korzyści
- w porządku
- i terminów, a
- następujący
- format
- Generować
- Gole
- dobry
- wspaniały
- Największym
- Rosnąć
- mający
- pomoc
- pomaga
- tutaj
- Wysoki
- W jaki sposób
- HTTPS
- Setki
- ICON
- zidentyfikować
- identyfikacja
- Rezultat
- wpływowy
- znaczenie
- ważny
- ulepszony
- zawierać
- Zwiększać
- wzrosła
- indywidualny
- Informacja
- wkład
- spostrzeżenia
- interaktywne
- Interfejs
- na świecie
- IT
- prowadzić
- prowadzący
- UCZYĆ SIĘ
- nauka
- Pozostawiać
- poziom
- Linia
- miejscowy
- maszyna
- uczenie maszynowe
- zrobiony
- poważny
- Dokonywanie
- zarządzanie
- i konserwacjami
- zarządzający
- Marketing
- mistrzowski
- Matrix
- znaczenie
- Metryka
- nic
- ML
- Aplikacje mobilne
- telefon komórkowy
- model
- modele
- jeszcze
- większość
- ujemny
- numer
- z naszej
- Oferty
- zoptymalizowane
- Option
- Opcje
- Inne
- na zewnątrz
- namiętny
- jest gwarancją najlepszej jakości, które mogą dostarczyć Ci Twoje monitory,
- Grać
- polityka
- pozytywny
- możliwy
- potencjał
- przewidzieć
- przepowiednia
- Przewidywania
- teraźniejszość
- bardzo
- Podgląd
- pierwotny
- wygląda tak
- Profil
- zyski
- promocja
- promocyjny
- zapewniać
- zapewnia
- Szybki
- w czasie rzeczywistym
- zaleca
- rekord
- dokumentacja
- zmniejszyć
- pozostały
- usuwanie
- wymagany
- Zasób
- Efekt
- powraca
- dochód
- przeglądu
- Ryzyko
- run
- bieganie
- skalowalny
- Skala
- nauka
- Naukowiec
- Naukowcy
- sekund
- bezpieczne
- usługa
- zestaw
- Share
- dzielenie
- podobny
- Prosty
- Rozmiar
- So
- Społeczeństwo
- solidny
- rozwiązanie
- Rozwiązania
- ROZWIĄZANIA
- kilka
- prędkość
- wydać
- Spędzanie
- standard
- Stan
- Rynek
- przechowywanie
- strategie
- biorąc
- cel
- zespół
- telekomunikacja
- test
- Testy
- texas
- czas
- już dziś
- Top
- Trening
- Podróżowanie
- Zaufaj
- TX
- zrozumieć
- uniwersytet
- us
- posługiwać się
- Użytkownicy
- wartość
- zweryfikować
- Zobacz i wysłuchaj
- Głos
- strony internetowe
- Co
- Co to jest
- czy
- KIM
- Wikipedia
- Praca
- pracujący
- by