Prevedeți ratarea clienților cu învățare automată fără cod folosind Amazon SageMaker Canvas

Republicat de Platon

Urmaritori: 0

Înțelegerea comportamentului clienților este cea mai importantă pentru fiecare afacere astăzi. Obținerea de informații despre de ce și cum cumpără clienții poate ajuta la creșterea veniturilor. Dar pierderea clienților (numită și pierderea clienților) este întotdeauna un risc, iar informațiile despre motivul pentru care clienții pleacă pot fi la fel de importante pentru menținerea veniturilor și a profiturilor. Învățarea automată (ML) poate ajuta cu statistici, dar până acum aveai nevoie de experți ML pentru a construi modele pentru a prezice pierderile, lipsa cărora ar putea întârzia acțiunile bazate pe informații ale companiilor pentru a păstra clienții.

În această postare, vă arătăm cum analiștii de afaceri pot construi un model ML de retragere a clienților Amazon SageMaker Canvas, nu este necesar niciun cod. Canvas oferă analiștilor de afaceri o interfață vizuală point-and-click care vă permite să construiți modele și să generați singur predicții ML precise – fără a necesita experiență ML sau a fi nevoie să scrieți o singură linie de cod.

Prezentare generală a soluției

Pentru acest post ne asumăm rolul unui analist de marketing în departamentul de marketing al unui operator de telefonie mobilă. Am fost însărcinați să identificăm clienții care sunt potențial expuși riscului de apariție. Avem acces la utilizarea serviciilor și la alte date despre comportamentul clienților și vrem să știm dacă aceste date pot ajuta la explicarea de ce un client ar pleca. Dacă putem identifica factorii care explică abandonul, atunci putem lua măsuri corective pentru a schimba comportamentul estimat, cum ar fi derularea de campanii de retenție direcționate.

Pentru a face acest lucru, folosim datele pe care le avem într-un fișier CSV, care conține informații despre utilizarea clienților și abandon. Folosim Canvas pentru a efectua următorii pași:

Importați setul de date churn din Serviciul Amazon de stocare simplă (Amazon S3).
Antrenează și construiește modelul churn.
Analizați rezultatele modelului.
Testați predicțiile față de model.

Pentru setul nostru de date, folosim a set de date sintetice de la un operator de telefonie mobilă de telecomunicații. Acest exemplu de set de date conține 5,000 de înregistrări, în care fiecare înregistrare utilizează 21 de atribute pentru a descrie profilul clientului. Atributele sunt după cum urmează:

Stat – Statul SUA în care își are reședința clientul, indicat printr-o abreviere din două litere; de exemplu, OH sau NJ
Lungimea contului – Numărul de zile în care acest cont a fost activ
Prefixul zonei – Prefixul din trei cifre al numărului de telefon al clientului
Telefon – Numărul de telefon rămas din șapte cifre
Planul Internațional – Dacă clientul are un plan de apeluri internaționale (da/nu)
Planul VMail – Dacă clientul are o funcție de mesagerie vocală (da/nu)
Mesaj VMail – Numărul mediu de mesaje vocale pe lună
Ziua Min – Numărul total de minute de apelare utilizate în timpul zilei
Apeluri de zi – Numărul total de apeluri efectuate în timpul zilei
Taxă de zi – Costul facturat al apelurilor în timpul zilei
Eve Mins, Eve sună, Eve Charge – Costul facturat pentru apelurile de seară
Minute de noapte, Apeluri de noapte, Încărcare de noapte – Costul facturat pentru apelurile pe timp de noapte
Intl Mins, Apeluri internaționale, Incarcare interna – Costul facturat pentru apelurile internaționale
Apeluri CustServ – Numărul de apeluri efectuate către serviciul clienți
Putinei? – Dacă clientul a părăsit serviciul (adevărat/fals)

Ultimul atribut, Churn?, este atributul pe care dorim să îl prezică modelul ML. Atributul țintă este binar, ceea ce înseamnă că modelul nostru prezice rezultatul ca una dintre două categorii (True or False).

Cerințe preliminare

Un administrator cloud cu un Cont AWS cu permisiunile corespunzătoare este necesar pentru a îndeplini următoarele cerințe preliminare:

Implementați un Amazon SageMaker Pentru instrucțiuni, consultați Integrat la domeniul Amazon SageMaker.
Implementează Canvas. Pentru instrucțiuni, vezi Configurarea și gestionarea Amazon SageMaker Canvas (pentru administratorii IT).
Configurați politicile de partajare a resurselor între origini (CORS) pentru Canvas. Pentru instrucțiuni, vezi Oferiți utilizatorilor posibilitatea de a încărca fișiere locale.

Creați un model de renunțare la client

Mai întâi, să descarcăm setul de date churn și examinați fișierul pentru a vă asigura că toate datele sunt acolo. Apoi parcurgeți următorii pași:

Conectați-vă la Consola de administrare AWS, folosind un cont cu permisiunile corespunzătoare pentru a accesa Canvas.
Conectați-vă la consola Canvas.

Aici ne putem gestiona seturile de date și putem crea modele.

Alege Import.

Butonul de import canvas Select

Alege Încărcați Și selectați churn.csv fișier.
Alege Date de import pentru a-l încărca pe Canvas.

Canvas select date din s3

Procesul de import durează aproximativ 10 secunde (aceasta poate varia în funcție de dimensiunea setului de date). Când este complet, putem vedea că setul de date este în Ready stare.

Set de date Canvas Ready

Pentru a previzualiza primele 100 de rânduri ale setului de date, treceți mouse-ul peste pictograma ochiului.

Setul de date Canvas View

Apare o previzualizare a setului de date. Aici putem verifica dacă datele noastre sunt corecte.

Datele de verificare canvas

După ce confirmăm că setul de date importat este gata, ne creăm modelul.

Alege Noul model.

Canvas Modele noi

Selectați setul de date churn.csv și alegeți Selectați setul de date.

Canvas Select Dataset

Acum configuram procesul de construire a modelului.

Pentru Coloane țintă, alege Churn? coloana.

Pentru Tipul modelului, Canvas recomandă automat tipul de model, în acest caz Predicție de 2 categorii (ceea ce un cercetător de date ar numi clasificare binară). Acest lucru este potrivit pentru cazul nostru de utilizare, deoarece avem doar două valori posibile de predicție: True or False, așa că mergem cu recomandarea Canvas făcută.

Model Canvas Build

Acum validăm câteva ipoteze. Dorim să obținem o vedere rapidă dacă coloana noastră țintă poate fi prezisă de celelalte coloane. Putem obține o vizualizare rapidă a preciziei estimate a modelului și a impactului coloanei (importanța estimată a fiecărei coloane în prezicerea coloanei țintă).

Selectați toate cele 21 de coloane și alegeți Previzualizare model.

Această caracteristică folosește un subset al setului nostru de date și doar o singură trecere la modelare. Pentru cazul nostru de utilizare, modelul de previzualizare durează aproximativ 2 minute pentru a construi.

Model de previzualizare canvas

După cum se arată în următoarea captură de ecran, Phone și State coloanele au un impact mult mai mic asupra predicției noastre. Vrem să fim atenți când eliminăm textul introdus, deoarece poate conține caracteristici importante, discrete, categorice, care contribuie la predicția noastră. Aici, numărul de telefon este doar echivalentul unui număr de cont - nu are valoare în prezicerea probabilității de pierdere a altor conturi, iar starea clientului nu influențează prea mult modelul nostru.

Eliminam aceste coloane pentru că nu au o importanță majoră pentru caracteristici.
După ce scoatem Phone și State coloane, să rulăm din nou previzualizarea.

După cum se arată în următoarea captură de ecran, precizia modelului a crescut cu 0.1%. Modelul nostru de previzualizare are o precizie estimată de 95.9%, iar coloanele cu cel mai mare impact sunt Night Calls, Eve Mins, și Night Charge. Acest lucru ne oferă o perspectivă asupra coloanelor care influențează cel mai mult performanța modelului nostru. Aici trebuie să fim atenți atunci când facem selecția caracteristicilor, deoarece dacă o singură caracteristică are un impact extrem asupra rezultatului unui model, este un indicator principal al scurgere țintă, iar funcția nu va fi disponibilă în momentul predicției. În acest caz, puține coloane au arătat un impact foarte similar, așa că continuăm să ne construim modelul.

Canvas Feature Engineering After

Canvas oferă două opțiuni de construcție:

Construcție standard – Construiește cel mai bun model dintr-un proces optimizat alimentat de AutoML; viteza este schimbată pentru cea mai mare precizie
Construire rapidă – Construiește un model într-o fracțiune de timp în comparație cu o construcție standard; precizia potențială este schimbată cu viteza.

Pentru această postare, alegem Construcție standard opțiune pentru că dorim să avem cel mai bun model și suntem dispuși să petrecem timp suplimentar așteptând rezultatul.

Canvas Standard Build

Procesul de construire poate dura 2-4 ore. În acest timp, Canvas testează sute de candidați, selectând cel mai bun model pe care să ni-l prezinte. În următoarea captură de ecran, putem vedea timpul de construcție așteptat și progresul.

Modelul de analiză canvas

Evaluați performanța modelului

Când procesul de construire a modelului este complet, modelul a prezis pierderea în 97.9% din timp. Acest lucru pare în regulă, dar în calitate de analiști dorim să ne aprofundăm și să vedem dacă putem avea încredere în modelul pentru a lua decizii pe baza acestuia. Pe Punctajul fila, putem revizui o diagramă vizuală a predicțiilor noastre mapate cu rezultatele acestora. Acest lucru ne permite o perspectivă mai profundă asupra modelului nostru.

Canvas separă setul de date în seturi de antrenament și de testare. Setul de date de antrenament este datele pe care Canvas le folosește pentru a construi modelul. Setul de testare este utilizat pentru a vedea dacă modelul funcționează bine cu date noi. Diagrama Sankey din următoarea captură de ecran arată cum a funcționat modelul pe setul de testare. Pentru a afla mai multe, consultați Evaluarea performanței modelului dvs. în Amazon SageMaker Canvas.

Pentru a obține informații mai detaliate dincolo de ceea ce este afișat în diagrama Sankey, analiștii de afaceri pot folosi a matrice de confuzie analiză pentru soluțiile lor de afaceri. De exemplu, dorim să înțelegem mai bine probabilitatea ca modelul să facă predicții false. Putem vedea acest lucru în diagrama Sankey, dar dorim mai multe perspective, așa că alegem Valori avansate. Ne este prezentată o matrice de confuzie, care afișează performanța unui model într-un format vizual cu următoarele valori, specifice clasei pozitive - măsurăm în funcție de faptul dacă acestea vor fi de fapt, astfel încât clasa noastră pozitivă este True in acest exemplu:

Adevărat pozitiv (TP) - Numarul True rezultate care au fost corect prezise ca True
Adevărat negativ (TN) - Numarul False rezultate care au fost corect prezise ca False
fals pozitiv (FP) - Numarul False rezultate care au fost greşit prezise ca True
fals negativ (FN) - Numarul True rezultate care au fost greşit prezise ca False

Putem folosi această diagramă matriceală pentru a determina nu numai cât de precis este modelul nostru, ci și când este greșit, cât de des ar putea fi și cum este greșit.

Canvas F1 Matrix

Valorile avansate arată bine. Putem avea încredere în rezultatul modelului. Vedem false pozitive și false negative foarte scăzute. Acestea sunt în cazul în care modelul crede că un client din setul de date se va retrage și de fapt nu (fals pozitiv), sau dacă modelul crede că clientul va renunța și chiar o fac (fals negativ). Cifrele mari pentru oricare dintre ele ne-ar putea face să ne gândim mai mult dacă putem folosi modelul pentru a lua decizii.

Să revenim la Descriere fila, pentru a revizui impactul fiecărei coloane. Aceste informații pot ajuta echipa de marketing să obțină informații care să ducă la luarea de măsuri pentru a reduce rata de retragere a clienților. De exemplu, putem vedea că atât scăzut cât și ridicat CustServ Calls crește probabilitatea de abandon. Echipa de marketing poate lua măsuri pentru a preveni retragerea clienților pe baza acestor învățăminte. Exemplele includ crearea unei întrebări frecvente detaliate pe site-uri web pentru a reduce apelurile de serviciu pentru clienți și desfășurarea de campanii de educație cu clienții cu privire la întrebările frecvente care pot menține implicarea.

Modelul nostru pare destul de precis. Putem efectua direct o predicție interactivă pe prezice filă, fie în lot sau predicție unică (în timp real). În acest exemplu, am făcut câteva modificări la anumite valori ale coloanei și am efectuat o predicție în timp real. Canvasul ne arată rezultatul predicției împreună cu nivelul de încredere.

Canvas Predict Inferență

Să presupunem că avem un client existent care are următoarele utilizări: Night Mins este 40 și Eve Mins este 40. Putem rula o predicție, iar modelul nostru returnează un scor de încredere de 93.2% pe care acest client îl va produce (True). Am putea alege acum să oferim reduceri promoționale pentru a păstra acest client.

Rularea unei singure predicții este excelentă pentru analiza individuală, dar trebuie, de asemenea, să rulăm predicții pe mai multe înregistrări simultan. Canvas este capabil să rulați predicții pe lot, care vă permite să rulați predicții la scară.

Concluzie

În această postare, am arătat cum un analist de afaceri poate crea un model de retragere a clienților cu SageMaker Canvas folosind date eșantion. Canvas le permite analiștilor dvs. de afaceri să creeze modele ML precise și să genereze predicții folosind o interfață vizuală, fără cod, de tip punct și clic. Un analizor de marketing poate folosi acum aceste informații pentru a desfășura campanii de reținere direcționate și pentru a testa noi strategii de campanie mai rapid, ceea ce duce la o reducere a pierderii clienților.

Analiștii pot duce acest lucru la nivelul următor prin împărtășirea modelelor lor cu colegii cercetători ai datelor. Oamenii de știință de date pot vizualiza modelul Canvas în Amazon SageMaker Studio, unde pot explora alegerile făcute de Canvas AutoML, pot valida rezultatele modelului și chiar pot produce modelul cu câteva clicuri. Acest lucru poate accelera crearea de valoare bazată pe ML și poate ajuta la scalarea mai rapidă a rezultatelor îmbunătățite.

Pentru a afla mai multe despre utilizarea Canvas, consultați Construiți, partajați, implementați: cum analiștii de afaceri și oamenii de știință de date obțin un time-to-market mai rapid folosind ML fără cod și Amazon SageMaker Canvas. Pentru mai multe informații despre crearea modelelor ML cu o soluție fără cod, consultați Anunțăm Amazon SageMaker Canvas – o capacitate de învățare automată vizuală, fără cod pentru analiștii de afaceri.

Despre autor

Henry Robalino este arhitect de soluții la AWS, cu sediul în NJ. Este pasionat de cloud și de învățarea automată și de rolul pe care îl pot juca în societate. El realizează acest lucru lucrând cu clienții pentru a-i ajuta să-și atingă obiectivele de afaceri folosind AWS Cloud. În afara serviciului, îl puteți găsi pe Henry călătorind sau explorând în aer liber împreună cu fiica sa de blană, Arly.

Prevedeți ratarea clienților cu învățarea automată fără cod folosind Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Căutare verticală. Ai. Chaoran Wang este arhitect de soluții la AWS, cu sediul în Dallas, TX. Lucrează la AWS de când a absolvit Universitatea Texas din Dallas în 2016, cu un master în Informatică. Chaoran îi ajută pe clienți să construiască aplicații scalabile, sigure și rentabile și să găsească soluții pentru a-și rezolva provocările de afaceri pe AWS Cloud. În afara serviciului, lui Chaoran îi place să petreacă timpul cu familia și cei doi câini, Biubiu și Coco.

Timestamp-ul: 5 Mai, 2022

Timestamp-ul: August 2, 2023

Republicat de Platon

Conectați Amazon EMR și RStudio pe Amazon SageMaker

Vă prezentăm aplicatorul de încărcare de documente în bloc Amazon Texttract pentru evaluare și analiză îmbunătățite | Amazon Web Services

Creați o soluție de întreținere predictivă cu Amazon Kinesis, AWS Glue și Amazon SageMaker

Securizarea adreselor URL presemnate de Amazon SageMaker Studio Partea 1: Infrastructură fundamentală

Despre noi

Căutare verticală și Ai

Platformă

Rămâneți conectat

Cont