Predict Customer Churn With No-code Machine Learning Using Amazon SageMaker Canvas

Ponovno objavil Platon

Spremljevalci: 0

Razumevanje vedenja strank je danes najpomembnejše za vsako podjetje. Pridobivanje vpogleda v to, zakaj in kako kupci kupujejo, lahko pomaga povečati prihodke. Toda izguba strank (imenovana tudi odliv strank) je vedno tveganje, vpogled v to, zakaj stranke odhajajo, pa je lahko prav tako pomemben za ohranjanje prihodkov in dobička. Strojno učenje (ML) lahko pomaga pri vpogledih, vendar ste do zdaj potrebovali strokovnjake za ML, da bi zgradili modele za napovedovanje odliva, pomanjkanje tega pa bi lahko odložilo dejanja podjetij, ki temeljijo na vpogledih, da obdržijo stranke.

V tej objavi vam pokažemo, kako lahko poslovni analitiki zgradijo model ML za odliv strank Amazon SageMaker Canvas, koda ni potrebna. Canvas ponuja poslovnim analitikom vizualni vmesnik »pokaži in klikni«, ki vam omogoča, da sami sestavite modele in ustvarite natančne napovedi ML – ne da bi morali imeti izkušnje z ML ali napisati eno vrstico kode.

Pregled rešitve

Za to delovno mesto prevzemamo vlogo marketinškega analitika v marketinškem oddelku mobilnega operaterja. Zadolženi smo za identifikacijo strank, ki so potencialno v nevarnosti odpovedi. Imamo dostop do podatkov o uporabi storitve in drugih vedenju strank in želimo vedeti, ali ti podatki lahko pomagajo razložiti, zakaj bi stranka odšla. Če lahko identificiramo dejavnike, ki pojasnjujejo odliv, potem lahko sprejmemo korektivne ukrepe za spremembo predvidenega vedenja, kot je izvajanje ciljno usmerjenih kampanj za ohranjanje.

Za to uporabimo podatke, ki jih imamo v datoteki CSV, ki vsebuje informacije o uporabi in odlivu strank. Canvas uporabljamo za izvajanje naslednjih korakov:

Uvozi nabor podatkov o odlivu iz Preprosta storitev shranjevanja Amazon (Amazon S3).
Usposobite in zgradite model odliva.
Analizirajte rezultate modela.
Preizkusite napovedi glede na model.

Za naš nabor podatkov uporabljamo a sintetični nabor podatkov od telekomunikacijskega operaterja mobilne telefonije. Ta vzorčni nabor podatkov vsebuje 5,000 zapisov, pri čemer vsak zapis uporablja 21 atributov za opis profila stranke. Atributi so naslednji:

Država – zvezna država ZDA, v kateri stranka prebiva, označena z dvočrkovno okrajšavo; na primer OH ali NJ
Dolžina računa – Število dni, ko je bil ta račun aktiven
Koda območja – Trimestna območna koda telefonske številke stranke
Telefon – Preostala sedemmestna telefonska številka
Int'l načrt – Ali ima stranka mednarodni klicni načrt (da/ne)
Načrt VMail – Ali ima stranka funkcijo glasovne pošte (da/ne)
Sporočilo VMail – Povprečno število glasovnih sporočil na mesec
Dnevne minute – Skupno število porabljenih minut klicev čez dan
Dnevni klici – Skupno število klicev v dnevu
Dnevna polnitev – Zaračunani stroški dnevnih klicev
Eve Mins, Eve kliče, Eve Charge – Zaračunani stroški večernih klicev
Nočne min, Nočni klici, Nočno polnjenje – Zaračunani stroški nočnih klicev
Intl min, Mednarodni klici, Mednarodno polnjenje – Zaračunani stroški mednarodnih klicev
Klici CustServ – Število klicev službe za stranke
Odliv? – Ali je stranka zapustila storitev (true/false)

Zadnji atribut, Churn?, je atribut, za katerega želimo, da ga predvidi model ML. Ciljni atribut je binarni, kar pomeni, da naš model napoveduje izhod kot eno od dveh kategorij (True or False).

Predpogoji

Skrbnik v oblaku z AWS račun z ustreznimi dovoljenji mora izpolniti naslednje predpogoje:

Uvedite Amazon SageMaker Za navodila glejte Vkrcajte se na domeno Amazon SageMaker.
Namestite Canvas. Za navodila glejte Nastavitev in upravljanje Amazon SageMaker Canvas (za skrbnike IT).
Konfigurirajte pravilnike skupne rabe virov navzkrižnega izvora (CORS) za Canvas. Za navodila glejte Dajte svojim uporabnikom možnost nalaganja lokalnih datotek.

Ustvarite model odliva strank

Najprej prenesimo nabor podatkov o odlivu in preglejte datoteko, da se prepričate, ali so tam vsi podatki. Nato izvedite naslednje korake:

Prijavite se v Konzola za upravljanje AWS, z uporabo računa z ustreznimi dovoljenji za dostop do Platna.
Prijavite se v konzolo Canvas.

Tukaj lahko upravljamo svoje nabore podatkov in ustvarjamo modele.

Izberite uvoz.

Gumb za uvoz platna Izberite

Izberite Pošiljanje In izberite churn.csv Datoteka.
Izberite Uvozi podatke da ga naložite na Canvas.

Canvas izberite podatke iz s3

Postopek uvoza traja približno 10 sekund (to se lahko razlikuje glede na velikost nabora podatkov). Ko je dokončan, lahko vidimo, da je nabor podatkov vstavljen Ready Status.

Nabor podatkov, pripravljen za Canvas

Za predogled prvih 100 vrstic nabora podatkov premaknite miško nad ikono očesa.

Nabor podatkov Canvas View

Prikaže se predogled nabora podatkov. Tukaj lahko preverimo, ali so naši podatki pravilni.

Canvas Verify Data

Ko potrdimo, da je uvoženi nabor podatkov pripravljen, ustvarimo naš model.

Izberite Novi model.

Canvas Novi modeli

Izberite nabor podatkov churn.csv in izberite Izberite nabor podatkov.

Canvas Select Dataset

Zdaj konfiguriramo postopek gradnje modela.

za Ciljni stolpci, izberite Churn? stolpec.

za Vrsta modela, Canvas v tem primeru samodejno priporoči vrsto modela Napoved 2 kategorije (kar bi podatkovni znanstvenik imenoval binarna klasifikacija). To je primerno za naš primer uporabe, ker imamo samo dve možni vrednosti napovedi: True or False, zato upoštevamo priporočilo Canvas made.

Model gradnje platna

Zdaj potrjujemo nekatere predpostavke. Želimo si hitro ogledati, ali je mogoče naš ciljni stolpec predvideti z drugimi stolpci. Dobimo lahko hiter vpogled v ocenjeno natančnost modela in vpliv stolpca (ocenjena pomembnost vsakega stolpca pri napovedovanju ciljnega stolpca).

Izberite vseh 21 stolpcev in izberite Predogled modela.

Ta funkcija uporablja podmnožico našega nabora podatkov in samo en prehod pri modeliranju. Za naš primer uporabe traja izdelava modela predogleda približno 2 minuti.

Model za predogled platna

Kot je prikazano na naslednjem posnetku zaslona, je Phone in State stolpci veliko manj vplivajo na našo napoved. Pri odstranjevanju vnosa besedila želimo biti previdni, ker lahko vsebuje pomembne diskretne, kategorične značilnosti, ki prispevajo k našemu predvidevanju. Tu je telefonska številka samo enakovredna številki računa – nima vrednosti pri napovedovanju verjetnosti odliva drugih računov, stanje stranke pa ne vpliva veliko na naš model.

Te stolpce odstranimo, ker nimajo večjega pomena.
Ko odstranimo Phone in State stolpcev, znova zaženimo predogled.

Kot je prikazano na naslednjem posnetku zaslona, se je natančnost modela povečala za 0.1 %. Naš predogledni model ima 95.9-odstotno ocenjeno natančnost, stolpci z največjim vplivom pa so Night Calls, Eve Minsin Night Charge. To nam daje vpogled v to, kateri stolpci najbolj vplivajo na delovanje našega modela. Tukaj moramo biti previdni, ko izbiramo funkcije, kajti če posamezna lastnost izjemno vpliva na rezultat modela, je to glavni pokazatelj ciljno uhajanje, in funkcija ne bo na voljo v času predvidevanja. V tem primeru je nekaj stolpcev pokazalo zelo podoben vpliv, zato nadaljujemo z izgradnjo našega modela.

Canvas Feature Engineering After

Canvas ponuja dve možnosti gradnje:

Standardna izdelava – Zgradi najboljši model iz optimiziranega procesa, ki ga poganja AutoML; hitrost se zamenja za največjo natančnost
Hitra izdelava – Zgradi model v delčku časa v primerjavi s standardno gradnjo; potencialna natančnost se zamenja za hitrost.

Za to objavo izberemo Standardna izdelava možnost, ker želimo imeti najboljši model in smo pripravljeni porabiti več časa za čakanje na rezultat.

Standardna zgradba Canvas

Postopek gradnje lahko traja 2–4 ure. V tem času Canvas testira na stotine možnih cevovodov in izbere najboljši model, ki nam ga predstavi. Na naslednjem posnetku zaslona lahko vidimo pričakovan čas gradnje in napredek.

Model analize platna

Ocenite delovanje modela

Ko je postopek gradnje modela končan, je model predvidel odliv v 97.9 % časa. To se zdi v redu, vendar se kot analitiki želimo poglobiti in ugotoviti, ali lahko modelu zaupamo, da bo na podlagi tega sprejemal odločitve. Na Točkovanje lahko pregledamo vizualni izris naših napovedi, preslikanih na njihove rezultate. To nam omogoča globlji vpogled v naš model.

Canvas razdeli nabor podatkov na nabore za usposabljanje in testne nabore. Nabor podatkov za usposabljanje so podatki, ki jih Canvas uporablja za izdelavo modela. Testni nabor se uporablja za preverjanje, ali se model dobro obnese z novimi podatki. Diagram Sankey na naslednjem posnetku zaslona prikazuje, kako se je model obnesel na preskusnem nizu. Če želite izvedeti več, glejte Ocenjevanje delovanja vašega modela v Amazon SageMaker Canvas.

Za pridobitev podrobnejših vpogledov poleg tega, kar je prikazano v diagramu Sankey, lahko poslovni analitiki uporabijo matrika zmede analize za svoje poslovne rešitve. Na primer, želimo bolje razumeti verjetnost, da model daje napačne napovedi. To lahko vidimo v diagramu Sankey, vendar želimo več vpogledov, zato izberemo Napredne meritve. Predstavljena nam je matrika zmede, ki prikazuje delovanje modela v vizualni obliki z naslednjimi vrednostmi, značilnimi za pozitivni razred – merimo glede na to, ali bodo dejansko odpadle, zato je naš pozitivni razred True v tem primeru:

Resnično pozitivno (TP) - Število True rezultate, ki so bili pravilno predvideni kot True
True Negative (TN) - Število False rezultate, ki so bili pravilno predvideni kot False
Lažno pozitivno (FP) - Število False rezultate, ki so bili napačno napovedani kot True
Lažno negativno (FN) - Število True rezultate, ki so bili napačno napovedani kot False

S to matrično karto lahko ugotovimo ne le, kako natančen je naš model, temveč tudi, kdaj je napačen, kako pogosto je to lahko in v čem je napačen.

Canvas F1 Matrix

Napredne meritve izgledajo dobro. Rezultatu modela lahko zaupamo. Vidimo zelo malo lažno pozitivnih in lažno negativnih rezultatov. To so, če model misli, da bo stranka v naboru podatkov odpadla, in dejansko ne (lažno pozitivno), ali če model misli, da bo stranka odpadla in dejansko to stori (lažno negativno). Visoke številke za enega ali drugega bi nas morda spodbudile k razmišljanju o tem, ali lahko uporabimo model za sprejemanje odločitev.

Vrnimo se k Pregled za pregled vpliva vsakega stolpca. Te informacije lahko pomagajo skupini za trženje pridobiti vpoglede, ki vodijo k ukrepanju za zmanjšanje odliva strank. Na primer, lahko vidimo, da tako nizko kot visoko CustServ Calls povečati verjetnost odliva. Tržna ekipa lahko na podlagi teh spoznanj sprejme ukrepe za preprečitev odliva strank. Primeri vključujejo ustvarjanje podrobnih pogostih vprašanj na spletnih mestih za zmanjšanje klicev v podporo strankam in vodenje izobraževalnih kampanj s strankami o pogostih vprašanjih, ki lahko ohranjajo sodelovanje.

Naš model je videti precej natančen. Neposredno lahko izvedemo interaktivno napoved na Predvidite v paketnem ali posameznem (v realnem času) predvidevanju. V tem primeru smo naredili nekaj sprememb v določenih vrednostih stolpcev in izvedli predvidevanje v realnem času. Canvas nam pokaže rezultat napovedi skupaj s stopnjo zaupanja.

Canvas Predict Inference

Recimo, da imamo obstoječo stranko, ki uporablja naslednje: Night Mins je 40 in Eve Mins je 40. Izvedemo lahko napoved in naš model vrne rezultat zaupanja 93.2 %, da bo ta stranka odpadla (True). Zdaj se lahko odločimo za promocijske popuste, da obdržimo to stranko.

Izvajanje ene napovedi je odlično za posamezno analizo kaj-če, vendar moramo izvesti tudi napovedi za več zapisov hkrati. Canvas zmore zaženite paketne napovedi, ki vam omogoča izvajanje napovedi v velikem obsegu.

zaključek

V tej objavi smo pokazali, kako lahko poslovni analitik ustvari model odliva strank s SageMaker Canvas z uporabo vzorčnih podatkov. Canvas vašim poslovnim analitikom omogoča ustvarjanje natančnih modelov ML in generiranje napovedi z uporabo vizualnega vmesnika brez kode, pokaži in klikni. Trženjski analitik lahko zdaj uporabi te informacije za izvajanje ciljno usmerjenih kampanj zadrževanja in hitrejše preizkušanje novih strategij kampanj, kar vodi do zmanjšanja odliva strank.

Analitiki lahko to dvignejo na višjo raven tako, da svoje modele delijo s kolegi podatkovnimi znanstveniki. Podatkovni znanstveniki si lahko ogledajo model Canvas v Amazon SageMaker Studio, kjer lahko raziščejo izbire, ki jih je naredil Canvas AutoML, potrdijo rezultate modela in celo proizvedejo model z nekaj kliki. To lahko pospeši ustvarjanje vrednosti, ki temelji na ML, in pomaga hitreje povečati izboljšane rezultate.

Če želite izvedeti več o uporabi Canvas, glejte Zgradite, delite, uvedite: kako poslovni analitiki in podatkovni znanstveniki dosežejo hitrejši čas do trga z uporabo ML brez kode in Amazon SageMaker Canvas. Za več informacij o ustvarjanju modelov ML z rešitvijo brez kode glejte Predstavljamo Amazon SageMaker Canvas – vizualno zmožnost strojnega učenja brez kodiranja za poslovne analitike.

O Author

Henry Robalino je arhitekt rešitev pri AWS s sedežem v NJ. Navdušen je nad oblakom in strojnim učenjem ter vlogo, ki jo lahko igrajo v družbi. To doseže s sodelovanjem s strankami, da bi jim pomagal doseči njihove poslovne cilje z uporabo AWS Cloud. Zunaj službe lahko Henryja najdete na potovanju ali raziskovanju na prostem s svojo krzneno hčerko Arly.

Predvidite odliv strank s strojnim učenjem brez kodiranja z uporabo Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Navpično iskanje. Ai. Chaoran Wang je arhitekt rešitev pri AWS s sedežem v Dallasu, TX. Dela pri AWS, odkar je leta 2016 diplomiral na Univerzi v Teksasu v Dallasu z magisterijem iz računalništva. Chaoran strankam pomaga zgraditi razširljive, varne in stroškovno učinkovite aplikacije ter najti rešitve za reševanje njihovih poslovnih izzivov v oblaku AWS. Zunaj službe Chaoran rad preživlja čas s svojo družino in dvema psoma, Biubiujem in Coco.

Časovni žig: Maj 5, 2022

Časovni žig: Avgust 2, 2023

Ponovno objavil Platon

Povežite Amazon EMR in RStudio na Amazon SageMaker

Predstavljamo nalaganje množičnih dokumentov Amazon Texttract za izboljšano vrednotenje in analizo | Spletne storitve Amazon

Zgradite rešitev za predvideno vzdrževanje z Amazon Kinesis, AWS Glue in Amazon SageMaker

Varni vnaprej podpisani URL-ji Amazon SageMaker Studio 1. del: Temeljna infrastruktura

O nas

Navpično iskanje in Ai

Platforma

Ostanite povezani

Račun