Razumevanje vedenja strank je danes najpomembnejše za vsako podjetje. Pridobivanje vpogleda v to, zakaj in kako kupci kupujejo, lahko pomaga povečati prihodke. Toda izguba strank (imenovana tudi odliv strank) je vedno tveganje, vpogled v to, zakaj stranke odhajajo, pa je lahko prav tako pomemben za ohranjanje prihodkov in dobička. Strojno učenje (ML) lahko pomaga pri vpogledih, vendar ste do zdaj potrebovali strokovnjake za ML, da bi zgradili modele za napovedovanje odliva, pomanjkanje tega pa bi lahko odložilo dejanja podjetij, ki temeljijo na vpogledih, da obdržijo stranke.
V tej objavi vam pokažemo, kako lahko poslovni analitiki zgradijo model ML za odliv strank Amazon SageMaker Canvas, koda ni potrebna. Canvas ponuja poslovnim analitikom vizualni vmesnik »pokaži in klikni«, ki vam omogoča, da sami sestavite modele in ustvarite natančne napovedi ML – ne da bi morali imeti izkušnje z ML ali napisati eno vrstico kode.
Pregled rešitve
Za to delovno mesto prevzemamo vlogo marketinškega analitika v marketinškem oddelku mobilnega operaterja. Zadolženi smo za identifikacijo strank, ki so potencialno v nevarnosti odpovedi. Imamo dostop do podatkov o uporabi storitve in drugih vedenju strank in želimo vedeti, ali ti podatki lahko pomagajo razložiti, zakaj bi stranka odšla. Če lahko identificiramo dejavnike, ki pojasnjujejo odliv, potem lahko sprejmemo korektivne ukrepe za spremembo predvidenega vedenja, kot je izvajanje ciljno usmerjenih kampanj za ohranjanje.
Za to uporabimo podatke, ki jih imamo v datoteki CSV, ki vsebuje informacije o uporabi in odlivu strank. Canvas uporabljamo za izvajanje naslednjih korakov:
- Uvozi nabor podatkov o odlivu iz Preprosta storitev shranjevanja Amazon (Amazon S3).
- Usposobite in zgradite model odliva.
- Analizirajte rezultate modela.
- Preizkusite napovedi glede na model.
Za naš nabor podatkov uporabljamo a sintetični nabor podatkov od telekomunikacijskega operaterja mobilne telefonije. Ta vzorčni nabor podatkov vsebuje 5,000 zapisov, pri čemer vsak zapis uporablja 21 atributov za opis profila stranke. Atributi so naslednji:
- Država – zvezna država ZDA, v kateri stranka prebiva, označena z dvočrkovno okrajšavo; na primer OH ali NJ
- Dolžina računa – Število dni, ko je bil ta račun aktiven
- Koda območja – Trimestna območna koda telefonske številke stranke
- Telefon – Preostala sedemmestna telefonska številka
- Int'l načrt – Ali ima stranka mednarodni klicni načrt (da/ne)
- Načrt VMail – Ali ima stranka funkcijo glasovne pošte (da/ne)
- Sporočilo VMail – Povprečno število glasovnih sporočil na mesec
- Dnevne minute – Skupno število porabljenih minut klicev čez dan
- Dnevni klici – Skupno število klicev v dnevu
- Dnevna polnitev – Zaračunani stroški dnevnih klicev
- Eve Mins, Eve kliče, Eve Charge – Zaračunani stroški večernih klicev
- Nočne min, Nočni klici, Nočno polnjenje – Zaračunani stroški nočnih klicev
- Intl min, Mednarodni klici, Mednarodno polnjenje – Zaračunani stroški mednarodnih klicev
- Klici CustServ – Število klicev službe za stranke
- Odliv? – Ali je stranka zapustila storitev (true/false)
Zadnji atribut, Churn?
, je atribut, za katerega želimo, da ga predvidi model ML. Ciljni atribut je binarni, kar pomeni, da naš model napoveduje izhod kot eno od dveh kategorij (True
or False
).
Predpogoji
Skrbnik v oblaku z AWS račun z ustreznimi dovoljenji mora izpolniti naslednje predpogoje:
- Uvedite Amazon SageMaker Za navodila glejte Vkrcajte se na domeno Amazon SageMaker.
- Namestite Canvas. Za navodila glejte Nastavitev in upravljanje Amazon SageMaker Canvas (za skrbnike IT).
- Konfigurirajte pravilnike skupne rabe virov navzkrižnega izvora (CORS) za Canvas. Za navodila glejte Dajte svojim uporabnikom možnost nalaganja lokalnih datotek.
Ustvarite model odliva strank
Najprej prenesimo nabor podatkov o odlivu in preglejte datoteko, da se prepričate, ali so tam vsi podatki. Nato izvedite naslednje korake:
- Prijavite se v Konzola za upravljanje AWS, z uporabo računa z ustreznimi dovoljenji za dostop do Platna.
- Prijavite se v konzolo Canvas.
Tukaj lahko upravljamo svoje nabore podatkov in ustvarjamo modele.
- Izberite uvoz.
- Izberite Pošiljanje In izberite
churn.csv
Datoteka. - Izberite Uvozi podatke da ga naložite na Canvas.
Postopek uvoza traja približno 10 sekund (to se lahko razlikuje glede na velikost nabora podatkov). Ko je dokončan, lahko vidimo, da je nabor podatkov vstavljen Ready
Status.
- Za predogled prvih 100 vrstic nabora podatkov premaknite miško nad ikono očesa.
Prikaže se predogled nabora podatkov. Tukaj lahko preverimo, ali so naši podatki pravilni.
Ko potrdimo, da je uvoženi nabor podatkov pripravljen, ustvarimo naš model.
- Izberite Novi model.
- Izberite nabor podatkov churn.csv in izberite Izberite nabor podatkov.
Zdaj konfiguriramo postopek gradnje modela.
- za Ciljni stolpci, izberite
Churn?
stolpec.
za Vrsta modela, Canvas v tem primeru samodejno priporoči vrsto modela Napoved 2 kategorije (kar bi podatkovni znanstvenik imenoval binarna klasifikacija). To je primerno za naš primer uporabe, ker imamo samo dve možni vrednosti napovedi: True
or False
, zato upoštevamo priporočilo Canvas made.
Zdaj potrjujemo nekatere predpostavke. Želimo si hitro ogledati, ali je mogoče naš ciljni stolpec predvideti z drugimi stolpci. Dobimo lahko hiter vpogled v ocenjeno natančnost modela in vpliv stolpca (ocenjena pomembnost vsakega stolpca pri napovedovanju ciljnega stolpca).
- Izberite vseh 21 stolpcev in izberite Predogled modela.
Ta funkcija uporablja podmnožico našega nabora podatkov in samo en prehod pri modeliranju. Za naš primer uporabe traja izdelava modela predogleda približno 2 minuti.
Kot je prikazano na naslednjem posnetku zaslona, je Phone
in State
stolpci veliko manj vplivajo na našo napoved. Pri odstranjevanju vnosa besedila želimo biti previdni, ker lahko vsebuje pomembne diskretne, kategorične značilnosti, ki prispevajo k našemu predvidevanju. Tu je telefonska številka samo enakovredna številki računa – nima vrednosti pri napovedovanju verjetnosti odliva drugih računov, stanje stranke pa ne vpliva veliko na naš model.
- Te stolpce odstranimo, ker nimajo večjega pomena.
- Ko odstranimo
Phone
inState
stolpcev, znova zaženimo predogled.
Kot je prikazano na naslednjem posnetku zaslona, se je natančnost modela povečala za 0.1 %. Naš predogledni model ima 95.9-odstotno ocenjeno natančnost, stolpci z največjim vplivom pa so Night Calls
, Eve Mins
in Night Charge
. To nam daje vpogled v to, kateri stolpci najbolj vplivajo na delovanje našega modela. Tukaj moramo biti previdni, ko izbiramo funkcije, kajti če posamezna lastnost izjemno vpliva na rezultat modela, je to glavni pokazatelj ciljno uhajanje, in funkcija ne bo na voljo v času predvidevanja. V tem primeru je nekaj stolpcev pokazalo zelo podoben vpliv, zato nadaljujemo z izgradnjo našega modela.
Canvas ponuja dve možnosti gradnje:
- Standardna izdelava – Zgradi najboljši model iz optimiziranega procesa, ki ga poganja AutoML; hitrost se zamenja za največjo natančnost
- Hitra izdelava – Zgradi model v delčku časa v primerjavi s standardno gradnjo; potencialna natančnost se zamenja za hitrost.
- Za to objavo izberemo Standardna izdelava možnost, ker želimo imeti najboljši model in smo pripravljeni porabiti več časa za čakanje na rezultat.
Postopek gradnje lahko traja 2–4 ure. V tem času Canvas testira na stotine možnih cevovodov in izbere najboljši model, ki nam ga predstavi. Na naslednjem posnetku zaslona lahko vidimo pričakovan čas gradnje in napredek.
Ocenite delovanje modela
Ko je postopek gradnje modela končan, je model predvidel odliv v 97.9 % časa. To se zdi v redu, vendar se kot analitiki želimo poglobiti in ugotoviti, ali lahko modelu zaupamo, da bo na podlagi tega sprejemal odločitve. Na Točkovanje lahko pregledamo vizualni izris naših napovedi, preslikanih na njihove rezultate. To nam omogoča globlji vpogled v naš model.
Canvas razdeli nabor podatkov na nabore za usposabljanje in testne nabore. Nabor podatkov za usposabljanje so podatki, ki jih Canvas uporablja za izdelavo modela. Testni nabor se uporablja za preverjanje, ali se model dobro obnese z novimi podatki. Diagram Sankey na naslednjem posnetku zaslona prikazuje, kako se je model obnesel na preskusnem nizu. Če želite izvedeti več, glejte Ocenjevanje delovanja vašega modela v Amazon SageMaker Canvas.
Za pridobitev podrobnejših vpogledov poleg tega, kar je prikazano v diagramu Sankey, lahko poslovni analitiki uporabijo matrika zmede analize za svoje poslovne rešitve. Na primer, želimo bolje razumeti verjetnost, da model daje napačne napovedi. To lahko vidimo v diagramu Sankey, vendar želimo več vpogledov, zato izberemo Napredne meritve. Predstavljena nam je matrika zmede, ki prikazuje delovanje modela v vizualni obliki z naslednjimi vrednostmi, značilnimi za pozitivni razred – merimo glede na to, ali bodo dejansko odpadle, zato je naš pozitivni razred True
v tem primeru:
- Resnično pozitivno (TP) - Število
True
rezultate, ki so bili pravilno predvideni kotTrue
- True Negative (TN) - Število
False
rezultate, ki so bili pravilno predvideni kotFalse
- Lažno pozitivno (FP) - Število
False
rezultate, ki so bili napačno napovedani kotTrue
- Lažno negativno (FN) - Število
True
rezultate, ki so bili napačno napovedani kotFalse
S to matrično karto lahko ugotovimo ne le, kako natančen je naš model, temveč tudi, kdaj je napačen, kako pogosto je to lahko in v čem je napačen.
Napredne meritve izgledajo dobro. Rezultatu modela lahko zaupamo. Vidimo zelo malo lažno pozitivnih in lažno negativnih rezultatov. To so, če model misli, da bo stranka v naboru podatkov odpadla, in dejansko ne (lažno pozitivno), ali če model misli, da bo stranka odpadla in dejansko to stori (lažno negativno). Visoke številke za enega ali drugega bi nas morda spodbudile k razmišljanju o tem, ali lahko uporabimo model za sprejemanje odločitev.
Vrnimo se k Pregled za pregled vpliva vsakega stolpca. Te informacije lahko pomagajo skupini za trženje pridobiti vpoglede, ki vodijo k ukrepanju za zmanjšanje odliva strank. Na primer, lahko vidimo, da tako nizko kot visoko CustServ Calls
povečati verjetnost odliva. Tržna ekipa lahko na podlagi teh spoznanj sprejme ukrepe za preprečitev odliva strank. Primeri vključujejo ustvarjanje podrobnih pogostih vprašanj na spletnih mestih za zmanjšanje klicev v podporo strankam in vodenje izobraževalnih kampanj s strankami o pogostih vprašanjih, ki lahko ohranjajo sodelovanje.
Naš model je videti precej natančen. Neposredno lahko izvedemo interaktivno napoved na Predvidite v paketnem ali posameznem (v realnem času) predvidevanju. V tem primeru smo naredili nekaj sprememb v določenih vrednostih stolpcev in izvedli predvidevanje v realnem času. Canvas nam pokaže rezultat napovedi skupaj s stopnjo zaupanja.
Recimo, da imamo obstoječo stranko, ki uporablja naslednje: Night Mins
je 40 in Eve Mins
je 40. Izvedemo lahko napoved in naš model vrne rezultat zaupanja 93.2 %, da bo ta stranka odpadla (True
). Zdaj se lahko odločimo za promocijske popuste, da obdržimo to stranko.
Recimo, da imamo obstoječo stranko, ki uporablja naslednje: Night Mins
je 40 in Eve Mins
je 40. Izvedemo lahko napoved in naš model vrne rezultat zaupanja 93.2 %, da bo ta stranka odpadla (True
). Zdaj se lahko odločimo za promocijske popuste, da obdržimo to stranko.
Izvajanje ene napovedi je odlično za posamezno analizo kaj-če, vendar moramo izvesti tudi napovedi za več zapisov hkrati. Canvas zmore zaženite paketne napovedi, ki vam omogoča izvajanje napovedi v velikem obsegu.
zaključek
V tej objavi smo pokazali, kako lahko poslovni analitik ustvari model odliva strank s SageMaker Canvas z uporabo vzorčnih podatkov. Canvas vašim poslovnim analitikom omogoča ustvarjanje natančnih modelov ML in generiranje napovedi z uporabo vizualnega vmesnika brez kode, pokaži in klikni. Trženjski analitik lahko zdaj uporabi te informacije za izvajanje ciljno usmerjenih kampanj zadrževanja in hitrejše preizkušanje novih strategij kampanj, kar vodi do zmanjšanja odliva strank.
Analitiki lahko to dvignejo na višjo raven tako, da svoje modele delijo s kolegi podatkovnimi znanstveniki. Podatkovni znanstveniki si lahko ogledajo model Canvas v Amazon SageMaker Studio, kjer lahko raziščejo izbire, ki jih je naredil Canvas AutoML, potrdijo rezultate modela in celo proizvedejo model z nekaj kliki. To lahko pospeši ustvarjanje vrednosti, ki temelji na ML, in pomaga hitreje povečati izboljšane rezultate.
Če želite izvedeti več o uporabi Canvas, glejte Zgradite, delite, uvedite: kako poslovni analitiki in podatkovni znanstveniki dosežejo hitrejši čas do trga z uporabo ML brez kode in Amazon SageMaker Canvas. Za več informacij o ustvarjanju modelov ML z rešitvijo brez kode glejte Predstavljamo Amazon SageMaker Canvas – vizualno zmožnost strojnega učenja brez kodiranja za poslovne analitike.
O Author
Henry Robalino je arhitekt rešitev pri AWS s sedežem v NJ. Navdušen je nad oblakom in strojnim učenjem ter vlogo, ki jo lahko igrajo v družbi. To doseže s sodelovanjem s strankami, da bi jim pomagal doseči njihove poslovne cilje z uporabo AWS Cloud. Zunaj službe lahko Henryja najdete na potovanju ali raziskovanju na prostem s svojo krzneno hčerko Arly.
Chaoran Wang je arhitekt rešitev pri AWS s sedežem v Dallasu, TX. Dela pri AWS, odkar je leta 2016 diplomiral na Univerzi v Teksasu v Dallasu z magisterijem iz računalništva. Chaoran strankam pomaga zgraditi razširljive, varne in stroškovno učinkovite aplikacije ter najti rešitve za reševanje njihovih poslovnih izzivov v oblaku AWS. Zunaj službe Chaoran rad preživlja čas s svojo družino in dvema psoma, Biubiujem in Coco.
- Coinsmart. Najboljša evropska borza bitcoinov in kriptovalut.
- Platoblockchain. Web3 Metaverse Intelligence. Razširjeno znanje. PROST DOSTOP.
- CryptoHawk. Altcoin radar. Brezplačen preizkus.
- Vir: https://aws.amazon.com/blogs/machine-learning/predicting-customer-churn-with-no-code-machine-learning-using-amazon-sagemaker-canvas/
- "
- 000
- 10
- 100
- 11
- 2016
- 7
- 9
- O meni
- pospeši
- dostop
- Račun
- natančna
- dejavnosti
- Dodatne
- admin
- administratorji
- napredno
- vsi
- Amazon
- Analiza
- Analitik
- aplikacije
- primerno
- približno
- OBMOČJE
- lastnosti
- Na voljo
- povprečno
- AWS
- BEST
- Poleg
- največji
- meja
- izgradnjo
- Building
- Gradi
- poslovni
- podjetja
- nakup
- klic
- Akcija
- Kampanje
- Lahko dobiš
- Kandidat
- platno
- Kategorija
- nekatere
- izzivi
- spremenite
- naboj
- možnosti
- Izberite
- razred
- Razvrstitev
- Cloud
- Koda
- sodelavci
- Stolpec
- v primerjavi z letom
- računalnik
- Računalništvo
- zaupanje
- zmeda
- Konzole
- Vsebuje
- naprej
- stroškovno učinkovito
- bi
- ustvarjajo
- Ustvarjanje
- Oblikovanje
- stranka
- Za stranke
- Stranke, ki so
- Dallas
- datum
- podatkovni znanstvenik
- globlje
- zamuda
- Odvisno
- razporedi
- podrobno
- Ugotovite,
- neposredno
- prikazovalniki
- Ne
- Izobraževanje
- sodelovanje
- Inženiring
- ocenjeni
- Primer
- obstoječih
- Pričakuje
- izkušnje
- Strokovnjaki
- raziskuje
- oči
- dejavniki
- družina
- FAQ
- FAST
- hitreje
- Feature
- Lastnosti
- konec
- prva
- po
- format
- ustvarjajo
- Cilji
- dobro
- veliko
- Največji
- Grow
- ob
- pomoč
- Pomaga
- tukaj
- visoka
- Kako
- HTTPS
- Stotine
- ICON
- identificirati
- identifikacijo
- vpliv
- vplivno
- Pomembnost
- Pomembno
- izboljšalo
- vključujejo
- Povečajte
- povečal
- individualna
- Podatki
- vhod
- vpogledi
- interaktivno
- vmesnik
- Facebook Global
- IT
- vodi
- vodi
- UČITE
- učenje
- pustite
- Stopnja
- vrstica
- lokalna
- stroj
- strojno učenje
- je
- velika
- Izdelava
- upravljanje
- upravljanje
- upravljanje
- Trženje
- poveljnika
- Matrix
- kar pomeni,
- Meritve
- moti
- ML
- Mobilni
- mobilni telefon
- Model
- modeli
- več
- Najbolj
- negativna
- Številka
- številke
- Ponudbe
- optimizirana
- Možnost
- možnosti
- Ostalo
- na prostem
- strastno
- performance
- Predvajaj
- politike
- pozitiven
- mogoče
- potencial
- napovedati
- napoved
- Napovedi
- predstaviti
- precej
- predogled
- primarni
- Postopek
- profil
- dobiček
- promocija
- promocijsko
- zagotavljajo
- zagotavlja
- Hitri
- v realnem času
- priporoča
- zapis
- evidence
- zmanjša
- Preostalih
- odstranjevanje
- obvezna
- vir
- Rezultati
- vrne
- prihodki
- pregleda
- Tveganje
- Run
- tek
- razširljive
- Lestvica
- Znanost
- Znanstvenik
- Znanstveniki
- sekund
- zavarovanje
- Storitev
- nastavite
- Delite s prijatelji, znanci, družino in partnerji :-)
- delitev
- Podoben
- Enostavno
- Velikosti
- So
- Društvo
- trdna
- Rešitev
- rešitve
- SOLVE
- nekaj
- hitrost
- preživeti
- Poraba
- standardna
- Država
- Status
- shranjevanje
- strategije
- ob
- ciljna
- skupina
- telekomunikacije
- Test
- testi
- texas
- čas
- danes
- vrh
- usposabljanje
- Potovanje
- Zaupajte
- TX
- razumeli
- univerza
- us
- uporaba
- Uporabniki
- vrednost
- preverjanje
- Poglej
- Voice
- spletne strani
- Kaj
- Kaj je
- ali
- WHO
- Wikipedia
- delo
- deluje
- bi