Ennustage klientide vähenemist koodita masinõppega, kasutades Amazon SageMaker Canvas

Taasavaldanud Platon

järgijaid: 0

Klientide käitumise mõistmine on tänapäeval iga ettevõtte jaoks esmatähtis. Kasvatada tulusid, kui saate aru, miks ja kuidas kliendid ostavad. Kuid klientide kaotamine (mida nimetatakse ka klientide vähenemiseks) on alati risk ning teadmine, miks kliendid lahkuvad, võib olla tulude ja kasumi säilitamiseks sama oluline. Masinõpe (ML) võib aidata saada teadmisi, kuid seni vajasite ML-eksperte, et luua mudeleid, et ennustada mahajäämust, mille puudumine võib viivitada ettevõtete arvamuspõhiseid tegevusi klientide hoidmiseks.

Selles postituses näitame teile, kuidas ärianalüütikud saavad luua kliendihulga ML-mudeli Amazon SageMakeri lõuend, koodi pole vaja. Canvas pakub ärianalüütikutele visuaalset point-and-click liidest, mis võimaldab teil iseseisvalt mudeleid luua ja täpseid ML-ennustusi genereerida – ilma ML-i kogemust nõudmata või ühtki koodirida kirjutamata.

Ülevaade lahendusest

Selle postituse jaoks võtame endale mobiiltelefonioperaatori turundusosakonna turundusanalüütiku rolli. Meile on antud ülesandeks tuvastada kliendid, kellel on potentsiaalselt kuhjumise oht. Meil on juurdepääs teenuse kasutamise ja muudele klientide käitumise andmetele ning soovime teada, kas need andmed aitavad selgitada, miks klient lahkub. Kui suudame tuvastada tegurid, mis seletavad kaotust, saame prognoositava käitumise muutmiseks võtta parandusmeetmeid, näiteks korraldada sihitud säilitamiskampaaniaid.

Selleks kasutame andmeid, mis meil on CSV-failis, mis sisaldab infot klientide kasutuse ja kliendivahetuse kohta. Kasutame Canvast järgmiste toimingute tegemiseks:

Importige eemaldamise andmestik kohast Amazoni lihtne salvestusteenus (Amazon S3).
Treenige ja ehitage churn mudel.
Analüüsige mudeli tulemusi.
Testige ennustusi mudeliga.

Oma andmestiku jaoks kasutame a sünteetiline andmestik telekommunikatsiooni mobiiltelefoni operaatorilt. See näidisandmekogum sisaldab 5,000 kirjet, kus iga kirje kasutab kliendiprofiili kirjeldamiseks 21 atribuuti. Atribuudid on järgmised:

riik – USA osariik, kus klient elab, tähistatud kahetähelise lühendiga; näiteks OH või NJ
Konto pikkus – päevade arv, mil see konto on olnud aktiivne
Piirkonna kood – Kliendi telefoninumbri kolmekohaline suunakood
TELEFON – ülejäänud seitsmekohaline telefoninumber
Rahvusvaheline plaan – kas kliendil on rahvusvaheliste kõnede plaan (jah/ei)
VMaili plaan – kas kliendil on kõneposti funktsioon (jah/ei)
VMaili sõnum – Kõnepostisõnumite keskmine arv kuus
Päev min – päeva jooksul kasutatud kõneminutite koguarv
Päevakõned – päeva jooksul tehtud kõnede koguarv
Päevatasu – päevaste kõnede arveldatud maksumus
Eve Mins, Eve helistab, Eve Charge – õhtuste kõnede arvelduskulud
Öine min, Öised kõned, Öine tasu – Öiste kõnede arvelduskulud
Rahvusvaheline min, Rahvusvahelised kõned, Rahvusvaheline tasu – rahvusvaheliste kõnede tasu
CustServ kõned – Klienditeenindusse tehtud kõnede arv
Kastma? – kas klient lahkus teenusest (tõene/vale)

Viimane atribuut, Churn?, on atribuut, mida tahame, et ML-mudel ennustaks. Sihtatribuut on binaarne, mis tähendab, et meie mudel ennustab väljundit ühena kahest kategooriast (True or False).

Eeldused

Pilveadministraator koos an AWS-i konto järgmiste eeltingimuste täitmiseks on vajalik asjakohaste lubadega:

Juurutage an Amazon SageMaker Juhiseid vt Sisseehitatud Amazon SageMakeri domeeniga.
Juurutage Canvas. Juhiseid vt Amazon SageMaker Canvase seadistamine ja haldamine (IT-administraatoritele).
Konfigureerige lõuendi jaoks päritoluülese ressursside jagamise (CORS) poliitikad. Juhiseid vt Andke oma kasutajatele võimalus kohalikke faile üles laadida.

Looge klientide lahkumise mudel

Kõigepealt laadime alla churn andmekogum ja vaadake fail üle, veendumaks, et kõik andmed on seal. Seejärel tehke järgmised sammud.

Logige sisse AWS-i juhtimiskonsool, kasutades kontot, millel on Canvasele juurdepääsuks vajalikud õigused.
Logige sisse Canvas-konsooli.

Siin saame hallata oma andmekogumeid ja luua mudeleid.

Vali Import.

Lõuendi importimise nupp Vali

Vali Täiendava Ja valige see churn.csv faili.
Vali Andmete importimine et see Canvasesse üles laadida.

Lõuendi valimine s3-st

Importimine võtab aega umbes 10 sekundit (see võib olenevalt andmestiku suurusest erineda). Kui see on valmis, näeme, et andmestik on sees Ready status.

Lõuendivalmis andmekogum

Andmestiku esimese 100 rea eelvaate kuvamiseks hõljutage kursorit silmaikooni kohal.

Lõuendivaate andmekogum

Ilmub andmestiku eelvaade. Siin saame kontrollida, kas meie andmed on õiged.

Lõuend Kinnitage andmed

Kui oleme kinnitanud, et imporditud andmestik on valmis, loome oma mudeli.

Vali Uus mudel.

Lõuend Uued mudelid

Valige andmestik churn.csv ja tehke valik Valige andmekogum.

Lõuend Valige andmekogum

Nüüd konfigureerime ehitusmudeli protsessi.

eest Sihtveerud, Vali Churn? kolonni.

eest Mudelitüüp, Sel juhul soovitab Canvas automaatselt mudelitüüpi 2 kategooria ennustus (mida andmeteadlane nimetaks binaarseks klassifikatsiooniks). See sobib meie kasutusjuhtumiks, kuna meil on ainult kaks võimalikku ennustusväärtust: True or False, seega lähtume soovitusest Lõuend tehtud.

Lõuendi ehitusmudel

Nüüd kinnitame mõned eeldused. Soovime saada kiire ülevaate sellest, kas meie sihtveergu saab teiste veergude järgi ennustada. Saame kiire ülevaate mudeli hinnangulisest täpsusest ja veeru mõjust (iga veeru hinnanguline tähtsus sihtveeru ennustamisel).

Valige kõik 21 veergu ja valige Mudeli eelvaade.

See funktsioon kasutab meie andmestiku alamhulka ja modelleerimisel ainult ühte läbimist. Meie kasutusjuhul kulub eelvaatemudeli loomiseks umbes 2 minutit.

Lõuendi eelvaate mudel

Nagu on näidatud järgmisel ekraanipildil, Phone ja State veerud mõjutavad meie ennustust palju vähem. Soovime tekstisisestuse eemaldamisel olla ettevaatlikud, kuna see võib sisaldada olulisi diskreetseid, kategoorilisi funktsioone, mis aitavad meie ennustusi. Siin on telefoninumber lihtsalt samaväärne kontonumbriga – see ei oma väärtust teiste kontode katkemise tõenäosuse ennustamisel ja kliendi olek ei mõjuta meie mudelit kuigi palju.

Eemaldame need veerud, kuna neil pole olulist funktsiooni tähtsust.
Pärast seda, kui oleme eemaldanud Phone ja State veergudes, käivitame eelvaate uuesti.

Nagu on näidatud järgmisel ekraanipildil, suurenes mudeli täpsus 0.1%. Meie eelvaatemudeli hinnanguline täpsus on 95.9% ja suurima mõjuga veerud on Night Calls, Eve Minsja Night Charge. See annab meile ülevaate sellest, millised veerud mõjutavad meie mudeli toimivust kõige rohkem. Siin peame funktsioonide valimisel olema ettevaatlikud, sest kui üks funktsioon mõjutab mudeli tulemust väga, on see esmane näitaja siht lekeja see funktsioon pole prognoosimise ajal saadaval. Sel juhul näitasid vähesed veerud väga sarnast mõju, seega jätkame oma mudeli loomist.

Lõuendi funktsioonide projekteerimine pärast

Canvas pakub kahte ehitusvalikut:

Standardne ehitus – Ehitab parima mudeli optimeeritud protsessist, mida toidab AutoML; kiirust vahetatakse suurima täpsuse vastu
Kiire ehitus – Ehitab mudeli tavalise ehitusega võrreldes murdosa ajast; potentsiaalne täpsus vahetatakse kiiruse vastu.

Selle postituse jaoks valime Standardne ehitus valik, sest soovime saada parimat mudelit ja oleme nõus kulutama lisaaega tulemuse ootamisele.

Lõuendi standardversioon

Ehitusprotsess võib kesta 2–4 tundi. Selle aja jooksul testib Canvas sadu kandidaatide torujuhtmeid, valides meile esitlemiseks parima mudeli. Järgmisel ekraanipildil näeme eeldatavat ehitamise aega ja edenemist.

Lõuendi analüüsi mudel

Hinnake mudeli jõudlust

Kui mudeli koostamise protsess on lõppenud, ennustas mudel 97.9% ajast katkemist. See tundub olevat hea, kuid analüütikutena tahame sukelduda sügavamale ja näha, kas saame usaldada mudelit selle põhjal otsuseid langetama. peal Hinded vahekaardil saame üle vaadata oma ennustuste visuaalse graafiku, mis on kaardistatud nende tulemustega. See võimaldab meil oma mudelist sügavama ülevaate.

Canvas jagab andmestiku treening- ja testikomplektideks. Treenimise andmestik on andmed, mida Canvas mudeli koostamiseks kasutab. Testikomplekti kasutatakse selleks, et näha, kas mudel toimib uute andmetega hästi. Järgmisel ekraanipildil olev Sankey diagramm näitab, kuidas mudel katsekomplektis toimis. Lisateabe saamiseks vaadake Oma mudeli jõudluse hindamine rakenduses Amazon SageMaker Canvas.

Üksikasjalikuma ülevaate saamiseks lisaks Sankey diagrammil kuvatule võivad ärianalüütikud kasutada a segaduse maatriks analüüs oma ärilahenduste jaoks. Näiteks tahame paremini mõista tõenäosust, et mudel teeb valeennustusi. Näeme seda Sankey diagrammil, kuid tahame rohkem teadmisi, seega valime Täpsemad mõõdikud. Meile esitatakse segadusmaatriks, mis kuvab mudeli toimivust visuaalses vormingus järgmiste väärtustega, mis on omased positiivsele klassile – me mõõdame selle põhjal, kas need ka tegelikult lakkavad, nii et meie positiivne klass on True selles näites:

Tõeliselt positiivne (TP) – arv True tulemused, mis olid õigesti ennustatud True
Tõeline negatiivne (TN) – arv False tulemused, mis olid õigesti ennustatud False
Valepositiivne (FP) – arv False tulemused, mis olid valesti ennustatud True
Valenegatiivne (FN) – arv True tulemused, mis olid valesti ennustatud False

Selle maatriksdiagrammi abil saame kindlaks teha mitte ainult selle, kui täpne meie mudel on, vaid ka selle, kui see on vale, kui sageli see võib juhtuda ja kuidas see on vale.

Lõuend F1 maatriks

Täpsemad mõõdikud näevad head välja. Võime mudeli tulemust usaldada. Me näeme väga vähe valepositiivseid ja valenegatiivseid tulemusi. Need on siis, kui mudel arvab, et andmestikus olev klient loobub ja tegelikult mitte (valepositiivne) või kui mudel arvab, et klient loobub ja ta seda tegelikult teeb (valenegatiivne). Kõrged numbrid kummagi puhul võivad panna meid rohkem mõtlema, kas saame mudelit otsuste tegemiseks kasutada.

Läheme tagasi Ülevaade iga veeru mõju ülevaatamiseks. See teave võib aidata turundusmeeskonnal saada teadmisi, mis viivad meetmete võtmiseni klientide vähenemise vähendamiseks. Näiteks näeme, et nii madal kui kõrge CustServ Calls suurendada vajumise tõenäosust. Turundusmeeskond saab nende teadmiste põhjal võtta meetmeid, et vältida klientide vähenemist. Näited hõlmavad veebisaitidel üksikasjalike KKK-de loomist, et vähendada klienditeeninduskõnede arvu, ja KKK-de kaudu klientidega harivaid kampaaniaid, mis aitavad kaasat hoida.

Meie mudel näeb välja üsna täpne. Saame otse teha interaktiivse ennustuse Ennusta vahekaarti kas partii või ühe (reaalajas) prognoosina. Selles näites tegime teatud veergude väärtustes mõned muudatused ja tegime reaalajas prognoosi. Lõuend näitab meile ennustuse tulemust koos usaldustasemega.

Lõuendi ennustamine

Oletame, et meil on olemasolev klient, kes kasutab järgmist: Night Mins on 40 ja Eve Mins on 40. Saame teha ennustuse ja meie mudel annab usaldusskooriks 93.2%, mida see klient loobub (True). Võime nüüd selle kliendi hoidmiseks teha soodushindu.

Ühe ennustuse käivitamine sobib suurepäraselt individuaalseks mis-kui-analüüsiks, kuid me peame ennustusi käivitama ka paljude kirjete puhul korraga. Lõuend suudab käivitada partii ennustused, mis võimaldab teha ennustusi mastaapselt.

Järeldus

Selles postituses näitasime, kuidas ärianalüütik saab näidisandmete abil luua SageMaker Canvase abil klientide lahkumise mudeli. Canvas võimaldab teie ärianalüütikutel luua täpseid ML-mudeleid ja genereerida ennustusi, kasutades koodivaba visuaalset, osuta ja klõpsa liidest. Turundusanalüütik saab nüüd seda teavet kasutada sihitud säilitamiskampaaniate käitamiseks ja uute kampaaniastrateegiate kiiremaks testimiseks, mis vähendab klientide arvu vähenemist.

Analüütikud saavad selle viia järgmisele tasemele, jagades oma mudeleid andmeteadlaste kolleegidega. Andmeteadlased saavad vaadata Canvas mudelit Amazon SageMaker Studio, kus nad saavad uurida Canvas AutoML-i tehtud valikuid, kinnitada mudelitulemusi ja isegi mõne klõpsuga mudelit toota. See võib kiirendada ML-põhist väärtuse loomist ja aidata parandada paremaid tulemusi kiiremini.

Canvase kasutamise kohta lisateabe saamiseks vaadake Ehitamine, jagamine, juurutamine: kuidas ärianalüütikud ja andmeteadlased saavutavad koodita ML-i ja Amazon SageMaker Canvase abil kiiremini turule jõudmise aja. Lisateavet koodita lahendusega ML-mudelite loomise kohta vt Amazon SageMaker Canvase väljakuulutamine – visuaalne, koodita masinõppevõimalus ärianalüütikutele.

Teave Autor

Henry Robalino on lahenduste arhitekt AWSis, mis asub NJ-st. Ta on kirglik pilve- ja masinõppe vastu ning nende rollist ühiskonnas. Ta saavutab selle, töötades klientidega, et aidata neil AWS-i pilve abil oma ärieesmärke saavutada. Väljaspool tööd võite leida Henry reisimas või koos oma karvase tütre Arlyga õues avastamas.

Ennustage klientide vähenemist koodita masinõppega, kasutades Amazon SageMaker Canvas PlatoBlockchain Data Intelligence'i. Vertikaalne otsing. Ai. Chaoran Wang on lahenduse arhitekt AWS-is, mis asub Dallases, TX. Ta on töötanud AWSis alates Dallase Texase ülikooli lõpetamisest 2016. aastal arvutiteaduse magistrikraadiga. Chaoran aitab klientidel luua skaleeritavaid, turvalisi ja kulutõhusaid rakendusi ning leida lahendusi oma äriprobleemide lahendamiseks AWS-i pilves. Väljaspool tööd armastab Chaoran veeta aega oma pere ja kahe koera, Biubiu ja Cocoga.