Klientide käitumise mõistmine on tänapäeval iga ettevõtte jaoks esmatähtis. Kasvatada tulusid, kui saate aru, miks ja kuidas kliendid ostavad. Kuid klientide kaotamine (mida nimetatakse ka klientide vähenemiseks) on alati risk ning teadmine, miks kliendid lahkuvad, võib olla tulude ja kasumi säilitamiseks sama oluline. Masinõpe (ML) võib aidata saada teadmisi, kuid seni vajasite ML-eksperte, et luua mudeleid, et ennustada mahajäämust, mille puudumine võib viivitada ettevõtete arvamuspõhiseid tegevusi klientide hoidmiseks.
Selles postituses näitame teile, kuidas ärianalüütikud saavad luua kliendihulga ML-mudeli Amazon SageMakeri lõuend, koodi pole vaja. Canvas pakub ärianalüütikutele visuaalset point-and-click liidest, mis võimaldab teil iseseisvalt mudeleid luua ja täpseid ML-ennustusi genereerida – ilma ML-i kogemust nõudmata või ühtki koodirida kirjutamata.
Ülevaade lahendusest
Selle postituse jaoks võtame endale mobiiltelefonioperaatori turundusosakonna turundusanalüütiku rolli. Meile on antud ülesandeks tuvastada kliendid, kellel on potentsiaalselt kuhjumise oht. Meil on juurdepääs teenuse kasutamise ja muudele klientide käitumise andmetele ning soovime teada, kas need andmed aitavad selgitada, miks klient lahkub. Kui suudame tuvastada tegurid, mis seletavad kaotust, saame prognoositava käitumise muutmiseks võtta parandusmeetmeid, näiteks korraldada sihitud säilitamiskampaaniaid.
Selleks kasutame andmeid, mis meil on CSV-failis, mis sisaldab infot klientide kasutuse ja kliendivahetuse kohta. Kasutame Canvast järgmiste toimingute tegemiseks:
- Importige eemaldamise andmestik kohast Amazoni lihtne salvestusteenus (Amazon S3).
- Treenige ja ehitage churn mudel.
- Analüüsige mudeli tulemusi.
- Testige ennustusi mudeliga.
Oma andmestiku jaoks kasutame a sünteetiline andmestik telekommunikatsiooni mobiiltelefoni operaatorilt. See näidisandmekogum sisaldab 5,000 kirjet, kus iga kirje kasutab kliendiprofiili kirjeldamiseks 21 atribuuti. Atribuudid on järgmised:
- riik – USA osariik, kus klient elab, tähistatud kahetähelise lühendiga; näiteks OH või NJ
- Konto pikkus – päevade arv, mil see konto on olnud aktiivne
- Piirkonna kood – Kliendi telefoninumbri kolmekohaline suunakood
- TELEFON – ülejäänud seitsmekohaline telefoninumber
- Rahvusvaheline plaan – kas kliendil on rahvusvaheliste kõnede plaan (jah/ei)
- VMaili plaan – kas kliendil on kõneposti funktsioon (jah/ei)
- VMaili sõnum – Kõnepostisõnumite keskmine arv kuus
- Päev min – päeva jooksul kasutatud kõneminutite koguarv
- Päevakõned – päeva jooksul tehtud kõnede koguarv
- Päevatasu – päevaste kõnede arveldatud maksumus
- Eve Mins, Eve helistab, Eve Charge – õhtuste kõnede arvelduskulud
- Öine min, Öised kõned, Öine tasu – Öiste kõnede arvelduskulud
- Rahvusvaheline min, Rahvusvahelised kõned, Rahvusvaheline tasu – rahvusvaheliste kõnede tasu
- CustServ kõned – Klienditeenindusse tehtud kõnede arv
- Kastma? – kas klient lahkus teenusest (tõene/vale)
Viimane atribuut, Churn?
, on atribuut, mida tahame, et ML-mudel ennustaks. Sihtatribuut on binaarne, mis tähendab, et meie mudel ennustab väljundit ühena kahest kategooriast (True
or False
).
Eeldused
Pilveadministraator koos an AWS-i konto järgmiste eeltingimuste täitmiseks on vajalik asjakohaste lubadega:
- Juurutage an Amazon SageMaker Juhiseid vt Sisseehitatud Amazon SageMakeri domeeniga.
- Juurutage Canvas. Juhiseid vt Amazon SageMaker Canvase seadistamine ja haldamine (IT-administraatoritele).
- Konfigureerige lõuendi jaoks päritoluülese ressursside jagamise (CORS) poliitikad. Juhiseid vt Andke oma kasutajatele võimalus kohalikke faile üles laadida.
Looge klientide lahkumise mudel
Kõigepealt laadime alla churn andmekogum ja vaadake fail üle, veendumaks, et kõik andmed on seal. Seejärel tehke järgmised sammud.
- Logige sisse AWS-i juhtimiskonsool, kasutades kontot, millel on Canvasele juurdepääsuks vajalikud õigused.
- Logige sisse Canvas-konsooli.
Siin saame hallata oma andmekogumeid ja luua mudeleid.
- Vali Import.
- Vali Täiendava Ja valige see
churn.csv
faili. - Vali Andmete importimine et see Canvasesse üles laadida.
Importimine võtab aega umbes 10 sekundit (see võib olenevalt andmestiku suurusest erineda). Kui see on valmis, näeme, et andmestik on sees Ready
status.
- Andmestiku esimese 100 rea eelvaate kuvamiseks hõljutage kursorit silmaikooni kohal.
Ilmub andmestiku eelvaade. Siin saame kontrollida, kas meie andmed on õiged.
Kui oleme kinnitanud, et imporditud andmestik on valmis, loome oma mudeli.
- Vali Uus mudel.
- Valige andmestik churn.csv ja tehke valik Valige andmekogum.
Nüüd konfigureerime ehitusmudeli protsessi.
- eest Sihtveerud, Vali
Churn?
kolonni.
eest Mudelitüüp, Sel juhul soovitab Canvas automaatselt mudelitüüpi 2 kategooria ennustus (mida andmeteadlane nimetaks binaarseks klassifikatsiooniks). See sobib meie kasutusjuhtumiks, kuna meil on ainult kaks võimalikku ennustusväärtust: True
or False
, seega lähtume soovitusest Lõuend tehtud.
Nüüd kinnitame mõned eeldused. Soovime saada kiire ülevaate sellest, kas meie sihtveergu saab teiste veergude järgi ennustada. Saame kiire ülevaate mudeli hinnangulisest täpsusest ja veeru mõjust (iga veeru hinnanguline tähtsus sihtveeru ennustamisel).
- Valige kõik 21 veergu ja valige Mudeli eelvaade.
See funktsioon kasutab meie andmestiku alamhulka ja modelleerimisel ainult ühte läbimist. Meie kasutusjuhul kulub eelvaatemudeli loomiseks umbes 2 minutit.
Nagu on näidatud järgmisel ekraanipildil, Phone
ja State
veerud mõjutavad meie ennustust palju vähem. Soovime tekstisisestuse eemaldamisel olla ettevaatlikud, kuna see võib sisaldada olulisi diskreetseid, kategoorilisi funktsioone, mis aitavad meie ennustusi. Siin on telefoninumber lihtsalt samaväärne kontonumbriga – see ei oma väärtust teiste kontode katkemise tõenäosuse ennustamisel ja kliendi olek ei mõjuta meie mudelit kuigi palju.
- Eemaldame need veerud, kuna neil pole olulist funktsiooni tähtsust.
- Pärast seda, kui oleme eemaldanud
Phone
jaState
veergudes, käivitame eelvaate uuesti.
Nagu on näidatud järgmisel ekraanipildil, suurenes mudeli täpsus 0.1%. Meie eelvaatemudeli hinnanguline täpsus on 95.9% ja suurima mõjuga veerud on Night Calls
, Eve Mins
ja Night Charge
. See annab meile ülevaate sellest, millised veerud mõjutavad meie mudeli toimivust kõige rohkem. Siin peame funktsioonide valimisel olema ettevaatlikud, sest kui üks funktsioon mõjutab mudeli tulemust väga, on see esmane näitaja siht lekeja see funktsioon pole prognoosimise ajal saadaval. Sel juhul näitasid vähesed veerud väga sarnast mõju, seega jätkame oma mudeli loomist.
Canvas pakub kahte ehitusvalikut:
- Standardne ehitus – Ehitab parima mudeli optimeeritud protsessist, mida toidab AutoML; kiirust vahetatakse suurima täpsuse vastu
- Kiire ehitus – Ehitab mudeli tavalise ehitusega võrreldes murdosa ajast; potentsiaalne täpsus vahetatakse kiiruse vastu.
- Selle postituse jaoks valime Standardne ehitus valik, sest soovime saada parimat mudelit ja oleme nõus kulutama lisaaega tulemuse ootamisele.
Ehitusprotsess võib kesta 2–4 tundi. Selle aja jooksul testib Canvas sadu kandidaatide torujuhtmeid, valides meile esitlemiseks parima mudeli. Järgmisel ekraanipildil näeme eeldatavat ehitamise aega ja edenemist.
Hinnake mudeli jõudlust
Kui mudeli koostamise protsess on lõppenud, ennustas mudel 97.9% ajast katkemist. See tundub olevat hea, kuid analüütikutena tahame sukelduda sügavamale ja näha, kas saame usaldada mudelit selle põhjal otsuseid langetama. peal Hinded vahekaardil saame üle vaadata oma ennustuste visuaalse graafiku, mis on kaardistatud nende tulemustega. See võimaldab meil oma mudelist sügavama ülevaate.
Canvas jagab andmestiku treening- ja testikomplektideks. Treenimise andmestik on andmed, mida Canvas mudeli koostamiseks kasutab. Testikomplekti kasutatakse selleks, et näha, kas mudel toimib uute andmetega hästi. Järgmisel ekraanipildil olev Sankey diagramm näitab, kuidas mudel katsekomplektis toimis. Lisateabe saamiseks vaadake Oma mudeli jõudluse hindamine rakenduses Amazon SageMaker Canvas.
Üksikasjalikuma ülevaate saamiseks lisaks Sankey diagrammil kuvatule võivad ärianalüütikud kasutada a segaduse maatriks analüüs oma ärilahenduste jaoks. Näiteks tahame paremini mõista tõenäosust, et mudel teeb valeennustusi. Näeme seda Sankey diagrammil, kuid tahame rohkem teadmisi, seega valime Täpsemad mõõdikud. Meile esitatakse segadusmaatriks, mis kuvab mudeli toimivust visuaalses vormingus järgmiste väärtustega, mis on omased positiivsele klassile – me mõõdame selle põhjal, kas need ka tegelikult lakkavad, nii et meie positiivne klass on True
selles näites:
- Tõeliselt positiivne (TP) – arv
True
tulemused, mis olid õigesti ennustatudTrue
- Tõeline negatiivne (TN) – arv
False
tulemused, mis olid õigesti ennustatudFalse
- Valepositiivne (FP) – arv
False
tulemused, mis olid valesti ennustatudTrue
- Valenegatiivne (FN) – arv
True
tulemused, mis olid valesti ennustatudFalse
Selle maatriksdiagrammi abil saame kindlaks teha mitte ainult selle, kui täpne meie mudel on, vaid ka selle, kui see on vale, kui sageli see võib juhtuda ja kuidas see on vale.
Täpsemad mõõdikud näevad head välja. Võime mudeli tulemust usaldada. Me näeme väga vähe valepositiivseid ja valenegatiivseid tulemusi. Need on siis, kui mudel arvab, et andmestikus olev klient loobub ja tegelikult mitte (valepositiivne) või kui mudel arvab, et klient loobub ja ta seda tegelikult teeb (valenegatiivne). Kõrged numbrid kummagi puhul võivad panna meid rohkem mõtlema, kas saame mudelit otsuste tegemiseks kasutada.
Läheme tagasi Ülevaade iga veeru mõju ülevaatamiseks. See teave võib aidata turundusmeeskonnal saada teadmisi, mis viivad meetmete võtmiseni klientide vähenemise vähendamiseks. Näiteks näeme, et nii madal kui kõrge CustServ Calls
suurendada vajumise tõenäosust. Turundusmeeskond saab nende teadmiste põhjal võtta meetmeid, et vältida klientide vähenemist. Näited hõlmavad veebisaitidel üksikasjalike KKK-de loomist, et vähendada klienditeeninduskõnede arvu, ja KKK-de kaudu klientidega harivaid kampaaniaid, mis aitavad kaasat hoida.
Meie mudel näeb välja üsna täpne. Saame otse teha interaktiivse ennustuse Ennusta vahekaarti kas partii või ühe (reaalajas) prognoosina. Selles näites tegime teatud veergude väärtustes mõned muudatused ja tegime reaalajas prognoosi. Lõuend näitab meile ennustuse tulemust koos usaldustasemega.
Oletame, et meil on olemasolev klient, kes kasutab järgmist: Night Mins
on 40 ja Eve Mins
on 40. Saame teha ennustuse ja meie mudel annab usaldusskooriks 93.2%, mida see klient loobub (True
). Võime nüüd selle kliendi hoidmiseks teha soodushindu.
Oletame, et meil on olemasolev klient, kes kasutab järgmist: Night Mins
on 40 ja Eve Mins
on 40. Saame teha ennustuse ja meie mudel annab usaldusskooriks 93.2%, mida see klient loobub (True
). Võime nüüd selle kliendi hoidmiseks teha soodushindu.
Ühe ennustuse käivitamine sobib suurepäraselt individuaalseks mis-kui-analüüsiks, kuid me peame ennustusi käivitama ka paljude kirjete puhul korraga. Lõuend suudab käivitada partii ennustused, mis võimaldab teha ennustusi mastaapselt.
Järeldus
Selles postituses näitasime, kuidas ärianalüütik saab näidisandmete abil luua SageMaker Canvase abil klientide lahkumise mudeli. Canvas võimaldab teie ärianalüütikutel luua täpseid ML-mudeleid ja genereerida ennustusi, kasutades koodivaba visuaalset, osuta ja klõpsa liidest. Turundusanalüütik saab nüüd seda teavet kasutada sihitud säilitamiskampaaniate käitamiseks ja uute kampaaniastrateegiate kiiremaks testimiseks, mis vähendab klientide arvu vähenemist.
Analüütikud saavad selle viia järgmisele tasemele, jagades oma mudeleid andmeteadlaste kolleegidega. Andmeteadlased saavad vaadata Canvas mudelit Amazon SageMaker Studio, kus nad saavad uurida Canvas AutoML-i tehtud valikuid, kinnitada mudelitulemusi ja isegi mõne klõpsuga mudelit toota. See võib kiirendada ML-põhist väärtuse loomist ja aidata parandada paremaid tulemusi kiiremini.
Canvase kasutamise kohta lisateabe saamiseks vaadake Ehitamine, jagamine, juurutamine: kuidas ärianalüütikud ja andmeteadlased saavutavad koodita ML-i ja Amazon SageMaker Canvase abil kiiremini turule jõudmise aja. Lisateavet koodita lahendusega ML-mudelite loomise kohta vt Amazon SageMaker Canvase väljakuulutamine – visuaalne, koodita masinõppevõimalus ärianalüütikutele.
Teave Autor
Henry Robalino on lahenduste arhitekt AWSis, mis asub NJ-st. Ta on kirglik pilve- ja masinõppe vastu ning nende rollist ühiskonnas. Ta saavutab selle, töötades klientidega, et aidata neil AWS-i pilve abil oma ärieesmärke saavutada. Väljaspool tööd võite leida Henry reisimas või koos oma karvase tütre Arlyga õues avastamas.
Chaoran Wang on lahenduse arhitekt AWS-is, mis asub Dallases, TX. Ta on töötanud AWSis alates Dallase Texase ülikooli lõpetamisest 2016. aastal arvutiteaduse magistrikraadiga. Chaoran aitab klientidel luua skaleeritavaid, turvalisi ja kulutõhusaid rakendusi ning leida lahendusi oma äriprobleemide lahendamiseks AWS-i pilves. Väljaspool tööd armastab Chaoran veeta aega oma pere ja kahe koera, Biubiu ja Cocoga.
- Münditark. Euroopa parim Bitcoini ja krüptobörs.
- Platoblockchain. Web3 metaversiooni intelligentsus. Täiustatud teadmised. TASUTA PÄÄS.
- CryptoHawk. Altcoini radar. Tasuta prooviversioon.
- Allikas: https://aws.amazon.com/blogs/machine-learning/predicting-customer-churn-with-no-code-machine-learning-using-amazon-sagemaker-canvas/
- "
- 000
- 10
- 100
- 11
- 2016
- 7
- 9
- MEIST
- kiirendama
- juurdepääs
- konto
- täpne
- meetmete
- Täiendavad lisad
- admin
- administraatorid
- edasijõudnud
- Materjal: BPA ja flataatide vaba plastik
- Amazon
- analüüs
- analüütik
- rakendused
- asjakohane
- umbes
- PIIRKOND
- atribuudid
- saadaval
- keskmine
- AWS
- BEST
- Peale
- suurim
- piir
- ehitama
- Ehitus
- Ehitab
- äri
- ettevõtted
- ostma
- helistama
- Kampaania
- Kampaaniad
- Saab
- kandidaat
- lõuend
- Kategooria
- kindel
- väljakutseid
- muutma
- tasu
- valikuid
- Vali
- klass
- klassifikatsioon
- Cloud
- kood
- kolleegidega
- Veerg
- võrreldes
- arvuti
- Arvutiteadus
- usaldus
- segadus
- konsool
- sisaldab
- jätkama
- kuluefektiivne
- võiks
- looma
- loomine
- loomine
- klient
- Kasutajatugi
- Kliendid
- Dallas
- andmed
- andmeteadlane
- sügavam
- viivitus
- Olenevalt
- juurutada
- üksikasjalik
- Määrama
- otse
- Näidikute
- Ei tee
- Käsitöö
- tegevus
- Inseneriteadus
- Hinnanguliselt
- näide
- olemasolevate
- oodatav
- kogemus
- ekspertide
- uurima
- silm
- tegurid
- pere
- FAQ
- KIIRE
- kiiremini
- tunnusjoon
- FUNKTSIOONID
- lõpp
- esimene
- Järel
- formaat
- tekitama
- Eesmärgid
- hea
- suur
- suurim
- Kasvama
- võttes
- aitama
- aitab
- siin
- Suur
- Kuidas
- HTTPS
- sajad
- ICON
- identifitseerima
- identifitseerimiseks
- mõju
- mõjuv
- tähtsus
- oluline
- paranenud
- sisaldama
- Suurendama
- kasvanud
- eraldi
- info
- sisend
- teadmisi
- interaktiivne
- Interface
- rahvusvaheliselt
- IT
- viima
- juhtivate
- Õppida
- õppimine
- Lahkuma
- Tase
- joon
- kohalik
- masin
- masinõpe
- tehtud
- peamine
- Tegemine
- juhtima
- juhtimine
- juhtiv
- Turundus
- meistrid
- maatriks
- tähendus
- Meetrika
- meeles
- ML
- mobiilne
- mobiiltelefon
- mudel
- mudelid
- rohkem
- kõige
- negatiivne
- number
- numbrid
- Pakkumised
- optimeeritud
- valik
- Valikud
- Muu
- väljas
- kirglik
- jõudlus
- mängima
- Poliitika
- positiivne
- võimalik
- potentsiaal
- ennustada
- ennustus
- Ennustused
- esitada
- ilus
- Eelvaade
- esmane
- protsess
- profiil
- kasum
- edendamine
- reklaam
- anda
- annab
- Kiire
- reaalajas
- soovitab
- rekord
- andmed
- vähendama
- ülejäänud
- eemaldades
- nõutav
- ressurss
- Tulemused
- Tulu
- tulu
- läbi
- Oht
- jooks
- jooksmine
- skaalautuvia
- Skaala
- teadus
- teadlane
- teadlased
- sekundit
- kindlustama
- teenus
- komplekt
- Jaga
- jagamine
- sarnane
- lihtne
- SUURUS
- So
- Ühiskond
- tahke
- lahendus
- Lahendused
- LAHENDAGE
- mõned
- kiirus
- kulutama
- Kulutused
- standard
- riik
- olek
- ladustamine
- strateegiad
- võtmine
- sihtmärk
- meeskond
- telekommunikatsioon
- test
- testid
- texas
- aeg
- täna
- ülemine
- koolitus
- Reisimine
- Usalda
- TX
- mõistma
- Ülikool
- us
- kasutama
- Kasutajad
- väärtus
- kontrollima
- vaade
- Hääl
- veebilehed
- M
- Mis on
- kas
- WHO
- Wikipedia
- Töö
- töö
- oleks