Paljud tööstusseadmete hoolduseks, kaubanduse jälgimiseks, autopargi haldamiseks ja marsruudi optimeerimiseks mõeldud rakendused on loodud avatud lähtekoodiga Cassandra API-de ja draiverite abil, et töödelda andmeid suure kiiruse ja madala latentsusajaga. Cassandra laudade ise haldamine võib olla aeganõudev ja kulukas. Amazon Keyspaces (Apache Cassandra jaoks) võimaldab teil seadistada, kaitsta ja skaleerida Cassandra tabeleid AWS-i pilves ilma täiendavat infrastruktuuri haldamata.
Selles postituses tutvustame teile AWS-i teenuseid, mis on seotud masinõppe (ML) mudelite treenimisega kõrgel tasemel Amazon Keyspacesi kasutades, ja anname samm-sammult juhised andmete sisestamiseks Amazon Keyspacesist Amazon SageMaker ja mudeli väljaõpetamine, mida saab kasutada konkreetse kliendi segmenteerimise kasutusjuhu jaoks.
AWS-il on mitu teenust, mis aitavad ettevõtetel pilves ML-protsesse rakendada.
AWS ML Stackil on kolm kihti. Keskmises kihis on SageMaker, mis annab arendajatele, andmeteadlastele ja ML-inseneridele võimaluse luua, koolitada ja juurutada ML-mudeleid ulatuslikult. See eemaldab ML-i töövoo iga etapi keerukuse, et saaksite oma ML-i kasutusjuhtumeid hõlpsamini juurutada. See hõlmab kõike alates ennustavast hooldusest kuni arvutinägemiseni, et ennustada klientide käitumist. Kliendid parandavad SageMakeriga andmeteadlaste tootlikkust kuni 10 korda.
Apache Cassandra on populaarne valik struktureerimata või poolstruktureeritud andmetega raskete kasutusjuhtumite jaoks. Näiteks populaarne toidu kohaletoimetamise ettevõte hindab tarneaega ja jaeklient võib sageli jätkata Apache Cassandra andmebaasis oleva tootekataloogi teabe kasutamist. Amazoni võtmeruumid on skaleeritav, hästi kättesaadav ja hallatav serverita Apache Cassandraga ühilduv andmebaasiteenus. Teil ei ole vaja servereid varustada, paika panna ega hallata ning tarkvara installida, hooldada ega käitada. Tabeleid saab automaatselt suurendada ja vähendada ning maksate ainult kasutatavate ressursside eest. Amazon Keyspaces võimaldab teil käitada Cassandra töökoormust AWS-is, kasutades sama Cassandra rakenduse koodi ja arendaja tööriistu, mida kasutate täna.
SageMaker pakub komplekti sisseehitatud algoritmid aidata andmeteadlastel ja ML-i praktikutel kiiresti alustada koolitust ja ML-mudelite juurutamist. Selles postituses näitame teile, kuidas jaeklient saab kasutada võtmeruumide andmebaasis olevate klientide ostude ajalugu ja sihtida turunduskampaaniate jaoks erinevaid kliendisegmente.
K-tähendab on järelevalveta õppealgoritm. See püüab leida andmete seest diskreetseid rühmitusi, kus grupi liikmed on üksteisega võimalikult sarnased ja võimalikult erinevad teiste rühmade liikmetest. Saate määrata atribuudid, mida soovite, et algoritm kasutaks sarnasuse määramiseks. SageMaker kasutab modifitseeritud versiooni veebimastaapne k-keskmiste klasterdamisalgoritm. Algoritmi algversiooniga võrreldes on SageMakeri kasutatav versioon täpsem. Sarnaselt algsele algoritmile ulatub see aga suurte andmekogumiteni ja parandab treeninguaega.
Lahenduse ülevaade
Juhised eeldavad, et kasutaksite koodi käitamiseks SageMaker Studiot. Seotud koodi on jagatud AWS-i näidis GitHub. Järgides laboris antud juhiseid, saate teha järgmist.
- Installige vajalikud sõltuvused.
- Looge ühendus Amazon Keyspacesiga, looge tabel ja neelake näidisandmed.
- Looge Amazon Keyspaces olevate andmete põhjal klassifitseerimise ML-mudel.
- Uurige mudeli tulemusi.
- Puhastage vastloodud ressursse.
Kui olete lõpetanud, olete ML-mudelite koolitamiseks integreerinud SageMakeri Amazon Keyspacesiga, nagu on näidatud järgmisel pildil.
Nüüd saate järgida samm-sammult juhised selles postituses, et alla neelata Amazon Keyspacesis salvestatud töötlemata andmed, kasutades SageMakerit, ja sel viisil hangitud andmed ML-i töötlemiseks.
Eeldused
Esiteks navigeerige SageMakerisse.
Järgmiseks, kui kasutate SageMakerit esimest korda, valige Alustamine.
Järgmine vali Seadistage SageMakeri domeen.
Järgmisena looge uus kasutajaprofiil nimega - salveikasutajaja valige Loo uus roll aasta Vaikimisi täitmise roll alajaotis.
Järgmisena valige hüpikaknast mis tahes Amazon Simple Storage Service (Amazon S3) ämber ja valige Loo roll.
Seda rolli kasutatakse järgmistes etappides, et võimaldada SageMakeril juurdepääsu võtmeruumide tabelisse, kasutades rolli ajutisi mandaate. See välistab vajaduse salvestada märkmikusse kasutajanime ja parooli.
Järgmisena hankige funktsiooniga seotud roll salveikasutaja mis loodi eelmises etapis kokkuvõtte jaotisest.
Seejärel navigeerige lehele AWS-i konsool ja vaata üles AWS-i identiteedi- ja juurdepääsuhaldus (IAM). Liikuge IAM-is jaotisesse Rollid. Otsige jaotisest Rollid eelmises etapis tuvastatud täitmisrolli.
Järgmisena valige eelmises etapis tuvastatud roll ja valige Lisa õigused. Ilmuvas rippmenüüs valige Loo tekstisisene poliitika. SageMaker võimaldab teil pakkuda üksikasjalikku juurdepääsutaset, mis piirab seda, milliseid toiminguid kasutaja/rakendus ärinõuetest lähtuvalt teha saab.
Seejärel valige vahekaart JSON ja kopeerige reegel Githubi jaotisest Märkused lehekülg. See reegel võimaldab SageMakeri sülearvutil luua ühenduse võtmeruumidega ja hankida andmeid edasiseks töötlemiseks.
Seejärel valige uuesti ja rippmenüüst Lisa õigused ning seejärel käsk Manusta poliitika.
Otsige üles AmazonKeyspacesFullAccessi poliitika ja märkige vastava tulemuse kõrval olev märkeruut ja valige Manusta poliitikad.
Veenduge, et lubade eeskirjade jaotis sisaldab AmazonS3FullAccess
, AmazonSageMakerFullAccess
, AmazonKeyspacesFullAccess
, samuti äsja lisatud tekstisisesed eeskirjad.
Järgmisena navigeerige AWS-i konsooli abil SageMaker Studio ja valige SageMaker Studio. Kui olete seal, valige Käivita rakendus ja seejärel Studio.
Märkmiku tutvustus
Eelistatud viis SageMakeri sülearvutist Keyspacesiga ühenduse loomiseks on kasutada AWS-i allkirja versiooni 4 protsess (SigV4) põhineb Ajutised volikirjad autentimiseks. Selle stsenaariumi korral EI pea me Keyspacesi mandaate genereerima ega salvestama ning saame kasutada neid mandaate SigV4 pistikprogrammiga autentimiseks. Ajutised turbemandaadid koosnevad juurdepääsuvõtme ID-st ja salajasest juurdepääsuvõtmest. Kuid need sisaldavad ka turvamärki, mis näitab, millal mandaadid aeguvad. Selles postituses loome IAM-i rolli ja loome ajutised turbemandaadid.
Esiteks installime draiveri (cassandra-sigv4). See draiver võimaldab teil lisada oma API päringutele autentimisteavet, kasutades AWS-i allkirja versiooni 4 protsessi (SigV4). Pistikprogrammi abil saate anda kasutajatele ja rakendustele lühiajalisi mandaate, et pääseda juurde Amazon Keyspacesile (Apache Cassandra jaoks), kasutades IAM-i kasutajaid ja rolle. Pärast seda impordite nõutava sertifikaadi koos täiendavate paketisõltuvustega. Lõpuks lubate sülearvutil võtta endale võtmeruumiga rääkimise roll.
Järgmisena looge ühenduse kinnitamiseks ühendus Amazon Keyspacesiga ja lugege süsteemiandmeid Keyspacesist Pandas DataFrame'i.
Järgmisena valmistage andmed ette algandmete kogumi koolituseks. Kasutage selle postitusega seotud Pythoni märkmikus jaemüügiandmete kogumit, mis on alla laaditud aadressilt siinja töödelda seda. Meie ärieesmärk, arvestades andmekogumit, on koondada kliendid konkreetse mõõdiku kõne RFM-i abil. RFM-mudel põhineb kolmel kvantitatiivsel teguril:
- Hiljutine: kui hiljuti on klient ostu sooritanud.
- Sagedus: kui sageli klient ostu sooritab.
- Rahaline väärtus: kui palju raha klient ostudele kulutab.
RFM-analüüs järjestab kliendi numbriliselt kõigis nendes kolmes kategoorias, üldiselt skaalal 1 kuni 5 (mida suurem arv, seda parem tulemus). “Parim” klient saab igas kategoorias parima hinde. Kasutame pandade kvantiilipõhist diskreteerimisfunktsiooni (qcut). See aitab väärtusi diskretiseerida võrdse suurusega ämbriteks, mis põhinevad või põhinevad näidiskvantiilidel.
Selles näites kasutame võtmeruumi tabelist kirjete lugemiseks CQL-i. Mõnel ML-i kasutusjuhul peate võib-olla lugema samu andmeid samast Keyspaces tabelist mitu korda. Sel juhul soovitame teil salvestada oma andmed Amazon S3 ämbrisse, et vältida lisatehinguid hinds lugemine Amazon Keyspacesist. Sõltuvalt teie stsenaariumist võite ka kasutada Amazon EMR et neelama väga suur Amazon S3 fail SageMakerisse.
Järgmisena treenime KMeansi algoritmi kasutades ML-mudelit ja veendume, et klastrid on loodud. Selle konkreetse stsenaariumi korral näete, et loodud klastrid prinditakse, mis näitab, et algandmekogumi kliendid on rühmitatud andmekogumi erinevate atribuutide alusel. Seda klastri teavet saab kasutada suunatud turunduskampaaniate jaoks.
(Valikuline) Järgmisena salvestame ML-mudeliga tuvastatud kliendisegmendid tagasi Amazon Keyspacesi tabelisse sihitud turundamiseks. Paketttöö võib neid andmeid lugeda ja konkreetsetes segmentides klientidele sihitud kampaaniaid käitada.
Lõpuks, me ressursse puhastama selle õpetuse käigus loodud, et vältida lisatasusid.
Klahviruumi ja tabelite kustutamise lõpuleviimiseks võib kuluda mõni sekund kuni minut. Kui kustutate klahviruumi, kustutatakse klahviruum ja kõik selle tabelid ning te lõpetate nendelt tasude kogumise.
Järeldus
See postitus näitas teile, kuidas sisestada Amazon Keyspacesist kliendiandmeid SageMakerisse ja koolitada klasterdamismudelit, mis võimaldas teil kliente segmenteerida. Saate seda teavet kasutada sihipäraseks turunduseks, parandades seeläbi oluliselt oma ettevõtte KPI-d. Amazon Keyspacesi kohta lisateabe saamiseks vaadake üle järgmisi ressursse.
- Treenige masinõppe mudeleid, kasutades andmeallikana Amazoni võtmeruume (SageMakeri märkmik)
- Ühendage oma töölaualt Amazon Keyspacesiga IntelliJ, PyCharmi või DataGripi IDE-de abil
- CQL-i keeleviide Amazoni võtmeruumide jaoks (Apache Cassandra jaoks)
- Kuidas seadistada käsurea juurdepääsu Amazon Keyspacesile (Apache Cassandra jaoks), kasutades uut arendaja tööriistakomplekti Dockeri kujutist
- Amazon Keyspacesi identiteedi- ja juurdepääsuhaldus (Apache Cassandra jaoks)
- Ühenduse loomine Amazon Keyspacesiga rakendusest SageMaker teenusepõhised mandaadid
- Hiljutine, sagedus, rahaline väärtus (RFM)
- Kaggle koodi viide
Autoritest
Vadim Ljahhovitš on San Francisco lahe piirkonnas AWS-i vanemlahenduste arhitekt, kes aitab klientidel AWS-ile üle minna. Ta teeb koostööd organisatsioonidega alates suurettevõtetest kuni väikeste idufirmadeni, et toetada nende uuendusi. Samuti aitab ta klientidel luua AWS-is skaleeritavaid, turvalisi ja kulutõhusaid lahendusi.
Parth Patel on lahenduste arhitekt AWSis San Francisco lahe piirkonnas. Parth juhendab kliente oma pilveteekonda kiirendama ja aitab neil AWS-i pilve edukalt kasutusele võtta. Ta keskendub ML-ile ja rakenduste moderniseerimisele.
Ram Pathangi on lahenduste arhitekt AWSis San Francisco lahe piirkonnas. Ta on aidanud põllumajanduse, kindlustuse, panganduse, jaemüügi, tervishoiu ja bioteaduste, hotellinduse ja kõrgtehnoloogia vertikaalsete klientidel oma äri edukalt AWS-i pilves juhtida. Ta on spetsialiseerunud andmebaasidele, analüüsidele ja ML-ile.
- Münditark. Euroopa parim Bitcoini ja krüptobörs.
- Platoblockchain. Web3 metaversiooni intelligentsus. Täiustatud teadmised. TASUTA PÄÄS.
- CryptoHawk. Altcoini radar. Tasuta prooviversioon.
- Allikas: https://aws.amazon.com/blogs/machine-learning/train-machine-learning-models-using-amazon-keyspaces-as-a-data-source/
- '
- "
- &
- 10
- 100
- 9
- võime
- MEIST
- kiirendama
- juurdepääs
- täpne
- Saavutada
- meetmete
- Täiendavad lisad
- põllumajandus
- eespool
- algoritm
- Materjal: BPA ja flataatide vaba plastik
- Amazon
- analüüs
- analytics
- Teine
- API
- API-liidesed
- app
- taotlus
- rakendused
- PIIRKOND
- tähelepanu
- atribuudid
- Autentimine
- automaatselt
- saadaval
- AWS
- Pangandus
- laht
- Blogi
- piir
- ehitama
- äri
- ettevõtted
- helistama
- Kampaaniad
- mis
- juhtudel
- Kategooria
- sertifikaat
- koormuste
- valik
- klassifikatsioon
- Cloud
- kood
- võrreldes
- arvuti
- Võta meiega ühendust
- ühendus
- konsool
- kuluefektiivne
- võiks
- riik
- looma
- loodud
- volikiri
- klient
- Kliendid
- andmed
- andmekogum
- andmebaas
- andmebaasid
- annab
- tarne
- Olenevalt
- juurutada
- juurutamine
- lauaarvuti
- Määrama
- arendaja
- Arendajad
- erinev
- laevalaadija
- alla
- juht
- Drop
- ajal
- kergesti
- Inseneride
- ettevõtete
- seadmed
- hinnangul
- näide
- täitmine
- tegurid
- esimene
- Esimest korda
- FLEET
- keskendub
- järgima
- Järel
- toit
- Francisco
- funktsioon
- edasi
- üldiselt
- tekitama
- saamine
- GitHub
- suuresti
- Grupp
- Grupi omad
- juhendid
- Tervis
- Tervishoiuamet
- aitama
- aidates
- Suur
- rohkem
- kõrgelt
- ajalugu
- Kuidas
- Kuidas
- aga
- HTTPS
- Identity
- pilt
- rakendada
- paranemine
- Paranemist
- sisaldama
- hõlmab
- indeks
- tööstus-
- info
- Infrastruktuur
- uuendusi
- paigaldama
- kindlustus
- integreeritud
- IT
- töö
- teekond
- Võti
- labor
- keel
- suur
- algatama
- kiht
- Õppida
- õppimine
- Tase
- Maaülikooli
- Vaata
- Lojaalne
- masin
- masinõpe
- tehtud
- säilitada
- TEEB
- juhtima
- juhitud
- juhtimine
- juhtiv
- Turundus
- suur
- sobitamine
- liikmed
- ML
- mudel
- mudelid
- Rahaline
- raha
- järelevalve
- rohkem
- kõige
- mitmekordne
- vajalik
- märkmik
- number
- töötama
- optimeerimine
- organisatsioonid
- Muu
- pakend
- eriline
- Parool
- Plaaster
- Maksma
- plugin
- Poliitika
- poliitika
- populaarne
- võimalik
- potentsiaal
- ennustada
- Valmistama
- eelmine
- hind
- esmane
- protsess
- Protsessid
- töötlemine
- Toode
- tootlikkus
- profiil
- paljutõotav
- anda
- annab
- ostma
- Ostud
- kvantitatiivne
- kiiresti
- alates
- Töötlemata
- Lugemine
- saama
- hiljuti
- soovitama
- andmed
- Taotlusi
- nõutav
- Nõuded
- Vahendid
- Tulemused
- jaemüük
- läbi
- Oht
- Roll
- Marsruut
- jooks
- San
- San Francisco
- SC
- skaalautuvia
- Skaala
- TEADUSED
- teadlased
- Ekraan
- Otsing
- sekundit
- kindlustama
- turvalisus
- turvakoodi
- segment
- segmentatsioon
- segmendid
- Serverita
- teenus
- Teenused
- komplekt
- jagatud
- lühiajaline
- näidatud
- sarnane
- lihtne
- uni
- väike
- So
- tarkvara
- tahke
- Lahendused
- mõned
- spetsialiseerunud
- Kestab
- alustatud
- Alustavatel
- ladustamine
- salvestada
- stuudio
- Edukalt
- toetama
- süsteem
- süsteemid
- rääkima
- sihtmärk
- suunatud
- ajutine
- .
- Läbi
- aeg
- korda
- täna
- kokku
- sümboolne
- Käsiraamat
- töövahendid
- ülemine
- kaubelda
- koolitus
- kasutama
- kasutamise juhtumid
- Kasutajad
- väärtus
- eri
- versioon
- vertikaalid
- nägemus
- M
- jooksul
- ilma
- töö
- oleks
- Sinu