Številne aplikacije, namenjene vzdrževanju industrijske opreme, spremljanju trgovine, upravljanju voznega parka in optimizaciji poti, so zgrajene z uporabo odprtokodnih API-jev Cassandra in gonilnikov za obdelavo podatkov pri visokih hitrostih in nizki zakasnitvi. Samostojno upravljanje tabel Cassandra je lahko dolgotrajno in drago. Amazon Keyspaces (za Apache Cassandra) omogoča nastavitev, zaščito in prilagajanje tabel Cassandra v oblaku AWS brez upravljanja dodatne infrastrukture.
V tej objavi vas bomo popeljali skozi storitve AWS, povezane z usposabljanjem modelov strojnega učenja (ML) z uporabo Amazon Keyspaces na visoki ravni, in podali navodila po korakih za vnos podatkov iz Amazon Keyspaces v Amazon SageMaker in usposabljanje modela, ki ga je mogoče uporabiti za poseben primer uporabe segmentacije strank.
AWS ima več storitev za pomoč podjetjem pri implementaciji procesov ML v oblaku.
AWS ML Stack ima tri plasti. V srednji plasti je SageMaker, ki razvijalcem, podatkovnim znanstvenikom in inženirjem ML omogoča izgradnjo, usposabljanje in uvajanje modelov ML v velikem obsegu. Odstrani zapletenost vsakega koraka delovnega toka ML, tako da lahko lažje uvedete svoje primere uporabe ML. To vključuje vse od prediktivnega vzdrževanja do računalniškega vida za napovedovanje vedenja strank. Stranke s SageMakerjem dosežejo do 10-krat večjo produktivnost podatkovnih znanstvenikov.
Apache Cassandra je priljubljena izbira za zelo zahtevne primere uporabe z nestrukturiranimi ali polstrukturiranimi podatki. Na primer, priljubljeno podjetje za dostavo hrane oceni čas dostave, maloprodajna stranka pa bi lahko pogosto uporabljala informacije iz kataloga izdelkov v zbirki podatkov Apache Cassandra. Amazon Keyspaces je razširljiva, zelo razpoložljiva in upravljana brezstrežniška storitev baze podatkov, združljiva z Apache Cassandra. Ni vam treba zagotavljati, popravljati ali upravljati strežnikov in ni vam treba namestiti, vzdrževati ali upravljati programske opreme. Tabele se lahko samodejno povečajo in zmanjšajo, plačate pa samo za vire, ki jih uporabljate. Amazon Keyspaces vam omogoča izvajanje delovnih obremenitev Cassandra na AWS z uporabo iste kode aplikacije Cassandra in orodij za razvijalce, ki jih uporabljate danes.
SageMaker ponuja zbirko vgrajeni algoritmi za pomoč podatkovnim znanstvenikom in praktikom ML pri hitrem začetku usposabljanja in uvajanja modelov ML. V tej objavi vam bomo pokazali, kako lahko maloprodajna stranka uporabi zgodovino nakupov strank v bazi podatkov Keyspaces in cilja na različne segmente strank za marketinške akcije.
K-pomeni je nenadzorovan učni algoritem. Poskuša najti diskretne skupine znotraj podatkov, kjer so člani skupine čim bolj podobni drug drugemu in čim bolj različni od članov drugih skupin. Vi definirate atribute, ki jih želite, da algoritem uporabi za določanje podobnosti. SageMaker uporablja spremenjeno različico algoritem za združevanje k-sredstev na spletni lestvici. V primerjavi s prvotno različico algoritma je različica, ki jo uporablja SageMaker, natančnejša. Vendar pa se, tako kot izvirni algoritem, prilagaja ogromnim naborom podatkov in zagotavlja izboljšave v času usposabljanja.
Pregled rešitev
Navodila predvidevajo, da bi za zagon kode uporabljali SageMaker Studio. Povezana koda je bila v skupni rabi na Vzorec AWS GitHub. Po navodilih v laboratoriju lahko naredite naslednje:
- Namestite potrebne odvisnosti.
- Povežite se z Amazon Keyspaces, ustvarite tabelo in vnesite vzorčne podatke.
- Zgradite klasifikacijski model ML z uporabo podatkov v Amazon Keyspaces.
- Raziščite rezultate modela.
- Očistite novo ustvarjene vire.
Ko končate, boste integrirali SageMaker z Amazon Keyspaces za usposabljanje modelov ML, kot je prikazano na naslednji sliki.
Zdaj lahko sledite navodila po korakih v tej objavi za vnos neobdelanih podatkov, shranjenih v Amazon Keyspaces, z uporabo SageMakerja in tako pridobljenih podatkov za obdelavo ML.
Predpogoji
Najprej pojdite na SageMaker.
Nato izberite, če SageMaker uporabljate prvič Odkrij več.
Nato izberite Nastavite domeno SageMaker.
Nato ustvarite nov uporabniški profil z Ime – sagemakeruserin izberite Ustvari novo vlogo v Privzeta izvršilna vloga pododdelek.
Nato na pojavnem zaslonu izberite katerega koli Preprosta storitev shranjevanja Amazon (Amazon S3) vedro in izberite Ustvari vlogo.
Ta vloga bo uporabljena v naslednjih korakih, da SageMakerju omogoči dostop do tabele Keyspaces Table z uporabo začasnih poverilnic iz vloge. To odpravlja potrebo po shranjevanju uporabniškega imena in gesla v beležnici.
Nato pridobite vlogo, povezano z sagemakeruser ki je bil ustvarjen v prejšnjem koraku iz razdelka s povzetkom.
Nato se pomaknite do Konzola AWS in poglej gor AWS Upravljanje identitete in dostopa (IAM). V IAM se pomaknite do Vloge. Znotraj Vloge poiščite izvršilno vlogo, identificirano v prejšnjem koraku.
Nato izberite vlogo, identificirano v prejšnjem koraku, in izberite Dodaj dovoljenja. V spustnem meniju, ki se prikaže, izberite Create Inline Policy. SageMaker vam omogoča zagotavljanje natančne ravni dostopa, ki omejuje, katera dejanja lahko izvaja uporabnik/aplikacija glede na poslovne zahteve.
Nato izberite zavihek JSON in kopirajte pravilnik iz razdelka Opomba v Githubu Stran. Ta pravilnik omogoča prenosniku SageMaker, da se poveže s prostori ključev in pridobi podatke za nadaljnjo obdelavo.
Nato znova izberite Dodaj dovoljenja in na spustnem seznamu izberite Priloži pravilnik.
Poiščite pravilnik AmazonKeyspacesFullAccess in izberite potrditveno polje poleg ujemajočega se rezultata ter izberite Priloži pravilnike.
Preverite, ali razdelek s pravilniki o dovoljenjih vključuje AmazonS3FullAccess
, AmazonSageMakerFullAccess
, AmazonKeyspacesFullAccess
, kot tudi na novo dodan vgrajeni pravilnik.
Nato se s konzolo AWS pomaknite do SageMaker Studio in izberite SageMaker Studio. Ko ste tam, izberite Zaženi aplikacijo in izberite Studio.
Prehod prek prenosnika
Najprimernejši način povezovanja s Keyspaces iz SageMaker Notebook je z uporabo Postopek AWS Signature različice 4 (SigV4) temeljijo Začasne poverilnice za avtentikacijo. V tem scenariju nam NI treba ustvariti ali shraniti poverilnic Keyspaces in lahko poverilnice uporabimo za preverjanje pristnosti z vtičnikom SigV4. Začasne varnostne poverilnice so sestavljene iz ID-ja ključa za dostop in skrivnega ključa za dostop. Vendar pa vključujejo tudi varnostni žeton, ki označuje, kdaj potečejo poverilnice. V tej objavi bomo ustvarili vlogo IAM in ustvarili začasne varnostne poverilnice.
Najprej namestimo gonilnik (cassandra-sigv4). Ta gonilnik vam omogoča dodajanje informacij za preverjanje pristnosti vašim zahtevam API z uporabo postopka AWS Signature Version 4 (SigV4). Z uporabo vtičnika lahko uporabnikom in aplikacijam zagotovite kratkoročne poverilnice za dostop do Amazon Keyspaces (za Apache Cassandra) z uporabo uporabnikov in vlog IAM. Po tem boste uvozili zahtevano potrdilo skupaj z dodatnimi odvisnostmi paketa. Na koncu boste prenosniku dovolili, da prevzame vlogo za pogovor s Keyspaces.
Nato se povežite z Amazon Keyspaces in preberite sistemske podatke iz Keyspaces v Pandas DataFrame, da potrdite povezavo.
Nato pripravite podatke za usposabljanje na naboru neobdelanih podatkov. V zvezku python, povezanem s to objavo, uporabite nabor maloprodajnih podatkov, prenesen iz tukaj, in ga obdelajte. Naš poslovni cilj glede na nabor podatkov je združiti stranke v skupine z uporabo posebnega metričnega klica RFM. Model RFM temelji na treh kvantitativnih dejavnikih:
- Nedavnost: Kako nedavno je stranka opravila nakup.
- Pogostost: kako pogosto kupec opravi nakup.
- Denarna vrednost: Koliko denarja stranka porabi za nakupe.
Analiza RFM številčno razvrsti stranko v vsako od teh treh kategorij, običajno na lestvici od 1 do 5 (višja kot je številka, boljši je rezultat). »Najboljša« stranka bi prejela najvišjo oceno v vsaki kategoriji. Uporabili bomo pandino funkcijo diskretizacije na osnovi kvantilov (qcut). Pomagal bo diskretizirati vrednosti v enako velika vedra na podlagi ali na podlagi vzorčnih kvantilov.
V tem primeru uporabljamo CQL za branje zapisov iz tabele Keyspace. V nekaterih primerih uporabe ML boste morda morali večkrat prebrati iste podatke iz iste tabele Keyspaces. V tem primeru vam priporočamo, da svoje podatke shranite v vedro Amazon S3, da se izognete dodatnim stroškibere iz Amazon Keyspaces. Odvisno od vašega scenarija lahko uporabite tudi Amazonski EMR do zaužiti zelo veliko datoteko Amazon S3 v SageMaker.
Nato urimo model ML z uporabo algoritma KMeans in poskrbimo, da so grozdi ustvarjeni. V tem posebnem scenariju bi videli, da so ustvarjene gruče natisnjene, kar kaže, da so bile stranke v naboru neobdelanih podatkov združene skupaj na podlagi različnih atributov v naboru podatkov. Te informacije o grozdu je mogoče uporabiti za ciljno usmerjene marketinške akcije.
(Izbirno) Nato shranimo segmente strank, ki jih je identificiral model ML, nazaj v tabelo Amazon Keyspaces za ciljno trženje. Paketno opravilo bi lahko prebralo te podatke in zagnalo ciljane kampanje za stranke v določenih segmentih.
Končno tudi mi očistite vire ustvarjeni med to vadnico, da se izognete dodatnim stroškom.
Dokončanje brisanja prostora ključev in tabel lahko traja od nekaj sekund do minute. Ko izbrišete prostor ključev, se izbrišejo prostor ključev in vse njegove tabele in prenehajo nabirati stroške zanje.
zaključek
Ta objava vam je pokazala, kako vnesti podatke o strankah iz Amazon Keyspaces v SageMaker in usposobiti model združevanja v gruče, ki vam je omogočil segmentiranje strank. Te informacije bi lahko uporabili za ciljno trženje in tako močno izboljšali svoj poslovni KPI. Če želite izvedeti več o Amazon Keyspaces, preglejte naslednje vire:
- Usposabljajte modele strojnega učenja z uporabo Amazon Keyspaces kot vira podatkov (SageMaker Notebook)
- Povežite se z Amazon Keyspaces z vašega namizja z uporabo IntelliJ, PyCharm ali DataGrip IDE
- Referenca jezika CQL za Amazon Keyspaces (za Apache Cassandra)
- Kako nastaviti dostop v ukazni vrstici do Amazon Keyspaces (za Apache Cassandra) z uporabo novega orodja za razvijalce Docker image
- Upravljanje identitete in dostopa za Amazon Keyspaces (za Apache Cassandra)
- Povezovanje z Amazon Keyspaces iz SageMaker z poverilnice, specifične za storitev
- Nedavnost, pogostost, denarna vrednost (RFM)
- Referenca kode Kaggle
O avtorjih
Vadim Ljahovič je višji arhitekt za rešitve pri AWS na območju zaliva San Francisco, ki strankam pomaga pri prehodu na AWS. Sodeluje z organizacijami, od velikih podjetij do majhnih startupov, da bi podprl njihove inovacije. Prav tako strankam pomaga oblikovati razširljive, varne in stroškovno učinkovite rešitve na AWS.
Parth Patel je arhitekt rešitev pri AWS na območju zaliva San Francisco. Parth usmerja stranke, da pospešijo njihovo pot v oblak in jim pomaga uspešno sprejeti oblak AWS. Osredotoča se na ML in posodobitev aplikacij.
Ram Pathangi je arhitekt rešitev pri AWS na območju zaliva San Francisco. Pomagal je strankam v kmetijstvu, zavarovalništvu, bančništvu, trgovini na drobno, zdravstveni negi in znanosti o življenju, gostinstvu in visokotehnoloških vertikalah pri uspešnem vodenju poslovanja v oblaku AWS. Specializiral se je za baze podatkov, analitiko in ML.
- Coinsmart. Najboljša evropska borza bitcoinov in kriptovalut.
- Platoblockchain. Web3 Metaverse Intelligence. Razširjeno znanje. PROST DOSTOP.
- CryptoHawk. Altcoin radar. Brezplačen preizkus.
- Vir: https://aws.amazon.com/blogs/machine-learning/train-machine-learning-models-using-amazon-keyspaces-as-a-data-source/
- '
- "
- &
- 10
- 100
- 9
- sposobnost
- O meni
- pospeši
- dostop
- natančna
- Doseči
- dejavnosti
- Dodatne
- Kmetijstvo
- naprej
- algoritem
- vsi
- Amazon
- Analiza
- analitika
- Še ena
- API
- API-ji
- aplikacija
- uporaba
- aplikacije
- OBMOČJE
- pozornosti
- lastnosti
- Preverjanje pristnosti
- samodejno
- Na voljo
- AWS
- Bančništvo
- zaliv
- Blog
- meja
- izgradnjo
- poslovni
- podjetja
- klic
- Kampanje
- ki
- primeri
- Kategorija
- potrdilo
- Stroški
- izbira
- Razvrstitev
- Cloud
- Koda
- v primerjavi z letom
- računalnik
- Connect
- povezava
- Konzole
- stroškovno učinkovito
- bi
- država
- ustvarjajo
- ustvaril
- Mandatno
- stranka
- Stranke, ki so
- datum
- nabor podatkov
- Baze podatkov
- baze podatkov
- daje
- dostava
- Odvisno
- razporedi
- uvajanja
- desktop
- Ugotovite,
- Razvojni
- Razvijalci
- drugačen
- Lučki delavec
- navzdol
- voznik
- Drop
- med
- enostavno
- Inženirji
- podjetja
- oprema
- ocene
- Primer
- izvedba
- dejavniki
- prva
- prvič
- FLET
- Osredotoča
- sledi
- po
- hrana
- Francisco
- funkcija
- nadalje
- splošno
- ustvarjajo
- pridobivanje
- GitHub
- zelo
- skupina
- Skupine
- Vodniki
- Zdravje
- Health Care
- pomoč
- pomoč
- visoka
- več
- zelo
- zgodovina
- Kako
- Kako
- Vendar
- HTTPS
- identiteta
- slika
- izvajati
- Izboljšanje
- izboljšanju
- vključujejo
- vključuje
- Indeks
- industrijske
- Podatki
- Infrastruktura
- novosti
- namestitev
- zavarovanje
- integrirana
- IT
- Job
- Potovanje
- Ključne
- lab
- jezik
- velika
- kosilo
- plast
- UČITE
- učenje
- Stopnja
- Life Sciences
- Poglej
- Zvest
- stroj
- strojno učenje
- je
- vzdrževati
- IZDELA
- upravljanje
- upravlja
- upravljanje
- upravljanje
- Trženje
- ogromen
- ujemanje
- člani
- ML
- Model
- modeli
- Denarno
- Denar
- spremljanje
- več
- Najbolj
- več
- potrebno
- prenosnik
- Številka
- deluje
- optimizacija
- organizacije
- Ostalo
- paket
- zlasti
- Geslo
- Patch
- Plačajte
- vključiti
- politike
- politika
- Popular
- mogoče
- potencial
- napovedati
- Pripravimo
- prejšnja
- Cena
- primarni
- Postopek
- Procesi
- obravnavati
- Izdelek
- produktivnost
- profil
- obetaven
- zagotavljajo
- zagotavlja
- nakup
- nakupi
- količinsko
- hitro
- obsegu
- Surovi
- reading
- prejeti
- Pred kratkim
- Priporočamo
- evidence
- zahteva
- obvezna
- Zahteve
- viri
- Rezultati
- Trgovina na drobno
- pregleda
- Tveganje
- vloga
- Pot
- Run
- San
- San Francisco
- SC
- razširljive
- Lestvica
- ZNANOSTI
- Znanstveniki
- Zaslon
- Iskalnik
- sekund
- zavarovanje
- varnost
- varnostni žeton
- Segment
- segmentacija
- segmentih
- Brez strežnika
- Storitev
- Storitve
- nastavite
- deli
- kratkoročno
- pokazale
- Podoben
- Enostavno
- spanje
- majhna
- So
- Software
- trdna
- rešitve
- nekaj
- specializirano
- sveženj
- začel
- Ustanavljanjem
- shranjevanje
- trgovina
- studio
- Uspešno
- podpora
- sistem
- sistemi
- Pogovor
- ciljna
- ciljno
- začasna
- O
- skozi
- čas
- krat
- danes
- skupaj
- žeton
- Orodje
- orodja
- vrh
- trgovini
- usposabljanje
- uporaba
- primeri uporabe
- Uporabniki
- vrednost
- različnih
- različica
- vertikale
- Vizija
- Kaj
- v
- brez
- deluje
- bi
- Vaša rutina za