Monet teollisuuden laitteiden huoltoon, kaupan seurantaan, kaluston hallintaan ja reittioptimointiin tarkoitetut sovellukset on rakennettu avoimen lähdekoodin Cassandra API:illa ja ohjaimilla datan käsittelyyn suurilla nopeuksilla ja alhaisella viiveellä. Cassandra-pöytien hallinta itse voi olla aikaa vievää ja kallista. Amazon Keyspaces (Apache Cassandralle) voit määrittää, suojata ja skaalata Cassandra-taulukoita AWS-pilvessä ilman lisäinfrastruktuurin hallintaa.
Tässä viestissä opastamme sinut AWS-palveluiden läpi, jotka liittyvät koneoppimismallien (ML) koulutukseen käyttämällä Amazon Keyspaces -tekniikkaa korkealla tasolla, ja annamme vaiheittaiset ohjeet tietojen siirtämiseen Amazon Keyspacesistä Amazon Sage Maker ja kouluttaa malli, jota voidaan käyttää tietyssä asiakassegmentoinnin käyttötapauksessa.
AWS:llä on useita palveluita, jotka auttavat yrityksiä toteuttamaan ML-prosesseja pilvessä.
AWS ML Stackissa on kolme kerrosta. Keskikerroksessa on SageMaker, joka tarjoaa kehittäjille, datatieteilijöille ja ML-insinööreille mahdollisuuden rakentaa, kouluttaa ja ottaa käyttöön ML-malleja mittakaavassa. Se poistaa monimutkaisuuden ML-työnkulun jokaisesta vaiheesta, jotta voit helpommin ottaa käyttöön ML-käyttötapauksiasi. Tämä sisältää kaiken ennakoivasta ylläpidosta tietokonenäköön asiakkaiden käyttäytymisen ennustamiseen. Asiakkaat saavuttavat jopa 10-kertaisen parannuksen datatieteilijöiden tuottavuudessa SageMakerin avulla.
Apache Cassandra on suosittu valinta vaativiin käyttötapauksiin, joissa on jäsentämätöntä tai puolistrukturoitua dataa. Esimerkiksi suosittu elintarvikkeiden toimitusyritys arvioi toimitusajan, ja vähittäisasiakas voi jatkuvasti käyttää tuoteluettelotietoja Apache Cassandra -tietokannassa. Amazon Keyspaces on skaalautuva, erittäin saatavilla oleva ja hallittu palvelimeton Apache Cassandra -yhteensopiva tietokantapalvelu. Sinun ei tarvitse valmistaa, korjata tai hallita palvelimia, eikä sinun tarvitse asentaa, ylläpitää tai käyttää ohjelmistoja. Taulukot voivat skaalata ylös ja alas automaattisesti, ja maksat vain käyttämistäsi resursseista. Amazon Keyspacesin avulla voit suorittaa Cassandra-työkuormituksiasi AWS:ssä käyttämällä samaa Cassandra-sovelluskoodia ja kehittäjätyökaluja, joita käytät nykyään.
SageMaker tarjoaa sarjan sisäänrakennetut algoritmit auttaa datatieteilijöitä ja ML-harjoittajia aloittamaan ML-mallien koulutuksen ja käyttöönoton nopeasti. Tässä postauksessa näytämme sinulle, kuinka vähittäisasiakas voi käyttää asiakasostohistoriaa Keyspaces-tietokannassa ja kohdistaa eri asiakassegmentteihin markkinointikampanjoita.
K-välineiden on valvomaton oppimisalgoritmi. Se yrittää löytää tiedosta diskreettejä ryhmittymiä, joissa ryhmän jäsenet ovat mahdollisimman samankaltaisia keskenään ja mahdollisimman erilaisia muiden ryhmien jäsenistä. Voit määrittää attribuutit, joita haluat algoritmin käyttävän samankaltaisuuden määrittämiseen. SageMaker käyttää muokattua versiota web-mittakaavassa k-means klusterointialgoritmi. Algoritmin alkuperäiseen versioon verrattuna SageMakerin käyttämä versio on tarkempi. Alkuperäisen algoritmin tavoin se kuitenkin skaalautuu massiivisiin tietokokonaisuuksiin ja parantaa harjoitusaikaa.
Ratkaisun yleiskatsaus
Ohjeissa oletetaan, että käytät SageMaker Studiota koodin suorittamiseen. Liittynyt koodi on jaettu AWS-näyte GitHub. Noudattamalla laboratorion ohjeita voit tehdä seuraavaa:
- Asenna tarvittavat riippuvuudet.
- Muodosta yhteys Amazon Keyspacesiin, luo taulukko ja ota näytetiedot.
- Rakenna luokittelu ML-malli Amazon Keyspaces -sovelluksen tietojen avulla.
- Tutustu mallin tuloksiin.
- Puhdista uudet resurssit.
Kun olet valmis, olet integroinut SageMakerin Amazon Keyspacesiin ML-mallien kouluttamiseksi seuraavan kuvan mukaisesti.
Nyt voit seurata vaiheittaiset ohjeet tässä viestissä nielemään raakadataa, joka on tallennettu Amazon Keyspacesiin SageMakerin avulla, ja näin haetut tiedot ML-käsittelyä varten.
Edellytykset
Siirry ensin SageMakeriin.
Seuraavaksi, jos käytät SageMakeria ensimmäistä kertaa, valitse Aloita.
Valitse sitten Määritä SageMaker-verkkotunnus.
Luo seuraavaksi uusi käyttäjäprofiili nimellä Nimi – sagemaker-käyttäjä, ja valitse Luo uusi rooli vuonna Oletussuoritusrooli alaosasto.
Valitse seuraavaksi avautuvassa näytössä mikä tahansa Amazonin yksinkertainen tallennuspalvelu (Amazon S3) ämpäri ja valitse Luo rooli.
Tätä roolia käytetään seuraavissa vaiheissa, jotta SageMaker voi käyttää avainvälitaulukkoa roolin väliaikaisilla tunnistetiedoilla. Tämä eliminoi käyttäjänimen ja salasanan tallentamisen muistikirjaan.
Hae seuraavaksi rooliin liittyvä rooli sagemaker-käyttäjä joka luotiin edellisessä vaiheessa yhteenveto-osiosta.
Siirry sitten kohtaan AWS-konsoli ja katso ylös AWS Identity and Access Management (IAM). Siirry IAM:ssa Rooleihin. Etsi Rooleista edellisessä vaiheessa tunnistettu suoritusrooli.
Valitse seuraavaksi edellisessä vaiheessa tunnistettu rooli ja valitse Lisää käyttöoikeudet. Valitse näkyviin tulevasta avattavasta valikosta Luo sisäinen käytäntö. SageMakerin avulla voit tarjota yksityiskohtaisen käyttöoikeustason, joka rajoittaa sitä, mitä toimintoja käyttäjä/sovellus voi suorittaa liiketoiminnan vaatimusten perusteella.
Valitse sitten JSON-välilehti ja kopioi käytäntö Githubin Huomautus-osiosta sivulla. Tämän käytännön avulla SageMaker-muistikirja voi muodostaa yhteyden Keyspacesiin ja hakea tietoja jatkokäsittelyä varten.
Valitse sitten Lisää käyttöoikeudet uudelleen ja pudotusvalikosta ja valitse Liitä käytäntö.
Etsi AmazonKeyspacesFullAccess-käytäntö, valitse vastaavan tuloksen vieressä oleva valintaruutu ja valitse Liitä käytännöt.
Varmista, että käyttöoikeuskäytännöt-osio sisältää AmazonS3FullAccess
, AmazonSageMakerFullAccess
, AmazonKeyspacesFullAccess
, sekä äskettäin lisätty sisäinen käytäntö.
Siirry seuraavaksi SageMaker Studioon AWS-konsolin avulla ja valitse SageMaker Studio. Kun olet siellä, valitse Käynnistä sovellus ja valitse Studio.
Muistikirjan läpikäynti
Suosituin tapa muodostaa yhteys Keyspacesiin SageMaker Notebookista on käyttää AWS Signature Version 4 -prosessi (SigV4) perustua Väliaikaiset valtakirjat todennusta varten. Tässä skenaariossa meidän EI tarvitse luoda tai tallentaa Keyspaces-tunnistetietoja, ja voimme käyttää valtuustietoja todentamiseen SigV4-laajennuksella. Väliaikaiset suojaustunnukset koostuvat pääsyavaimen tunnuksesta ja salaisesta pääsyavaimesta. Ne sisältävät kuitenkin myös suojaustunnuksen, joka ilmoittaa, milloin valtuustiedot vanhenevat. Tässä viestissä luomme IAM-roolin ja luomme väliaikaiset suojaustunnukset.
Ensin asennamme ohjaimen (cassandra-sigv4). Tämän ohjaimen avulla voit lisätä todennustietoja API-pyyntöihisi käyttämällä AWS Signature Version 4 -prosessia (SigV4). Laajennuksella voit antaa käyttäjille ja sovelluksille lyhytaikaiset kirjautumistiedot Amazon Keyspaces -avaintiloihin (Apache Cassandralle) IAM-käyttäjiä ja rooleja käyttämällä. Tämän jälkeen tuot vaaditun varmenteen ja muita pakettiriippuvuuksia. Lopulta annat muistikirjan ottaa roolin puhua Keyspacesille.
Muodosta seuraavaksi yhteys Amazon Keyspacesiin ja lue järjestelmätiedot Keyspacesistä Pandas DataFrameen vahvistaaksesi yhteyden.
Valmistele seuraavaksi tiedot raakatietojoukon harjoittelua varten. Käytä tähän viestiin liittyvässä python-muistikirjassa vähittäismyyntitietojoukkoa, joka on ladattu osoitteesta tätäja käsittele se. Liiketoimintatavoitteemme tietojoukon perusteella on klusterioida asiakkaat tietyn metrikutsun RFM:n avulla. RFM-malli perustuu kolmeen kvantitatiiviseen tekijään:
- Viimeaikaisuus: kuinka äskettäin asiakas on tehnyt ostoksen.
- Toistuvuus: Kuinka usein asiakas tekee ostoksen.
- Rahallinen arvo: Kuinka paljon rahaa asiakas käyttää ostoksiin.
RFM-analyysi luokittelee asiakkaan numeerisesti kuhunkin näistä kolmesta kategoriasta, yleensä asteikolla 1-5 (mitä suurempi luku, sitä parempi tulos). "Paras" asiakas sai parhaan pistemäärän jokaisessa kategoriassa. Käytämme pandan kvantiilipohjaista diskretisointifunktiota (qcut). Se auttaa diskretisoimaan arvot samankokoisiin ryhmiin perustuen tai otoskvantiileihin perustuen.
Tässä esimerkissä käytämme CQL:ää lukemaan tietueita Keyspace-taulukosta. Joissakin ML-käyttötapauksissa saatat joutua lukemaan samat tiedot samasta Keyspaces-taulukosta useita kertoja. Tässä tapauksessa suosittelemme, että tallennat tietosi Amazon S3 -ämpäriin, jotta vältyt ylimääräisiltä maksaalukee Amazon Keyspacesistä. Skenaariostasi riippuen voit myös käyttää Amazonin EMR että nielemään erittäin suuri Amazon S3 -tiedosto SageMakeriin.
Seuraavaksi harjoittelemme ML-mallia KMeans-algoritmilla ja varmistamme, että klusterit on luotu. Tässä skenaariossa näet, että luodut klusterit tulostetaan, mikä osoittaa, että raakatietojoukon asiakkaat on ryhmitelty yhteen tietojoukon eri attribuuttien perusteella. Näitä klusterin tietoja voidaan käyttää kohdistetuissa markkinointikampanjoissa.
(Valinnainen) Tallennamme seuraavaksi ML-mallin tunnistamat asiakassegmentit takaisin Amazon Keyspaces -taulukkoon kohdennettua markkinointia varten. Erätyö voisi lukea nämä tiedot ja suorittaa kohdistettuja kampanjoita tietyissä segmenteissä oleville asiakkaille.
Viimeinkin me puhdistaa resurssit luotu tämän opetusohjelman aikana lisäkulujen välttämiseksi.
Avaintilan ja taulukoiden poistaminen saattaa kestää muutamasta sekunnista minuuttiin. Kun poistat avaintilan, avainavaruus ja kaikki sen taulukot poistetaan ja et enää kerää niistä kuluja.
Yhteenveto
Tämä viesti osoitti sinulle, kuinka voit siirtää asiakasdataa Amazon Keyspacesista SageMakeriin ja kouluttaa klusterimallin, jonka avulla voit segmentoida asiakkaita. Voit käyttää näitä tietoja kohdennettuun markkinointiin, mikä parantaa merkittävästi yrityksesi KPI:tä. Saat lisätietoja Amazon Keyspacesistä tutustumalla seuraaviin resursseihin:
- Harjoittele koneoppimismalleja käyttämällä tietolähteenä Amazon Keyspaces (SageMaker-muistikirja)
- Yhdistä Amazon Keyspacesiin työpöydältäsi käyttämällä IntelliJ-, PyCharm- tai DataGrip IDE:itä
- CQL-kieliviite Amazon Keyspacesille (Apache Cassandralle)
- Kuinka määrittää komentorivikäyttö Amazon Keyspacesille (Apache Cassandralle) käyttämällä uutta kehittäjän työkalupakkia Docker-kuvaa
- Identiteetti- ja käyttöoikeuksien hallinta Amazon Keyspacesille (Apache Cassandralle)
- Yhdistäminen Amazon Keyspacesiin SageMakerista käyttämällä palvelukohtaiset tunnistetiedot
- Äskettäisyys, toistuvuus, rahallinen arvo (RFM)
- Kaggle-koodin viite
Tietoja Tekijät
Vadim Lyakhovich on vanhempi ratkaisuarkkitehti AWS:ssä San Franciscon lahden alueella ja auttaa asiakkaita siirtymään AWS:ään. Hän työskentelee organisaatioiden kanssa suurista yrityksistä pieniin startupeihin tukeakseen niiden innovaatioita. Hän myös auttaa asiakkaita suunnittelemaan skaalautuvia, turvallisia ja kustannustehokkaita AWS-ratkaisuja.
Parth Patel on ratkaisuarkkitehti AWS:ssä San Franciscon lahden alueella. Parth opastaa asiakkaita nopeuttamaan matkaansa pilveen ja ottamaan AWS-pilven käyttöön onnistuneesti. Hän keskittyy ML:ään ja sovellusten modernisointiin.
Ram Pathangi on ratkaisuarkkitehti AWS:ssä San Franciscon lahden alueella. Hän on auttanut asiakkaita maatalouden, vakuutustoiminnan, pankkitoiminnan, vähittäiskaupan, terveydenhuollon ja biotieteiden, ravintola-alan ja korkean teknologian toimialoilla hoitamaan liiketoimintaansa menestyksekkäästi AWS-pilvessä. Hän on erikoistunut tietokantoihin, analytiikkaan ja ML:ään.
- Coinsmart. Euroopan paras Bitcoin- ja kryptopörssi.
- Platoblockchain. Web3 Metaverse Intelligence. Tietoa laajennettu. VAPAA PÄÄSY.
- CryptoHawk. Altcoinin tutka. Ilmainen kokeilu.
- Lähde: https://aws.amazon.com/blogs/machine-learning/train-machine-learning-models-using-amazon-keyspaces-as-a-data-source/
- '
- "
- &
- 10
- 100
- 9
- kyky
- Meistä
- kiihdyttää
- pääsy
- tarkka
- Saavuttaa
- toimet
- lisä-
- maatalous
- eteenpäin
- algoritmi
- Kaikki
- Amazon
- analyysi
- Analytics
- Toinen
- api
- API
- sovelluksen
- Hakemus
- sovellukset
- ALUE
- huomio
- attribuutteja
- Authentication
- automaattisesti
- saatavissa
- AWS
- Pankkitoiminta
- Lahti
- Uutiset ja media
- reunus
- rakentaa
- liiketoiminta
- yritykset
- soittaa
- Kampanjat
- joka
- tapauksissa
- Kategoria
- todistus
- maksut
- valinta
- luokittelu
- pilvi
- koodi
- verrattuna
- tietokone
- kytkeä
- liitäntä
- Console
- kustannustehokas
- voisi
- maa
- luoda
- luotu
- Valtakirja
- asiakas
- Asiakkaat
- tiedot
- tietojoukko
- tietokanta
- tietokannat
- Antaa
- toimitus
- Riippuen
- sijoittaa
- levityspinnalta
- pöytä-
- Määrittää
- Kehittäjä
- kehittäjille
- eri
- Satamatyöläinen
- alas
- kuljettaja
- Pudota
- aikana
- helposti
- Engineers
- yrityksille
- laitteet
- arviot
- esimerkki
- teloitus
- tekijät
- Etunimi
- ensimmäistä kertaa
- LAIVASTON
- keskittyy
- seurata
- jälkeen
- ruoka
- Francisco
- toiminto
- edelleen
- yleensä
- tuottaa
- saada
- GitHub
- suuresti
- Ryhmä
- Ryhmän
- Oppaat
- terveys
- Terveydenhuolto
- auttaa
- auttaa
- Korkea
- korkeampi
- erittäin
- historia
- Miten
- Miten
- Kuitenkin
- HTTPS
- Identiteetti
- kuva
- toteuttaa
- parannus
- parantaminen
- sisältää
- sisältää
- indeksi
- teollinen
- tiedot
- Infrastruktuuri
- innovaatiot
- asentaa
- vakuutus
- integroitu
- IT
- Job
- matka
- avain
- laboratorio
- Kieli
- suuri
- käynnistää
- kerros
- OPPIA
- oppiminen
- Taso
- Life Sciences
- katso
- uskollinen
- kone
- koneoppiminen
- tehty
- ylläpitää
- TEE
- hoitaa
- onnistui
- johto
- toimitusjohtaja
- Marketing
- massiivinen
- matching
- Jäsenet
- ML
- malli
- mallit
- Raha
- raha
- seuranta
- lisää
- eniten
- moninkertainen
- välttämätön
- muistikirja
- numero
- käyttää
- optimointi
- organisaatioiden
- Muut
- paketti
- erityinen
- Salasana
- läikkä
- Maksaa
- kytkeä
- politiikkaa
- politiikka
- Suosittu
- mahdollinen
- mahdollinen
- ennustaa
- Valmistella
- edellinen
- hinta
- ensisijainen
- prosessi
- Prosessit
- käsittely
- Tuotteet
- tuottavuus
- Profiili
- lupaava
- toimittaa
- tarjoaa
- osto
- ostot
- määrällinen
- nopeasti
- alainen
- raaka
- Lukeminen
- vastaanottaa
- äskettäin
- suositella
- asiakirjat
- pyynnöt
- tarvitaan
- vaatimukset
- Esittelymateriaalit
- tulokset
- vähittäiskauppa
- arviot
- Riski
- Rooli
- Reitti
- ajaa
- San
- San Francisco
- SC
- skaalautuva
- Asteikko
- tieteet
- tutkijat
- Näytön
- Haku
- sekuntia
- turvallinen
- turvallisuus
- turvallisuusmerkki
- segmentti
- jakautuminen
- segmentit
- serverless
- palvelu
- Palvelut
- setti
- yhteinen
- Lyhytaikainen
- esitetty
- samankaltainen
- Yksinkertainen
- nukkua
- pieni
- So
- Tuotteemme
- vankka
- Ratkaisumme
- jonkin verran
- erikoistunut
- pino
- alkoi
- Startups
- Levytila
- verkkokaupasta
- studio
- Onnistuneesti
- tuki
- järjestelmä
- järjestelmät
- Puhua
- Kohde
- kohdennettu
- tilapäinen
- -
- Kautta
- aika
- kertaa
- tänään
- yhdessä
- symbolinen
- työkalupakki
- työkalut
- ylin
- kauppaa
- koulutus
- käyttää
- Käytä koteloita
- Käyttäjät
- arvo
- eri
- versio
- pystysuunnassa
- visio
- Mitä
- sisällä
- ilman
- työskentely
- olisi
- Sinun