Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazoni veebiteenused

Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazoni veebiteenused

Meil on hea meel teatada selle käivitamisest Amazon DocumentDB (ühilduv MongoDB-ga) integratsiooniga Amazon SageMakeri lõuend, mis võimaldab Amazon DocumentDB klientidel luua ja kasutada generatiivseid AI- ja masinõppe (ML) lahendusi ilma koodi kirjutamata. Amazon DocumentDB on täielikult hallatav natiivne JSON-dokumentide andmebaas, mis muudab kriitiliste dokumentide töökoormuse haldamise peaaegu igas mahus ilma infrastruktuuri haldamata lihtsaks ja kulutõhusaks. Amazon SageMaker Canvas on koodita ML-tööruum, mis pakub kasutusvalmis mudeleid, sealhulgas alusmudeleid, ning võimalust koostada andmeid ning koostada ja juurutada kohandatud mudeleid.

Selles postituses arutame, kuidas tuua Amazon DocumentDB-sse salvestatud andmed SageMaker Canvasisse ja kasutada neid andmeid ennustava analüüsi jaoks mõeldud ML-mudelite koostamiseks. Ilma andmekonveierite loomise ja hooldamiseta saate ML-mudeleid toita Amazon DocumentDB-sse salvestatud struktureerimata andmetega.

Lahenduse ülevaade

Oletame toidu kohaletoimetamise ettevõtte ärianalüütiku rolli. Teie mobiilirakendus salvestab selle skaleeritavuse ja paindlike skeemivõimaluste tõttu teavet restoranide kohta Amazon DocumentDB-s. Soovite koguda nende andmete kohta teadmisi ja koostada ML-mudeli, et ennustada, kuidas uusi restorane hinnatakse, kuid struktureerimata andmete põhjal on keeruline analüüsida. Te puutute kokku kitsaskohtadega, kuna peate nende eesmärkide saavutamiseks lootma andmetehnika ja andmeteaduse meeskondadele.

See uus integratsioon lahendab need probleemid, muutes Amazon DocumentDB andmete viimise SageMaker Canvasse lihtsaks ja alustades kohe andmete ettevalmistamist ja analüüsimist ML jaoks. Lisaks eemaldab SageMaker Canvas kvaliteetsete mudelite koostamiseks ja prognooside loomiseks sõltuvuse ML-teadmistest.

Näitame, kuidas kasutada Amazon DocumentDB andmeid ML-mudelite loomiseks SageMaker Canvasis järgmiste sammudega.

  1. Looge rakenduses SageMaker Canvas Amazon DocumentDB konnektor.
  2. Analüüsige andmeid generatiivse AI abil.
  3. Valmistage ette andmed masinõppe jaoks.
  4. Ehitage mudel ja looge ennustusi.

Eeldused

Selle lahenduse rakendamiseks täitke järgmised eeltingimused.

  1. Teil on AWS Cloudi administraatorijuurdepääs AWS-i identiteedi- ja juurdepääsuhaldus (AMI) kasutaja integreerimise lõpuleviimiseks vajalike lubadega.
  2. Lõpetage keskkonna seadistamine kasutades AWS CloudFormation ühe järgmistest valikutest:
    1. Juurutage CloudFormationi mall uude VPC-sse – See valik loob uue AWS-keskkonna, mis koosneb VPC-st, privaatsest alamvõrkudest, turvarühmadest, IAM-i täitmisrollidest, Amazoni pilv9, nõutavad VPC lõpp-punktidja SageMakeri domeen. Seejärel juurutab see uude VPC-sse Amazon DocumentDB. Laadige alla šabloon või kiirkäivitage CloudFormationi virn, valides Käivitage Stack:
      Käivitage CloudFormationi virn
    2. Juurutage olemasolevasse VPC-sse CloudFormationi mall – See suvand loob privaatsete alamvõrkudega olemasolevas VPC-s vajalikud VPC lõpp-punktid, IAM-i täitmisrollid ja SageMakeri domeen. Laadige alla šabloon või kiirkäivitage CloudFormationi virn, valides Käivitage Stack:
      Käivitage CloudFormationi virn

Pange tähele, et kui loote uue SageMakeri domeeni, peate konfigureerima domeeni privaatses VPC-s ilma Interneti-juurdepääsuta, et saaksite konnektori Amazon DocumentDB-sse lisada. Lisateabe saamiseks vaadake Seadistage Amazon SageMaker Canvas VPC-s ilma Interneti-ühenduseta.

  1. Järgi juhendaja restoraniandmete näidisandmete laadimiseks Amazon DocumentDB-sse.
  2. Lisage juurdepääs Amazon Bedrockile ja selles olevale Anthropic Claude'i mudelile. Lisateabe saamiseks vt Lisage juurdepääs mudelile.

Looge rakenduses SageMaker Canvas Amazon DocumentDB konnektor

Pärast SageMakeri domeeni loomist toimige järgmiselt.

  1. Amazon DocumentDB konsoolil valige Koodivaba masinõpe navigeerimispaanil.
  2. alla Valige domeen ja profiil¸ vali oma SageMakeri domeen ja kasutajaprofiil.
  3. Vali Käivitage Canvas et käivitada SageMaker Canvas uuel vahelehel.
    Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Kui SageMaker Canvas laadimise lõpetab, maandute lehele andmevoogude Tab.

  1. Vali Looma uue andmevoo loomiseks.
    Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.
  2. Sisestage oma andmevoo nimi ja valige Looma.
  3. Lisage uus Amazon DocumentDB ühendus, valides Andmete importimine, siis vali Tabel eest Andmestiku tüüp.
  4. Kohta Andmete importimine leht, jaoks Andmeallikas, vali DokumentDB ja Lisa ühendus.
    Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.
  5. Sisestage ühenduse nimi (nt demo) ja valige soovitud Amazon DocumentDB klaster.

Pange tähele, et SageMaker Canvas täidab rippmenüü klastritega, mis asuvad teie SageMakeri domeeniga samas VPC-s.

  1. Sisestage kasutajanimi, parool ja andmebaasi nimi.
  2. Lõpuks valige oma lugemiseelistus.

Esmaste eksemplaride jõudluse kaitsmiseks on SageMaker Canvas vaikimisi Kesk-, mis tähendab, et see loeb ainult teisestest eksemplaridest. Kui lugemise eelistus on Eelistatud sekundaarne, SageMaker Canvas loeb saadaolevatest teisestest eksemplaridest, kuid loeb esmasest eksemplarist, kui sekundaarne eksemplar pole saadaval. Lisateavet Amazon DocumentDB-ühenduse konfigureerimise kohta leiate veebisaidilt Ühendage AWS-is salvestatud andmebaasiga.

  1. Vali Lisage ühendus.
    Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Kui ühendus õnnestub, näete oma Amazon DocumentDB andmebaasis kogusid tabelitena.

  1. Lohistage oma valitud tabel tühjale lõuendile. Selle postituse jaoks lisame oma restorani andmed.

Esimesed 100 rida kuvatakse eelvaatena.

  1. Andmete analüüsimise ja ettevalmistamise alustamiseks valige Andmete importimine.
    Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.
  2. Sisestage andmestiku nimi ja valige Andmete importimine.

Analüüsige andmeid generatiivse AI abil

Järgmisena tahame saada oma andmetest ülevaadet ja otsida mustreid. SageMaker Canvas pakub loomuliku keele liidest andmete analüüsimiseks ja ettevalmistamiseks. Kui kuupäev Kui vahekaart laaditakse, saate oma andmetega vestelda järgmiste sammudega.

  1. Vali Vestlus andmete ettevalmistamiseks.
    Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.
  2. Koguge oma andmete kohta statistikat, esitades küsimusi, nagu on näidatud järgmistel ekraanipiltidel.
    Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Lisateavet selle kohta, kuidas kasutada loomulikku keelt andmete uurimiseks ja ettevalmistamiseks, vaadake Kasutage Amazon SageMaker Canvas'i uue võimalusega andmete uurimiseks ja ettevalmistamiseks loomulikku keelt.

Saagem oma andmete kvaliteedist sügavamalt aimu, kasutades SageMaker Canvas Data Quality and Insights aruannet, mis hindab automaatselt andmete kvaliteeti ja tuvastab kõrvalekalded.

  1. Kohta analüüsid valige vahekaart Andmekvaliteedi ja ülevaate aruanne.
  2. Vali rating sihtveerguna ja Regressioon kui probleemi tüüp, siis valige Looma.

See simuleerib mudelikoolitust ja annab ülevaate sellest, kuidas saaksime oma andmeid masinõppe jaoks täiustada. Täielik aruanne genereeritakse mõne minutiga.

Meie aruanne näitab, et 2.47%-l meie sihtmärgi ridadest on väärtused puuduvad – käsitleme seda järgmises etapis. Lisaks näitab analüüs, et address line 2, nameja type_of_food funktsioonidel on meie andmetes suurim ennustusjõud. See näitab, et restorani põhiteave, nagu asukoht ja köök, võib hinnanguid oluliselt mõjutada.

Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Valmistage ette andmed masinõppe jaoks

SageMaker Canvas pakub imporditud andmete ettevalmistamiseks üle 300 sisseehitatud teisenduse. Lisateavet SageMaker Canvase teisendusfunktsioonide kohta leiate aadressilt Valmistage ette andmed täpsemate teisendustega. Lisame mõned teisendused, et meie andmed oleksid ML-mudeli treenimiseks valmis.

  1. Navigeerige tagasi lehele Andmevoog lehele, valides lehe ülaosas oma andmevoo nime.
  2. Valige kõrval olev plussmärk Andmetüübid Ja vali Lisa teisendus.
    Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.
  3. Vali Lisa samm.
  4. Nimetame ümber address line 2 veerust kuni cities.
    1. Vali Veergude haldamine.
    2. Vali Nimeta veerg ümber eest Muutma.
    3. Vali address line 2 eest Sisestusveerg, sisenema cities eest Uus nimija vali lisama.
      Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.
  5. Lisaks laseb ära visata mõned mittevajalikud veerud.
    1. Lisage uus teisendus.
    2. eest Muutma, vali Langetage veerg.
    3. eest Veerud kukutamiseks, vali URL ja restaurant_id.
    4. Vali lisama.
      Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.[
  6. Meie rating funktsiooni veerus on mõned väärtused puudu, seega täidame need read selle veeru keskmise väärtusega.
    1. Lisage uus teisendus.
    2. eest Muutma, vali Impute.
    3. eest Veeru tüüp, vali Arv-.
    4. eest Sisestusveerud, Vali rating kolonni.
    5. eest Arvestusstrateegia, vali Keskmine.
    6. eest Väljundveerg, sisenema rating_avg_filled.
    7. Vali lisama.
      Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.
  7. Võime loobuda rating veerus, sest meil on uus täidetud väärtustega veerg.
  8. Sest type_of_food on oma olemuselt kategooriline, tahame selle numbriliselt kodeerida. Kodeerime selle funktsiooni one-hot kodeerimistehnikaga.
    1. Lisage uus teisendus.
    2. eest Muutma, vali Ühe kuuma kodeering.
    3. Sisendveergude jaoks valige type_of_food.
    4. eest Kehtetu käsitsemisstrateegia¸ vali hoidma.
    5. eest Väljundi stiil¸ vali Veerud.
    6. eest Väljundveerg, sisenema encoded.
    7. Vali lisama.
      Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Ehitage mudel ja looge ennustusi

Nüüd, kui oleme oma andmeid muutnud, treenime arvulist ML-mudelit, et ennustada restoranide hinnanguid.

  1. Vali Loo mudel.
  2. eest Andmestiku nimi, sisestage andmestiku ekspordi nimi.
  3. Vali Eksport ja oodake, kuni teisendatud andmed eksporditakse.
    Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.
  4. Vali Loo mudel link lehe vasakus alanurgas.

Andmestiku saate valida ka lehe vasakus servas olevast funktsioonist Data Wrangler.

Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

  1. Sisestage mudeli nimi.
  2. Vali Ennustav analüüs, siis vali Looma.
  3. Vali rating_avg_filled sihtveerguna.

SageMaker Canvas valib automaatselt sobiva mudelitüübi.

  1. Vali Mudeli eelvaade tagamaks, et andmete kvaliteediga pole probleeme.
  2. Vali Kiire ehitus mudeli ehitamiseks.
    Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Mudeli loomine võtab aega umbes 2–15 minutit.

Saate vaadata mudeli olekut pärast seda, kui modell on koolituse lõpetanud. Meie mudeli RSME on 0.422, mis tähendab, et mudel ennustab restorani hinnangut sageli +/- 0.422 piires tegelikust väärtusest, mis on kindel ligikaudne hinnang skaalal 1–6.

Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

  1. Lõpuks saate luua näidisennustusi, navigeerides lehele Ennusta Tab.
    Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Koristage

Edaspidiste tasude vältimiseks kustutage selle postituse jälgimise ajal loodud ressursid. SageMaker Canvas esitab teile arve seansi kestuse eest ja kui te seda ei kasuta, soovitame SageMaker Canvasist välja logida. Viitama Amazon SageMaker Canvasist väljalogimine rohkem üksikasju.

Järeldus

Selles postituses arutasime, kuidas saate Amazon DocumentDB-sse salvestatud andmetega kasutada SageMaker Canvast generatiivse AI ja ML jaoks. Meie näites näitasime, kuidas analüütik saab restorani näidisandmestiku abil kiiresti luua kvaliteetse ML-mudeli.

Näitasime lahenduse rakendamise samme, alates andmete importimisest Amazon DocumentDB-st kuni ML-mudeli loomiseni SageMaker Canvasis. Kogu protsess viidi lõpule visuaalse liidese kaudu ilma ühtegi koodirida kirjutamata.

Madala koodiga/koodita ML-teekonna alustamiseks vaadake jaotist Amazon SageMakeri lõuend.


Autoritest

Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Adeleke Coker on AWS-iga globaalsete lahenduste arhitekt. Ta teeb koostööd klientidega kogu maailmas, et pakkuda juhiseid ja tehnilist abi AWS-i tootmistöökoormuste ulatuslikul kasutuselevõtul. Vabal ajal meeldib talle õppida, lugeda, mängida ja spordiüritusi vaadata.

Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai. Gururaj S Bayari on AWS-i DocumentDB spetsialistlahenduste arhitekt. Talle meeldib aidata klientidel Amazoni selleks loodud andmebaase kasutusele võtta. Ta aitab klientidel kavandada, hinnata ja optimeerida oma Interneti-mahtu ja suure jõudlusega töökoormust, mis põhineb NoSQL-il ja/või relatsiooniandmebaasidel.

Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Tim Pusateri on AWS-i vanemtootejuht, kus ta töötab Amazon SageMaker Canvasel. Tema eesmärk on aidata klientidel AI/ML-ist kiiresti väärtust ammutada. Väljaspool tööd meeldib talle olla õues, mängida kitarri, vaadata elavat muusikat ning veeta aega pere ja sõpradega.

Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Pratik Das on AWS-i tootejuht. Talle meeldib töötada klientidega, kes soovivad luua pilves vastupidavat töökoormust ja tugevat andmebaasi. Ta toob kaasa oskusteavet ettevõtetega töötamiseks moderniseerimise, analüütiliste ja andmete teisendamise algatuste vallas.

Kasutage Amazon DocumentDB-d koodita masinõppelahenduste loomiseks rakenduses Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Varma Gottumukkala on Dallas Fort Worthist pärit AWS-i vanemandmebaasispetsialisti lahenduste arhitekt. Varma töötab klientidega nende andmebaasistrateegia kallal ja kujundab nende töökoormused AWS-i otstarbel ehitatud andmebaaside abil. Enne AWS-iga liitumist töötas ta viimase 22 aasta jooksul palju relatsiooniandmebaaside, NOSQL-i andmebaaside ja mitme programmeerimiskeelega.

Ajatempel:

Veel alates AWS-i masinõpe