Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services

Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services

Olemme iloisia voidessamme ilmoittaa Amazon DocumentDB (MongoDB-yhteensopivuuden kanssa) integraatio Amazon SageMaker Canvas, jonka avulla Amazon DocumentDB -asiakkaat voivat rakentaa ja käyttää generatiivisia tekoäly- ja koneoppimisratkaisuja ilman koodin kirjoittamista. Amazon DocumentDB on täysin hallittu natiivi JSON-dokumenttitietokanta, joka tekee kriittisten dokumenttien työkuormien käyttämisestä yksinkertaista ja kustannustehokasta käytännössä missä tahansa mittakaavassa ilman infrastruktuurin hallintaa. Amazon SageMaker Canvas on kooditon ML-työtila, joka tarjoaa käyttövalmiita malleja, mukaan lukien perusmallit, ja mahdollisuuden valmistella tietoja sekä rakentaa ja ottaa käyttöön mukautettuja malleja.

Tässä viestissä keskustelemme siitä, kuinka Amazon DocumentDB:hen tallennetut tiedot tuodaan SageMaker Canvasiin ja miten niitä käytetään ML-mallien rakentamiseen ennustavaa analytiikkaa varten. Luomatta ja ylläpitämättä tietoputkia, voit käyttää ML-malleja Amazon DocumentDB:hen tallennetuilla jäsentymättömillä tiedoillasi.

Ratkaisun yleiskatsaus

Otetaanpa elintarvikkeiden toimitusyrityksen liiketoimintaanalyytikon rooli. Mobiilisovelluksesi tallentaa tietoja ravintoloista Amazon DocumentDB:hen skaalautuvuuden ja joustavien malliominaisuuksien vuoksi. Haluat kerätä näkemyksiä näistä tiedoista ja rakentaa ML-mallin ennustaaksesi, kuinka uudet ravintolat luokitellaan, mutta sinun on haastavaa suorittaa analytiikkaa jäsentelemättömälle datalle. Kohtaat pullonkauloja, koska sinun täytyy luottaa tietotekniikan ja datatieteen ryhmiin näiden tavoitteiden saavuttamiseksi.

Tämä uusi integraatio ratkaisee nämä ongelmat helpottamalla Amazon DocumentDB -tietojen tuomista SageMaker Canvasiin ja aloittamalla välittömästi tietojen valmistelun ja analysoinnin ML:ää varten. Lisäksi SageMaker Canvas poistaa riippuvuuden ML-asiantuntemuksesta korkealaatuisten mallien rakentamisessa ja ennusteiden luomisessa.

Osoitamme, kuinka Amazon DocumentDB -tietoja käytetään ML-mallien rakentamiseen SageMaker Canvasissa seuraavissa vaiheissa:

  1. Luo Amazon DocumentDB -liitin SageMaker Canvasissa.
  2. Analysoi dataa generatiivisen tekoälyn avulla.
  3. Valmistele dataa koneoppimista varten.
  4. Rakenna malli ja luo ennusteita.

Edellytykset

Voit ottaa tämän ratkaisun käyttöön täyttämällä seuraavat edellytykset:

  1. Hanki AWS Cloud -järjestelmänvalvojan käyttöoikeus AWS-henkilöllisyyden ja käyttöoikeuksien hallinta (MINÄ OLEN) lähettämä integroinnin suorittamiseen vaadittavat oikeudet.
  2. Viimeistele ympäristön asetukset käyttämällä AWS-pilven muodostuminen jommallakummalla seuraavista vaihtoehdoista:
    1. Ota CloudFormation-malli käyttöön uuteen VPC:hen – Tämä vaihtoehto rakentaa uuden AWS-ympäristön, joka koostuu VPC:stä, yksityisistä aliverkoista, suojausryhmistä, IAM-suoritusrooleista, Amazon Cloud 9, vaaditut VPC-päätepisteetja SageMaker-verkkotunnus. Sitten se ottaa käyttöön Amazon DocumentDB:n tähän uuteen VPC:hen. Lataa sapluuna tai käynnistä CloudFormation-pino nopeasti valitsemalla Käynnistä pino:
      Käynnistä CloudFormation-pino
    2. Ota CloudFormation-malli käyttöön olemassa olevaan VPC:hen – Tämä vaihtoehto luo vaaditut VPC-päätepisteet, IAM-suoritusroolit ja SageMaker-toimialueen olemassa olevaan VPC:hen, jossa on yksityiset aliverkot. Lataa sapluuna tai käynnistä CloudFormation-pino nopeasti valitsemalla Käynnistä pino:
      Käynnistä CloudFormation-pino

Huomaa, että jos olet luomassa uutta SageMaker-toimialuetta, sinun on määritettävä toimialue yksityiseen VPC:hen ilman Internet-yhteyttä, jotta voit lisätä liittimen Amazon DocumentDB:hen. Lisätietoja saat osoitteesta Määritä Amazon SageMaker Canvas VPC:ssä ilman Internet-yhteyttä.

  1. Seuraa oppitunti ladata näyteravintolatietoja Amazon DocumentDB:hen.
  2. Lisää pääsy Amazon Bedrockiin ja sen sisällä olevaan Anthropic Claude -malliin. Katso lisätietoja Lisää mallin käyttöoikeus.

Luo Amazon DocumentDB -liitin SageMaker Canvasissa

Kun olet luonut SageMaker-verkkotunnuksesi, suorita seuraavat vaiheet:

  1. Valitse Amazon DocumentDB -konsolissa Kooditon koneoppiminen navigointipaneelissa.
  2. Alle Valitse verkkotunnus ja profiili¸ valitse SageMaker-verkkotunnuksesi ja käyttäjäprofiilisi.
  3. Valita Käynnistä Canvas käynnistääksesi SageMaker Canvasin uudella välilehdellä.
    Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Kun SageMaker Canvas on latautunut, laskeudut sivulle Tietovirrat Tab.

  1. Valita luoda luodaksesi uuden tietovirran.
    Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.
  2. Anna tietovirtasi nimi ja valitse luoda.
  3. Lisää uusi Amazon DocumentDB-yhteys valitsemalla Tuo päivämäärät, valitse sitten Taulukko varten Tietojoukon tyyppi.
  4. On Tuo päivämäärät sivua varten Tietolähde, valitse AsiakirjaDB ja Lisää yhteys.
    Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.
  5. Anna yhteyden nimi, kuten demo, ja valitse haluamasi Amazon DocumentDB -klusteri.

Huomaa, että SageMaker Canvas esitäyttää avattavan valikon klustereilla samassa VPC:ssä kuin SageMaker-verkkotunnuksesi.

  1. Anna käyttäjänimi, salasana ja tietokannan nimi.
  2. Valitse lopuksi lukuasetus.

Ensisijaisten esiintymien suorituskyvyn suojaamiseksi SageMaker Canvasin oletusarvo on Toissijainen, mikä tarkoittaa, että se lukee vain toissijaisista esiintymistä. Kun lukuasetus on Toissijainen mieluiten, SageMaker Canvas lukee käytettävissä olevista toissijaisista ilmentymistä, mutta lukee ensisijaisesta ilmentymästä, jos toissijaista ilmentymää ei ole saatavilla. Lisätietoja Amazon DocumentDB -yhteyden määrittämisestä on kohdassa Yhdistä AWS:ään tallennettuun tietokantaan.

  1. Valita Lisää yhteys.
    Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Jos yhteys onnistuu, näet Amazon DocumentDB -tietokannassasi kokoelmat taulukoina.

  1. Vedä haluamasi taulukko tyhjälle kankaalle. Tätä viestiä varten lisäämme ravintolatietomme.

Ensimmäiset 100 riviä näytetään esikatseluna.

  1. Aloita tietojen analysointi ja valmistelu valitsemalla Tuo päivämäärät.
    Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.
  2. Anna tietojoukon nimi ja valitse Tuo päivämäärät.

Analysoi dataa generatiivisen tekoälyn avulla

Seuraavaksi haluamme saada näkemyksiä tiedoistamme ja etsiä malleja. SageMaker Canvas tarjoaa luonnollisen kielen käyttöliittymän tietojen analysointia ja valmistelua varten. Kun Päiväys välilehti latautuu, voit aloittaa keskustelun tietojesi kanssa seuraavilla vaiheilla:

  1. Valita Chat tietojen valmistelua varten.
    Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.
  2. Kerää oivalluksia tiedoistasi esittämällä kysymyksiä, kuten seuraavissa kuvakaappauksissa näytetyt esimerkit.
    Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Lisätietoja luonnollisen kielen käyttämisestä tietojen tutkimiseen ja valmisteluun on kohdassa Käytä luonnollista kieltä tutkiaksesi ja valmistellaksesi tietoja Amazon SageMaker Canvasin uudella ominaisuudella.

Saadaan syvempää käsitystä tietojemme laadusta käyttämällä SageMaker Canvas Data Quality and Insights -raporttia, joka arvioi automaattisesti tietojen laadun ja havaitsee poikkeavuudet.

  1. On analyysit välilehti, valitse Data Quality and Insights -raportti.
  2. Valita rating kohdesarakkeena ja Regressio ongelman tyypiksi ja valitse sitten luoda.

Tämä simuloi mallikoulutusta ja antaa oivalluksia siitä, kuinka voimme parantaa dataamme koneoppimista varten. Täydellinen raportti luodaan muutamassa minuutissa.

Raporttimme osoittaa, että 2.47 prosentilla tavoitteemme riveistä puuttuu arvoja – korjaamme sen seuraavassa vaiheessa. Lisäksi analyysi osoittaa, että address line 2, nameja type_of_food ominaisuuksilla on suurin ennustevoima tiedoissamme. Tämä osoittaa, että ravintolan perustiedoilla, kuten sijainnilla ja keittiöllä, voi olla suuri vaikutus arvioihin.

Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Valmistele dataa koneoppimista varten

SageMaker Canvas tarjoaa yli 300 sisäänrakennettua muunnosa tuotujen tietojen valmistelemiseksi. Lisätietoja SageMaker Canvasin muunnosominaisuuksista on kohdassa Valmistele tiedot edistyneillä muunnoksilla. Lisätään joitain muunnoksia, jotta tietomme ovat valmiita ML-mallin harjoittelua varten.

  1. Navigoi takaisin kohtaan Tietovirta -sivulle valitsemalla tietokulkusi nimen sivun yläreunasta.
  2. Valitse vieressä oleva plusmerkki Tietotyypit Ja valitse Lisää muunnos.
    Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.
  3. Valita Lisää vaihe.
  4. Nimetään uudelleen address line 2 sarake kohtaan cities.
    1. Valita Hallitse sarakkeita.
    2. Valita Nimeä sarake uudelleen varten Muuttaa.
    3. Valita address line 2 varten Syöttösarake, tulla sisään cities varten Uusi nimi, ja valitse Lisää.
      Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.
  5. Lisäksi voidaan pudottaa joitain tarpeettomia sarakkeita.
    1. Lisää uusi muunnos.
    2. varten Muuttaa, valitse Pudota sarake.
    3. varten Pudotettavat sarakkeet, valitse URL ja restaurant_id.
    4. Valita Lisää.
      Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.[
  6. Meidän rating ominaisuussarakkeesta puuttuu joitakin arvoja, joten täytetään nämä rivit tämän sarakkeen keskiarvolla.
    1. Lisää uusi muunnos.
    2. varten Muuttaa, valitse Impute.
    3. varten Sarakkeen tyyppi, valitse Numeerinen.
    4. varten Syötä sarakkeet, Valitse rating sarake.
    5. varten Imputointistrategia, valitse Mean.
    6. varten Tulos sarake, tulla sisään rating_avg_filled.
    7. Valita Lisää.
      Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.
  7. Voimme pudottaa rating sarakkeessa, koska meillä on uusi sarake, jossa on täytetyt arvot.
  8. Koska type_of_food on luonteeltaan kategorinen, haluamme koodata sen numeerisesti. Koodataan tämä ominaisuus käyttämällä one-hot-koodaustekniikkaa.
    1. Lisää uusi muunnos.
    2. varten Muuttaa, valitse Yksi kuuma koodaus.
    3. Valitse syöttösarakkeista type_of_food.
    4. varten Virheellinen käsittelystrategia¸ valitse Pitää.
    5. varten Tulostustyyli¸ valitse Pylväät.
    6. varten Tulos sarake, tulla sisään encoded.
    7. Valita Lisää.
      Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Rakenna malli ja luo ennusteita

Nyt kun olemme muuttaneet tietomme, koulutetaan numeerinen ML-malli ennustamaan ravintoloiden arvosanat.

  1. Valita Luo malli.
  2. varten Tietojoukon nimi, anna datajoukon viennin nimi.
  3. Valita Vie ja odota, että muunnetut tiedot viedään.
    Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.
  4. Valitse Luo malli linkki sivun vasemmassa alakulmassa.

Voit myös valita tietojoukon sivun vasemmalla olevasta Data Wrangler -ominaisuudesta.

Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

  1. Anna mallin nimi.
  2. Valita Ennakoiva analyysi, valitse sitten luoda.
  3. Valita rating_avg_filled kohdesarakkeena.

SageMaker Canvas valitsee automaattisesti sopivan mallityypin.

  1. Valita Esikatselu malli varmistaaksesi, että tietojen laatuongelmia ei ole.
  2. Valita Nopea rakentaa rakentaa malli.
    Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Mallin luominen kestää noin 2–15 minuuttia.

Voit tarkastella mallin tilaa, kun malli on suorittanut harjoittelun. Mallimme RSME on 0.422, mikä tarkoittaa, että malli ennustaa usein ravintolan arvosanan +/- 0.422 sisällä todellisesta arvosta, mikä on kiinteä likiarvo luokitusasteikolle 1–6.

Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

  1. Lopuksi voit luoda esimerkkiennusteita siirtymällä kohtaan Ennustaa Tab.
    Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Puhdistaa

Vältä tulevia maksuja poistamalla resurssit, jotka loit seuraamalla tätä viestiä. SageMaker Canvas laskuttaa sinua istunnon ajalta, ja suosittelemme kirjautumaan ulos SageMaker Canvasista, kun et käytä sitä. Viitata Kirjaudu ulos Amazon SageMaker Canvasista lisätietoja.

Yhteenveto

Tässä viestissä keskustelimme siitä, kuinka voit käyttää SageMaker Canvaa generatiiviseen tekoälyyn ja ML:ään Amazon DocumentDB:hen tallennetuilla tiedoilla. Esimerkissämme osoitimme, kuinka analyytikko voi nopeasti rakentaa korkealaatuisen ML-mallin käyttämällä esimerkkiravintolatietoaineistoa.

Näitimme vaiheet ratkaisun toteuttamiseksi tietojen tuomisesta Amazon DocumentDB:stä ML-mallin rakentamiseen SageMaker Canvasissa. Koko prosessi suoritettiin visuaalisen käyttöliittymän kautta kirjoittamatta yhtään koodiriviä.

Aloita alhaisen koodin/koodittoman ML-matkasi kohdasta Amazon SageMaker Canvas.


Tietoja kirjoittajista

Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Adeleke Coker on AWS:n globaali ratkaisuarkkitehti. Hän työskentelee asiakkaiden kanssa maailmanlaajuisesti tarjotakseen ohjausta ja teknistä apua tuotantotyökuormien käyttöönotossa AWS:ssä. Vapaa-ajallaan hän nauttii oppimisesta, lukemisesta, pelaamisesta ja urheilutapahtumien katsomisesta.

Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai. Gururaj S Bayari on vanhempi DocumentDB Specialist Solutions -arkkitehti AWS:ssä. Hän auttaa asiakkaita ottamaan käyttöön Amazonin tarkoitukseen rakennetut tietokannat. Hän auttaa asiakkaita suunnittelemaan, arvioimaan ja optimoimaan Internet-mittakaavansa ja korkean suorituskyvyn työkuormituksensa NoSQL- ja/tai relaatiotietokantojen avulla.

Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Tim Pusateri on vanhempi tuotepäällikkö AWS:ssä, jossa hän työskentelee Amazon SageMaker Canvasilla. Hänen tavoitteenaan on auttaa asiakkaita saamaan nopeasti arvoa AI/ML:stä. Työn ulkopuolella hän rakastaa olla ulkona, soittaa kitaraa, katsoa elävää musiikkia ja viettää aikaa perheen ja ystävien kanssa.

Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Pratik Das on AWS:n tuotepäällikkö. Hän nauttii työskentelystä asiakkaiden kanssa, jotka haluavat rakentaa kestäviä työkuormia ja vahvaa tietopohjaa pilveen. Hän tuo asiantuntemusta työskennellessä yritysten kanssa modernisointi-, analyyttis- ja datamuunnoshankkeissa.

Käytä Amazon DocumentDB:tä koodittomien koneoppimisratkaisujen rakentamiseen Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Varma Gottumukkala on AWS:n vanhempi tietokanta-asiantuntijaratkaisuarkkitehti Dallas Fort Worthista. Varma työskentelee asiakkaiden kanssa heidän tietokantastrategiassaan ja suunnittelee heidän työkuormituksensa AWS:n tarkoitukseen rakennetuilla tietokantoilla. Ennen liittymistään AWS:ään hän työskenteli laajasti relaatiotietokantojen, NOSQL-tietokantojen ja useiden ohjelmointikielien parissa viimeisen 22 vuoden ajan.

Aikaleima:

Lisää aiheesta AWS-koneoppiminen