Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Spletne storitve Amazon

Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Spletne storitve Amazon

Z veseljem oznanjamo lansiranje Amazon DocumentDB (z združljivostjo z MongoDB) integracija s Amazon SageMaker Canvas, ki strankam Amazon DocumentDB omogoča izdelavo in uporabo generativnih rešitev AI in strojnega učenja (ML) brez pisanja kode. Amazon DocumentDB je v celoti upravljana izvorna zbirka dokumentov JSON, ki omogoča preprosto in stroškovno učinkovito upravljanje kritičnih delovnih obremenitev dokumentov v skoraj katerem koli obsegu brez upravljanja infrastrukture. Amazon SageMaker Canvas je delovni prostor ML brez kode, ki ponuja modele, pripravljene za uporabo, vključno z modeli temeljev, in zmožnostjo priprave podatkov ter gradnje in uvajanja modelov po meri.

V tej objavi razpravljamo o tem, kako prenesti podatke, shranjene v Amazon DocumentDB, v SageMaker Canvas in uporabiti te podatke za izdelavo modelov ML za napovedno analitiko. Brez ustvarjanja in vzdrževanja podatkovnih cevovodov boste lahko poganjali modele ML s svojimi nestrukturiranimi podatki, shranjenimi v Amazon DocumentDB.

Pregled rešitev

Prevzemimo vlogo poslovnega analitika za podjetje za dostavo hrane. Vaša mobilna aplikacija shranjuje informacije o restavracijah v Amazon DocumentDB zaradi svoje razširljivosti in prilagodljivih shem. Želite zbrati vpogled v te podatke in zgraditi model ML za napovedovanje, kako bodo ocenjene nove restavracije, vendar se vam zdi izziv izvajati analitiko na nestrukturiranih podatkih. Naletite na ozka grla, ker se morate za uresničitev teh ciljev zanesti na ekipe za podatkovno inženirstvo in podatkovno znanost.

Ta nova integracija rešuje te težave tako, da omogoča preprost prenos podatkov Amazon DocumentDB v SageMaker Canvas in takojšen začetek priprave in analize podatkov za ML. Poleg tega SageMaker Canvas odpravlja odvisnost od strokovnega znanja o ML za izdelavo visokokakovostnih modelov in ustvarjanje napovedi.

V naslednjih korakih prikazujemo, kako uporabiti podatke Amazon DocumentDB za izdelavo modelov ML v SageMaker Canvas:

  1. Ustvarite konektor Amazon DocumentDB v SageMaker Canvas.
  2. Analizirajte podatke z uporabo generativne umetne inteligence.
  3. Pripravite podatke za strojno učenje.
  4. Zgradite model in ustvarite napovedi.

Predpogoji

Za izvedbo te rešitve izpolnite naslednje predpogoje:

  1. Imejte skrbniški dostop do AWS Cloud z AWS upravljanje identitete in dostopa (JAZ SEM) uporabnik z dovoljenji, potrebnimi za dokončanje integracije.
  2. Dokončajte nastavitev okolja z uporabo Oblikovanje oblaka AWS prek ene od naslednjih možnosti:
    1. Razmestite predlogo CloudFormation v nov VPC – Ta možnost zgradi novo okolje AWS, ki ga sestavljajo VPC, zasebna podomrežja, varnostne skupine, izvajalske vloge IAM, Amazon Cloud9, zahtevane končne točke VPCin Domena SageMaker. Nato namesti Amazon DocumentDB v ta novi VPC. Prenesite Predloga ali hitro zaženite sklad CloudFormation tako, da izberete Izstrelite sklad:
      Zaženite sklad CloudFormation
    2. Razmestite predlogo CloudFormation v obstoječi VPC – Ta možnost ustvari zahtevane končne točke VPC, vloge izvajanja IAM in domeno SageMaker v obstoječem VPC z zasebnimi podomrežji. Prenesite Predloga ali hitro zaženite sklad CloudFormation tako, da izberete Izstrelite sklad:
      Zaženite sklad CloudFormation

Upoštevajte, da če ustvarjate novo domeno SageMaker, morate domeno konfigurirati tako, da bo v zasebnem VPC brez dostopa do interneta, da boste lahko dodali konektor v Amazon DocumentDB. Če želite izvedeti več, glejte Konfigurirajte Amazon SageMaker Canvas v VPC brez dostopa do interneta.

  1. Sledite Navodila za nalaganje vzorčnih podatkov restavracije v Amazon DocumentDB.
  2. Dodajte dostop do Amazon Bedrock in modela Anthropic Claude v njem. Za več informacij glejte Dodajte dostop do modela.

Ustvarite konektor Amazon DocumentDB v SageMaker Canvas

Ko ustvarite domeno SageMaker, dokončajte naslednje korake:

  1. Na konzoli Amazon DocumentDB izberite Strojno učenje brez kode v podoknu za krmarjenje.
  2. Pod Izberite domeno in profil¸ izberite svojo domeno SageMaker in uporabniški profil.
  3. Izberite Zaženite Canvas da zaženete SageMaker Canvas v novem zavihku.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Ko se SageMaker Canvas konča z nalaganjem, boste pristali na Pretok podatkov tab.

  1. Izberite ustvarjanje ustvariti nov pretok podatkov.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Vnesite ime za pretok podatkov in izberite ustvarjanje.
  3. Dodajte novo povezavo Amazon DocumentDB tako, da izberete Uvozi podatke, nato izberite Tabela za Vrsta nabora podatkov.
  4. o Uvozi podatke stran, za Vir podatkov, izberite Dokument DB in Dodaj povezavo.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  5. Vnesite ime povezave, kot je demo, in izberite želeno gručo Amazon DocumentDB.

Upoštevajte, da bo SageMaker Canvas vnaprej zapolnil spustni meni z gručami v istem VPC kot vaša domena SageMaker.

  1. Vnesite uporabniško ime, geslo in ime baze podatkov.
  2. Na koncu izberite želeno branje.

Za zaščito delovanja primarnih primerkov je SageMaker Canvas privzeto nastavljen na Sekundarno, kar pomeni, da bo bral samo iz sekundarnih primerkov. Pri branju prednost je Zaželeno sekundarno, SageMaker Canvas bere iz razpoložljivih sekundarnih primerkov, vendar bo bral iz primarnega primerka, če sekundarni primerek ni na voljo. Za več informacij o tem, kako konfigurirati povezavo Amazon DocumentDB, glejte Povežite se z bazo podatkov, shranjeno v AWS.

  1. Izberite Dodajte povezavo.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Če je povezava uspešna, boste v svoji bazi podatkov Amazon DocumentDB videli zbirke, prikazane kot tabele.

  1. Povlecite izbrano tabelo na prazno platno. Za to objavo dodamo podatke o naši restavraciji.

Prvih 100 vrstic je prikazanih kot predogled.

  1. Če želite začeti analizirati in pripravljati podatke, izberite Uvozi podatke.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Vnesite ime nabora podatkov in izberite Uvozi podatke.

Analizirajte podatke z uporabo generativne umetne inteligence

Nato želimo pridobiti nekaj vpogledov v naše podatke in poiskati vzorce. SageMaker Canvas ponuja vmesnik v naravnem jeziku za analizo in pripravo podatkov. Ko datum naloži zavihek, lahko začnete klepetati s svojimi podatki z naslednjimi koraki:

  1. Izberite Klepet za pripravo podatkov.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Zberite vpogled v svoje podatke tako, da postavite vprašanja, kot so vzorci, prikazani na naslednjih posnetkih zaslona.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Če želite izvedeti več o uporabi naravnega jezika za raziskovanje in pripravo podatkov, glejte Uporabite naravni jezik za raziskovanje in pripravo podatkov z novo zmogljivostjo Amazon SageMaker Canvas.

Pridobimo globlji občutek o kakovosti naših podatkov z uporabo poročila o kakovosti in vpogledih podatkov SageMaker Canvas, ki samodejno oceni kakovost podatkov in zazna nepravilnosti.

  1. o Analize izberite jeziček Poročilo o kakovosti podatkov in vpogledih.
  2. Izberite rating kot ciljni stolpec in regresija kot vrsto težave, nato izberite ustvarjanje.

To bo simuliralo modelno usposabljanje in zagotovilo vpogled v to, kako lahko izboljšamo naše podatke za strojno učenje. Celotno poročilo se ustvari v nekaj minutah.

Naše poročilo kaže, da ima 2.47 % vrstic v našem cilju manjkajoče vrednosti – to bomo obravnavali v naslednjem koraku. Poleg tega analiza kaže, da je address line 2, namein type_of_food lastnosti imajo največjo napovedno moč v naših podatkih. To pomeni, da lahko osnovne informacije o restavraciji, kot sta lokacija in kulinarika, močno vplivajo na ocene.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Pripravite podatke za strojno učenje

SageMaker Canvas ponuja več kot 300 vgrajenih transformacij za pripravo uvoženih podatkov. Za več informacij o transformacijskih funkcijah SageMaker Canvas glejte Pripravite podatke z naprednimi transformacijami. Dodajmo nekaj transformacij, da bodo naši podatki pripravljeni za usposabljanje modela ML.

  1. Pojdite nazaj na Pretok podatkov strani tako, da na vrhu strani izberete ime vašega toka podatkov.
  2. Izberite znak plus poleg Vrste podatkov In izberite Dodaj preoblikovanje.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  3. Izberite Dodaj korak.
  4. Preimenujmo address line 2 stolpec do cities.
    1. Izberite Upravljanje stolpcev.
    2. Izberite Preimenuj stolpec za Transform.
    3. Izberite address line 2 za Vhodni stolpec, vnesite cities za Novo ime, in izberite Dodaj.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  5. Poleg tega izpustimo nekaj nepotrebnih stolpcev.
    1. Dodajte novo transformacijo.
    2. za Transform, izberite Spustite stolpec.
    3. za Stolpci za spuščanje, izberite URL in restaurant_id.
    4. Izberite Dodaj.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.[
  6. naše rating ima nekaj manjkajočih vrednosti, zato izpolnimo te vrstice s povprečno vrednostjo tega stolpca.
    1. Dodajte novo transformacijo.
    2. za Transform, izberite Impute.
    3. za Vrsta stolpca, izberite Številčno.
    4. za Vnosni stolpci, izberite rating stolpec.
    5. za Strategija imputiranja, izberite Pomeni.
    6. za Izhodni stolpec, vnesite rating_avg_filled.
    7. Izberite Dodaj.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  7. Lahko spustimo rating ker imamo nov stolpec z izpolnjenimi vrednostmi.
  8. Ker type_of_food je po naravi kategoričen, ga bomo želeli numerično kodirati. Kodirajmo to funkcijo s tehniko enkratnega kodiranja.
    1. Dodajte novo transformacijo.
    2. za Transform, izberite Enkratno kodiranje.
    3. Za vnosne stolpce izberite type_of_food.
    4. za Neveljavna strategija ravnanja¸ izberite Imejte.
    5. za Izhodni slog¸ izberite Stolpci.
    6. za Izhodni stolpec, vnesite encoded.
    7. Izberite Dodaj.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Zgradite model in ustvarite napovedi

Zdaj, ko smo preoblikovali naše podatke, urimo numerični model ML za napovedovanje ocen za restavracije.

  1. Izberite Ustvari model.
  2. za Ime nabora podatkov, vnesite ime za izvoz nabora podatkov.
  3. Izberite izvoz in počakajte, da se preoblikovani podatki izvozijo.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  4. Izberite Ustvari model povezavo v spodnjem levem kotu strani.

Nabor podatkov lahko izberete tudi v funkciji Data Wrangler na levi strani.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

  1. Vnesite ime modela.
  2. Izberite Napovedna analiza, nato izberite ustvarjanje.
  3. Izberite rating_avg_filled kot ciljni stolpec.

SageMaker Canvas samodejno izbere ustrezno vrsto modela.

  1. Izberite Predogled modela da zagotovite, da ni težav s kakovostjo podatkov.
  2. Izberite Hitra izdelava za izdelavo modela.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Izdelava modela bo trajala približno 2–15 minut.

Stanje modela si lahko ogledate, ko model konča usposabljanje. Naš model ima RSME 0.422, kar pomeni, da model pogosto napove oceno restavracije znotraj +/- 0.422 dejanske vrednosti, kar je dober približek za ocenjevalno lestvico od 1 do 6.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

  1. Končno lahko ustvarite vzorčne napovedi tako, da se pomaknete na Predvidite tab.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Čiščenje

Da se izognete prihodnjim stroškom, izbrišite vire, ki ste jih ustvarili med spremljanjem te objave. SageMaker Canvas vam zaračuna trajanje seje in priporočamo, da se odjavite iz SageMaker Canvas, ko ga ne uporabljate. Nanašati se na Odjava iz Amazon SageMaker Canvas Za več podrobnosti.

zaključek

V tej objavi smo razpravljali o tem, kako lahko uporabite SageMaker Canvas za generativni AI in ML s podatki, shranjenimi v Amazon DocumentDB. V našem primeru smo pokazali, kako lahko analitik hitro zgradi visokokakovosten model ML z uporabo vzorčnega nabora podatkov restavracije.

Pokazali smo korake za implementacijo rešitve, od uvoza podatkov iz Amazon DocumentDB do gradnje modela ML v SageMaker Canvas. Celoten proces je bil zaključen prek vizualnega vmesnika brez pisanja ene vrstice kode.

Če želite začeti svoje potovanje ML z nizko kodo/brez kode, glejte Amazon SageMaker Canvas.


O avtorjih

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Adeleke Coker je arhitekt globalnih rešitev pri AWS. Sodeluje s strankami po vsem svetu, da bi zagotovil smernice in tehnično pomoč pri uvajanju proizvodnih delovnih obremenitev v velikem obsegu na AWS. V prostem času se rad uči, bere, igra in spremlja športne dogodke.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Gururaj S Bayari je višji specialist za rešitve DocumentDB pri AWS. Uživa v tem, da strankam pomaga prevzeti Amazonove namenske baze podatkov. Strankam pomaga oblikovati, oceniti in optimizirati njihovo internetno lestvico in visoko zmogljive delovne obremenitve, ki jih poganjajo NoSQL in/ali relacijske baze podatkov.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Tim Pusateri je višji produktni vodja pri AWS, kjer dela na Amazon SageMaker Canvas. Njegov cilj je strankam pomagati hitro izpeljati vrednost iz AI/ML. Zunaj službe je rad na prostem, igra kitaro, spremlja glasbo v živo in preživlja čas z družino in prijatelji.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Pratik Das je produktni vodja pri AWS. Uživa v delu s strankami, ki želijo zgraditi prožne delovne obremenitve in močne podatkovne temelje v oblaku. Prinaša strokovno znanje in izkušnje pri delu s podjetji pri pobudah za posodobitev, analitiko in pretvorbo podatkov.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Varma Gottumukkala je višji strokovnjak za rešitve za baze podatkov pri AWS s sedežem v Dallas Fort Worthu. Varma sodeluje s strankami pri njihovi strategiji baze podatkov in oblikuje njihove delovne obremenitve z uporabo namensko zgrajenih podatkovnih baz AWS. Preden se je pridružil AWS, je zadnjih 22 let veliko delal z relacijskimi bazami podatkov, bazami podatkov NOSQL in številnimi programskimi jeziki.

Časovni žig:

Več od Strojno učenje AWS