Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Spletne storitve Amazon

Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Spletne storitve Amazon

Z veseljem oznanjamo lansiranje Amazon DocumentDB (z združljivostjo z MongoDB) integracija s Amazon SageMaker Canvas, ki strankam Amazon DocumentDB omogoča izdelavo in uporabo generativnih rešitev AI in strojnega učenja (ML) brez pisanja kode. Amazon DocumentDB je v celoti upravljana izvorna zbirka dokumentov JSON, ki omogoča preprosto in stroškovno učinkovito upravljanje kritičnih delovnih obremenitev dokumentov v skoraj katerem koli obsegu brez upravljanja infrastrukture. Amazon SageMaker Canvas je delovni prostor ML brez kode, ki ponuja modele, pripravljene za uporabo, vključno z modeli temeljev, in zmožnostjo priprave podatkov ter gradnje in uvajanja modelov po meri.

V tej objavi razpravljamo o tem, kako prenesti podatke, shranjene v Amazon DocumentDB, v SageMaker Canvas in uporabiti te podatke za izdelavo modelov ML za napovedno analitiko. Brez ustvarjanja in vzdrževanja podatkovnih cevovodov boste lahko poganjali modele ML s svojimi nestrukturiranimi podatki, shranjenimi v Amazon DocumentDB.

Pregled rešitev

Prevzemimo vlogo poslovnega analitika za podjetje za dostavo hrane. Vaša mobilna aplikacija shranjuje informacije o restavracijah v Amazon DocumentDB zaradi svoje razširljivosti in prilagodljivih shem. Želite zbrati vpogled v te podatke in zgraditi model ML za napovedovanje, kako bodo ocenjene nove restavracije, vendar se vam zdi izziv izvajati analitiko na nestrukturiranih podatkih. Naletite na ozka grla, ker se morate za uresničitev teh ciljev zanesti na ekipe za podatkovno inženirstvo in podatkovno znanost.

Ta nova integracija rešuje te težave tako, da omogoča preprost prenos podatkov Amazon DocumentDB v SageMaker Canvas in takojšen začetek priprave in analize podatkov za ML. Poleg tega SageMaker Canvas odpravlja odvisnost od strokovnega znanja o ML za izdelavo visokokakovostnih modelov in ustvarjanje napovedi.

V naslednjih korakih prikazujemo, kako uporabiti podatke Amazon DocumentDB za izdelavo modelov ML v SageMaker Canvas:

  1. Ustvarite konektor Amazon DocumentDB v SageMaker Canvas.
  2. Analizirajte podatke z uporabo generativne umetne inteligence.
  3. Pripravite podatke za strojno učenje.
  4. Zgradite model in ustvarite napovedi.

Predpogoji

Za izvedbo te rešitve izpolnite naslednje predpogoje:

  1. Imejte skrbniški dostop do AWS Cloud z AWS upravljanje identitete in dostopa (JAZ SEM) uporabnik z dovoljenji, potrebnimi za dokončanje integracije.
  2. Dokončajte nastavitev okolja z uporabo Oblikovanje oblaka AWS prek ene od naslednjih možnosti:
    1. Razmestite predlogo CloudFormation v nov VPC – Ta možnost zgradi novo okolje AWS, ki ga sestavljajo VPC, zasebna podomrežja, varnostne skupine, izvajalske vloge IAM, Amazon Cloud9, zahtevane končne točke VPCin Domena SageMaker. Nato namesti Amazon DocumentDB v ta novi VPC. Prenesite Predloga ali hitro zaženite sklad CloudFormation tako, da izberete Izstrelite sklad:
      Zaženite sklad CloudFormation
    2. Razmestite predlogo CloudFormation v obstoječi VPC – Ta možnost ustvari zahtevane končne točke VPC, vloge izvajanja IAM in domeno SageMaker v obstoječem VPC z zasebnimi podomrežji. Prenesite Predloga ali hitro zaženite sklad CloudFormation tako, da izberete Izstrelite sklad:
      Zaženite sklad CloudFormation

Upoštevajte, da če ustvarjate novo domeno SageMaker, morate domeno konfigurirati tako, da bo v zasebnem VPC brez dostopa do interneta, da boste lahko dodali konektor v Amazon DocumentDB. Če želite izvedeti več, glejte Konfigurirajte Amazon SageMaker Canvas v VPC brez dostopa do interneta.

  1. Sledite Navodila za nalaganje vzorčnih podatkov restavracije v Amazon DocumentDB.
  2. Dodajte dostop do Amazon Bedrock in modela Anthropic Claude v njem. Za več informacij glejte Dodajte dostop do modela.

Ustvarite konektor Amazon DocumentDB v SageMaker Canvas

Ko ustvarite domeno SageMaker, dokončajte naslednje korake:

  1. Na konzoli Amazon DocumentDB izberite Strojno učenje brez kode v podoknu za krmarjenje.
  2. Pod Izberite domeno in profil¸ izberite svojo domeno SageMaker in uporabniški profil.
  3. Izberite Zaženite Canvas da zaženete SageMaker Canvas v novem zavihku.
    Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Ko se SageMaker Canvas konča z nalaganjem, boste pristali na Pretok podatkov tab.

  1. Izberite ustvarjanje ustvariti nov pretok podatkov.
    Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.
  2. Vnesite ime za pretok podatkov in izberite ustvarjanje.
  3. Dodajte novo povezavo Amazon DocumentDB tako, da izberete Uvozi podatke, nato izberite Tabela za Vrsta nabora podatkov.
  4. o Uvozi podatke stran, za Vir podatkov, izberite Dokument DB in Dodaj povezavo.
    Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.
  5. Vnesite ime povezave, kot je demo, in izberite želeno gručo Amazon DocumentDB.

Upoštevajte, da bo SageMaker Canvas vnaprej zapolnil spustni meni z gručami v istem VPC kot vaša domena SageMaker.

  1. Vnesite uporabniško ime, geslo in ime baze podatkov.
  2. Na koncu izberite želeno branje.

Za zaščito delovanja primarnih primerkov je SageMaker Canvas privzeto nastavljen na Sekundarno, kar pomeni, da bo bral samo iz sekundarnih primerkov. Pri branju prednost je Zaželeno sekundarno, SageMaker Canvas bere iz razpoložljivih sekundarnih primerkov, vendar bo bral iz primarnega primerka, če sekundarni primerek ni na voljo. Za več informacij o tem, kako konfigurirati povezavo Amazon DocumentDB, glejte Povežite se z bazo podatkov, shranjeno v AWS.

  1. Izberite Dodajte povezavo.
    Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Če je povezava uspešna, boste v svoji bazi podatkov Amazon DocumentDB videli zbirke, prikazane kot tabele.

  1. Povlecite izbrano tabelo na prazno platno. Za to objavo dodamo podatke o naši restavraciji.

Prvih 100 vrstic je prikazanih kot predogled.

  1. Če želite začeti analizirati in pripravljati podatke, izberite Uvozi podatke.
    Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.
  2. Vnesite ime nabora podatkov in izberite Uvozi podatke.

Analizirajte podatke z uporabo generativne umetne inteligence

Nato želimo pridobiti nekaj vpogledov v naše podatke in poiskati vzorce. SageMaker Canvas ponuja vmesnik v naravnem jeziku za analizo in pripravo podatkov. Ko datum naloži zavihek, lahko začnete klepetati s svojimi podatki z naslednjimi koraki:

  1. Izberite Klepet za pripravo podatkov.
    Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.
  2. Zberite vpogled v svoje podatke tako, da postavite vprašanja, kot so vzorci, prikazani na naslednjih posnetkih zaslona.
    Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Če želite izvedeti več o uporabi naravnega jezika za raziskovanje in pripravo podatkov, glejte Uporabite naravni jezik za raziskovanje in pripravo podatkov z novo zmogljivostjo Amazon SageMaker Canvas.

Pridobimo globlji občutek o kakovosti naših podatkov z uporabo poročila o kakovosti in vpogledih podatkov SageMaker Canvas, ki samodejno oceni kakovost podatkov in zazna nepravilnosti.

  1. o Analize izberite jeziček Poročilo o kakovosti podatkov in vpogledih.
  2. Izberite rating kot ciljni stolpec in regresija kot vrsto težave, nato izberite ustvarjanje.

To bo simuliralo modelno usposabljanje in zagotovilo vpogled v to, kako lahko izboljšamo naše podatke za strojno učenje. Celotno poročilo se ustvari v nekaj minutah.

Naše poročilo kaže, da ima 2.47 % vrstic v našem cilju manjkajoče vrednosti – to bomo obravnavali v naslednjem koraku. Poleg tega analiza kaže, da je address line 2, namein type_of_food lastnosti imajo največjo napovedno moč v naših podatkih. To pomeni, da lahko osnovne informacije o restavraciji, kot sta lokacija in kulinarika, močno vplivajo na ocene.

Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Pripravite podatke za strojno učenje

SageMaker Canvas ponuja več kot 300 vgrajenih transformacij za pripravo uvoženih podatkov. Za več informacij o transformacijskih funkcijah SageMaker Canvas glejte Pripravite podatke z naprednimi transformacijami. Dodajmo nekaj transformacij, da bodo naši podatki pripravljeni za usposabljanje modela ML.

  1. Pojdite nazaj na Pretok podatkov strani tako, da na vrhu strani izberete ime vašega toka podatkov.
  2. Izberite znak plus poleg Vrste podatkov In izberite Dodaj preoblikovanje.
    Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.
  3. Izberite Dodaj korak.
  4. Preimenujmo address line 2 stolpec do cities.
    1. Izberite Upravljanje stolpcev.
    2. Izberite Preimenuj stolpec za Transform.
    3. Izberite address line 2 za Vhodni stolpec, vnesite cities za Novo ime, in izberite Dodaj.
      Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.
  5. Poleg tega izpustimo nekaj nepotrebnih stolpcev.
    1. Dodajte novo transformacijo.
    2. za Transform, izberite Spustite stolpec.
    3. za Stolpci za spuščanje, izberite URL in restaurant_id.
    4. Izberite Dodaj.
      Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.[
  6. naše rating ima nekaj manjkajočih vrednosti, zato izpolnimo te vrstice s povprečno vrednostjo tega stolpca.
    1. Dodajte novo transformacijo.
    2. za Transform, izberite Impute.
    3. za Vrsta stolpca, izberite Številčno.
    4. za Vnosni stolpci, izberite rating stolpec.
    5. za Strategija imputiranja, izberite Pomeni.
    6. za Izhodni stolpec, vnesite rating_avg_filled.
    7. Izberite Dodaj.
      Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.
  7. Lahko spustimo rating ker imamo nov stolpec z izpolnjenimi vrednostmi.
  8. Ker type_of_food je po naravi kategoričen, ga bomo želeli numerično kodirati. Kodirajmo to funkcijo s tehniko enkratnega kodiranja.
    1. Dodajte novo transformacijo.
    2. za Transform, izberite Enkratno kodiranje.
    3. Za vnosne stolpce izberite type_of_food.
    4. za Neveljavna strategija ravnanja¸ izberite Imejte.
    5. za Izhodni slog¸ izberite Stolpci.
    6. za Izhodni stolpec, vnesite encoded.
    7. Izberite Dodaj.
      Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Zgradite model in ustvarite napovedi

Zdaj, ko smo preoblikovali naše podatke, urimo numerični model ML za napovedovanje ocen za restavracije.

  1. Izberite Ustvari model.
  2. za Ime nabora podatkov, vnesite ime za izvoz nabora podatkov.
  3. Izberite izvoz in počakajte, da se preoblikovani podatki izvozijo.
    Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.
  4. Izberite Ustvari model povezavo v spodnjem levem kotu strani.

Nabor podatkov lahko izberete tudi v funkciji Data Wrangler na levi strani.

Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

  1. Vnesite ime modela.
  2. Izberite Napovedna analiza, nato izberite ustvarjanje.
  3. Izberite rating_avg_filled kot ciljni stolpec.

SageMaker Canvas samodejno izbere ustrezno vrsto modela.

  1. Izberite Predogled modela da zagotovite, da ni težav s kakovostjo podatkov.
  2. Izberite Hitra izdelava za izdelavo modela.
    Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Izdelava modela bo trajala približno 2–15 minut.

Stanje modela si lahko ogledate, ko model konča usposabljanje. Naš model ima RSME 0.422, kar pomeni, da model pogosto napove oceno restavracije znotraj +/- 0.422 dejanske vrednosti, kar je dober približek za ocenjevalno lestvico od 1 do 6.

Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

  1. Končno lahko ustvarite vzorčne napovedi tako, da se pomaknete na Predvidite tab.
    Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Čiščenje

Da se izognete prihodnjim stroškom, izbrišite vire, ki ste jih ustvarili med spremljanjem te objave. SageMaker Canvas vam zaračuna trajanje seje in priporočamo, da se odjavite iz SageMaker Canvas, ko ga ne uporabljate. Nanašati se na Odjava iz Amazon SageMaker Canvas Za več podrobnosti.

zaključek

V tej objavi smo razpravljali o tem, kako lahko uporabite SageMaker Canvas za generativni AI in ML s podatki, shranjenimi v Amazon DocumentDB. V našem primeru smo pokazali, kako lahko analitik hitro zgradi visokokakovosten model ML z uporabo vzorčnega nabora podatkov restavracije.

Pokazali smo korake za implementacijo rešitve, od uvoza podatkov iz Amazon DocumentDB do gradnje modela ML v SageMaker Canvas. Celoten proces je bil zaključen prek vizualnega vmesnika brez pisanja ene vrstice kode.

Če želite začeti svoje potovanje ML z nizko kodo/brez kode, glejte Amazon SageMaker Canvas.


O avtorjih

Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Adeleke Coker je arhitekt globalnih rešitev pri AWS. Sodeluje s strankami po vsem svetu, da bi zagotovil smernice in tehnično pomoč pri uvajanju proizvodnih delovnih obremenitev v velikem obsegu na AWS. V prostem času se rad uči, bere, igra in spremlja športne dogodke.

Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai. Gururaj S Bayari je višji specialist za rešitve DocumentDB pri AWS. Uživa v tem, da strankam pomaga prevzeti Amazonove namenske baze podatkov. Strankam pomaga oblikovati, oceniti in optimizirati njihovo internetno lestvico in visoko zmogljive delovne obremenitve, ki jih poganjajo NoSQL in/ali relacijske baze podatkov.

Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Tim Pusateri je višji produktni vodja pri AWS, kjer dela na Amazon SageMaker Canvas. Njegov cilj je strankam pomagati hitro izpeljati vrednost iz AI/ML. Zunaj službe je rad na prostem, igra kitaro, spremlja glasbo v živo in preživlja čas z družino in prijatelji.

Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Pratik Das je produktni vodja pri AWS. Uživa v delu s strankami, ki želijo zgraditi prožne delovne obremenitve in močne podatkovne temelje v oblaku. Prinaša strokovno znanje in izkušnje pri delu s podjetji pri pobudah za posodobitev, analitiko in pretvorbo podatkov.

Uporabite Amazon DocumentDB za izdelavo rešitev za strojno učenje brez kode v Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Varma Gottumukkala je višji strokovnjak za rešitve za baze podatkov pri AWS s sedežem v Dallas Fort Worthu. Varma sodeluje s strankami pri njihovi strategiji baze podatkov in oblikuje njihove delovne obremenitve z uporabo namensko zgrajenih podatkovnih baz AWS. Preden se je pridružil AWS, je zadnjih 22 let veliko delal z relacijskimi bazami podatkov, bazami podatkov NOSQL in številnimi programskimi jeziki.

Časovni žig:

Več od Strojno učenje AWS