Z veseljem oznanjamo lansiranje Amazon DocumentDB (z združljivostjo z MongoDB) integracija s Amazon SageMaker Canvas, ki strankam Amazon DocumentDB omogoča izdelavo in uporabo generativnih rešitev AI in strojnega učenja (ML) brez pisanja kode. Amazon DocumentDB je v celoti upravljana izvorna zbirka dokumentov JSON, ki omogoča preprosto in stroškovno učinkovito upravljanje kritičnih delovnih obremenitev dokumentov v skoraj katerem koli obsegu brez upravljanja infrastrukture. Amazon SageMaker Canvas je delovni prostor ML brez kode, ki ponuja modele, pripravljene za uporabo, vključno z modeli temeljev, in zmožnostjo priprave podatkov ter gradnje in uvajanja modelov po meri.
V tej objavi razpravljamo o tem, kako prenesti podatke, shranjene v Amazon DocumentDB, v SageMaker Canvas in uporabiti te podatke za izdelavo modelov ML za napovedno analitiko. Brez ustvarjanja in vzdrževanja podatkovnih cevovodov boste lahko poganjali modele ML s svojimi nestrukturiranimi podatki, shranjenimi v Amazon DocumentDB.
Pregled rešitev
Prevzemimo vlogo poslovnega analitika za podjetje za dostavo hrane. Vaša mobilna aplikacija shranjuje informacije o restavracijah v Amazon DocumentDB zaradi svoje razširljivosti in prilagodljivih shem. Želite zbrati vpogled v te podatke in zgraditi model ML za napovedovanje, kako bodo ocenjene nove restavracije, vendar se vam zdi izziv izvajati analitiko na nestrukturiranih podatkih. Naletite na ozka grla, ker se morate za uresničitev teh ciljev zanesti na ekipe za podatkovno inženirstvo in podatkovno znanost.
Ta nova integracija rešuje te težave tako, da omogoča preprost prenos podatkov Amazon DocumentDB v SageMaker Canvas in takojšen začetek priprave in analize podatkov za ML. Poleg tega SageMaker Canvas odpravlja odvisnost od strokovnega znanja o ML za izdelavo visokokakovostnih modelov in ustvarjanje napovedi.
V naslednjih korakih prikazujemo, kako uporabiti podatke Amazon DocumentDB za izdelavo modelov ML v SageMaker Canvas:
- Ustvarite konektor Amazon DocumentDB v SageMaker Canvas.
- Analizirajte podatke z uporabo generativne umetne inteligence.
- Pripravite podatke za strojno učenje.
- Zgradite model in ustvarite napovedi.
Predpogoji
Za izvedbo te rešitve izpolnite naslednje predpogoje:
- Imejte skrbniški dostop do AWS Cloud z AWS upravljanje identitete in dostopa (JAZ SEM) uporabnik z dovoljenji, potrebnimi za dokončanje integracije.
- Dokončajte nastavitev okolja z uporabo Oblikovanje oblaka AWS prek ene od naslednjih možnosti:
- Razmestite predlogo CloudFormation v nov VPC – Ta možnost zgradi novo okolje AWS, ki ga sestavljajo VPC, zasebna podomrežja, varnostne skupine, izvajalske vloge IAM, Amazon Cloud9, zahtevane končne točke VPCin Domena SageMaker. Nato namesti Amazon DocumentDB v ta novi VPC. Prenesite Predloga ali hitro zaženite sklad CloudFormation tako, da izberete Izstrelite sklad:
- Razmestite predlogo CloudFormation v obstoječi VPC – Ta možnost ustvari zahtevane končne točke VPC, vloge izvajanja IAM in domeno SageMaker v obstoječem VPC z zasebnimi podomrežji. Prenesite Predloga ali hitro zaženite sklad CloudFormation tako, da izberete Izstrelite sklad:
- Razmestite predlogo CloudFormation v nov VPC – Ta možnost zgradi novo okolje AWS, ki ga sestavljajo VPC, zasebna podomrežja, varnostne skupine, izvajalske vloge IAM, Amazon Cloud9, zahtevane končne točke VPCin Domena SageMaker. Nato namesti Amazon DocumentDB v ta novi VPC. Prenesite Predloga ali hitro zaženite sklad CloudFormation tako, da izberete Izstrelite sklad:
Upoštevajte, da če ustvarjate novo domeno SageMaker, morate domeno konfigurirati tako, da bo v zasebnem VPC brez dostopa do interneta, da boste lahko dodali konektor v Amazon DocumentDB. Če želite izvedeti več, glejte Konfigurirajte Amazon SageMaker Canvas v VPC brez dostopa do interneta.
- Sledite Navodila za nalaganje vzorčnih podatkov restavracije v Amazon DocumentDB.
- Dodajte dostop do Amazon Bedrock in modela Anthropic Claude v njem. Za več informacij glejte Dodajte dostop do modela.
Ustvarite konektor Amazon DocumentDB v SageMaker Canvas
Ko ustvarite domeno SageMaker, dokončajte naslednje korake:
- Na konzoli Amazon DocumentDB izberite Strojno učenje brez kode v podoknu za krmarjenje.
- Pod Izberite domeno in profil¸ izberite svojo domeno SageMaker in uporabniški profil.
- Izberite Zaženite Canvas da zaženete SageMaker Canvas v novem zavihku.
Ko se SageMaker Canvas konča z nalaganjem, boste pristali na Pretok podatkov tab.
- Izberite ustvarjanje ustvariti nov pretok podatkov.
- Vnesite ime za pretok podatkov in izberite ustvarjanje.
- Dodajte novo povezavo Amazon DocumentDB tako, da izberete Uvozi podatke, nato izberite Tabela za Vrsta nabora podatkov.
- o Uvozi podatke stran, za Vir podatkov, izberite Dokument DB in Dodaj povezavo.
- Vnesite ime povezave, kot je demo, in izberite želeno gručo Amazon DocumentDB.
Upoštevajte, da bo SageMaker Canvas vnaprej zapolnil spustni meni z gručami v istem VPC kot vaša domena SageMaker.
- Vnesite uporabniško ime, geslo in ime baze podatkov.
- Na koncu izberite želeno branje.
Za zaščito delovanja primarnih primerkov je SageMaker Canvas privzeto nastavljen na Sekundarno, kar pomeni, da bo bral samo iz sekundarnih primerkov. Pri branju prednost je Zaželeno sekundarno, SageMaker Canvas bere iz razpoložljivih sekundarnih primerkov, vendar bo bral iz primarnega primerka, če sekundarni primerek ni na voljo. Za več informacij o tem, kako konfigurirati povezavo Amazon DocumentDB, glejte Povežite se z bazo podatkov, shranjeno v AWS.
- Izberite Dodajte povezavo.
Če je povezava uspešna, boste v svoji bazi podatkov Amazon DocumentDB videli zbirke, prikazane kot tabele.
- Povlecite izbrano tabelo na prazno platno. Za to objavo dodamo podatke o naši restavraciji.
Prvih 100 vrstic je prikazanih kot predogled.
- Če želite začeti analizirati in pripravljati podatke, izberite Uvozi podatke.
- Vnesite ime nabora podatkov in izberite Uvozi podatke.
Analizirajte podatke z uporabo generativne umetne inteligence
Nato želimo pridobiti nekaj vpogledov v naše podatke in poiskati vzorce. SageMaker Canvas ponuja vmesnik v naravnem jeziku za analizo in pripravo podatkov. Ko datum naloži zavihek, lahko začnete klepetati s svojimi podatki z naslednjimi koraki:
- Izberite Klepet za pripravo podatkov.
- Zberite vpogled v svoje podatke tako, da postavite vprašanja, kot so vzorci, prikazani na naslednjih posnetkih zaslona.
Če želite izvedeti več o uporabi naravnega jezika za raziskovanje in pripravo podatkov, glejte Uporabite naravni jezik za raziskovanje in pripravo podatkov z novo zmogljivostjo Amazon SageMaker Canvas.
Pridobimo globlji občutek o kakovosti naših podatkov z uporabo poročila o kakovosti in vpogledih podatkov SageMaker Canvas, ki samodejno oceni kakovost podatkov in zazna nepravilnosti.
- o Analize izberite jeziček Poročilo o kakovosti podatkov in vpogledih.
- Izberite
rating
kot ciljni stolpec in regresija kot vrsto težave, nato izberite ustvarjanje.
To bo simuliralo modelno usposabljanje in zagotovilo vpogled v to, kako lahko izboljšamo naše podatke za strojno učenje. Celotno poročilo se ustvari v nekaj minutah.
Naše poročilo kaže, da ima 2.47 % vrstic v našem cilju manjkajoče vrednosti – to bomo obravnavali v naslednjem koraku. Poleg tega analiza kaže, da je address line 2
, name
in type_of_food
lastnosti imajo največjo napovedno moč v naših podatkih. To pomeni, da lahko osnovne informacije o restavraciji, kot sta lokacija in kulinarika, močno vplivajo na ocene.
Pripravite podatke za strojno učenje
SageMaker Canvas ponuja več kot 300 vgrajenih transformacij za pripravo uvoženih podatkov. Za več informacij o transformacijskih funkcijah SageMaker Canvas glejte Pripravite podatke z naprednimi transformacijami. Dodajmo nekaj transformacij, da bodo naši podatki pripravljeni za usposabljanje modela ML.
- Pojdite nazaj na Pretok podatkov strani tako, da na vrhu strani izberete ime vašega toka podatkov.
- Izberite znak plus poleg Vrste podatkov In izberite Dodaj preoblikovanje.
- Izberite Dodaj korak.
- Preimenujmo
address line 2
stolpec docities
.- Izberite Upravljanje stolpcev.
- Izberite Preimenuj stolpec za Transform.
- Izberite
address line 2
za Vhodni stolpec, vnesitecities
za Novo ime, in izberite Dodaj.
- Poleg tega izpustimo nekaj nepotrebnih stolpcev.
- Dodajte novo transformacijo.
- za Transform, izberite Spustite stolpec.
- za Stolpci za spuščanje, izberite
URL
inrestaurant_id
. - Izberite Dodaj.
[
- naše
rating
ima nekaj manjkajočih vrednosti, zato izpolnimo te vrstice s povprečno vrednostjo tega stolpca.- Dodajte novo transformacijo.
- za Transform, izberite Impute.
- za Vrsta stolpca, izberite Številčno.
- za Vnosni stolpci, izberite
rating
stolpec. - za Strategija imputiranja, izberite Pomeni.
- za Izhodni stolpec, vnesite
rating_avg_filled
. - Izberite Dodaj.
- Lahko spustimo
rating
ker imamo nov stolpec z izpolnjenimi vrednostmi. - Ker
type_of_food
je po naravi kategoričen, ga bomo želeli numerično kodirati. Kodirajmo to funkcijo s tehniko enkratnega kodiranja.- Dodajte novo transformacijo.
- za Transform, izberite Enkratno kodiranje.
- Za vnosne stolpce izberite
type_of_food
. - za Neveljavna strategija ravnanja¸ izberite Imejte.
- za Izhodni slog¸ izberite Stolpci.
- za Izhodni stolpec, vnesite
encoded
. - Izberite Dodaj.
Zgradite model in ustvarite napovedi
Zdaj, ko smo preoblikovali naše podatke, urimo numerični model ML za napovedovanje ocen za restavracije.
- Izberite Ustvari model.
- za Ime nabora podatkov, vnesite ime za izvoz nabora podatkov.
- Izberite izvoz in počakajte, da se preoblikovani podatki izvozijo.
- Izberite Ustvari model povezavo v spodnjem levem kotu strani.
Nabor podatkov lahko izberete tudi v funkciji Data Wrangler na levi strani.
- Vnesite ime modela.
- Izberite Napovedna analiza, nato izberite ustvarjanje.
- Izberite
rating_avg_filled
kot ciljni stolpec.
SageMaker Canvas samodejno izbere ustrezno vrsto modela.
- Izberite Predogled modela da zagotovite, da ni težav s kakovostjo podatkov.
- Izberite Hitra izdelava za izdelavo modela.
Izdelava modela bo trajala približno 2–15 minut.
Stanje modela si lahko ogledate, ko model konča usposabljanje. Naš model ima RSME 0.422, kar pomeni, da model pogosto napove oceno restavracije znotraj +/- 0.422 dejanske vrednosti, kar je dober približek za ocenjevalno lestvico od 1 do 6.
- Končno lahko ustvarite vzorčne napovedi tako, da se pomaknete na Predvidite tab.
Čiščenje
Da se izognete prihodnjim stroškom, izbrišite vire, ki ste jih ustvarili med spremljanjem te objave. SageMaker Canvas vam zaračuna trajanje seje in priporočamo, da se odjavite iz SageMaker Canvas, ko ga ne uporabljate. Nanašati se na Odjava iz Amazon SageMaker Canvas Za več podrobnosti.
zaključek
V tej objavi smo razpravljali o tem, kako lahko uporabite SageMaker Canvas za generativni AI in ML s podatki, shranjenimi v Amazon DocumentDB. V našem primeru smo pokazali, kako lahko analitik hitro zgradi visokokakovosten model ML z uporabo vzorčnega nabora podatkov restavracije.
Pokazali smo korake za implementacijo rešitve, od uvoza podatkov iz Amazon DocumentDB do gradnje modela ML v SageMaker Canvas. Celoten proces je bil zaključen prek vizualnega vmesnika brez pisanja ene vrstice kode.
Če želite začeti svoje potovanje ML z nizko kodo/brez kode, glejte Amazon SageMaker Canvas.
O avtorjih
Adeleke Coker je arhitekt globalnih rešitev pri AWS. Sodeluje s strankami po vsem svetu, da bi zagotovil smernice in tehnično pomoč pri uvajanju proizvodnih delovnih obremenitev v velikem obsegu na AWS. V prostem času se rad uči, bere, igra in spremlja športne dogodke.
Gururaj S Bayari je višji specialist za rešitve DocumentDB pri AWS. Uživa v tem, da strankam pomaga prevzeti Amazonove namenske baze podatkov. Strankam pomaga oblikovati, oceniti in optimizirati njihovo internetno lestvico in visoko zmogljive delovne obremenitve, ki jih poganjajo NoSQL in/ali relacijske baze podatkov.
Tim Pusateri je višji produktni vodja pri AWS, kjer dela na Amazon SageMaker Canvas. Njegov cilj je strankam pomagati hitro izpeljati vrednost iz AI/ML. Zunaj službe je rad na prostem, igra kitaro, spremlja glasbo v živo in preživlja čas z družino in prijatelji.
Pratik Das je produktni vodja pri AWS. Uživa v delu s strankami, ki želijo zgraditi prožne delovne obremenitve in močne podatkovne temelje v oblaku. Prinaša strokovno znanje in izkušnje pri delu s podjetji pri pobudah za posodobitev, analitiko in pretvorbo podatkov.
Varma Gottumukkala je višji strokovnjak za rešitve za baze podatkov pri AWS s sedežem v Dallas Fort Worthu. Varma sodeluje s strankami pri njihovi strategiji baze podatkov in oblikuje njihove delovne obremenitve z uporabo namensko zgrajenih podatkovnih baz AWS. Preden se je pridružil AWS, je zadnjih 22 let veliko delal z relacijskimi bazami podatkov, bazami podatkov NOSQL in številnimi programskimi jeziki.
- Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
- PlatoData.Network Vertical Generative Ai. Opolnomočite se. Dostopite tukaj.
- PlatoAiStream. Web3 Intelligence. Razširjeno znanje. Dostopite tukaj.
- PlatoESG. Ogljik, CleanTech, Energija, Okolje, sončna energija, Ravnanje z odpadki. Dostopite tukaj.
- PlatoHealth. Obveščanje o biotehnologiji in kliničnih preskušanjih. Dostopite tukaj.
- vir: https://aws.amazon.com/blogs/machine-learning/use-amazon-documentdb-to-build-no-code-machine-learning-solutions-in-amazon-sagemaker-canvas/
- :ima
- : je
- :ne
- :kje
- 10
- 100
- 11
- 12
- 13
- 150
- 22
- 27
- 300
- 385
- 500
- 58
- 7
- 8
- 9
- a
- sposobnost
- Sposobna
- O meni
- dostop
- doseganje
- dejanska
- dodajte
- Poleg tega
- Naslov
- admin
- sprejme
- napredno
- po
- AI
- AI / ML
- Dovoli
- Prav tako
- Amazon
- Amazon SageMaker
- Amazon SageMaker Canvas
- Amazon Web Services
- an
- Analiza
- Analitik
- Analitično
- analitika
- analizirati
- analiziranje
- in
- Objavi
- Antropično
- kaj
- aplikacija
- približno
- SE
- AS
- sprašuje
- pomoč
- domnevati
- At
- samodejno
- Na voljo
- povprečno
- izogniti
- AWS
- nazaj
- temeljijo
- Osnovni
- BE
- ker
- pred
- Računov
- ozka grla
- Bottom
- prinašajo
- Prinaša
- izgradnjo
- Building
- Gradi
- zgrajena
- vgrajeno
- poslovni
- vendar
- by
- CAN
- platno
- Zmogljivosti
- zmožnost
- izziv
- Stroški
- klepet
- izbira
- Izberite
- izbiri
- Cloud
- Grozd
- Koda
- Zbirke
- Stolpec
- Stolpci
- podjetje
- združljivost
- dokončanje
- Končana
- povezava
- vsebuje
- Konzole
- Kotiček
- stroškovno učinkovito
- ustvarjajo
- ustvaril
- ustvari
- Ustvarjanje
- Oblikovanje
- kritično
- po meri
- Stranke, ki so
- Dallas
- datum
- znanost o podatkih
- Baze podatkov
- baze podatkov
- globlje
- privzeto
- dostava
- demo
- izkazati
- Odvisnost
- razporedi
- uvajanja
- razpolaga
- drift
- Oblikovanje
- želeno
- Podrobnosti
- razpravlja
- razpravljali
- prikazano
- dokument
- domena
- prenesi
- Drop
- trajanje
- bodisi
- kodiranje
- Inženiring
- zagotovitev
- Vnesite
- podjetja
- Celotna
- okolje
- oceniti
- dogodki
- Primer
- razburjen
- izvedba
- obstoječih
- strokovno znanje
- raziskuje
- izvoz
- obširno
- družina
- Feature
- Lastnosti
- Nekaj
- izpolnite
- napolnjena
- Najdi
- prva
- prilagodljiv
- Pretok
- po
- hrana
- dostava hrane
- za
- Fundacija
- Temelji
- prijatelji
- iz
- v celoti
- Prihodnost
- igre na srečo
- zbiranje
- ustvarjajo
- ustvarila
- generativno
- Generativna AI
- dobili
- Globalno
- Globalno
- Cilj
- Cilji
- Skupine
- Navodila
- Ravnanje
- Imajo
- he
- pomoč
- pomoč
- Pomaga
- visoka
- visoka kvaliteta
- njegov
- Kako
- Kako
- HTML
- HTTPS
- identiteta
- if
- takoj
- vpliv
- izvajati
- uvoz
- izboljšanje
- in
- Vključno
- označuje
- Podatki
- Infrastruktura
- pobud
- vhod
- vpogledi
- primer
- integracija
- vmesnik
- Internet
- dostop do interneta
- v
- Vprašanja
- IT
- ITS
- pridružil
- Potovanje
- jpg
- json
- Država
- jezik
- jeziki
- Zadnja
- kosilo
- UČITE
- učenje
- levo
- Lets
- kot
- vrstica
- LINK
- v živo
- obremenitev
- nalaganje
- obremenitve
- kraj aktivnosti
- sečnja
- Poglej
- si
- ljubi
- stroj
- strojno učenje
- vzdrževanje
- IZDELA
- Izdelava
- upravlja
- upravitelj
- upravljanje
- Maj ..
- kar pomeni,
- pomeni
- Meni
- Minute
- manjka
- ML
- Mobilni
- mobilna aplikacija
- Model
- modeli
- MongoDB
- več
- Najbolj
- več
- Glasba
- morajo
- Ime
- materni
- naravna
- Narava
- krmarjenje
- ostalo
- Nimate
- Novo
- Naslednja
- št
- of
- ponujanje
- Ponudbe
- pogosto
- on
- samo
- deluje
- Optimizirajte
- Možnost
- možnosti
- or
- naši
- ven
- na prostem
- zunaj
- več
- Stran
- podokno
- Geslo
- vzorci
- Izvedite
- performance
- Dovoljenja
- platon
- Platonova podatkovna inteligenca
- PlatoData
- Predvajaj
- plus
- Prispevek
- moč
- poganja
- napovedati
- napoved
- Napovedi
- Napovedna analiza
- Napovedi
- Pripravimo
- priprava
- predpogoji
- predogled
- primarni
- zasebna
- problem
- Težave
- Postopek
- Izdelek
- produktni vodja
- proizvodnja
- profil
- Programiranje
- programskih jezikov
- zaščito
- zagotavljajo
- zagotavlja
- Namen
- kakovost
- vprašanja
- Hitri
- hitro
- ocenjene
- ocena
- ocen
- Preberi
- reading
- pripravljen
- Priporočamo
- glejte
- zanašajo
- odstrani
- poročilo
- obvezna
- odporno
- viri
- restavracija
- restavracije
- vloga
- vloge
- s
- sagemaker
- Enako
- Prilagodljivost
- Lestvica
- Znanost
- galerija
- sekundarno
- varnost
- glej
- izberite
- višji
- Občutek
- Storitve
- Zasedanje
- nastavitev
- je pokazala,
- pokazale
- Razstave
- podpisati
- Enostavno
- sam
- So
- trdna
- Rešitev
- rešitve
- Rešuje
- nekaj
- specialist
- preživeti
- Šport
- sveženj
- Začetek
- Status
- Korak
- Koraki
- shranjeni
- trgovine
- naravnost
- Strategija
- močna
- podomrežja
- uspešno
- taka
- primerna
- miza
- Bodite
- ciljna
- Skupine
- tehnični
- tehnika
- Predloga
- da
- O
- njihove
- POTEM
- Tukaj.
- te
- ta
- tisti,
- skozi
- čas
- do
- vrh
- Vlak
- usposabljanje
- Transform
- Preoblikovanje
- transformacije
- preoblikovati
- tip
- nepotrebna
- uporaba
- uporabnik
- uporabo
- vrednost
- Vrednote
- Poglej
- praktično
- vizualna
- Počakaj
- želeli
- je
- gledanju
- we
- web
- spletne storitve
- kdaj
- ki
- medtem
- bo
- z
- v
- brez
- delo
- delal
- deluje
- deluje
- vredno
- pisanje
- let
- Vi
- Vaša rutina za
- zefirnet