Használja az Amazon DocumentDB-t kód nélküli gépi tanulási megoldások létrehozásához az Amazon SageMaker Canvas | Amazon webszolgáltatások

Használja az Amazon DocumentDB-t kód nélküli gépi tanulási megoldások létrehozásához az Amazon SageMaker Canvas | Amazon webszolgáltatások

Örömmel jelentjük be az indulást Amazon DocumentDB (MongoDB-kompatibilitással) integráció a Amazon SageMaker Canvas, amely lehetővé teszi az Amazon DocumentDB ügyfelei számára, hogy kódírás nélkül generatív AI és gépi tanulási (ML) megoldásokat építsenek és használhassanak. Az Amazon DocumentDB egy teljesen felügyelt natív JSON-dokumentumadatbázis, amely egyszerűvé és költséghatékonysá teszi a kritikus dokumentum-munkaterhelések kezelését gyakorlatilag bármilyen léptékben, infrastruktúra kezelése nélkül. Az Amazon SageMaker Canvas egy kód nélküli ML munkaterület, amely használatra kész modelleket kínál, beleértve az alapmodelleket, valamint lehetőséget ad adatok előkészítésére, valamint egyedi modellek létrehozására és telepítésére.

Ebben a bejegyzésben megvitatjuk, hogyan vihetjük be az Amazon DocumentDB-ben tárolt adatokat a SageMaker Canvasba, és hogyan használhatjuk fel ezeket az adatokat ML-modellek felépítésére a prediktív elemzéshez. Adatfolyamatok létrehozása és karbantartása nélkül képes lesz az ML-modellek működtetésére az Amazon DocumentDB-ben tárolt strukturálatlan adataival.

Megoldás áttekintése

Vegyük fel egy élelmiszer-kiszállító cég üzleti elemzőjének szerepét. Mobilalkalmazása az Amazon DocumentDB-ben tárol információkat az éttermekről a méretezhetőség és a rugalmas sémaképesség miatt. Betekintést szeretne szerezni ezekből az adatokból, és egy ML-modellt szeretne felépíteni az új éttermek besorolásának előrejelzésére, de kihívást jelent a strukturálatlan adatok elemzése. Szűk keresztmetszetekbe ütközik, mert adatmérnöki és adattudományi csapatokra kell támaszkodnia e célok eléréséhez.

Ez az új integráció megoldja ezeket a problémákat azáltal, hogy egyszerűvé teszi az Amazon DocumentDB adatainak a SageMaker Canvasba való bejuttatását, és azonnal megkezdheti az adatok előkészítését és elemzését az ML számára. Ezenkívül a SageMaker Canvas megszünteti az ML-szakértelemtől való függőséget, hogy kiváló minőségű modelleket készítsen és előrejelzéseket generáljon.

A következő lépésekben bemutatjuk, hogyan lehet az Amazon DocumentDB adatait felhasználni ML-modellek felépítéséhez a SageMaker Canvasban:

  1. Hozzon létre egy Amazon DocumentDB-összekötőt a SageMaker Canvasban.
  2. Az adatok elemzése generatív mesterséges intelligencia segítségével.
  3. Adatok előkészítése a gépi tanuláshoz.
  4. Készítsen modellt és készítsen előrejelzéseket.

Előfeltételek

A megoldás megvalósításához teljesítse a következő előfeltételeket:

  1. Rendeljen AWS Cloud rendszergazdai hozzáférést egy AWS Identity and Access Management (AMI) használó az integráció befejezéséhez szükséges engedélyekkel.
  2. Fejezze be a környezet beállítását a segítségével AWS felhőképződés az alábbi lehetőségek egyikén keresztül:
    1. Telepítsen egy CloudFormation sablont egy új VPC-be – Ez az opció egy új AWS-környezetet hoz létre, amely a VPC-ből, privát alhálózatokból, biztonsági csoportokból, IAM-végrehajtási szerepkörökből áll, Amazon Cloud 9, szükséges VPC végpontokatés SageMaker domain. Ezután telepíti az Amazon DocumentDB-t ebben az új VPC-ben. Töltse le a sablon vagy gyorsan indítsa el a CloudFormation verem kiválasztásával Indítsa el a Stack alkalmazást:
      Indítsa el a CloudFormation veremet
    2. Telepítsen egy CloudFormation sablont egy meglévő VPC-be – Ez a beállítás létrehozza a szükséges VPC-végpontokat, IAM-végrehajtási szerepköröket és SageMaker-tartományt egy meglévő VPC-ben, privát alhálózatokkal. Töltse le a sablon vagy gyorsan indítsa el a CloudFormation verem kiválasztásával Indítsa el a Stack alkalmazást:
      Indítsa el a CloudFormation veremet

Vegye figyelembe, hogy ha új SageMaker tartományt hoz létre, akkor a tartományt internet-hozzáférés nélküli privát VPC-re kell konfigurálnia, hogy hozzáadhassa a csatlakozót az Amazon DocumentDB-hez. További információért lásd: Konfigurálja az Amazon SageMaker Canvast egy internet-hozzáférés nélküli VPC-n.

  1. Kövesse a oktatói mintaéttermi adatok betöltéséhez az Amazon DocumentDB-be.
  2. Adjon hozzá hozzáférést az Amazon Bedrockhoz és az Anthropic Claude modellhez. További információkért lásd Modellhozzáférés hozzáadása.

Hozzon létre egy Amazon DocumentDB-összekötőt a SageMaker Canvasban

A SageMaker domain létrehozása után hajtsa végre a következő lépéseket:

  1. Az Amazon DocumentDB konzolon válassza a lehetőséget Kód nélküli gépi tanulás a navigációs ablaktáblában.
  2. Alatt Válasszon domaint és profilt¸ válassza ki SageMaker domainjét és felhasználói profilját.
  3. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Indítsa el a Canvast a SageMaker Canvast elindításához egy új lapon.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Amikor a SageMaker Canvas betöltése befejeződik, a következőre kerül Adatfolyamok Tab.

  1. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Teremt új adatfolyam létrehozásához.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Adjon nevet az adatfolyamnak, és válassza ki Teremt.
  3. Adjon hozzá egy új Amazon DocumentDB kapcsolatot a kiválasztásával Adatok importálása, majd válassza ki Táblázatos mert Adatkészlet típusa.
  4. A Adatok importálása oldal, mert Adatforrás, választ DocumentDB és a Csatlakozás hozzáadása.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  5. Adjon meg egy kapcsolatnevet, például demo, és válassza ki a kívánt Amazon DocumentDB-fürtöt.

Vegye figyelembe, hogy a SageMaker Canvas előre feltölti a legördülő menüt a SageMaker-domainnel azonos VPC-n lévő fürtökkel.

  1. Adjon meg egy felhasználónevet, jelszót és adatbázisnevet.
  2. Végül válassza ki az olvasási preferenciát.

Az elsődleges példányok teljesítményének védelme érdekében a SageMaker Canvas alapértelmezett értéke Másodlagos, ami azt jelenti, hogy csak másodlagos példányokból fog olvasni. Amikor az olvasási preferencia Másodlagos előnyben, a SageMaker Canvas az elérhető másodlagos példányokból olvas, de az elsődleges példányból olvas, ha másodlagos példány nem érhető el. Az Amazon DocumentDB kapcsolat konfigurálásával kapcsolatos további információkért lásd a Csatlakozzon az AWS-ben tárolt adatbázishoz.

  1. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Csatlakozás hozzáadása.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Ha a kapcsolat sikeres, akkor az Amazon DocumentDB adatbázisában táblázatok formájában jelennek meg a gyűjtemények.

  1. Húzza a választott táblázatot az üres vászonra. Ehhez a bejegyzéshez hozzáadjuk éttermi adatainkat.

Az első 100 sor előnézetként jelenik meg.

  1. Az adatok elemzésének és előkészítésének megkezdéséhez válassza a lehetőséget Adatok importálása.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Adja meg az adatkészlet nevét, és válassza ki Adatok importálása.

Az adatok elemzése generatív mesterséges intelligencia segítségével

Ezután szeretnénk némi betekintést nyerni adatainkra, és mintákat keresni. A SageMaker Canvas természetes nyelvi felületet biztosít az adatok elemzéséhez és előkészítéséhez. Amikor az dátum lap betöltődik, a következő lépésekkel kezdheti meg az adataival való csevegést:

  1. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Chat az adatok előkészítéséhez.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Gyűjtsön betekintést az adatairól a következő képernyőképeken látható mintákhoz hasonló kérdések feltevésével.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Ha többet szeretne megtudni arról, hogyan használhatja a természetes nyelvet adatok feltárásához és előkészítéséhez, tekintse meg a következőt: Használjon természetes nyelvet az adatok felfedezéséhez és előkészítéséhez az Amazon SageMaker Canvas új képességével.

A SageMaker Canvas Data Quality and Insights jelentés segítségével mélyebb képet kaphatunk adatminőségünkről, amely automatikusan értékeli az adatok minőségét és észleli a rendellenességeket.

  1. A elemzések lapot választani Adatminőségi és betekintési jelentés.
  2. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a rating mint a céloszlop és Regresszió problématípusként, majd válassza ki Teremt.

Ez szimulálja a modellképzést, és betekintést nyújt abba, hogyan javíthatjuk adatainkat a gépi tanuláshoz. A teljes jelentés néhány perc alatt elkészül.

Jelentésünk azt mutatja, hogy a célunkban szereplő sorok 2.47%-a tartalmaz hiányzó értékeket – ezt a következő lépésben kezeljük. Ezenkívül az elemzés azt mutatja, hogy a address line 2, nameés type_of_food jellemzői rendelkeznek a legnagyobb előrejelzési erővel adatainkban. Ez azt jelzi, hogy az étterem olyan alapvető információi, mint a hely és a konyha, nagymértékben befolyásolhatják az értékeléseket.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Adatok előkészítése a gépi tanuláshoz

A SageMaker Canvas több mint 300 beépített átalakítást kínál az importált adatok előkészítéséhez. A SageMaker Canvas átalakítási funkcióival kapcsolatos további információkért lásd: Adatok előkészítése speciális átalakításokkal. Adjunk hozzá néhány átalakítást, hogy adatainkat felkészítsük az ML-modell betanítására.

  1. Navigáljon vissza a Adatáramlás oldalt az adatfolyam nevének kiválasztásával az oldal tetején.
  2. Válassza ki a mellette lévő pluszjelet Adattípusok És válasszon Transzformáció hozzáadása.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  3. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Lépés hozzáadása.
  4. Nevezzük át a address line 2 oszlop a cities.
    1. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Oszlopok kezelése.
    2. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Oszlop átnevezése mert Átalakítás.
    3. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a address line 2 mert Beviteli oszlop, belép cities mert Új név, és válasszon hozzáad.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  5. Ezenkívül hagyjon el néhány felesleges oszlopot.
    1. Új transzformáció hozzáadása.
    2. A Átalakítás, választ Dobja el az oszlopot.
    3. A Eldobandó oszlopok, választ URL és a restaurant_id.
    4. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a hozzáad.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.[
  6. termékeink rating jellemző oszlopból hiányzik néhány érték, ezért töltsük ki ezeket a sorokat ennek az oszlopnak az átlagos értékével.
    1. Új transzformáció hozzáadása.
    2. A Átalakítás, választ Impute.
    3. A Oszlop típusa, választ Numerikus.
    4. A Beviteli oszlopok, válaszd a rating oszlop.
    5. A Imputációs stratégia, választ Jelenteni.
    6. A Kimeneti oszlop, belép rating_avg_filled.
    7. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a hozzáad.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  7. Eldobhatjuk a rating oszlopot, mert van egy új oszlopunk kitöltött értékekkel.
  8. Mivel type_of_food kategorikus jellegű, szeretnénk numerikusan kódolni. Kódoljuk ezt a funkciót a one-hot kódolási technikával.
    1. Új transzformáció hozzáadása.
    2. A Átalakítás, választ Egyszeri kódolás.
    3. A beviteli oszlopoknál válassza a lehetőséget type_of_food.
    4. A Érvénytelen kezelési stratégiaválaszt Tart.
    5. A Kimeneti stílusválaszt Oszlopok.
    6. A Kimeneti oszlop, belép encoded.
    7. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a hozzáad.
      Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Készítsen modellt és készítsen előrejelzéseket

Most, hogy átalakítottuk adatainkat, képezzünk ki egy numerikus ML-modellt az éttermek értékelésének előrejelzésére.

  1. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Modell létrehozása.
  2. A Adatkészlet neve, adja meg az adatkészlet exportálásának nevét.
  3. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Export és várja meg az átalakított adatok exportálását.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  4. Válassza a Modell létrehozása linket az oldal bal alsó sarkában.

Az adatkészletet az oldal bal oldalán található Data Wrangler funkcióból is kiválaszthatja.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

  1. Adja meg a modell nevét.
  2. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Prediktív elemzés, majd válassza ki Teremt.
  3. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a rating_avg_filled mint a céloszlop.

A SageMaker Canvas automatikusan kiválasztja a megfelelő modelltípust.

  1. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Modell előnézete hogy ne legyen adatminőségi probléma.
  2. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Gyors felépítés a modell felépítéséhez.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A modell létrehozása körülbelül 2-15 percet vesz igénybe.

Megtekintheti a modell állapotát, miután a modell befejezte a képzést. Modellünk RSME-je 0.422, ami azt jelenti, hogy a modell gyakran előrejelzi egy étterem értékelését a tényleges érték +/- 0.422-es tartományán belül, ami szilárd közelítés az 1-től 6-ig terjedő értékelési skálához.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

  1. Végül minta előrejelzéseket generálhat a következőre navigálva Tippelje Tab.
    Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Tisztítsuk meg

A jövőbeni költségek elkerülése érdekében törölje a bejegyzés követése közben létrehozott forrásokat. A SageMaker Canvas számlát számláz Önnek a munkamenet időtartamára, és azt javasoljuk, hogy jelentkezzen ki a SageMaker Canvasból, ha nem használja. Hivatkozni Kijelentkezés az Amazon SageMaker Canvasból fül alatt találsz.

Következtetés

Ebben a bejegyzésben megvitattuk, hogyan használhatja a SageMaker Canvast generatív AI-hoz és ML-hez az Amazon DocumentDB-ben tárolt adatokkal. Példánkban megmutattuk, hogyan tud egy elemző gyorsan felépíteni egy kiváló minőségű ML-modellt egy mintaéttermi adatkészlet felhasználásával.

Megmutattuk a megoldás megvalósításának lépéseit, az adatok Amazon DocumentDB-ből történő importálásától a SageMaker Canvasban egy ML-modell felépítéséig. Az egész folyamat egy vizuális felületen keresztül ment végbe, egyetlen kódsor megírása nélkül.

Az alacsony kódú/kód nélküli ML utazás megkezdéséhez lásd: Amazon SageMaker Canvas.


A szerzőkről

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Adeleke Coker az AWS globális megoldások építésze. Világszerte együttműködik az ügyfelekkel, hogy útmutatást és technikai segítséget nyújtson a termelési munkaterhelések AWS-en történő nagyszabású telepítéséhez. Szabadidejében szívesen tanul, olvas, játszik és sporteseményeket néz.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Gururaj S Bayari az AWS vezető DocumentDB Specialist Solutions Architect-je. Szívesen segít ügyfeleinek elfogadni az Amazon erre a célra épített adatbázisait. Segít az ügyfeleknek megtervezni, értékelni és optimalizálni internetes léptéküket és nagy teljesítményű, NoSQL és/vagy relációs adatbázisok által működtetett munkaterheléseiket.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Tim Pusateri az AWS vezető termékmenedzsere, ahol az Amazon SageMaker Canvason dolgozik. Célja, hogy segítsen az ügyfeleknek gyorsan levonni az AI/ML értéket. Munkán kívül szeret a szabadban lenni, gitározni, élő zenét nézni, és időt tölt családjával és barátaival.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Pratik Das az AWS termékmenedzsere. Szívesen dolgozik olyan ügyfelekkel, akik rugalmas munkaterhelést és erős adatalapot szeretnének kiépíteni a felhőben. Szakértelmet hoz a vállalkozásokkal való együttműködéshez a modernizációs, elemzési és adatátalakítási kezdeményezésekben.

Use Amazon DocumentDB to build no-code machine learning solutions in Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Varma Gottumukkala a Dallas Fort Worth-i székhelyű AWS vezető adatbázis-specialistája. A Varma együttműködik az ügyfelekkel az adatbázis-stratégián, és az AWS-célra épített adatbázisok segítségével tervezi meg a munkaterhelésüket. Mielőtt csatlakozott volna az AWS-hez, az elmúlt 22 évben sokat dolgozott relációs adatbázisokkal, NOSQL adatbázisokkal és többféle programozási nyelvvel.

Időbélyeg:

Még több AWS gépi tanulás