Importáljon adatokat több mint 40 adatforrásból a kód nélküli gépi tanuláshoz az Amazon SageMaker Canvas segítségével

Importáljon adatokat több mint 40 adatforrásból a kód nélküli gépi tanuláshoz az Amazon SageMaker Canvas segítségével

Az adatok a gépi tanulás (ML) középpontjában állnak. Az üzleti probléma átfogó bemutatása érdekében releváns adatok megadása biztosítja, hogy hatékonyan rögzítse a trendeket és kapcsolatokat, így az üzleti döntések meghozatalához szükséges betekintést nyerhet. Val vel Amazon SageMaker Canvas, most már importálhat adatokat innen több mint 40 adatforrás kód nélküli ML-hez kell használni. A Canvas kibővíti az ML-hez való hozzáférést azáltal, hogy az üzleti elemzők számára vizuális felületet biztosít, amely lehetővé teszi számukra, hogy maguk generáljanak pontos ML-előrejelzéseket – anélkül, hogy bármilyen ML-tapasztalatot igényelnének, vagy egyetlen kódsort kellene írniuk. Mostantól adatokat importálhat az alkalmazáson belül olyan népszerű relációs adattárakból, mint pl Amazon Athéné által támogatott harmadik féltől származó szoftverek (SaaS) platformok Amazon App Flow például a Salesforce, az SAP OData és a Google Analytics.

Az ML-hez szükséges jó minőségű adatok gyűjtésének folyamata bonyolult és időigényes lehet, mivel a SaaS-alkalmazások és adattárolási szolgáltatások elterjedése számos rendszeren keresztül az adatok megoszlását hozta létre. Előfordulhat például, hogy vevői lemorzsolódási elemzést kell végeznie a Salesforce ügyféladatai, az SAP pénzügyi adatai és a Snowflake logisztikai adatai alapján. Ha ezeken a forrásokon keresztül szeretne adatkészletet létrehozni, minden egyes alkalmazásba külön-külön be kell jelentkeznie, ki kell választania a kívánt adatokat, majd helyileg exportálnia kell azokat, ahol aztán egy másik eszközzel összesítheti. Ezt az adatkészletet ezután egy különálló ML-alkalmazásba kell importálni.

Ezzel a bevezetéssel a Canvas lehetővé teszi, hogy hasznot húzzon a különböző forrásokban tárolt adatokból, mivel támogatja az alkalmazáson belüli adatimportálást és -összesítést több mint 40 adatforrásból. Ezt a funkciót az Athena és az Amazon AppFlow új natív csatlakozói teszik lehetővé AWS ragasztó Adatkatalógus. Az Amazon AppFlow egy felügyelt szolgáltatás, amely lehetővé teszi az adatok biztonságos átvitelét harmadik féltől származó SaaS-alkalmazásokból Amazon egyszerű tárolási szolgáltatás (Amazon S3), és néhány kattintással katalogizálja az adatokat az Adatkatalógussal. Az adatok átvitele után egyszerűen hozzáférhet az adatforráshoz a Canvason belül, ahol megtekintheti a táblasémákat, egyesítheti a táblákat adatforrásokon belül vagy között, írhat Athena-lekérdezéseket, valamint megtekintheti és importálhatja adatait. Az adatok importálása után használhatja a meglévő Canvas-funkciókat, például ML-modell felépítését, oszlophatásadatok megtekintését vagy előrejelzések generálását. Automatizálhatja az adatátviteli folyamatot az Amazon AppFlow-ban, hogy ütemezetten aktiválódjon, hogy mindig hozzáférjen a Canvas legújabb adataihoz.

Megoldás áttekintése

Az ebben a bejegyzésben felvázolt lépések két példát adnak arra, hogyan importálhat adatokat a Canvasba kód nélküli ML-hez. Az első példában bemutatjuk, hogyan importálhatunk adatokat az Athénén keresztül. A második példában bemutatjuk, hogyan importálhatunk adatokat egy harmadik fél SaaS-alkalmazásából az Amazon AppFlow segítségével.

Adatok importálása az Athénából

Ebben a részben egy példát mutatunk be az adatok Canvasba történő importálására az Athénából az ügyfélszegmentációs elemzés elvégzéséhez. Létrehozunk egy ML besorolási modellt, hogy vásárlóink ​​négy különböző osztályba sorolhatók legyenek, és a végső cél, hogy a modell segítségével előre jelezzük, melyik osztályba fog tartozni egy új ügyfél. Három fő lépést követünk: adatok importálása, modell betanítása és előrejelzések generálása. Kezdjük el.

Importálja az adatokat

Ha adatokat szeretne importálni az Athénából, hajtsa végre a következő lépéseket:

  1. A Canvas konzolon válassza a lehetőséget Datasets a navigációs ablakban, majd válassza a lehetőséget import.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Bontsa ki a Adatforrás menüben és válasszon Athéné.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  3. Válassza ki a megfelelő adatbázist és táblát, amelyből importálni szeretne. Opcionálisan megtekintheti a táblázat előnézetét az előnézet ikon kiválasztásával.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A következő képernyőképen egy példa látható az előnézeti táblázatra.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Példánkban az ügyfeleket azon marketingcsatorna alapján szegmentáljuk, amelyen keresztül igénybe vették szolgáltatásainkat. Ezt az oszlop adja meg segmentation, ahol A a nyomtatott sajtó, B a mobil, C a bolti promóciók és D a televízió.

  1. Ha meggyőződött arról, hogy megvan a megfelelő táblázat, húzza a kívánt táblázatot a A csatlakozáshoz húzza át az adatkészleteket szakasz.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Mostantól opcionálisan kijelölhet vagy törölhet oszlopokat, összekapcsolhat táblázatokat úgy, hogy egy másik táblázatot húz a A csatlakozáshoz húzza át az adatkészleteket szakaszban, vagy írjon SQL-lekérdezéseket az adatszelet megadásához. Ehhez a bejegyzéshez a táblázat összes adatát felhasználjuk.
  3. Az adatok importálásához válassza a lehetőséget Adatok importálása.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Adatait a rendszer adatkészletként importálja a Canvasba az Athena adott táblájából.

Taníts modellt

Az adatok importálása után megjelennek a Datasets oldalon. Ebben a szakaszban modellt készíthet. Ehhez hajtsa végre a következő lépéseket:

  1. Válassza ki az adatkészletet, és válassza ki Hozzon létre egy modellt.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. A Modell név, írja be a modell nevét (ebben a bejegyzésben, my_first_model).
  3. A Canvas segítségével modelleket hozhat létre prediktív elemzéshez, képelemzéshez és szövegelemzéshez. Mivel szeretnénk kategorizálni az ügyfeleket, válassz Prediktív elemzés mert Probléma típusa.
  4. A folytatáshoz válassza a lehetőséget Teremt.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A Épít oldalon megtekintheti az adatkészletre vonatkozó statisztikákat, például a hiányzó értékek százalékos arányát és az adatok átlagát.

  1. A Céloszlop, válasszon egy oszlopot (ehhez a bejegyzéshez, segmentation).
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A Canvas kétféle modellt kínál, amelyek előrejelzéseket generálhatnak. A gyors felépítés a sebességet részesíti előnyben a pontossággal szemben, így 2–15 perc alatt elkészül a modell. A szabványos összeállítás a pontosságot helyezi előtérbe a sebességgel szemben, így 2–4 óra alatt elkészül a modell.

  1. Ehhez a bejegyzéshez válassza a lehetőséget Gyors felépítés.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. A modell betanítása után elemezheti a modell pontosságát.

A következő modell az esetek 94.67%-ában helyesen kategorizálja az ügyfeleket.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

  1. Opcionálisan azt is megtekintheti, hogy az egyes oszlopok hogyan befolyásolják a kategorizálást. Ebben a példában az ügyfél öregedésével az oszlop kevésbé befolyásolja a kategorizálást. Ha előrejelzéseket szeretne generálni az új modellel, válassza a lehetőséget Tippelje.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Előrejelzések generálása

A Tippelje lapon csoportos előrejelzéseket és egyedi előrejelzéseket is generálhat. Hajtsa végre a következő lépéseket:

  1. Ehhez a bejegyzéshez válassza a lehetőséget Egyetlen jóslat hogy megértsük, milyen ügyfélszegmentáció eredményez egy új ügyfél számára.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Előrejelzésünkhöz azt szeretnénk megérteni, milyen szegmentációjú lesz az ügyfél, ha 32 éves, és szakmáját tekintve jogász.

  1. Cserélje ki a megfelelő értékeket ezekkel a bemenetekkel.
  2. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Frissítések.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A frissített előrejelzés megjelenik az előrejelzési ablakban. Ebben a példában egy 32 éves ügyvéd a D szegmensbe van besorolva.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Importáljon adatokat egy harmadik fél SaaS-alkalmazásából az AWS-be

Ha harmadik féltől származó SaaS-alkalmazásokból szeretne adatokat importálni a Canvasba kód nélküli ML-hez, először át kell vinnie az adatokat az alkalmazásból az Amazon S3-ba az Amazon AppFlow segítségével. Ebben a példában gyártási adatokat viszünk át az SAP OData-ból.

Az adatok átviteléhez hajtsa végre a következő lépéseket:

  1. Az Amazon AppFlow konzolon válassza a lehetőséget Folyamat létrehozása.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. A Flow név, írjon be egy nevet.
  3. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Következő.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  4. A Forrás neve, válassza ki a kívánt harmadik féltől származó SaaS-alkalmazást (ebben a bejegyzésben az SAP OData).
  5. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Hozzon létre új kapcsolatot.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  6. A Csatlakozzon az SAP OData-hoz felugró ablakban, töltse ki a hitelesítési adatokat, és válassza ki Csatlakozás.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  7. A SAP OData objektum, válassza ki az adatait tartalmazó objektumot az SAP OData-n belül.
  8. A Úticél neve, választ Amazon S3.
  9. A Vödör részletei, adja meg az S3 vödör adatait.
  10. választ Katalogizálja adatait az AWS ragasztóadat-katalógusában.
  11. A Felhasználói szerep, válaszd a AWS Identity and Access Management (IAM) szerepkör, amelyből a Canvas felhasználó hozzáfér az adatokhoz.
  12. A Áramlásindítóválassza Fuss igény szerint.

Alternatív megoldásként a kiválasztással automatizálhatja az áramlás átvitelét Futtassa az áramlást az ütemezés szerint.

  1. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Következő.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  2. Válassza ki a mezők leképezési módját, és fejezze be a mezőleképezést. Ehhez a bejegyzéshez, mivel nincs megfelelő céladatbázis, amelyhez leképezni lehetne, nem kell megadni a leképezést.
  3. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Következő.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  4. Ha szükséges, adjon hozzá szűrőket az adatátvitel korlátozásához.
  5. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Következő.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.
  6. Tekintse át adatait, és válasszon Folyamat létrehozása.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A folyamat létrehozásakor egy zöld szalag jelenik meg az oldal tetején, jelezve a sikeres frissítést.

  1. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Futtassa az áramlást.
    Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Ebben a szakaszban sikeresen átvitte adatait az SAP OData-ból az Amazon S3-ba.

Most már importálhatja az adatokat a Canvas alkalmazásból. Az adatok Canvasból történő importálásához kövesse a következőben leírtakat Adatok importálása szakasz a bejegyzés korábbi részében. Ebben a példában a Adatforrás legördülő menü a Adatok importálása oldalon, láthatod SAP OData szerepel.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Mostantól használhatja az összes meglévő Canvas-funkciót, például az adatok megtisztítását, az ML-modell felépítését, az oszlophatásadatok megtekintését és az előrejelzések generálását.

Tisztítsuk meg

A rendelkezésre álló erőforrások megtisztításához lépjen ki a Canvas alkalmazásból a kiválasztással Kijelentkezés a navigációs ablaktáblában.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Következtetés

A Canvas segítségével immár 47 adatforrásból importálhat adatokat kód nélküli ML-hez az Athena és az Amazon AppFlow natív csatlakozókon keresztül az AWS ragasztóadat-katalógusán keresztül. Ez a folyamat lehetővé teszi az adatok közvetlen elérését és összesítését a Canvas adatforrásai között, miután az adatokat az Amazon AppFlow-on keresztül továbbította. Automatizálhatja az adatátvitelt az ütemezett aktiváláshoz, ami azt jelenti, hogy az adatok frissítéséhez nem kell újra végigmennie a folyamaton. Ezzel a folyamattal új adatkészleteket hozhat létre a legfrissebb adataival anélkül, hogy ki kellene hagynia a Canvas alkalmazást. Ez a funkció mostantól minden AWS-régióban elérhető, ahol a Canvas elérhető. Az adatok importálásának megkezdéséhez lépjen a Canvas konzolra, és kövesse az ebben a bejegyzésben ismertetett lépéseket. További információért lásd: Csatlakozás adatforrásokhoz.


A szerzőkről

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.Brandon Nair az Amazon SageMaker Canvas vezető termékmenedzsere. Szakmai érdeklődése a méretezhető gépi tanulási szolgáltatások és alkalmazások létrehozásában rejlik. Munkán kívül a nemzeti parkok felfedezése, a golf swing tökéletesítése vagy egy kalandtúra tervezése során találkozhat vele.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.Sanjana Kambalapally az AWS Sagemaker Canvas szoftverfejlesztési menedzsere, amelynek célja a gépi tanulás demokratizálása kód nélküli ML alkalmazások létrehozásával.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.Xin Xu szoftverfejlesztő mérnök a Canvas csapatában, ahol adat-előkészítéssel foglalkozik, többek között a kód nélküli gépi tanulási termékek terén. Szabadidejében szívesen kocog, olvas és filmeket néz.

Import data from over 40 data sources for no-code machine learning with Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertical Search. Ai.Volkan Unsal Sr. Frontend Engineer a Canvas csapatban, ahol kód nélküli termékeket készít, hogy a mesterséges intelligenciát elérhetővé tegye az emberek számára. Szabadidejében szívesen fut, olvas, nézi az e-sportot és a harcművészeteket.

Időbélyeg:

Még több AWS gépi tanulás