Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Az Amazon SageMaker Autopilot mostantól támogatja az idősoros adatokat

Amazon SageMaker Autopilot automatikusan összeállítja, betanítja és hangolja a legjobb gépi tanulási (ML) modelleket az Ön adatai alapján, miközben lehetővé teszi a teljes irányítás és láthatóság fenntartását. Nemrég bejelentettük idősoros adatok támogatása az Autopilotban. Az Autopilot segítségével idősoradatokon vagy általában sorozatadatokon végzett regressziós és osztályozási feladatokat kezelheti. Az idősoradatok a sorozatadatok egy speciális típusa, ahol az adatpontokat egyenletes időközönként gyűjtik össze.

Az adatok kézi előkészítése, a megfelelő ML modell kiválasztása, paramétereinek optimalizálása még egy szakértő szakember számára is összetett feladat. Bár léteznek olyan automatizált megközelítések, amelyek meg tudják találni a legjobb modelleket és paramétereiket, ezek általában nem tudják kezelni a sorozatként érkező adatokat, például a hálózati forgalmat, az áramfogyasztást vagy a háztartási kiadásokat, amelyeket az idő múlásával rögzítettek. Mivel ezek az adatok különböző időpontokban szerzett megfigyelések formáját öltik, az egymást követő megfigyeléseket nem lehet egymástól függetlenként kezelni, és ezeket egészként kell feldolgozni. Az Autopilot a szekvenciális adatokkal kapcsolatos problémák széles körére használható. Például osztályozhatja az idővel rögzített hálózati forgalmat, hogy azonosítsa a rosszindulatú tevékenységeket, vagy meghatározza, hogy az egyének jogosultak-e jelzáloghitelre a hiteltörténetük alapján. Ön biztosít egy adatkészletet, amely idősor-adatokat tartalmaz, az Autopilot pedig kezeli a többit, feldolgozza a szekvenciális adatokat speciális jellemző transzformációk révén, és megtalálja a legjobb modellt az Ön nevében.

Az Autopilot kiküszöböli az ML-modellek felépítésének nehéz terheit, és segít automatikusan felépíteni, betanítani és beállítani a legjobb ML-modellt adatai alapján. Az Autopilot számos algoritmust futtat az adatokon, és ezek hiperparamétereit hangolja egy teljesen felügyelt számítási infrastruktúrán. Ebben a bejegyzésben bemutatjuk, hogyan használhatod Robotpilóta osztályozási és regressziós problémák megoldására idősoros adatokon. Az Autopilot modell létrehozására és betanítására vonatkozó utasításokért lásd: Ügyféllemorzsolódás előrejelzése az Amazon SageMaker Autopilot segítségével.

Idősoros adatok osztályozása Autopilot segítségével

Futó példaként egy többosztályos problémát tekintünk az idősoron adatbázisba UWaveGestureLibraryX, amely a gyorsulásmérő érzékelőinek egyenlő távolságra történő leolvasását tartalmazza, miközben nyolc előre meghatározott kézmozdulat egyikét hajtja végre. Az egyszerűség kedvéért csak a gyorsulásmérő X dimenzióját vesszük figyelembe. A feladat egy olyan osztályozási modell felépítése, amely leképezi az idősorok adatait az érzékelő leolvasásaiból az előre meghatározott gesztusokhoz. A következő ábra az adatkészlet első sorait mutatja CSV formátumban. A teljes táblázat 896 sorból és két oszlopból áll: az első oszlop egy gesztuscímke, a második oszlop pedig az érzékelők leolvasásainak idősora.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Konvertálja az adatokat a megfelelő formátumba az Amazon SageMaker Data Wrangler segítségével

A numerikus, kategorikus és szabványos szövegoszlopok elfogadása mellett az Autopilot mostantól egy sorozatbeviteli oszlopot is elfogad. Ha az idősor adatai nem követik ezt a formátumot, könnyen konvertálhatja azokat Amazon SageMaker Data Wrangler. A Data Wrangler hetekről percekre csökkenti az adatok összesítéséhez és előkészítéséhez szükséges időt az ML-hez. A Data Wrangler segítségével leegyszerűsítheti az adat-előkészítési és szolgáltatástervezési folyamatot, és elvégezheti az adat-előkészítési munkafolyamat minden egyes lépését, beleértve az adatok kiválasztását, tisztítását, feltárását és megjelenítését egyetlen vizuális felületről. Vegyük például ugyanazt az adatkészletet, de más bemeneti formátumban: minden gesztus (az azonosító által meghatározott) a gyorsulásmérő egyenlő távolságra mért méréseinek sorozata. Függőleges tárolás esetén minden sor tartalmaz egy időbélyeget és egy értéket. A következő ábra összehasonlítja ezeket az adatokat eredeti formátumukban és sorozatformátumban.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Ha ezt az adatkészletet a Data Wrangler használatával korábban ismertetett formátumra szeretné konvertálni, töltse be az adatkészletet innen Amazon egyszerű tárolási szolgáltatás (Amazon S3). Ezután használja a idősor Csoportosítás transzformáció szerint, amint az a következő képernyőképen látható, és exportálja vissza az adatokat az Amazon S3-ba CSV formátumban.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Ha az adatkészlet a kijelölt formátumban van, folytathatja az Autopilot funkciót. A Data Wrangler egyéb idősoros transzformátorainak megtekintéséhez lásd: Készítsen idősoros adatokat az Amazon SageMaker Data Wrangler segítségével.

Indítson el egy AutoML-feladatot

Az Autopilot által támogatott többi bemeneti típushoz hasonlóan az adatkészlet minden sora más megfigyelés, és minden oszlop egy szolgáltatás. Ebben a példában egyetlen oszlopot tartalmaz az idősorok adatai, de több idősoroszlop is lehet. Több oszlop is lehet különböző beviteli típusokkal, például idősorokkal, szöveggel és számokkal.

Nak nek hozzon létre egy Autopilot kísérletet, helyezze az adatkészletet egy S3 tárolóba, és hozzon létre egy új kísérletet Amazon SageMaker Studio. Amint az a következő képernyőképen látható, meg kell adnia a kísérlet nevét, az adatkészlet S3 helyét, a kimeneti melléktermékek S3 helyét és az előrejelzett oszlop nevét.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Autopilot analyzes the data, generates ML pipelines, and runs a default 250 iterations of hyperparameter optimization on this classification task. As shown in the following model leaderboard, Autopilot reaches 0.821 accuracy, and you can deploy the best model in just one click.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Ezenkívül az Autopilot generál a adatfeltárási jelentés, ahol megjelenítheti és felfedezheti adatait.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Az átlátszóság az Autopilot alapja. Megtekintheti és módosíthatja a generált ML folyamatokat a jelöltdefiníciós jegyzetfüzetben. A következő képernyőkép bemutatja, hogy az Autopilot hogyan javasol egy sor csővezetéket, kombinálva az idősoros transzformátort TSFeatureExtractor különböző ML-algoritmusokkal, például gradiens-növelt döntési fákkal és lineáris modellekkel. Az TSFeatureExtractor idősor-funkciók százait bontja ki az Ön számára, amelyeket azután a downstream algoritmusokhoz táplálnak, hogy előrejelzéseket készítsenek. Az idősor-funkciók teljes listáját lásd: Áttekintés a kivont funkciókról.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Következtetés

Ebben a bejegyzésben bemutattuk, hogyan használható a SageMaker Autopilot az idősorok osztályozási és regressziós problémáinak néhány kattintással történő megoldására.

Az Autopilottal kapcsolatos további információkért lásd: Amazon SageMaker Autopilot. A SageMaker kapcsolódó funkcióinak felfedezéséhez lásd: Amazon SageMaker Data Wrangler.


A szerzőkről

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.Nyikita Ivkin az Amazon SageMaker Data Wrangler alkalmazott tudósa.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.Anne Milbert szoftverfejlesztő mérnök, aki az Amazon SageMaker automatikus modellhangolásán dolgozik.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.Valerio Perrone Alkalmazott tudományos menedzser, aki az Amazon SageMaker Automatic Model Tuning és Autopilot területén dolgozik.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai.Meghana Satish szoftverfejlesztő mérnök, aki az Amazon SageMaker automatikus modellhangolásán dolgozik.

Amazon SageMaker Autopilot now supports time series data PlatoBlockchain Data Intelligence. Vertical Search. Ai. Ali Takbiri az AI/ML specialista Solutions Architect, és a Machine Learning segítségével segíti ügyfeleit üzleti kihívásaik megoldásában az AWS felhőben.

Időbélyeg:

Még több AWS gépi tanulás