Amazon SageMaker Autopilot egy automatizált gépi tanulási (AutoML) megoldás, amely elvégzi a teljes körű gépi tanulási (ML) munkafolyamat elvégzéséhez szükséges összes feladatot. Feltárja és előkészíti az adatokat, különböző algoritmusokat alkalmaz egy modell létrehozásához, és átlátható módon modellbetekintést és magyarázhatósági jelentéseket biztosít az eredmények értelmezéséhez. Az Autopilot valós idejű végpontot is létrehozhat az online következtetéshez. Az Autopilot egy kattintással elérhető funkcióit itt érheti el Amazon SageMaker Studio vagy a AWS SDK Pythonhoz (Boto3) vagy a SageMaker Python SDK.
Ebben a bejegyzésben bemutatjuk, hogyan készíthetünk kötegelt előrejelzéseket egy címkézetlen adatkészleten egy Autopilot által betanított modell segítségével. Szintetikusan előállított adatkészletet használunk, amely az ügyfelek lemorzsolódásának előrejelzésekor jellemzően látható funkciókat jelzi.
Megoldás áttekintése
Batch következtetés, ill Nem elérhető következtetés, a megfigyelések kötegére vonatkozó előrejelzések generálásának folyamata. A kötegelt következtetés feltételezi, hogy nincs szüksége azonnali válaszra a modell előrejelzési kérésére, ahogyan egy online, valós idejű modellvégpont használatakor tenné. Az offline előrejelzések nagyobb adatkészletekhez és olyan esetekben alkalmasak, amikor megengedheti magának, hogy néhány percet vagy órát várjon a válaszra. Ellentétben, online következtetés valós időben generál ML előrejelzéseket, és találóan hivatkoznak rá real-time következtetés ill dinamikus következtetés. Általában ezek az előrejelzések az adatok egyetlen megfigyelése alapján jönnek létre futás közben.
Az ügyfelek elvesztése minden vállalkozás számára költséges. Az elégedetlen ügyfelek korai felismerése lehetőséget ad arra, hogy ösztönözze őket a maradásra. A mobilszolgáltatók előzményadatokkal rendelkeznek, amelyek azt mutatják, hogy kik szálltak le és kik tartották fenn a szolgáltatást. Ezeket az előzményadatokat felhasználhatjuk egy olyan modell felépítésére, amely megjósolja, hogy az ügyfél lemorzsolódik-e az ML használatával.
Miután betanítottunk egy ML-modellt, átadhatjuk egy tetszőleges ügyfél profilinformációit (ugyanazt a profilinformációt, amelyet a betanításhoz használtunk) a modellnek, és a modell megjósolhatja, hogy az ügyfél lemorzsolódik-e vagy sem. A bejegyzéshez használt adatkészlet a sagemaker-sample-files mappában található egy Amazon egyszerű tárolási szolgáltatás (Amazon S3) nyilvános vödör, amelyet letölthet. 5,000 rekordból áll, ahol minden rekord 21 attribútumot használ egy ismeretlen amerikai mobilszolgáltató ügyfél profiljának leírására. Az attribútumok a következők:
- Állami – az egyesült államokbeli állam, amelyben az ügyfél lakik, kétbetűs rövidítéssel; például TX vagy CA
- Számla hossza – Azon napok száma, amíg ez a fiók aktív volt
- Körzetszám – A megfelelő ügyfél telefonszámának háromjegyű körzetszáma
- WhatsApp/Viber – Fennmaradó hétjegyű telefonszám
- Nemzetközi terv – Nemzetközi hívási előfizetése van: Igen/Nem
- VMail terv – Hangposta funkcióval rendelkezik: Igen/Nem
- VMail üzenet – A hangpostaüzenetek átlagos száma havonta
- nap min – A nap folyamán felhasznált teljes hívási percek száma
- Napi hívások – A nap folyamán kezdeményezett hívások teljes száma
- Napi díj – A nappali hívások számlázott költsége
- Eve Mins, Eve Calls, Eve Charge – Az este folyamán kezdeményezett hívások számlázott költsége
- Éjszakai percek, éjszakai hívások, éjszakai töltés – Az éjszakai hívások számlázott költsége
- Nemzetközi percek, nemzetközi hívások, nemzetközi díj – Nemzetközi hívások számlázott költsége
- CustServ hívások – Ügyfélszolgálatra indított hívások száma
- Köpül? – Az ügyfél elhagyta a szolgáltatást: igaz/hamis
Az utolsó attribútum, a Churn?, az a célattribútum, amelyet az ML-modelltől előre jelezni szeretnénk. Mivel a célattribútum bináris, modellünk bináris előrejelzést hajt végre, más néven bináris osztályozás.
Előfeltételek
Töltse le az adatkészletet a helyi fejlesztői környezetbe, és fedezze fel a következő S3 másolási parancs futtatásával a AWS parancssori interfész (AWS CLI):
Ezután átmásolhatja az adatkészletet egy S3 tárolóba a saját AWS-fiókjában. Ez az Autopilot beviteli helye. Átmásolhatja az adatkészletet az Amazon S3-ra úgy, hogy manuálisan feltölti a tárolóba, vagy futtassa a következő parancsot az AWS CLI használatával:
Hozzon létre egy Autopilot kísérletet
Amikor az adatkészlet készen áll, inicializálhat egy Autopilot kísérletet a SageMaker Studio alkalmazásban. A teljes útmutatásért lásd: Hozzon létre egy Amazon SageMaker Autopilot kísérletet.
Alatt Alapbeállítások, egyszerűen létrehozhat egy Autopilot kísérletet, ha megadja a kísérlet nevét, az adatbeviteli és -kimeneti helyeket, és megadja a megjósolandó céladatokat. Opcionálisan megadhatja a megoldani kívánt ML probléma típusát. Ellenkező esetben használja a kocsi beállítást, és az Autopilot automatikusan meghatározza a modellt az Ön által megadott adatok alapján.
Az Autopilot kísérletet a Pythonhoz készült AWS SDK (Boto3) vagy a SageMaker Python SDK használatával is futtathatja. A következő kódrészlet bemutatja, hogyan lehet inicializálni egy Autopilot kísérletet a SageMaker Python SDK használatával. Használjuk a AutoML osztály a SageMaker Python SDK-ból.
Miután az Autopilot elindít egy kísérletet, a szolgáltatás automatikusan ellenőrzi a nyers bemeneti adatokat, alkalmazza a funkciófeldolgozókat, és kiválasztja a legjobb algoritmuskészletet. Az algoritmus kiválasztása után az Autopilot egy hiperparaméter-optimalizálási keresési folyamat segítségével optimalizálja a teljesítményét. Ezt gyakran a modell betanításának és hangolásának nevezik. Ez végső soron segít egy olyan modell létrehozásában, amely pontosan előrejelzéseket tud készíteni olyan adatokról, amelyeket még soha nem látott. Az Autopilot automatikusan követi a modell teljesítményét, majd rangsorolja a végső modelleket a modell pontosságát és pontosságát leíró mérőszámok alapján.
Lehetősége van a rangsorolt modellek bármelyikének üzembe helyezésére is, ha kiválasztja a modellt (jobb gombbal), majd kiválasztja Modell telepítése, vagy válassza ki a modellt a rangsorolt listából, és válassza ki Modell telepítése.
Készítsen kötegelt előrejelzéseket az Autopilot modelljével
Amikor az Autopilot-kísérlet befejeződött, a betanított modell segítségével kötegelt előrejelzéseket futtathat a teszten vagy a tartási adatkészleten értékelés céljából. Ezután összehasonlíthatja az előrejelzett címkéket a várt címkékkel, ha a teszt vagy a tartási adatkészlet előre címkézett. Ez lényegében egy módja annak, hogy a modell előrejelzéseit összehasonlítsuk az igazsággal. Ha a modell több előrejelzése egyezik a valódi címkékkel, általában jól teljesítő kategóriába sorolhatjuk a modellt. A címkézetlen adatok címkézéséhez kötegelt előrejelzéseket is futtathat. Ugyanezt könnyedén elérheti a magas szintű, néhány soros kóddal rendelkező SageMaker Python SDK használatával.
Írjon le egy korábban futtatott Autopilot kísérletet
Először egy korábban befejezett Autopilot kísérletből kell kinyernünk az információkat. A SageMaker Python SDK AutoML osztályát használhatjuk egy olyan automl objektum létrehozására, amely egy korábbi Autopilot kísérlet információit tartalmazza. Használhatja az Autopilot kísérlet inicializálása során megadott kísérlet nevét. Lásd a következő kódot:
Az automl objektum segítségével egyszerűen leírhatjuk és újra létrehozhatjuk a legjobban képzett modellt, amint azt a következő részletek mutatják:
Bizonyos esetekben előfordulhat, hogy az Autopilot által besorolt legjobb modelltől eltérő modellt szeretne használni. Egy ilyen jelölt modell megtalálásához használhatja az automl objektumot, és ismételheti az összes vagy a legnépszerűbb N modelljelölt listáját, és kiválaszthatja az újra létrehozni kívánt modellt. Ehhez a bejegyzéshez egy egyszerű Python For ciklust használunk a modelljelöltek listáján való iterációhoz:
A következtetési válasz testreszabása
Az Autopilot által betanított modellek legjobb vagy bármely más modelljének újraalkotásakor testreszabhatjuk a modellhez tartozó következtetési választ az extra paraméter hozzáadásával. inference_response_keys
, amint az az előző példában látható. Ezt a paramétert bináris vagy többosztályos osztályozási problématípusokhoz egyaránt használhatja:
- előrejelzett_címke – A megjósolt osztály.
- valószínűség – Bináris besorolásnál annak a valószínűsége, hogy az eredményt a céloszlop második vagy igaz osztályaként jósolják meg. Többosztályos besorolásban a győztes osztály valószínűsége.
- címkék – Az összes lehetséges osztály listája.
- valószínűségek – Az összes valószínűség listája az összes osztályhoz (a sorrend megfelel a címkéknek).
Mivel a probléma, amellyel ebben a bejegyzésben foglalkozunk, a bináris osztályozás, a modellek létrehozásakor a következőképpen állítottuk be ezt a paramétert az előző részletekben:
Hozzon létre transzformátort, és futtasson kötegelőrejelzéseket
Végül, miután újra létrehoztuk a jelölt modelleket, létrehozhatunk egy transzformátort a kötegelőrejelzési feladat elindításához, amint azt a következő két kódrészlet mutatja. A transzformátor létrehozásakor meghatározzuk a fürt specifikációit a kötegelt feladat futtatásához, például a példányszámot és a típust. A kötegelt bemenet és kimenet az Amazon S3 helyek, ahol az adatbeviteleink és -kimeneteink tárolódnak. A kötegelt előrejelzési feladatot a SageMaker kötegelt transzformáció.
Amikor a feladat befejeződött, beolvashatjuk a kötegelt kimenetet, és kiértékeléseket és egyéb downstream műveleteket hajthatunk végre.
Összegzésként
Ebben a bejegyzésben bemutattuk, hogyan készíthet gyorsan és egyszerűen kötegelt előrejelzéseket az Autopilot által kiképzett modellek használatával a képzés utáni értékelésekhez. A SageMaker Studio segítségével inicializáltunk egy Autopilot kísérletet, hogy modellt hozzunk létre az ügyfelek lemorzsolódásának előrejelzésére. Ezután hivatkoztunk az Autopilot legjobb modelljére a kötegelt előrejelzések futtatásához az automl osztály használatával a SageMaker Python SDK-val. Az SDK-t arra is használtuk, hogy kötegelt előrejelzéseket hajtsunk végre más modelljelöltekkel. Az Autopilot segítségével automatikusan feltártuk és előfeldolgoztuk adatainkat, majd egyetlen kattintással több ML-modellt hoztunk létre, így a SageMaker gondoskodhat a modelljeink betanításához és hangolásához szükséges infrastruktúra kezeléséről. Végül kötegelt transzformációt használtunk, hogy a modellünkkel előrejelzéseket készítsünk minimális kód használatával.
Az Autopilotról és speciális funkcióiról további információért lásd: Automatizálja a modellfejlesztést az Amazon SageMaker Autopilot segítségével. A bejegyzésben szereplő példa részletes áttekintéséhez vessen egy pillantást a következőkre példafüzet.
A szerzőkről
Arunprasath Shankar a mesterséges intelligencia és a gépi tanulás (AI/ML) specialistája az AWS-vel, segít a globális ügyfeleknek mesterséges intelligencia-megoldásaik hatékony és eredményes felhőben történő méretezésében. Szabadidejében Arun szívesen néz sci-fi filmeket és hallgat klasszikus zenét.
Peter Chung az AWS megoldástervezője, és szenvedélyesen segíti az ügyfeleket, hogy betekintést nyerjenek adataikból. Olyan megoldásokat épített, amelyek segítik a szervezeteket adatvezérelt döntések meghozatalában mind az állami, mind a magánszektorban. Az összes AWS-tanúsítvánnyal, valamint két GCP-tanúsítvánnyal rendelkezik. Szeret kávézni, főzni, aktív marad, és a családjával tölti az idejét.
- Coinsmart. Európa legjobb Bitcoin- és kriptográfiai tőzsdéje.
- Platoblockchain. Web3 metaverzum intelligencia. Felerősített tudás. SZABAD HOZZÁFÉRÉS.
- CryptoHawk. Altcoin radar. Ingyenes próbaverzió.
- Forrás: https://aws.amazon.com/blogs/machine-learning/make-batch-predictions-with-amazon-sagemaker-autopilot/
- "
- 000
- 100
- Rólunk
- hozzáférés
- Fiók
- cselekvések
- aktív
- fejlett
- AI
- algoritmus
- algoritmusok
- Minden termék
- amazon
- TERÜLET
- mesterséges
- mesterséges intelligencia
- Mesterséges intelligencia és gépi tanulás
- Automatizált
- átlagos
- AWS
- BEST
- határ
- Épület
- üzleti
- ami
- esetek
- besorolás
- felhő
- kód
- Kávé
- Oszlop
- létrehozása
- Ügyfelek
- dátum
- telepíteni
- Fejlesztés
- különböző
- Korai
- könnyen
- Endpoint
- Környezet
- példa
- végrehajtás
- várható
- kísérlet
- család
- Funkció
- Jellemzők
- vezetéknév
- következő
- Tele
- generál
- Globális
- segít
- segít
- történeti
- tart
- Hogyan
- How To
- HTTPS
- azonnali
- információ
- Infrastruktúra
- meglátások
- Intelligencia
- Nemzetközi
- IT
- Munka
- Állások
- ismert
- Címkék
- nagyobb
- tanulás
- vonal
- Lista
- Kihallgatás
- helyi
- elhelyezkedés
- helyszínek
- gép
- gépi tanulás
- kezelése
- kézzel
- Mérkőzés
- Metrics
- ML
- Mobil
- modell
- modellek
- Filmek
- zene
- szám
- ajánlat
- online
- optimalizálás
- opció
- érdekében
- szervezetek
- Más
- másképp
- teljesítmény
- lehetséges
- előrejelzés
- Tippek
- magán
- Probléma
- folyamat
- gyárt
- profil
- ad
- biztosít
- nyilvános
- gyorsan
- Nyers
- real-time
- rekord
- nyilvántartások
- Jelentések
- válasz
- Eredmények
- futás
- futás
- Skála
- sdk
- Keresés
- ágazatok
- szolgáltatás
- készlet
- beállítás
- Egyszerű
- Megoldások
- SOLVE
- Költési
- kezdet
- Állami
- tartózkodás
- tárolás
- stúdió
- cél
- feladatok
- teszt
- Keresztül
- idő
- felső
- Képzések
- Átalakítás
- TX
- feltárni
- us
- használ
- Hang
- várjon
- vajon
- WHO
- belül