Építsen nagy teljesítményű képosztályozási modelleket az Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.

Építsen nagy teljesítményű képosztályozási modelleket az Amazon SageMaker JumpStart segítségével

A képosztályozás egy számítógépes látás alapú gépi tanulási (ML) technika, amely lehetővé teszi a képek osztályozását. A képek osztályozásának néhány jól ismert példája a kézzel írt számjegyek osztályozása, az orvosi képek osztályozása és az arcfelismerés. A képbesorolás hasznos technika számos üzleti alkalmazásban, de egy jó képosztályozási modell felépítése nem triviális.

Az ML-modell értékelésénél több szempont is szerepet játszhat. A modell pontosságán túl további fontos mérőszámok a modell betanítási ideje és a következtetési idő. Tekintettel az ML-modellfejlesztés iteratív jellegére, a gyorsabb betanítási idők lehetővé teszik az adatkutatók számára, hogy gyorsan teszteljenek különféle hipotéziseket. A gyorsabb következtetés kritikus lehet a valós idejű alkalmazásokban.

Amazon SageMaker JumpStart Egykattintásos finomhangolást és előre betanított modellek széles skáláját kínálja a népszerű ML-feladatok között, valamint számos olyan átfogó megoldást, amelyek megoldják a gyakori üzleti problémákat. Ezek a funkciók eltávolítják az ML folyamat minden egyes lépéséből adódó nehézségeket, megkönnyítve a kiváló minőségű modellek fejlesztését, és lerövidítve a telepítéshez szükséges időt. JumpStart API-k lehetővé teszi a JumpStart által támogatott előre betanított modellek hatalmas választékának programozott telepítését és finomhangolását saját adatkészletein.

A telepítés előtt fokozatosan betaníthatja és hangolhatja a JumpStartban kínált ML modelleket. A cikk írásakor 87 mély tanuláson alapuló képosztályozási modell érhető el a JumpStartban.

De melyik modell adja a legjobb eredményt? Ebben a bejegyzésben bemutatunk egy módszertant több modell egyszerű futtatásához és kimeneteik összehasonlításához három érdekes dimenzióban: a modell pontossága, a betanítási idő és a következtetési idő.

Megoldás áttekintése

A JumpStart lehetővé teszi a modellek betanítását, hangolását és üzembe helyezését akár a JumpStart konzolról, annak felhasználói felületével vagy API-jával. Ebben a bejegyzésben az API útvonalat használjuk, és bemutatunk egy notebookot különféle segédszkriptekkel. Futtathatja ezt a notebookot, és eredményeket kaphat a modellek egyszerű összehasonlításához, majd kiválaszthatja azt a modellt, amely a legjobban megfelel üzleti igényeinek a modell pontossága, a betanítási idő és a következtetési idő tekintetében.

A nyilvános adatkészlet Ebben a bejegyzésben használt közel 55,000 0 kép a beteg és egészséges növényi levelekről, amelyeket ellenőrzött körülmények között gyűjtöttek össze, 38 és 44,000 közötti osztálycímkékkel. Ez az adatkészlet betanítási és érvényesítési adatkészletekre van felosztva, körülbelül 11,000 XNUMX képzés alatt álló és XNUMX XNUMX ellenőrzés alatt álló képpel. Az alábbiakban néhány mintakép látható.

Ehhez a gyakorlathoz a JumpStart által kínált két keretrendszerből – PyTorch és TensorFlow – választottunk modelleket. A következő 15 modellalgoritmus a népszerű neurális hálózati architektúrák széles skáláját fedi le ezekből a keretrendszerekből:

  • pytorch-ic-alexnet-FT
  • pytorch-ic-densenet121-FT
  • pytorch-ic-densenet201-FT
  • pytorch-ic-googlenet-FT
  • pytorch-ic-mobilenet-v2-FT
  • pytorch-ic-resnet152-FT
  • pytorch-ic-resnet34-FT
  • tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
  • tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
  • tensorflow-ic-imagenet-inception-v3-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
  • tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
  • tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

A modellt használjuk tensorflow-ic-imagenet-inception-v3-classification-4-FT alapul szolgál, amelyhez más modellek eredményeit összehasonlítják. Ezt az alapmodellt önkényesen választották ki.

Az összehasonlítás futtatásához használt kód elérhető a AWS minták GitHub repo.

Eredmények

Ebben a részben ennek a 15 futtatásnak az eredményeit mutatjuk be. Mindezen futtatásoknál a használt hiperparaméterek korszakok = 5, tanulási sebesség = 0.001, kötegméret = 16.

Modell pontosság, betanítási idő és következtetési idő a modellből tensorflow-ic-imagenet-inception-v3-classification-4-FT alapul vettük, és az összes többi modell eredményeit ehhez az alapmodellhez viszonyítva mutatjuk be. Itt nem az a célunk, hogy megmutassuk, melyik modell a legjobb, hanem inkább azt, hogy a JumpStart API-n keresztül hogyan hasonlíthatja össze a különböző modellek eredményeit, majd kiválaszthatja az Ön használati esetének leginkább megfelelő modellt.

A következő képernyőkép kiemeli azt az alapmodellt, amellyel az összes többi modellt összehasonlították.

Építsen nagy teljesítményű képosztályozási modelleket az Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.

A következő diagram a relatív pontosság és a relatív edzésidő részletes nézetét mutatja. A PyTorch modellek piros színkóddal, a TensorFlow modellek pedig kék színkóddal vannak ellátva.

Építsen nagy teljesítményű képosztályozási modelleket az Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.

Az előző ábrán zöld ellipszissel kiemelt modellek a relatív pontosság és az alacsony relatív képzési idő jó kombinációját mutatják. Az alábbi táblázat további részleteket tartalmaz erről a három modellről.

Modell neve Relatív pontosság Relatív képzési idő
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT 1.01 0.74
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT 1.02 0.74
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT 1.04 1.16

A következő diagram a relatív pontosságot és a relatív következtetési időt hasonlítja össze. A PyTorch modellek piros színkóddal, a TensorFlow modellek pedig kék színkóddal vannak ellátva.

Építsen nagy teljesítményű képosztályozási modelleket az Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.

A következő táblázat a zöld ellipszis három modelljének részleteit tartalmazza.

Modell neve Relatív pontosság Relatív következtetési idő
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT 1.01 0.94
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT 1.02 0.90
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT 1.04 1.43

A két diagram egyértelműen mutatja, hogy bizonyos modellalgoritmusok jobban teljesítettek, mint mások a kiválasztott három dimenzióban. Az ebben a gyakorlatban kínált rugalmasság segíthet a megfelelő algoritmus kiválasztásában, és a mellékelt notebook használatával könnyedén futtathatja ezt a típusú kísérletet a 87 elérhető modell bármelyikén.

Következtetés

Ebben a bejegyzésben bemutattuk, hogyan használható a JumpStart a nagy teljesítményű képosztályozási modellek felépítéséhez több érdekes dimenzióra, például a modell pontosságára, a betanítási időre és a következtetési késleltetésre. Megadtuk a kódot is a gyakorlat futtatásához a saját adatkészletén; kiválaszthat tetszőleges modellt a 87 modell közül, amelyek jelenleg elérhetőek a JumpStart modellközpont képbesorolására. Javasoljuk, hogy próbálja ki még ma.

A JumpStart további részleteiért lásd: SageMaker JumpStart.


A szerzőkről

Építsen nagy teljesítményű képosztályozási modelleket az Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.Dr. Raju Penmatcha az AWS mesterséges intelligencia-platformjainak AI/ML-specialista megoldásainak építésze. PhD fokozatát a Stanford Egyetemen szerezte. Szorosan együttműködik a SageMaker alacsony/kód nélküli szolgáltatáscsomagjával, amely segít az ügyfeleknek gépi tanulási modellek és megoldások egyszerű felépítésében és üzembe helyezésében. Amikor nem segít az ügyfeleknek, szeret új helyekre utazni.

Építsen nagy teljesítményű képosztályozási modelleket az Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence segítségével. Függőleges keresés. Ai.Dr. Ashish Khetan vezető alkalmazott tudós az Amazon SageMaker beépített algoritmusaival, és segít gépi tanulási algoritmusok fejlesztésében. PhD fokozatát az Illinois Urbana-Champaign Egyetemen szerezte. A gépi tanulás és a statisztikai következtetések aktív kutatója, és számos közleményt publikált NeurIPS, ICML, ICLR, JMLR, ACL és EMNLP konferenciákon.

Időbélyeg:

Még több AWS gépi tanulás