Looge suure jõudlusega kujutiste klassifitseerimismudeleid, kasutades Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence'i. Vertikaalne otsing. Ai.

Looge Amazon SageMaker JumpStarti abil suure jõudlusega kujutiste klassifitseerimismudeleid

Piltide klassifitseerimine on arvutinägemisel põhinev masinõppe (ML) tehnika, mis võimaldab pilte klassifitseerida. Mõned tuntud piltide klassifitseerimise näited hõlmavad käsitsi kirjutatud numbrite klassifitseerimist, meditsiiniliste kujutiste klassifikatsiooni ja näotuvastust. Piltide klassifitseerimine on kasulik tehnika mitmete ärirakenduste puhul, kuid hea piltide klassifitseerimismudeli loomine pole triviaalne.

ML-mudeli hindamisel võivad rolli mängida mitmed kaalutlused. Lisaks mudeli täpsusele on muud potentsiaalsed olulised mõõdikud mudeli koolituse aeg ja järelduste tegemise aeg. Arvestades ML-mudeli arendamise iteratiivset olemust, võimaldavad kiiremad koolitusajad andmeteadlastel erinevaid hüpoteese kiiresti testida. Kiirem järelduste tegemine võib reaalajas rakendustes olla kriitilise tähtsusega.

Amazon SageMaker JumpStart pakub ühe klõpsuga peenhäälestamist ja paljude eelkoolitatud mudelite juurutamist populaarsete ML-ülesannete jaoks, samuti valikut täislahendusi, mis lahendavad levinud äriprobleeme. Need funktsioonid eemaldavad ML-protsessi iga etapi raskused, muutes kvaliteetsete mudelite väljatöötamise lihtsamaks ja vähendades kasutuselevõtuks kuluvat aega. KiirStardi API-d võimaldab teil programmiliselt juurutada ja viimistleda suurt valikut JumpStarti toetatud eelkoolitatud mudeleid oma andmekogumitele.

Enne juurutamist saate JumpStartis pakutavaid ML-mudeleid järk-järgult treenida ja häälestada. Artikli kirjutamise ajal on JumpStartis saadaval 87 süvaõppepõhist kujutiste klassifitseerimise mudelit.

Kuid milline mudel annab teile parima tulemuse? Selles postituses tutvustame metoodikat mitme mudeli hõlpsaks käitamiseks ja nende väljundite võrdlemiseks kolme huvipakkuva mõõtme järgi: mudeli täpsus, koolitusaeg ja järeldusaeg.

Lahenduse ülevaade

JumpStart võimaldab teil treenida, häälestada ja juurutada mudeleid kas JumpStarti konsoolist, kasutades selle kasutajaliidest või API-t. Selles postituses kasutame API marsruuti ja esitleme erinevate abiskriptidega märkmikku. Saate seda märkmikku käitada ja saada tulemusi nende mudelite hõlpsaks võrdlemiseks ja seejärel valida mudel, mis vastab teie ettevõtte vajadustele kõige paremini mudeli täpsuse, koolitusaja ja järelduste tegemise aja osas.

. avalik andmestik Selles postituses kasutatud pilt koosneb ligi 55,000 0 pildist haigete ja tervete taimede lehtedest, mis on kogutud kontrollitud tingimustes, klasside märgistega vahemikus 38–44,000. See andmestik on jagatud rongi- ja valideerimisandmekomplektideks, kus on umbes 11,000 XNUMX koolitusel ja XNUMX XNUMX valideerimisel olevat pilti. Järgnevalt mõned näidispildid.

Selle harjutuse jaoks valisime mudelid kahest raamistikust – PyTorch ja TensorFlow – nagu pakub JumpStart. Järgmised 15 mudelialgoritmi hõlmavad laia valikut populaarseid närvivõrgu arhitektuure nendest raamistikest:

  • pytorch-ic-alexnet-FT
  • pytorch-ic-densenet121-FT
  • pytorch-ic-densenet201-FT
  • pytorch-ic-googlenet-FT
  • pytorch-ic-mobilenet-v2-FT
  • pytorch-ic-resnet152-FT
  • pytorch-ic-resnet34-FT
  • tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
  • tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
  • tensorflow-ic-imagenet-inception-v3-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
  • tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
  • tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

Kasutame mudelit tensorflow-ic-imagenet-inception-v3-classification-4-FT alusena, millega võrreldakse teiste mudelite tulemusi. See baasmudel valiti meelevaldselt.

Selle võrdluse käitamiseks kasutatav kood on saadaval aadressil AWS proovib GitHubi repo.

Tulemused

Selles jaotises tutvustame nende 15 jooksmise tulemusi. Kõigi nende käitamiste puhul kasutati hüperparameetreid epohhid = 5, õppimiskiirus = 0.001, partii suurus = 16.

Mudeli täpsus, treeninguaeg ja mudeli põhjal järelduste tegemise aeg tensorflow-ic-imagenet-inception-v3-classification-4-FT võeti aluseks ja kõigi teiste mudelite tulemused on esitatud selle baasmudeli suhtes. Meie eesmärk ei ole siin näidata, milline mudel on parim, vaid pigem näidata, kuidas saate JumpStart API kaudu võrrelda erinevate mudelite tulemusi ja seejärel valida mudeli, mis sobib teie kasutusjuhtumiga kõige paremini.

Järgmisel ekraanipildil on esile tõstetud baasmudel, millega võrreldi kõiki teisi mudeleid.

Looge suure jõudlusega kujutiste klassifitseerimismudeleid, kasutades Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence'i. Vertikaalne otsing. Ai.

Järgmine graafik näitab üksikasjalikku vaadet suhtelise täpsuse ja suhtelise treeningaja kohta. PyTorchi mudelid on värvikoodiga punasega ja TensorFlow mudelid sinisega.

Looge suure jõudlusega kujutiste klassifitseerimismudeleid, kasutades Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence'i. Vertikaalne otsing. Ai.

Eelmisel joonisel rohelise ellipsiga esile tõstetud mudelitel näib olevat hea kombinatsioon suhtelisest täpsusest ja madalast suhtelisest treeningajast. Järgmises tabelis on nende kolme mudeli kohta rohkem üksikasju.

Mudeli nimi Suhteline täpsus Suhteline koolitusaeg
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT 1.01 0.74
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT 1.02 0.74
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT 1.04 1.16

Järgmisel diagrammil võrreldakse suhtelist täpsust ja suhtelist järeldusaega. PyTorchi mudelid on värvikoodiga punasega ja TensorFlow mudelid sinisega.

Looge suure jõudlusega kujutiste klassifitseerimismudeleid, kasutades Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence'i. Vertikaalne otsing. Ai.

Järgmises tabelis on üksikasjalikud andmed kolme rohelise ellipsi mudeli kohta.

Mudeli nimi Suhteline täpsus Suhteline järeldusaeg
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT 1.01 0.94
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT 1.02 0.90
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT 1.04 1.43

Need kaks graafikut näitavad selgelt, et teatud mudelialgoritmid toimisid valitud kolmes mõõtmes paremini kui teised. Selle harjutuse pakutav paindlikkus aitab teil valida õige algoritmi ja kaasasolevat sülearvutit kasutades saate seda tüüpi katset hõlpsalt läbi viia mis tahes 87 saadaolevast mudelist.

Järeldus

Selles postituses näitasime, kuidas kasutada JumpStarti, et luua suure jõudlusega kujutiste klassifitseerimismudeleid mitmel huvipakkuval mõõtmel, nagu mudeli täpsus, treeningaeg ja järelduste latentsus. Esitasime ka koodi selle harjutuse käitamiseks teie enda andmestikul; saate valida kõik huvipakkuvad mudelid 87 mudeli hulgast, mis on praegu JumpStart mudelikeskuses piltide klassifitseerimiseks saadaval. Soovitame teil seda juba täna proovida.

KiirStardi kohta lisateabe saamiseks vaadake SageMaker KiirStart.


Autoritest

Looge suure jõudlusega kujutiste klassifitseerimismudeleid, kasutades Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence'i. Vertikaalne otsing. Ai.Dr Raju Penmatcha on AWS-i tehisintellekti platvormide AI/ML spetsialistilahenduste arhitekt. Ta sai doktorikraadi Stanfordi ülikoolist. Ta teeb tihedat koostööd SageMakeri madala/koodita teenuste komplektiga, mis aitab klientidel hõlpsasti masinõppemudeleid ja -lahendusi luua ja juurutada. Kui kliente ei aita, meeldib talle reisida uutesse kohtadesse.

Looge suure jõudlusega kujutiste klassifitseerimismudeleid, kasutades Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence'i. Vertikaalne otsing. Ai.Dr Ashish Khetan on vanemrakendusteadlane, kellel on Amazon SageMaker sisseehitatud algoritmid ja aitab välja töötada masinõppe algoritme. Ta sai doktorikraadi Illinoisi Urbana-Champaigni ülikoolist. Ta on aktiivne masinõppe ja statistiliste järelduste uurija ning avaldanud palju artikleid NeurIPS, ICML, ICLR, JMLR, ACL ja EMNLP konverentsidel.

Ajatempel:

Veel alates AWS-i masinõpe