Izdelajte visoko zmogljive modele klasifikacije slik z uporabo Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Z Amazon SageMaker JumpStart zgradite visoko zmogljive modele klasifikacije slik

Klasifikacija slik je tehnika strojnega učenja (ML), ki temelji na računalniškem vidu in omogoča razvrščanje slik. Nekateri dobro znani primeri klasifikacije slik vključujejo klasifikacijo ročno napisanih števk, klasifikacijo medicinskih slik in prepoznavanje obraza. Klasifikacija slik je uporabna tehnika z več poslovnimi aplikacijami, vendar izdelava dobrega modela klasifikacije slik ni nepomembna.

Pri ocenjevanju modela ML lahko igra vlogo več dejavnikov. Poleg natančnosti modela sta drugi možni pomembni meritvi čas usposabljanja modela in čas sklepanja. Glede na iterativno naravo razvoja modela ML hitrejši časi usposabljanja omogočajo podatkovnim znanstvenikom, da hitro preizkusijo različne hipoteze. Hitrejše sklepanje je lahko kritično v aplikacijah v realnem času.

Amazon SageMaker JumpStart zagotavlja fino nastavitev in uvajanje široke palete vnaprej usposobljenih modelov v priljubljenih opravilih ML z enim klikom ter izbor celovitih rešitev, ki rešujejo pogoste poslovne probleme. Te funkcije odpravljajo težko delo pri vsakem koraku procesa ML, kar olajša razvoj visokokakovostnih modelov in skrajša čas do uvajanja. API-ji JumpStart vam omogočajo, da programsko uvedete in natančno prilagodite širok izbor predhodno usposobljenih modelov, ki jih podpira JumpStart, na vaših lastnih nizih podatkov.

Modele ML, ki so na voljo v JumpStartu, lahko pred uvedbo postopno učite in prilagajate. V času pisanja tega članka je v JumpStartu na voljo 87 modelov klasifikacije slik, ki temeljijo na globokem učenju.

Toda kateri model vam bo dal najboljše rezultate? V tem prispevku predstavljamo metodologijo za preprosto izvajanje več modelov in primerjavo njihovih rezultatov na treh zanimivih dimenzijah: natančnost modela, čas usposabljanja in čas sklepanja.

Pregled rešitev

JumpStart vam omogoča usposabljanje, prilagajanje in uvajanje modelov iz konzole JumpStart z uporabo njenega uporabniškega vmesnika ali z njenim API-jem. V tej objavi uporabljamo pot API in predstavljamo zvezek z različnimi pomožnimi skripti. Ta prenosni računalnik lahko zaženete in pridobite rezultate za enostavno primerjavo teh modelov med seboj, nato pa izberete model, ki najbolj ustreza vašim poslovnim potrebam glede natančnosti modela, časa usposabljanja in časa sklepanja.

O javni nabor podatkov uporabljen v tej objavi, je sestavljen iz skoraj 55,000 slik obolelih in zdravih rastlinskih listov, zbranih v nadzorovanih pogojih, z oznakami razreda od 0–38. Ta nabor podatkov je razdeljen na nabore podatkov o usposabljanju in preverjanju, pri čemer je približno 44,000 v procesu usposabljanja in 11,000 slik v postopku potrjevanja. Sledi nekaj vzorčnih slik.

Za to vajo smo izbrali modele iz dveh ogrodij – PyTorch in TensorFlow – kot jih ponuja JumpStart. Naslednjih 15 modelnih algoritmov pokriva široko paleto priljubljenih arhitektur nevronskih mrež iz teh okvirov:

  • pytorch-ic-alexnet-FT
  • pytorch-ic-densenet121-FT
  • pytorch-ic-densenet201-FT
  • pytorch-ic-googlenet-FT
  • pytorch-ic-mobilenet-v2-FT
  • pytorch-ic-resnet152-FT
  • pytorch-ic-resnet34-FT
  • tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
  • tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
  • tensorflow-ic-imagenet-inception-v3-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
  • tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
  • tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

Uporabljamo model tensorflow-ic-imagenet-inception-v3-classification-4-FT kot osnova, s katero se primerjajo rezultati drugih modelov. Ta osnovni model je bil izbran poljubno.

Koda, uporabljena za izvedbo te primerjave, je na voljo na AWS Samples GitHub repo.

Rezultati

V tem razdelku predstavljamo rezultate teh 15 voženj. Za vse te poteke so bili uporabljeni hiperparametri epohe = 5, stopnja učenja = 0.001, velikost serije = 16.

Natančnost modela, čas usposabljanja in čas sklepanja iz modela tensorflow-ic-imagenet-inception-v3-classification-4-FT so bili vzeti kot osnova, rezultati vseh drugih modelov pa so predstavljeni glede na ta osnovni model. Naš namen tukaj ni pokazati, kateri model je najboljši, temveč pokazati, kako lahko prek API-ja JumpStart primerjate rezultate različnih modelov in nato izberete model, ki najbolje ustreza vašemu primeru uporabe.

Naslednji posnetek zaslona poudarja osnovni model, s katerim so bili primerjani vsi drugi modeli.

Izdelajte visoko zmogljive modele klasifikacije slik z uporabo Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Naslednji diagram prikazuje podroben pogled relativne natančnosti v primerjavi z relativnim časom usposabljanja. Modeli PyTorch so barvno označeni z rdečo barvo, modeli TensorFlow pa z modro.

Izdelajte visoko zmogljive modele klasifikacije slik z uporabo Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Zdi se, da imajo modeli, označeni z zeleno elipso na prejšnjem grafu, dobro kombinacijo relativne natančnosti in kratkega relativnega časa usposabljanja. Naslednja tabela vsebuje več podrobnosti o teh treh modelih.

Ime modela Relativna natančnost Relativni čas treninga
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT 1.01 0.74
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT 1.02 0.74
tensorflow-ic-bit-s-r101x1-ilsvrc2012-razvrstitev-1-FT 1.04 1.16

Naslednji diagram primerja relativno natančnost z relativnim časom sklepanja. Modeli PyTorch so barvno označeni z rdečo barvo, modeli TensorFlow pa z modro.

Izdelajte visoko zmogljive modele klasifikacije slik z uporabo Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

V naslednji tabeli so podrobnosti o treh modelih v zeleni elipsi.

Ime modela Relativna natančnost Relativni čas sklepanja
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT 1.01 0.94
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT 1.02 0.90
tensorflow-ic-bit-s-r101x1-ilsvrc2012-razvrstitev-1-FT 1.04 1.43

Grafa jasno kažeta, da so nekateri algoritmi modela delovali bolje kot drugi na treh izbranih dimenzijah. Prilagodljivost, ki jo ponuja ta vaja, vam lahko pomaga izbrati pravi algoritem, z uporabo priloženega zvezka pa lahko preprosto izvedete to vrsto poskusa na katerem koli od 87 razpoložljivih modelov.

zaključek

V tej objavi smo pokazali, kako uporabiti JumpStart za izdelavo visoko zmogljivih modelov klasifikacije slik na več zanimivih dimenzijah, kot so natančnost modela, čas usposabljanja in zakasnitev sklepanja. Zagotovili smo tudi kodo za izvajanje te vaje na vašem lastnem nizu podatkov; lahko izberete kateri koli model, ki vas zanima, med 87 modeli, ki so trenutno na voljo za razvrščanje slik v središču modelov JumpStart. Spodbujamo vas, da poskusite še danes.

Za več podrobnosti o JumpStartu glejte SageMaker JumpStart.


O avtorjih

Izdelajte visoko zmogljive modele klasifikacije slik z uporabo Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Dr. Raju Penmatcha je specialist za rešitve AI/ML za platforme AI pri AWS. Doktoriral je na univerzi Stanford. Tesno sodeluje pri naboru storitev z nizko stopnjo/brez kodiranja v SageMakerju, ki strankam pomagajo pri preprosti gradnji in uvajanju modelov in rešitev strojnega učenja. Ko ne pomaga strankam, rad potuje v nove kraje.

Izdelajte visoko zmogljive modele klasifikacije slik z uporabo Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Dr. Ashish Khetan je višji aplikativni znanstvenik z vgrajenimi algoritmi Amazon SageMaker in pomaga pri razvoju algoritmov strojnega učenja. Doktoriral je na Univerzi Illinois Urbana-Champaign. Je aktiven raziskovalec strojnega učenja in statističnega sklepanja ter je objavil številne članke na konferencah NeurIPS, ICML, ICLR, JMLR, ACL in EMNLP.

Časovni žig:

Več od Strojno učenje AWS