Näpunäiteid oma Amazon Rekognitioni kohandatud siltide mudeli täiustamiseks

Taasavaldanud Platon

järgijaid: 0

Selles postituses käsitleme parimaid tavasid teie arvutinägemismudelite toimivuse parandamiseks Amazon Rekognitioni kohandatud sildid. Rekognition Custom Labels on täielikult hallatav teenus, mis võimaldab luua kohandatud arvutinägemismudeleid kujutiste klassifitseerimiseks ja objektide tuvastamiseks. Rekognition Custom Labels põhineb eelnevalt koolitatud mudelitel Amazon Rekognitsioon, mis on juba koolitatud kümnete miljonite piltide jaoks paljudes kategooriates. Tuhandete piltide asemel võite alustada väikese treeningpiltide komplektiga (paarsada või vähem), mis on teie kasutusjuhtumile omane. Rekognitioni kohandatud sildid eemaldavad kohandatud mudeli loomise keerukuse. See kontrollib automaatselt koolitusandmeid, valib õiged ML-algoritmid, valib eksemplari tüübi, koolitab mitut kandidaatmudelit erinevate hüperparameetrite sätetega ja väljastab kõige paremini koolitatud mudeli. Rekognition Custom Labels pakub ka hõlpsasti kasutatavat liidest AWS-i juhtimiskonsool kogu ML-i töövoo haldamiseks, sealhulgas piltide märgistamiseks, mudeli koolitamiseks, mudeli juurutamiseks ja testitulemuste visualiseerimiseks.

Mõnikord ei ole mudeli täpsus parim ja teil pole palju võimalusi mudeli konfiguratsiooniparameetrite reguleerimiseks. Kulisside taga on mitu tegurit, mis mängivad suure jõudlusega mudeli loomisel võtmerolli, näiteks järgmised.

Pildi nurk
Pildi eraldusvõime
Pildi kuvasuhe
Valguse säritus
Tausta selgus ja erksus
Värvikontrast
Näidisandmete suurus

Järgmised on üldised sammud, mida tuleb järgida tootmistasemel Rekognitioni kohandatud siltide mudeli koolitamiseks.

Taksonoomia ülevaade – See määrab atribuutide/üksuste loendi, mida soovite pildil tuvastada.
Koguge asjakohaseid andmeid – See on kõige olulisem samm, kus peate koguma asjakohaseid pilte, mis peaksid sarnanema tootmiskeskkonnas nähtule. See võib hõlmata erineva tausta, valgustuse või kaameranurgaga objektide pilte. Seejärel loote kogutud pildid tükeldades koolitus- ja testimisandmed. Testimisandmestiku osana peaksite kaasama ainult reaalseid pilte ja ärge sünteetiliselt loodud pilte. Kogutud andmete märkused on mudeli toimimise jaoks üliolulised. Veenduge, et piirdekarbid on objektide ümber tihedalt kinni ja sildid täpsed. Selles postituses käsitleme mõningaid näpunäiteid, mida saate sobiva andmestiku koostamisel arvesse võtta.
Vaadake üle treeningmõõdikud – Kasutage mudeli treenimiseks ja F1 skoori, täpsuse ja meeldetuletuse treeningmõõdikute ülevaatamiseks eelnevaid andmekogumeid. Sellest postitusest räägime üksikasjalikult, kuidas treeningmõõdikuid analüüsida.
Hinda koolitatud mudelit – Prognooside hindamiseks kasutage tuntud siltidega seninägematute kujutiste komplekti (ei kasutata mudeli treenimiseks). See samm tuleks alati läbi viia tagamaks, et mudel toimib tootmiskeskkonnas ootuspäraselt.
Ümberõpe (valikuline) – Üldiselt on mis tahes masinõppemudeli koolitamine soovitud tulemuste saavutamiseks iteratiivne protsess, arvutinägemise mudel ei erine sellest. Vaadake üle 4. sammu tulemused, et näha, kas treeningandmetele on vaja lisada rohkem pilte, ja korrake ülaltoodud samme 3–5.

Selles postituses keskendume asjakohaste andmete kogumise (2. samm) ja koolitatud mõõdikute hindamise (3. samm) parimatele tavadele, et parandada teie mudeli jõudlust.

Koguge asjakohaseid andmeid

See on tootmistasemel Rekognitioni kohandatud siltide mudeli koolitamise kõige kriitilisem etapp. Täpsemalt on kaks andmekogumit: koolitus ja testimine. Treeningandmeid kasutatakse mudeli treenimiseks ja teil tuleb kulutada jõupingutusi sobiva treeningkomplekti loomiseks. Rekognitioni kohandatud siltide mudelid on optimeeritud F1 skoor testimisandmestikul, et valida oma projekti jaoks kõige täpsem mudel. Seetõttu on oluline kureerida testimisandmestikku, mis sarnaneks pärismaailmaga.

Piltide arv

Soovitame, et sildi kohta oleks vähemalt 15–20 pilti. Kui teil on rohkem pilte koos rohkemate variatsioonidega, mis kajastavad teie kasutusjuhtumit, parandab mudeli jõudlust.

Tasakaalustatud andmestik

Ideaalis peaks andmestiku igal sildil olema sarnane arv näidiseid. Kujutiste arvus sildil ei tohiks olla suuri erinevusi. Näiteks andmestik, kus sildi suurim piltide arv on 1,000 vs. 50 teise sildi kujutist, sarnaneb tasakaalustamata andmekogumiga. Soovitame vältida stsenaariume, mille külgsuhe on 1:50 kõige väiksema kujutiste arvuga sildi ja suurima kujutiste arvuga sildi vahel.

Erinevat tüüpi pildid

Kaasake koolituse ja testi andmekogusse pilte, mis sarnanevad sellega, mida te pärismaailmas kasutate. Näiteks kui soovite liigitada elutubade ja magamistubade pilte, peaksite lisama mõlema ruumi tühjad ja sisustatud pildid.

Järgnevalt on toodud näide möbleeritud elutoast.

Seevastu on alljärgnev näide möbleerimata elutoast.

Järgnevalt on toodud näide möbleeritud magamistoast.

Järgnevalt on toodud näide möbleerimata magamistoast.

Erineva taustaga

Kaasake erineva taustaga pilte. Loomuliku kontekstiga pildid võivad anda paremaid tulemusi kui tavaline taust.

Järgnevalt on toodud näide maja eeshoovist.

Järgnevalt on toodud näide erineva taustaga maja esihoovist.

Erinevad valgustingimused

Kaasake erineva valgustusega pilte, nii et see kataks järelduse tegemisel esinevad erinevad valgustingimused (nt välguga ja ilma). Saate lisada ka erineva küllastuse, tooni ja heledusega pilte.

Järgmine on lille näidiskujutis tavalises valguses.

Seevastu järgmine pilt on samast lillest eredas valguses.

Erinevad nurgad

Kaasake pildid, mis on tehtud objekti erinevate nurkade alt. See aitab mudelil õppida objektide erinevaid omadusi.

Järgmised pildid on samast magamistoast erinevate nurkade alt.

Näpunäiteid oma Amazon Rekognitioni kohandatud siltide mudeli PlatoBlockchain Data Intelligence täiustamiseks. Vertikaalne otsing. Ai.

Võib juhtuda, et erinevat tüüpi pilte pole võimalik hankida. Nendel stsenaariumidel saab sünteetilisi pilte genereerida koolitusandmestiku osana. Lisateavet levinud pildi suurendamise tehnikate kohta leiate aadressilt Andmete suurendamine.

Lisage negatiivsed sildid

Piltide klassifitseerimisel võib negatiivsete siltide lisamine aidata mudeli täpsust suurendada. Näiteks saate lisada negatiivse sildi, mis ei vasta ühelegi nõutavale sildile. Järgmine pilt kujutab erinevaid silte, mida kasutatakse täiskasvanud lillede tuvastamiseks.

Negatiivse sildi lisamine not_fully_grown aitab mudelil õppida omadusi, mis ei ole osa fully_grown silt.

Sildi segaduse käsitlemine

Analüüsige testiandmestiku tulemusi, et tuvastada kõik mustrid, mis koolituse või testimise andmekogumis puuduvad. Mõnikord on selliseid mustreid lihtne pilte visuaalselt uurida. Järgmisel pildil on mudelil raskusi tagaaia ja siseõue sildi vahel.

Selle stsenaariumi korral võib mudeli täpsust suurendada, kui lisate andmekogus neile siltidele rohkem pilte ja määratlete uuesti sildid nii, et need oleksid erinevad.

Andmete suurendamine

Rekognitioni kohandatud siltide sees teostame mudelitreeningu jaoks mitmesuguseid andmete täiendusi, sealhulgas pildi juhuslikku kärpimist, värvide värisemist, juhuslikke Gaussi müra ja palju muud. Arvestades teie konkreetseid kasutusjuhtumeid, võib olla kasulik lisada oma treeningandmetele täpsemaid andmete täiendusi. Näiteks kui olete huvitatud loomade tuvastamisest nii värvilistel kui ka mustvalgetel piltidel, võite saada suurema täpsuse, kui lisate treeningandmetele samade piltide mustvalged ja värvilised versioonid.

Me ei soovita testimisandmete täiendusi, välja arvatud juhul, kui täiendused kajastavad teie tootmiskasutusjuhtumeid.

Vaadake üle treeningmõõdikud

F1 skoor, täpsus, meeldetuletus ja oletatav lävi on meetrika mis luuakse Rekognitioni kohandatud siltide abil mudeli treenimise väljundina. Mudelid on optimeeritud parima F1 skoori saamiseks pakutava testimisandmestiku põhjal. Eeldatav lävi genereeritakse ka testimisandmestiku põhjal. Saate läve kohandada vastavalt oma ärinõuetele täpsuse või tagasivõtmise osas.

Kuna eeldatavad läved on seatud testimisandmestikule, peaks sobiv testikomplekt kajastama tegelikku tootmiskasutusjuhtumit. Kui testandmestik ei ole kasutusjuhtumit esindav, võite näha oma tegelikel piltidel kunstlikult kõrgeid F1 skoori ja mudeli kehva jõudlust.

Need mõõdikud on abiks mudeli esmasel hindamisel. Tootmistasemel süsteemi puhul soovitame hinnata mudelit välise andmestiku (500–1,000 nägemata pilti) alusel, mis esindab tegelikku maailma. See aitab hinnata, kuidas mudel tootmissüsteemis toimiks, samuti tuvastada kõik puuduvad mustrid ja parandada neid mudeli ümberõppega. Kui näete F1 skooride ja välise hindamise vahel mittevastavust, soovitame teil uurida, kas teie testiandmed kajastavad tegelikku kasutusjuhtumit.

Järeldus

Selles postituses tutvustasime teile Rekognitioni kohandatud siltide mudelite täiustamise parimaid tavasid. Soovitame teil selle kohta rohkem teada saada Äratundmise kohandatud sildid ja proovige seda oma ettevõttepõhiste andmekogumite jaoks.

Autoritest

Amit Gupta on AWS-i AI teenuste lahenduste vanemarhitekt. Ta on kirglik võimaldada klientidele hästi läbimõeldud masinõppelahendusi ulatuslikult.

Yogesh Chaturvedi on AWS-i lahenduste arhitekt, keskendudes arvutinägemisele. Ta töötab klientidega, et lahendada nende äriprobleemid pilvetehnoloogiate abil. Väljaspool tööd naudib ta matkamist, reisimist ja spordi vaatamist.

Hao Yang on Amazon Rekognitioni kohandatud siltide meeskonna vanemrakendusteadlane. Tema peamised uurimisvaldkonnad on objektide tuvastamine ja piiratud annotatsioonidega õppimine. Väljaspool tööd naudib Hao filmide vaatamist, fotograafiat ja tegevusi väljas.

Pashmeen Mistry on Amazon Rekognitioni kohandatud siltide vanemtootejuht. Väljaspool tööd naudib Pashmeen seikluslikke matku, fotograafiat ja perega aja veetmist.

Ajatempel: September 9, 2022September 10, 2022

Veel alates AWS-i masinõpe

Kuidas Mendix muudab klientide kogemusi generatiivse AI ja Amazon Bedrockiga | Amazoni veebiteenused

AWS-i masinõpe

Allikasõlm: 1913698

Ajatempel: November 15, 2023

LLM-ide skaleerimine PyTorch 2.0 FSDP-ga Amazon EKS-is – 2. osa | Amazoni veebiteenused

Allikaklaster:

AWS-i masinõpe

Allikasõlm: 1960833

Ajatempel: Aprill 1, 2024

Näpunäiteid oma Amazon Rekognitioni kohandatud siltide mudeli täiustamiseks

Taasavaldanud Platon

Koguge asjakohaseid andmeid

Piltide arv

Tasakaalustatud andmestik

Erinevat tüüpi pildid

Erineva taustaga

Erinevad valgustingimused

Erinevad nurgad

Lisage negatiivsed sildid

Sildi segaduse käsitlemine

Andmete suurendamine

Vaadake üle treeningmõõdikud

Järeldus

Autoritest

Veel alates AWS-i masinõpe

TensorFlow kujutiste klassifitseerimismudelite õppimise ülekandmine Amazon SageMakeris

Õppige Renate abil närvivõrke automaatselt ümber

Vähendage toidu raiskamist, et parandada jätkusuutlikkust ja finantstulemusi jaemüügis Amazon Forecastiga

Valmistage Amazon EMR-i andmed ette masinõppeks, kasutades Amazon SageMaker Data Wrangleri

Käitage rakenduses Amazon SageMaker ansambli ML mudeleid

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto