Vinkkejä Amazon Rekognition mukautetun etikettimallin parantamiseen

Julkaissut Platon

seuraajia: 0

Tässä viestissä keskustelemme parhaista käytännöistä parantaaksesi tietokonenäkömalliesi suorituskykyä Amazon Rekognition mukautetut etiketit. Rekognition Custom Labels on täysin hallittu palvelu, jolla voidaan rakentaa mukautettuja tietokonenäkömalleja kuvien luokittelua ja objektien havaitsemista varten. Rekognition Custom Labels rakentuu valmiiksi koulutetuista malleista Amazonin tunnistus, jotka on jo koulutettu kymmeniin miljooniin kuviin useissa luokissa. Tuhansien kuvien sijaan voit aloittaa pienellä harjoituskuvien sarjalla (muutama sata tai vähemmän), jotka ovat sinun käyttötarkoitukseesi sopivia. Rekognition Custom Labels poistaa mukautetun mallin rakentamiseen liittyvän monimutkaisuuden. Se tarkastaa automaattisesti harjoitustiedot, valitsee oikeat ML-algoritmit, valitsee ilmentymän tyypin, kouluttaa useita ehdokasmalleja erilaisilla hyperparametriasetuksilla ja tulostaa parhaiten koulutetun mallin. Rekognition Custom Labels tarjoaa myös helppokäyttöisen käyttöliittymän AWS-hallintakonsoli koko ML-työnkulun hallintaan, mukaan lukien kuvien merkitseminen, mallin koulutus, mallin käyttöönotto ja testitulosten visualisointi.

Joskus mallin tarkkuus ei ole paras, eikä sinulla ole monia vaihtoehtoja mallin konfigurointiparametrien säätämiseen. Kulissien takana on useita tekijöitä, joilla on keskeinen rooli tehokkaan mallin rakentamisessa, kuten seuraavat:

Kuvakulma
Kuvan resoluutio
Kuvan kuvasuhde
Valovalotus
Taustan selkeys ja eloisuus
Värikontrasti
Esimerkkidatan koko

Seuraavat ovat yleiset vaiheet, joita on noudatettava tuotantotason Rekognition Custom Labels -mallin kouluttamiseksi:

Tarkista Taxonomy – Tämä määrittää luettelon määritteistä/kohteista, jotka haluat tunnistaa kuvassa.
Kerää asiaankuuluvia tietoja – Tämä on tärkein vaihe, jossa sinun on kerättävä asiaankuuluvia kuvia, joiden pitäisi muistuttaa sitä, mitä näkisit tuotantoympäristössä. Tämä voi sisältää kuvia kohteista, joiden taustat, valaistus tai kamerakulma vaihtelevat. Luo sitten koulutus- ja testaustietojoukot jakamalla kerätyt kuvat. Sinun tulisi sisällyttää vain tosielämän kuvia osana testaustietojoukkoa, äläkä synteettisesti luotuja kuvia. Kerättyjen tietojen merkinnät ovat ratkaisevan tärkeitä mallin suorituskyvyn kannalta. Varmista, että rajoituslaatikot ovat tiukasti objektien ympärillä ja että tarrat ovat tarkkoja. Keskustelemme vinkeistä, joita voit ottaa huomioon rakentaessasi sopivaa tietojoukkoa myöhemmin tässä viestissä.
Tarkista harjoitusmittarit – Käytä edeltäviä tietojoukkoja mallin harjoittamiseen ja F1-pisteiden, tarkkuuden ja muistamisen harjoittelumetriikan tarkistamiseen. Keskustelemme yksityiskohtaisesti koulutusmittareiden analysoinnista myöhemmin tässä viestissä.
Arvioi koulutettu malli – Käytä ennusteiden arvioimiseen joukkoa näkymättömiä kuvia (jota ei käytetä mallin harjoittamiseen) tunnetuilla nimikkeillä. Tämä vaihe tulee aina suorittaa sen varmistamiseksi, että malli toimii odotetulla tavalla tuotantoympäristössä.
Uudelleenkoulutus (valinnainen) – Yleisesti ottaen minkä tahansa koneoppimismallin kouluttaminen on iteratiivinen prosessi haluttujen tulosten saavuttamiseksi, tietokonenäkömalli ei eroa siitä. Tarkista tulokset vaiheessa 4 nähdäksesi, tarvitseeko harjoitustietoihin lisätä kuvia, ja toista yllä olevat vaiheet 3–5.

Tässä viestissä keskitymme parhaisiin käytäntöihin, jotka liittyvät asiaankuuluvien tietojen keräämiseen (vaihe 2) ja koulutettujen mittareiden arvioimiseen (vaihe 3) mallin suorituskyvyn parantamiseksi.

Kerää asiaankuuluvia tietoja

Tämä on kriittisin vaihe tuotantotason Rekognition Custom Labels -mallin koulutuksessa. Erityisesti on olemassa kaksi tietojoukkoa: koulutus ja testaus. Harjoitustietoja käytetään mallin harjoittamiseen, ja sinun on käytettävä vaivaa sopivan harjoitussarjan rakentamiseen. Rekognition Custom Labels -mallit on optimoitu F1 pisteet testaustietojoukossa valitaksesi tarkimman mallin projektillesi. Siksi on tärkeää kuratoida testaustietojoukko, joka muistuttaa todellista maailmaa.

Kuvien määrä

Suosittelemme, että tarraa kohden on vähintään 15–20 kuvaa. Mallin suorituskyky paranee, jos sinulla on enemmän kuvia ja enemmän muunnelmia, jotka vastaavat käyttötapaasi.

Tasapainoinen tietojoukko

Ihannetapauksessa jokaisessa tietojoukon tarrassa tulisi olla sama määrä näytteitä. Kuvien määrässä etikettiä kohden ei pitäisi olla suuria eroja. Esimerkiksi tietojoukko, jossa tarran suurin kuvien määrä on 1,000 50 verrattuna toisen tarran 1 kuvaan, muistuttaa epätasapainoista tietojoukkoa. Suosittelemme välttämään skenaarioita, joissa vähiten kuvia sisältävän tarran ja eniten kuvia sisältävän tarran välinen vinosuhde on 50:XNUMX.

Erilaisia kuvia

Sisällytä koulutus- ja testiaineistoon kuvia, jotka muistuttavat sitä, mitä aiot käyttää todellisessa maailmassa. Jos esimerkiksi haluat luokitella kuvia olohuoneista ja makuuhuoneista, sinun tulee sisällyttää tyhjiä ja kalustettuja kuvia molemmista huoneista.

Seuraavassa on esimerkkikuva kalustetusta olohuoneesta.

Sitä vastoin seuraava on esimerkki kalustamattomasta olohuoneesta.

Seuraavassa on esimerkkikuva kalustetusta makuuhuoneesta.

Seuraavassa on esimerkkikuva kalustamattomasta makuuhuoneesta.

Vaihtelevat taustat

Sisällytä kuvia erilaisilla taustoilla. Luonnollisen kontekstin kuvat voivat tuottaa parempia tuloksia kuin pelkkä tausta.

Seuraavassa on esimerkkikuva talon etupihasta.

Seuraavassa on esimerkkikuva eri talon etupihasta eri taustalla.

Vaihtelevat valaistusolosuhteet

Sisällytä kuvia vaihtelevalla valaistuksella, jotta se kattaa päättelyn aikana esiintyvät erilaiset valaistusolosuhteet (esimerkiksi salaman kanssa ja ilman). Voit myös sisällyttää kuvia, joiden kylläisyys, sävy ja kirkkaus vaihtelevat.

Seuraavassa on esimerkkikuva kukasta normaalissa valossa.

Sitä vastoin seuraavassa kuvassa on sama kukka kirkkaassa valossa.

Vaihtelevat kulmat

Sisällytä kuvia, jotka on otettu kohteen eri kulmista. Tämä auttaa mallia oppimaan esineiden erilaisia ominaisuuksia.

Seuraavat kuvat ovat samasta makuuhuoneesta eri näkökulmista.

Vinkkejä Amazon Rekognition Custom Labels -mallin PlatoBlockchain Data Intelligencen parantamiseen. Pystysuuntainen haku. Ai.

Saattaa olla tilanteita, joissa ei ole mahdollista hankkia erityyppisiä kuvia. Näissä skenaarioissa synteettisiä kuvia voidaan luoda osana koulutustietojoukkoa. Lisätietoja yleisistä kuvan lisäystekniikoista on kohdassa Tietojen lisääminen.

Lisää negatiivisia tunnisteita

Kuvien luokittelua varten negatiivisten tarrojen lisääminen voi parantaa mallin tarkkuutta. Voit esimerkiksi lisätä negatiivisen tunnisteen, joka ei vastaa mitään vaadituista tunnisteista. Seuraava kuva esittää eri tarroja, joita käytetään täysin kasvaneiden kukkien tunnistamiseen.

Negatiivisen tunnisteen lisääminen not_fully_grown auttaa mallia oppimaan ominaisuuksia, jotka eivät ole osa mallia fully_grown etiketti.

Etikettien hämmennyksen käsittely

Analysoi testidatajoukon tulokset tunnistaaksesi mallit, jotka puuttuvat koulutus- tai testaustietojoukosta. Joskus on helppo havaita tällaiset kuviot visuaalisesti tarkastelemalla kuvia. Seuraavassa kuvassa malli kamppailee ratkaistakseen takapihan vs. pation etiketin välillä.

Tässä skenaariossa kuvien lisääminen näihin tietojoukon tarroihin ja myös tarrojen uudelleenmäärittely siten, että jokainen tarra on erillinen, voi parantaa mallin tarkkuutta.

Tietojen lisääminen

Rekognition Custom Labelsissa suoritamme erilaisia datan lisäyksiä malliharjoittelua varten, mukaan lukien kuvan satunnainen rajaus, värinvärähtely, satunnaiset Gaussin kohinat ja paljon muuta. Erityisten käyttötapaustesi perusteella saattaa myös olla hyödyllistä lisätä harjoitustietoihisi selkeämpiä datan lisäyksiä. Jos olet esimerkiksi kiinnostunut havaitsemaan eläimiä sekä värillisistä että mustavalkoisista kuvista, voit mahdollisesti saada paremman tarkkuuden lisäämällä harjoitustietoihin samojen kuvien mustavalkoisia ja värillisiä versioita.

Emme suosittele lisäyksiä testaustietoihin, elleivät lisäykset heijasta tuotannon käyttötapauksiasi.

Tarkista harjoitusmittarit

F1-pisteet, tarkkuus, muistaminen ja oletettu kynnys ovat mittarit jotka luodaan tulosteena harjoitettaessa mallia Rekognition Custom Labels -tunnisteiden avulla. Mallit on optimoitu parhaan F1-pisteen saavuttamiseksi toimitetun testausaineiston perusteella. Oletettu kynnysarvo luodaan myös testaustietojoukon perusteella. Voit säätää kynnystä yrityksesi tarkkuusvaatimuksen tai takaisinkutsun perusteella.

Koska oletetut kynnysarvot on asetettu testaustietojoukossa, sopivan testijoukon tulee kuvastaa todellista tuotantokäyttötapausta. Jos testitietojoukko ei edusta käyttötapausta, saatat nähdä keinotekoisesti korkeita F1-pisteitä ja mallin huonoa suorituskykyä todellisissa kuvissasi.

Nämä mittarit ovat hyödyllisiä suoritettaessa mallin alustavaa arviointia. Tuotantotason järjestelmässä suosittelemme mallin arvioimista ulkoiseen tietojoukkoon (500–1,000 1 näkymätöntä kuvaa), joka edustaa todellista maailmaa. Tämä auttaa arvioimaan mallin toimivuutta tuotantojärjestelmässä sekä tunnistamaan puuttuvat kuviot ja korjaamaan ne kouluttamalla mallia uudelleen. Jos näet FXNUMX-pisteiden ja ulkoisen arvioinnin välisen ristiriidan, suosittelemme, että tutkit, heijastavatko testitietosi todellista käyttötapausta.

Yhteenveto

Tässä viestissä esitimme sinulle parhaat käytännöt Rekognition Custom Labels -mallien parantamiseksi. Kannustamme sinua oppimaan lisää Tunnustuksen mukautetut tarrat ja kokeile sitä yrityskohtaisissa tietojoukoissasi.

Tietoja kirjoittajista

Amit Gupta on AWS:n vanhempi AI-palveluratkaisuarkkitehti. Hän haluaa tarjota asiakkailleen hyvin suunniteltuja koneoppimisratkaisuja laajassa mittakaavassa.

Yogesh Chaturvedi on AWS:n ratkaisuarkkitehti, joka keskittyy tietokonenäköön. Hän työskentelee asiakkaiden kanssa vastatakseen heidän liiketoiminnan haasteisiinsa pilviteknologioiden avulla. Työn ulkopuolella hän pitää vaeltamisesta, matkustamisesta ja urheilun katselusta.

Hao Yang on vanhempi soveltuva tutkija Amazon Rekognition Custom Labels -tiimissä. Hänen tärkeimmät tutkimusaiheensa ovat esineiden havaitseminen ja oppiminen rajoitetuilla huomautuksilla. Töiden ulkopuolella Hao nauttii elokuvien katselusta, valokuvaamisesta ja ulkoilusta.

Pashmeen Mistry on Amazon Rekognition Custom Labels -tuotepäällikkö. Työn ulkopuolella Pashmeen nauttii seikkailunhaluisista vaelluksista, valokuvaamisesta ja perheen kanssa viettämisestä.

Aikaleima: Syyskuu 9, 2022Syyskuu 10, 2022

Lisää aiheesta AWS-koneoppiminen

Kuinka Mendix muuttaa asiakaskokemuksia generatiivisen tekoälyn ja Amazon Bedrockin avulla | Amazon Web Services

AWS-koneoppiminen

Lähdesolmu: 1913698

Aikaleima: Marraskuu 15, 2023

Skaalaa LLM:itä PyTorch 2.0 FSDP:n avulla Amazon EKS:ssä – Osa 2 | Amazon Web Services

Lähde klusteri:

AWS-koneoppiminen

Lähdesolmu: 1960833

Aikaleima: Huhtikuu 1, 2024

Vinkkejä Amazon Rekognition Custom Labels -mallin parantamiseen

Julkaissut Platon