Amazon felismerés előre betanított és testreszabható számítógépes látási képességeket kínál, hogy információkat és betekintést nyerjen a képekből és videókból. Az egyik ilyen képesség az Amazon felismerési címkék, amely tárgyakat, jeleneteket, cselekvéseket és fogalmakat észlel a képeken. Olyan ügyfelek, mint a Synchronoss, Shutterstockés a Nomad Media az Amazon Rekognition Labels segítségével automatikusan hozzáadja a metaadatokat tartalomkönyvtárához, és lehetővé teszi a tartalomalapú keresési eredményeket. TripleLift az Amazon Rekognition Labels segítségével határozza meg a legjobb pillanatokat a hirdetések dinamikus beszúrásához, amelyek kiegészítik a közönség megtekintési élményét. vidmob az Amazon Rekognition Labels segítségével kinyeri a metaadatokat a hirdetésekből, hogy megértse a kreatív döntéshozatal egyedülálló szerepét a hirdetések teljesítményében, így a marketingszakemberek olyan hirdetéseket állíthatnak elő, amelyek hatással vannak a számukra leginkább fontos célokra. Ezen túlmenően több ezer ügyfél használja az Amazon Rekognition Labels-t számos más felhasználási eset támogatására, például túra- vagy túrafotók osztályozására, emberek vagy járművek észlelésére a biztonsági kamerák felvételein, valamint a személyazonosító okmányok képeinek osztályozására.
Az Amazon Rekognition Labels a képekhez 600 új címkét észlel, köztük tereptárgyakat és tevékenységeket, és javítja a több mint 2,000 meglévő címke pontosságát. Ezenkívül az Amazon Rekognition Labels mostantól támogatja az Image Properties funkciót a kép, az előtér és a háttér domináns színeinek, valamint az észlelt objektumok határolókeretekkel történő észlelésére. A Kép tulajdonságai a kép fényerejét, élességét és kontrasztját is mérik. Végül az Amazon Rekognition Labels két további mező segítségével rendszerezi a címkeeredményeket, aliases
és a categories
, és támogatja az eredmények szűrését. A következő részekben néhány példával részletesebben is áttekintjük az új képességeket és azok előnyeit.
Új címkék
Az Amazon Rekognition Labels több mint 600 új címkét adott hozzá, bővítve a támogatott címkék listáját. Íme néhány példa az új címkékre:
- Népszerű tereptárgyak – Brooklyn híd, Colosseum, Eiffel-torony, Machu Picchu, Taj Mahal stb.
- Tevékenységek – Taps, biciklizés, ünneplés, ugrálás, kutyasétáltatás stb.
- Kárfelismerés – Autó horpadás, autókarc, korrózió, lakáskár, tetőkár, termesz sérülés stb.
- Szöveg és dokumentumok – Oszlopdiagram, beszállókártya, folyamatábra, jegyzetfüzet, számla, nyugta stb.
- Sport – Baseball játék, krikettütő, műkorcsolya, rögbi, vízilabda stb.
- Sok más – Hajóverseny, mulatság, városkép, falu, esküvői ajánlat, bankett stb.
Ezekkel a címkékkel a képmegosztó, stockfotó vagy közvetített médiában dolgozó ügyfelek automatikusan új metaadatokat adhatnak hozzá tartalomkönyvtárukhoz, hogy javítsák keresési képességeiket.
Nézzünk egy címkeészlelési példát a Brooklyn Bridge-hez.
A következő táblázat az API-válaszban visszaadott címkéket és megbízhatósági pontszámokat mutatja be.
Címkék | Magabiztossági pontszámok |
Brooklyn híd | 95.6 |
Bridge | 95.6 |
Határkő | 95.6 |
Továbbfejlesztett címkék
Az Amazon Rekognition Labels több mint 2,000 címke pontosságát is javította. Íme néhány példa a továbbfejlesztett címkékre:
- Tevékenységek - Búvárkodás, vezetés, olvasás, ülés, állás stb.
- Ruházat és kiegészítők – Hátizsák, öv, blúz, kapucnis pulóver, dzseki, cipő stb.
- Otthon és bent - Úszómedence, cserepes növény, párna, kandalló, takaró stb.
- Technológia és számítástechnika - Fejhallgató, mobiltelefon, táblagép, olvasás, laptop stb.
- Járművek és autóipar - Teherautó, kerék, gumi, lökhárító, autósülés, autós tükör stb.
- Szöveg és dokumentumok – Útlevél, jogosítvány, névjegykártya, okmány stb.
- Sok más – Kutya, Kenguru, Városi tér, Fesztivál, Nevetés stb.
Képtulajdonságok a domináns színérzékeléshez és képminőséghez
Az Image Properties az Amazon Rekognition Labels új képessége a képekhez, és használható címkeészlelési funkcióval vagy anélkül. Megjegyzés: A Kép tulajdonságai az külön árazva az Amazon Rekognition Labels szolgáltatásból, és csak a frissített SDK-kkal érhető el.
Domináns színérzékelés
A Kép tulajdonságai a kép domináns színeit azonosítja a képpontok százalékos aránya alapján. Ezek a domináns színek a 140 CSS színpaletta, RGB, hexa kód és 12 egyszerűsített szín (zöld, rózsaszín, fekete, piros, sárga, cián, barna, narancs, fehér, lila, kék, szürke). Alapértelmezés szerint az API legfeljebb 10 domináns színt ad vissza, hacsak nem adja meg a visszaküldendő színek számát. Az API által visszaadható domináns színek maximális száma 12.
Önálló használat esetén az Image Properties felismeri a teljes kép domináns színeit, valamint az előterét és a hátterét. Címkeészlelési funkciókkal együtt használva az Image Properties az észlelt objektumok domináns színeit is határolókeretekkel azonosítja.
A képmegosztó vagy stockfotózást használó ügyfelek a domináns színérzékelés segítségével gazdagíthatják képkönyvtáruk metaadatait a tartalomfelfedezés javítása érdekében, lehetővé téve végfelhasználóik számára, hogy szín szerint szűrjenek, vagy konkrét színű objektumok között keressenek, például „kék szék” vagy „piros cipő”. ” Ezen túlmenően a hirdető ügyfelek kreatív elemeik színei alapján meghatározhatják a hirdetés teljesítményét.
A képminőség
A domináns színérzékelésen kívül az Image Properties a képminőséget is méri a fényerő, az élesség és a kontraszt pontszámokon keresztül. Ezen pontszámok mindegyike 0 és 100 között mozog. Például egy nagyon sötét kép alacsony fényerőt, míg egy erősen megvilágított kép magas értékeket ad vissza.
Ezekkel a pontszámokkal a képmegosztó, hirdetési vagy e-kereskedelmi ügyfelek minőségellenőrzést végezhetnek, és kiszűrhetik az alacsony fényerővel és élességgel rendelkező képeket, hogy csökkentsék a hamis címkék előrejelzését.
A következő képen az Eiffel-torony példája látható.
A következő táblázat egy példa az API-válaszban visszaadott kép tulajdonságaira.
A következő kép egy piros székre mutat példát.
Az alábbiakban egy példa látható az API-válaszban visszaadott kép tulajdonságaira.
A következő kép egy sárga hátterű kutya példája.
Az alábbiakban egy példa látható az API-válaszban visszaadott kép tulajdonságaira.
Új álnevek és kategóriamezők
Az Amazon Rekognition Labels két új mezőt ad vissza, aliases
és a categories
, az API-válaszban. Az álnevek ugyanazon címke más nevei, és a kategóriák az egyes címkéket 40 közös téma alapján csoportosítják, mint pl. Food and Beverage
és a Animals and Pets
. A címkeészlelési modell frissítésével az álnevek többé nem jelennek meg a címkenevek elsődleges listájában. Ehelyett az álnevek az újban jelennek meg aliases
mezőt az API-válaszban. Megjegyzés: Az álnevek és kategóriák csak a frissített SDK-kkal együtt jelennek meg.
A fotómegosztó, e-kereskedelem vagy hirdetési tevékenységet folytató ügyfelek álnevek és kategóriák segítségével rendszerezhetik tartalmi metaadat-taxonómiájukat, hogy tovább javítsák a tartalomkeresést és -szűrést:
- Példa az álnevekre - Mivel
Car
és aAutomobile
álnevek, metaadatokat adhat hozzá egy képhezCar
és aAutomobile
egy időben - Példa a kategóriákra – A kategóriák segítségével kategóriaszűrőt hozhat létre, vagy megjeleníthet egy adott kategóriához kapcsolódó összes képet, pl
Food and Beverage
, anélkül, hogy kifejezetten metaadatokat kellene hozzáadnia az egyes képekhezFood and Beverage
A következő kép egy címkeészlelési példát mutat be álnevekkel és kategóriákkal egy búvár számára.
A következő táblázat az API-válaszban visszaadott címkéket, megbízhatósági pontszámokat, álneveket és kategóriákat mutatja be.
Címkék | Magabiztossági pontszámok | Más nevek | Kategóriák |
Természet | 99.9 | - | Természet és szabadban |
Víz | 99.9 | - | Természet és szabadban |
Búvárkodás | 99.9 | Aqua Scuba | Utazás és kaland |
Személy | 99.9 | Emberi | Személyleírás |
Szabadidős tevékenységek | 99.9 | Pihenés | Utazás és kaland |
Sport | 99.9 | Sport | Sport |
A következő kép egy kerékpáros példája.
A következő táblázat tartalmazza az API-válaszban visszaadott címkéket, megbízhatósági pontszámokat, álneveket és kategóriákat.
Címkék | Magabiztossági pontszámok | Más nevek | Kategóriák |
Ég | 99.9 | - | Természet és szabadban |
Szabadban | 99.9 | - | Természet és szabadban |
Személy | 98.3 | Emberi | Személyleírás |
napnyugta | 98.1 | Alkonyat, Hajnal | Természet és szabadban |
Kerékpár | 96.1 | Bicikli | Hobbi és érdeklődési kör |
Kerékpározás | 85.1 | Kerékpáros, kerékpáros kerékpáros | Hozzászólások |
Befoglalási és kizárási szűrők
Az Amazon Rekognition Labels új felvételi és kizárási szűrési beállításokat vezet be az API bemeneti paramétereibe, hogy szűkítse az API-válaszban visszaadott címkék listáját. Megadhatja a felvenni vagy kizárni kívánt címkék vagy kategóriák egyértelmű listáját. Megjegyzés: Ezek a szűrők a frissített SDK-kkal érhetők el.
Az ügyfelek felvételi és kizárási szűrőket használhatnak az őket érdeklő címkék vagy kategóriák megszerzéséhez anélkül, hogy további logikát kellene létrehozniuk az alkalmazásukban. Például a biztosítással rendelkező ügyfelek használhatják LabelCategoriesInclusionFilter
hogy csak a címkeeredményeket tartalmazza a Damage Detection
kategória.
A következő kód egy API-minta kérés felvételi és kizárási szűrőkkel:
Az alábbiakban példák láthatók a felvételi és kizárási szűrők működésére:
- Ha csak észlelni akarod
Person
és aCar
, és ne törődj más címkékkel, megadhatod [“Person”,”Car”
] ban benLabelsInclusionFilter
. - Ha az összes címkét észlelni szeretné, kivéve a
Clothing
, megadhatja [“Clothing”
] ban benLabelsExclusionFilter
. - Ha csak a címkéket szeretné észlelni a
Animal and Pets
kategóriák kivételévelDog
és aCat
, megadhatja ["Animal and Pets"
] ban,-benLabelCategoriesInclusionFilter
, val vel ["Dog", "Cat"
] ban benLabelsExclusionFilter
. - Ha címke van megadva a
LabelsInclusionFilter
orLabelsExclusionFilter
, fedőneveik ennek megfelelően szerepelnek vagy ki lesznek zárva, mertaliases
a címkék résztaxonómiája. Például azért, mertAutomobile
egy álneveCar
, ha megadodCar
inLabelsInclusionFilter
, az API visszaadja aCar
felirattalAutomobile
aaliases
mező.
Következtetés
Az Amazon Rekognition Labels 600 új címkét észlel, és több mint 2,000 meglévő címke pontosságát javítja. Ezekkel a frissítésekkel együtt az Amazon Rekognition Labels mostantól támogatja a képtulajdonságokat, az álneveket és a kategóriákat, valamint a felvételi és befogadási szűrőket.
Az új címkeészlelési modell új funkcióival való kipróbálásához jelentkezzen be AWS-fiókjába, és nézze meg a Amazon Rekognition konzol címkefelismeréshez és képtulajdonságokhoz. Ha többet szeretne megtudni, látogasson el Címkék észlelése.
A szerzőkről
Mária Handoko az AWS vezető termékmenedzsere. Arra összpontosít, hogy segítse ügyfeleit üzleti kihívásaik megoldásában a gépi tanulás és a számítógépes látás segítségével. Szabadidejében szeret túrázni, podcastokat hallgatni és különféle konyhákat felfedezni.
Shipra Kanoria az AWS fő termékmenedzsere. Szenvedélyesen törekszik arra, hogy a gépi tanulás és a mesterséges intelligencia segítségével segítse ügyfeleit legbonyolultabb problémáik megoldásában. Mielőtt csatlakozott volna az AWS-hez, Shipra több mint 4 évet töltött az Amazon Alexánál, ahol számos, a termelékenységgel kapcsolatos funkciót bevezetett az Alexa hangasszisztensen.
- AI
- ai művészet
- ai art generátor
- van egy robotod
- Amazon felismerés
- mesterséges intelligencia
- mesterséges intelligencia tanúsítás
- mesterséges intelligencia a bankszektorban
- mesterséges intelligencia robot
- mesterséges intelligencia robotok
- mesterséges intelligencia szoftver
- AWS gépi tanulás
- blockchain
- blokklánc konferencia ai
- coingenius
- társalgási mesterséges intelligencia
- kriptokonferencia ai
- dall's
- mély tanulás
- google azt
- gépi tanulás
- Plató
- plato ai
- Platón adatintelligencia
- Platón játék
- PlatoData
- platogaming
- skála ai
- szintaxis
- zephyrnet