Identifying Landmarks With Amazon Rekognition Custom Labels

Genudgivet af Platon

Abonnenter: 0

Amazon-anerkendelse er en computervisionstjeneste, der gør det nemt at tilføje billed- og videoanalyse til dine applikationer ved hjælp af gennemprøvet, meget skalerbar, deep learning-teknologi, der ikke kræver maskinlæring (ML) ekspertise. Med Amazon Rekognition kan du identificere objekter, personer, tekst, scener og aktiviteter i billeder og videoer og opdage upassende indhold. Amazon Rekognition giver også meget nøjagtige ansigtsanalyse- og ansigtssøgningsfunktioner, som du kan bruge til at opdage, analysere og sammenligne ansigter til en lang række forskellige anvendelsestilfælde.

Tilpassede etiketter til Amazon-genkendelse er en funktion i Amazon Rekognition, der gør det nemt at bygge dine egne specialiserede ML-baserede billedanalysefunktioner for at detektere unikke objekter og scener, der er integreret i din specifikke brugssituation.

Nogle almindelige brugssager af Rekognition Custom Labels inkluderer at finde dit logo i opslag på sociale medier, at identificere dine produkter på butikshylderne, at klassificere maskindele i et samlebånd, at skelne mellem sunde og inficerede planter og mere.

Amazon-genkendelsesetiketter understøtter populære vartegn som Brooklyn Bridge, Colosseum, Eiffeltårnet, Machu Picchu, Taj Mahal, og mere. Hvis du har andre vartegn eller bygninger, der endnu ikke er understøttet af Amazon Rekognition, kan du stadig bruge Amazon Rekognition Custom Labels.

I dette indlæg demonstrerer vi brugen af Rekognition Custom Labels til at opdage Amazon Spheres-bygningen i Seattle.

Med Rekognition Custom Labels tager AWS sig af de tunge løft for dig. Rekognition Custom Labels bygger på de eksisterende muligheder for Amazon Rekognition, som allerede er trænet på titusinder af billeder på tværs af mange kategorier. I stedet for tusindvis af billeder skal du blot uploade et lille sæt træningsbilleder (typisk et par hundrede billeder eller mindre), der er specifikke for din brugssituation via vores enkle konsol. Amazon Rekognition kan begynde at træne med blot et par klik. Efter at Amazon Rekognition begynder at træne fra dit billedsæt, kan det producere en tilpasset billedanalysemodel til dig inden for få minutter eller timer. Bag kulisserne indlæser og inspicerer Rekognition Custom Labels automatisk træningsdataene, vælger de passende ML-algoritmer, træner en model og leverer modelpræstationsmålinger. Du kan derefter bruge din brugerdefinerede model via Rekognition Custom Labels API og integrere den i dine applikationer.

Løsningsoversigt

Til vores eksempel bruger vi Amazon sfærer bygning i Seattle. Vi træner en model ved hjælp af Rekognition Custom Labels; Når der bruges lignende billeder, skal algoritmen identificere det som Amazon Spheres i stedet for Dome, Architecture, Glass buildingeller andre etiketter.

Lad os først vise et eksempel på brug af etiketdetektionsfunktionen i Amazon Rekognition, hvor vi fodrer billedet af Amazon Spheres uden nogen tilpasset træning. Vi bruger Amazon Rekognition-konsollen til at åbne etiketdetektionsdemoen og uploade vores foto.

Efter at billedet er uploadet og analyseret, ser vi etiketter med deres konfidensscore under Resultater. I dette tilfælde, Dome blev detekteret med en konfidensscore på 99.2 %, Architecture med 99.2%, Building med 99.2%, Metropolis med 79.4 % og så videre.

Vi ønsker at bruge tilpasset mærkning til at producere en computervisionsmodel, der kan mærke billedet Amazon Spheres.

I de følgende afsnit fører vi dig gennem forberedelsen af dit datasæt, oprettelse af et Rekognition Custom Labels-projekt, træning af modellen, evaluering af resultaterne og testning med yderligere billeder.

Forudsætninger

Før du starter med trinene, er der kvoter til brugerdefinerede anerkendelsesetiketter, som du skal være opmærksom på. Hvis du ønsker at ændre grænserne, kan du anmode om en stigning i servicegrænsen.

Opret dit datasæt

Hvis det er første gang, du bruger brugerdefinerede etiketter for anerkendelse, bliver du bedt om at oprette en Amazon Simple Storage Service (Amazon S3) spand til at gemme dit datasæt.

Til denne blogdemonstration har vi brugt billeder af Amazonasfærerne, som vi fangede, mens vi besøgte Seattle, WA. Du er velkommen til at bruge dine egne billeder efter dit behov.

Kopier dit datasæt til den nyoprettede bøtte, som gemmer dine billeder inden for deres respektive præfikser.

Identifying landmarks with Amazon Rekognition Custom Labels PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Opret et projekt

For at oprette dit Rekognition Custom Labels-projekt skal du udføre følgende trin:

På Rekognition Custom Labels-konsollen skal du vælge Opret et projekt.
Til Projekt navn, indtast et navn.
Vælg Opret projekt.

Nu specificerer vi konfigurationen og stien til dit trænings- og testdatasæt.
Vælg Opret datasæt.

Du kan starte med et projekt, der har et enkelt datasæt, eller et projekt, der har separate trænings- og testdatasæt. Hvis du starter med et enkelt datasæt, opdeler Rekognition Custom Labels dit datasæt under træning for at oprette et træningsdatasæt (80 %) og et testdatasæt (20 %) til dit projekt.

Derudover kan du oprette trænings- og testdatasæt for et projekt ved at importere billeder fra en af følgende lokationer:

Til dette indlæg bruger vi vores eget tilpassede datasæt af Amazon Spheres.

Type Start med et enkelt datasæt.
Type Importer billeder fra S3 bucket.
Til S3 URI, indtast stien til din S3-spand.
Hvis du ønsker, at Rekognition Custom Labels automatisk skal mærke billederne for dig baseret på mappenavnene i din S3-bøtte, skal du vælge Tildel automatisk etiketter på billedniveau til billeder baseret på mappenavnet.
Vælg Opret datasæt.

Der åbnes en side, der viser dig billederne med deres etiketter. Hvis du ser nogen fejl i etiketterne, se Fejlretning af datasæt.

Identifying landmarks with Amazon Rekognition Custom Labels PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Træn modellen

Efter du har gennemgået dit datasæt, kan du nu træne modellen.

Vælg tog model.
Til Vælg projekt, skal du indtaste ARN for dit projekt, hvis det ikke allerede er på listen.
Vælg Tog model.

I Modeller afsnittet på projektsiden, kan du kontrollere den aktuelle status i Model status kolonne, hvor træningen er i gang. Træningstiden tager typisk 30 minutter til 24 timer at gennemføre, afhængigt af flere faktorer, såsom antallet af billeder og antallet af etiketter i træningssættet, og typer af ML-algoritmer, der bruges til at træne din model.

Når modeluddannelsen er afsluttet, kan du se modelstatus som TRAINING_COMPLETED. Hvis træningen mislykkes, henvises til Fejlretning af en mislykket modeltræning.

Vurder modellen

Åbn siden med modeldetaljer. Det Evaluering fanen viser metrics for hver etiket og den gennemsnitlige metric for hele testdatasættet.

Anerkendte brugerdefinerede etiketter-konsollen giver følgende metrics som en oversigt over træningsresultaterne og som metrics for hver etiket:

Du kan se resultaterne af din trænede model for individuelle billeder, som vist på det følgende skærmbillede.

Test modellen

Nu hvor vi har set evalueringsresultaterne, er vi klar til at starte modellen og analysere nye billeder.

Du kan starte modellen på Brug model fanen på konsollen med brugerdefinerede etiketter for anerkendelse, eller ved at bruge StartProjectVersion drift via AWS kommandolinjegrænseflade (AWS CLI) eller Python SDK.

Når modellen kører, kan vi analysere de nye billeder ved hjælp af DetectCustomLabels API. Resultatet fra DetectCustomLabels er en forudsigelse om, at billedet indeholder specifikke objekter, scener eller koncepter. Se følgende kode:

aws rekognition detect-custom-labels 
--project-version-arn  
--image '{"S3Object": {"Bucket":,"Name":}}' 
--region

I outputtet kan du se etiketten med dens konfidensscore:

{
    "Custom Labels": [
        {
            "Name": "Amazon Spheres",
            "Confidence": 93.55500030517578
        }
    ]
}

Som du kan se på resultatet, kan du blot med få enkle klik bruge Rekognition Custom Labels til at opnå nøjagtige mærkningsresultater. Du kan bruge dette til et væld af billedbrugssager, såsom at identificere tilpasset mærkning af fødevarer, kæledyr, maskindele og mere.

Ryd op

For at rydde op i de ressourcer, du har oprettet som en del af dette indlæg og undgå potentielle tilbagevendende omkostninger, skal du udføre følgende trin:

På Brug model fane, stoppe modellen.
Alternativt kan du stoppe modellen ved hjælp af StopProjectVersion drift via AWS CLI eller Python SDK.Vent indtil modellen er i Stopped tilstand, før du fortsætter til de næste trin.
Slet modellen.
Slet projektet.
Slet datasættet.
Tom S3 spandens indhold og slette spanden.

Konklusion

I dette indlæg viste vi, hvordan man bruger Rekognition Custom Labels til at opdage bygningsbilleder.

Du kan komme i gang med dine brugerdefinerede billeddatasæt, og med et par enkle klik på Rekognition Custom Labels-konsollen kan du træne din model og detektere objekter i billeder. Tilpassede etiketter for anerkendelse kan automatisk indlæse og inspicere dataene, vælge de rigtige ML-algoritmer, træne en model og levere modelpræstationsmålinger. Du kan gennemgå detaljerede præstationsmålinger såsom præcision, genkaldelse, F1-score og konfidensscore.

Dagen er kommet, hvor vi nu kan identificere populære bygninger som Empire State Building i New York City, Taj Mahal i Indien og mange andre over hele verden, der er præ-mærket og klar til brug for intelligens i dine applikationer. Men hvis du har andre vartegn, som endnu ikke understøttes af Amazon Rekognition Labels, skal du ikke lede længere og prøve Amazon Rekognition Custom Labels.

For mere information om brug af brugerdefinerede etiketter, se Hvad er tilpassede etiketter til Amazon-genkendelse? Besøg også vores GitHub repo for en end-to-end workflow af Amazon Rekognition brugerdefineret branddetektion.

Om forfatterne:

Suresh Patnam er Principal BDM – GTM AI/ML Leader hos AWS. Han arbejder sammen med kunder om at opbygge IT-strategi, hvilket gør digital transformation gennem skyen mere tilgængelig ved at udnytte Data & AI/ML. I sin fritid nyder Suresh at spille tennis og tilbringe tid med sin familie.

Bunny Kaushik er Solutions Architect hos AWS. Han brænder for at bygge AI/ML-løsninger på AWS og hjælpe kunder med at innovere på AWS-platformen. Uden for arbejdet nyder han at vandre, klatre og svømme.

Tidsstempel: November 22, 2022November 22, 2022

Tidsstempel: Februar 2, 2022

Identifikation af vartegn med Amazon Rekognition Custom Labels

Genudgivet af Platon

Løsningsoversigt

Forudsætninger

Opret dit datasæt

Opret et projekt

Træn modellen

Vurder modellen

Test modellen

Ryd op

Konklusion

Om forfatterne:

Mere fra AWS maskinindlæring

Nem og præcis prognose med AutoGluon-TimeSeries

Identificer nøgleindsigt fra tekstdokumenter gennem finjustering og HPO med Amazon SageMaker JumpStart

Opret en HCLS dokumentopsummeringsapplikation med Falcon ved hjælp af Amazon SageMaker JumpStart | Amazon Web Services

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto