Digitale udgivere leder løbende efter måder at strømline og automatisere deres mediearbejdsgange for at generere og udgive nyt indhold så hurtigt som de kan.
Mange forlag har et stort bibliotek af stockbilleder, som de bruger til deres artikler. Disse billeder kan genbruges mange gange til forskellige historier, især når udgiveren har billeder af berømtheder. Ganske ofte kan en journalist være nødt til at beskære en ønsket berømthed fra et billede for at bruge til deres kommende historie. Dette er en manuel, gentagne opgave, der bør automatiseres. Nogle gange vil en forfatter måske bruge et billede af en berømthed, men det indeholder to personer, og den primære berømthed skal beskæres fra billedet. Andre gange skal berømthedsbilleder muligvis omformateres til udgivelse til en række forskellige platforme som mobil, sociale medier eller digitale nyheder. Derudover kan en forfatter muligvis ændre billedformatet eller sætte berømtheden i skarpt fokus.
I dette indlæg viser vi, hvordan du bruger Amazon-anerkendelse at udføre billedanalyse. Amazon Rekognition gør det nemt at tilføje denne funktion til dine applikationer uden maskinlæringsekspertise (ML) og leveres med forskellige API'er til at opfylde use cases såsom objektgenkendelse, indholdsmoderering, ansigtsgenkendelse og -analyse og tekst- og berømthedsgenkendelse, som vi brug i dette eksempel.
genkendelse af berømtheder in Amazon-anerkendelse genkender automatisk titusindvis af kendte personligheder i billeder og videoer ved hjælp af ML. Berømthedsgenkendelse kan ikke blot registrere tilstedeværelsen af den givne berømthed, men også placeringen i billedet.
Oversigt over løsning
I dette indlæg demonstrerer vi, hvordan vi kan sende et billede, et berømthedsnavn og et billedformat for det udsendte billede for at kunne generere et beskåret billede af den givne berømthed, der fanger deres ansigt i midten.
Når man arbejder med Amazon Rekognition celebrity detection API, returneres mange elementer i svaret. Følgende er nogle vigtige reaktionselementer:
- MatchConfidence – En matchkonfidensscore, der kan bruges til at kontrollere API-adfærd. Vi anbefaler at anvende en passende tærskel for denne score i din ansøgning for at vælge dit foretrukne driftspunkt. For eksempel, ved at indstille en tærskel på 99 %, kan du eliminere falske positive, men kan gå glip af nogle potentielle matches.
- Navn, id og webadresser – Berømthedsnavnet, et unikt Amazon-genkendelses-id og en liste over URL'er, såsom berømthedens IMDb- eller Wikipedia-link for yderligere information.
- BoundingBox – Koordinater for det rektangulære afgrænsningsfelts placering for hvert genkendt berømthedsansigt.
- Kendt Køn – Kendt kønsidentitet for hver anerkendt berømthed.
- Emotions – Følelser udtrykt på berømthedens ansigt, for eksempel glad, trist eller vred.
- Positur – Position af berømthedens ansigt ved hjælp af tre akser med rulning, pitch og yaw.
- Smil – Om berømtheden smiler eller ej.
En del af API-svaret fra Amazon Rekognition inkluderer følgende kode:
I denne øvelse demonstrerer vi, hvordan man bruger afgrænsningsramme-elementet til at identificere placeringen af ansigtet, som vist i følgende eksempelbillede. Alle dimensionerne er repræsenteret som forhold mellem den samlede billedstørrelse, så tallene i svaret er mellem 0-1. I eksempel-API-svaret er afgrænsningsrammens bredde 0.1, hvilket indebærer, at ansigtsbredden er 10 % af billedets samlede bredde.
Med denne afgrænsningsramme er vi nu i stand til at bruge logik til at sikre, at ansigtet forbliver inden for kanterne af det nye billede, vi skaber. Vi kan påføre noget polstring omkring denne afgrænsningsboks for at holde ansigtet i midten.
I de følgende afsnit viser vi, hvordan du opretter følgende beskårne billedoutput med Werner Vogels i skarpt fokus.
Vi lancerer en Amazon SageMaker notebook, som giver et Python-miljø, hvor du kan køre koden for at sende et billede til Amazon Rekognition og derefter automatisk ændre billedet med berømtheden i fokus.
Koden udfører følgende trin på højt niveau:
- Lav en anmodning til
recognize_celebrities
API med det givne billede og kendte navn. - Filtrer svaret for information om afgrænsningsrammen.
- Tilføj noget polstring til afgrænsningsboksen, så vi fanger noget af baggrunden.
Forudsætninger
For denne gennemgang skal du have følgende forudsætninger:
Upload eksempelbilledet
Upload dit eksempel på en berømthedsbillede til din S3-bøtte.
Kør koden
For at køre koden bruger vi en SageMaker notesbog, men enhver IDE ville også fungere efter installation af Python, pillow og Boto3. Vi laver en SageMaker notesbog samt AWS identitets- og adgangsstyring (IAM) rolle med de nødvendige tilladelser. Udfør følgende trin:
- Opret notesbogen og navngiv det
automatic-cropping-celebrity
.
Standardudførelsespolitikken, som blev oprettet ved oprettelse af SageMaker-notesbogen, har en simpel politik, der giver rollen tilladelse til at interagere med Amazon S3.
- Opdatér
Resource
begrænsning med S3-spandnavnet:
- Opret en anden politik for at føje til SageMaker notebook IAM-rollen for at kunne kalde Genkend Berømtheder API'er:
- Vælg på SageMaker-konsollen Notebook-forekomster i navigationsruden.
- Find den
automatic-cropping-celebrity
notesbog og vælg Åbn Jupyter. - Vælg Ny , conda_python3 som kernen til din notesbog.
For de følgende trin skal du kopiere kodeblokkene ind i din Jupyter notesbog og køre dem ved at vælge Kør.
- Først importerer vi hjælpefunktioner og biblioteker:
- Indstil variabler
- Opret en serviceklient
- Funktion til at genkende de kendte
- Funktion for at få afgrænsningsrammen for den givne berømthed:
- Funktion til at tilføje noget polstring til afgrænsningsboksen, så vi fanger noget baggrund omkring ansigtet
- Funktion til at gemme billedet til notebook-lageret og til Amazon S3
- Brug Python
main()
funktion til at kombinere de foregående funktioner for at fuldende arbejdsgangen med at gemme et nyt beskåret billede af vores berømthed:
Når du kører denne kodeblok, kan du se, at vi fandt Werner Vogels og skabte et nyt billede med hans ansigt i midten.
Billedet gemmes på notesbogen og uploades også til S3-bøtten.
Du kan inkludere denne løsning i en større arbejdsgang; for eksempel vil et forlag måske udgive denne mulighed som et slutpunkt til at omformatere og ændre størrelsen på billeder i farten, når de udgiver artikler fra berømtheder på flere platforme.
Gøre rent
For at undgå fremtidige gebyrer skal du slette ressourcerne:
- På SageMaker-konsollen skal du vælge din notesbog og på handlinger menu, vælg Stands.
- Efter at notesbogen er stoppet, på handlinger menu, vælg Slette.
- På IAM-konsollen skal du slette den SageMaker-udførelsesrolle, du har oprettet.
- På Amazon S3-konsollen skal du slette inputbilledet og eventuelle outputfiler fra din S3-bøtte.
Konklusion
I dette indlæg viste vi, hvordan vi kan bruge Amazon Rekognition til at automatisere en ellers manuel opgave med at ændre billeder for at understøtte mediearbejdsgange. Dette er især vigtigt inden for forlagsbranchen, hvor hastighed betyder noget for at få frisk indhold ud hurtigt og til flere platforme.
For mere information om at arbejde med medieaktiver, se Medieintelligens er lige blevet smartere med Media2Cloud 3.0
Om forfatteren
Mark Watkins er en Solutions Architect inden for medie- og underholdningsteamet. Han hjælper kunder med at skabe AI/ML-løsninger, der løser deres forretningsmæssige udfordringer ved hjælp af AWS. Han har arbejdet på adskillige AI/ML-projekter relateret til computersyn, naturlig sprogbehandling, personalisering, ML på kanten og mere. Væk fra det professionelle liv elsker han at tilbringe tid med sin familie og se sine to små vokse op.
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- Platoblokkæde. Web3 Metaverse Intelligence. Viden forstærket. Adgang her.
- Kilde: https://aws.amazon.com/blogs/machine-learning/automatic-image-cropping-with-amazon-rekognition/
- :er
- $OP
- 1
- 10
- 100
- 11
- 7
- 8
- 9
- a
- I stand
- Om
- adgang
- Handling
- Derudover
- Efter
- AI / ML
- Alle
- Amazon
- Amazon-anerkendelse
- analyse
- ,
- En anden
- api
- API'er
- Anvendelse
- applikationer
- Indløs
- Anvendelse
- ER
- omkring
- artikler
- AS
- udseende
- Aktiver
- At
- forfatter
- automatisere
- Automatiseret
- Automatisk Ur
- automatisk
- AWS
- AKSER
- baggrund
- BE
- mellem
- Bloker
- Blocks
- Boks
- kasser
- virksomhed
- by
- ringe
- CAN
- fange
- Optagelse
- tilfælde
- Celeb
- berømtheder
- Celebrity
- center
- udfordringer
- lave om
- afgifter
- Vælg
- vælge
- kode
- kombinerer
- selskab
- fuldføre
- computer
- Computer Vision
- tillid
- Konsol
- indeholder
- indhold
- kontinuerligt
- kontrol
- kunne
- skabe
- oprettet
- Oprettelse af
- afgrøde
- Kunder
- Standard
- demonstrere
- ønskes
- opdaget
- Detektion
- forskellige
- digital
- størrelse
- Skærm
- downloade
- e
- hver
- Edge
- effekt
- element
- elementer
- eliminere
- Endpoint
- Underholdning
- Miljø
- især
- eksempel
- udførelse
- Dyrke motion
- ekspertise
- udtrykt
- Ansigtet
- ansigter
- familie
- berømt
- File (Felt)
- Filer
- Fokus
- efter
- Til
- format
- fundet
- frisk
- fra
- funktion
- funktioner
- yderligere
- fremtiden
- Køn
- generere
- få
- få
- given
- giver
- Dyrkning
- Gem
- Have
- højde
- hjælper
- højt niveau
- Hvordan
- How To
- Men
- HTML
- http
- HTTPS
- ID
- identificere
- Identity
- billede
- billeder
- importere
- vigtigt
- in
- omfatter
- omfatter
- industrien
- oplysninger
- indgang
- installation
- Intelligens
- interagere
- IT
- journalist
- jpg
- Holde
- Nøgle
- kendt
- Sprog
- stor
- lancere
- læring
- biblioteker
- Bibliotek
- Livet
- ligesom
- LINK
- Liste
- lidt
- lokale
- placering
- leder
- maskine
- machine learning
- lave
- maerker
- manuel
- mange
- Match
- Matters
- Medier
- Menu
- måske
- ML
- Mobil
- mådehold
- ændre
- mere
- flere
- navn
- Natural
- Natural Language Processing
- Navigation
- Behov
- behov
- Ny
- nyheder
- notesbog
- numre
- objekt
- Objektdetektion
- of
- on
- drift
- ordrer
- Andet
- Ellers
- output
- samlet
- brød
- især
- sti
- Mennesker
- Udfør
- udfører
- Tilladelser
- Personligheder
- Personalisering
- Pitch
- Platforme
- plato
- Platon Data Intelligence
- PlatoData
- Punkt
- politik
- Indlæg
- potentiale
- foretrækkes
- forudsætninger
- tilstedeværelse
- primære
- forarbejdning
- professionel
- projekter
- giver
- offentliggøre
- forlægger
- udgivere
- Publicering
- sætte
- Python
- hurtigt
- rejse
- hurtigt
- forholdet
- anerkendelse
- genkende
- anerkendt
- anerkender
- anbefaler
- relaterede
- resterne
- repetitiv
- repræsenteret
- anmode
- påkrævet
- ressource
- Ressourcer
- svar
- resultere
- Resultater
- afkast
- ROI
- roller
- Roll
- Kør
- sagemaker
- Gem
- besparelse
- score
- sektioner
- tjeneste
- indstilling
- flere
- bør
- Vis
- vist
- Simpelt
- Størrelse
- smartere
- So
- Social
- sociale medier
- løsninger
- Løsninger
- SOLVE
- nogle
- hastighed
- udgifterne
- firkant
- Statement
- Steps
- bestand
- stoppet
- opbevaring
- Historier
- Historie
- strømline
- sådan
- egnede
- support
- Opgaver
- hold
- at
- deres
- Them
- Disse
- tusinder
- tre
- tærskel
- tid
- gange
- til
- top
- I alt
- enestående
- kommende
- uploadet
- brug
- række
- forskellige
- udgave
- Videoer
- vision
- går igennem
- ser
- måder
- GODT
- Kendt
- hvorvidt
- som
- bredde
- Wikipedia
- vilje
- med
- inden for
- uden
- Arbejde
- arbejdsgange
- arbejder
- ville
- Du
- Din
- zephyrnet