amazontekst er en maskinlæringstjeneste (ML), der muliggør automatisk udtrækning af tekst, håndskrift og data fra scannede dokumenter, der overgår traditionel optisk tegngenkendelse (OCR). Det kan identificere, forstå og udtrække data fra tabeller og formularer med bemærkelsesværdig nøjagtighed. I øjeblikket er flere virksomheder afhængige af manuelle ekstraktionsmetoder eller grundlæggende OCR-software, hvilket er kedeligt og tidskrævende og kræver manuel konfiguration, der skal opdateres, når formularen ændres. Amazon Textract hjælper med at løse disse udfordringer ved at bruge ML til automatisk at behandle forskellige dokumenttyper og præcist udtrække information med minimal manuel indgriben. Dette giver dig mulighed for at automatisere dokumentbehandlingen og bruge de udtrukne data til forskellige formål, såsom automatisering af lånebehandling eller indsamling af oplysninger fra fakturaer og kvitteringer.
Da rejsen genoptages efter pandemien, kan det i mange tilfælde være nødvendigt at bekræfte en rejsendes vaccinationsstatus. Hoteller og rejsebureauer har ofte brug for at gennemgå vaccinationskort for at indsamle vigtige detaljer, såsom om den rejsende er fuldt vaccineret, vaccinedatoer og den rejsendes navn. Nogle bureauer gør dette gennem manuel verifikation af kort, hvilket kan være tidskrævende for personalet og giver plads til menneskelige fejl. Andre har bygget skræddersyede løsninger, men disse kan være dyre og svære at skalere og tage betydelig tid at implementere. Fremadrettet kan der være muligheder for at strømline processen til verifikation af vaccinationsstatus på en måde, der er effektiv for virksomheder, samtidig med at de rejsendes privatliv og bekvemmelighed respekteres.
Amazon Textract-forespørgsler hjælper med at løse disse udfordringer. Amazon Textract Queries giver dig mulighed for kun at specificere og udtrække den information, du har brug for, fra dokumentet. Det giver dig præcise og nøjagtige oplysninger fra dokumentet.
I dette indlæg fører vi dig gennem en trin-for-trin implementeringsvejledning til at bygge en løsning til verifikation af vaccinationsstatus ved hjælp af Amazon Textract-forespørgsler. Løsningen viser, hvordan man behandler vaccinationskort ved hjælp af en Amazon Textract-forespørgsel, verificerer vaccinationsstatus og gemmer oplysningerne til fremtidig brug.
Løsningsoversigt
Følgende diagram illustrerer løsningsarkitekturen.
Arbejdsgangen omfatter følgende trin:
- Brugeren tager et billede af et vaccinationskort.
- Billedet uploades til en Amazon Simple Storage Service (Amazon S3) spand.
- Når billedet bliver gemt i S3-bøtten, kalder det en AWS-trinfunktioner workflow:
- Forespørgselsbeslutteren AWS Lambda funktion undersøger det indsendte dokument og tilføjer oplysninger om mime-typen, antallet af sider og antallet af forespørgsler til Trinfunktioner-arbejdsgangen (for vores eksempel har vi fire forespørgsler).
NumberQueriesAndPagesChoice
er en valgtilstand, der tilføjer betinget logik til en arbejdsgang. Hvis der er mellem 15-31 forespørgsler, og antallet af sider er mellem 2-3,001, så er Amazon Textract asynkron behandling den eneste mulighed, fordi synkrone API'er kun understøtter op til 15 forespørgsler og dokumenter på én side. I alle andre tilfælde går vi til det tilfældige valg af synkron eller asynkron behandling.-
TextractSync
Lambda-funktionen sender en anmodning til Amazon Textract om at analysere dokumentet baseret på følgende Amazon Textract-forespørgsler:- Hvad er vaccinationsstatus?
- Hvad er navnet?
- Hvad er fødselsdato?
- Hvad er dokumentnummer?
- Amazon Textract analyserer billedet og sender svarene på disse forespørgsler tilbage til Lambda-funktionen.
- Lambda-funktionen verificerer kundens vaccinationsstatus og gemmer det endelige resultat i CSV-format i samme S3-spand (
demoqueries-textractxxx
) Icsv-output
mappe.
Forudsætninger
For at fuldføre denne løsning skal du have en AWS-konto og de relevante tilladelser til at oprette de ressourcer, der kræves som en del af løsningen.
Download implementeringskoden og prøvevaccinationskortet fra GitHub.
Brug Queries-funktionen på Amazon Textract-konsollen
Før du bygger vaccinationsbekræftelsesløsningen, lad os undersøge, hvordan du kan bruge Amazon Textract-forespørgsler til at udtrække vaccinationsstatus via Amazon Textract-konsollen. Du kan bruge prøven af vaccinationskortet, som du downloadede fra GitHub-reposen.
- På Amazon Textract-konsollen skal du vælge Analyser dokument i navigationsruden.
- Under Upload dokument, vælg Vælg dokument at uploade vaccinationskortet fra dit lokale drev.
- Når du har uploadet dokumentet, skal du vælge Forespørgsler i Konfigurer dokument sektion.
- Du kan derefter tilføje forespørgsler i form af spørgsmål i naturligt sprog. Lad os tilføje følgende:
- Hvad er vaccinationsstatus?
- Hvad er navnet?
- Hvad er fødselsdato?
- Hvad er dokumentnummer?
- Når du har tilføjet alle dine forespørgsler, skal du vælge Anvend konfiguration.
- Tjek forespørgslerne fanen for at se svarene på spørgsmålene.
Du kan se, at Amazon Textract uddrager svaret på din forespørgsel fra dokumentet.
Implementer vaccinationsverifikationsløsningen
I dette indlæg bruger vi en AWS Cloud9 instans og installer de nødvendige afhængigheder på instansen med AWS Cloud Development Kit (AWS CDK) og Docker. AWS Cloud9 er et cloud-baseret integreret udviklingsmiljø (IDE), der lader dig skrive, køre og fejlsøge din kode med kun en browser.
- I terminalen skal du vælge Upload lokale filer på den File (Felt) menu.
- Vælg Vælg mappe og vælg
vaccination_verification_solution
mappe, du downloadede fra GitHub. - I terminalen skal du forberede din serverløse applikation til de efterfølgende trin i dit udviklingsworkflow AWS serverløs applikationsmodel (AWS SAM) ved hjælp af følgende kommando:
- Implementer applikationen ved hjælp af
cdk deploy
kommando:Vent på, at AWS CDK implementerer modellen og opretter de ressourcer, der er nævnt i skabelonen.
- Når implementeringen er fuldført, kan du kontrollere de implementerede ressourcer på AWS CloudFormation konsol på Ressourcer fanen på siden med stakdetaljer.
Test løsningen
Nu er det tid til at teste løsningen. For at udløse arbejdsgangen skal du bruge aws s3 cp
at uploade vac_card.jpg
fil til DemoQueries.DocumentUploadLocation
inde i docs-mappen:
Vaccinationscertifikatfilen bliver automatisk uploadet til S3-bøtten demoqueries-textractxxx
i upload-mappen.
Step Functions-arbejdsgangen udløses via en Lambda-funktion, så snart vaccinationscertifikatfilen er uploadet til S3-bøtten.
Queries-Decider Lambda-funktionen undersøger dokumentet og tilføjer oplysninger om mime-typen, antallet af sider og antallet af forespørgsler til Step Functions-arbejdsgangen (i dette eksempel bruger vi fire forespørgsler – dokumentnummer, kundenavn, dato for fødsel og vaccinationsstatus).
TextractSync
funktionen sender inputforespørgslerne til Amazon Textract og returnerer synkront det fulde resultat som en del af svaret. Det understøtter 1-sides dokumenter (TIFF, PDF, JPG, PNG) og op til 15 forespørgsler. Det GenerateCsvTask
funktionen tager JSON-outputtet fra Amazon Textract og konverterer det til en CSV-fil.
Det endelige output gemmes i den samme S3-bøtte i csv-output-mappen som en CSV-fil.
Du kan downloade filen til din lokale maskine ved hjælp af følgende kommando:
Formatet på resultatet er timestamp
, classification
, filename
, page number
, key name
, key_confidence
, value
, value_confidence
, key_bb_top
, key_bb_height
, key_bb.width
, key_bb_left
, value_bb_top
, value_bb_height
, value_bb_width
, value_bb_left
.
Du kan skalere løsningen til hundredvis af vaccinationscertifikatdokumenter for flere kunder ved at uploade deres vaccinationscertifikater til DemoQueries.DocumentUploadLocation
. Dette udløser automatisk flere kørsler af Step Functions-tilstandsmaskinen, og det endelige resultat gemmes i den samme S3-bøtte i csv-output-mappen.
For at ændre det indledende sæt af forespørgsler, der føres ind i Amazon Textract, kan du gå til din AWS Cloud9-instans og åbne filen start_execution.py. I filvisningen i venstre rude skal du navigere til lambda, start_queries
, app
, start_execution.py
. Denne Lambda-funktion aktiveres, når en fil uploades til DemoQueries.DocumentUploadLocation
. De forespørgsler, der sendes til arbejdsgangen, er defineret i start_execution.py
; du kan ændre dem ved at opdatere koden som vist på det følgende skærmbillede.
Ryd op
For at undgå at pådrage sig løbende gebyrer skal du slette de ressourcer, der er oprettet i dette indlæg ved at bruge følgende kommando:
Svar på spørgsmålet Are you sure you want to delete: DemoQueries (y/n)?
med y.
Konklusion
I dette indlæg viste vi dig, hvordan du bruger Amazon Textract Queries til at bygge en vaccinationsverifikationsløsning til rejsebranchen. Du kan bruge Amazon Textract-forespørgsler til at bygge løsninger i andre brancher som finans og sundhedspleje og hente oplysninger fra dokumenter såsom lønsedler, pantsedler og forsikringskort baseret på spørgsmål om naturligt sprog.
For mere information, se Analyse af dokumenter, eller tjek Amazon Textract-konsollen og prøv denne funktion.
Om forfatterne
Dhiraj Thakur er en løsningsarkitekt med Amazon Web Services. Han arbejder sammen med AWS-kunder og -partnere for at give vejledning om cloud-adoption, migrering og strategi. Han brænder for teknologi og nyder at bygge og eksperimentere i analytics og AI/ML-rummet.
Rishabh Yadav er Partner Solutions-arkitekt hos AWS med en omfattende baggrund i DevOps og sikkerhedstilbud hos AWS. Han arbejder sammen med ASEAN-partnere for at give vejledning om virksomheds cloud-adoption og arkitekturgennemgange sammen med opbygning af AWS-praksis gennem implementering af Well-Architected Framework. Uden for arbejdet kan han lide at bruge sin tid på sportspladsen og FPS-spil.
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk dig selv. Adgang her.
- PlatoAiStream. Web3 intelligens. Viden forstærket. Adgang her.
- PlatoESG. Kulstof, CleanTech, Energi, Miljø, Solenergi, Affaldshåndtering. Adgang her.
- PlatoHealth. Bioteknologiske og kliniske forsøgs intelligens. Adgang her.
- Kilde: https://aws.amazon.com/blogs/machine-learning/build-a-vaccination-verification-solution-using-the-queries-feature-in-amazon-textract/
- :er
- $OP
- 001
- 100
- 15 %
- 1930
- 2468
- 258
- 7
- 8
- a
- Om
- Konto
- nøjagtighed
- præcis
- præcist
- tilføje
- adresse
- Tilføjer
- Vedtagelse
- agenturer
- AI / ML
- Alle
- tillader
- sammen
- Amazon
- amazontekst
- Amazon Web Services
- an
- analytics
- analysere
- analyser
- ,
- besvare
- svar
- API'er
- Anvendelse
- passende
- arkitektur
- ER
- AS
- Asean
- At
- automatisere
- Automatisk Ur
- automatisk
- Automatisering
- undgå
- AWS
- AWS Cloud9
- AWS CloudFormation
- tilbage
- baggrund
- baseret
- grundlæggende
- BE
- fordi
- mellem
- fødsel
- browser
- bygge
- Bygning
- bygget
- virksomheder
- men
- by
- CAN
- kort
- Kort
- tilfælde
- CD
- certifikat
- certifikater
- udfordringer
- lave om
- Ændringer
- karakter
- karaktergenkendelse
- afgifter
- kontrollere
- valg
- Vælg
- Cloud
- cloud adoption
- Cloud9
- kode
- Virksomheder
- fuldføre
- Konfiguration
- Konsol
- bekvemmelighed
- kostbar
- skabe
- oprettet
- skik
- kunde
- Kunder
- data
- Dato
- Datoer
- definerede
- afhængigheder
- indsætte
- indsat
- implementering
- ødelægge
- detaljer
- Udvikling
- forskellige
- svært
- do
- Docker
- dokumentet
- dokumenter
- downloade
- køre
- effektiv
- muliggør
- Enterprise
- Miljø
- fejl
- undersøger
- eksempel
- udforske
- omfattende
- ekstrakt
- udvinding
- Uddrag
- Feature
- Fed
- felt
- File (Felt)
- endelige
- finansiere
- efter
- Til
- formular
- format
- formularer
- Videresend
- fire
- fps
- Framework
- fra
- fuld
- fuldt ud
- funktion
- funktioner
- fremtiden
- spil
- samle
- indsamling
- GitHub
- giver
- Go
- vejledning
- vejlede
- Have
- he
- sundhedspleje
- hjælper
- hans
- hoteller
- Hvordan
- How To
- HTML
- http
- HTTPS
- menneskelig
- Hundreder
- identificere
- if
- illustrerer
- billede
- gennemføre
- implementering
- vigtigt
- in
- I andre
- omfatter
- industrier
- industrien
- oplysninger
- initial
- indgang
- indvendig
- installere
- instans
- forsikring
- integreret
- indgriben
- ind
- fakturaer
- påberåbes
- påberåber sig
- IT
- jpg
- json
- lige
- Sprog
- læring
- til venstre
- Lets
- ligesom
- synes godt om
- Lån
- lokale
- logik
- maskine
- machine learning
- manuel
- mange
- Kan..
- nævnte
- Menu
- metoder
- migration
- mindste
- ML
- model
- mere
- Pant
- flytning
- flere
- navn
- Natural
- Naviger
- Navigation
- nødvendig
- Behov
- behov
- Noter
- nummer
- OCR
- OCR-software
- of
- tilbud
- tit
- on
- igangværende
- kun
- åbent
- Muligheder
- optisk tegngenkendelse
- Option
- or
- Andet
- Andre
- vores
- ud
- output
- uden for
- side
- sider
- brød
- del
- partner
- partnere
- Bestået
- lidenskabelige
- Tilladelser
- foto
- stykke
- plato
- Platon Data Intelligence
- PlatoData
- Indlæg
- post-pandemi
- praksis
- brug
- Forbered
- i øjeblikket
- Beskyttelse af personlige oplysninger
- behandle
- forarbejdning
- give
- formål
- forespørgsler
- spørgsmål
- Spørgsmål
- tilfældig
- kvitteringer
- anerkendelse
- stole
- bemærkelsesværdig
- anmode
- påkrævet
- Krav
- Kræver
- Ressourcer
- respektere
- svar
- resultere
- afkast
- gennemgå
- Anmeldelser
- Værelse
- R
- Kør
- løber
- Sam
- samme
- gemt
- Scale
- Sektion
- sikkerhed
- se
- Vælg
- valg
- sender
- sendt
- Serverless
- tjeneste
- Tjenester
- sæt
- flere
- bør
- viste
- vist
- signifikant
- Simpelt
- Software
- løsninger
- Løsninger
- SOLVE
- nogle
- snart
- Space
- tilbringe
- Sport
- stable
- Personale
- Tilstand
- Status
- Trin
- Steps
- opbevaring
- butik
- opbevaret
- forhandler
- Strategi
- strømline
- efterfølgende
- sådan
- support
- Understøtter
- sikker
- overgår
- Tag
- tager
- Teknologier
- kedelig
- skabelon
- terminal
- prøve
- tekst
- at
- oplysninger
- deres
- derefter
- Der.
- Disse
- denne
- dem
- Gennem
- tid
- tidskrævende
- til
- traditionelle
- rejse
- rejseindustri
- rejsende
- udløse
- udløst
- prøv
- typen
- typer
- forstå
- opdatering
- uploadet
- Uploading
- URL
- brug
- Bruger
- ved brug af
- Ved hjælp af
- Vacciner
- værdi
- Verifikation
- verificere
- verificere
- via
- Specifikation
- gå
- ønsker
- Vej..
- we
- web
- webservices
- hvornår
- hvorvidt
- som
- mens
- med
- Arbejde
- workflow
- virker
- skriver
- Du
- Din
- zephyrnet