Amazon T-extract is een machine learning (ML)-service die automatische extractie van tekst, handschrift en gegevens uit gescande documenten mogelijk maakt, en daarmee de traditionele optische tekenherkenning (OCR) overtreft. Het kan met opmerkelijke nauwkeurigheid gegevens uit tabellen en formulieren identificeren, begrijpen en extraheren. Momenteel vertrouwen verschillende bedrijven op handmatige extractiemethoden of eenvoudige OCR-software, wat vervelend en tijdrovend is en handmatige configuratie vereist die moet worden bijgewerkt wanneer het formulier verandert. Amazon Textract helpt deze uitdagingen op te lossen door ML te gebruiken om automatisch verschillende documenttypen te verwerken en informatie nauwkeurig te extraheren met minimale handmatige tussenkomst. Hierdoor kunt u de documentverwerking automatiseren en de opgehaalde gegevens voor verschillende doeleinden gebruiken, zoals het automatiseren van de verwerking van leningen of het verzamelen van informatie uit facturen en bonnen.
Nu het reizen na de pandemie weer wordt hervat, kan het in veel gevallen nodig zijn om de vaccinatiestatus van een reiziger te verifiรซren. Hotels en reisbureaus moeten vaak vaccinatiekaarten bekijken om belangrijke details te verzamelen, zoals of de reiziger volledig is gevaccineerd, vaccinatiedata en de naam van de reiziger. Sommige instanties doen dit door handmatige verificatie van kaarten, wat tijdrovend kan zijn voor het personeel en ruimte laat voor menselijke fouten. Anderen hebben oplossingen op maat gebouwd, maar deze kunnen duur en moeilijk op te schalen zijn en veel tijd vergen om te implementeren. In de toekomst kunnen er mogelijkheden zijn om het verificatieproces van de vaccinatiestatus te stroomlijnen op een manier die efficiรซnt is voor bedrijven en tegelijkertijd de privacy en het gemak van reizigers respecteert.
Amazon Textract-query's helpt deze uitdagingen aan te pakken. Met Amazon Textract Queries kunt u alleen het stukje informatie dat u nodig heeft uit het document specificeren en extraheren. Het geeft u nauwkeurige en nauwkeurige informatie uit het document.
In dit bericht leiden we u stapsgewijze door een implementatiegids om een โโoplossing voor de verificatie van de vaccinatiestatus te bouwen met behulp van Amazon Textract Queries. De oplossing laat zien hoe vaccinatiekaarten kunnen worden verwerkt met behulp van een Amazon Textract-query, hoe de vaccinatiestatus kan worden geverifieerd en hoe de informatie kan worden opgeslagen voor toekomstig gebruik.
Overzicht oplossingen
Het volgende diagram illustreert de oplossingsarchitectuur.
De workflow omvat de volgende stappen:
- De gebruiker maakt een foto van een vaccinatiekaart.
- De afbeelding wordt geรผpload naar een Amazon eenvoudige opslagservice (Amazon S3) emmer.
- Wanneer de afbeelding wordt opgeslagen in de S3-bucket, wordt een AWS Stap Functies werkstroom:
- De vragenbeslisser AWS Lambda functie onderzoekt het doorgegeven document en voegt informatie over het mime-type, het aantal pagina's en het aantal queries toe aan de Step Functions-workflow (in ons voorbeeld hebben we vier queries).
NumberQueriesAndPagesChoice
is een keuzestatus die voorwaardelijke logica aan een werkstroom toevoegt. Als er tussen de 15 en 31 zoekopdrachten zijn en het aantal pagina's tussen de 2 en 3,001 ligt, is de asynchrone verwerking van Amazon Textract de enige optie, omdat synchrone API's slechts maximaal 15 zoekopdrachten en documenten van รฉรฉn pagina ondersteunen. Voor alle andere gevallen gaan we over op de willekeurige selectie van synchrone of asynchrone verwerking.- De
TextractSync
De Lambda-functie stuurt een verzoek naar Amazon Textract om het document te analyseren op basis van de volgende Amazon Textract-query's:- Wat is de vaccinatiestatus?
- Wat is de naam?
- Wat is geboortedatum?
- Wat is documentnummer?
- Amazon Textract analyseert de afbeelding en stuurt de antwoorden op deze vragen terug naar de Lambda-functie.
- De Lambda-functie verifieert de vaccinatiestatus van de klant en slaat het eindresultaat in CSV-formaat op in dezelfde S3-bucket (
demoqueries-textractxxx
) in decsv-output
map.
Voorwaarden
Om deze oplossing te voltooien, moet u een AWS-account en de juiste machtigingen hebben om de benodigde bronnen als onderdeel van de oplossing te creรซren.
Download de implementatiecode en de voorbeeldvaccinatiekaart van GitHub.
Gebruik de functie Query's op de Amazon Textract-console
Laten we, voordat u de oplossing voor vaccinatieverificatie bouwt, onderzoeken hoe u Amazon Textract Queries kunt gebruiken om de vaccinatiestatus te extraheren via de Amazon Textract-console. U kunt het voorbeeld van de vaccinatiekaart gebruiken dat u hebt gedownload van de GitHub-repository.
- Kies op de Amazon Textract-console Analyseer document in het navigatievenster.
- Onder Document uploaden, kiezen Kies document om de vaccinatiekaart te uploaden vanaf uw lokale schijf.
- Nadat u het document hebt geรผpload, selecteert u Queries in de Document configureren pagina.
- Vervolgens kunt u zoekopdrachten toevoegen in de vorm van vragen in natuurlijke taal. Laten we het volgende toevoegen:
- Wat is de vaccinatiestatus?
- Wat is de naam?
- Wat is geboortedatum?
- Wat is documentnummer?
- Nadat u al uw zoekopdrachten heeft toegevoegd, kiest u Pas configuratie toe.
- Controleer de zoekopdrachten tabblad om de antwoorden op de vragen te bekijken.
U kunt zien dat Amazon Textract het antwoord op uw vraag uit het document haalt.
Implementeer de oplossing voor vaccinatieverificatie
In dit bericht gebruiken we een AWS-Cloud9 instance en installeer de benodigde afhankelijkheden op de instance met de AWS Cloud-ontwikkelingskit (AWS CDK) en Docker. AWS Cloud9 is een cloudgebaseerde geรฏntegreerde ontwikkelomgeving (IDE) waarmee u uw code kunt schrijven, uitvoeren en debuggen met slechts een browser.
- Kies in de terminal Lokale bestanden uploaden op de Dien in menu.
- Kies map selecteren En kies de
vaccination_verification_solution
map die u hebt gedownload van GitHub. - In de terminal bereidt u uw serverloze applicatie voor op de volgende stappen in uw ontwikkelingsworkflow AWS serverloos toepassingsmodel (AWS SAM) met behulp van de volgende opdracht:
- Implementeer de applicatie met behulp van de
cdk deploy
opdracht:Wacht tot de AWS CDK het model heeft geรฏmplementeerd en de bronnen heeft gemaakt die in de sjabloon worden vermeld.
- Wanneer de implementatie is voltooid, kunt u de geรฏmplementeerde bronnen controleren op het AWS CloudFormatie console op de Resources tabblad van de pagina met stapeldetails.
Test de oplossing
Nu is het tijd om de oplossing te testen. Gebruik om de workflow te activeren aws s3 cp
om de te uploaden vac_card.jpg
bestand naar DemoQueries.DocumentUploadLocation
in de map docs:
Het vaccinatiecertificaatbestand wordt automatisch geรผpload naar de S3-bucket demoqueries-textractxxx
in de uploadmap.
De Step Functions-workflow wordt geactiveerd via een Lambda-functie zodra het vaccinatiecertificaatbestand naar de S3-bucket wordt geรผpload.
De functie Queries-Decider Lambda onderzoekt het document en voegt informatie over het mime-type, het aantal pagina's en het aantal query's toe aan de Step Functions-workflow (voor dit voorbeeld gebruiken we vier query's: documentnummer, klantnaam, datum van geboorte en vaccinatiestatus).
De TextractSync
functie stuurt de invoerquery's naar Amazon Textract en retourneert synchroon het volledige resultaat als onderdeel van het antwoord. Het ondersteunt documenten van 1 pagina (TIFF, PDF, JPG, PNG) en maximaal 15 zoekopdrachten. De GenerateCsvTask
functie neemt de JSON-uitvoer van Amazon Textract en converteert deze naar een CSV-bestand.
De uiteindelijke uitvoer wordt als CSV-bestand opgeslagen in dezelfde S3-bucket in de map csv-output.
U kunt het bestand downloaden naar uw lokale computer met behulp van de volgende opdracht:
Het formaat van het resultaat is timestamp
, classification
, filename
, page number
, key name
, key_confidence
, value
, value_confidence
, key_bb_top
, key_bb_height
, key_bb.width
, key_bb_left
, value_bb_top
, value_bb_height
, value_bb_width
, value_bb_left
.
U kunt de oplossing opschalen naar honderden vaccinatiecertificaatdocumenten voor meerdere klanten door hun vaccinatiecertificaten te uploaden naar DemoQueries.DocumentUploadLocation
. Dit activeert automatisch meerdere uitvoeringen van de Step Functions-statusmachine en het eindresultaat wordt opgeslagen in dezelfde S3-bucket in de map csv-output.
Om de initiรซle reeks vragen die in Amazon Textract worden ingevoerd te wijzigen, kunt u naar uw AWS Cloud9-instantie gaan en het start_execution.py-bestand openen. Navigeer in de bestandsweergave in het linkerdeelvenster naar lambda, start_queries
, app
, start_execution.py
. Deze Lambda-functie wordt aangeroepen wanneer een bestand wordt geรผpload naar DemoQueries.DocumentUploadLocation
. De query's die naar de workflow worden verzonden, worden gedefinieerd in start_execution.py
; u kunt deze wijzigen door de code bij te werken, zoals weergegeven in de volgende schermafbeelding.
Opruimen
Om te voorkomen dat er doorlopende kosten in rekening worden gebracht, verwijdert u de bronnen die in dit bericht zijn gemaakt met behulp van de volgende opdracht:
Beantwoord de vraag Are you sure you want to delete: DemoQueries (y/n)?
met y.
Conclusie
In dit bericht hebben we u laten zien hoe u Amazon Textract Queries kunt gebruiken om een โโoplossing voor vaccinatieverificatie voor de reisindustrie te bouwen. Je kunt Amazon Textract Queries gebruiken om oplossingen te bouwen in andere sectoren, zoals de financiรซle sector en de gezondheidszorg, en om informatie op te halen uit documenten zoals loonstrookjes, hypotheeknota's en verzekeringskaarten op basis van vragen in natuurlijke taal.
Voor meer informatie, zie Documenten analyseren, of bekijk de Amazon Textract-console en probeer deze functie uit.
Over de auteurs
Dhiraj Thakuro is een Solutions Architect bij Amazon Web Services. Hij werkt samen met AWS-klanten en -partners om advies te geven over de acceptatie, migratie en strategie van enterprise-cloud. Hij is gepassioneerd door technologie en geniet van het bouwen en experimenteren op het gebied van analyse en AI / ML.
Rishabh Yadav is een Partner Solutions-architect bij AWS met een uitgebreide achtergrond in DevOps en beveiligingsaanbiedingen bij AWS. Hij werkt samen met ASEAN-partners om begeleiding te bieden bij de adoptie van enterprise-clouds en architectuurbeoordelingen, en om AWS-praktijken op te bouwen door de implementatie van het Well-Architected Framework. Buiten zijn werk houdt hij zich graag bezig met het sportveld en FPS-gaming.
- Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
- PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
- PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
- PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
- Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
- Bron: https://aws.amazon.com/blogs/machine-learning/build-a-vaccination-verification-solution-using-the-queries-feature-in-amazon-textract/
- :is
- $UP
- 001
- 100
- 15%
- 1930
- 2468
- 258
- 7
- 8
- a
- Over
- Account
- nauwkeurigheid
- accuraat
- nauwkeurig
- toevoegen
- adres
- Voegt
- Adoptie
- agentschappen
- AI / ML
- Alles
- toestaat
- langs
- Amazone
- Amazon T-extract
- Amazon Web Services
- an
- analytics
- analyseren
- analyseert
- en
- beantwoorden
- antwoorden
- APIs
- Aanvraag
- passend
- architectuur
- ZIJN
- AS
- Asean
- At
- automatiseren
- Automatisch
- webmaster.
- automatiseren
- vermijd
- AWS
- AWS-Cloud9
- AWS CloudFormatie
- terug
- achtergrond
- gebaseerde
- basis-
- BE
- omdat
- tussen
- geboorte
- browser
- bouw
- Gebouw
- bebouwd
- ondernemingen
- maar
- by
- CAN
- kaart
- Kaarten
- gevallen
- CD
- certificaat
- certificaten
- uitdagingen
- verandering
- Wijzigingen
- karakter
- tekenherkenning
- lasten
- controle
- keuze
- Kies
- Cloud
- cloud adoptie
- Cloud9
- code
- Bedrijven
- compleet
- Configuratie
- troosten
- gemak
- kostbaar
- en je merk te creรซren
- aangemaakt
- gewoonte
- klant
- Klanten
- gegevens
- Datum
- Data
- gedefinieerd
- afhankelijkheden
- implementeren
- ingezet
- inzet
- vernietigen
- gegevens
- Ontwikkeling
- anders
- moeilijk
- do
- havenarbeider
- document
- documenten
- Download
- rit
- doeltreffend
- maakt
- Enterprise
- Milieu
- fout
- Onderzoekt
- voorbeeld
- Verken
- uitgebreid
- extract
- extractie
- extracten
- Kenmerk
- Fed
- veld-
- Dien in
- finale
- financiรซn
- volgend
- Voor
- formulier
- formaat
- formulieren
- Naar voren
- vier
- fps
- Achtergrond
- oppompen van
- vol
- geheel
- functie
- functies
- toekomst
- gaming
- verzamelen
- verzameling
- GitHub
- geeft
- Go
- leiding
- gids
- Hebben
- he
- gezondheidszorg
- helpt
- zijn
- hotels
- Hoe
- How To
- HTML
- http
- HTTPS
- menselijk
- Honderden
- identificeren
- if
- illustreert
- beeld
- uitvoeren
- uitvoering
- belangrijk
- in
- Anders
- omvat
- industrieรซn
- -industrie
- informatie
- eerste
- invoer
- binnen
- installeren
- instantie
- verzekering
- geรฏntegreerde
- tussenkomst
- in
- facturen
- ingeroepen
- oproept
- IT
- jpg
- json
- voor slechts
- taal
- leren
- links
- Laten we
- als
- sympathieรซn
- Leningen
- lokaal
- logica
- machine
- machine learning
- handboek
- veel
- Mei..
- vermeld
- Menu
- methoden
- migratie
- minimaal
- ML
- model
- meer
- Hypotheek
- bewegend
- meervoudig
- naam
- Naturel
- OP DEZE WEBSITE VIND JE
- Navigatie
- noodzakelijk
- Noodzaak
- behoeften
- Opmerkingen
- aantal
- OCR
- OCR-software
- of
- aanbod
- vaak
- on
- lopend
- Slechts
- open
- Kansen
- optische tekenherkenning
- Keuze
- or
- Overige
- Overig
- onze
- uit
- uitgang
- buiten
- pagina
- paginas
- brood
- deel
- partner
- partners
- voorbij
- hartstochtelijk
- permissies
- foto
- stuk
- Plato
- Plato gegevensintelligentie
- PlatoData
- Post
- post-pandemie
- praktijken
- nauwkeurig
- Voorbereiden
- dadelijk
- privacy
- verwerking
- zorgen voor
- doeleinden
- queries
- vraag
- Contact
- willekeurige
- ontvangsten
- erkenning
- vertrouwen
- opmerkelijk
- te vragen
- nodig
- Voorwaarden
- vereist
- Resources
- met inachtneming van
- antwoord
- resultaat
- Retourneren
- beoordelen
- Recensies
- Kamer
- weg
- lopen
- loopt
- Sam
- dezelfde
- gered
- Scale
- sectie
- veiligheid
- zien
- kiezen
- selectie
- verzendt
- verzonden
- Serverless
- service
- Diensten
- reeks
- verscheidene
- moet
- vertoonde
- getoond
- aanzienlijke
- Eenvoudig
- Software
- oplossing
- Oplossingen
- OPLOSSEN
- sommige
- binnenkort
- Tussenruimte
- besteden
- Sport
- stack
- Medewerkers
- Land
- Status
- Stap voor
- Stappen
- mediaopslag
- shop
- opgeslagen
- winkels
- Strategie
- gestroomlijnd
- volgend
- dergelijk
- ondersteuning
- steunen
- zeker
- overtreffen
- Nemen
- neemt
- Technologie
- vervelend
- sjabloon
- terminal
- proef
- tekst
- dat
- De
- de informatie
- hun
- harte
- Er.
- Deze
- dit
- die
- Door
- niet de tijd of
- tijdrovend
- naar
- traditioneel
- reizen
- reisindustrie
- reiziger
- leiden
- veroorzaakt
- proberen
- type dan:
- types
- begrijpen
- bijwerken
- geรผpload
- Uploaden
- URL
- .
- Gebruiker
- gebruik
- Gebruik makend
- Vaccin
- waarde
- Verificatie
- controleren
- het verifiรซren
- via
- Bekijk
- lopen
- willen
- Manier..
- we
- web
- webservices
- wanneer
- of
- welke
- en
- Met
- Mijn werk
- workflow
- Bedrijven
- schrijven
- You
- Your
- zephyrnet