Text Amazon este un serviciu de învățare automată (ML) care permite extragerea automată a textului, scrisului de mână și a datelor din documentele scanate, depășind recunoașterea optică a caracterelor tradiționale (OCR). Poate identifica, înțelege și extrage date din tabele și formulare cu o acuratețe remarcabilă. În prezent, mai multe companii se bazează pe metode de extragere manuală sau pe un software OCR de bază, care este obositor și consuma mult timp și necesită o configurare manuală care necesită actualizare atunci când formularul se schimbă. Amazon Texttract ajută la rezolvarea acestor provocări prin utilizarea ML pentru a procesa automat diferite tipuri de documente și pentru a extrage informații cu acuratețe, cu o intervenție manuală minimă. Acest lucru vă permite să automatizați procesarea documentelor și să utilizați datele extrase în diferite scopuri, cum ar fi automatizarea procesării împrumuturilor sau colectarea de informații din facturi și chitanțe.
Pe măsură ce călătoriile se reiau după pandemie, în multe cazuri poate fi necesară verificarea stării de vaccinare a călătorului. Hotelurile și agențiile de turism trebuie adesea să examineze cardurile de vaccinare pentru a aduna detalii importante, cum ar fi dacă călătorul este complet vaccinat, datele vaccinului și numele călătorului. Unele agenții fac acest lucru prin verificarea manuală a cardurilor, care poate consuma mult timp pentru personal și lasă loc erorilor umane. Alții au construit soluții personalizate, dar acestea pot fi costisitoare și dificil de scalat și necesită timp semnificativ pentru implementare. În continuare, pot exista oportunități de simplificare a procesului de verificare a stării de vaccinare într-un mod eficient pentru companii, respectând în același timp confidențialitatea și confortul călătorilor.
Interogări Amazon Text ajută la abordarea acestor provocări. Amazon Texttract Queries vă permite să specificați și să extrageți doar informația de care aveți nevoie din document. Vă oferă informații precise și exacte din document.
În această postare, vă prezentăm un ghid de implementare pas cu pas pentru a crea o soluție de verificare a stării de vaccinare folosind Amazon Texttract Queries. Soluția arată cum să procesați cardurile de vaccinare folosind o interogare Amazon Text, să verificați starea vaccinării și să stocați informațiile pentru utilizare ulterioară.
Prezentare generală a soluțiilor
Următoarea diagramă ilustrează arhitectura soluției.
Fluxul de lucru include următorii pași:
- Utilizatorul face o fotografie a unui card de vaccinare.
- Imaginea este încărcată într-un Serviciul Amazon de stocare simplă Găleată (Amazon S3)
- Când imaginea este salvată în compartimentul S3, invocă un Funcții pas AWS flux de lucru:
- Interogarile-Decider AWS Lambdas funcția examinează documentul transmis și adaugă informații despre tipul mime, numărul de pagini și numărul de interogări fluxului de lucru Step Functions (de exemplu, avem patru interogări).
NumberQueriesAndPagesChoice
este o stare de alegere care adaugă logică condiționată unui flux de lucru. Dacă există între 15-31 de interogări și numărul de pagini este între 2-3,001, atunci procesarea asincronă Amazon Texttract este singura opțiune, deoarece API-urile sincrone acceptă doar până la 15 interogări și documente de o pagină. Pentru toate celelalte cazuri, vom direcționa către selecția aleatorie a procesării sincrone sau asincrone.-
TextractSync
Funcția Lambda trimite o solicitare către Amazon Texttract pentru a analiza documentul pe baza următoarelor interogări Amazon Texttract:- Care este starea de vaccinare?
- Care este numele?
- Care este data nașterii?
- Ce este numărul documentului?
- Amazon Texttract analizează imaginea și trimite răspunsurile la aceste interogări înapoi la funcția Lambda.
- Funcția Lambda verifică starea de vaccinare a clientului și stochează rezultatul final în format CSV în aceeași găleată S3 (
demoqueries-textractxxx
), Încsv-output
dosar.
Cerințe preliminare
Pentru a finaliza această soluție, ar trebui să aveți un cont AWS și permisiunile corespunzătoare pentru a crea resursele necesare ca parte a soluției.
Descărcați codul de implementare și proba de card de vaccinare de la GitHub.
Utilizați funcția Interogări de pe consola Amazon Texttract
Înainte de a crea soluția de verificare a vaccinării, haideți să explorăm cum puteți utiliza Amazon Texttract Queries pentru a extrage starea vaccinării prin consola Amazon Texttract. Puteți folosi eșantionul de card de vaccinare pe care l-ați descărcat din depozitul GitHub.
- Pe consola Amazon Texttract, alegeți Analizați documentul în panoul de navigare.
- În Încărcați documentul, alege Alegeți documentul pentru a încărca cardul de vaccinare de pe unitatea locală.
- După ce încărcați documentul, selectați Interogări în Configurați documentul secţiune.
- Apoi puteți adăuga interogări sub formă de întrebări în limbaj natural. Să adăugăm următoarele:
- Care este starea de vaccinare?
- Care este numele?
- Care este data nașterii?
- Ce este numărul documentului?
- După ce ați adăugat toate interogările, alegeți Aplicați configurația.
- Verificați interogările fila pentru a vedea răspunsurile la întrebări.
Puteți vedea că Amazon Texttract extrage răspunsul la întrebarea dvs. din document.
Implementați soluția de verificare a vaccinării
În această postare, folosim un AWS Cloud9 instanță și instalați dependențele necesare pe instanță cu Kit AWS Cloud Development (AWS CDK) și Docker. AWS Cloud9 este un mediu de dezvoltare integrat (IDE) bazat pe cloud, care vă permite să scrieți, să rulați și să vă depanați codul doar cu un browser.
- În terminal, alegeți Încărcați fișiere locale pe Fișier meniu.
- Alege Selectați folderul și alegeți
vaccination_verification_solution
folderul pe care l-ați descărcat de pe GitHub. - În terminal, pregătiți aplicația dvs. fără server pentru pașii următori din fluxul de lucru de dezvoltare în Model de aplicație fără server AWS (AWS SAM) utilizând următoarea comandă:
- Implementați aplicația folosind
cdk deploy
comanda:Așteptați ca AWS CDK să implementeze modelul și să creeze resursele menționate în șablon.
- Când implementarea este completă, puteți verifica resursele implementate pe Formarea AWS Cloud consola pe Resurse fila din pagina cu detaliile stivei.
Testați soluția
Acum este timpul să testăm soluția. Pentru a declanșa fluxul de lucru, utilizați aws s3 cp
pentru a încărca fișierul vac_card.jpg
fișier de DemoQueries.DocumentUploadLocation
în dosarul documente:
Fișierul certificatului de vaccinare este încărcat automat în găleata S3 demoqueries-textractxxx
în folderul de încărcări.
Fluxul de lucru Step Functions este declanșat printr-o funcție Lambda de îndată ce fișierul certificatului de vaccinare este încărcat în găleata S3.
Funcția Queries-Decider Lambda examinează documentul și adaugă informații despre tipul mime, numărul de pagini și numărul de interogări fluxului de lucru Step Functions (pentru acest exemplu, folosim patru interogări — numărul documentului, numele clientului, data naștere și starea de vaccinare).
TextractSync
funcția trimite interogările de intrare către Amazon Texttract și returnează sincron rezultatul complet ca parte a răspunsului. Suportă documente de 1 pagină (TIFF, PDF, JPG, PNG) și până la 15 interogări. The GenerateCsvTask
funcția preia rezultatul JSON din Amazon Texttract și o convertește într-un fișier CSV.
Ieșirea finală este stocată în același bucket S3 în folderul csv-output ca un fișier CSV.
Puteți descărca fișierul pe computerul local folosind următoarea comandă:
Formatul rezultatului este timestamp
, classification
, filename
, page number
, key name
, key_confidence
, value
, value_confidence
, key_bb_top
, key_bb_height
, key_bb.width
, key_bb_left
, value_bb_top
, value_bb_height
, value_bb_width
, value_bb_left
.
Puteți scala soluția la sute de documente de certificat de vaccinare pentru mai mulți clienți, încărcându-le certificatele de vaccinare pe DemoQueries.DocumentUploadLocation
. Acest lucru declanșează automat mai multe rulări ale mașinii de stare Step Functions, iar rezultatul final este stocat în același bucket S3 în folderul csv-output.
Pentru a modifica setul inițial de interogări care sunt introduse în Amazon Texttract, puteți accesa instanța AWS Cloud9 și deschideți fișierul start_execution.py. În vizualizarea fișierului din panoul din stânga, navigați la lambda, start_queries
, app
, start_execution.py
. Această funcție Lambda este invocată atunci când un fișier este încărcat în DemoQueries.DocumentUploadLocation
. Interogările trimise fluxului de lucru sunt definite în start_execution.py
; le puteți modifica prin actualizarea codului, așa cum se arată în următoarea captură de ecran.
A curăța
Pentru a evita costurile curente, ștergeți resursele create în această postare folosind următoarea comandă:
Răspunde la întrebare Are you sure you want to delete: DemoQueries (y/n)?
cu y.
Concluzie
În această postare, v-am arătat cum să utilizați Amazon Texttract Queries pentru a construi o soluție de verificare a vaccinării pentru industria călătoriilor. Puteți utiliza Amazon Texttract Queries pentru a construi soluții în alte industrii, cum ar fi finanțele și asistența medicală, și pentru a prelua informații din documente precum talonele de plată, note de credit ipotecar și carduri de asigurare pe baza întrebărilor în limbaj natural.
Pentru mai multe informații, consultați Analizarea documentelor, sau verificați consola Amazon Texttract și încercați această funcție.
Despre Autori
Dhiraj Thakur este arhitect de soluții cu Amazon Web Services. El lucrează cu clienții și partenerii AWS pentru a oferi îndrumări cu privire la adoptarea cloud, migrarea și strategia întreprinderii. Este pasionat de tehnologie și îi place să construiască și să experimenteze în spațiul de analiză și AI/ML.
Rishabh Yadav este arhitect Partner Solutions la AWS cu o experiență extinsă în ofertele DevOps și securitate la AWS. El lucrează cu partenerii ASEAN pentru a oferi îndrumări privind adoptarea cloud-ului pentru întreprinderi și revizuirile arhitecturii, împreună cu construirea de practici AWS prin implementarea cadrului bine arhitecturat. În afara serviciului, îi place să-și petreacă timpul pe terenul de sport și în jocurile FPS.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://aws.amazon.com/blogs/machine-learning/build-a-vaccination-verification-solution-using-the-queries-feature-in-amazon-textract/
- :este
- $UP
- 001
- 100
- 15%
- 1930
- 2468
- 258
- 7
- 8
- a
- Despre Noi
- Cont
- precizie
- precis
- precis
- adăuga
- adresa
- Adaugă
- Adoptare
- Agențiile
- AI / ML
- TOATE
- permite
- de-a lungul
- Amazon
- Text Amazon
- Amazon Web Services
- an
- Google Analytics
- analiza
- analize
- și
- răspunde
- răspunsuri
- API-uri
- aplicație
- adecvat
- arhitectură
- SUNT
- AS
- Asean
- At
- automatizarea
- Automat
- în mod automat
- automatizarea
- evita
- AWS
- AWS Cloud9
- Formarea AWS Cloud
- înapoi
- fundal
- bazat
- de bază
- BE
- deoarece
- între
- naştere
- browser-ul
- construi
- Clădire
- construit
- întreprinderi
- dar
- by
- CAN
- card
- Carduri
- cazuri
- CD
- certificat
- Certificatele
- provocări
- Schimbare
- Modificări
- caracter
- recunoașterea personajelor
- taxe
- verifica
- alegere
- Alege
- Cloud
- adoptarea norului
- Cloud9
- cod
- Companii
- Completă
- Configuraţie
- Consoleze
- comoditate
- costisitor
- crea
- a creat
- personalizat
- client
- clienţii care
- de date
- Data
- Date
- definit
- dependențe
- implementa
- dislocate
- desfășurarea
- distruge
- detalii
- Dezvoltare
- diferit
- dificil
- do
- Docher
- document
- documente
- Descarca
- conduce
- eficient
- permite
- Afacere
- Mediu inconjurator
- eroare
- Analizează
- exemplu
- explora
- extensiv
- extrage
- extracţie
- extracte
- Caracteristică
- fed-
- camp
- Fișier
- final
- finanţa
- următor
- Pentru
- formă
- format
- formulare
- Înainte
- patru
- FPS
- Cadru
- din
- Complet
- complet
- funcţie
- funcții
- viitor
- jocuri
- aduna
- culegere
- GitHub
- oferă
- Go
- îndrumare
- ghida
- Avea
- he
- de asistență medicală
- ajută
- lui
- Hoteluri
- Cum
- Cum Pentru a
- HTML
- http
- HTTPS
- uman
- sute
- identifica
- if
- ilustrează
- imagine
- punerea în aplicare a
- implementarea
- important
- in
- În altele
- include
- industrii
- industrie
- informații
- inițială
- intrare
- în interiorul
- instala
- instanță
- asigurare
- integrate
- intervenţie
- în
- facturi
- invocat
- invocă
- IT
- jpg
- JSON
- doar
- limbă
- învăţare
- stânga
- Permite
- ca
- îi place
- Credite
- local
- logică
- maşină
- masina de învățare
- manual
- multe
- Mai..
- menționat
- Meniu
- Metode
- migrațiune
- minim
- ML
- model
- mai mult
- Ipotecare
- în mişcare
- multiplu
- nume
- Natural
- Navigaţi
- Navigare
- necesar
- Nevoie
- nevoilor
- notițe
- număr
- OCR
- Software OCR
- of
- ofertele
- de multe ori
- on
- în curs de desfășurare
- afară
- deschide
- Oportunităţi
- recunoaștere optică a caracterelor
- Opțiune
- or
- Altele
- Altele
- al nostru
- afară
- producție
- exterior
- pagină
- pagini
- pâine
- parte
- partener
- parteneri
- Trecut
- pasionat
- permisiuni
- bucată
- Plato
- Informații despre date Platon
- PlatoData
- Post
- post-pandemie
- practicile
- precis
- Pregăti
- în prezent
- intimitate
- proces
- prelucrare
- furniza
- scopuri
- interogări
- întrebare
- Întrebări
- aleator
- încasări
- recunoaştere
- se bazează
- remarcabil
- solicita
- necesar
- Cerinţe
- Necesită
- Resurse
- respectare
- răspuns
- rezultat
- Returnează
- revizuiască
- Recenzii
- Cameră
- Traseul
- Alerga
- ruleaza
- Sam
- acelaşi
- salvate
- Scară
- Secțiune
- securitate
- vedea
- selecta
- selecţie
- trimite
- trimis
- serverless
- serviciu
- Servicii
- set
- câteva
- să
- a arătat
- indicat
- semnificativ
- simplu
- Software
- soluţie
- soluţii
- REZOLVAREA
- unele
- curând
- Spaţiu
- petrece
- Sportul
- stivui
- Personal
- Stat
- Stare
- Pas
- paşi
- depozitare
- stoca
- stocate
- magazine
- Strategie
- simplifica
- ulterior
- astfel de
- a sustine
- Sprijină
- sigur
- depășind
- Lua
- ia
- Tehnologia
- plictisitor
- șablon
- Terminal
- test
- a) Sport and Nutrition Awareness Day in Manasia Around XNUMX people from the rural commune Manasia have participated in a sports and healthy nutrition oriented activity in one of the community’s sports ready yards. This activity was meant to gather, mainly, middle-aged people from a Romanian rural community and teach them about the benefits that sports have on both their mental and physical health and on how sporting activities can be used to bring people from a community closer together. Three trainers were made available for this event, so that the participants would get the best possible experience physically and so that they could have the best access possible to correct information and good sports/nutrition practices. b) Sports Awareness Day in Poiana Țapului A group of young participants have taken part in sporting activities meant to teach them about sporting conduct, fairplay, and safe physical activities. The day culminated with a football match.
- acea
- informațiile
- lor
- apoi
- Acolo.
- Acestea
- acest
- aceste
- Prin
- timp
- consumă timp
- la
- tradiţional
- călătorie
- industria călătoriilor
- călător
- declanşa
- a declanșat
- încerca
- tip
- Tipuri
- înţelege
- actualizarea
- încărcat
- Se încarcă
- URL-ul
- utilizare
- Utilizator
- folosind
- Utilizand
- Vaccin
- valoare
- Verificare
- verifica
- verificarea
- de
- Vizualizare
- umbla
- vrea
- Cale..
- we
- web
- servicii web
- cand
- dacă
- care
- în timp ce
- cu
- Apartamente
- flux de lucru
- fabrică
- scrie
- Tu
- Ta
- zephyrnet