Amazonovo besedilo je storitev strojnega učenja (ML), ki omogoča samodejno ekstrakcijo besedila, rokopisa in podatkov iz skeniranih dokumentov, kar presega tradicionalno optično prepoznavanje znakov (OCR). Lahko identificira, razume in izvleče podatke iz tabel in obrazcev z izjemno natančnostjo. Trenutno se več podjetij zanaša na ročne metode ekstrakcije ali osnovno programsko opremo OCR, ki je dolgočasna in zamudna ter zahteva ročno konfiguracijo, ki jo je treba posodobiti, ko se obrazec spremeni. Amazon Texttract pomaga rešiti te izzive z uporabo ML za samodejno obdelavo različnih vrst dokumentov in natančno pridobivanje informacij z minimalnim ročnim posredovanjem. To vam omogoča avtomatizacijo obdelave dokumentov in uporabo ekstrahiranih podatkov za različne namene, kot je avtomatizacija obdelave posojil ali zbiranje informacij iz računov in potrdil.
Ko se potovanja po pandemiji nadaljujejo, bo morda v mnogih primerih potrebno preveriti potnikov status cepljenja. Hoteli in potovalne agencije morajo pogosto pregledati kartice cepljenja, da zberejo pomembne podrobnosti, na primer, ali je potnik v celoti cepljen, datume cepljenja in potnikovo ime. Nekatere agencije to počnejo z ročnim preverjanjem kartic, kar je za osebje lahko zamudno in pušča prostor za človeške napake. Drugi so izdelali rešitve po meri, vendar so te lahko drage in jih je težko prilagoditi, implementacija pa zahteva precej časa. V prihodnje bodo morda priložnosti za racionalizacijo postopka preverjanja statusa cepljenja na način, ki bo učinkovit za podjetja, hkrati pa bo spoštoval zasebnost in udobje potnikov.
Poizvedbe Amazon Texttract pomaga pri reševanju teh izzivov. Poizvedbe Amazon Texttract vam omogočajo, da iz dokumenta določite in izvlečete le tiste podatke, ki jih potrebujete. Daje vam natančne in točne podatke iz dokumenta.
V tem prispevku vas popeljemo skozi vodnik za implementacijo po korakih za izdelavo rešitve za preverjanje statusa cepljenja z uporabo Amazon Texttract Queries. Rešitev prikazuje, kako obdelati kartice cepljenja s poizvedbo Amazon Texttract, preveriti status cepljenja in shraniti podatke za prihodnjo uporabo.
Pregled rešitev
Naslednji diagram prikazuje arhitekturo rešitev.
Potek dela vključuje naslednje korake:
- Uporabnik fotografira cepilni karton.
- Slika je naložena v Preprosta storitev shranjevanja Amazon (Amazon S3) vedro.
- Ko se slika shrani v vedro S3, prikliče an Korak funkcije AWS potek dela:
- Odločevalec poizvedb AWS Lambda funkcija pregleda posredovani dokument in doda informacije o vrsti mime, številu strani in številu poizvedb v potek dela Step Functions (v našem primeru imamo štiri poizvedbe).
NumberQueriesAndPagesChoice
je stanje izbire, ki poteku dela doda pogojno logiko. Če je poizvedb med 15–31 in je število strani med 2–3,001, je asinhrona obdelava Amazon Texttract edina možnost, ker sinhroni API-ji podpirajo samo do 15 poizvedb in enostranske dokumente. Za vse druge primere se usmerimo na naključno izbiro sinhrone ali asinhrone obdelave.- O
TextractSync
Funkcija Lambda pošlje zahtevo storitvi Amazon Texttract za analizo dokumenta na podlagi naslednjih poizvedb Amazon Texttract:- Kaj je status cepljenja?
- Kaj je ime?
- Kaj je datum rojstva?
- Kaj je številka dokumenta?
- Amazon Texttract analizira sliko in pošlje odgovore teh poizvedb nazaj v funkcijo Lambda.
- Funkcija Lambda preveri status cepljenja stranke in shrani končni rezultat v formatu CSV v isto vedro S3 (
demoqueries-textractxxx
) vcsv-output
mapa.
Predpogoji
Za dokončanje te rešitve bi morali imeti račun AWS in ustrezna dovoljenja za ustvarjanje virov, ki so potrebni kot del rešitve.
Prenesite kodo za uvedbo in vzorec kartice cepljenja s GitHub.
Uporabite funkcijo Queries na konzoli Amazon Texttract
Preden zgradite rešitev za preverjanje cepljenja, raziščimo, kako lahko uporabite poizvedbe Amazon Texttract za pridobivanje statusa cepljenja prek konzole Amazon Texttract. Uporabite lahko vzorec kartice cepljenja, ki ste ga prenesli iz skladišča GitHub.
- Na konzoli Amazon Texttract izberite Analizirajte dokument v podoknu za krmarjenje.
- Pod Naloži dokument, izberite Izberite dokument da naložite kartico cepljenja z vašega lokalnega diska.
- Ko naložite dokument, izberite Poizvedbe v Konfigurirajte dokument oddelek.
- Nato lahko dodate poizvedbe v obliki vprašanj v naravnem jeziku. Dodajmo še naslednje:
- Kaj je status cepljenja?
- Kaj je ime?
- Kaj je datum rojstva?
- Kaj je številka dokumenta?
- Ko dodate vse svoje poizvedbe, izberite Uporabi konfiguracijo.
- Preverite poizvedbe za ogled odgovorov na vprašanja.
Vidite lahko, da Amazon Texttract izvleče odgovor na vašo poizvedbo iz dokumenta.
Namestite rešitev za preverjanje cepljenja
V tej objavi uporabljamo an AWS Cloud9 primerek in namestite potrebne odvisnosti od primerka z Komplet za razvoj oblaka AWS (AWS CDK) in Docker. AWS Cloud9 je v oblaku temelječe integrirano razvojno okolje (IDE), ki vam omogoča pisanje, izvajanje in odpravljanje napak v kodi samo z brskalnikom.
- V terminalu izberite Nalaganje lokalnih datotek o file meni.
- Izberite Izberite mapo In izberite
vaccination_verification_solution
mapo, ki ste jo prenesli iz GitHub. - V terminalu pripravite svojo brezstrežniško aplikacijo za nadaljnje korake v vašem delovnem toku razvoja AWS Model brez strežnika (AWS SAM) z naslednjim ukazom:
- Razmestite aplikacijo z uporabo
cdk deploy
ukaz:Počakajte, da AWS CDK uvede model in ustvari vire, omenjene v predlogi.
- Ko je uvajanje končano, lahko preverite razporejene vire na Oblikovanje oblaka AWS konzola na viri na strani s podrobnostmi o skladu.
Preizkusite raztopino
Zdaj je čas, da preizkusite rešitev. Če želite sprožiti potek dela, uporabite aws s3 cp
da naložite vac_card.jpg
datoteko DemoQueries.DocumentUploadLocation
znotraj mape z dokumenti:
Datoteka s potrdilom o cepljenju se samodejno naloži v vedro S3 demoqueries-textractxxx
v mapi za nalaganje.
Delovni tok funkcij korakov se sproži prek funkcije Lambda takoj, ko je datoteka potrdila o cepljenju naložena v vedro S3.
Funkcija Queries-Decider Lambda preuči dokument in doda informacije o vrsti mime, številu strani in številu poizvedb v potek dela Step Functions (v tem primeru uporabljamo štiri poizvedbe – številko dokumenta, ime stranke, datum rojstvo in status cepljenja).
O TextractSync
funkcija pošlje vhodne poizvedbe v Amazon Texttract in sinhrono vrne celoten rezultat kot del odgovora. Podpira 1-stranske dokumente (TIFF, PDF, JPG, PNG) in do 15 poizvedb. The GenerateCsvTask
funkcija vzame izhod JSON iz Amazon Texttract in ga pretvori v datoteko CSV.
Končni izhod je shranjen v istem vedru S3 v mapi csv-output kot datoteka CSV.
Datoteko lahko prenesete na svoj lokalni računalnik z naslednjim ukazom:
Oblika rezultata je timestamp
, classification
, filename
, page number
, key name
, key_confidence
, value
, value_confidence
, key_bb_top
, key_bb_height
, key_bb.width
, key_bb_left
, value_bb_top
, value_bb_height
, value_bb_width
, value_bb_left
.
Rešitev lahko razširite na stotine dokumentov s potrdili o cepljenju za več strank, tako da naložite njihova potrdila o cepljenju v DemoQueries.DocumentUploadLocation
. To samodejno sproži več zagonov stroja stanja Step Functions in končni rezultat je shranjen v istem vedru S3 v izhodni mapi csv.
Če želite spremeniti začetni nabor poizvedb, ki so vnesene v Amazon Texttract, lahko obiščete svojo instanco AWS Cloud9 in odprete datoteko start_execution.py. V pogledu datoteke v levem podoknu se pomaknite do lambda, start_queries
, app
, start_execution.py
. Ta funkcija Lambda se prikliče, ko je datoteka naložena v DemoQueries.DocumentUploadLocation
. Poizvedbe, poslane v potek dela, so definirane v start_execution.py
; lahko jih spremenite tako, da posodobite kodo, kot je prikazano na naslednjem posnetku zaslona.
Čiščenje
Da se izognete nenehnim zaračunavanjem, izbrišite vire, ustvarjene v tej objavi, z naslednjim ukazom:
Odgovori na vprašanje Are you sure you want to delete: DemoQueries (y/n)?
z y.
zaključek
V tej objavi smo vam pokazali, kako uporabiti Amazon Texttract Queries za izdelavo rešitve za preverjanje cepljenja za potovalno industrijo. Poizvedbe Amazon Texttract Queries lahko uporabite za ustvarjanje rešitev v drugih panogah, kot sta finance in zdravstvo, ter pridobivanje informacij iz dokumentov, kot so plačilne liste, hipotekarni zapisi in zavarovalne kartice, na podlagi vprašanj v naravnem jeziku.
Za več informacij si oglejte Analiziranje dokumentov, ali si oglejte konzolo Amazon Texttract in preizkusite to funkcijo.
O avtorjih
Dhiraj Thakur je arhitekt rešitev pri Amazon Web Services. Sodeluje s strankami in partnerji AWS, da bi zagotovil smernice o sprejemanju oblaka v podjetju, migraciji in strategiji. Navdušen je nad tehnologijo in uživa v gradnji in eksperimentiranju na področju analitike in AI/ML.
Rishabh Yadav je arhitekt partnerskih rešitev pri AWS z obsežnim znanjem o DevOps in varnostnih ponudbah pri AWS. Sodeluje s partnerji iz ASEAN, da bi zagotovil smernice za sprejetje oblaka v podjetjih in preglede arhitekture skupaj z gradnjo praks AWS z implementacijo dobro arhitekturnega ogrodja. Zunaj službe svoj čas rad preživlja na športnem področju in igranju iger FPS.
- Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
- PlatoData.Network Vertical Generative Ai. Opolnomočite se. Dostopite tukaj.
- PlatoAiStream. Web3 Intelligence. Razširjeno znanje. Dostopite tukaj.
- PlatoESG. Ogljik, CleanTech, Energija, Okolje, sončna energija, Ravnanje z odpadki. Dostopite tukaj.
- PlatoHealth. Obveščanje o biotehnologiji in kliničnih preskušanjih. Dostopite tukaj.
- vir: https://aws.amazon.com/blogs/machine-learning/build-a-vaccination-verification-solution-using-the-queries-feature-in-amazon-textract/
- : je
- $GOR
- 001
- 100
- 15%
- 1930
- 2468
- 258
- 7
- 8
- a
- O meni
- Račun
- natančnost
- natančna
- natančno
- dodajte
- Naslov
- Dodaja
- Sprejetje
- agencije
- AI / ML
- vsi
- omogoča
- skupaj
- Amazon
- Amazonovo besedilo
- Amazon Web Services
- an
- analitika
- analizirati
- analize
- in
- odgovor
- odgovori
- API-ji
- uporaba
- primerno
- Arhitektura
- SE
- AS
- Asean
- At
- avtomatizirati
- Samodejno
- samodejno
- avtomatizacija
- izogniti
- AWS
- AWS Cloud9
- Oblikovanje oblaka AWS
- nazaj
- ozadje
- temeljijo
- Osnovni
- BE
- ker
- med
- Rojstvo
- brskalnik
- izgradnjo
- Building
- zgrajena
- podjetja
- vendar
- by
- CAN
- kartice
- Kartice
- primeri
- CD
- potrdilo
- Potrdila
- izzivi
- spremenite
- Spremembe
- značaja
- prepoznavanje znakov
- Stroški
- preveriti
- izbira
- Izberite
- Cloud
- sprejem v oblak
- Cloud9
- Koda
- Podjetja
- dokončanje
- konfiguracija
- Konzole
- udobje
- drago
- ustvarjajo
- ustvaril
- po meri
- stranka
- Stranke, ki so
- datum
- Datum
- Termini
- opredeljen
- odvisnosti
- razporedi
- razporejeni
- uvajanje
- uniči
- Podrobnosti
- Razvoj
- drugačen
- težko
- do
- Lučki delavec
- dokument
- Dokumenti
- prenesi
- pogon
- učinkovite
- omogoča
- Podjetje
- okolje
- Napaka
- Pregleduje
- Primer
- raziskuje
- obsežen
- ekstrakt
- pridobivanje
- Izvlečki
- Feature
- Fed
- Polje
- file
- končna
- financiranje
- po
- za
- obrazec
- format
- Obrazci
- Naprej
- štiri
- fps
- Okvirni
- iz
- polno
- v celoti
- funkcija
- funkcije
- Prihodnost
- igre na srečo
- zbiranje
- zbiranje
- GitHub
- daje
- Go
- Navodila
- vodi
- Imajo
- he
- zdravstveno varstvo
- Pomaga
- njegov
- Hoteli
- Kako
- Kako
- HTML
- http
- HTTPS
- človeškega
- Stotine
- identificirati
- if
- ponazarja
- slika
- izvajati
- Izvajanje
- Pomembno
- in
- V drugi
- vključuje
- industrij
- Industrija
- Podatki
- začetna
- vhod
- v notranjosti
- namestitev
- primer
- zavarovanje
- integrirana
- intervencije
- v
- računi
- sklican
- prikliče
- IT
- jpg
- json
- samo
- jezik
- učenje
- levo
- Lets
- kot
- všeč mi je
- Posojila
- lokalna
- Logika
- stroj
- strojno učenje
- Navodilo
- več
- Maj ..
- omenjeno
- Meni
- Metode
- migracije
- minimalna
- ML
- Model
- več
- Hipotekarni
- premikanje
- več
- Ime
- naravna
- Krmarjenje
- ostalo
- potrebno
- Nimate
- potrebe
- Opombe
- Številka
- OCR
- Programska oprema OCR
- of
- Ponudbe
- pogosto
- on
- v teku
- samo
- odprite
- Priložnosti
- optično prepoznavanje znakov
- Možnost
- or
- Ostalo
- drugi
- naši
- ven
- izhod
- zunaj
- Stran
- strani
- podokno
- del
- partner
- partnerji
- opravil
- strastno
- Dovoljenja
- fotografija
- kos
- platon
- Platonova podatkovna inteligenca
- PlatoData
- Prispevek
- post-pandemija
- vaje
- natančna
- Pripravimo
- trenutno
- zasebnost
- Postopek
- obravnavati
- zagotavljajo
- namene
- poizvedbe
- vprašanje
- vprašanja
- naključno
- prejemki
- Priznanje
- zanašajo
- izjemno
- zahteva
- obvezna
- Zahteve
- zahteva
- viri
- spoštovanje
- Odgovor
- povzroči
- vrne
- pregleda
- Mnenja
- soba
- Pot
- Run
- deluje
- sam
- Enako
- shranjena
- Lestvica
- Oddelek
- varnost
- glej
- izberite
- izbor
- pošlje
- poslan
- Brez strežnika
- Storitev
- Storitve
- nastavite
- več
- shouldnt
- je pokazala,
- pokazale
- pomemben
- Enostavno
- Software
- Rešitev
- rešitve
- SOLVE
- nekaj
- Kmalu
- Vesolje
- preživeti
- Šport
- sveženj
- Osebje
- Država
- Status
- Korak
- Koraki
- shranjevanje
- trgovina
- shranjeni
- trgovine
- Strategija
- racionalizirati
- kasneje
- taka
- podpora
- Podpira
- Preverite
- presegajo
- Bodite
- meni
- Tehnologija
- dolgočasen
- Predloga
- terminal
- Test
- besedilo
- da
- O
- informacije
- njihove
- POTEM
- Tukaj.
- te
- ta
- tisti,
- skozi
- čas
- zamudno
- do
- tradicionalna
- potovanja
- potovalna industrija
- popotnik
- sprožijo
- sprožilo
- poskusite
- tip
- Vrste
- razumeli
- posodabljanje
- naložili
- Prenos
- URL
- uporaba
- uporabnik
- uporabo
- Uporaben
- Cepivo
- vrednost
- Preverjanje
- preverjanje
- preverjanje
- preko
- Poglej
- sprehod
- želeli
- način..
- we
- web
- spletne storitve
- kdaj
- ali
- ki
- medtem
- z
- delo
- potek dela
- deluje
- pisati
- Vi
- Vaša rutina za
- zefirnet