Amazoni tekst on masinõppeteenus (ML), mis võimaldab skannitud dokumentidest teksti, käsitsikirja ja andmete automaatset ekstraheerimist, ületades traditsioonilise optilise märgituvastuse (OCR). See suudab tuvastada, mõista ja eraldada tabelitest ja vormidest andmeid märkimisväärse täpsusega. Praegu kasutavad mitmed ettevõtted käsitsi ekstraheerimismeetodeid või põhilist OCR-tarkvara, mis on tüütu ja aeganõudev ning nõuab käsitsi konfigureerimist, mis vajab vormi muutumisel värskendamist. Amazon Textract aitab neid probleeme lahendada, kasutades ML-i erinevate dokumenditüüpide automaatseks töötlemiseks ja teabe täpseks eraldamiseks minimaalse käsitsi sekkumisega. See võimaldab automatiseerida dokumentide töötlemist ja kasutada väljavõetud andmeid erinevatel eesmärkidel, näiteks laenude töötlemise automatiseerimiseks või arvetelt ja kviitungitelt teabe kogumiseks.
Kuna reisimine jätkub pärast pandeemiat, võib paljudel juhtudel olla vajalik reisija vaktsineerimise staatuse kontrollimine. Hotellid ja reisibürood peavad sageli vaktsineerimiskaardid üle vaatama, et koguda olulisi üksikasju, näiteks kas reisija on täielikult vaktsineeritud, vaktsiinikuupäevad ja reisija nimi. Mõned asutused teevad seda kaartide käsitsi kontrollimise teel, mis võib olla töötajate jaoks aeganõudev ja jätab ruumi inimlikele eksimustele. Teised on loonud kohandatud lahendusi, kuid need võivad olla kulukad ja raskesti skaleeritavad ning nende rakendamine võtab palju aega. Edaspidi võib tekkida võimalusi vaktsineerimise oleku kontrollimise protsessi sujuvamaks muutmiseks viisil, mis on ettevõtete jaoks tõhus, austades samas reisijate privaatsust ja mugavust.
Amazoni tekstipäringud aitab nende väljakutsetega toime tulla. Amazon Textract Queries võimaldab teil määrata ja eraldada dokumendist ainult vajaliku teabe. See annab teile dokumendist täpset ja täpset teavet.
Selles postituses tutvustame teile samm-sammult rakendusjuhendit, et luua Amazon Textract Queriesi abil vaktsineerimise oleku kontrollimise lahendus. Lahenduses näidatakse, kuidas töödelda Amazon Textracti päringu abil vaktsineerimiskaarte, kontrollida vaktsineerimise olekut ja salvestada teavet edaspidiseks kasutamiseks.
Lahenduse ülevaade
Järgnev diagramm illustreerib lahenduse arhitektuuri.
Töövoog sisaldab järgmisi samme:
- Kasutaja teeb vaktsineerimiskaardist foto.
- Pilt laaditakse üles an Amazoni lihtne salvestusteenus (Amazon S3) kopp.
- Kui pilt salvestatakse S3 ämbrisse, kutsub see esile AWS-i astmefunktsioonid töövoog:
- Päringute otsustaja AWS Lambda funktsioon uurib edastatud dokumenti ja lisab Step Functions töövoogu teabe MIME tüübi, lehtede arvu ja päringute arvu kohta (meie näitel on meil neli päringut).
NumberQueriesAndPagesChoice
on valiku olek, mis lisab töövoogu tingimusliku loogika. Kui päringuid on 15–31 ja lehtede arv jääb vahemikku 2–3,001, siis on Amazon Textracti asünkroonne töötlemine ainus võimalus, sest sünkroonsed API-d toetavad vaid kuni 15 päringut ja üheleheküljelisi dokumente. Kõigil muudel juhtudel valime sünkroonse või asünkroonse töötlemise juhusliku valiku.- .
TextractSync
Lambda funktsioon saadab Amazon Textractile taotluse dokumenti analüüsida järgmiste Amazon Textracti päringute põhjal:- Mis on vaktsineerimise staatus?
- Mis on nimi?
- Mis on sünnikuupäev?
- Mis on dokumendi number?
- Amazon Textract analüüsib pilti ja saadab nende päringute vastused tagasi Lambda funktsiooni.
- Lambda funktsioon kontrollib kliendi vaktsineerimise staatust ja salvestab lõpptulemuse CSV-vormingus samasse S3 ämbrisse (
demoqueries-textractxxx
) aastalcsv-output
kausta.
Eeldused
Selle lahenduse lõpuleviimiseks peab teil olema AWS-i konto ja sobivad õigused, et luua lahenduse osana vajalikke ressursse.
Laadige alla juurutuskood ja vaktsineerimiskaardi näidis aadressilt GitHub.
Kasutage Amazon Textracti konsooli funktsiooni Päringud
Enne vaktsineerimise kinnituslahenduse loomist uurime, kuidas saate Amazon Textract'i konsooli kaudu vaktsineerimisoleku väljavõtmiseks kasutada Amazon Textract Queries'i. Võite kasutada vaktsineerimiskaardi näidist, mille laadisite alla GitHubi repost.
- Amazon Textracti konsoolil valige Analüüsige dokumenti navigeerimispaanil.
- alla Laadige dokument üles, vali Valige dokument vaktsineerimiskaardi üleslaadimiseks kohalikult draivilt.
- Pärast dokumendi üleslaadimist valige Päringud aasta Konfigureerige dokument sektsiooni.
- Seejärel saate lisada päringuid loomuliku keele küsimuste vormis. Lisame järgmise:
- Mis on vaktsineerimise staatus?
- Mis on nimi?
- Mis on sünnikuupäev?
- Mis on dokumendi number?
- Pärast kõigi päringute lisamist valige Rakenda konfiguratsioon.
- Kontrollige päringuid vahekaarti, et näha vastuseid küsimustele.
Näete, kuidas Amazon Textract võtab teie päringule vastuse dokumendist välja.
Rakendage vaktsineerimise kontrollimise lahendus
Selles postituses kasutame an AWSi pilv eksemplar ja installige eksemplarile vajalikud sõltuvused rakendusega AWS pilvearenduskomplekt (AWS CDK) ja Docker. AWS Cloud9 on pilvepõhine integreeritud arenduskeskkond (IDE), mis võimaldab teil koodi kirjutada, käitada ja siluda vaid brauseriga.
- Terminalis valige Laadige üles kohalikud failid kohta fail menüü.
- Vali Vali kataloog ja vali
vaccination_verification_solution
kausta, mille GitHubist alla laadisite. - Terminalis valmistage oma serverita rakendus ette arendustöövoo järgmisteks sammudeks AWS-i serverita rakendusmudel (AWS SAM), kasutades järgmist käsku:
- Juurutage rakendus kasutades
cdk deploy
käsk:Oodake, kuni AWS CDK juurutab mudeli ja loob mallis mainitud ressursid.
- Kui juurutamine on lõppenud, saate juurutatud ressursse kontrollida AWS CloudFormation konsool peal Vahendid virna üksikasjade lehe vahekaarti.
Testige lahendust
Nüüd on aeg lahendust katsetada. Töövoo käivitamiseks kasutage aws s3 cp
üles laadida vac_card.jpg
toimikule DemoQueries.DocumentUploadLocation
dokumentide kaustas:
Vaktsineerimissertifikaadi fail laaditakse automaatselt üles S3 ämbrisse demoqueries-textractxxx
üleslaadimiste kaustas.
Step Functions töövoog käivitatakse lambda funktsiooni kaudu kohe, kui vaktsineerimissertifikaadi fail laaditakse üles S3 ämbrisse.
Funktsioon Queries-Decider Lambda uurib dokumenti ja lisab Step Functions töövoogu teavet MIME tüübi, lehtede arvu ja päringute arvu kohta (selle näite puhul kasutame nelja päringut – dokumendi number, kliendi nimi, kuupäev sünd ja vaktsineerimise staatus).
. TextractSync
funktsioon saadab sisendpäringud Amazon Textractile ja tagastab vastuse osana sünkroonselt täieliku tulemuse. See toetab 1-leheküljelisi dokumente (TIFF, PDF, JPG, PNG) ja kuni 15 päringut. The GenerateCsvTask
funktsioon võtab Amazon Textracti JSON-väljundi ja teisendab selle CSV-failiks.
Lõplik väljund salvestatakse samasse S3 ämbrisse csv-väljundi kaustas CSV-failina.
Saate faili oma kohalikku masinasse alla laadida, kasutades järgmist käsku:
Tulemuse formaat on timestamp
, classification
, filename
, page number
, key name
, key_confidence
, value
, value_confidence
, key_bb_top
, key_bb_height
, key_bb.width
, key_bb_left
, value_bb_top
, value_bb_height
, value_bb_width
, value_bb_left
.
Saate skaleerida lahenduse sadadele vaktsineerimissertifikaadi dokumentidele mitme kliendi jaoks, laadides nende vaktsineerimissertifikaadid üles DemoQueries.DocumentUploadLocation
. See käivitab automaatselt sammufunktsioonide olekumasina mitu käitamist ja lõpptulemus salvestatakse samasse S3 ämbrisse csv-väljundkaustas.
Amazon Textracti sisestatavate päringute esialgse komplekti muutmiseks võite minna oma AWS Cloud9 eksemplari ja avada faili start_execution.py. Liikuge vasakpoolsel paanil failivaates lambda, start_queries
, app
, start_execution.py
. See Lambda funktsioon käivitatakse faili üleslaadimisel DemoQueries.DocumentUploadLocation
. Töövoogu saadetavad päringud on määratletud keeles start_execution.py
; saate neid muuta, värskendades koodi, nagu on näidatud järgmisel ekraanipildil.
Koristage
Pidevate tasude vältimiseks kustutage selles postituses loodud ressursid, kasutades järgmist käsku:
Vasta küsimusele Are you sure you want to delete: DemoQueries (y/n)?
koos y-ga.
Järeldus
Selles postituses näitasime teile, kuidas kasutada Amazon Textract Queries'i, et luua reisitööstuse jaoks vaktsineerimise kinnituslahendus. Rakendust Amazon Textract Queries saate kasutada lahenduste loomiseks muudes tööstusharudes, nagu rahandus ja tervishoid, ning hankida teavet dokumentidest, nagu palgalehed, hüpoteeklaenulehed ja kindlustuskaardid loomuliku keele küsimuste põhjal.
Täpsema info saamiseks vt Dokumentide analüüsiminevõi vaadake Amazon Textracti konsooli ja proovige seda funktsiooni.
Autoritest
Dhiraj Thakur on Amazon Web Servicesi lahenduste arhitekt. Ta teeb koostööd AWS-i klientide ja partneritega, et anda juhiseid ettevõtte pilve kasutuselevõtu, migratsiooni ja strateegia kohta. Ta on kirglik tehnoloogia vastu ning talle meeldib analüütika ja AI/ML-ruumis ehitada ja katsetada.
Rishabh Yadav on AWS-i partnerlahenduste arhitekt, kellel on laialdane taust AWS-i DevOpsi ja turvateenuste valdkonnas. Ta teeb koostööd ASEANi partneritega, et anda juhiseid ettevõtte pilve kasutuselevõtuks ja arhitektuuriülevaateks ning AWS-i tavade loomiseks hästi arhitektuurse raamistiku rakendamise kaudu. Väljaspool tööd meeldib talle veeta aega spordiväljakul ja FPS-i mängides.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/build-a-vaccination-verification-solution-using-the-queries-feature-in-amazon-textract/
- :on
- $ UP
- 001
- 100
- 15%
- 1930
- 2468
- 258
- 7
- 8
- a
- MEIST
- konto
- täpsus
- täpne
- täpselt
- lisama
- aadress
- Lisab
- Vastuvõtmine
- asutused
- AI / ML
- Materjal: BPA ja flataatide vaba plastik
- võimaldab
- mööda
- Amazon
- Amazoni tekst
- Amazon Web Services
- an
- analytics
- analüüsima
- analüüse
- ja
- vastus
- vastuseid
- API-liidesed
- taotlus
- asjakohane
- arhitektuur
- OLEME
- AS
- ASEAN
- At
- automatiseerima
- Automaatne
- automaatselt
- automatiseerimine
- vältima
- AWS
- AWSi pilv
- AWS CloudFormation
- tagasi
- tagapõhi
- põhineb
- põhiline
- BE
- sest
- vahel
- sünd
- brauseri
- ehitama
- Ehitus
- ehitatud
- ettevõtted
- kuid
- by
- CAN
- kaart
- Kaardid
- juhtudel
- CD
- sertifikaat
- tunnistused
- väljakutseid
- muutma
- Vaidluste lahendamine
- iseloom
- tegelase äratundmine
- koormuste
- kontrollima
- valik
- Vali
- Cloud
- pilve adopteerimine
- Cloud9
- kood
- Ettevõtted
- täitma
- konfiguratsioon
- konsool
- mugavus
- kulukas
- looma
- loodud
- tava
- klient
- Kliendid
- andmed
- kuupäev
- Kuupäevad
- määratletud
- sõltuvused
- juurutada
- lähetatud
- kasutuselevõtu
- hävitama
- detailid
- & Tarkvaraarendus
- erinev
- raske
- do
- laevalaadija
- dokument
- dokumendid
- lae alla
- ajam
- tõhus
- võimaldab
- ettevõte
- keskkond
- viga
- Uurib
- näide
- uurima
- ulatuslik
- väljavõte
- kaevandamine
- Väljavõtted
- tunnusjoon
- Toidetud
- väli
- fail
- lõplik
- rahastama
- Järel
- eest
- vorm
- formaat
- vormid
- edasi
- neli
- fps
- Raamistik
- Alates
- täis
- täielikult
- funktsioon
- funktsioonid
- tulevik
- mäng
- koguma
- kogumine
- GitHub
- annab
- Go
- juhised
- suunata
- Olema
- he
- tervishoid
- aitab
- tema
- Hotellid
- Kuidas
- Kuidas
- HTML
- http
- HTTPS
- inim-
- sajad
- identifitseerima
- if
- illustreerib
- pilt
- rakendada
- täitmine
- oluline
- in
- Teistes
- hõlmab
- tööstusharudes
- tööstus
- info
- esialgne
- sisend
- sees
- paigaldama
- Näiteks
- kindlustus
- integreeritud
- sekkumine
- sisse
- arved
- kutsutud
- kutsub
- IT
- jpg
- Json
- lihtsalt
- keel
- õppimine
- lahkus
- Lets
- nagu
- meeldib
- Laenud
- kohalik
- loogika
- masin
- masinõpe
- käsiraamat
- palju
- mai..
- mainitud
- menüü
- meetodid
- ränne
- minimaalne
- ML
- mudel
- rohkem
- Hüpoteek
- liikuv
- mitmekordne
- nimi
- Natural
- Navigate
- NAVIGATSIOON
- vajalik
- Vajadus
- vajadustele
- märkused
- number
- OCR
- OCR-tarkvara
- of
- Pakkumised
- sageli
- on
- jätkuv
- ainult
- avatud
- Võimalused
- optiline märkide tuvastamine
- valik
- or
- Muu
- teised
- meie
- välja
- väljund
- väljaspool
- lehekülg
- lehekülge
- pane
- osa
- partner
- partnerid
- Vastu võetud
- kirglik
- Õigused
- foto
- tükk
- Platon
- Platoni andmete intelligentsus
- PlatoData
- post
- pandeemiajärgne
- tavad
- vajadus
- Valmistama
- praegu
- privaatsus
- protsess
- töötlemine
- anda
- eesmärkidel
- päringud
- küsimus
- Küsimused
- juhuslik
- laekumised
- tunnustamine
- lootma
- tähelepanuväärne
- taotleda
- nõutav
- Nõuded
- Vajab
- Vahendid
- austades
- vastus
- kaasa
- Tulu
- läbi
- Arvustused
- ruum
- Marsruut
- jooks
- jookseb
- Sam
- sama
- salvestatud
- Skaala
- Osa
- turvalisus
- vaata
- valima
- valik
- saadab
- Saadetud
- Serverita
- teenus
- Teenused
- komplekt
- mitu
- peaks
- näitas
- näidatud
- märkimisväärne
- lihtne
- tarkvara
- lahendus
- Lahendused
- LAHENDAGE
- mõned
- varsti
- Ruum
- kulutama
- sport
- Kestab
- Personal
- riik
- olek
- Samm
- Sammud
- ladustamine
- salvestada
- ladustatud
- kauplustes
- Strateegia
- kiirendama
- järgnev
- selline
- toetama
- Toetab
- kindel
- ületades
- Võtma
- võtab
- Tehnoloogia
- tüütu
- šabloon
- terminal
- test
- tekst
- et
- .
- teave
- oma
- SIIS
- Seal.
- Need
- see
- need
- Läbi
- aeg
- aega võttev
- et
- traditsiooniline
- reisima
- reisitööstus
- reisija
- vallandada
- vallandas
- püüdma
- tüüp
- liigid
- mõistma
- ajakohastamine
- laetud
- Üleslaadimine
- URL
- kasutama
- Kasutaja
- kasutamine
- kasutades
- vaktsiin
- väärtus
- Kontrollimine
- kontrollima
- kontrollimine
- kaudu
- vaade
- kõndima
- tahan
- Tee..
- we
- web
- veebiteenused
- millal
- kas
- mis
- kuigi
- koos
- Töö
- töövoog
- töötab
- kirjutama
- sa
- Sinu
- sephyrnet