Amazon szöveg egy gépi tanulási (ML) szolgáltatás, amely lehetővé teszi a szöveg, a kézírás és az adatok automatikus kinyerését a beolvasott dokumentumokból, felülmúlva a hagyományos optikai karakterfelismerést (OCR). Figyelemre méltó pontossággal képes azonosítani, megérteni és adatokat kinyerni táblázatokból és űrlapokból. Jelenleg több cég támaszkodik a kézi kivonatolási módszerekre vagy az alapvető OCR-szoftverekre, ami fárasztó és időigényes, és manuális konfigurációt igényel, amelyet az űrlap megváltozásakor frissíteni kell. Az Amazon Textract segít megoldani ezeket a kihívásokat azáltal, hogy az ML segítségével automatikusan feldolgozza a különböző dokumentumtípusokat, és minimális kézi beavatkozással pontosan kinyeri az információkat. Ez lehetővé teszi a dokumentumok feldolgozásának automatizálását és a kinyert adatok különböző célokra történő felhasználását, például a hitelfeldolgozás automatizálását vagy a számlákról és nyugtákról történő információgyűjtést.
Mivel az utazás a világjárvány után folytatódik, sok esetben szükség lehet az utazó beoltottsági állapotának ellenőrzésére. A szállodáknak és utazási irodáknak gyakran át kell tekinteniük az oltási kártyákat, hogy összegyűjtsék a fontos részleteket, például, hogy az utazó teljesen beoltott-e, az oltás dátumai és az utazó neve. Egyes ügynökségek ezt a kártyák kézi ellenőrzésével teszik meg, ami időigényes lehet a személyzet számára, és teret enged az emberi hibáknak. Mások egyedi megoldásokat készítettek, de ezek költségesek és nehezen méretezhetők, és jelentős időt vesz igénybe a megvalósítás. A jövőben lehetőség nyílik az oltási állapot ellenőrzési folyamatának egyszerűsítésére oly módon, hogy az hatékony legyen a vállalkozások számára, miközben tiszteletben tartja az utazók magánéletét és kényelmét.
Amazon Texttract Queries segít ezeknek a kihívásoknak a kezelésében. Az Amazon Textract Queries lehetővé teszi, hogy a dokumentumból csak azt az információt adja meg, amelyre szüksége van. Pontos és pontos információkat ad a dokumentumból.
Ebben a bejegyzésben lépésről lépésre bemutatjuk az oltási állapot-ellenőrző megoldást az Amazon Textract Queries segítségével. A megoldás bemutatja, hogyan kell feldolgozni az oltási kártyákat egy Amazon Textract lekérdezés segítségével, ellenőrizni az oltás állapotát, és tárolni az információkat későbbi használatra.
Megoldás áttekintése
A következő ábra a megoldás architektúráját mutatja be.
A munkafolyamat a következő lépéseket tartalmazza:
- A felhasználó lefényképezi az oltási kártyát.
- A kép feltöltve egy Amazon egyszerű tárolási szolgáltatás (Amazon S3) vödör.
- Amikor a kép az S3 tárolóba kerül, meghív egy AWS lépésfunkciók munkafolyamat:
- A lekérdezések-döntés AWS Lambda függvény megvizsgálja a beküldött dokumentumot, és a MIME típusával, az oldalak számával és a lekérdezések számával kapcsolatos információkat ad hozzá a Step Functions munkafolyamathoz (a mi példánkban négy lekérdezésünk van).
NumberQueriesAndPagesChoice
egy választási állapot, amely feltételes logikát ad a munkafolyamatokhoz. Ha 15-31 lekérdezés van, és az oldalak száma 2-3,001 között van, akkor az Amazon Textract aszinkron feldolgozása az egyetlen lehetőség, mivel a szinkron API-k legfeljebb 15 lekérdezést és egyoldalas dokumentumokat támogatnak. Minden más esetben a szinkron vagy aszinkron feldolgozás véletlenszerű kiválasztására irányulunk.- A
TextractSync
A Lambda függvény kérést küld az Amazon Textract-nak, hogy elemezze a dokumentumot a következő Amazon Textract lekérdezések alapján:- Mi az oltási állapot?
- Mi a név?
- Mi a születési dátum?
- Mi az a dokumentumszám?
- Az Amazon Textract elemzi a képet, és visszaküldi ezekre a kérdésekre a válaszokat a Lambda függvénynek.
- A Lambda funkció ellenőrzi az ügyfél oltási állapotát, és a végeredményt CSV formátumban tárolja ugyanabban az S3 tárolóban (
demoqueries-textractxxx
) ban,-bencsv-output
mappát.
Előfeltételek
A megoldás befejezéséhez rendelkeznie kell egy AWS-fiókkal és a megfelelő engedélyekkel a megoldás részeként szükséges erőforrások létrehozásához.
Töltse le a telepítési kódot és az oltási kártya mintáját innen GitHub.
Használja a Lekérdezések funkciót az Amazon Textract konzolon
Mielőtt elkészítené az oltásellenőrzési megoldást, nézzük meg, hogyan használhatja az Amazon Textract Queries-t az oltási állapot kinyerésére az Amazon Textract konzolon keresztül. Használhatja a GitHub-tárhelyről letöltött oltási kártyamintát.
- Az Amazon Textract konzolon válassza a lehetőséget Dokumentum elemzése a navigációs ablaktáblában.
- Alatt Dokumentum feltöltése, választ Válassza ki a dokumentumot az oltási kártya feltöltéséhez a helyi meghajtóról.
- A dokumentum feltöltése után válassza a lehetőséget Lekérdezések a Dokumentum konfigurálása szakasz.
- Ezután természetes nyelvi kérdések formájában adhat hozzá lekérdezéseket. Tegyük hozzá a következőket:
- Mi az oltási állapot?
- Mi a név?
- Mi a születési dátum?
- Mi az a dokumentumszám?
- Miután hozzáadta az összes lekérdezést, válassza a lehetőséget Alkalmazza a konfigurációt.
- Ellenőrizze a lekérdezéseket lapon megtekintheti a kérdésekre adott válaszokat.
Láthatja, hogy az Amazon Textract kivonja a választ a kérdésére a dokumentumból.
Telepítse az oltásellenőrző megoldást
Ebben a bejegyzésben egy AWS Cloud9 példányt, és telepítse a szükséges függőségeket a példányon a AWS Cloud Development Kit (AWS CDK) és a Docker. Az AWS Cloud9 egy felhőalapú integrált fejlesztői környezet (IDE), amely lehetővé teszi a kód megírását, futtatását és hibakeresését egyetlen böngészővel.
- A terminálon válassza ki Helyi fájlok feltöltése a filé menüben.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Válassza ki a mappát, és válassza a
vaccination_verification_solution
a GitHubról letöltött mappába. - A terminálban készítse fel kiszolgáló nélküli alkalmazását a fejlesztési munkafolyamat további lépéseire AWS szerver nélküli alkalmazásmodell (AWS SAM) a következő paranccsal:
- Telepítse az alkalmazást a
cdk deploy
parancs:Várja meg, amíg az AWS CDK telepíti a modellt, és létrehozza a sablonban említett erőforrásokat.
- Amikor a telepítés befejeződött, ellenőrizheti a telepített erőforrásokat a webhelyen AWS felhőképződés konzol a Tudástár a verem részleteit tartalmazó oldal lapján.
Tesztelje az oldatot
Most itt az ideje, hogy tesztelje a megoldást. A munkafolyamat elindításához használja a aws s3 cp
feltölteni a vac_card.jpg
fájlt DemoQueries.DocumentUploadLocation
a docs mappában:
Az oltási igazolás fájl automatikusan feltöltődik az S3 tárolóba demoqueries-textractxxx
a feltöltések mappában.
A Step Functions munkafolyamat egy Lambda funkción keresztül indul el, amint az oltási tanúsítvány fájl feltöltésre kerül az S3 tárolóba.
A Queries-Decider Lambda funkció megvizsgálja a dokumentumot, és információkat ad a MIME típusáról, az oldalak számáról és a lekérdezések számáról a Step Functions munkafolyamathoz (ebben a példában négy lekérdezést használunk – dokumentumszám, ügyfél neve, dátum születés és oltási állapot).
A TextractSync
függvény elküldi a bemeneti lekérdezéseket az Amazon Textractnak, és a válasz részeként szinkronban visszaadja a teljes eredményt. Támogatja az 1 oldalas dokumentumokat (TIFF, PDF, JPG, PNG) és akár 15 lekérdezést. A GenerateCsvTask
függvény átveszi az Amazon Textract JSON-kimenetét, és CSV-fájllá alakítja.
A végső kimenet ugyanabban az S3 tárolóban van tárolva a csv-output mappában CSV-fájlként.
A fájlt a következő paranccsal töltheti le helyi gépére:
Az eredmény formátuma az timestamp
, classification
, filename
, page number
, key name
, key_confidence
, value
, value_confidence
, key_bb_top
, key_bb_height
, key_bb.width
, key_bb_left
, value_bb_top
, value_bb_height
, value_bb_width
, value_bb_left
.
A megoldást több száz oltási bizonyítványra méretezheti több ügyfél számára, ha feltölti az oltási igazolásaikat a DemoQueries.DocumentUploadLocation
. Ez automatikusan elindítja a Step Functions állapotgép többszöri futtatását, és a végeredmény ugyanabban az S3 tárolóban kerül tárolásra a csv-kimeneti mappában.
Az Amazon Textractba betáplált lekérdezések kezdeti készletének módosításához nyissa meg az AWS Cloud9 példányát, és nyissa meg a start_execution.py fájlt. A bal oldali ablaktáblában lévő fájlnézetben lépjen a lambda elemre, start_queries
, app
, start_execution.py
. Ez a lambda funkció akkor kerül meghívásra, amikor egy fájlt feltöltenek ide DemoQueries.DocumentUploadLocation
. A munkafolyamatba küldött lekérdezések a következőben vannak meghatározva start_execution.py
; megváltoztathatja ezeket a kód frissítésével, ahogy az a következő képernyőképen látható.
Tisztítsuk meg
A folyamatos költségek elkerülése érdekében törölje az ebben a bejegyzésben létrehozott erőforrásokat a következő paranccsal:
Válaszold meg a kérdést Are you sure you want to delete: DemoQueries (y/n)?
y-val.
Következtetés
Ebben a bejegyzésben megmutattuk, hogyan használhatja az Amazon Textract Queries-t egy oltásellenőrző megoldás létrehozására az utazási ágazat számára. Az Amazon Textract Queries segítségével megoldásokat hozhat létre más iparágakban, például a pénzügyekben és az egészségügyben, és természetes nyelvi kérdések alapján információkat nyerhet le dokumentumokból, például fizetési jegyzékekből, jelzáloglevelekből és biztosítási kártyákból.
További információkért lásd: Dokumentumok elemzése, vagy nézze meg az Amazon Textract konzolt, és próbálja ki ezt a funkciót.
A szerzőkről
Dhiraj Thakur az Amazon Web Services megoldástervezője. Az AWS-ügyfelekkel és -partnerekkel együttműködve útmutatást ad a vállalati felhő bevezetéséhez, migrációjához és stratégiájához. Szenvedélyes a technológia iránt, és szeret építeni és kísérletezni az analitika és az AI/ML térben.
Rishabh Yadav az AWS Partner Solutions építésze, kiterjedt háttérrel a DevOps és az AWS biztonsági kínálatában. Az ASEAN-partnerekkel együttműködve útmutatást ad a vállalati felhő bevezetéséhez és az architektúra felülvizsgálatához, valamint az AWS-gyakorlatok kiépítéséhez a jól felépített keretrendszer megvalósításán keresztül. Munkán kívül szívesen tölti idejét a sportpályán és az FPS-játékokkal.
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
- Forrás: https://aws.amazon.com/blogs/machine-learning/build-a-vaccination-verification-solution-using-the-queries-feature-in-amazon-textract/
- :is
- $ UP
- 001
- 100
- 15%
- 1930
- 2468
- 258
- 7
- 8
- a
- Rólunk
- Fiók
- pontosság
- pontos
- pontosan
- hozzá
- cím
- Hozzáteszi
- Örökbefogadás
- ügynökségek
- AI / ML
- Minden termék
- lehetővé teszi, hogy
- mentén
- amazon
- Amazon szöveg
- Az Amazon Web Services
- an
- analitika
- elemez
- elemzések
- és a
- válasz
- válaszok
- API-k
- Alkalmazás
- megfelelő
- építészet
- VANNAK
- AS
- ASEAN
- At
- automatizált
- Automatikus
- automatikusan
- automatizálás
- elkerülése érdekében
- AWS
- AWS Cloud9
- AWS felhőképződés
- vissza
- háttér
- alapján
- alapvető
- BE
- mert
- között
- születés
- böngésző
- épít
- Épület
- épült
- vállalkozások
- de
- by
- TUD
- kártya
- Kártyák
- esetek
- CD
- igazolás
- tanúsítványok
- kihívások
- változik
- Változások
- karakter
- karakter felismerés
- díjak
- ellenőrizze
- választás
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a
- felhő
- felhő elfogadása
- Cloud9
- kód
- Companies
- teljes
- Configuration
- Konzol
- kényelem
- drága
- teremt
- készítette
- szokás
- vevő
- Ügyfelek
- dátum
- találka
- Időpontok
- meghatározott
- függőségek
- telepíteni
- telepített
- bevetés
- elpusztítani
- részletek
- Fejlesztés
- különböző
- nehéz
- do
- Dokkmunkás
- dokumentum
- dokumentumok
- letöltés
- hajtás
- hatékony
- lehetővé teszi
- Vállalkozás
- Környezet
- hiba
- megvizsgálja
- példa
- feltárása
- kiterjedt
- kivonat
- kitermelés
- kivonatok
- Funkció
- Fed
- mező
- filé
- utolsó
- finanszíroz
- következő
- A
- forma
- formátum
- formák
- Előre
- négy
- FPS
- Keretrendszer
- ból ből
- Tele
- teljesen
- funkció
- funkciók
- jövő
- szerencsejáték
- gyűjt
- gyűjtése
- GitHub
- ad
- Go
- útmutatást
- útmutató
- Legyen
- he
- egészségügyi
- segít
- övé
- szállás
- Hogyan
- How To
- HTML
- http
- HTTPS
- emberi
- Több száz
- azonosítani
- if
- illusztrálja
- kép
- végre
- végrehajtás
- fontos
- in
- Más
- magában foglalja a
- iparágak
- ipar
- információ
- kezdetben
- bemenet
- belső
- telepíteni
- példa
- biztosítás
- integrált
- beavatkozás
- bele
- számlák
- hivatkozni
- behívja
- IT
- jpg
- json
- éppen
- nyelv
- tanulás
- balra
- Lets
- mint
- Kedvencek
- Hitelek
- helyi
- logika
- gép
- gépi tanulás
- kézikönyv
- sok
- Lehet..
- említett
- Menü
- mód
- elvándorlás
- minimális
- ML
- modell
- több
- Jelzálog
- mozgó
- többszörös
- név
- Természetes
- Keresse
- Navigáció
- elengedhetetlen
- Szükség
- igények
- Megjegyzések
- szám
- OCR
- OCR szoftver
- of
- Ajánlat
- gyakran
- on
- folyamatban lévő
- csak
- nyitva
- Lehetőségek
- optikai karakter felismerés
- opció
- or
- Más
- Egyéb
- mi
- ki
- teljesítmény
- kívül
- oldal
- oldalak
- üvegtábla
- rész
- partner
- partnerek
- Elmúlt
- szenvedélyes
- engedélyek
- darab
- Plató
- Platón adatintelligencia
- PlatoData
- állás
- post-járvány
- gyakorlat
- pontos
- Készít
- jelenleg
- magánélet
- folyamat
- feldolgozás
- ad
- célokra
- lekérdezések
- kérdés
- Kérdések
- véletlen
- bevételek
- elismerés
- támaszkodnak
- figyelemre méltó
- kérni
- kötelező
- követelmények
- megköveteli,
- Tudástár
- vonatkozó
- válasz
- eredményez
- Visszatér
- Kritika
- Vélemények
- Szoba
- Útvonal
- futás
- fut
- Sam
- azonos
- mentett
- Skála
- Rész
- biztonság
- lát
- válasszuk
- kiválasztás
- küld
- küldött
- vagy szerver
- szolgáltatás
- Szolgáltatások
- készlet
- számos
- kellene
- kimutatta,
- mutatott
- jelentős
- Egyszerű
- szoftver
- megoldások
- Megoldások
- SOLVE
- néhány
- nemsokára
- Hely
- költ
- Sport
- verem
- Személyzet
- Állami
- Állapot
- Lépés
- Lépései
- tárolás
- tárolni
- memorizált
- árnyékolók
- Stratégia
- áramvonal
- későbbi
- ilyen
- támogatás
- Támogatja
- biztos
- kimagasló
- Vesz
- tart
- Technológia
- unalmas
- sablon
- terminál
- teszt
- szöveg
- hogy
- A
- az információ
- azok
- akkor
- Ott.
- Ezek
- ezt
- azok
- Keresztül
- idő
- időigényes
- nak nek
- hagyományos
- utazás
- utazási ipar
- utazó
- kiváltó
- váltott
- megpróbál
- típus
- típusok
- megért
- frissítése
- feltöltve
- Feltöltés
- URL
- használ
- használó
- segítségével
- kihasználva
- Vakcina
- érték
- Igazolás
- ellenőrzése
- ellenőrzése
- keresztül
- Megnézem
- séta
- akar
- Út..
- we
- háló
- webes szolgáltatások
- amikor
- vajon
- ami
- míg
- val vel
- Munka
- munkafolyamat
- művek
- ír
- te
- A te
- zephyrnet