Amazoni tekst on masinõppe (ML) teenus, mis ekstraheerib automaatselt teksti, käsitsikirja ja andmed mis tahes dokumendist või pildist. AnalyzeDocument Signatures on Amazon Textracti funktsioon, mis pakub võimalust automaatselt tuvastada mis tahes dokumendi allkirju. See võib vähendada vajadust inimeste ülevaatuse, kohandatud koodi või ML-kogemuse järele.
Selles postituses käsitleme funktsiooni AnalyzeDocument Signatures eeliseid ja seda, kuidas AnalyzeDocument Signatures API aitab dokumentides allkirju tuvastada. Samuti käsitleme seda funktsiooni Amazon Textracti konsooli kaudu ja anname koodinäiteid API kasutamiseks ja vastuse töötlemiseks Amazon Textracti vastuseparseri teegiga. Lõpuks jagame selle funktsiooni kasutamise parimaid tavasid.
Funktsiooni Allkirjad eelised
Meie kliendid kindlustus-, hüpoteeklaenu-, õigus- ja maksusektorist seisavad silmitsi väljakutsega töödelda tohutul hulgal paberdokumente, järgides samal ajal regulatiivseid ja vastavusnõudeid, mis nõuavad dokumentides allkirju. Enne taotluse töötlemise alustamist peate võib-olla tagama, et teie lõppklientide esitatud konkreetsed vormid (nt laenutaotlused või nõuded) sisaldavad allkirju. Teatud dokumenditöötluse töövoogude puhul peate võib-olla astuma sammu kaugemale, et allkirjad kinnitamiseks eraldada ja võrrelda.
Ajalooliselt suunavad kliendid allkirjade tuvastamiseks dokumendid üldiselt ülevaatajale. Inimeste ülevaatajate kasutamine allkirjade tuvastamiseks nõuab tavaliselt palju aega ja ressursse. See võib põhjustada ka ebaefektiivsust dokumentide töötlemise töövoos, mille tulemuseks on pikem töötlemisaeg ja kehv lõppkasutaja kogemus.
Funktsioon AnalyzeDocument Signatures võimaldab automaatselt tuvastada dokumentidel käsitsi kirjutatud allkirju, elektroonilisi allkirju ja initsiaale. See võib aidata teil luua automatiseeritud skaleeritava lahenduse, mis ei sõltu kulukast ja aeganõudvast käsitsi töötlemisest. Selle funktsiooni abil saate mitte ainult kontrollida, kas dokument on allkirjastatud, vaid ka tuvastatud allkirjade asukoha üksikasjade abil kontrollida, kas vormi konkreetne väli on allkirjastatud. Asukohateavet saate kasutada ka isikut tuvastava teabe (PII) eemaldamiseks dokumendis.
Kuidas AnalyzeDocument Signatures dokumentides allkirju tuvastab
AnalyzeDocument API-l on neli funktsioonitüüpi: vormid, tabelid, päringud ja allkirjad. Kui Amazon Textract dokumente töötleb, tagastatakse tulemused massiivina Blokeerima objektid. Funktsiooni Allkirjad saab kasutada eraldi või koos teiste funktsioonitüüpidega. Funktsiooni tüüp Allkirjad, kui seda kasutatakse iseseisvalt, pakub JSON-vastust, mis sisaldab tuvastatud allkirjade ja dokumentide toorteksti (sõnade ja ridade) asukohta ja usaldusskoore. Funktsioon Allkirjad koos teiste funktsioonitüüpidega, nagu vormid ja tabelid, võivad aidata saada kasulikke teadmisi. Juhtudel, kui funktsiooni kasutatakse vormide ja tabelitega, kuvatakse vastuses allkiri võtmeväärtuste paari või tabeli lahtri osana. Näiteks sisaldab järgmise vormi vastus võtit as Laenuandja allkiri ja väärtus nagu Block
objekt
Kuidas kasutada Amazon Textracti konsooli allkirjade funktsiooni
Enne API ja koodinäidistega alustamist vaatame üle Amazon Textracti konsooli. Pärast dokumendi Amazon Textracti konsooli üleslaadimist valige Allkirja tuvastamine aasta Konfigureerige dokument jaotis ja valige Rakenda konfiguratsioon.
Järgmisel ekraanipildil on näide palganumbrist Allkirjad vahekaart Analüüsi dokumenti API jaoks Amazon Textracti konsoolis.
Funktsioon tuvastab ja esitab allkirja koos vastava lehe ja usaldusskooriga.
Koodi näited
Allkirjade funktsiooni saate kasutada allkirjade tuvastamiseks erinevat tüüpi dokumentidel, nagu tšekid, laenutaotluse vormid, nõudevormid, palgalehed, hüpoteegi dokumendid, pangaväljavõtted, liisingulepingud ja lepingud. Selles jaotises käsitleme mõnda neist dokumentidest ja näitame, kuidas kutsuda AnalyzeDocument API parameetriga Signatures, et tuvastada allkirju.
Sisenddokument võib olla baitimassiivi vormingus või asuda Amazoni lihtne salvestusteenus (Amazon S3) kopp. Baitimassiivi vormingus dokumentide puhul saate esitada pildibaite Amazon Textract API toimingule, kasutades bytes
vara. Allkirju kui funktsioonitüüpi toetab AnalyzeDocument API sünkroonseks dokumentide töötlemiseks ja StartDocumentAnalysis dokumentide asünkroonseks töötlemiseks.
Järgmises näites tuvastame allkirjad töötamise kinnituskirjal.
Kasutame järgmist Pythoni näidiskoodi:
Analüüsime AnalyzeDocument API-lt saadud vastust. Järgmist vastust on kärbitud, et kuvada ainult asjakohased osad. Vastuses on a BlockType
of SIGNATURE
mis näitab usaldusskoori, ploki ID-d ja piirdekasti üksikasju:
Kasutame ID ja asukoha tabelivormingus printimiseks järgmist koodi:
Järgmine ekraanipilt näitab meie tulemusi.
Lisateavet ja täielikku koodi leiate sülearvutist aadressil GitHub repo.
Dokumentide jaoks, millel on võtmeväärtuste vormingus loetavad allkirjad, saame kasutada Teksti vastuse analüüsija ainult allkirjaväljade eraldamiseks, otsides võtit ja nendele võtmetele vastavat väärtust:
Eelnev kood tagastab järgmised tulemused:
Pange tähele, et sellisel viisil allkirjade transkribeerimiseks peavad allkirjad olema loetavad.
Allkirjade funktsiooni kasutamise parimad tavad
Selle funktsiooni kasutamisel võtke arvesse järgmisi parimaid tavasid.
- Reaalajas vastuste jaoks kasutage AnalyzeDocument API sünkroonset toimimist. Kui te ei vaja vastust reaalajas (nt paketttöötlus), soovitame kasutada API asünkroonset toimimist.
- Allkirjade funktsioon töötab kõige paremini, kui ühel lehel on kuni kolm allkirja. Kui lehel on rohkem kui kolm allkirja, on kõige parem jagada leht osadeks ja edastada API-le iga jaotis eraldi.
- Kasutage tuvastatud allkirjadega kaasasolevaid usaldusskoore, et suunata dokumendid inimese ülevaatamiseks, kui hinded ei vasta teie nõutavale lävele. Usaldusskoor ei ole täpsuse mõõt, vaid hinnang mudeli kindlustunde kohta oma prognoosis. Peaksite valima usaldusskoori, mis on teie kasutusjuhtumi jaoks kõige mõistlikum.
kokkuvõte
Selles postituses andsime ülevaate Amazon Textracti funktsioonist Signatures, et tuvastada automaatselt allkirjad dokumentidel, nagu palgalehed, rendilepingud ja lepingud. AnalyzeDocument Signatures vähendab vajadust inimestest ülevaatajate järele ning aitab teil vähendada kulusid, säästa aega ja luua skaleeritavaid lahendusi dokumentide töötlemiseks.
Alustamiseks logige funktsiooni proovimiseks sisse Amazon Textracti konsooli. Amazon Textracti võimaluste kohta lisateabe saamiseks vaadake Amazoni tekst, Amazon Textracti arendaja juhendvõi Tekstiressursid.
Autoritest
Maran Chandrasekaran on Amazon Web Servicesi vanemlahenduste arhitekt, kes töötab meie äriklientidega. Väljaspool tööd armastab ta reisida ja Texas Hill Countryis oma mootorrattaga sõita.
Shibin Michaelraj on AWS Textracti meeskonna vanem tootejuht. Ta on keskendunud AI/ML-põhiste toodete loomisele AWS-i klientidele.
Suprakash Dutta on Amazon Web Services'i lahenduste arhitekt. Ta keskendub digitaalse ümberkujundamise strateegiale, rakenduste moderniseerimisele ja migratsioonile, andmeanalüütikale ja masinõppele. Ta on osa AWS-i AI/ML kogukonnast ja kavandab intelligentseid dokumenditöötluslahendusi.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- Platoblockchain. Web3 metaversiooni intelligentsus. Täiustatud teadmised. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/detect-signatures-on-documents-or-images-using-the-signatures-feature-in-amazon-textract/
- 100
- 7
- a
- võime
- MEIST
- täpsus
- pärast
- lepingud
- AI / ML
- võimaldab
- Amazon
- Amazoni tekst
- Amazon Web Services
- summa
- analytics
- analüüsima
- ja
- API
- taotlus
- rakendused
- Array
- Automatiseeritud
- automaatselt
- saadaval
- AWS
- Pank
- enne
- Kasu
- BEST
- parimaid tavasid
- Blokeerima
- Plokid
- Kast
- ehitama
- Ehitus
- helistama
- võimeid
- juhul
- juhtudel
- kindel
- väljakutse
- Kontroll
- Vali
- nõuete
- klient
- kliendid
- kood
- kombinatsioon
- kombineeritud
- kogukond
- võrdlema
- täitma
- Vastavus
- usaldus
- konsool
- sisaldab
- lepingud
- Vastav
- kulud
- riik
- tava
- Kliendid
- andmed
- Andmete analüüs
- disainilahendused
- detailid
- tuvastatud
- Detection
- arendaja
- erinev
- digitaalne
- Digitaalne Transformation
- arutama
- dokument
- dokumendid
- Ära
- iga
- kumbki
- Elektrooniline
- töö
- tagama
- ettevõte
- hinnata
- näide
- näited
- kogemus
- väljavõte
- Väljavõtted
- nägu
- tunnusjoon
- väli
- Valdkonnad
- keskendunud
- keskendub
- Järel
- vorm
- formaat
- vormid
- Alates
- edasi
- üldiselt
- saama
- Go
- võre
- kõrgus
- aitama
- aitab
- Kuidas
- Kuidas
- HTML
- HTTPS
- tohutu
- inim-
- ID
- pilt
- pildid
- import
- in
- hõlmab
- tööstusharudes
- info
- sisend
- teadmisi
- kindlustus
- Intelligentne
- Arukas dokumenditöötlus
- IT
- ise
- Json
- Võti
- võtmed
- viima
- Õppida
- õppimine
- Õigus
- laenuandja
- kiri
- Raamatukogu
- liinid
- laen
- kohalik
- asub
- liising
- enam
- masin
- masinõpe
- TEEB
- juht
- käsiraamat
- mõõtma
- Vastama
- ränne
- ML
- rohkem
- Hüpoteek
- kõige
- mootorratas
- Vajadus
- märkmik
- objekt
- esemeid
- Pakkumised
- töö
- et
- Muu
- väljaspool
- ülevaade
- paberipõhised
- parameeter
- osa
- eriline
- osad
- Mööduv
- Isiklikult
- Platon
- Platoni andmete intelligentsus
- PlatoData
- hulknurk
- vaene
- post
- tavad
- ennustus
- kingitusi
- trükk
- protsess
- Protsessid
- töötlemine
- Toode
- tootejuht
- Toodet
- kinnisvara
- anda
- tingimusel
- annab
- Python
- Töötlemata
- reaalne
- reaalajas
- vähendama
- vähendab
- regulatiivne
- asjakohane
- sõltuvus
- nõudma
- nõutav
- Nõuded
- Vahendid
- vastus
- tulemuseks
- Tulemused
- Tulu
- läbi
- Richard
- Sõitma
- Marsruut
- Säästa
- skaalautuvia
- Otsing
- otsimine
- Osa
- lõigud
- vanem
- tunne
- teenus
- Teenused
- Jaga
- peaks
- näitama
- Näitused
- Allkirjad
- allkirjastatud
- märkimisväärne
- lihtne
- lahendus
- Lahendused
- mõned
- konkreetse
- jagada
- algus
- alustatud
- avaldused
- Samm
- ladustamine
- Strateegia
- esitama
- esitatud
- selline
- Toetatud
- tabel
- maks
- meeskond
- texas
- .
- Plokk
- kolm
- künnis
- Läbi
- aeg
- aega võttev
- korda
- et
- ülemine
- Transformation
- Ümberkujundamise strateegia
- reisima
- TRP
- liigid
- kasutama
- kasutage juhtumit
- KINNITAGE
- väärtus
- Kontrollimine
- kontrollima
- mahud
- web
- veebiteenused
- kas
- kuigi
- jooksul
- sõnad
- Töö
- Töövoogud
- töö
- töötab
- X
- sa
- Sinu
- sephyrnet