amazontext är en maskininlärningstjänst (ML) som automatiskt extraherar text, handstil och data från alla dokument eller bilder. AnalyzeDocument Signatures är en funktion inom Amazon Textract som erbjuder möjligheten att automatiskt upptäcka signaturer på alla dokument. Detta kan minska behovet av mänsklig granskning, anpassad kod eller ML-upplevelse.
I det här inlägget diskuterar vi fördelarna med funktionen AnalyzeDocument Signatures och hur AnalyzeDocument Signatures API hjälper till att upptäcka signaturer i dokument. Vi går också igenom hur man använder funktionen genom Amazon Textract-konsolen och ger kodexempel för att använda API:t och bearbeta svaret med Amazon Textract-svarstolkbiblioteket. Slutligen delar vi med oss av några bästa metoder för att använda den här funktionen.
Fördelar med signaturfunktionen
Våra kunder från försäkrings-, bolåne-, juridik- och skattebranscherna står inför utmaningen att bearbeta enorma volymer pappersbaserade dokument samtidigt som de följer regelverk och efterlevnadskrav som kräver signaturer i dokument. Du kan behöva se till att specifika formulär som låneansökningar eller anspråk som lämnats in av dina slutkunder innehåller signaturer innan du börjar behandla ansökan. För vissa arbetsflöden för dokumentbearbetning kan du behöva gå ett steg längre för att extrahera och jämföra signaturerna för verifiering.
Historiskt sett skickar kunder vanligtvis dokumenten till en mänsklig granskare för att upptäcka signaturer. Att använda mänskliga granskare för att upptäcka signaturer tenderar att kräva en betydande mängd tid och resurser. Det kan också leda till ineffektivitet i arbetsflödet för dokumentbearbetning, vilket resulterar i längre handläggningstider och en dålig slutanvändarupplevelse.
Funktionen AnalyzeDocument Signatures låter dig automatiskt upptäcka handskrivna signaturer, elektroniska signaturer och initialer på dokument. Detta kan hjälpa dig att bygga en automatiserad skalbar lösning med mindre beroende av kostsam och tidskrävande manuell bearbetning. Du kan inte bara använda den här funktionen för att verifiera om dokumentet är signerat, utan du kan också verifiera om ett visst fält i formuläret är signerat med hjälp av platsinformationen för de upptäckta signaturerna. Du kan också använda platsinformation för att redigera personlig identifierbar information (PII) i ett dokument.
Hur AnalyzeDocument Signatures upptäcker signaturer i dokument
AnalyzeDocument API har fyra funktionstyper: Formulär, tabeller, frågor och signaturer. När Amazon Textract bearbetar dokument returneras resultaten i en uppsättning av Blockera föremål. Signaturfunktionen kan användas för sig själv eller i kombination med andra funktionstyper. När den används av sig själv ger funktionstypen Signaturer ett JSON-svar som inkluderar placeringen och konfidenspoängen för de upptäckta signaturerna och råtext (ord och rader) från dokumenten. Funktionen Signaturer i kombination med andra funktionstyper, som formulär och tabeller, kan hjälpa till att skapa användbara insikter. I de fall där funktionen används med formulär och tabeller visar svaret signaturen som en del av nyckelvärdesparet eller en tabellcell. Till exempel innehåller svaret för följande formulär nyckeln som Långiverens underskrift och värdet som Block
objekt.
Hur man använder signaturfunktionen på Amazon Textract-konsolen
Innan vi börjar med API:t och kodexempel, låt oss granska Amazon Textract-konsolen. När du har laddat upp dokumentet till Amazon Textract-konsolen väljer du Signaturdetektering i Konfigurera dokument avsnitt och välj Tillämpa konfiguration.
Följande skärmdump visar ett exempel på en betalstub på signaturer fliken för Analysera Document API på Amazon Textract-konsolen.
Funktionen upptäcker och presenterar signaturen med dess motsvarande sida och konfidenspoäng.
Kodsexempel
Du kan använda funktionen Signaturer för att upptäcka signaturer på olika typer av dokument, såsom checkar, låneansökningsformulär, skadeformulär, lönebesked, inteckningsdokument, kontoutdrag, hyresavtal och kontrakt. I det här avsnittet diskuterar vi några av dessa dokument och visar hur man anropar AnalyzeDocument API med parametern Signatures för att upptäcka signaturer.
Inmatningsdokumentet kan antingen vara i ett byte-arrayformat eller placerat i en Amazon enkel lagringstjänst (Amazon S3) hink. För dokument i ett byte-arrayformat kan du skicka bildbytes till en Amazon Textract API-operation genom att använda bytes
fast egendom. Signaturer som funktionstyp stöds av AnalyzeDocument API för synkron dokumentbehandling och StartDocumentAnalysis för asynkron behandling av dokument.
I följande exempel upptäcker vi signaturer på ett anställningsverifieringsbrev.
Vi använder följande exempel på Python-kod:
Låt oss analysera svaret vi får från AnalyzeDocument API. Följande svar har trimmats för att endast visa de relevanta delarna. Svaret har en BlockType
of SIGNATURE
som visar konfidenspoäng, ID för blocket och detaljer om begränsningsrutan:
Vi använder följande kod för att skriva ut ID och plats i tabellformat:
Följande skärmdump visar våra resultat.
Mer information och den fullständiga koden finns i anteckningsboken på GitHub repo.
För dokument som har läsbara signaturer i nyckelvärdeformat kan vi använda Textract response parser för att bara extrahera signaturfälten genom att söka efter nyckeln och motsvarande värde för dessa nycklar:
Den föregående koden returnerar följande resultat:
Observera att för att kunna transkribera signaturerna på detta sätt måste signaturerna vara läsbara.
Bästa metoder för att använda signaturfunktionen
Tänk på följande bästa praxis när du använder den här funktionen:
- För realtidssvar, använd den synkrona driften av AnalyzeDocument API. För användningsfall där du inte behöver svaret i realtid, såsom batchbearbetning, föreslår vi att du använder API:ets asynkrona operation.
- Signaturfunktionen fungerar bäst när det finns upp till tre signaturer på en sida. När det finns fler än tre signaturer på en sida är det bäst att dela upp sidan i sektioner och mata var och en av sektionerna separat till API:et.
- Använd konfidenspoängen som tillhandahålls med de upptäckta signaturerna för att dirigera dokumenten för mänsklig granskning när poängen inte når din nödvändiga tröskel. Konfidenspoängen är inte ett mått på noggrannhet, utan en uppskattning av modellens tilltro till dess förutsägelse. Du bör välja en konfidenspoäng som är mest meningsfull för ditt användningsfall.
Sammanfattning
I det här inlägget gav vi en översikt över signaturfunktionen i Amazon Textract för att automatiskt upptäcka signaturer på dokument, såsom lönebrev, hyresavtal och kontrakt. AnalyzeDocument Signatures minskar behovet av mänskliga granskare och hjälper dig att minska kostnaderna, spara tid och bygga skalbara lösningar för dokumentbehandling.
För att komma igång, logga in på Amazon Textract-konsolen för att testa funktionen. För att lära dig mer om Amazon Textracts funktioner, se amazontext, den Amazon Textract utvecklarguide, eller Textract-resurser.
Om författarna
Maran Chandrasekaran är Senior Solutions Architect på Amazon Web Services och arbetar med våra företagskunder. Utanför jobbet älskar han att resa och åka motorcykel i Texas Hill Country.
Shibin Michaelraj är Sr. Product Manager med AWS Textract-teamet. Han är fokuserad på att bygga AI/ML-baserade produkter för AWS-kunder.
Suprakash Dutta är Sr. Solutions Architect på Amazon Web Services. Han fokuserar på digital transformationsstrategi, applikationsmodernisering och migrering, dataanalys och maskininlärning. Han är en del av AI/ML-communityt på AWS och designar intelligenta dokumentbehandlingslösningar.
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- Platoblockchain. Web3 Metaverse Intelligence. Kunskap förstärkt. Tillgång här.
- Källa: https://aws.amazon.com/blogs/machine-learning/detect-signatures-on-documents-or-images-using-the-signatures-feature-in-amazon-textract/
- 100
- 7
- a
- förmåga
- Om oss
- noggrannhet
- Efter
- avtal
- AI / ML
- tillåter
- amason
- amazontext
- Amazon Web Services
- mängd
- analytics
- analysera
- och
- api
- Ansökan
- tillämpningar
- array
- Automatiserad
- automatiskt
- tillgänglig
- AWS
- Bank
- innan
- Fördelarna
- BÄST
- bästa praxis
- Blockera
- Block
- Box
- SLUTRESULTAT
- Byggnad
- Ring
- kapacitet
- Vid
- fall
- vissa
- utmanar
- Kontroller
- Välja
- hävdar
- klient
- klienter
- koda
- kombination
- kombinerad
- samfundet
- jämföra
- fullborda
- Efterlevnad
- förtroende
- Konsol
- innehåller
- kontrakt
- Motsvarande
- Kostar
- land
- beställnings
- Kunder
- datum
- Data Analytics
- mönster
- detaljer
- detekterad
- Detektering
- Utvecklare
- olika
- digital
- digital Transformation
- diskutera
- dokumentera
- dokument
- inte
- varje
- antingen
- Elektronisk
- sysselsättning
- säkerställa
- Företag
- uppskatta
- exempel
- exempel
- erfarenhet
- extrahera
- extrakt
- Ansikte
- Leverans
- fält
- Fält
- fokuserade
- fokuserar
- efter
- formen
- format
- former
- från
- ytterligare
- allmänhet
- skaffa sig
- Go
- Rutnät
- höjd
- hjälpa
- hjälper
- Hur ser din drömresa ut
- How To
- html
- HTTPS
- stor
- humant
- ID
- bild
- bilder
- importera
- in
- innefattar
- industrier
- informationen
- ingång
- insikter
- försäkring
- Intelligent
- Intelligent dokumentbehandling
- IT
- sig
- json
- Nyckel
- nycklar
- leda
- LÄRA SIG
- inlärning
- Adress
- långivare
- brev
- Bibliotek
- rader
- lån
- lokal
- belägen
- läge
- längre
- Maskinen
- maskininlärning
- GÖR
- chef
- manuell
- mäta
- Möt
- migration
- ML
- mer
- Inteckning
- mest
- mc
- Behöver
- anteckningsbok
- objektet
- objekt
- Erbjudanden
- drift
- beställa
- Övriga
- utanför
- Översikt
- pappersbaserad
- parameter
- del
- särskilt
- reservdelar till din klassiker
- Förbi
- Personligen
- plato
- Platon Data Intelligence
- PlatonData
- Polygon
- dålig
- Inlägg
- praxis
- förutsägelse
- presenterar
- Skriva ut
- process
- processer
- bearbetning
- Produkt
- produktchef
- Produkter
- egenskapen
- ge
- förutsatt
- ger
- Python
- Raw
- verklig
- realtid
- minska
- minskar
- regulatorer
- relevanta
- tillit
- kräver
- Obligatorisk
- Krav
- Resurser
- respons
- resulterande
- Resultat
- återgår
- översyn
- Richard
- Rider
- Rutt
- Save
- skalbar
- Sök
- söka
- §
- sektioner
- senior
- känsla
- service
- Tjänster
- Dela
- skall
- show
- Visar
- signaturer
- signerad
- signifikant
- Enkelt
- lösning
- Lösningar
- några
- specifik
- delas
- starta
- igång
- uttalanden
- Steg
- förvaring
- Strategi
- skicka
- lämnats
- sådana
- Som stöds
- bord
- skatt
- grupp
- texas
- Smakämnen
- Kvarteret
- tre
- tröskelvärde
- Genom
- tid
- tidskrävande
- gånger
- till
- topp
- Transformation
- Transformationsstrategi
- färdas
- TRP
- typer
- användning
- användningsfall
- BEKRÄFTA
- värde
- Verifiering
- verifiera
- volymer
- webb
- webbservice
- om
- medan
- inom
- ord
- Arbete
- arbetsflöden
- arbetssätt
- fungerar
- X
- Om er
- Din
- zephyrnet