amazontekst er en maskinlæringstjeneste (ML) som automatisk trekker ut tekst, håndskrift og data fra ethvert dokument eller bilde. AnalyzeDocument Signatures er en funksjon i Amazon Textract som tilbyr muligheten til automatisk å oppdage signaturer på ethvert dokument. Dette kan redusere behovet for menneskelig gjennomgang, tilpasset kode eller ML-erfaring.
I dette innlegget diskuterer vi fordelene med AnalyzeDocument Signatures-funksjonen og hvordan AnalyzeDocument Signatures API hjelper til med å oppdage signaturer i dokumenter. Vi går også gjennom hvordan du bruker funksjonen gjennom Amazon Textract-konsollen og gir kodeeksempler for å bruke API og behandle svaret med Amazon Textract-svarparserbiblioteket. Til slutt deler vi noen beste fremgangsmåter for bruk av denne funksjonen.
Fordeler med signaturfunksjonen
Våre kunder fra forsikrings-, boliglåns-, juridiske og skattebransjen står overfor utfordringen med å behandle enorme mengder papirbaserte dokumenter mens de overholder regulatoriske og samsvarskrav som krever signaturer i dokumenter. Du må kanskje sørge for at spesifikke skjemaer som lånesøknader eller krav sendt inn av sluttkundene dine inneholder signaturer før du begynner å behandle søknaden. For visse dokumentbehandlingsarbeidsflyter må du kanskje gå et skritt videre for å trekke ut og sammenligne signaturene for verifisering.
Historisk sett ruter kunder vanligvis dokumentene til en menneskelig anmelder for å oppdage signaturer. Å bruke menneskelige anmeldere til å oppdage signaturer har en tendens til å kreve en betydelig mengde tid og ressurser. Det kan også føre til ineffektivitet i dokumentbehandlingsarbeidsflyten, noe som resulterer i lengre behandlingstider og en dårlig sluttbrukeropplevelse.
AnalyzeDocument Signatures-funksjonen lar deg automatisk oppdage håndskrevne signaturer, elektroniske signaturer og initialer på dokumenter. Dette kan hjelpe deg med å bygge en automatisert skalerbar løsning med mindre avhengighet av kostbar og tidkrevende manuell behandling. Ikke bare kan du bruke denne funksjonen til å bekrefte om dokumentet er signert, men du kan også validere om et bestemt felt i skjemaet er signert ved å bruke stedsdetaljene til de oppdagede signaturene. Du kan også bruke stedsinformasjon til å redigere personlig identifiserbar informasjon (PII) i et dokument.
Hvordan AnalyzeDocument Signatures oppdager signaturer i dokumenter
AnalyzeDocument API har fire funksjonstyper: Skjemaer, Tabeller, Spørringer og Signaturer. Når Amazon Textract behandler dokumenter, returneres resultatene i en rekke av Blokker gjenstander. Signaturfunksjonen kan brukes alene eller i kombinasjon med andre funksjonstyper. Når den brukes av seg selv, gir funksjonstypen Signaturer et JSON-svar som inkluderer plassering og konfidenspoeng for de oppdagede signaturene og råtekst (ord og linjer) fra dokumentene. Signaturfunksjonen kombinert med andre funksjonstyper, for eksempel skjemaer og tabeller, kan bidra til å få nyttig innsikt. I tilfeller der funksjonen brukes med skjemaer og tabeller, viser svaret signaturen som en del av nøkkelverdiparet eller en tabellcelle. For eksempel inneholder svaret for følgende skjema nøkkelen som Långivers signatur og verdien som Block
gjenstand.
Hvordan bruke signaturfunksjonen på Amazon Textract-konsollen
Før vi begynner med API og kodeeksempler, la oss se gjennom Amazon Textract-konsollen. Etter at du har lastet opp dokumentet til Amazon Textract-konsollen, velger du Signaturgjenkjenning i Konfigurer dokumentet delen og velg Bruk konfigurasjon.
Følgende skjermbilde viser et eksempel på en utbetalingsslipp på signaturer fanen for Analyser Document API på Amazon Textract-konsollen.
Funksjonen oppdager og presenterer signaturen med tilhørende side og konfidenspoengsum.
Kodeeksempler
Du kan bruke signaturfunksjonen til å oppdage signaturer på forskjellige typer dokumenter, for eksempel sjekker, lånesøknadsskjemaer, kravskjemaer, lønnsslipper, pantedokumenter, kontoutskrifter, leieavtaler og kontrakter. I denne delen diskuterer vi noen av disse dokumentene og viser hvordan du aktiverer AnalyzeDocument API med Signaturer-parameteren for å oppdage signaturer.
Inndatadokumentet kan enten være i et byte-array-format eller plassert i en Amazon enkel lagringstjeneste (Amazon S3) bøtte. For dokumenter i et byte array-format kan du sende inn bildebytes til en Amazon Textract API-operasjon ved å bruke bytes
eiendom. Signaturer som funksjonstype støttes av AnalyzeDocument API for synkron dokumentbehandling og StartDocumentAnalysis for asynkron behandling av dokumenter.
I det følgende eksempelet oppdager vi signaturer på et bekreftelsesbrev for ansettelse.
Vi bruker følgende eksempel på Python-kode:
La oss analysere svaret vi får fra AnalyzeDocument API. Følgende svar er trimmet til kun å vise de relevante delene. Svaret har en BlockType
of SIGNATURE
som viser konfidenspoengsummen, ID for blokken og detaljer om grenseramme:
Vi bruker følgende kode for å skrive ut ID og plassering i et tabellformat:
Følgende skjermbilde viser resultatene våre.
Flere detaljer og den fullstendige koden er tilgjengelig i notatboken på GitHub repo.
For dokumenter som har leselige signaturer i nøkkelverdiformater, kan vi bruke Textract-responsparser for å trekke ut kun signaturfeltene ved å søke etter nøkkelen og den tilsvarende verdien til disse nøklene:
Den foregående koden returnerer følgende resultater:
Merk at for å transkribere signaturene på denne måten, må signaturene være lesbare.
Beste fremgangsmåter for bruk av signaturfunksjonen
Vurder følgende beste fremgangsmåter når du bruker denne funksjonen:
- For sanntidssvar, bruk den synkrone operasjonen til AnalyzeDocument API. For brukstilfeller der du ikke trenger svaret i sanntid, for eksempel batchbehandling, foreslår vi å bruke den asynkrone operasjonen til API.
- Signaturfunksjonen fungerer best når det er opptil tre signaturer på en side. Når det er mer enn tre signaturer på en side, er det best å dele siden inn i seksjoner og mate hver av seksjonene separat til API.
- Bruk konfidenspoengsummen som følger med de oppdagede signaturene til å rute dokumentene for menneskelig vurdering når poengsummene ikke oppfyller den nødvendige terskelen. Konfidenspoengsummen er ikke et mål på nøyaktighet, men et estimat av modellens tillit til sin prediksjon. Du bør velge en konfidenspoengsum som gir mest mening for ditt bruksområde.
Oppsummering
I dette innlegget ga vi en oversikt over signaturfunksjonen til Amazon Textract for automatisk å oppdage signaturer på dokumenter, for eksempel lønnsslipper, leiekontrakter og kontrakter. AnalyzeDocument Signatures reduserer behovet for menneskelige anmeldere og hjelper deg med å redusere kostnader, spare tid og bygge skalerbare løsninger for dokumentbehandling.
For å komme i gang, logg på Amazon Textract-konsollen for å prøve funksjonen. For å lære mer om Amazon Textract-funksjoner, se amazontekstden Amazon Textract utviklerveiledningeller Textract-ressurser.
Om forfatterne
Maran Chandrasekaran er Senior Solutions Architect hos Amazon Web Services, og jobber med våre bedriftskunder. Utenom jobben elsker han å reise og kjøre motorsykkel i Texas Hill Country.
Shibin Michaelraj er Sr. Product Manager med AWS Textract-teamet. Han er fokusert på å bygge AI/ML-baserte produkter for AWS-kunder.
Suprakash Dutta er senior løsningsarkitekt hos Amazon Web Services. Han fokuserer på digital transformasjonsstrategi, applikasjonsmodernisering og migrering, dataanalyse og maskinlæring. Han er en del av AI/ML-fellesskapet hos AWS og designer intelligente dokumentbehandlingsløsninger.
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- Platoblokkkjede. Web3 Metaverse Intelligence. Kunnskap forsterket. Tilgang her.
- kilde: https://aws.amazon.com/blogs/machine-learning/detect-signatures-on-documents-or-images-using-the-signatures-feature-in-amazon-textract/
- 100
- 7
- a
- evne
- Om oss
- nøyaktighet
- Etter
- avtaler
- AI / ML
- tillater
- Amazon
- amazontekst
- Amazon Web Services
- beløp
- analytics
- analysere
- og
- api
- Søknad
- søknader
- Array
- Automatisert
- automatisk
- tilgjengelig
- AWS
- Bank
- før du
- Fordeler
- BEST
- beste praksis
- Blokker
- Blocks
- Eske
- bygge
- Bygning
- ring
- evner
- saken
- saker
- viss
- utfordre
- Sjekker
- Velg
- krav
- kunde
- klienter
- kode
- kombinasjon
- kombinert
- samfunnet
- sammenligne
- fullføre
- samsvar
- selvtillit
- Konsoll
- inneholder
- kontrakter
- Tilsvarende
- Kostnader
- land
- skikk
- Kunder
- dato
- Data Analytics
- design
- detaljer
- oppdaget
- Gjenkjenning
- Utvikler
- forskjellig
- digitalt
- Digital Transformation
- diskutere
- dokument
- dokumenter
- ikke
- hver enkelt
- enten
- elektronisk
- sysselsetting
- sikre
- Enterprise
- anslag
- eksempel
- eksempler
- erfaring
- trekke ut
- ekstrakter
- Face
- Trekk
- felt
- Felt
- fokuserte
- fokuserer
- etter
- skjema
- format
- skjemaer
- fra
- videre
- generelt
- få
- Go
- Grid
- høyde
- hjelpe
- hjelper
- Hvordan
- Hvordan
- HTML
- HTTPS
- stort
- menneskelig
- ID
- bilde
- bilder
- importere
- in
- inkluderer
- bransjer
- informasjon
- inngang
- innsikt
- forsikring
- Intelligent
- Intelligent dokumentbehandling
- IT
- selv
- JSON
- nøkkel
- nøkler
- føre
- LÆRE
- læring
- Lovlig
- utlåner
- brev
- Bibliotek
- linjer
- lån
- lokal
- ligger
- plassering
- lenger
- maskin
- maskinlæring
- GJØR AT
- leder
- håndbok
- måle
- Møt
- migrasjon
- ML
- mer
- Boliglån
- mest
- motorsykkel
- Trenger
- bærbare
- objekt
- gjenstander
- Tilbud
- drift
- rekkefølge
- Annen
- utenfor
- oversikt
- papirbasert
- parameter
- del
- Spesielt
- deler
- Passerer
- personlig
- plato
- Platon Data Intelligence
- PlatonData
- polygon
- dårlig
- Post
- praksis
- prediksjon
- gaver
- Skrive ut
- prosess
- Prosesser
- prosessering
- Produkt
- Produktsjef
- Produkter
- eiendom
- gi
- forutsatt
- gir
- Python
- Raw
- ekte
- sanntids
- redusere
- reduserer
- regulatorer
- relevant
- avhengighet
- krever
- påkrevd
- Krav
- Ressurser
- svar
- resulterende
- Resultater
- avkastning
- anmeldelse
- Richard
- Ride
- Rute
- Spar
- skalerbar
- Søk
- søker
- Seksjon
- seksjoner
- senior
- forstand
- tjeneste
- Tjenester
- Del
- bør
- Vis
- Viser
- signaturer
- signert
- signifikant
- Enkelt
- løsning
- Solutions
- noen
- spesifikk
- splittet
- Begynn
- startet
- uttalelser
- Trinn
- lagring
- Strategi
- send
- innsendt
- slik
- Støttes
- bord
- skatt
- lag
- texas
- De
- Blokken
- tre
- terskel
- Gjennom
- tid
- tidkrevende
- ganger
- til
- topp
- Transformation
- Transformasjonsstrategi
- reiser
- TRP
- typer
- bruke
- bruk sak
- VALIDERE
- verdi
- Verifisering
- verifisere
- volumer
- web
- webtjenester
- om
- mens
- innenfor
- ord
- Arbeid
- arbeidsflyt
- arbeid
- virker
- X
- Du
- Din
- zephyrnet