Amazontext ist ein Dienst für maschinelles Lernen (ML), der automatisch Text, Handschrift und Daten aus jedem Dokument oder Bild extrahiert. AnalyzeDocument Signatures ist eine Funktion in Amazon Textract, die die Möglichkeit bietet, Signaturen auf jedem Dokument automatisch zu erkennen. Dies kann den Bedarf an menschlicher Überprüfung, benutzerdefiniertem Code oder ML-Erfahrung reduzieren.
In diesem Beitrag diskutieren wir die Vorteile der Funktion „AnalyzeDocument Signatures“ und wie die API „AnalyzeDocument Signatures“ dabei hilft, Signaturen in Dokumenten zu erkennen. Wir führen auch durch, wie Sie die Funktion über die Amazon Textract-Konsole verwenden, und stellen Codebeispiele bereit, um die API zu verwenden und die Antwort mit der Amazon Textract-Antwort-Parser-Bibliothek zu verarbeiten. Abschließend teilen wir einige Best Practices für die Verwendung dieser Funktion.
Vorteile der Signaturfunktion
Unsere Kunden aus der Versicherungs-, Hypotheken-, Rechts- und Steuerbranche stehen vor der Herausforderung, große Mengen papierbasierter Dokumente zu verarbeiten und gleichzeitig regulatorische und Compliance-Anforderungen einzuhalten, die Unterschriften in Dokumenten erfordern. Möglicherweise müssen Sie sicherstellen, dass bestimmte Formulare wie Kreditanträge oder Forderungen, die von Ihren Endkunden eingereicht werden, Unterschriften enthalten, bevor Sie mit der Bearbeitung des Antrags beginnen. Bei bestimmten Dokumentenverarbeitungs-Workflows müssen Sie möglicherweise noch einen Schritt weiter gehen, um die Signaturen zur Überprüfung zu extrahieren und zu vergleichen.
In der Vergangenheit leiteten Kunden die Dokumente im Allgemeinen an einen menschlichen Prüfer weiter, um Unterschriften zu erkennen. Der Einsatz menschlicher Prüfer zur Erkennung von Signaturen erfordert in der Regel einen erheblichen Zeit- und Ressourcenaufwand. Es kann auch zu Ineffizienzen im Dokumentenverarbeitungs-Workflow führen, was zu längeren Bearbeitungszeiten und einer schlechten Endbenutzererfahrung führt.
Mit der Funktion „Unterschriften von Dokumenten analysieren“ können Sie automatisch handschriftliche Unterschriften, elektronische Unterschriften und Initialen auf Dokumenten erkennen. Dies kann Ihnen dabei helfen, eine automatisierte skalierbare Lösung zu erstellen, die weniger auf kostspielige und zeitaufwändige manuelle Verarbeitung angewiesen ist. Mit dieser Funktion können Sie nicht nur überprüfen, ob das Dokument signiert ist, sondern anhand der Standortdetails der erkannten Signaturen auch überprüfen, ob ein bestimmtes Feld im Formular signiert ist. Sie können Standortinformationen auch verwenden, um personenbezogene Daten (PII) in einem Dokument zu entfernen.
Wie AnalyzeDocument Signatures Signaturen in Dokumenten erkennt
Die AnalyzeDocument-API hat vier Funktionstypen: Formulare, Tabellen, Abfragen und Signaturen. Wenn Amazon Textract Dokumente verarbeitet, werden die Ergebnisse in einem Array von zurückgegeben Blockieren Objekte. Die Signaturfunktion kann allein oder in Kombination mit anderen Funktionstypen verwendet werden. Bei alleiniger Verwendung stellt der Feature-Typ „Signaturen“ eine JSON-Antwort bereit, die die Position und die Konfidenzwerte der erkannten Signaturen und des Rohtexts (Wörter und Zeilen) aus den Dokumenten enthält. Die Signaturfunktion in Kombination mit anderen Funktionstypen wie Formularen und Tabellen kann dabei helfen, nützliche Erkenntnisse zu gewinnen. In Fällen, in denen die Funktion mit Formularen und Tabellen verwendet wird, zeigt die Antwort die Signatur als Teil eines Schlüsselwertpaars oder einer Tabellenzelle. Beispielsweise enthält die Antwort für das folgende Formular den Schlüssel as Unterschrift des Kreditgebers und der Wert als die Block
Objekt.
So verwenden Sie die Signaturfunktion in der Amazon Textract-Konsole
Bevor wir mit der API und den Codebeispielen beginnen, sehen wir uns die Amazon Textract-Konsole an. Nachdem Sie das Dokument in die Amazon Textract-Konsole hochgeladen haben, wählen Sie Signaturerkennung der Dokument konfigurieren Abschnitt und wählen Sie Konfiguration anwenden.
Der folgende Screenshot zeigt ein Beispiel für eine Gehaltsabrechnung auf der Unterschriften Registerkarte für die API zum Analysieren von Dokumenten in der Amazon Textract-Konsole.
Die Funktion erkennt und präsentiert die Signatur mit der entsprechenden Seite und dem Vertrauenswert.
Codebeispiele
Sie können die Funktion „Signaturen“ verwenden, um Signaturen auf verschiedenen Arten von Dokumenten zu erkennen, z. B. Schecks, Kreditantragsformulare, Forderungsformulare, Gehaltsabrechnungen, Hypothekendokumente, Kontoauszüge, Mietverträge und Verträge. In diesem Abschnitt diskutieren wir einige dieser Dokumente und zeigen, wie Sie die AnalyzeDocument-API mit dem Signatures-Parameter aufrufen, um Signaturen zu erkennen.
Das Eingabedokument kann entweder in einem Byte-Array-Format vorliegen oder sich in einem befinden Amazon Simple Storage-Service (Amazon S3) Eimer. Für Dokumente in einem Byte-Array-Format können Sie Bildbytes an eine Amazon Textract-API-Operation senden, indem Sie die verwenden bytes
Eigentum. Signaturen als Feature-Typ werden von der AnalyzeDocument-API für die synchrone Dokumentenverarbeitung und StartDocumentAnalysis für die asynchrone Verarbeitung von Dokumenten unterstützt.
Im folgenden Beispiel erkennen wir Unterschriften auf einem Beschäftigungsbestätigungsschreiben.
Wir verwenden den folgenden Beispiel-Python-Code:
Analysieren wir die Antwort, die wir von der AnalyzeDocument-API erhalten. Die folgende Antwort wurde gekürzt, um nur die relevanten Teile anzuzeigen. Die Antwort hat eine BlockType
of SIGNATURE
die den Konfidenzwert, die ID für den Block und die Details des Begrenzungsrahmens anzeigt:
Wir verwenden den folgenden Code, um die ID und den Standort in tabellarischer Form zu drucken:
Der folgende Screenshot zeigt unsere Ergebnisse.
Weitere Details und den vollständigen Code finden Sie im Notizbuch auf der GitHub Repo.
Für Dokumente mit lesbaren Signaturen in Schlüsselwertformaten können wir die verwenden Textract-Antwort-Parser um nur die Signaturfelder zu extrahieren, indem Sie nach dem Schlüssel und dem entsprechenden Wert für diese Schlüssel suchen:
Der vorangehende Code gibt die folgenden Ergebnisse zurück:
Beachten Sie, dass die Unterschriften lesbar sein müssen, um die Unterschriften auf diese Weise zu transkribieren.
Best Practices für die Verwendung der Signaturfunktion
Berücksichtigen Sie bei der Verwendung dieser Funktion die folgenden Best Practices:
- Verwenden Sie für Echtzeitantworten den synchronen Betrieb der AnalyzeDocument-API. Für Anwendungsfälle, in denen Sie die Antwort nicht in Echtzeit benötigen, wie z. B. bei der Stapelverarbeitung, empfehlen wir die Verwendung des asynchronen Betriebs der API.
- Die Signaturfunktion funktioniert am besten, wenn auf einer Seite bis zu drei Signaturen vorhanden sind. Wenn mehr als drei Signaturen auf einer Seite vorhanden sind, ist es am besten, die Seite in Abschnitte aufzuteilen und jeden Abschnitt separat an die API zu übermitteln.
- Verwenden Sie die mit den erkannten Signaturen bereitgestellten Konfidenzwerte, um die Dokumente zur menschlichen Überprüfung weiterzuleiten, wenn die Werte Ihren erforderlichen Schwellenwert nicht erreichen. Der Konfidenzwert ist kein Maß für die Genauigkeit, sondern eine Schätzung des Vertrauens des Modells in seine Vorhersage. Sie sollten einen Konfidenzwert auswählen, der für Ihren Anwendungsfall am sinnvollsten ist.
Zusammenfassung
In diesem Beitrag haben wir einen Überblick über die Signaturfunktion von Amazon Textract zur automatischen Erkennung von Unterschriften auf Dokumenten wie Gehaltsabrechnungen, Mietverträgen und Verträgen gegeben. AnalyzeDocument Signatures reduziert den Bedarf an menschlichen Prüfern und hilft Ihnen, Kosten zu senken, Zeit zu sparen und skalierbare Lösungen für die Dokumentenverarbeitung zu entwickeln.
Melden Sie sich zunächst bei der Amazon Textract-Konsole an, um die Funktion auszuprobieren. Weitere Informationen zu den Funktionen von Amazon Textract finden Sie unter Amazontext, der Amazon Textract Entwicklerhandbuch, oder Textract-Ressourcen.
Über die Autoren
Maran Chandrasekaran ist Senior Solutions Architect bei Amazon Web Services und arbeitet mit unseren Unternehmenskunden zusammen. Außerhalb der Arbeit liebt er es zu reisen und Motorrad im Texas Hill Country zu fahren.
Schibin Michaelraj ist Senior Product Manager im AWS Textract-Team. Er konzentriert sich auf die Entwicklung von AI/ML-basierten Produkten für AWS-Kunden.
Suprakash Dutta ist Senior Solutions Architect bei Amazon Web Services. Er konzentriert sich auf Strategien zur digitalen Transformation, Anwendungsmodernisierung und -migration, Datenanalyse und maschinelles Lernen. Er ist Teil der AI/ML-Community bei AWS und entwirft intelligente Dokumentenverarbeitungslösungen.
- SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
- Platoblockkette. Web3-Metaverse-Intelligenz. Wissen verstärkt. Hier zugreifen.
- Quelle: https://aws.amazon.com/blogs/machine-learning/detect-signatures-on-documents-or-images-using-the-signatures-feature-in-amazon-textract/
- 100
- 7
- a
- Fähigkeit
- LiveBuzz
- Genauigkeit
- Nach der
- Vereinbarungen
- AI / ML
- erlaubt
- Amazon
- Amazontext
- Amazon Web Services
- Betrag
- Analytik
- analysieren
- und
- Bienen
- Anwendung
- Anwendungen
- Feld
- Automatisiert
- Im Prinzip so, wie Sie es von Google Maps kennen.
- verfügbar
- AWS
- Bank
- Bevor
- Vorteile
- BESTE
- Best Practices
- Blockieren
- Blockiert
- Box
- bauen
- Building
- rufen Sie uns an!
- Fähigkeiten
- Häuser
- Fälle
- sicher
- challenges
- Schecks
- Auswählen
- aus aller Welt
- Auftraggeber
- Kunden
- Code
- Kombination
- kombiniert
- community
- vergleichen
- abschließen
- Compliance
- Vertrauen
- Konsul (Console)
- enthält
- Verträge
- Dazugehörigen
- Kosten
- Land
- Original
- Kunden
- technische Daten
- Datenanalyse
- Designs
- Details
- erkannt
- Entdeckung
- Entwickler:in / Unternehmen
- anders
- digital
- Digitale Transformation
- diskutieren
- Dokument
- Unterlagen
- Nicht
- jeder
- entweder
- elektronisch
- Beschäftigung
- gewährleisten
- Unternehmen
- schätzen
- Beispiel
- Beispiele
- ERFAHRUNGEN
- Extrakt
- KONZENTRAT
- Gesicht
- Merkmal
- Feld
- Felder
- konzentriert
- konzentriert
- Folgende
- unten stehende Formular
- Format
- Formen
- für
- weiter
- allgemein
- bekommen
- Go
- Gitter
- Höhe
- Hilfe
- hilft
- Ultraschall
- Hilfe
- HTML
- HTTPS
- riesig
- human
- ID
- Image
- Bilder
- importieren
- in
- Dazu gehören
- Branchen
- Information
- Varianten des Eingangssignals:
- Einblicke
- Versicherung
- Intelligent
- Intelligente Dokumentenverarbeitung
- IT
- selbst
- JSON
- Wesentliche
- Tasten
- führen
- LERNEN
- lernen
- Rechtlich
- Verleiher
- Brief
- Bibliothek
- Linien
- Darlehen
- aus einer regionalen
- located
- Standorte
- länger
- Maschine
- Maschinelles Lernen
- MACHT
- Manager
- manuell
- messen
- Triff
- Migration
- ML
- mehr
- Darlehen
- vor allem warme
- Motorrad
- Need
- Notizbuch
- Objekt
- Objekte
- Angebote
- Betrieb
- Auftrag
- Andere
- aussen
- Überblick
- auf Papierbasis
- Parameter
- Teil
- besondere
- Teile
- Bestehen
- Persönlich
- Plato
- Datenintelligenz von Plato
- PlatoData
- Vieleck
- Arm
- Post
- Praktiken
- Prognose
- Geschenke
- Prozessdefinierung
- anpassen
- Verarbeitung
- Produkt
- Produkt-Manager
- Produkte
- Resorts
- die
- vorausgesetzt
- bietet
- Python
- Roh
- echt
- Echtzeit
- Veteran
- reduziert
- Regulierungsbehörden
- relevant
- Vertrauen
- erfordern
- falls angefordert
- Voraussetzungen:
- Downloads
- Antwort
- was zu
- Die Ergebnisse
- Rückgabe
- Überprüfen
- Daniel
- Biken
- Straße
- Speichern
- skalierbaren
- Suche
- Suche
- Abschnitt
- Abschnitte
- Senior
- Sinn
- Lösungen
- Teilen
- sollte
- erklären
- Konzerte
- Unterschriften
- unterzeichnet
- signifikant
- Einfacher
- Lösung
- Lösungen
- einige
- spezifisch
- gespalten
- Anfang
- begonnen
- Aussagen
- Schritt
- Lagerung
- Strategie
- abschicken
- eingereicht
- so
- Unterstützte
- Tabelle
- Steuer
- Team
- Texas
- Das
- Der Block
- nach drei
- Schwelle
- Durch
- Zeit
- Zeitaufwendig
- mal
- zu
- Top
- Transformation
- Transformationsstrategie
- reisen
- TRP
- Typen
- -
- Anwendungsfall
- BESTÄTIGEN
- Wert
- Verification
- überprüfen
- Volumen
- Netz
- Web-Services
- ob
- während
- .
- Worte
- Arbeiten
- Workflows
- arbeiten,
- Werk
- X
- Du
- Ihr
- Zephyrnet