Amazon T-extract is een machine learning (ML)-service die automatisch tekst, handschrift en gegevens extraheert uit elk document of elke afbeelding. Amazon Textract biedt nu de flexibiliteit om de gegevens te specificeren die je uit documenten moet extraheren met behulp van de nieuwe Queries-functie in de Analyse Document API. U hoeft de structuur van de gegevens in het document (tabel, formulier, geรฏmpliceerd veld, geneste gegevens) niet te kennen of u zorgen te maken over variaties in documentversies en -indelingen.
In dit bericht bespreken we de volgende onderwerpen:
- Succesverhalen van AWS-klanten en voordelen van de nieuwe Queries-functie
- Hoe de Analyse Document Queries API helpt bij het extraheren van informatie uit documenten
- Een overzicht van de Amazon Textract-console
- Codevoorbeelden om de Analyse Document Queries API te gebruiken
- Het antwoord verwerken met de Amazon Textract-parserbibliotheek
Voordelen van de nieuwe functie Query's
Traditionele OCR-oplossingen hebben moeite om gegevens nauwkeurig te extraheren uit de meeste semi-gestructureerde en ongestructureerde documenten vanwege aanzienlijke verschillen in de manier waarop de gegevens zijn ingedeeld in meerdere versies en formaten van deze documenten. U moet aangepaste code voor nabewerking implementeren of handmatig de geรซxtraheerde informatie uit deze documenten bekijken. Met de functie Query's kunt u de informatie die u nodig hebt specificeren in de vorm van vragen in natuurlijke taal (bijvoorbeeld "Wat is de naam van de klant") en de exacte informatie ontvangen ("John Doe") als onderdeel van het API-antwoord. De functie gebruikt een combinatie van visuele, ruimtelijke en taalmodellen om de informatie die u zoekt met hoge nauwkeurigheid te extraheren. De functie Query's is vooraf getraind in een grote verscheidenheid aan semi-gestructureerde en ongestructureerde documenten. Enkele voorbeelden zijn loonstrookjes, bankafschriften, W-2's, aanvraagformulieren voor leningen, hypotheeknota's en vaccin- en verzekeringskaarten.
"Amazon Textract stelt ons in staat om de documentverwerkingsbehoeften van onze klanten te automatiseren. Met de functie Query's kunnen we gegevens uit een verscheidenheid aan documenten extraheren met nog meer flexibiliteit en nauwkeurigheid," zei Robert Jansen, Chief Executive Officer bij TekStream Solutions. "We zien dit als een grote productiviteitswinst voor onze zakelijke klanten, die de Queries-functie kunnen gebruiken als onderdeel van onze IDP-oplossing om snel belangrijke informatie uit hun documenten te halen."
"Amazon Textract stelt ons in staat om zowel tekst als gestructureerde elementen zoals formulieren en tabellen met hoge nauwkeurigheid uit afbeeldingen te extraheren. Amazon Textract Queries heeft ons geholpen de kwaliteit van informatie-extractie uit verschillende bedrijfskritieke documenten, zoals veiligheidsinformatiebladen of materiaalspecificaties, drastisch te verbeteren" zei Thorsten Warnecke, directeur | Hoofd PC Analytics, Camelot Management Consultants. "Het natuurlijke taalquerysysteem biedt een grote flexibiliteit en nauwkeurigheid, waardoor onze nabewerkingsbelasting is verminderd en we nieuwe documenten sneller aan onze gegevensextractietools kunnen toevoegen."
Hoe de Analyse Document Queries API helpt bij het extraheren van informatie uit documenten
Bedrijven hebben meer gebruik gemaakt van digitale platforms, vooral in het licht van de COVID-19-pandemie. De meeste organisaties bieden nu een digitale manier aan om hun diensten en producten aan te schaffen met behulp van smartphones en andere mobiele apparaten, wat gebruikers flexibiliteit biedt, maar ook bijdraagt โโaan de schaal waarop digitale documenten moeten worden beoordeeld, verwerkt en geanalyseerd. In sommige werklasten waarbij bijvoorbeeld hypotheekdocumenten, vaccinatiekaarten, loonstrookjes, verzekeringskaarten en andere documenten digitaal moeten worden geanalyseerd, kan de complexiteit van gegevensextractie exponentieel toenemen omdat deze documenten geen standaardformaat hebben of aanzienlijke variaties in gegevensformaat hebben in verschillende versies van het document.
Zelfs krachtige OCR-oplossingen hebben moeite om gegevens nauwkeurig uit deze documenten te extraheren, en het kan zijn dat u aangepaste nabewerking voor deze documenten moet implementeren. Dit omvat het toewijzen van mogelijke variaties van formuliersleutels aan klanteigen veldnamen of het opnemen van aangepaste machine learning om specifieke informatie in een ongestructureerd document te identificeren.
De nieuwe Analyse Document Queries API in Amazon Textract kan in natuurlijke taal geschreven vragen beantwoorden, zoals "Wat is de rente?" en voer krachtige AI- en ML-analyse uit op het document om de gewenste informatie te achterhalen en deze uit het document te extraheren zonder enige nabewerking. De functie Query's vereist geen aangepaste modeltraining of het instellen van sjablonen of configuraties. U kunt snel aan de slag door uw documenten te uploaden en vragen over die documenten te specificeren via de Amazon Textract-console, de AWS-opdrachtregelinterface (AWS CLI) of AWS SDK.
In de volgende secties van dit bericht bespreken we gedetailleerde voorbeelden van hoe u deze nieuwe functionaliteit kunt gebruiken voor veelvoorkomende gebruiksscenario's voor werkbelastingen en hoe u de Analyse Document Queries-API gebruikt om flexibiliteit toe te voegen aan het proces van digitalisering van uw werklast.
Gebruik de functie Query's op de Amazon Textract-console
Voordat we aan de slag gaan met de API en codevoorbeelden, laten we de Amazon Textract-console eens bekijken. De volgende afbeelding toont een voorbeeld van een vaccinatiekaart op de: Queries tabblad voor de Analyse Document API op de Amazon Textract-console. Nadat je het document naar de Amazon Textract-console hebt geรผpload, kies je Queries in de Document configureren sectie. U kunt dan zoekopdrachten toevoegen in de vorm van natuurlijke taalvragen. Nadat u al uw vragen heeft toegevoegd, kiest u Configuratie toepassen. De antwoorden op de vragen staan โโop de Queries Tab.
Code voorbeelden
In deze sectie leggen we uit hoe u de Analyse Document-API aanroept met de parameter Query's om antwoorden te krijgen op natuurlijke taalvragen over het document. Het invoerdocument heeft een bytearray-indeling of bevindt zich in een Amazon eenvoudige opslagservice (Amazon S3) emmer. U geeft afbeeldingsbytes door aan een Amazon Textract API-bewerking met behulp van de eigenschap Bytes. U kunt bijvoorbeeld de Bytes
eigenschap om een โโdocument door te geven dat is geladen vanuit een lokaal bestandssysteem. Afbeeldingsbytes doorgegeven met behulp van de Bytes
eigenschap moet base64-gecodeerd zijn. Uw code hoeft mogelijk geen documentbestandsbytes te coderen als u een AWS SDK gebruikt om Amazon Textract API-bewerkingen aan te roepen. Als alternatief kunt u afbeeldingen die zijn opgeslagen in een S3-bucket doorgeven aan een Amazon Textract API-bewerking met behulp van de S3Object
eigendom. Documenten die zijn opgeslagen in een S3-bucket hoeven niet gecodeerd te zijn met base64.
U kunt de functie Query's gebruiken om antwoorden te krijgen van verschillende soorten documenten, zoals loonstrookjes, vaccinatiekaarten, hypotheekdocumenten, bankafschriften, W-2-formulieren, 1099-formulieren en andere. In de volgende secties bespreken we enkele van deze documenten en laten we zien hoe de functie Query's werkt.
loonstrookje
In dit voorbeeld doorlopen we de stappen om een โโloonstrook te analyseren met behulp van de functie Query's, zoals weergegeven in de volgende voorbeeldafbeelding.
We gebruiken de volgende voorbeeld-python-code:
De volgende code is een voorbeeld van een AWS CLI-opdracht:
Laten we het antwoord analyseren dat we krijgen voor de twee query's die we in het voorgaande voorbeeld hebben doorgegeven aan de Analyse Document-API. Het volgende antwoord is bijgesneden om alleen de relevante delen weer te geven:
Het antwoord heeft een BlockType
of QUERY
dat toont de vraag die werd gesteld en a Relationships
sectie met de ID voor het blok met het antwoord. Het antwoord staat in de BlockType
of QUERY_RESULT
. De alias die wordt doorgegeven als invoer voor de Analyse Document-API, wordt geretourneerd als onderdeel van het antwoord en kan worden gebruikt om het antwoord te labelen.
We maken gebruik van de Amazon Textract Response-parser om alleen de vragen, de alias en de bijbehorende antwoorden op die vragen te extraheren:
De voorgaande code retourneert de volgende resultaten:
Meer vragen en de volledige code zijn te vinden in het notitieboekje op de GitHub repo.
Hypotheeknota
De Analyse Document Queries API werkt ook goed met hypotheeknota's zoals de volgende.
Het proces om de API aan te roepen en de resultaten te verwerken is hetzelfde als in het vorige voorbeeld. U vindt het volledige codevoorbeeld op de GitHub repo.
De volgende code toont de voorbeeldreacties die zijn verkregen met behulp van de API:
Vaccinatiekaart
De Amazon Textract Queries-functie werkt ook heel goed om informatie te extraheren uit vaccinatiekaarten of kaarten die erop lijken, zoals in het volgende voorbeeld.
Het proces om de API aan te roepen en de resultaten te parseren is hetzelfde als voor een paystub. Nadat we de reactie hebben verwerkt, krijgen we de volgende informatie:
De volledige code is te vinden in het notitieboekje op de GitHub repo.
Verzekeringskaart
De functie Query's werkt ook goed met verzekeringskaarten zoals de volgende.
Het proces om de API aan te roepen en de procesresultaten te verwerken is hetzelfde als eerder getoond. Het volledige codevoorbeeld is beschikbaar in het notitieboek op de GitHub repo.
Hieronder volgen de voorbeeldreacties die zijn verkregen met behulp van de API:
Praktische tips voor het maken van zoekopdrachten
Houd bij het opstellen van uw zoekopdrachten rekening met de volgende praktische tips:
- Stel in het algemeen een natuurlijke taalvraag die begint met 'Wat is', 'Waar is' of 'Wie is'. De uitzondering is wanneer u standaard sleutel-waardeparen probeert te extraheren, in welk geval u de sleutelnaam als een query kunt doorgeven.
- Vermijd slecht geformuleerde of grammaticaal incorrecte vragen, omdat deze tot onverwachte antwoorden kunnen leiden. Een slecht geformuleerde vraag is bijvoorbeeld "Wanneer?" terwijl een goed geformuleerde vraag is: "Wanneer werd de eerste vaccindosis toegediend?"
- Gebruik waar mogelijk woorden uit het document om de query samen te stellen. Hoewel de functie Query's probeert acroniemen en synoniemen te matchen voor een aantal veelvoorkomende termen in de branche, zoals 'SSN', 'belastingnummer' en 'Social Security number', verbetert het gebruik van taal rechtstreeks uit het document de resultaten. Als het document bijvoorbeeld 'taakvoortgang' zegt, probeer dan variaties zoals 'projectvoortgang', 'programmavoortgang' of 'taakstatus' te vermijden.
- Maak een query die woorden uit zowel de rijkoptekst als de kolomkoptekst bevat. Om bijvoorbeeld de datum van de tweede vaccinatie te weten, kunt u in het voorgaande voorbeeld van de vaccinatiekaart de vraag omkaderen als "Op welke datum is de 2e dosis toegediend?"
- Lange antwoorden verhogen de responslatentie en kunnen leiden tot time-outs. Probeer vragen te stellen die antwoorden met antwoorden van minder dan 100 woorden.
- Het doorgeven van alleen de sleutelnaam als vraag werkt wanneer u probeert standaard sleutel-waardeparen uit een formulier te extraheren. We raden aan om volledige vragen te formuleren voor alle andere gebruiksscenario's voor extractie.
- Wees zo specifiek mogelijk. Bijvoorbeeld:
- Als het document meerdere secties bevat (zoals "Borrower" en "Co-Borrower") en beide secties hebben een veld met de naam "SSN", vraag dan "Wat is de SSN voor Lener?" en "Wat is het SSN voor medelener?"
- Als het document meerdere datumgerelateerde velden heeft, wees dan specifiek in de zoektaal en vraag "Wat is de datum waarop het document is ondertekend?" of โWat is de geboortedatum van de aanvraag?โ Vermijd het stellen van dubbelzinnige vragen zoals "Wat is de datum?"
- Als u de lay-out van het document vooraf kent, geeft u locatiehints om de nauwkeurigheid van de resultaten te verbeteren. Vraag bijvoorbeeld "Wat is de datum bovenaan?" of "Wat is de datum aan de linkerkant?" of "Wat is de datum onderaan?"
Voor meer informatie over de functie Query's, raadpleeg de Textract documentatie.
Conclusie
In dit bericht hebben we een overzicht gegeven van de nieuwe Queries-functie van Amazon Textract om snel en eenvoudig informatie op te halen uit documenten zoals loonstrookjes, hypotheeknota's, verzekeringskaarten en vaccinatiekaarten op basis van natuurlijke taalvragen. We hebben ook beschreven hoe u de respons-JSON kunt ontleden.
Voor meer informatie, zie Documenten analyseren , of bekijk de Amazon Textract-console en probeer deze functie uit.
Over de auteurs
Uday Narayanan is Sr. Solutions Architect bij AWS. Hij helpt klanten graag bij het vinden van innovatieve oplossingen voor complexe zakelijke uitdagingen. Zijn belangrijkste aandachtsgebieden zijn data-analyse, big data-systemen en machine learning. In zijn vrije tijd houdt hij van sporten, tv-programma's kijken en reizen.
Rafaรซl Caixeta is een Sr. Solutions Architect bij AWS in Californiรซ. Hij heeft meer dan 10 jaar ervaring met het ontwikkelen van architecturen voor de cloud. Zijn kerngebieden zijn serverless, containers en machine learning. In zijn vrije tijd leest hij graag fictieboeken en reist hij de wereld rond.
Navneeth Nair is Senior Product Manager, Technical bij het Amazon Textract-team. Hij richt zich op het bouwen van op machine learning gebaseerde services voor AWS-klanten.
Martin Schade is een Senior ML Product SA met het Amazon Textract-team. Hij heeft meer dan 20 jaar ervaring met internetgerelateerde technologieรซn, engineering en architectuuroplossingen. Hij kwam in 2014 bij AWS, waar hij eerst enkele van de grootste AWS-klanten begeleidde bij het meest efficiรซnte en schaalbare gebruik van AWS-services, en zich later toelegde op AI/ML met een focus op computervisie. Momenteel is hij geobsedeerd door het extraheren van informatie uit documenten.
- Coinsmart. Europa's beste Bitcoin- en crypto-uitwisseling.
- Platoblockchain. Web3 Metaverse Intelligentie. Kennis versterkt. GRATIS TOEGANG.
- CryptoHawk. Altcoin-radar. Gratis proefversie.
- Bron: https://aws.amazon.com/blogs/machine-learning/specify-and-extract-information-from-documents-using-the-new-queries-feature-in-amazon-textract/
- "
- 000
- 10
- 100
- 20 jaar
- 2022
- Over
- verwerven
- over
- toegediend
- Adoptie
- AI
- Alles
- Hoewel
- Amazone
- bedragen
- analyse
- analytics
- api
- Aanvraag
- April
- automatiseren
- Beschikbaar
- AWS
- Bank
- worden
- Begin
- betekent
- BEST
- 'best practices'
- Big data
- Blok
- Boeken
- grens
- Gebouw
- bedrijfsdeskundigen
- Californiรซ
- Bellen
- Kaarten
- gevallen
- uitdagingen
- chef
- chief executive officer
- Kies
- Plaats
- Cloud
- code
- Kolom
- combinatie van
- Gemeen
- complex
- vertrouwen
- troosten
- containers
- bevat
- Kern
- kon
- Covid-19
- COVID-19 pandemie
- Actueel
- Op dit moment
- gewoonte
- klant
- Klanten
- gegevens
- gegevens Analytics
- beschreven
- het ontwikkelen van
- systemen
- anders
- digitaal
- digitaal
- direct
- bespreken
- documenten
- Nee
- gemakkelijk
- effectief
- doeltreffend
- geeft je de mogelijkheid
- Engineering
- vooral
- voorbeeld
- uitvoerend
- ervaring
- exponentieel
- extracten
- Kenmerk
- Fictie
- Velden
- Figuur
- Voornaam*
- Flexibiliteit
- Focus
- gericht
- volgend
- formulier
- formaat
- formulieren
- gevonden
- FRAME
- vol
- functionaliteit
- Algemeen
- GitHub
- groot
- meer
- hoofd
- het helpen van
- helpt
- Hoge
- Hoe
- How To
- HTTPS
- identificeren
- beeld
- uitvoeren
- impliciete
- verbeteren
- omvatten
- omvat
- Inclusief
- Laat uw omzet
- meer
- -industrie
- informatie
- innovatieve
- invoer
- verzekering
- belang
- IT
- toegetreden
- sleutel
- toetsen
- taal
- Groot
- grootste
- leiden
- leren
- Niveau
- licht
- Lijn
- Lijst
- laden
- lokaal
- plaats
- machine
- machine learning
- groot
- management
- manager
- handmatig
- Fabrikant
- in kaart brengen
- Maart
- matching
- materiaal
- ะทัะตะปะพััั
- medisch
- lid
- ML
- Mobile
- mobiele toestellen
- model
- modellen
- meer
- meest
- meervoudig
- namen
- Naturel
- notitieboekje
- Opmerkingen
- aantal
- verkregen
- bieden
- Aanbod
- Officier
- operatie
- Operations
- bestellen
- organisaties
- Overige
- pandemisch
- Betaal
- betaling
- betalingen
- PC
- platforms
- mogelijk
- krachtige
- Principal
- verwerking
- Product
- produktiviteit
- Producten
- eigendom
- kwaliteit
- vraag
- snel
- lezing
- ontvangen
- adviseren
- Relaties
- relevante
- vereisen
- antwoord
- Resultaten
- Retourneren
- beoordelen
- ROBERT
- Veiligheid
- schaalbare
- Scale
- sdk
- veiligheid
- Serverless
- service
- Diensten
- het instellen van
- aanzienlijke
- Zilver
- Eenvoudig
- website
- smartphones
- oplossing
- Oplossingen
- sommige
- specialist
- Sport
- standaard
- gestart
- starts
- Land
- verklaringen
- Status
- mediaopslag
- Blog
- gestructureerde
- system
- Systems
- team
- Technisch
- Technologies
- de wereld
- Door
- niet de tijd of
- tools
- top
- onderwerpen
- Trainingen
- Reizend
- tv
- us
- .
- gebruikers
- gebruik maken van
- Gebruik makend
- Vaccin
- variรซteit
- visie
- Wat
- Wat is
- WIE
- winnen
- binnen
- zonder
- woorden
- Bedrijven
- wereld
- X
- jaar
- jaar