Καθορίστε και εξάγετε πληροφορίες από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα Queries στο Amazon Textract PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Καθορίστε και εξάγετε πληροφορίες από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα ερωτημάτων στο Amazon Textract

Textract Amazon είναι μια υπηρεσία μηχανικής εκμάθησης (ML) που εξάγει αυτόματα κείμενο, χειρόγραφο και δεδομένα από οποιοδήποτε έγγραφο ή εικόνα. Το Amazon Textract προσφέρει τώρα την ευελιξία για να καθορίσετε τα δεδομένα που χρειάζεστε για να εξαγάγετε από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα Queries στο Analyze Document API. Δεν χρειάζεται να γνωρίζετε τη δομή των δεδομένων στο έγγραφο (πίνακας, φόρμα, υπονοούμενο πεδίο, ένθετα δεδομένα) ή να ανησυχείτε για παραλλαγές μεταξύ εκδόσεων και μορφών εγγράφων.

Σε αυτήν την ανάρτηση, συζητάμε τα ακόλουθα θέματα:

  • Ιστορίες επιτυχίας από πελάτες AWS και οφέλη της νέας λειτουργίας Queries
  • Πώς το API Analyze Document Queries βοηθά στην εξαγωγή πληροφοριών από έγγραφα
  • Μια περιγραφή της κονσόλας Amazon Textract
  • Παραδείγματα κώδικα για τη χρήση του API Analyze Document Queries
  • Πώς να επεξεργαστείτε την απόκριση με τη βιβλιοθήκη ανάλυσης κειμένου Amazon

Πλεονεκτήματα της νέας δυνατότητας Queries

Οι παραδοσιακές λύσεις OCR δυσκολεύονται να εξαγάγουν δεδομένα με ακρίβεια από τα περισσότερα ημιδομημένα και αδόμητα έγγραφα λόγω σημαντικών παραλλαγών στον τρόπο με τον οποίο τα δεδομένα παρουσιάζονται σε πολλές εκδόσεις και μορφές αυτών των εγγράφων. Πρέπει να εφαρμόσετε προσαρμοσμένο κώδικα μεταεπεξεργασίας ή να ελέγξετε με μη αυτόματο τρόπο τις εξαγόμενες πληροφορίες από αυτά τα έγγραφα. Με τη λειτουργία Ερωτήματα, μπορείτε να καθορίσετε τις πληροφορίες που χρειάζεστε με τη μορφή ερωτήσεων φυσικής γλώσσας (για παράδειγμα, "Ποιο είναι το όνομα πελάτη") και να λάβετε τις ακριβείς πληροφορίες ("John Doe") ως μέρος της απάντησης API. Η δυνατότητα χρησιμοποιεί έναν συνδυασμό οπτικών, χωρικών και γλωσσικών μοντέλων για την εξαγωγή των πληροφοριών που αναζητάτε με υψηλή ακρίβεια. Η δυνατότητα Ερωτήματα είναι προεκπαιδευμένη σε μια μεγάλη ποικιλία ημιδομημένων και μη δομημένων εγγράφων. Μερικά παραδείγματα περιλαμβάνουν αποδείξεις πληρωμής, αντίγραφα κίνησης τραπεζικών κινήσεων, W-2, φόρμες αίτησης δανείου, σημειώσεις υποθήκης και κάρτες εμβολίων και ασφάλισης.

"Το Amazon Textract μας δίνει τη δυνατότητα να αυτοματοποιούμε τις ανάγκες επεξεργασίας εγγράφων των πελατών μας. Με τη λειτουργία Queries, θα μπορούμε να εξάγουμε δεδομένα από μια ποικιλία εγγράφων με ακόμη μεγαλύτερη ευελιξία και ακρίβεια," δήλωσε ο Robert Jansen, Διευθύνων Σύμβουλος της TekStream Solutions. »Θεωρούμε ότι αυτό είναι μια μεγάλη νίκη παραγωγικότητας για τους επιχειρηματικούς πελάτες μας, οι οποίοι θα μπορούν να χρησιμοποιούν τη δυνατότητα Queries ως μέρος της λύσης IDP μας για να λάβουν γρήγορα βασικές πληροφορίες από τα έγγραφά τους."

"Το Amazon Textract μας δίνει τη δυνατότητα να εξάγουμε κείμενο καθώς και δομημένα στοιχεία όπως Φόρμες και Πίνακες από εικόνες με υψηλή ακρίβεια. Το Amazon Textract Queries μας βοήθησε να βελτιώσουμε δραστικά την ποιότητα της εξαγωγής πληροφοριών από διάφορα έγγραφα κρίσιμα για τις επιχειρήσεις, όπως φύλλα δεδομένων ασφαλείας ή προδιαγραφές υλικού" είπε ο Thorsten Warnecke, Principal | Επικεφαλής του PC Analytics, Camelot Management Consultants. »Το σύστημα ερωτημάτων φυσικής γλώσσας προσφέρει μεγάλη ευελιξία και ακρίβεια, γεγονός που μείωσε το φορτίο μετά την επεξεργασία και μας επέτρεψε να προσθέτουμε νέα έγγραφα στα εργαλεία εξαγωγής δεδομένων μας πιο γρήγορα."

Πώς το API Analyze Document Queries βοηθά στην εξαγωγή πληροφοριών από έγγραφα

Οι εταιρείες έχουν αυξήσει την υιοθέτηση ψηφιακών πλατφορμών, ειδικά υπό το φως της πανδημίας COVID-19. Οι περισσότεροι οργανισμοί προσφέρουν πλέον έναν ψηφιακό τρόπο απόκτησης των υπηρεσιών και των προϊόντων τους χρησιμοποιώντας smartphone και άλλες κινητές συσκευές, γεγονός που προσφέρει ευελιξία στους χρήστες αλλά αυξάνει επίσης την κλίμακα στην οποία τα ψηφιακά έγγραφα πρέπει να αναθεωρηθούν, να επεξεργαστούν και να αναλυθούν. Σε ορισμένους φόρτους εργασίας όπου, για παράδειγμα, τα έγγραφα υποθήκης, οι κάρτες εμβολιασμού, τα στελέχη πληρωμών, οι κάρτες ασφάλισης και άλλα έγγραφα πρέπει να αναλυθούν ψηφιακά, η πολυπλοκότητα της εξαγωγής δεδομένων μπορεί να επιδεινωθεί εκθετικά επειδή αυτά τα έγγραφα δεν έχουν τυπική μορφή ή έχουν σημαντικές διαφορές στη μορφή δεδομένων σε διαφορετικές εκδόσεις του εγγράφου.

Ακόμη και ισχυρές λύσεις OCR δυσκολεύονται να εξαγάγουν δεδομένα με ακρίβεια από αυτά τα έγγραφα και ίσως χρειαστεί να εφαρμόσετε προσαρμοσμένη μεταεπεξεργασία για αυτά τα έγγραφα. Αυτό περιλαμβάνει την αντιστοίχιση πιθανών παραλλαγών των κλειδιών φόρμας σε ονόματα πεδίων εγγενών πελατών ή τη συμπερίληψη προσαρμοσμένης μηχανικής εκμάθησης για τον προσδιορισμό συγκεκριμένων πληροφοριών σε ένα μη δομημένο έγγραφο.

Το νέο Analyze Document Queries API στο Amazon Textract μπορεί να απαντήσει σε γραπτές ερωτήσεις φυσικής γλώσσας όπως "Ποιο είναι το επιτόκιο;" και πραγματοποιήστε ισχυρή ανάλυση AI και ML στο έγγραφο για να καταλάβετε τις επιθυμητές πληροφορίες και να τις εξαγάγετε από το έγγραφο χωρίς καμία μεταεπεξεργασία. Η λειτουργία Ερωτήματα δεν απαιτεί εκπαίδευση προσαρμοσμένου μοντέλου ή ρύθμιση προτύπων ή διαμορφώσεων. Μπορείτε να ξεκινήσετε γρήγορα ανεβάζοντας τα έγγραφά σας και προσδιορίζοντας ερωτήσεις σχετικά με αυτά τα έγγραφα μέσω της κονσόλας Amazon Textract, της Διεπαφή γραμμής εντολών AWS (AWS CLI) ή AWS SDK.

Σε επόμενες ενότητες αυτής της ανάρτησης, παρουσιάζουμε λεπτομερή παραδείγματα για το πώς να χρησιμοποιήσετε αυτήν τη νέα λειτουργικότητα σε συνήθεις περιπτώσεις χρήσης φόρτου εργασίας και πώς να χρησιμοποιήσετε το API Analyze Document Queries για να προσθέσετε ευελιξία στη διαδικασία ψηφιοποίησης του φόρτου εργασίας σας.

Χρησιμοποιήστε τη δυνατότητα ερωτημάτων στην κονσόλα Amazon Textract

Πριν ξεκινήσουμε με το API και τα δείγματα κώδικα, ας εξετάσουμε την κονσόλα Amazon Textract. Η παρακάτω εικόνα δείχνει ένα παράδειγμα κάρτας εμβολιασμού στο Ερωτήματα καρτέλα για το API Analyze Document στην κονσόλα Amazon Textract. Αφού ανεβάσετε το έγγραφο στην κονσόλα Amazon Textract, επιλέξτε Ερωτήματα στο Διαμόρφωση εγγράφου Ενότητα. Στη συνέχεια, μπορείτε να προσθέσετε ερωτήματα με τη μορφή ερωτήσεων φυσικής γλώσσας. Αφού προσθέσετε όλα τα ερωτήματά σας, επιλέξτε Εφαρμογή διαμόρφωσης. Οι απαντήσεις στις ερωτήσεις βρίσκονται στο Ερωτήματα Tab.

Καθορίστε και εξάγετε πληροφορίες από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα Queries στο Amazon Textract PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Παραδείγματα κώδικα

Σε αυτήν την ενότητα, εξηγούμε πώς να καλέσετε το API Analyze Document με την παράμετρο Queries για να λάβετε απαντήσεις σε ερωτήσεις φυσικής γλώσσας σχετικά με το έγγραφο. Το έγγραφο εισόδου είναι είτε σε μορφή πίνακα byte είτε βρίσκεται σε ένα Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3) κάδος. Μεταβιβάζετε byte εικόνας σε μια λειτουργία API κειμένου Amazon χρησιμοποιώντας την ιδιότητα Bytes. Για παράδειγμα, μπορείτε να χρησιμοποιήσετε το Bytes ιδιότητα να μεταβιβάσει ένα έγγραφο που έχει φορτωθεί από ένα τοπικό σύστημα αρχείων. Τα byte εικόνας περνούν χρησιμοποιώντας το Bytes Η ιδιότητα πρέπει να έχει κωδικοποίηση base64. Ο κώδικάς σας μπορεί να μην χρειάζεται να κωδικοποιεί byte αρχείων εγγράφων, εάν χρησιμοποιείτε ένα AWS SDK για να καλέσετε λειτουργίες API του Amazon Textract. Εναλλακτικά, μπορείτε να μεταβιβάσετε εικόνες που είναι αποθηκευμένες σε έναν κάδο S3 σε μια λειτουργία Amazon Textract API χρησιμοποιώντας το S3Object ιδιοκτησία. Τα έγγραφα που είναι αποθηκευμένα σε κάδο S3 δεν χρειάζεται να είναι κωδικοποιημένα με βάση το 64.

Μπορείτε να χρησιμοποιήσετε τη λειτουργία Ερωτήματα για να λάβετε απαντήσεις από διαφορετικούς τύπους εγγράφων, όπως αποδείξεις πληρωμής, κάρτες εμβολιασμού, έγγραφα υποθηκών, τραπεζικές κινήσεις, φόρμες W-2, φόρμες 1099 και άλλα. Στις επόμενες ενότητες, εξετάζουμε ορισμένα από αυτά τα έγγραφα και δείχνουμε πώς λειτουργεί η δυνατότητα Ερωτήματα.

Απόκομμα μισθοδοσίας

Σε αυτό το παράδειγμα, ακολουθούμε τα βήματα για να αναλύσουμε ένα στέλεχος πληρωμής χρησιμοποιώντας τη δυνατότητα Ερωτήματα, όπως φαίνεται στο παρακάτω παράδειγμα εικόνας.

Καθορίστε και εξάγετε πληροφορίες από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα Queries στο Amazon Textract PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Χρησιμοποιούμε το ακόλουθο δείγμα κώδικα Python:

import boto3
import json #create a Textract Client
textract = boto3.client('textract') image_filename = "paystub.jpg" response = None
with open(image_filename, 'rb') as document: imageBytes = bytearray(document.read()) # Call Textract AnalyzeDocument by passing a document from local disk
response = textract.analyze_document( Document={'Bytes': imageBytes}, FeatureTypes=["QUERIES"], QueriesConfig={ "Queries": [{ "Text": "What is the year to date gross pay", "Alias": "PAYSTUB_YTD_GROSS" }, { "Text": "What is the current gross pay?", "Alias": "PAYSTUB_CURRENT_GROSS" }] })

Ο παρακάτω κώδικας είναι ένα δείγμα εντολής AWS CLI:

aws textract analyze-document —document '{"S3Object":{"Bucket":"your-s3-bucket","Name":"paystub.jpg"}}' —feature-types '["QUERIES"]' —queries-config '{"Queries":[{"Text":"What is the year to date gross pay", "Alias": "PAYSTUB_YTD_GROSS"}]}' 

Ας αναλύσουμε την απάντηση που λαμβάνουμε για τα δύο ερωτήματα που περάσαμε στο Analyze Document API στο προηγούμενο παράδειγμα. Η ακόλουθη απάντηση έχει περικοπεί για να εμφανίζει μόνο τα σχετικά μέρη:

{ "BlockType":"QUERY", "Id":"cbbba2fa-45be-452b-895b-adda98053153", #id of first QUERY "Relationships":[ { "Type":"ANSWER", "Ids":[ "f2db310c-eaa6-481d-8d18-db0785c33d38" #id of first QUERY_RESULT ] } ], "Query":{ "Text":"What is the year to date gross pay", #First Query "Alias":"PAYSTUB_YTD_GROSS" } }, { "BlockType":"QUERY_RESULT", "Confidence":87.0, "Text":"23,526.80", #Answer to the first Query "Geometry":{...}, "Id":"f2db310c-eaa6-481d-8d18-db0785c33d38" #id of first QUERY_RESULT }, { "BlockType":"QUERY", "Id":"4e2a17f0-154f-4847-954c-7c2bf2670c52", #id of second QUERY "Relationships":[ { "Type":"ANSWER", "Ids":[ "350ab92c-4128-4aab-a78a-f1c6f6718959"#id of second QUERY_RESULT ] } ], "Query":{ "Text":"What is the current gross pay?", #Second Query "Alias":"PAYSTUB_CURRENT_GROSS" } }, { "BlockType":"QUERY_RESULT", "Confidence":95.0, "Text":"$ 452.43", #Answer to the Second Query "Geometry":{...}, "Id":"350ab92c-4128-4aab-a78a-f1c6f6718959" #id of second QUERY_RESULT }

Η απάντηση έχει α BlockType of QUERY που δείχνει την ερώτηση που τέθηκε και α Relationships ενότητα που έχει το αναγνωριστικό για το μπλοκ που έχει την απάντηση. Η απάντηση βρίσκεται στο BlockType of QUERY_RESULT. Το ψευδώνυμο που μεταβιβάζεται ως είσοδος στο Analyze Document API επιστρέφεται ως μέρος της απόκρισης και μπορεί να χρησιμοποιηθεί για την επισήμανση της απάντησης.

Χρησιμοποιούμε το Αναλυτής απόκρισης Textract Amazon για να εξαγάγετε μόνο τις ερωτήσεις, το ψευδώνυμο και τις αντίστοιχες απαντήσεις σε αυτές τις ερωτήσεις:

import trp.trp2 as t2 d = t2.TDocumentSchema().load(response)
page = d.pages[0] # get_query_answers returns a list of [query, alias, answer]
query_answers = d.get_query_answers(page=page)
for x in query_answers: print(f"{image_filename},{x[1]},{x[2]}") from tabulate import tabulate
print(tabulate(query_answers, tablefmt="github"))

Ο προηγούμενος κώδικας επιστρέφει τα ακόλουθα αποτελέσματα:

|------------------------------------|-----------------------|-----------|
| What is the current gross pay? | PAYSTUB_CURRENT_GROSS | $ 452.43 |
| What is the year to date gross pay | PAYSTUB_YTD_GROSS | 23,526.80 |

Περισσότερες ερωτήσεις και τον πλήρη κωδικό μπορείτε να βρείτε στο σημειωματάριο στο GitHub repo.

Στεγαστικό σημείωμα

Το API Analyze Document Queries λειτουργεί επίσης καλά με σημειώσεις υποθήκης όπως το παρακάτω.

Καθορίστε και εξάγετε πληροφορίες από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα Queries στο Amazon Textract PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η διαδικασία κλήσης του API και των αποτελεσμάτων διεργασίας είναι η ίδια με το προηγούμενο παράδειγμα. Μπορείτε να βρείτε το πλήρες παράδειγμα κώδικα στο GitHub repo.

Ο ακόλουθος κώδικας δείχνει τα παραδείγματα απαντήσεων που ελήφθησαν χρησιμοποιώντας το API:

|------------------------------------------------------------|----------------------------------|---------------|
| When is this document dated? | MORTGAGE_NOTE_DOCUMENT_DATE | March 4, 2022 |
| What is the note date? | MORTGAGE_NOTE_DATE | March 4, 2022 |
| When is the Maturity date the borrower has to pay in full? | MORTGAGE_NOTE_MATURITY_DATE | April, 2032 |
| What is the note city and state? | MORTGAGE_NOTE_CITY_STATE | Anytown, ZZ |
| what is the yearly interest rate? | MORTGAGE_NOTE_YEARLY_INTEREST | 4.150% |
| Who is the lender? | MORTGAGE_NOTE_LENDER | AnyCompany |
| When does payments begin? | MORTGAGE_NOTE_BEGIN_PAYMENTS | April, 2022 |
| What is the beginning date of payment? | MORTGAGE_NOTE_BEGIN_DATE_PAYMENT | April, 2022 |
| What is the initial monthly payments? | MORTGAGE_NOTE_MONTHLY_PAYMENTS | $ 2500 |
| What is the interest rate? | MORTGAGE_NOTE_INTEREST_RATE | 4.150% |
| What is the principal amount borrower has to pay? | MORTGAGE_NOTE_PRINCIPAL_PAYMENT | $ 500,000 |

Κάρτα εμβολιασμού

Η λειτουργία Amazon Textract Queries λειτουργεί επίσης πολύ καλά για την εξαγωγή πληροφοριών από κάρτες εμβολιασμού ή κάρτες που μοιάζουν με αυτήν, όπως στο παρακάτω παράδειγμα.

Καθορίστε και εξάγετε πληροφορίες από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα Queries στο Amazon Textract PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η διαδικασία για να καλέσετε το API και να αναλύσετε τα αποτελέσματα είναι η ίδια που χρησιμοποιείται για ένα paystub. Αφού επεξεργαστούμε την απάντηση, λαμβάνουμε τις ακόλουθες πληροφορίες:

|------------------------------------------------------------|--------------------------------------|--------------|
| What is the patients first name | PATIENT_FIRST_NAME | Major |
| What is the patients last name | PATIENT_LAST_NAME | Mary |
| Which clinic site was the 1st dose COVID-19 administrated? | VACCINATION_FIRST_DOSE_CLINIC_SITE | XYZ |
| Who is the manufacturer for 1st dose of COVID-19? | VACCINATION_FIRST_DOSE_MANUFACTURER | Pfizer |
| What is the date for the 2nd dose covid-19? | VACCINATION_SECOND_DOSE_DATE | 2/8/2021 |
| What is the patient number | PATIENT_NUMBER | 012345abcd67 |
| Who is the manufacturer for 2nd dose of COVID-19? | VACCINATION_SECOND_DOSE_MANUFACTURER | Pfizer |
| Which clinic site was the 2nd dose covid-19 administrated? | VACCINATION_SECOND_DOSE_CLINIC_SITE | CVS |
| What is the lot number for 2nd dose covid-19? | VACCINATION_SECOND_DOSE_LOT_NUMBER | BB5678 |
| What is the date for the 1st dose covid-19? | VACCINATION_FIRST_DOSE_DATE | 1/18/21 |
| What is the lot number for 1st dose covid-19? | VACCINATION_FIRST_DOSE_LOT_NUMBER | AA1234 |
| What is the MI? | MIDDLE_INITIAL | M |

Ο πλήρης κωδικός βρίσκεται στο σημειωματάριο στο GitHub repo.

Κάρτα ασφάλισης

Η δυνατότητα ερωτημάτων λειτουργεί επίσης καλά με κάρτες ασφάλισης όπως οι παρακάτω.

Καθορίστε και εξάγετε πληροφορίες από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα Queries στο Amazon Textract PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η διαδικασία για την κλήση του API και των αποτελεσμάτων διεργασίας είναι η ίδια που παρουσιάστηκε προηγουμένως. Το πλήρες παράδειγμα κώδικα είναι διαθέσιμο στο σημειωματάριο στο GitHub repo.

Ακολουθούν τα παραδείγματα απαντήσεων που ελήφθησαν χρησιμοποιώντας το API:

|-------------------------------------|-----------------------------------|---------------|
| What is the insured name? | INSURANCE_CARD_NAME | Jacob Michael |
| What is the level of benefits? | INSURANCE_CARD_LEVEL_BENEFITS | SILVER |
| What is medical insurance provider? | INSURANCE_CARD_PROVIDER | Anthem |
| What is the OOP max? | INSURANCE_CARD_OOP_MAX | $6000/$12000 |
| What is the effective date? | INSURANCE_CARD_EFFECTIVE_DATE | 11/02/2021 |
| What is the office visit copay? | INSURANCE_CARD_OFFICE_VISIT_COPAY | $55/0% |
| What is the specialist visit copay? | INSURANCE_CARD_SPEC_VISIT_COPAY | $65/0% |
| What is the member id? | INSURANCE_CARD_MEMBER_ID | XZ 9147589652 |
| What is the plan type? | INSURANCE_CARD_PLAN_TYPE | Pathway X-EPO |
| What is the coinsurance amount? | INSURANCE_CARD_COINSURANCE | 30% |

Βέλτιστες πρακτικές για τη δημιουργία ερωτημάτων

Όταν δημιουργείτε τα ερωτήματά σας, λάβετε υπόψη τις ακόλουθες βέλτιστες πρακτικές:

  • Γενικά, κάντε μια ερώτηση φυσικής γλώσσας που ξεκινά με «Τι είναι», «Πού είναι» ή «Ποιος είναι». Η εξαίρεση είναι όταν προσπαθείτε να εξαγάγετε τυπικά ζεύγη κλειδιών-τιμών, οπότε μπορείτε να μεταβιβάσετε το όνομα κλειδιού ως ερώτημα.
  • Αποφύγετε λανθασμένες ή γραμματικά λανθασμένες ερωτήσεις, γιατί αυτές θα μπορούσαν να οδηγήσουν σε απροσδόκητες απαντήσεις. Για παράδειγμα, ένα ερώτημα που δεν έχει σχηματιστεί σωστά είναι "When?" ενώ ένα καλά διαμορφωμένο ερώτημα είναι "Πότε χορηγήθηκε η πρώτη δόση εμβολίου;"
  • Όπου είναι δυνατόν, χρησιμοποιήστε λέξεις από το έγγραφο για να δημιουργήσετε το ερώτημα. Αν και η δυνατότητα Ερωτήματα προσπαθεί να κάνει αντιστοίχιση ακρωνύμιου και συνωνύμου για ορισμένους κοινούς όρους του κλάδου, όπως "SSN", "ΑΦΜ" και "Αριθμός κοινωνικής ασφάλισης", η χρήση γλώσσας απευθείας από το έγγραφο βελτιώνει τα αποτελέσματα. Για παράδειγμα, εάν το έγγραφο αναφέρει "πρόοδος εργασίας", προσπαθήστε να αποφύγετε τη χρήση παραλλαγών όπως "πρόοδος έργου", "πρόοδος προγράμματος" ή "κατάσταση εργασίας".
  • Κατασκευάστε ένα ερώτημα που περιέχει λέξεις τόσο από την κεφαλίδα γραμμής όσο και από την κεφαλίδα στήλης. Για παράδειγμα, στο προηγούμενο παράδειγμα της κάρτας εμβολιασμού, για να γνωρίζετε την ημερομηνία του δεύτερου εμβολιασμού, μπορείτε να διαμορφώσετε το ερώτημα ως "Ποια ημερομηνία χορηγήθηκε η 2η δόση;"
  • Οι μεγάλες απαντήσεις αυξάνουν τον λανθάνοντα χρόνο απόκρισης και μπορεί να οδηγήσουν σε χρονικά όρια. Προσπαθήστε να κάνετε ερωτήσεις που απαντούν με απαντήσεις λιγότερες από 100 λέξεις.
  • Η μετάδοση μόνο του ονόματος κλειδιού ως ερώτηση λειτουργεί όταν προσπαθείτε να εξαγάγετε τυπικά ζεύγη κλειδιού-τιμής από μια φόρμα. Συνιστούμε να διαμορφώσετε πλήρεις ερωτήσεις για όλες τις άλλες περιπτώσεις χρήσης εξαγωγής.
  • Να είστε όσο πιο συγκεκριμένοι γίνεται. Για παράδειγμα:
    • Όταν το έγγραφο περιέχει πολλές ενότητες (όπως "Δανειολήπτης" και "Συνδανειζόμενος") και και οι δύο ενότητες έχουν ένα πεδίο που ονομάζεται "SSN", ρωτήστε "Τι είναι το SSN για τον Δανειολήπτη;" και "Τι είναι το SSN για Συν-Δανειολήπτη;"
    • Όταν το έγγραφο έχει πολλά πεδία που σχετίζονται με την ημερομηνία, να είστε συγκεκριμένοι στη γλώσσα ερωτήματος και να ρωτήσετε "Ποια είναι η ημερομηνία υπογραφής του εγγράφου;" ή "Ποια είναι η ημερομηνία γέννησης της αίτησης;" Αποφύγετε να κάνετε διφορούμενες ερωτήσεις όπως "Ποια είναι η ημερομηνία;"
  • Εάν γνωρίζετε εκ των προτέρων τη διάταξη του εγγράφου, δώστε συμβουλές τοποθεσίας για να βελτιώσετε την ακρίβεια των αποτελεσμάτων. Για παράδειγμα, ρωτήστε "Ποια είναι η ημερομηνία στην κορυφή;" ή "Ποια είναι η ημερομηνία στα αριστερά;" ή "Ποια είναι η ημερομηνία στο κάτω μέρος;"

Για περισσότερες πληροφορίες σχετικά με τη δυνατότητα ερωτημάτων, ανατρέξτε στο Κείμενο τεκμηρίωση.

Συμπέρασμα

Σε αυτήν την ανάρτηση, παρείχαμε μια επισκόπηση της νέας δυνατότητας Queries του Amazon Textract για γρήγορη και εύκολη ανάκτηση πληροφοριών από έγγραφα όπως αποδείξεις πληρωμής, σημειώσεις υποθήκης, ασφαλιστικές κάρτες και κάρτες εμβολιασμού με βάση ερωτήσεις φυσικής γλώσσας. Περιγράψαμε επίσης πώς μπορείτε να αναλύσετε την απάντηση JSON.

Για περισσότερες πληροφορίες, δείτε Ανάλυση Εγγράφων , ή ρίξτε μια ματιά στην κονσόλα Amazon Textract και δοκιμάστε αυτήν τη δυνατότητα.


Σχετικά με τους Συγγραφείς

Καθορίστε και εξάγετε πληροφορίες από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα Queries στο Amazon Textract PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Uday Narayanan είναι Sr. Solutions Architect στο AWS. Του αρέσει να βοηθά τους πελάτες να βρίσκουν καινοτόμες λύσεις σε πολύπλοκες επιχειρηματικές προκλήσεις. Οι βασικοί τομείς εστίασής του είναι η ανάλυση δεδομένων, τα συστήματα μεγάλων δεδομένων και η μηχανική μάθηση. Στον ελεύθερο χρόνο του, του αρέσει να παίζει αθλήματα, να παρακολουθεί τηλεοπτικές εκπομπές και να ταξιδεύει.

Καθορίστε και εξάγετε πληροφορίες από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα Queries στο Amazon Textract PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Rafael Caixeta είναι αρχιτέκτονας Sr. Solutions στην AWS με έδρα την Καλιφόρνια. Έχει πάνω από 10 χρόνια εμπειρίας στην ανάπτυξη αρχιτεκτονικών για το cloud. Οι βασικοί του τομείς είναι χωρίς διακομιστές, κοντέινερ και μηχανική μάθηση. Στον ελεύθερο χρόνο του, του αρέσει να διαβάζει βιβλία μυθοπλασίας και να ταξιδεύει σε όλο τον κόσμο.

Καθορίστε και εξάγετε πληροφορίες από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα Queries στο Amazon Textract PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται. Navneeth Nair είναι Ανώτερος Διευθυντής Προϊόντων, Τεχνικός με την ομάδα του Amazon Textract. Επικεντρώνεται στη δημιουργία υπηρεσιών μηχανικής μάθησης για πελάτες AWS.

Καθορίστε και εξάγετε πληροφορίες από έγγραφα χρησιμοποιώντας τη νέα δυνατότητα Queries στο Amazon Textract PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Μάρτιν Σάντ είναι Senior ML Product SA με την ομάδα Amazon Textract. Έχει πάνω από 20 χρόνια εμπειρίας σε τεχνολογίες που σχετίζονται με το Διαδίκτυο, μηχανικές και αρχιτεκτονικές λύσεις. Εντάχθηκε στην AWS το 2014, καθοδηγώντας αρχικά μερικούς από τους μεγαλύτερους πελάτες AWS στην πιο αποτελεσματική και κλιμακούμενη χρήση των υπηρεσιών AWS, και αργότερα επικεντρώθηκε στην AI/ML με έμφαση στην όραση υπολογιστών. Επί του παρόντος, έχει εμμονή με την εξαγωγή πληροφοριών από έγγραφα.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS