Ευφυής Επεξεργασία Εγγράφων με Υπηρεσίες AWS AI: Μέρος 2

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Η έξυπνη επεξεργασία εγγράφων (IDP) της Amazon σάς βοηθά να επιταχύνετε τους κύκλους επιχειρηματικών αποφάσεων και να μειώσετε το κόστος. Σε πολλούς κλάδους, οι πελάτες πρέπει να επεξεργάζονται εκατομμύρια έγγραφα ετησίως κατά τη διάρκεια της επιχείρησής τους. Για πελάτες που επεξεργάζονται εκατομμύρια έγγραφα, αυτή είναι μια κρίσιμη πτυχή για την εμπειρία του τελικού χρήστη και μια κορυφαία προτεραιότητα ψηφιακού μετασχηματισμού. Λόγω των ποικίλων μορφών, οι περισσότερες εταιρείες επεξεργάζονται με μη αυτόματο τρόπο έγγραφα όπως W2, αξιώσεις, έγγραφα ταυτότητας, τιμολόγια και νομικές συμβάσεις ή χρησιμοποιούν παλαιού τύπου λύσεις OCR (οπτική αναγνώριση χαρακτήρων) που είναι χρονοβόρες, επιρρεπείς σε σφάλματα και δαπανηρές. Ένας αγωγός IDP με υπηρεσίες AWS AI σάς δίνει τη δυνατότητα να υπερβείτε το OCR με πιο ακριβή και ευέλικτη εξαγωγή πληροφοριών, να επεξεργάζεστε έγγραφα πιο γρήγορα, να εξοικονομείτε χρήματα και να μετατοπίζετε πόρους σε εργασίες υψηλότερης αξίας.

Σε αυτήν τη σειρά, δίνουμε μια επισκόπηση του αγωγού IDP για να μειώσουμε τον χρόνο και την προσπάθεια που απαιτείται για την απορρόφηση ενός εγγράφου και τη λήψη των βασικών πληροφοριών στα κατάντη συστήματα. Το παρακάτω σχήμα δείχνει τα στάδια που αποτελούν συνήθως μέρος μιας ροής εργασίας IDP.

Σε αυτήν τη σειρά δύο μερών, συζητάμε πώς μπορείτε να αυτοματοποιήσετε και να επεξεργάζεστε έξυπνα έγγραφα σε κλίμακα χρησιμοποιώντας υπηρεσίες AWS AI. Σε μέρος 1, συζητήσαμε τις τρεις πρώτες φάσεις της ροής εργασιών IDP. Σε αυτήν την ανάρτηση, συζητάμε τις υπόλοιπες φάσεις ροής εργασίας.

Επισκόπηση λύσεων

Η ακόλουθη αρχιτεκτονική αναφοράς δείχνει πώς μπορείτε να χρησιμοποιήσετε υπηρεσίες AWS AI όπως Textract Amazon και Κατανοήστε το Amazon, μαζί με άλλες υπηρεσίες AWS για την υλοποίηση της ροής εργασιών IDP. Στο μέρος 1, περιγράψαμε τα στάδια συλλογής δεδομένων και ταξινόμησης εγγράφων, όπου κατηγοριοποιήσαμε και επισημάναμε έγγραφα όπως αντίγραφα κίνησης τραπεζικών κινήσεων, τιμολόγια και έγγραφα αποδείξεων. Συζητήσαμε επίσης το στάδιο εξαγωγής, όπου μπορείτε να εξαγάγετε σημαντικές επιχειρηματικές πληροφορίες από τα έγγραφά σας. Σε αυτήν την ανάρτηση, επεκτείνουμε τον αγωγό IDP εξετάζοντας τις προεπιλεγμένες και προσαρμοσμένες οντότητες του Amazon Comprehend στη φάση εξαγωγής, πραγματοποιούμε εμπλουτισμό εγγράφων και επίσης εξετάζουμε εν συντομία τις δυνατότητες του Amazon Augmented AI (Amazon A2I) για τη συμπερίληψη ανθρώπινου δυναμικού ελέγχου στο στάδιο της αναθεώρησης και της επικύρωσης.

Χρησιμοποιούμε επίσης Amazon Comprehend Medical ως μέρος αυτής της λύσης, η οποία είναι μια υπηρεσία εξαγωγής πληροφοριών από μη δομημένο ιατρικό κείμενο με ακρίβεια και ταχύτητα και αναγνώριση σχέσεων μεταξύ εξαγόμενων πληροφοριών υγείας και σύνδεση με ιατρικές οντολογίες όπως το ICD-10-CM, το RxNorm και το SNOMED CT.

Το Amazon A2I είναι μια υπηρεσία μηχανικής μάθησης (ML) που διευκολύνει τη δημιουργία των ροών εργασίας που απαιτούνται για την ανθρώπινη αναθεώρηση. Το Amazon A2I φέρνει την ανθρώπινη κριτική σε όλους τους προγραμματιστές, καταργώντας την αδιαφοροποίητη βαρύτητα που σχετίζεται με την κατασκευή συστημάτων ανθρώπινης αξιολόγησης ή με τη διαχείριση μεγάλου αριθμού ανθρώπινων αναθεωρητών είτε εκτελείται σε AWS είτε όχι. Το Amazon A2I ενσωματώνεται με Textract Amazon και Κατανοήστε το Amazon για να σας παρέχει τη δυνατότητα να εισάγετε βήματα ανθρώπινης αναθεώρησης στη ροή εργασιών IDP σας.

Προϋποθέσεις

Πριν ξεκινήσετε, ανατρέξτε στο μέρος 1 για μια επισκόπηση υψηλού επιπέδου του IDP και λεπτομέρειες σχετικά με τα στάδια συλλογής, ταξινόμησης και εξαγωγής δεδομένων.

Φάση εκχύλισης

Στο μέρος 1 αυτής της σειράς, συζητήσαμε πώς μπορούμε να χρησιμοποιήσουμε τις λειτουργίες Amazon Textract για ακριβή εξαγωγή δεδομένων για κάθε τύπο εγγράφων. Για να επεκτείνουμε αυτή τη φάση, χρησιμοποιούμε προεκπαιδευμένες οντότητες Amazon Comprehend και προσαρμοσμένο αναγνωριστικό οντοτήτων Amazon Comprehend για περαιτέρω εξαγωγή εγγράφων. Ο σκοπός του αναγνωριστικού προσαρμοσμένης οντότητας είναι να εντοπίσει συγκεκριμένες οντότητες και να δημιουργήσει προσαρμοσμένα μεταδεδομένα σχετικά με τα έγγραφά μας σε μορφή CSV ή αναγνώσιμη από τον άνθρωπο, τα οποία θα αναλυθούν αργότερα από τους επιχειρηματικούς χρήστες.

Αναγνωρισμένη οντότητα

Η αναγνώριση επώνυμης οντότητας (NER) είναι μια δευτερεύουσα εργασία επεξεργασίας φυσικής γλώσσας (NLP) που περιλαμβάνει την εξέταση δεδομένων κειμένου για τον εντοπισμό ονομαστικών φράσεων, που ονομάζονται ονομαστικές οντότητες, και την κατηγοριοποίηση καθεμίας με μια ετικέτα, όπως επωνυμία, ημερομηνία, εκδήλωση, τοποθεσία, οργανισμούς , πρόσωπο, ποσότητα ή τίτλος. Για παράδειγμα, στη δήλωση "Έγινα πρόσφατα συνδρομητής στο Amazon Prime", το Amazon Prime είναι η ονομαζόμενη οντότητα και μπορεί να κατηγοριοποιηθεί ως επωνυμία.

Το Amazon Comprehend σάς δίνει τη δυνατότητα να εντοπίσετε τέτοιες προσαρμοσμένες οντότητες στο έγγραφό σας. Κάθε οντότητα έχει επίσης μια βαθμολογία επιπέδου εμπιστοσύνης που επιστρέφει το Amazon Comprehend για κάθε τύπο οντότητας. Το παρακάτω διάγραμμα απεικονίζει τη διαδικασία αναγνώρισης οντοτήτων.

Αναγνώριση επώνυμης οντότητας με το Amazon Comprehend

Για να λάβουμε οντότητες από το έγγραφο κειμένου, καλούμε το comprehend.detect_entities() μέθοδο και διαμορφώστε τον κώδικα γλώσσας και το κείμενο ως παραμέτρους εισαγωγής:

def get_entities(text):
    try:
        #detect entities
        entities = comprehend.detect_entities(LanguageCode="en", Text=text)  
        df = pd.DataFrame(entities["Entities"], columns = ['Text', 'Type'])
        display(HTML(df.to_html(index=False)))
    except Exception as e:
        print(e)

Τρέχουμε το get_entities() μέθοδο στο τραπεζικό παραστατικό και λάβετε τη λίστα οντοτήτων στα αποτελέσματα.

Απάντηση από τη μέθοδο get_entities από το Comprehend.

Αν και η εξαγωγή οντοτήτων λειτούργησε αρκετά καλά στον προσδιορισμό των προεπιλεγμένων τύπων οντοτήτων για οτιδήποτε στο τραπεζικό έγγραφο, θέλουμε να αναγνωρίζονται συγκεκριμένες οντότητες για την περίπτωση χρήσης μας. Πιο συγκεκριμένα, πρέπει να προσδιορίσουμε τους αριθμούς λογαριασμών αποταμίευσης και ελέγχου του πελάτη στο αντίγραφο κίνησης της τράπεζας. Μπορούμε να εξαγάγουμε αυτούς τους βασικούς επιχειρηματικούς όρους χρησιμοποιώντας την προσαρμοσμένη αναγνώριση οντοτήτων Amazon Comprehend.

Εκπαιδεύστε ένα προσαρμοσμένο μοντέλο αναγνώρισης οντοτήτων του Amazon Comprehend

Για να εντοπίσουμε τις συγκεκριμένες οντότητες που μας ενδιαφέρουν από το αντίγραφο κίνησης του πελάτη, εκπαιδεύουμε έναν προσαρμοσμένο αναγνωριστικό οντοτήτων με δύο προσαρμοσμένες οντότητες: SAVINGS_AC και CHECKING_AC.

Στη συνέχεια εκπαιδεύουμε ένα προσαρμοσμένο μοντέλο αναγνώρισης οντοτήτων. Μπορούμε να επιλέξουμε έναν από τους δύο τρόπους παροχής δεδομένων στο Amazon Comprehend: σχολιασμούς ή λίστες οντοτήτων.

Η μέθοδος των σχολιασμών μπορεί συχνά να οδηγήσει σε πιο εκλεπτυσμένα αποτελέσματα για αρχεία εικόνας, PDF ή έγγραφα Word, επειδή εκπαιδεύετε ένα μοντέλο υποβάλλοντας πιο ακριβές περιβάλλον ως σχολιασμούς μαζί με τα έγγραφά σας. Ωστόσο, η μέθοδος των σχολιασμών μπορεί να είναι χρονοβόρα και εντατική. Για απλότητα αυτής της ανάρτησης ιστολογίου, χρησιμοποιούμε τη μέθοδο λιστών οντοτήτων, την οποία μπορείτε να χρησιμοποιήσετε μόνο για έγγραφα απλού κειμένου. Αυτή η μέθοδος μας δίνει ένα αρχείο CSV που θα πρέπει να περιέχει το απλό κείμενο και τον αντίστοιχο τύπο οντότητας, όπως φαίνεται στο προηγούμενο παράδειγμα. Οι οντότητες σε αυτό το αρχείο θα είναι συγκεκριμένες για τις επιχειρηματικές μας ανάγκες (αριθμοί λογαριασμών αποταμίευσης και ελέγχου).

Για περισσότερες λεπτομέρειες σχετικά με τον τρόπο προετοιμασίας των δεδομένων εκπαίδευσης για διαφορετικές περιπτώσεις χρήσης χρησιμοποιώντας σχολιασμούς ή μεθόδους λιστών οντοτήτων, ανατρέξτε στο Προετοιμασία των δεδομένων εκπαίδευσης.

Το παρακάτω στιγμιότυπο οθόνης δείχνει ένα παράδειγμα της λίστας οντοτήτων μας.

Ένα στιγμιότυπο της λίστας οντοτήτων.

Δημιουργήστε ένα προσαρμοσμένο τελικό σημείο NER για το Amazon Comprehend σε πραγματικό χρόνο

Στη συνέχεια, δημιουργούμε ένα προσαρμοσμένο τελικό σημείο αναγνώρισης οντοτήτων σε πραγματικό χρόνο χρησιμοποιώντας το μοντέλο που εκπαιδεύσαμε. Χρησιμοποιούμε το Δημιουργία Endpoint API μέσω του comprehend.create_endpoint() μέθοδος για τη δημιουργία του τελικού σημείου σε πραγματικό χρόνο:

#create comprehend endpoint
model_arn = entity_recognizer_arn
ep_name = 'idp-er-endpoint'

try:
    endpoint_response = comprehend.create_endpoint(
        EndpointName=ep_name,
        ModelArn=model_arn,
        DesiredInferenceUnits=1,    
        DataAccessRoleArn=role
    )
    ER_ENDPOINT_ARN=endpoint_response['EndpointArn']
    print(f'Endpoint created with ARN: {ER_ENDPOINT_ARN}')
    %store ER_ENDPOINT_ARN
except Exception as error:
    if error.response['Error']['Code'] == 'ResourceInUseException':
        print(f'An endpoint with the name "{ep_name}" already exists.')
        ER_ENDPOINT_ARN = f'arn:aws:comprehend:{region}:{account_id}:entity-recognizer-endpoint/{ep_name}'
        print(f'The classifier endpoint ARN is: "{ER_ENDPOINT_ARN}"')
        %store ER_ENDPOINT_ARN
    else:
        print(error)

Αφού εκπαιδεύσουμε έναν αναγνωριστικό προσαρμοσμένης οντότητας, χρησιμοποιούμε το προσαρμοσμένο τελικό σημείο σε πραγματικό χρόνο για να εξαγάγουμε ορισμένες εμπλουτισμένες πληροφορίες από το έγγραφο και, στη συνέχεια, να εκτελέσουμε επεξεργασία εγγράφων με τη βοήθεια των προσαρμοσμένων οντοτήτων που αναγνωρίζονται από το Amazon Comprehend και τις πληροφορίες πλαισίου οριοθέτησης από το Amazon Textract.

Φάση εμπλουτισμού

Στο στάδιο του εμπλουτισμού εγγράφων, μπορούμε να πραγματοποιήσουμε εμπλουτισμό εγγράφων με επεξεργασία δεδομένων προσωπικής ταυτοποίησης (PII), εξαγωγή προσαρμοσμένων επιχειρηματικών όρων κ.λπ. Το προηγούμενο δείγμα εγγράφου μας (ένα αντίγραφο κίνησης τραπεζικού λογαριασμού) περιέχει τους αριθμούς λογαριασμών αποταμίευσης και ελέγχου των πελατών, τους οποίους θέλουμε να επεξεργαστούμε. Επειδή γνωρίζουμε ήδη αυτές τις προσαρμοσμένες οντότητες μέσω του προσαρμοσμένου μοντέλου NER του Amazon Comprehend, μπορούμε εύκολα να χρησιμοποιήσουμε τον τύπο δεδομένων γεωμετρίας Amazon Textract για να επεξεργαστούμε αυτές τις οντότητες PII όπου κι αν εμφανίζονται στο έγγραφο. Στην ακόλουθη αρχιτεκτονική, αφαιρούμε βασικούς επιχειρηματικούς όρους (λογαριασμούς ταμιευτηρίου και όψεως) από το έγγραφο κίνησης τραπεζικού λογαριασμού.

Φάση εμπλουτισμού εγγράφων.

Όπως μπορείτε να δείτε στο παρακάτω παράδειγμα, οι αριθμοί λογαριασμών ελέγχου και ταμιευτηρίου είναι πλέον κρυμμένοι στο αντίγραφο κίνησης του τραπεζικού λογαριασμού.

Διορθωμένο δείγμα τραπεζικού λογαριασμού.

Οι παραδοσιακές λύσεις OCR δυσκολεύονται να εξαγάγουν δεδομένα με ακρίβεια από τα περισσότερα αδόμητα και ημι-δομημένα έγγραφα λόγω των σημαντικών παραλλαγών στον τρόπο με τον οποίο τα δεδομένα παρουσιάζονται σε πολλές εκδόσεις και μορφές αυτών των εγγράφων. Στη συνέχεια, μπορεί να χρειαστεί να εφαρμόσετε προσαρμοσμένη λογική προεπεξεργασίας ή ακόμα και να εξαγάγετε με μη αυτόματο τρόπο τις πληροφορίες από αυτά τα έγγραφα. Σε αυτήν την περίπτωση, η διοχέτευση IDP υποστηρίζει δύο λειτουργίες που μπορείτε να χρησιμοποιήσετε: Προσαρμοσμένα ερωτήματα NER του Amazon Comprehend και ερωτήματα Amazon Textract. Και οι δύο αυτές υπηρεσίες χρησιμοποιούν το NLP για την εξαγωγή πληροφοριών σχετικά με το περιεχόμενο των εγγράφων.

Εξαγωγή με ερωτήματα Amazon Textract

Κατά την επεξεργασία ενός εγγράφου με το Amazon Textract, μπορείτε να προσθέσετε τη νέα λειτουργία ερωτημάτων στην ανάλυσή σας για να καθορίσετε ποιες πληροφορίες χρειάζεστε. Αυτό περιλαμβάνει τη μετάδοση μιας ερώτησης NLP, όπως "Ποιος είναι ο αριθμός κοινωνικής ασφάλισης του πελάτη;" στο Amazon Textract. Το Amazon Textract βρίσκει τις πληροφορίες στο έγγραφο για αυτήν την ερώτηση και τις επιστρέφει σε μια δομή απάντησης ξεχωριστή από τις υπόλοιπες πληροφορίες του εγγράφου. Τα ερωτήματα μπορούν να υποβληθούν σε επεξεργασία μόνα τους ή σε συνδυασμό με οποιοδήποτε άλλο FeatureType, Όπως Tables or Forms.

Εξαγωγή βάσει ερωτημάτων με χρήση του Amazon Textract.

Με τα ερωτήματα Amazon Textract, μπορείτε να εξαγάγετε πληροφορίες με υψηλή ακρίβεια, ανεξάρτητα από τον τρόπο με τον οποίο τα δεδομένα διατάσσονται σε μια δομή εγγράφου, όπως φόρμες, πίνακες και πλαίσια ελέγχου ή τοποθετούνται σε ένθετες ενότητες σε ένα έγγραφο.

Για να δείξουμε τη δυνατότητα ερωτημάτων, εξάγουμε πολύτιμες πληροφορίες, όπως το όνομα και το επίθετο του ασθενούς, τον κατασκευαστή της δόσης και ούτω καθεξής από έγγραφα όπως μια κάρτα εμβολιασμού για τον COVID-19.

Δείγμα εμβολιαστικής κάρτας.

Χρησιμοποιούμε το textract.analyze_document() λειτουργία και καθορίστε το FeatureType as QUERIES καθώς και να προσθέσετε τα ερωτήματα με τη μορφή ερωτήσεων φυσικής γλώσσας στο QueriesConfig.

Ο παρακάτω κώδικας έχει περικοπεί για λόγους απλοποίησης. Για τον πλήρη κωδικό, ανατρέξτε στο GitHub δείγμα κώδικα for analyze_document().

response = None
with open(image_filename, 'rb') as document:
    imageBytes = bytearray(document.read())

# Call Textract
response = textract.analyze_document(
    Document={'Bytes': imageBytes},
    FeatureTypes=["QUERIES"],
    QueriesConfig={
            "Queries": [{
                "Text": "What is the date for the 1st dose covid-19?",
                "Alias": "COVID_VACCINATION_FIRST_DOSE_DATE"
            },
# code trimmed down for simplification
#..
]
})

Για τη δυνατότητα ερωτημάτων, το textract.analyze_document() Η λειτουργία εξάγει όλα τα OCR WORDS και LINES, πληροφορίες γεωμετρίας και βαθμολογίες εμπιστοσύνης στην απόκριση JSON. Ωστόσο, μπορούμε απλώς να εκτυπώσουμε τις πληροφορίες για τις οποίες ζητήσαμε.

Document είναι μια συνάρτηση περιτυλίγματος που χρησιμοποιείται για να βοηθήσει στην ανάλυση της απόκρισης JSON από το API. Παρέχει μια αφαίρεση υψηλού επιπέδου και καθιστά την έξοδο API επαναλαμβανόμενη και εύκολη στη λήψη πληροφοριών. Για περισσότερες πληροφορίες, ανατρέξτε στο Αναλυτής απόκρισης κειμένου και Texttractor Αποθετήρια GitHub. Αφού επεξεργαστούμε την απάντηση, λαμβάνουμε τις ακόλουθες πληροφορίες όπως φαίνεται στο στιγμιότυπο οθόνης.

import trp.trp2 as t2
from tabulate import tabulate

d = t2.TDocumentSchema().load(response)
page = d.pages[0]

query_answers = d.get_query_answers(page=page)

print(tabulate(query_answers, tablefmt="github"))

Απάντηση από εξαγωγή ερωτημάτων.

Φάση αναθεώρησης και επικύρωσης

Αυτό είναι το τελικό στάδιο του αγωγού μας για το IDP. Σε αυτό το στάδιο, μπορούμε να χρησιμοποιήσουμε τους επιχειρηματικούς μας κανόνες για να ελέγξουμε την πληρότητα ενός εγγράφου. Για παράδειγμα, από ένα έγγραφο ασφαλιστικών απαιτήσεων, το αναγνωριστικό αξίωσης εξάγεται με ακρίβεια και επιτυχία. Μπορούμε να χρησιμοποιήσουμε τεχνολογίες χωρίς διακομιστή AWS όπως π.χ AWS Lambda για περαιτέρω αυτοματοποίηση αυτών των επιχειρηματικών κανόνων. Επιπλέον, μπορούμε να συμπεριλάβουμε ανθρώπινο δυναμικό για αναθεωρήσεις εγγράφων για να διασφαλίσουμε ότι οι προβλέψεις είναι ακριβείς. Το Amazon A2I επιταχύνει τις ροές εργασιών κτιρίου που απαιτούνται για ανθρώπινη αναθεώρηση για προβλέψεις ML.

Με το Amazon A2I, μπορείτε να επιτρέψετε σε ανθρώπινους αναθεωρητές να παρέμβουν όταν ένα μοντέλο δεν είναι σε θέση να κάνει μια πρόβλεψη υψηλής εμπιστοσύνης ή να ελέγχει τις προβλέψεις του σε συνεχή βάση. Ο στόχος του αγωγού IDP είναι να μειώσει την ποσότητα της ανθρώπινης εισροής που απαιτείται για τη λήψη ακριβών πληροφοριών στα συστήματα λήψης αποφάσεων. Με το IDP, μπορείτε να μειώσετε την ποσότητα της ανθρώπινης εισροής για τις διαδικασίες των εγγράφων σας, καθώς και το συνολικό κόστος της επεξεργασίας εγγράφων.

Αφού εξάγετε όλες τις ακριβείς πληροφορίες από τα έγγραφα, μπορείτε να προσθέσετε περαιτέρω κανόνες για συγκεκριμένες επιχειρήσεις χρησιμοποιώντας τις λειτουργίες Lambda και, τέλος, να ενσωματώσετε τη λύση με βάσεις δεδομένων ή εφαρμογές μεταγενέστερης ροής.

Φάση αναθεώρησης και επαλήθευσης από τον άνθρωπο.

Για περισσότερες πληροφορίες σχετικά με τον τρόπο δημιουργίας μιας ροής εργασίας Amazon A2I, ακολουθήστε τις οδηγίες από το Προετοιμασία για την Ενότητα 4 βήμα στο τέλος του 03-idp-document-enrichment.ipynb στο δικό μας GitHub repo.

εκκαθάριση

Για να αποτρέψετε μελλοντικές χρεώσεις στον λογαριασμό σας AWS, διαγράψτε τους πόρους που παρείχαμε στη ρύθμιση του αποθετηρίου μεταβαίνοντας στο Ενότητα καθαρισμού στο αποθετήριο μας.

Συμπέρασμα

Σε αυτήν την ανάρτηση δύο μερών, είδαμε πώς να δημιουργήσουμε έναν αγωγό IDP από άκρο σε άκρο με λίγη ή καθόλου εμπειρία ML. Συζητήσαμε τα διάφορα στάδια του αγωγού και μια πρακτική λύση με υπηρεσίες AWS AI, όπως το Amazon Textract, το Amazon Comprehend, το Amazon Comprehend Medical και το Amazon A2I για το σχεδιασμό και την κατασκευή περιπτώσεων χρήσης ειδικών για τη βιομηχανία. Στο πρώτη θέση της σειράς, δείξαμε πώς να χρησιμοποιείτε το Amazon Textract και το Amazon Comprehend για την εξαγωγή πληροφοριών από διάφορα έγγραφα. Σε αυτήν την ανάρτηση, κάναμε μια βαθιά βουτιά στο πώς να εκπαιδεύσουμε έναν αναγνωριστικό προσαρμοσμένης οντότητας Amazon Comprehend ώστε να εξάγει προσαρμοσμένες οντότητες από τα έγγραφά μας. Πραγματοποιήσαμε επίσης τεχνικές εμπλουτισμού εγγράφων, όπως η σύνταξη χρησιμοποιώντας το Amazon Textract, καθώς και τη λίστα οντοτήτων από το Amazon Comprehend. Τέλος, είδαμε πώς μπορείτε να χρησιμοποιήσετε μια ροή εργασίας ανθρώπινης αναθεώρησης Amazon A2I για το Amazon Textract συμπεριλαμβάνοντας μια ιδιωτική ομάδα εργασίας.

Για περισσότερες πληροφορίες σχετικά με τα πλήρη δείγματα κώδικα σε αυτήν την ανάρτηση, ανατρέξτε στο GitHub repo.

Σας συνιστούμε να διαβάσετε τις ενότητες ασφαλείας του Textract Amazon, Κατανοήστε το Amazon, να Amazon A2I τεκμηρίωση και ακολουθήστε τις οδηγίες που παρέχονται. Επίσης, αφιερώστε λίγο χρόνο για να ελέγξετε και να κατανοήσετε την τιμολόγηση Textract Amazon, Κατανοήστε το Amazon, να Amazon A2I.

Σχετικά με τους συγγραφείς

Τσιν Ρέιν είναι Αρχιτέκτονας Ειδικών Λύσεων AI/ML στην Amazon Web Services. Είναι παθιασμένη με τα εφαρμοσμένα μαθηματικά και τη μηχανική μάθηση. Επικεντρώνεται στο σχεδιασμό έξυπνων λύσεων επεξεργασίας εγγράφων για πελάτες AWS. Εκτός δουλειάς, της αρέσει να χορεύει salsa και bachata.

Σονάλι Σάχου είναι η ηγετική ομάδα του Intelligent Document Processing AI/ML Solutions Architect στην Amazon Web Services. Είναι παθιασμένη τεχνόφιλη και της αρέσει να εργάζεται με πελάτες για την επίλυση σύνθετων προβλημάτων χρησιμοποιώντας την καινοτομία. Οι βασικοί τομείς εστίασής της είναι η τεχνητή νοημοσύνη και η μηχανική μάθηση για έξυπνη επεξεργασία εγγράφων.

Anjan Biswas είναι Senior Solutions Architect, ειδικός σε AI/ML. Ο Anjan συνεργάζεται με εταιρικούς πελάτες και είναι παθιασμένος με την ανάπτυξη, την ανάπτυξη και την εξήγηση AI/ML, ανάλυση δεδομένων και λύσεις μεγάλων δεδομένων. Η Anjan έχει πάνω από 14 χρόνια εμπειρίας σε συνεργασία με παγκόσμιους οργανισμούς εφοδιαστικής αλυσίδας, κατασκευής και λιανικής και βοηθά ενεργά τους πελάτες να ξεκινήσουν και να κλιμακωθούν στο AWS.

Suprakash Dutta είναι αρχιτέκτονας λύσεων στο Amazon Web Services. Επικεντρώνεται στη στρατηγική ψηφιακού μετασχηματισμού, τον εκσυγχρονισμό και τη μετανάστευση εφαρμογών, την ανάλυση δεδομένων και τη μηχανική μάθηση. Είναι μέλος της κοινότητας AI/ML στο AWS και σχεδιάζει έξυπνες λύσεις επεξεργασίας εγγράφων.