Elaborazione intelligente dei documenti con i servizi AWS AI nel settore assicurativo: parte 1

Ripubblicato da Platone

Seguaci: 0

L'obiettivo dell'elaborazione intelligente dei documenti (IDP) è aiutare la tua organizzazione a prendere decisioni più rapide e accurate applicando l'IA per elaborare i tuoi documenti. Questa serie in due parti mette in evidenza le tecnologie di intelligenza artificiale di AWS che le compagnie assicurative possono utilizzare per accelerare i propri processi aziendali. Queste tecnologie di intelligenza artificiale possono essere utilizzate in casi d'uso assicurativi come reclami, sottoscrizioni, corrispondenza con i clienti, contratti o gestione delle risoluzioni di controversie. Questa serie si concentra su un caso d'uso dell'elaborazione dei sinistri nel settore assicurativo; per ulteriori informazioni sui concetti fondamentali della soluzione AWS IDP, fare riferimento a quanto segue serie in due parti.

L'elaborazione dei reclami consiste in più punti di controllo in un flusso di lavoro necessario per esaminare, verificare l'autenticità e determinare la corretta responsabilità finanziaria per giudicare un reclamo. Le compagnie di assicurazione passano attraverso questi posti di blocco per i reclami prima dell'aggiudicazione dei reclami. Se un reclamo passa con successo attraverso tutti questi checkpoint senza problemi, la compagnia di assicurazione lo approva ed elabora qualsiasi pagamento. Tuttavia, potrebbero richiedere ulteriori informazioni di supporto per giudicare una richiesta. Questo processo di elaborazione dei reclami è spesso manuale, il che lo rende costoso, soggetto a errori e dispendioso in termini di tempo. I clienti assicurativi possono automatizzare questo processo utilizzando i servizi di intelligenza artificiale di AWS per automatizzare la pipeline di elaborazione dei documenti per l'elaborazione dei reclami.

In questa serie in due parti, ti spiegheremo come automatizzare ed elaborare in modo intelligente i documenti su larga scala utilizzando i servizi di intelligenza artificiale di AWS per un caso d'uso per l'elaborazione di sinistri assicurativi.

Elaborazione intelligente dei documenti con i servizi di analisi e intelligenza artificiale di AWS nel settore assicurativo

Panoramica della soluzione

Il diagramma seguente rappresenta ogni fase che in genere vediamo in una pipeline IDP. Esaminiamo ciascuna di queste fasi e come si collegano ai passaggi coinvolti in un processo di richiesta di risarcimento, a partire da quando viene presentata una domanda, fino all'indagine e alla chiusura della domanda. In questo post, trattiamo i dettagli tecnici delle fasi di acquisizione, classificazione ed estrazione dei dati. In Parte 2, espandiamo la fase di estrazione dei documenti e continuiamo a documentare l'arricchimento, la revisione e la verifica ed estendiamo la soluzione per fornire analisi e visualizzazioni per un caso d'uso di frode per reclami.

Il diagramma dell'architettura seguente mostra i diversi servizi AWS utilizzati durante le fasi della pipeline IDP in base alle diverse fasi di un'applicazione di elaborazione dei reclami.

Diagramma dell'architettura IDP

La soluzione utilizza i seguenti servizi chiave:

Testo Amazon è un servizio di machine learning (ML) che estrae automaticamente testo, grafia e dati dai documenti scansionati. Va oltre il semplice riconoscimento ottico dei caratteri (OCR) per identificare, comprendere ed estrarre dati da moduli e tabelle. Amazon Textract utilizza il ML per leggere ed elaborare qualsiasi tipo di documento, estraendo con precisione testo, grafia, tabelle e altri dati senza alcuno sforzo manuale.
Amazon Comprehend è un servizio di elaborazione del linguaggio naturale (NLP) che utilizza il machine learning per estrarre informazioni dettagliate dal testo. Amazon Comprehend può rilevare entità come persona, posizione, data, quantità e altro. Può anche rilevare la lingua dominante, le informazioni di identificazione personale (PII) e classificare i documenti nella loro classe pertinente.
AI aumentata di Amazon (Amazon A2I) è un servizio ML che semplifica la creazione dei flussi di lavoro necessari per la revisione umana. Amazon A2I offre la revisione umana a tutti gli sviluppatori, eliminando il peso indifferenziato associato alla creazione di sistemi di revisione umana o alla gestione di un gran numero di revisori umani. Amazon A2I integra entrambi con Testo Amazon ed Amazon Comprehend per fornire la possibilità di introdurre la revisione o la convalida umana all'interno del flusso di lavoro IDP.

Prerequisiti

Nelle sezioni seguenti, illustreremo i diversi servizi relativi alle prime tre fasi dell'architettura, ovvero le fasi di acquisizione, classificazione ed estrazione dei dati.

Fare riferimento al nostro Repository GitHub per campioni di codice completo insieme ai campioni di documenti nel pacchetto di elaborazione dei reclami.

Fase di acquisizione dei dati

I reclami e i relativi documenti giustificativi possono arrivare attraverso vari canali, come fax, e-mail, un portale di amministrazione e altro ancora. Puoi archiviare questi documenti in uno spazio di archiviazione altamente scalabile e durevole come Servizio di archiviazione semplice Amazon (Amazon S3). Questi documenti possono essere di vario tipo, come PDF, JPEG, PNG, TIFF e altro. I documenti possono venire in vari formati e layout e possono provenire da diversi canali al datastore.

Fase di classificazione

Nella fase di classificazione dei documenti, possiamo combinare Amazon Comprehend con Amazon Textract per convertire il testo nel contesto del documento per classificare i documenti archiviati nella fase di acquisizione dei dati. Possiamo quindi utilizzare la classificazione personalizzata in Amazon Comprehend per organizzare i documenti in classi che abbiamo definito nel pacchetto di elaborazione dei reclami. La classificazione personalizzata è utile anche per automatizzare il processo di verifica dei documenti e identificare eventuali documenti mancanti dal pacchetto. Ci sono due passaggi nella classificazione personalizzata, come mostrato nel diagramma dell'architettura:

Estrai il testo utilizzando Amazon Textract da tutti i documenti nell'archivio dati per preparare i dati di addestramento per il classificatore personalizzato.
Addestra un modello di classificazione personalizzato Amazon Comprehend (chiamato anche a documento classificatore) per riconoscere le classi di interesse in base al contenuto del testo.

Documento di classificazione del pacchetto sinistri assicurativi

Dopo che il modello di classificazione personalizzato di Amazon Comprehend è stato addestrato, possiamo utilizzare l'endpoint in tempo reale per classificare i documenti. Amazon Comprehend restituisce tutte le classi di documenti con un punteggio di affidabilità collegato a ciascuna classe in una matrice di coppie chiave-valore (Doc_name - Confidence_score). Si consiglia di esaminare il codice di esempio di classificazione del documento dettagliato su GitHub.

Fase di estrazione

Nella fase di estrazione, estraiamo i dati dai documenti utilizzando Amazon Textract e Amazon Comprehend. Per questo post, utilizzare i seguenti documenti di esempio nel pacchetto di elaborazione dei reclami: un modulo di richiesta Center of Medicaid and Medicare Services (CMS)-1500, patente di guida e ID assicurazione e fattura.

Estrarre i dati da un modulo di richiesta CMS-1500

Il modulo CMS-1500 è il modulo di richiesta standard utilizzato da un fornitore o fornitore non istituzionale per fatturare i vettori Medicare.

È importante elaborare il modulo CMS-1500 in modo accurato, altrimenti potrebbe rallentare il processo di reclamo o ritardare il pagamento da parte del corriere. Con Amazon Texttract AnalyzeDocument API, possiamo accelerare il processo di estrazione con maggiore precisione per estrarre il testo dai documenti al fine di comprendere ulteriori approfondimenti all'interno del modulo di richiesta. Quello che segue è un documento di esempio di un modulo di richiesta CMS-1500.

Un modulo di richiesta CMS1500

Usiamo ora il AnalyzeDocument API per estrarne due FeatureTypes, FORMS ed TABLES, dal documento:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

I seguenti risultati sono stati abbreviati per una migliore leggibilità. Per informazioni più dettagliate, consultare il ns Repository GitHub.

I FORMS l'estrazione è identificata come coppie chiave-valore.

I TABLES l'estrazione contiene celle, celle unite e intestazioni di colonna all'interno di una tabella rilevata nel modulo di richiesta.

Estrazione tabelle dal modulo CMS1500

Estrarre i dati dai documenti di identità

Per i documenti di identità come un ID assicurativo, che possono avere layout diversi, possiamo utilizzare Amazon Texttract AnalyzeDocument API. Noi usiamo il FeatureType FORMS come configurazione per il AnalyzeDocument API per estrarre le coppie chiave-valore dall'ID assicurazione (vedere l'esempio seguente):

Esegui il seguente codice:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

Otteniamo le coppie chiave-valore nell'array dei risultati, come mostrato nella schermata seguente.

Per i documenti d'identità come una patente di guida statunitense o un passaporto statunitense, Amazon Textract fornisce un supporto specializzato per estrarre automaticamente i termini chiave senza la necessità di modelli o formati, a differenza di quanto visto in precedenza per l'esempio dell'ID assicurativo. Con il AnalyzeID API, le aziende possono estrarre informazioni in modo rapido e accurato da documenti ID che hanno modelli o formati diversi. Il AnalyzeID L'API restituisce due categorie di tipi di dati:

Coppie chiave-valore disponibili sull'ID come data di nascita, data di emissione, numero ID, classe e restrizioni
Campi impliciti nel documento a cui potrebbero non essere associate chiavi esplicite, come nome, indirizzo ed emittente

Utilizziamo la seguente patente di guida statunitense di esempio dal nostro pacchetto di elaborazione dei reclami.

Esegui il seguente codice:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

Lo screenshot seguente mostra il nostro risultato.

Dallo screenshot dei risultati, puoi osservare che vengono presentate alcune chiavi che non erano nella patente stessa. Per esempio, Veteran non è una chiave trovata nella licenza; tuttavia, è un valore-chiave precompilato AnalyzeID supporta, a causa delle differenze riscontrate nelle licenze tra gli stati.

Estrarre dati da fatture e ricevute

Simile al AnalyzeID API, il AnalyzeExpense L'API fornisce un supporto specializzato per fatture e ricevute per estrarre informazioni rilevanti come il nome del fornitore, il totale parziale e gli importi totali e altro da qualsiasi formato di documenti fattura. Non è necessario alcun modello o configurazione per l'estrazione. Amazon Textract utilizza il ML per comprendere il contesto di fatture e ricevute ambigue.

Di seguito è riportato un esempio di fattura di assicurazione medica.

Un campione di fattura assicurativa

Usiamo il AnalyzeExpense API per visualizzare un elenco di campi standardizzati. I campi che non sono riconosciuti come campi standard sono classificati come OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

Otteniamo il seguente elenco di campi come coppie chiave-valore (vedi screenshot a sinistra) e l'intera riga di singoli elementi pubblicitari acquistati (vedi screenshot a destra) nei risultati.

Elaborazione intelligente dei documenti con i servizi AWS AI nel settore assicurativo: Parte 1 PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Conclusione

In questo post, abbiamo mostrato le sfide comuni nell'elaborazione dei reclami e come possiamo utilizzare i servizi di intelligenza artificiale di AWS per automatizzare una pipeline di elaborazione dei documenti intelligente per aggiudicare automaticamente un reclamo. Abbiamo visto come classificare i documenti in varie classi di documenti utilizzando un classificatore personalizzato Amazon Comprehend e come utilizzare Amazon Textract per estrarre tipi di documenti non strutturati, semistrutturati, strutturati e specializzati.

In Parte 2, espandiamo la fase di estrazione con Amazon Texttract. Utilizziamo anche entità predefinite ed entità personalizzate di Amazon Comprehend per arricchire i dati e mostrare come estendere la pipeline IDP per integrarla con i servizi di analisi e visualizzazione per ulteriori elaborazioni.

Si consiglia di rivedere le sezioni di sicurezza del Amazon Texttract, Amazon Comprendi, ed AmazonA2I documentazione e seguendo le linee guida fornite. Per ulteriori informazioni sui prezzi della soluzione, consultare i dettagli sui prezzi di Amazon Texttract, Amazon Comprehende AmazonA2I.

Informazioni sugli autori

Chinmayee Rane è un architetto di soluzioni specializzato in AI/ML presso Amazon Web Services. È appassionata di matematica applicata e machine learning. Si concentra sulla progettazione di soluzioni intelligenti per l'elaborazione dei documenti per i clienti AWS. Al di fuori del lavoro, le piace ballare la salsa e la bachata.

Sonali Sahu è a capo del team di Intelligent Document Processing AI/ML Solutions Architect di Amazon Web Services. È un'appassionata tecnofila e le piace lavorare con i clienti per risolvere problemi complessi utilizzando l'innovazione. La sua principale area di interesse è l'intelligenza artificiale e l'apprendimento automatico per l'elaborazione intelligente dei documenti.

Tim Condel è un Senior AI/ML Specialist Solutions Architect presso Amazon Web Services. Il suo obiettivo è l'elaborazione del linguaggio naturale e la visione artificiale. A Tim piace prendere le idee dei clienti e trasformarle in soluzioni scalabili.