Forbedring af AWS intelligent dokumentbehandling med generativ AI | Amazon Web Services

Forbedring af AWS intelligent dokumentbehandling med generativ AI | Amazon Web Services

Dataklassificering, udtræk og analyse kan være udfordrende for organisationer, der beskæftiger sig med mængder af dokumenter. Traditionelle dokumentbehandlingsløsninger er manuelle, dyre, fejlbehæftede og svære at skalere. AWS intelligent dokumentbehandling (IDP), med AI-tjenester som f.eks amazontekst, giver dig mulighed for at drage fordel af brancheførende maskinlæringsteknologi (ML) til hurtigt og præcist at behandle data fra ethvert scannet dokument eller billede. Generativ kunstig intelligens (generativ AI) supplerer Amazon Textract for yderligere at automatisere dokumentbehandlingsarbejdsgange. Funktioner som normalisering af nøglefelter og opsummering af inputdata understøtter hurtigere cyklusser til styring af dokumentprocesser, samtidig med at risikoen for fejl reduceres.

Generativ AI er drevet af store ML-modeller kaldet fundamentmodeller (FM'er). FM'er transformerer den måde, du kan løse traditionelt komplekse dokumentbehandlingsarbejdsbelastninger på. Ud over eksisterende muligheder skal virksomheder opsummere specifikke kategorier af information, herunder debet- og kreditdata fra dokumenter såsom finansielle rapporter og kontoudtog. FM'er gør det nemmere at generere sådanne indsigter fra de udtrukne data. For at optimere tiden brugt på menneskelig gennemgang og for at forbedre medarbejdernes produktivitet kan fejl som manglende cifre i telefonnumre, manglende dokumenter eller adresser uden vejnumre markeres på en automatiseret måde. I det aktuelle scenarie skal du dedikere ressourcer til at udføre sådanne opgaver ved hjælp af menneskelig gennemgang og komplekse scripts. Denne tilgang er kedelig og dyr. FM'er kan hjælpe med at fuldføre disse opgaver hurtigere med færre ressourcer og transformere forskellige inputformater til en standardskabelon, der kan behandles yderligere. Hos AWS tilbyder vi services som f.eks Amazonas grundfjeld, den nemmeste måde at bygge og skalere generative AI-applikationer med FM'er. Amazon Bedrock er en fuldt administreret tjeneste, der gør FM'er fra førende AI-startups og Amazon tilgængelige via en API, så du kan finde den model, der passer bedst til dine krav. Vi tilbyder også Amazon SageMaker JumpStart, som giver ML-praktikere mulighed for at vælge mellem et bredt udvalg af open source FM'er. ML-udøvere kan implementere FM'er til dedikerede Amazon SageMaker forekomster fra et netværksisoleret miljø og tilpasse modeller ved hjælp af SageMaker til modeltræning og implementering.

Ricoh tilbyder arbejdspladsløsninger og digitale transformationstjenester designet til at hjælpe kunder med at administrere og optimere informationsflowet på tværs af deres virksomheder. Ashok Shenoy, VP for Portfolio Solution Development, siger: "Vi tilføjer generativ kunstig intelligens til vores IDP-løsninger for at hjælpe vores kunder med at få deres arbejde udført hurtigere og mere præcist ved at bruge nye muligheder såsom Q&A, opsummering og standardiserede output. AWS giver os mulighed for at drage fordel af generativ kunstig intelligens og samtidig holde hver af vores kunders data adskilte og sikre."

I dette indlæg deler vi, hvordan du forbedrer din IDP-løsning på AWS med generativ AI.

Forbedring af IDP-pipeline

I dette afsnit gennemgår vi, hvordan den traditionelle IDP-pipeline kan forstærkes af FM'er og gennemgår et eksempel på brug af Amazon Textract med FM'er.

AWS IDP består af tre faser: klassificering, ekstraktion og berigelse. For flere detaljer om hvert trin, se Intelligent dokumentbehandling med AWS AI-tjenester: Del 1 , del 2. I klassifikationsfasen kan FM'er nu klassificere dokumenter uden yderligere uddannelse. Det betyder, at dokumenter kan kategoriseres, selvom modellen ikke har set lignende eksempler før. FM'er i udtrækningsstadiet normaliserer datofelter og verificerer adresser og telefonnumre, samtidig med at de sikrer ensartet formatering. FM'er i berigelsesstadiet tillader slutninger, logisk ræsonnement og opsummering. Når du bruger FM'er i hver IDP-fase, vil din arbejdsgang være mere strømlinet, og ydeevnen forbedres. Følgende diagram illustrerer IDP-pipelinen med generativ AI.

Intelligent dokumentbehandlingspipeline med generativ AI

Udvindingsstadiet af IDP-rørledningen

Når FM'er ikke direkte kan behandle dokumenter i deres oprindelige formater (såsom PDF'er, img, jpeg og tiff) som input, er der behov for en mekanisme til at konvertere dokumenter til tekst. For at udtrække teksten fra dokumentet, før du sender den til FM'erne, kan du bruge Amazon Textract. Med Amazon Textract kan du udtrække linjer og ord og videregive dem til nedstrøms FM'er. Følgende arkitektur bruger Amazon Textract til nøjagtig tekstudtrækning fra enhver type dokument, før den sendes til FM'er til yderligere behandling.

Textract Indtager dokumentdata til Foundation-modellerne

Typisk består dokumenter af struktureret og semistruktureret information. Amazon Textract kan bruges til at udtrække rå tekst og data fra tabeller og formularer. Forholdet mellem dataene i tabeller og formularer spiller en afgørende rolle i automatisering af forretningsprocesser. Visse typer oplysninger må ikke behandles af FM'er. Som et resultat kan vi vælge enten at gemme disse oplysninger i en downstream-butik eller sende dem til FM'er. Følgende figur er et eksempel på, hvordan Amazon Textract kan udtrække struktureret og semi-struktureret information fra et dokument, ud over tekstlinjer, der skal behandles af FM'er.

Enhancing AWS intelligent document processing with generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Brug af AWS-serverløse tjenester til at opsummere med FM'er

IDP-pipelinen, vi illustrerede tidligere, kan problemfrit automatiseres ved hjælp af AWS-serverløse tjenester. Meget ustrukturerede dokumenter er almindelige i store virksomheder. Disse dokumenter kan strække sig fra Securities and Exchange Commission (SEC) dokumenter i bankbranchen til dækningsdokumenter i sygeforsikringsbranchen. Med udviklingen af ​​generativ AI hos AWS leder folk i disse brancher efter måder at få et resumé fra disse dokumenter på en automatiseret og omkostningseffektiv måde. Serverløse tjenester hjælper med at give mekanismen til hurtigt at bygge en løsning til IDP. Tjenester som f.eks AWS Lambda, AWS-trinfunktionerog Amazon Eventbridge kan hjælpe med at opbygge dokumentbehandlingspipeline med integration af FM'er, som vist i følgende diagram.

End-to-end dokumentbehandling med Amazon Textract og Generative AI

prøveansøgning brugt i den foregående arkitektur er drevet af begivenheder. En begivenhed defineres som en tilstandsændring, der er sket for nylig. For eksempel, når et objekt bliver uploadet til en Amazon Simple Storage Service (Amazon S3) bucket, udsender Amazon S3 en Object Created-begivenhed. Denne hændelsesmeddelelse fra Amazon S3 kan udløse en Lambda-funktion eller en Step Functions-arbejdsgang. Denne type arkitektur betegnes som en begivenhedsdrevet arkitektur. I dette indlæg bruger vores eksempelapplikation en begivenhedsdrevet arkitektur til at behandle et eksempel på et medicinsk udskrivningsdokument og opsummere detaljerne i dokumentet. Flow fungerer som følger:

  1. Når et dokument uploades til en S3 bucket, udløser Amazon S3 en Object Created-hændelse.
  2. EventBridge-standardhændelsesbussen udbreder hændelsen til trinfunktioner baseret på en EventBridge-regel.
  3. Statsmaskinens arbejdsgang behandler dokumentet, begyndende med Amazon Textract.
  4. En Lambda-funktion transformerer de analyserede data til næste trin.
  5. Statsmaskinen påberåber sig a SageMaker slutpunkt, som er vært for FM ved hjælp af direkte AWS SDK-integration.
  6. En opsummerende S3-destinationsbøtte modtager det sammenfattende svar indsamlet fra FM.

Vi brugte prøveapplikationen med en flan-t5 Hugging face model for at opsummere følgende eksempel på patientudskrivningsoversigt ved hjælp af Trinfunktioner-arbejdsgangen.

resumé af patientudskrivning

Workflowet Trinfunktioner bruger AWS SDK integration at kalde Amazon Textract AnalyserDokument og SageMaker runtime InvokeEndpoint API'er, som vist i den følgende figur.

workflow

Denne arbejdsgang resulterer i et oversigts-JSON-objekt, der er gemt i en destinationsindsamling. JSON-objektet ser ud som følger:

{ "summary": [ "John Doe is a 35-year old male who has been experiencing stomach problems for two months. He has been taking antibiotics for the last two weeks, but has not been able to eat much. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has also noticed a change in his stool color, which is now darker. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of fatigue, and has been unable to work for the last two weeks. He has also been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help." ], "forms": [ { "key": "Ph: ", "value": "(888)-(999)-(0000) " }, { "key": "Fax: ", "value": "(888)-(999)-(1111) " }, { "key": "Patient Name: ", "value": "John Doe " }, { "key": "Patient ID: ", "value": "NARH-36640 " }, { "key": "Gender: ", "value": "Male " }, { "key": "Attending Physician: ", "value": "Mateo Jackson, PhD " }, { "key": "Admit Date: ", "value": "07-Sep-2020 " }, { "key": "Discharge Date: ", "value": "08-Sep-2020 " }, { "key": "Discharge Disposition: ", "value": "Home with Support Services " }, { "key": "Pre-existing / Developed Conditions Impacting Hospital Stay: ", "value": "35 yo M c/o stomach problems since 2 months. Patient reports epigastric abdominal pain non- radiating. Pain is described as gnawing and burning, intermittent lasting 1-2 hours, and gotten progressively worse. Antacids used to alleviate pain but not anymore; nothing exacerbates pain. Pain unrelated to daytime or to meals. Patient denies constipation or diarrhea. Patient denies blood in stool but have noticed them darker. Patient also reports nausea. Denies recent illness or fever. He also reports fatigue for 2 weeks and bloating after eating. ROS: Negative except for above findings Meds: Motrin once/week. Tums previously. PMHx: Back pain and muscle spasms. No Hx of surgery. NKDA. FHx: Uncle has a bleeding ulcer. Social Hx: Smokes since 15 yo, 1/2-1 PPD. No recent EtOH use. Denies illicit drug use. Works on high elevation construction. Fast food diet. Exercises 3-4 times/week but stopped 2 weeks ago. " }, { "key": "Summary: ", "value": "some activity restrictions suggested, full course of antibiotics, check back with physican in case of relapse, strict diet " } ] }

Generering af disse oversigter ved hjælp af IDP med serverløs implementering i stor skala hjælper organisationer med at få meningsfulde, kortfattede og præsentable data på en omkostningseffektiv måde. Trinfunktioner begrænser ikke metoden til behandling af dokumenter til ét dokument ad gangen. Dens distribueret kort funktion kan opsummere et stort antal dokumenter på en tidsplan.

prøveansøgning bruge til flan-t5 Hugging face model; du kan dog bruge et FM-slutpunkt efter eget valg. Træning og kørsel af modellen er uden for prøveansøgningens omfang. Følg instruktionerne i GitHub-lageret for at implementere en prøveapplikation. Den foregående arkitektur er en vejledning i, hvordan du kan orkestrere en IDP-arbejdsgang ved hjælp af Step Functions. Der henvises til IDP Generative AI workshop for detaljerede instruktioner om, hvordan man bygger en applikation med AWS AI-tjenester og FM'er.

Opsæt løsningen

Følg trinene i README fil for at indstille løsningsarkitekturen (undtagen SageMaker-endepunkterne). Når du har dit eget SageMaker-slutpunkt tilgængeligt, kan du videregive slutpunktnavnet som en parameter til skabelonen.

Ryd op

For at spare omkostninger skal du slette de ressourcer, du implementerede som en del af selvstudiet:

  1. Følg trinene i oprydningsafsnittet i README fil.
  2. Slet alt indhold fra din S3-bøtte, og slet derefter bøtten gennem Amazon S3-konsollen.
  3. Slet eventuelle SageMaker-slutpunkter, du måtte have oprettet gennem SageMaker-konsollen.

Konklusion

Generativ AI ændrer, hvordan du kan behandle dokumenter med IDP for at opnå indsigt. AWS AI-tjenester såsom Amazon Textract sammen med AWS FM'er kan hjælpe med nøjagtig behandling af enhver type dokumenter. For mere information om at arbejde med generativ AI på AWS, se Annoncering af nye værktøjer til bygning med generativ AI på AWS.


Om forfatterne

Enhancing AWS intelligent document processing with generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Sonali Sahu leder intelligent dokumentbehandling med AI/ML-serviceteamet i AWS. Hun er forfatter, tankeleder og passioneret teknolog. Hendes kernefokusområde er AI og ML, og hun taler ofte ved AI- og ML-konferencer og -møder rundt om i verden. Hun har både bred og dybdegående erfaring inden for teknologi og teknologiindustrien, med brancheekspertise inden for sundhedspleje, finanssektoren og forsikring.

Enhancing AWS intelligent document processing with generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Ashish Lal er en Senior Product Marketing Manager, der leder produktmarketing for AI-tjenester hos AWS. Han har 9 års marketingerfaring og har ledet produktmarketingindsatsen for Intelligent dokumentbehandling. Han fik sin Master i Business Administration ved University of Washington.

Enhancing AWS intelligent document processing with generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Mrunal Daftari er en Enterprise Senior Solutions Architect hos Amazon Web Services. Han er baseret i Boston, MA. Han er en cloud-entusiast og meget passioneret omkring at finde løsninger til kunder, der er enkle og adresserer deres forretningsresultater. Han elsker at arbejde med cloud-teknologier, levere enkle, skalerbare løsninger, der driver positive forretningsresultater, cloud-adoptionsstrategi og designe innovative løsninger og fremme operationel excellence.

Enhancing AWS intelligent document processing with generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Dhiraj Mahapatro er Principal Serverless Specialist Solutions Architect hos AWS. Han har specialiseret sig i at hjælpe virksomheders finansielle tjenester med at indføre serverløse og begivenhedsdrevne arkitekturer for at modernisere deres applikationer og accelerere deres innovationstempo. For nylig har han arbejdet på at bringe containerarbejdsbelastninger og praktisk brug af generativ AI tættere på serverløs og EDA for kunder i finanssektoren.

Enhancing AWS intelligent document processing with generative AI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Jacob Hauskens er en Principal AI Specialist med over 15 års strategisk forretningsudvikling og partnerskabserfaring. I de sidste 7 år har han ledet skabelsen og implementeringen af ​​go-to-market-strategier for nye AI-drevne B2B-tjenester. For nylig har han hjulpet ISV'er med at øge deres omsætning ved at tilføje generativ AI til intelligente dokumentbehandlingsarbejdsgange.

Tidsstempel:

Mere fra AWS maskinindlæring