Verbesserung der intelligenten Dokumentenverarbeitung von AWS mit generativer KI | Amazon Web Services

Verbesserung der intelligenten Dokumentenverarbeitung von AWS mit generativer KI | Amazon Web Services

Die Klassifizierung, Extraktion und Analyse von Daten kann für Unternehmen, die mit großen Dokumentenmengen umgehen, eine Herausforderung darstellen. Herkömmliche Dokumentenverarbeitungslösungen sind manuell, teuer, fehleranfällig und schwer zu skalieren. AWS Intelligent Document Processing (IDP) mit KI-Diensten wie z Amazontextermöglicht es Ihnen, die branchenführende Technologie des maschinellen Lernens (ML) zu nutzen, um Daten aus jedem gescannten Dokument oder Bild schnell und genau zu verarbeiten. Generative künstliche Intelligenz (generative KI) ergänzt Amazon Textract, um Arbeitsabläufe bei der Dokumentenverarbeitung weiter zu automatisieren. Funktionen wie die Normalisierung von Schlüsselfeldern und die Zusammenfassung von Eingabedaten unterstützen schnellere Zyklen bei der Verwaltung von Dokumentenprozess-Workflows und reduzieren gleichzeitig das Fehlerpotenzial.

Generative KI wird durch große ML-Modelle angetrieben, die als Foundation Models (FMs) bezeichnet werden. FMs verändern die Art und Weise, wie Sie traditionell komplexe Arbeitslasten bei der Dokumentenverarbeitung lösen können. Zusätzlich zu den vorhandenen Funktionen müssen Unternehmen bestimmte Informationskategorien zusammenfassen, darunter Soll- und Habendaten aus Dokumenten wie Finanzberichten und Kontoauszügen. FMs erleichtern die Generierung solcher Erkenntnisse aus den extrahierten Daten. Um den Zeitaufwand für die menschliche Überprüfung zu optimieren und die Produktivität der Mitarbeiter zu steigern, können Fehler wie fehlende Ziffern in Telefonnummern, fehlende Dokumente oder Adressen ohne Hausnummern automatisiert gekennzeichnet werden. Im aktuellen Szenario müssen Sie Ressourcen bereitstellen, um solche Aufgaben mithilfe menschlicher Überprüfung und komplexer Skripts auszuführen. Dieser Ansatz ist langwierig und teuer. FMs können dazu beitragen, diese Aufgaben schneller und mit weniger Ressourcen zu erledigen und unterschiedliche Eingabeformate in eine Standardvorlage umzuwandeln, die weiterverarbeitet werden kann. Bei AWS bieten wir Dienstleistungen an wie Amazonas Grundgestein, der einfachste Weg, generative KI-Anwendungen mit FMs zu erstellen und zu skalieren. Amazon Bedrock ist ein vollständig verwalteter Dienst, der FMs von führenden KI-Startups und Amazon über eine API verfügbar macht, sodass Sie das Modell finden können, das Ihren Anforderungen am besten entspricht. Wir bieten auch an Amazon SageMaker-JumpStart, wodurch ML-Praktiker aus einer breiten Auswahl an Open-Source-FMs wählen können. ML-Praktiker können FMs dediziert einsetzen Amazon Sage Maker Erstellen Sie Instanzen aus einer netzwerkisolierten Umgebung und passen Sie Modelle mithilfe von SageMaker für die Modellschulung und -bereitstellung an.

Ricoh bietet Arbeitsplatzlösungen und digitale Transformationsdienste, die Kunden dabei helfen sollen, den Informationsfluss in ihren Unternehmen zu verwalten und zu optimieren. Ashok Shenoy, VP of Portfolio Solution Development, sagt: „Wir fügen generative KI zu unseren IDP-Lösungen hinzu, um unseren Kunden zu helfen, ihre Arbeit schneller und genauer zu erledigen, indem wir neue Funktionen wie Fragen und Antworten, Zusammenfassungen und standardisierte Ausgaben nutzen.“ AWS ermöglicht es uns, die Vorteile generativer KI zu nutzen und gleichzeitig die Daten aller unserer Kunden getrennt und sicher zu halten.“

In diesem Beitrag erfahren Sie, wie Sie Ihre IDP-Lösung auf AWS mit generativer KI verbessern können.

Verbesserung der IDP-Pipeline

In diesem Abschnitt untersuchen wir, wie die traditionelle IDP-Pipeline durch FMs erweitert werden kann, und gehen einen Beispielanwendungsfall mit Amazon Textract mit FMs durch.

AWS IDP besteht aus drei Phasen: Klassifizierung, Extraktion und Anreicherung. Weitere Einzelheiten zu den einzelnen Phasen finden Sie unter Intelligente Dokumentenverarbeitung mit AWS AI-Services: Teil 1 und Teil 2. In der Klassifizierungsphase können FMs nun Dokumente ohne zusätzliche Schulung klassifizieren. Dies bedeutet, dass Dokumente auch dann kategorisiert werden können, wenn das Modell zuvor noch keine ähnlichen Beispiele gesehen hat. FMs in der Extraktionsphase normalisieren Datumsfelder und überprüfen Adressen und Telefonnummern, während sie gleichzeitig eine konsistente Formatierung sicherstellen. FMs in der Anreicherungsphase ermöglichen Rückschlüsse, logisches Denken und Zusammenfassungen. Wenn Sie FMs in jeder IDP-Phase verwenden, wird Ihr Arbeitsablauf rationalisiert und die Leistung verbessert. Das folgende Diagramm veranschaulicht die IDP-Pipeline mit generativer KI.

Intelligente Dokumentenverarbeitungspipeline mit generativer KI

Extraktionsphase der IDP-Pipeline

Wenn FMs Dokumente in ihren nativen Formaten (z. B. PDFs, IMG, JPEG und TIFF) nicht direkt als Eingabe verarbeiten können, ist ein Mechanismus zum Konvertieren von Dokumenten in Text erforderlich. Um den Text aus dem Dokument zu extrahieren, bevor Sie es an die FMs senden, können Sie Amazon Textract verwenden. Mit Amazon Textract können Sie Zeilen und Wörter extrahieren und an nachgelagerte FMs übergeben. Die folgende Architektur verwendet Amazon Textract für die genaue Textextraktion aus beliebigen Dokumenttypen, bevor sie zur weiteren Verarbeitung an FMs gesendet werden.

Textract übernimmt Dokumentdaten in die Foundation Models

Normalerweise bestehen Dokumente aus strukturierten und halbstrukturierten Informationen. Amazon Textract kann zum Extrahieren von Rohtext und Daten aus Tabellen und Formularen verwendet werden. Die Beziehung zwischen den Daten in Tabellen und Formularen spielt eine entscheidende Rolle bei der Automatisierung von Geschäftsprozessen. Bestimmte Arten von Informationen dürfen von FMs nicht verarbeitet werden. Daher haben wir die Wahl, diese Informationen entweder in einem nachgelagerten Speicher zu speichern oder an FMs zu senden. Die folgende Abbildung ist ein Beispiel dafür, wie Amazon Textract zusätzlich zu Textzeilen, die von FMs verarbeitet werden müssen, auch strukturierte und halbstrukturierte Informationen aus einem Dokument extrahieren kann.

Verbesserung der intelligenten Dokumentenverarbeitung von AWS mit generativer KI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Verwendung serverloser AWS-Dienste zur Zusammenfassung mit FMs

Die zuvor dargestellte IDP-Pipeline kann mithilfe serverloser AWS-Dienste nahtlos automatisiert werden. In großen Unternehmen sind stark unstrukturierte Dokumente an der Tagesordnung. Diese Dokumente können von Dokumenten der Securities and Exchange Commission (SEC) im Bankensektor bis hin zu Versicherungsdokumenten in der Krankenversicherungsbranche reichen. Mit der Entwicklung der generativen KI bei AWS suchen Menschen in diesen Branchen nach Möglichkeiten, auf automatisierte und kostengünstige Weise eine Zusammenfassung dieser Dokumente zu erhalten. Serverlose Dienste helfen dabei, den Mechanismus bereitzustellen, um schnell eine Lösung für IDP zu erstellen. Dienstleistungen wie z AWS Lambda, AWS Step-Funktionen und Amazon EventBridge kann beim Aufbau der Dokumentenverarbeitungspipeline mit der Integration von FMs helfen, wie im folgenden Diagramm dargestellt.

Durchgängige Dokumentenverarbeitung mit Amazon Textract und Generative AI

Das Beispielanwendung in der vorhergehenden Architektur verwendet wird getrieben von EreignissenEine Event ist definiert als eine Zustandsänderung, die kürzlich stattgefunden hat. Wenn beispielsweise ein Objekt auf eine hochgeladen wird Amazon Simple Storage-Service (Amazon S3)-Bucket gibt Amazon S3 ein Objekt erstellt-Ereignis aus. Diese Ereignisbenachrichtigung von Amazon S3 kann eine Lambda-Funktion oder einen Step Functions-Workflow auslösen. Diese Art von Architektur wird als bezeichnet Ereignisgesteuerte Architektur. In diesem Beitrag verwendet unsere Beispielanwendung eine ereignisgesteuerte Architektur, um ein Beispieldokument für eine medizinische Entlassung zu verarbeiten und die Details des Dokuments zusammenzufassen. Der Ablauf funktioniert wie folgt:

  1. Wenn ein Dokument in einen S3-Bucket hochgeladen wird, löst Amazon S3 ein Objekt erstellt-Ereignis aus.
  2. Der EventBridge-Standardereignisbus gibt das Ereignis basierend auf einer EventBridge-Regel an Step Functions weiter.
  3. Der Zustandsmaschinen-Workflow verarbeitet das Dokument, beginnend mit Amazon Textract.
  4. Eine Lambda-Funktion transformiert die analysierten Daten für den nächsten Schritt.
  5. Die Staatsmaschine ruft auf a SageMaker-Endpunkt, das das FM mithilfe der direkten AWS SDK-Integration hostet.
  6. Ein zusammenfassender S3-Ziel-Bucket empfängt die vom FM gesammelte zusammenfassende Antwort.

Wir haben die Beispielanwendung mit a verwendet flan-t5 Modell mit umarmendem Gesicht um die folgende beispielhafte Patientenentlassungszusammenfassung mithilfe des Step-Functions-Workflows zusammenzufassen.

Zusammenfassung der Entlassung des Patienten

Der Step Functions-Workflow verwendet AWS SDK-Integration um den Amazon Textract aufzurufen Dokument analysieren und SageMaker-Laufzeit InvokeEndpoint APIs, wie in der folgenden Abbildung dargestellt.

Arbeitsablauf.

Dieser Workflow führt zu einem zusammenfassenden JSON-Objekt, das in einem Ziel-Bucket gespeichert wird. Das JSON-Objekt sieht wie folgt aus:

{ "summary": [ "John Doe is a 35-year old male who has been experiencing stomach problems for two months. He has been taking antibiotics for the last two weeks, but has not been able to eat much. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has also noticed a change in his stool color, which is now darker. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of fatigue, and has been unable to work for the last two weeks. He has also been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help." ], "forms": [ { "key": "Ph: ", "value": "(888)-(999)-(0000) " }, { "key": "Fax: ", "value": "(888)-(999)-(1111) " }, { "key": "Patient Name: ", "value": "John Doe " }, { "key": "Patient ID: ", "value": "NARH-36640 " }, { "key": "Gender: ", "value": "Male " }, { "key": "Attending Physician: ", "value": "Mateo Jackson, PhD " }, { "key": "Admit Date: ", "value": "07-Sep-2020 " }, { "key": "Discharge Date: ", "value": "08-Sep-2020 " }, { "key": "Discharge Disposition: ", "value": "Home with Support Services " }, { "key": "Pre-existing / Developed Conditions Impacting Hospital Stay: ", "value": "35 yo M c/o stomach problems since 2 months. Patient reports epigastric abdominal pain non- radiating. Pain is described as gnawing and burning, intermittent lasting 1-2 hours, and gotten progressively worse. Antacids used to alleviate pain but not anymore; nothing exacerbates pain. Pain unrelated to daytime or to meals. Patient denies constipation or diarrhea. Patient denies blood in stool but have noticed them darker. Patient also reports nausea. Denies recent illness or fever. He also reports fatigue for 2 weeks and bloating after eating. ROS: Negative except for above findings Meds: Motrin once/week. Tums previously. PMHx: Back pain and muscle spasms. No Hx of surgery. NKDA. FHx: Uncle has a bleeding ulcer. Social Hx: Smokes since 15 yo, 1/2-1 PPD. No recent EtOH use. Denies illicit drug use. Works on high elevation construction. Fast food diet. Exercises 3-4 times/week but stopped 2 weeks ago. " }, { "key": "Summary: ", "value": "some activity restrictions suggested, full course of antibiotics, check back with physican in case of relapse, strict diet " } ] }

Die Generierung dieser Zusammenfassungen mithilfe von IDP mit serverloser Implementierung in großem Maßstab hilft Unternehmen, auf kostengünstige Weise aussagekräftige, prägnante und darstellbare Daten zu erhalten. Step Functions beschränkt die Methode der Dokumentenverarbeitung nicht auf jeweils ein Dokument. Es ist verteilte Karte Mit dieser Funktion können große Mengen an Dokumenten nach einem Zeitplan zusammengefasst werden.

Das Beispielanwendung verwendet ein flan-t5 Modell mit umarmendem Gesicht; Sie können jedoch einen FM-Endpunkt Ihrer Wahl verwenden. Das Trainieren und Ausführen des Modells ist nicht Gegenstand der Beispielanwendung. Befolgen Sie die Anweisungen im GitHub-Repository, um eine Beispielanwendung bereitzustellen. Die vorstehende Architektur ist eine Anleitung, wie Sie einen IDP-Workflow mithilfe von Schrittfunktionen orchestrieren können. Siehe die IDP-Workshop zur generativen KI Ausführliche Anweisungen zum Erstellen einer Anwendung mit AWS AI-Services und FMs finden Sie hier.

Richten Sie die Lösung ein

Befolgen Sie die Schritte in der README Datei zum Festlegen der Lösungsarchitektur (außer für die SageMaker-Endpunkte). Nachdem Sie über einen eigenen SageMaker-Endpunkt verfügen, können Sie den Endpunktnamen als Parameter an die Vorlage übergeben.

Aufräumen

Um Kosten zu sparen, löschen Sie die Ressourcen, die Sie im Rahmen des Tutorials bereitgestellt haben:

  1. Befolgen Sie die Schritte im Bereinigungsabschnitt des README Datei.
  2. Löschen Sie alle Inhalte aus Ihrem S3-Bucket und löschen Sie den Bucket dann über die Amazon S3-Konsole.
  3. Löschen Sie alle SageMaker-Endpunkte, die Sie möglicherweise über die SageMaker-Konsole erstellt haben.

Zusammenfassung

Generative KI verändert die Art und Weise, wie Sie Dokumente mit IDP verarbeiten können, um Erkenntnisse abzuleiten. AWS-KI-Services wie Amazon Textract können zusammen mit AWS FMs dabei helfen, jede Art von Dokumenten präzise zu verarbeiten. Weitere Informationen zum Arbeiten mit generativer KI in AWS finden Sie unter Ankündigung neuer Tools für das Erstellen mit generativer KI auf AWS.


Über die Autoren

Verbesserung der intelligenten Dokumentenverarbeitung von AWS mit generativer KI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Sonali Sahu leitet die intelligente Dokumentenverarbeitung mit dem AI/ML-Services-Team in AWS. Sie ist Autorin, Vordenkerin und leidenschaftliche Technologin. Ihr Schwerpunkt liegt auf KI und ML, und sie spricht häufig auf KI- und ML-Konferenzen und Meetups auf der ganzen Welt. Sie verfügt über umfassende und fundierte Erfahrung in der Technologie und der Technologiebranche und verfügt über Branchenkenntnisse im Gesundheitswesen, im Finanzsektor und im Versicherungswesen.

Verbesserung der intelligenten Dokumentenverarbeitung von AWS mit generativer KI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Ashish Lal ist Senior Product Marketing Manager und leitet das Produktmarketing für KI-Dienste bei AWS. Er verfügt über 9 Jahre Marketingerfahrung und leitete die Produktmarketingbemühungen für die intelligente Dokumentenverarbeitung. Er erwarb seinen Master in Betriebswirtschaftslehre an der University of Washington.

Verbesserung der intelligenten Dokumentenverarbeitung von AWS mit generativer KI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Mrunal Daftari ist Enterprise Senior Solutions Architect bei Amazon Web Services. Er lebt in Boston, MA. Er ist ein Cloud-Enthusiast und sehr leidenschaftlich daran interessiert, Lösungen für Kunden zu finden, die einfach sind und sich an deren Geschäftsergebnissen orientieren. Er liebt die Arbeit mit Cloud-Technologien, die Bereitstellung einfacher, skalierbarer Lösungen, die zu positiven Geschäftsergebnissen und Cloud-Einführungsstrategien führen, sowie die Entwicklung innovativer Lösungen und die Förderung betrieblicher Exzellenz.

Verbesserung der intelligenten Dokumentenverarbeitung von AWS mit generativer KI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Dhiraj Mahapatro ist Principal Serverless Specialist Solutions Architect bei AWS. Er ist darauf spezialisiert, Finanzdienstleistern dabei zu helfen, serverlose und ereignisgesteuerte Architekturen einzuführen, um ihre Anwendungen zu modernisieren und ihr Innovationstempo zu beschleunigen. In letzter Zeit hat er daran gearbeitet, Container-Workloads und die praktische Nutzung generativer KI für Kunden aus der Finanzdienstleistungsbranche näher an Serverless und EDA heranzuführen.

Verbesserung der intelligenten Dokumentenverarbeitung von AWS mit generativer KI | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Jacob Hauskens ist ein leitender KI-Spezialist mit über 15 Jahren Erfahrung in der strategischen Geschäftsentwicklung und Partnerschaften. In den letzten sieben Jahren leitete er die Entwicklung und Umsetzung von Markteinführungsstrategien für neue KI-gestützte B7B-Dienste. Kürzlich hat er ISVs dabei geholfen, ihren Umsatz zu steigern, indem er generative KI zu intelligenten Dokumentenverarbeitungs-Workflows hinzugefügt hat.

Zeitstempel:

Mehr von AWS Maschinelles Lernen