Aprimorando o processamento inteligente de documentos da AWS com IA generativa | Amazon Web Services

Aprimorando o processamento inteligente de documentos da AWS com IA generativa | Amazon Web Services

A classificação, extração e análise de dados podem ser desafiadoras para organizações que lidam com volumes de documentos. As soluções tradicionais de processamento de documentos são manuais, caras, propensas a erros e difíceis de dimensionar. Processamento inteligente de documentos (IDP) da AWS, com serviços de IA, como amazontext, permite que você aproveite a tecnologia de aprendizado de máquina (ML) líder do setor para processar dados com rapidez e precisão de qualquer documento ou imagem digitalizada. A inteligência artificial generativa (IA generativa) complementa o Amazon Textract para automatizar ainda mais os fluxos de trabalho de processamento de documentos. Recursos como normalização de campos-chave e resumo de dados de entrada oferecem suporte a ciclos mais rápidos para gerenciar fluxos de trabalho de processo de documentos, ao mesmo tempo em que reduzem o potencial de erros.

A IA generativa é impulsionada por grandes modelos de ML chamados modelos de fundação (FMs). Os FMs estão transformando a maneira como você pode resolver cargas de trabalho de processamento de documentos tradicionalmente complexos. Além dos recursos existentes, as empresas precisam resumir categorias específicas de informações, incluindo dados de débito e crédito de documentos como relatórios financeiros e extratos bancários. Os FMs facilitam a geração de tais percepções a partir dos dados extraídos. Para otimizar o tempo gasto na revisão humana e melhorar a produtividade dos funcionários, erros como a falta de dígitos em números de telefone, falta de documentos ou endereços sem números de rua podem ser sinalizados de forma automatizada. No cenário atual, você precisa dedicar recursos para realizar tais tarefas usando revisão humana e scripts complexos. Essa abordagem é tediosa e cara. Os FMs podem ajudar a concluir essas tarefas mais rapidamente, com menos recursos e transformar vários formatos de entrada em um modelo padrão que pode ser processado posteriormente. Na AWS, oferecemos serviços como Rocha Amazônica, a maneira mais fácil de criar e dimensionar aplicativos de IA generativos com FMs. O Amazon Bedrock é um serviço totalmente gerenciado que disponibiliza FMs das principais startups de IA e da Amazon por meio de uma API, para que você possa encontrar o modelo que melhor atende às suas necessidades. Nós também oferecemos JumpStart do Amazon SageMaker, que permite aos profissionais de ML escolher entre uma ampla seleção de FMs de código aberto. Os profissionais de ML podem implantar FMs para dedicados Amazon Sage Maker instâncias de um ambiente isolado de rede e personalize modelos usando o SageMaker para treinamento e implantação de modelo.

Ricoh oferece soluções de local de trabalho e serviços de transformação digital projetados para ajudar os clientes a gerenciar e otimizar o fluxo de informações em seus negócios. Ashok Shenoy, vice-presidente de desenvolvimento de soluções de portfólio, diz: “Estamos adicionando IA generativa às nossas soluções de IDP para ajudar nossos clientes a realizar seu trabalho com mais rapidez e precisão, utilizando novos recursos, como perguntas e respostas, resumo e saídas padronizadas. A AWS nos permite aproveitar a IA generativa, mantendo cada um dos dados de nossos clientes separados e seguros.”

Nesta postagem, compartilhamos como aprimorar sua solução de IDP na AWS com IA generativa.

Melhorando o pipeline de IDP

Nesta seção, revisamos como o pipeline IDP tradicional pode ser aumentado por FMs e percorremos um exemplo de caso de uso usando o Amazon Textract com FMs.

O AWS IDP é composto de três estágios: classificação, extração e enriquecimento. Para mais detalhes sobre cada estágio, consulte Processamento inteligente de documentos com serviços de IA da AWS: parte 1 e Parte 2. No estágio de classificação, os FMs agora podem classificar documentos sem nenhum treinamento adicional. Isso significa que os documentos podem ser categorizados mesmo que o modelo não tenha visto exemplos semelhantes antes. Os FMs no estágio de extração normalizam os campos de data e verificam endereços e números de telefone, garantindo a consistência da formatação. FMs no estágio de enriquecimento permitem inferência, raciocínio lógico e resumo. Ao usar FMs em cada estágio do IDP, seu fluxo de trabalho será mais simplificado e o desempenho melhorará. O diagrama a seguir ilustra o pipeline IDP com IA generativa.

Pipeline de processamento de documentos inteligente com IA generativa

Estágio de extração do pipeline IDP

Quando os FMs não podem processar documentos diretamente em seus formatos nativos (como PDFs, img, jpeg e tiff) como uma entrada, é necessário um mecanismo para converter documentos em texto. Para extrair o texto do documento antes de enviá-lo para os FMs, você pode usar o Amazon Textract. Com o Amazon Textract, você pode extrair linhas e palavras e passá-las para FMs downstream. A arquitetura a seguir usa o Amazon Textract para extração precisa de texto de qualquer tipo de documento antes de enviá-lo para FMs para processamento adicional.

Textract ingere dados do documento para os modelos de fundação

Normalmente, os documentos são compostos de informações estruturadas e semiestruturadas. O Amazon Textract pode ser usado para extrair texto bruto e dados de tabelas e formulários. A relação entre os dados em tabelas e formulários desempenha um papel vital na automação de processos de negócios. Certos tipos de informação podem não ser processados ​​pelos FMs. Como resultado, podemos optar por armazenar essas informações em um armazenamento a jusante ou enviá-las para FMs. A figura a seguir é um exemplo de como o Amazon Textract pode extrair informações estruturadas e semiestruturadas de um documento, além de linhas de texto que precisam ser processadas por FMs.

Aprimorando o processamento inteligente de documentos da AWS com IA generativa | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.

Usando serviços sem servidor da AWS para resumir com FMs

O pipeline de IDP que ilustramos anteriormente pode ser totalmente automatizado usando os serviços sem servidor da AWS. Documentos altamente desestruturados são comuns em grandes empresas. Esses documentos podem abranger desde documentos da Securities and Exchange Commission (SEC) no setor bancário até documentos de cobertura no setor de seguros de saúde. Com a evolução da IA ​​generativa na AWS, as pessoas desses setores estão procurando maneiras de obter um resumo desses documentos de maneira automatizada e econômica. Os serviços sem servidor ajudam a fornecer o mecanismo para criar uma solução para IDP rapidamente. Serviços como AWS Lambda, Funções de etapa da AWS e Amazon Event Bridge pode ajudar a construir o pipeline de processamento de documentos com integração de FMs, conforme mostrado no diagrama a seguir.

Processamento de documentos de ponta a ponta com Amazon Textract e Generative AI

A aplicativo de amostra usado na arquitetura anterior é impulsionado por eventos. Um evento é definido como uma mudança de estado que ocorreu recentemente. Por exemplo, quando um objeto é carregado em um Serviço de armazenamento simples da Amazon (Amazon S3), o Amazon S3 emite um evento Object Created. Essa notificação de evento do Amazon S3 pode acionar uma função do Lambda ou um fluxo de trabalho do Step Functions. Este tipo de arquitetura é denominado como arquitetura orientada a eventos. Nesta postagem, nosso aplicativo de amostra usa uma arquitetura orientada a eventos para processar uma amostra de documento de alta médica e resumir os detalhes do documento. O fluxo funciona da seguinte forma:

  1. Quando um documento é carregado em um bucket do S3, o Amazon S3 aciona um evento Object Created.
  2. O barramento de eventos padrão do EventBridge propaga o evento para o Step Functions com base em uma regra do EventBridge.
  3. O fluxo de trabalho da máquina de estado processa o documento, começando com Amazon Textract.
  4. Uma função do Lambda transforma os dados analisados ​​para a próxima etapa.
  5. A máquina de estado invoca a Endpoint SageMaker, que hospeda o FM usando a integração direta do AWS SDK.
  6. Um bucket de destino S3 resumido recebe a resposta resumida coletada do FM.

Usamos o aplicativo de exemplo com um flan-t5 Modelo de rosto abraçado para resumir o exemplo de resumo de alta do paciente a seguir usando o fluxo de trabalho do Step Functions.

resumo de alta do paciente

O fluxo de trabalho do Step Functions usa Integração do AWS SDK para chamar o Amazon Textract Analisar Documento e tempo de execução do SageMaker InvocarEndpoint APIs, conforme mostrado na figura a seguir.

de gestão de documentos

Esse fluxo de trabalho resulta em um objeto JSON de resumo que é armazenado em um bucket de destino. O objeto JSON tem a seguinte aparência:

{ "summary": [ "John Doe is a 35-year old male who has been experiencing stomach problems for two months. He has been taking antibiotics for the last two weeks, but has not been able to eat much. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has also noticed a change in his stool color, which is now darker. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of fatigue, and has been unable to work for the last two weeks. He has also been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help. He has been experiencing a lot of abdominal pain, bloating, and fatigue. He has been taking antacids for the last two weeks, but they no longer help." ], "forms": [ { "key": "Ph: ", "value": "(888)-(999)-(0000) " }, { "key": "Fax: ", "value": "(888)-(999)-(1111) " }, { "key": "Patient Name: ", "value": "John Doe " }, { "key": "Patient ID: ", "value": "NARH-36640 " }, { "key": "Gender: ", "value": "Male " }, { "key": "Attending Physician: ", "value": "Mateo Jackson, PhD " }, { "key": "Admit Date: ", "value": "07-Sep-2020 " }, { "key": "Discharge Date: ", "value": "08-Sep-2020 " }, { "key": "Discharge Disposition: ", "value": "Home with Support Services " }, { "key": "Pre-existing / Developed Conditions Impacting Hospital Stay: ", "value": "35 yo M c/o stomach problems since 2 months. Patient reports epigastric abdominal pain non- radiating. Pain is described as gnawing and burning, intermittent lasting 1-2 hours, and gotten progressively worse. Antacids used to alleviate pain but not anymore; nothing exacerbates pain. Pain unrelated to daytime or to meals. Patient denies constipation or diarrhea. Patient denies blood in stool but have noticed them darker. Patient also reports nausea. Denies recent illness or fever. He also reports fatigue for 2 weeks and bloating after eating. ROS: Negative except for above findings Meds: Motrin once/week. Tums previously. PMHx: Back pain and muscle spasms. No Hx of surgery. NKDA. FHx: Uncle has a bleeding ulcer. Social Hx: Smokes since 15 yo, 1/2-1 PPD. No recent EtOH use. Denies illicit drug use. Works on high elevation construction. Fast food diet. Exercises 3-4 times/week but stopped 2 weeks ago. " }, { "key": "Summary: ", "value": "some activity restrictions suggested, full course of antibiotics, check back with physican in case of relapse, strict diet " } ] }

Gerar esses resumos usando o IDP com implementação sem servidor em escala ajuda as organizações a obter dados significativos, concisos e apresentáveis ​​de maneira econômica. O Step Functions não limita o método de processamento de documentos a um documento por vez. Isso é mapa distribuído recurso pode resumir um grande número de documentos em uma programação.

A aplicativo de amostra utiliza um flan-t5 Modelo de rosto abraçado; no entanto, você pode usar um endpoint FM de sua escolha. O treinamento e a execução do modelo estão fora do escopo do aplicativo de amostra. Siga as instruções no repositório GitHub para implantar um aplicativo de exemplo. A arquitetura anterior é uma orientação sobre como você pode orquestrar um fluxo de trabalho IDP usando o Step Functions. Consulte o Workshop de IDP Generativa para obter instruções detalhadas sobre como criar um aplicativo com serviços de IA e FMs da AWS.

Configure a solução

Siga as etapas no README arquivo para definir a arquitetura da solução (exceto para os endpoints do SageMaker). Depois de ter seu próprio endpoint do SageMaker disponível, você pode passar o nome do endpoint como um parâmetro para o modelo.

limpar

Para economizar custos, exclua os recursos implantados como parte do tutorial:

  1. Siga as etapas na seção de limpeza do README arquivo.
  2. Exclua qualquer conteúdo do seu bucket do S3 e, em seguida, exclua o bucket por meio do console do Amazon S3.
  3. Exclua todos os endpoints do SageMaker que você possa ter criado por meio do console do SageMaker.

Conclusão

A IA generativa está mudando a forma como você pode processar documentos com o IDP para obter insights. Os serviços de AI da AWS, como o Amazon Textract, juntamente com FMs da AWS, podem ajudar a processar com precisão qualquer tipo de documento. Para obter mais informações sobre como trabalhar com IA generativa na AWS, consulte Anunciando novas ferramentas para criar com IA generativa na AWS.


Sobre os autores

Aprimorando o processamento inteligente de documentos da AWS com IA generativa | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.Sonali Sahu está liderando o processamento inteligente de documentos com a equipe de serviços AI/ML na AWS. Ela é autora, líder de pensamento e tecnóloga apaixonada. Sua principal área de foco é IA e ML, e ela costuma falar em conferências e encontros de IA e ML em todo o mundo. Ela tem ampla e profunda experiência em tecnologia e no setor de tecnologia, com experiência no setor de saúde, setor financeiro e seguros.

Aprimorando o processamento inteligente de documentos da AWS com IA generativa | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.Ashish Lal é um gerente sênior de marketing de produtos que lidera o marketing de produtos para serviços de IA na AWS. Ele tem 9 anos de experiência em marketing e liderou o esforço de marketing de produto para processamento inteligente de documentos. Ele obteve seu mestrado em Administração de Empresas na Universidade de Washington.

Aprimorando o processamento inteligente de documentos da AWS com IA generativa | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.Mrunal Daftari é arquiteto sênior de soluções corporativas na Amazon Web Services. Ele mora em Boston, MA. Ele é um entusiasta da nuvem e muito apaixonado por encontrar soluções para clientes que sejam simples e abordem seus resultados de negócios. Ele adora trabalhar com tecnologias de nuvem, fornecendo soluções simples e escaláveis ​​que geram resultados de negócios positivos, estratégia de adoção de nuvem e soluções inovadoras de design e excelência operacional.

Aprimorando o processamento inteligente de documentos da AWS com IA generativa | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.Dhiraj Mahapatro é Arquiteto Principal de Soluções Serverless Specialist na AWS. Ele é especialista em ajudar os serviços financeiros corporativos a adotar arquiteturas sem servidor e orientadas a eventos para modernizar seus aplicativos e acelerar o ritmo de inovação. Recentemente, ele tem trabalhado para aproximar cargas de trabalho de contêineres e uso prático de IA generativa de serverless e EDA para clientes do setor de serviços financeiros.

Aprimorando o processamento inteligente de documentos da AWS com IA generativa | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai.Jacob Hauskens é um Principal AI Specialist com mais de 15 anos de experiência em desenvolvimento de negócios estratégicos e parcerias. Nos últimos 7 anos, ele liderou a criação e implementação de estratégias de entrada no mercado para novos serviços B2B com tecnologia de IA. Recentemente, ele ajudou ISVs a aumentar sua receita adicionando IA generativa a fluxos de trabalho inteligentes de processamento de documentos.

Carimbo de hora:

Mais de Aprendizado de máquina da AWS