Tùy chỉnh các quy tắc kinh doanh để xử lý tài liệu thông minh với sự đánh giá của con người và trực quan hóa BI PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Tùy chỉnh các quy tắc kinh doanh để xử lý tài liệu thông minh với sự xem xét của con người và trực quan hóa BI

Một lượng lớn tài liệu kinh doanh được xử lý hàng ngày trên các ngành. Nhiều tài liệu trong số này ở dạng giấy, được quét vào hệ thống của bạn dưới dạng hình ảnh hoặc ở định dạng phi cấu trúc như PDF. Mỗi công ty có thể áp dụng các quy tắc duy nhất liên quan đến nền tảng kinh doanh của mình trong khi xử lý các tài liệu này. Làm thế nào để trích xuất thông tin một cách chính xác và xử lý chúng một cách linh hoạt là một thách thức mà nhiều công ty phải đối mặt.

Xử lý tài liệu thông minh của Amazon (IDP) cho phép bạn tận dụng lợi thế của công nghệ máy học (ML) hàng đầu trong ngành mà không cần trải nghiệm ML trước đó. Bài đăng này giới thiệu một giải pháp được bao gồm trong Hội thảo IDP của Amazon giới thiệu cách xử lý tài liệu để phục vụ các quy tắc kinh doanh linh hoạt bằng cách sử dụng các dịch vụ AI của Amazon. Bạn có thể sử dụng từng bước sau Máy tính xách tay Jupyter để hoàn thành phòng thí nghiệm.

Văn bản Amazon giúp bạn dễ dàng trích xuất văn bản từ các tài liệu khác nhau và AI tăng cường của Amazon (Amazon A2I) cho phép bạn triển khai đánh giá của con người về các dự đoán ML. Mẫu Amazon A2I mặc định cho phép bạn xây dựng quy trình đánh giá của con người dựa trên các quy tắc, chẳng hạn như khi điểm tin cậy trích xuất thấp hơn ngưỡng được xác định trước hoặc thiếu các khóa bắt buộc. Nhưng trong môi trường sản xuất, bạn cần quy trình xử lý tài liệu để hỗ trợ các quy tắc kinh doanh linh hoạt, chẳng hạn như xác thực định dạng chuỗi, xác minh loại và phạm vi dữ liệu cũng như xác thực các trường trên tài liệu. Bài đăng này cho thấy cách bạn có thể sử dụng Amazon Textract và Amazon A2I để tùy chỉnh một quy trình xử lý tài liệu chung hỗ trợ các quy tắc kinh doanh linh hoạt.

Tổng quan về giải pháp

Đối với giải pháp mẫu của chúng tôi, chúng tôi sử dụng Biểu mẫu thuế 990, một biểu mẫu IRS (Sở Thuế vụ) của Hoa Kỳ cung cấp cho công chúng thông tin tài chính về một tổ chức phi lợi nhuận. Đối với ví dụ này, chúng tôi chỉ đề cập đến logic trích xuất cho một số trường trên trang đầu tiên của biểu mẫu. Bạn có thể tìm thêm các tài liệu mẫu trên Trang web của IRS.

Sơ đồ sau minh họa quy trình IDP hỗ trợ các quy tắc kinh doanh tùy chỉnh với sự xem xét của con người.

Kiến trúc bao gồm ba giai đoạn hợp lý:

  • Khai thác - Trích xuất dữ liệu từ Biểu mẫu thuế 990 (chúng tôi sử dụng trang 1 làm ví dụ).
  • THẨM ĐỊNH - Áp dụng các quy tắc kinh doanh linh hoạt với sự đánh giá trực tiếp của con người.
    • Xác thực dữ liệu được trích xuất theo các quy tắc kinh doanh, chẳng hạn như xác thực độ dài của trường ID.
    • Gửi tài liệu tới Amazon A2I để nhân viên xem xét nếu bất kỳ quy tắc kinh doanh nào không thành công.
    • Người đánh giá sử dụng giao diện người dùng Amazon A2I (một trang web có thể tùy chỉnh) để xác minh kết quả trích xuất.
  • Hình ảnh BI - Chúng tôi sử dụng Amazon QuickSight để xây dựng bảng điều khiển thông minh kinh doanh (BI) hiển thị thông tin chi tiết về quy trình.

Tùy chỉnh các quy tắc kinh doanh

Bạn có thể xác định quy tắc kinh doanh chung ở định dạng JSON sau. Trong mã mẫu, chúng tôi xác định ba quy tắc:

  • Quy tắc đầu tiên dành cho trường ID nhà tuyển dụng. Quy tắc không thành công nếu điểm tin cậy của Amazon Textract thấp hơn 99%. Đối với bài đăng này, chúng tôi đặt ngưỡng điểm tin cậy cao, ngưỡng này sẽ phá vỡ theo thiết kế. Bạn có thể điều chỉnh ngưỡng thành một giá trị hợp lý hơn để giảm nỗ lực không cần thiết của con người trong môi trường thực tế, chẳng hạn như 90%.
  • Quy tắc thứ hai dành cho trường DLN (mã định danh duy nhất của biểu mẫu thuế), bắt buộc đối với logic xử lý xuôi dòng. Quy tắc này không thành công nếu trường DLN bị thiếu hoặc có giá trị trống.
  • Quy tắc thứ ba cũng dành cho trường DLN nhưng với một loại điều kiện khác: LengthCheck. Quy tắc bị phá vỡ nếu độ dài DLN không phải là 16 ký tự.

Đoạn mã sau hiển thị các quy tắc kinh doanh của chúng tôi ở định dạng JSON:

rules = [
    {
        "description": "Employee Id confidence score should greater than 99",
        "field_name": "d.employer_id",
        "field_name_regex": None, # support Regex: "_confidence$",
        "condition_category": "Confidence",
        "condition_type": "ConfidenceThreshold",
        "condition_setting": "99",
    },
    {
        "description": "dln is required",
        "field_name": "dln",
        "condition_category": "Required",
        "condition_type": "Required",
        "condition_setting": None,
    },
    {
        "description": "dln length should be 16",
        "field_name": "dln",
        "condition_category": "LengthCheck",
        "condition_type": "ValueRegex",
        "condition_setting": "^[0-9a-zA-Z]{16}$",
    }
]

Bạn có thể mở rộng giải pháp bằng cách thêm nhiều quy tắc nghiệp vụ hơn theo cùng một cấu trúc.

Trích xuất văn bản bằng truy vấn Amazon Textract

Trong giải pháp mẫu, chúng tôi gọi API phân tích_document của Amazon Textract truy vấn tính năng trích xuất các trường bằng cách đặt các câu hỏi cụ thể. Bạn không cần phải biết cấu trúc của dữ liệu trong tài liệu (bảng, biểu mẫu, trường ngụ ý, dữ liệu lồng nhau) hoặc lo lắng về các biến thể giữa các phiên bản và định dạng tài liệu. Các truy vấn sử dụng kết hợp các dấu hiệu hình ảnh, không gian và ngôn ngữ để trích xuất thông tin bạn tìm kiếm với độ chính xác cao.

Để trích xuất giá trị cho trường DLN, bạn có thể gửi yêu cầu với các câu hỏi bằng ngôn ngữ tự nhiên, chẳng hạn như "DLN là gì?" Amazon Textract trả về văn bản, độ tin cậy và siêu dữ liệu khác nếu nó tìm thấy thông tin tương ứng trên hình ảnh hoặc tài liệu. Sau đây là ví dụ về yêu cầu truy vấn Textract của Amazon:

textract.analyze_document(
        Document={'S3Object': {'Bucket': data_bucket, 'Name': s3_key}},
        FeatureTypes=["QUERIES"],
        QueriesConfig={
                'Queries': [
                    {
                        'Text': 'What is the DLN?',
                       'Alias': 'The DLN number - unique identifier of the form'
                    }
               ]
        }
)

Xác định mô hình dữ liệu

Giải pháp mẫu xây dựng dữ liệu theo định dạng có cấu trúc để phục vụ đánh giá quy tắc kinh doanh chung. Để giữ các giá trị được trích xuất, bạn có thể xác định mô hình dữ liệu cho mỗi trang tài liệu. Hình ảnh sau đây cho thấy cách văn bản trên trang 1 ánh xạ tới các trường JSON.Mô hình dữ liệu tùy chỉnh

Mỗi trường đại diện cho văn bản, hộp kiểm hoặc ô bảng / biểu mẫu của tài liệu trên trang. Đối tượng JSON trông giống như đoạn mã sau:

{
    "dln": {
        "value": "93493319020929",
        "confidence": 0.9765, 
        "block": {} 
    },
    "omb_no": {
        "value": "1545-0047",
        "confidence": 0.9435,
        "block": {}
    },
    ...
}

Bạn có thể tìm thấy định nghĩa cấu trúc JSON chi tiết trong Repo GitHub.

Đánh giá dữ liệu so với các quy tắc kinh doanh

Giải pháp mẫu đi kèm với lớp Điều kiện — một công cụ quy tắc chung lấy dữ liệu được trích xuất (như được xác định trong mô hình dữ liệu) và các quy tắc (như được định nghĩa trong các quy tắc nghiệp vụ tùy chỉnh). Nó trả về hai danh sách với các điều kiện không thành công và thỏa mãn. Chúng tôi có thể sử dụng kết quả để quyết định xem chúng tôi có nên gửi tài liệu đến Amazon A2I để con người xem xét hay không.

Mã nguồn lớp Điều kiện có trong mẫu Repo GitHub. Nó hỗ trợ logic xác thực cơ bản, chẳng hạn như xác thực độ dài, phạm vi giá trị và ngưỡng điểm tin cậy của một chuỗi. Bạn có thể sửa đổi mã để hỗ trợ nhiều loại điều kiện hơn và logic xác thực phức tạp.

Tạo giao diện người dùng web Amazon A2I tùy chỉnh

Amazon A2I cho phép bạn tùy chỉnh giao diện người dùng web của người đánh giá bằng cách xác định mẫu nhiệm vụ công nhân. Mẫu là một trang web tĩnh trong HTML và JavaScript. Bạn có thể chuyển dữ liệu đến trang người đánh giá tùy chỉnh bằng cách sử dụng Chất lỏng cú pháp.

Trong giải pháp mẫu, mẫu giao diện người dùng Amazon A2I tùy chỉnh hiển thị trang ở bên trái và các điều kiện hỏng hóc ở bên phải. Người đánh giá có thể sử dụng nó để sửa giá trị trích xuất và thêm nhận xét của họ.

Ảnh chụp màn hình sau đây cho thấy giao diện người dùng Amazon A2I tùy chỉnh của chúng tôi. Nó hiển thị tài liệu hình ảnh gốc ở bên trái và các điều kiện không thành công sau ở bên phải:

  • Số DLN phải dài 16 ký tự. DLN thực tế có 15 ký tự.
  • Điểm tin cậy của Employ_id thấp hơn 99%. Điểm tin cậy thực tế là khoảng 98%.

Người đánh giá có thể xác minh các kết quả này theo cách thủ công và thêm nhận xét trong THAY ĐỔI LÝ DO hộp văn bản.Giao diện người dùng đánh giá A2I tùy chỉnh

Để biết thêm thông tin về việc tích hợp Amazon A2I vào bất kỳ quy trình làm việc ML tùy chỉnh nào, hãy tham khảo hơn 60 các mẫu công nhân được tạo sẵn trên repo GitHub và Sử dụng AI tăng cường của Amazon với các loại tác vụ tùy chỉnh.

Xử lý đầu ra Amazon A2I

Sau khi người đánh giá sử dụng giao diện người dùng tùy chỉnh Amazon A2I xác minh kết quả và chọn Gửi, Amazon A2I lưu trữ tệp JSON trong thư mục nhóm S3. Tệp JSON bao gồm thông tin sau ở cấp cơ sở:

  • Định nghĩa luồng Amazon A2I ARN và tên vòng lặp của con người
  • Câu trả lời của con người (đầu vào của người đánh giá được thu thập bởi giao diện người dùng Amazon A2I tùy chỉnh)
  • Nội dung đầu vào (dữ liệu gốc được gửi đến Amazon A2I khi bắt đầu tác vụ lặp của con người)

Sau đây là JSON mẫu do Amazon A2I tạo:

{
  "flowDefinitionArn": "arn:aws:sagemaker:us-east-1:711334203977:flow-definition/a2i-custom-ui-demo-workflow",
  "humanAnswers": [
    {
      "acceptanceTime": "2022-08-23T15:23:53.488Z",
      "answerContent": {
        "Change Reason 1": "Missing X at the end.",
        "True Value 1": "93493319020929X",
        "True Value 2": "04-3018996"
      },
      "submissionTime": "2022-08-23T15:24:47.991Z",
      "timeSpentInSeconds": 54.503,
      "workerId": "94de99f1bc6324b8",
      "workerMetadata": {
        "identityData": {
          "identityProviderType": "Cognito",
          "issuer": "https://cognito-idp.us-east-1.amazonaws.com/us-east-1_URd6f6sie",
          "sub": "cef8d484-c640-44ea-8369-570cdc132d2d"
        }
      }
    }
  ],
  "humanLoopName": "custom-loop-9b4e67ff-2c9f-40f9-aae5-0e26316c905c",
  "inputContent": {...} # the original input send to A2I when starting the human review task
}

Bạn có thể triển khai logic trích xuất, chuyển đổi và tải (ETL) để phân tích cú pháp thông tin từ JSON đầu ra của Amazon A2I và lưu trữ nó trong một tệp hoặc cơ sở dữ liệu. Giải pháp mẫu đi kèm với Tệp CSV với dữ liệu đã xử lý. Bạn có thể sử dụng nó để xây dựng bảng điều khiển BI bằng cách làm theo hướng dẫn trong phần tiếp theo.

Tạo trang tổng quan trong Amazon QuickSight

Giải pháp mẫu bao gồm giai đoạn báo cáo với trang tổng quan trực quan hóa do Amazon QuickSight cung cấp. Bảng điều khiển BI hiển thị các chỉ số chính như số lượng tài liệu được xử lý tự động hoặc thủ công, các trường phổ biến nhất yêu cầu con người xem xét và các thông tin chi tiết khác. Trang tổng quan này có thể giúp bạn giám sát quá trình xử lý tài liệu và phân tích các lý do phổ biến khiến con người xem xét. Bạn có thể tối ưu hóa quy trình làm việc bằng cách giảm bớt đầu vào của con người.

Trang tổng quan mẫu bao gồm các chỉ số cơ bản. Bạn có thể mở rộng giải pháp bằng cách sử dụng Amazon QuickSight để hiển thị thêm thông tin chi tiết về dữ liệu.Bảng điều khiển BI

Mở rộng giải pháp để hỗ trợ nhiều tài liệu và quy tắc kinh doanh hơn

Để mở rộng giải pháp hỗ trợ nhiều trang tài liệu hơn với các quy tắc nghiệp vụ tương ứng, bạn cần thực hiện các thay đổi sau:

  • Tạo mô hình dữ liệu cho trang mới trong cấu trúc JSON đại diện cho tất cả các giá trị bạn muốn trích xuất từ ​​các trang. Tham khảo đến Xác định mô hình dữ liệu cho một định dạng chi tiết.
  • Sử dụng Amazon Textract để trích xuất văn bản ra khỏi tài liệu và điền các giá trị vào mô hình dữ liệu.
  • Thêm quy tắc kinh doanh tương ứng với trang ở định dạng JSON. Tham khảo đến Tùy chỉnh các quy tắc kinh doanh phần cho định dạng chi tiết.

Giao diện người dùng Amazon A2I tùy chỉnh trong giải pháp là chung, không yêu cầu thay đổi để hỗ trợ các quy tắc kinh doanh mới.

Kết luận

Xử lý tài liệu thông minh đang có nhu cầu cao và các công ty cần một đường ống tùy chỉnh để hỗ trợ logic kinh doanh độc đáo của họ. Amazon A2I cũng cung cấp mẫu tích hợp được tích hợp với Amazon Textract để triển khai các trường hợp sử dụng đánh giá con người của bạn. Nó cũng cho phép bạn tùy chỉnh trang người đánh giá để phục vụ các yêu cầu linh hoạt.

Bài đăng này đã hướng dẫn bạn giải pháp tham khảo bằng cách sử dụng Amazon Textract và Amazon A2I để xây dựng đường dẫn IDP hỗ trợ các quy tắc kinh doanh linh hoạt. Bạn có thể dùng thử bằng cách sử dụng Máy tính xách tay Jupyter trong repo hội thảo GitHub IDP.


Giới thiệu về tác giả

Tùy chỉnh các quy tắc kinh doanh để xử lý tài liệu thông minh với sự đánh giá của con người và trực quan hóa BI PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Trương Lana là Kiến trúc sư Giải pháp Sơ cấp tại nhóm Dịch vụ AI của AWS WWSO với chuyên môn về AI và ML để xử lý tài liệu thông minh và kiểm duyệt nội dung. Cô ấy đam mê quảng bá các dịch vụ AWS AI và giúp khách hàng chuyển đổi các giải pháp kinh doanh của họ.

Tùy chỉnh các quy tắc kinh doanh để xử lý tài liệu thông minh với sự đánh giá của con người và trực quan hóa BI PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.
Sonali Sahu là đội ngũ Kiến trúc sư Giải pháp AI / ML Xử lý Tài liệu Thông minh hàng đầu tại Amazon Web Services. Cô ấy là một người đam mê công nghệ và thích làm việc với khách hàng để giải quyết các vấn đề phức tạp bằng cách sử dụng sự đổi mới. Lĩnh vực trọng tâm của cô là Trí tuệ nhân tạo & Máy học để xử lý tài liệu thông minh.

Dấu thời gian:

Thêm từ Học máy AWS