Dữ liệu có cấu trúc, được định nghĩa là dữ liệu theo một mẫu cố định, chẳng hạn như thông tin được lưu trữ trong các cột trong cơ sở dữ liệu và dữ liệu phi cấu trúc, thiếu biểu mẫu hoặc mẫu cụ thể như văn bản, hình ảnh hoặc bài đăng trên mạng xã hội, cả hai đều tiếp tục phát triển khi chúng được sản xuất và tiêu thụ bởi các tổ chức khác nhau. Chẳng hạn, theo Tập đoàn Dữ liệu Quốc tế (IDC), khối lượng dữ liệu của thế giới dự kiến sẽ tăng gấp 2025 lần vào năm 2, trong đó dữ liệu phi cấu trúc chiếm một phần đáng kể. Doanh nghiệp có thể muốn thêm siêu dữ liệu tùy chỉnh như loại tài liệu (biểu mẫu W-XNUMX hoặc cuống phiếu lương), nhiều loại thực thể khác nhau như tên, tổ chức và địa chỉ, ngoài siêu dữ liệu tiêu chuẩn như loại tệp, ngày tạo hoặc kích thước để mở rộng thông minh tìm kiếm trong khi nhập tài liệu. Siêu dữ liệu tùy chỉnh giúp các tổ chức, doanh nghiệp phân loại thông tin theo cách ưa thích của họ. Ví dụ: siêu dữ liệu có thể được sử dụng để lọc và tìm kiếm. Khách hàng có thể tạo siêu dữ liệu tùy chỉnh bằng cách sử dụng Amazon hiểu, một dịch vụ xử lý ngôn ngữ tự nhiên (NLP) do AWS quản lý để trích xuất thông tin chi tiết về nội dung của tài liệu và nhập thông tin đó vào Amazon Kendra cùng với dữ liệu của họ vào chỉ mục. Amazon Kendra là dịch vụ tìm kiếm doanh nghiệp có độ chính xác cao và dễ sử dụng được hỗ trợ bởi Machine Learning (AWS). Sau đó, siêu dữ liệu tùy chỉnh có thể được sử dụng để làm phong phú nội dung tốt hơn lọc và khía cạnh khả năng. Trong Amazon Kendra, các khía cạnh là các chế độ xem có phạm vi của một tập hợp kết quả tìm kiếm. Ví dụ: bạn có thể cung cấp kết quả tìm kiếm cho các thành phố trên khắp thế giới, nơi tài liệu được lọc theo thành phố cụ thể mà chúng được liên kết. Bạn cũng có thể tạo các khía cạnh để hiển thị kết quả của một tác giả cụ thể.
Các công ty bảo hiểm đang phải chịu gánh nặng với số lượng yêu cầu bồi thường ngày càng tăng mà họ phải xử lý. Ngoài ra, sự phức tạp của việc xử lý yêu cầu bồi thường cũng ngày càng tăng do có nhiều loại tài liệu bảo hiểm liên quan và các thực thể tùy chỉnh trong mỗi tài liệu này. Trong bài đăng này, chúng tôi mô tả một trường hợp sử dụng để làm phong phú nội dung tùy chỉnh cho các nhà cung cấp bảo hiểm. Nhà cung cấp bảo hiểm nhận được yêu cầu thanh toán từ luật sư của người thụ hưởng đối với các loại bảo hiểm khác nhau, chẳng hạn như bảo hiểm nhà, ô tô và nhân thọ. Trong trường hợp sử dụng này, tài liệu mà nhà cung cấp bảo hiểm nhận được không chứa bất kỳ siêu dữ liệu nào cho phép tìm kiếm nội dung dựa trên các thực thể và lớp nhất định. Nhà cung cấp bảo hiểm muốn lọc nội dung Kendra dựa trên các thực thể và lớp tùy chỉnh dành riêng cho miền kinh doanh của họ. Bài đăng này minh họa cách bạn có thể tự động hóa và đơn giản hóa việc tạo siêu dữ liệu bằng cách sử dụng các mô hình tùy chỉnh của Amazon Comprehend. Siêu dữ liệu được tạo có thể được tùy chỉnh trong quá trình nhập bằng Amazon Kendra Làm giàu tài liệu tùy chỉnh (CDE) logic tùy chỉnh.
Hãy xem một số ví dụ về tìm kiếm trên Amazon Kendra có hoặc không có khả năng lọc và khía cạnh.
Trong ảnh chụp màn hình sau, Amazon Kendra cung cấp kết quả tìm kiếm nhưng không có tùy chọn nào để thu hẹp hơn nữa kết quả tìm kiếm bằng cách sử dụng bất kỳ bộ lọc nào.
Ảnh chụp màn hình sau đây cho thấy kết quả tìm kiếm của Amazon Kendra có thể được lọc bằng cách sử dụng các khía cạnh khác nhau như Công ty luật, Số chính sách, được tạo bởi siêu dữ liệu tùy chỉnh để thu hẹp kết quả tìm kiếm.
Giải pháp được thảo luận trong bài đăng này cũng có thể dễ dàng áp dụng cho các doanh nghiệp/trường hợp sử dụng khác, chẳng hạn như chăm sóc sức khỏe, sản xuất và nghiên cứu.
Tổng quan về giải pháp
Trong giải pháp được đề xuất này, chúng tôi sẽ 1) phân loại các yêu cầu bồi thường bảo hiểm được gửi thành các loại khác nhau và 2) truy xuất các thực thể cụ thể về bảo hiểm từ các tài liệu này. Khi quá trình này hoàn tất, tài liệu có thể được chuyển đến bộ phận thích hợp hoặc quy trình tiếp theo.
Sơ đồ sau đây phác thảo kiến trúc giải pháp được đề xuất.
Amazon hiểu phân loại tùy chỉnh API được sử dụng để sắp xếp tài liệu của bạn thành các danh mục (lớp) mà bạn xác định. Phân loại tùy chỉnh là một quá trình gồm hai bước. Trước tiên, bạn huấn luyện một mô hình phân loại tùy chỉnh (còn gọi là bộ phân loại) để nhận ra các lớp mà bạn quan tâm. Sau đó, bạn sử dụng mô hình của mình để phân loại số lượng bộ tài liệu bất kỳ.
Amazon hiểu công nhận thực thể tùy chỉnh tính năng được sử dụng để xác định các loại thực thể cụ thể (tên công ty bảo hiểm, tên công ty bảo hiểm, số hợp đồng) ngoài những gì có sẵn trong các loại thực thể chung theo mặc định. Xây dựng mô hình nhận dạng thực thể tùy chỉnh là cách tiếp cận hiệu quả hơn so với việc sử dụng kết hợp chuỗi hoặc biểu thức chính quy để trích xuất các thực thể từ tài liệu. Mô hình nhận dạng thực thể tùy chỉnh có thể tìm hiểu bối cảnh nơi những tên đó có thể xuất hiện. Ngoài ra, tính năng khớp chuỗi sẽ không phát hiện các thực thể có lỗi chính tả hoặc tuân theo các quy ước đặt tên mới, trong khi điều này có thể thực hiện được bằng cách sử dụng mô hình tùy chỉnh.
Trước khi tìm hiểu sâu hơn, hãy dành chút thời gian khám phá Amazon Kendra. Amazon Kendra là dịch vụ tìm kiếm doanh nghiệp có độ chính xác cao và dễ sử dụng được hỗ trợ bởi machine learning. Nó cho phép người dùng tìm thấy thông tin họ cần trong lượng nội dung khổng lồ trải khắp tổ chức của họ, từ các trang web và cơ sở dữ liệu đến các trang mạng nội bộ. Trước tiên, chúng tôi sẽ tạo chỉ mục Amazon Kendra để nhập tài liệu. Trong khi nhập dữ liệu, điều cần thiết là phải xem xét khái niệm Làm giàu dữ liệu tùy chỉnh (CDE). CDE cho phép bạn nâng cao khả năng tìm kiếm bằng cách kết hợp kiến thức bên ngoài vào chỉ mục tìm kiếm. Để biết thêm thông tin, hãy tham khảo Làm giàu tài liệu của bạn trong quá trình nhập. Trong bài đăng này, logic CDE gọi các API tùy chỉnh của Amazon Comprehend để làm phong phú thêm tài liệu với các lớp và thực thể được xác định. Cuối cùng, chúng tôi sử dụng trang tìm kiếm Amazon Kendra để hiển thị cách siêu dữ liệu nâng cao khả năng tìm kiếm bằng cách thêm khả năng lọc và phân loại.
Các bước cấp cao để thực hiện giải pháp này như sau:
- Huấn luyện trình phân loại tùy chỉnh Amazon Comprehend bằng dữ liệu huấn luyện
- Huấn luyện khả năng nhận dạng thực thể tùy chỉnh của Amazon Comprehend bằng dữ liệu huấn luyện
- Tạo trình phân loại tùy chỉnh Amazon Comprehend và điểm cuối nhận dạng thực thể tùy chỉnh
- Tạo và triển khai hàm Lambda để làm giàu nội dung sau trích xuất
- Tạo và điền chỉ mục Amazon Kendra
- Sử dụng các thực thể được trích xuất để lọc tìm kiếm trong Amazon Kendra
Chúng tôi cũng đã cung cấp một ứng dụng mẫu trong Repo GitHub để tham khảo.
Bảo mật dữ liệu và cân nhắc IAM
Với ưu tiên hàng đầu là bảo mật, giải pháp này tuân theo nguyên tắc cấp phép ít đặc quyền nhất đối với các dịch vụ và tính năng được sử dụng. Vai trò IAM được phân loại tùy chỉnh và nhận dạng thực thể tùy chỉnh của Amazon Comprehend chỉ có quyền truy cập vào tập dữ liệu từ nhóm thử nghiệm. Dịch vụ Amazon Kendra có quyền truy cập vào một bộ chứa S3 cụ thể và hàm Lambda dùng để gọi các API hiểu rõ. Hàm Lambda chỉ có quyền gọi API Amazon Comprehend. Để biết thêm thông tin, hãy xem lại phần 1.2 và 1.3 trong sổ tay.
Chúng tôi khuyên bạn nên thực hiện những việc sau trong môi trường phi sản xuất trước khi triển khai giải pháp trong môi trường sản xuất.
Huấn luyện trình phân loại tùy chỉnh Comprehend bằng dữ liệu huấn luyện
Phân loại tùy chỉnh của Amazon Comprehend hỗ trợ hai loại định dạng dữ liệu cho tệp chú thích:
Vì dữ liệu của chúng tôi đã được gắn nhãn và lưu trữ trong tệp CSV nên chúng tôi sẽ sử dụng định dạng tệp CSV cho tệp chú thích làm ví dụ. Chúng tôi phải cung cấp dữ liệu đào tạo được gắn nhãn dưới dạng văn bản được mã hóa UTF-8 trong tệp CSV. Không bao gồm hàng tiêu đề trong tệp CSV. Việc thêm hàng tiêu đề vào tệp của bạn có thể gây ra lỗi thời gian chạy. Một ví dụ về tệp CSV dữ liệu đào tạo như sau:
Để chuẩn bị dữ liệu huấn luyện phân loại, hãy tham khảo Chuẩn bị dữ liệu huấn luyện phân loại. Đối với mỗi hàng trong tệp CSV, cột đầu tiên chứa một hoặc nhiều nhãn lớp. Nhãn lớp có thể là bất kỳ chuỗi UTF-8 hợp lệ nào. Chúng tôi khuyên bạn nên sử dụng tên lớp rõ ràng và không trùng lặp về ý nghĩa. Tên có thể bao gồm khoảng trắng và có thể bao gồm nhiều từ được kết nối bằng dấu gạch dưới hoặc dấu gạch nối. Không để lại bất kỳ ký tự khoảng trắng nào trước hoặc sau dấu phẩy ngăn cách các giá trị trong một hàng.
Tiếp theo, bạn sẽ huấn luyện bằng cách sử dụng Chế độ nhiều lớp or Chế độ nhiều nhãn. Cụ thể, ở chế độ nhiều lớp, phân loại chỉ định một lớp cho mỗi tài liệu, trong khi ở chế độ nhiều nhãn, các lớp riêng lẻ đại diện cho các danh mục khác nhau không loại trừ lẫn nhau. Trong trường hợp của chúng tôi, chúng tôi sẽ sử dụng chế độ Multi-Class cho các mô hình Văn bản thuần túy.
Bạn có thể chuẩn bị các tập dữ liệu đào tạo và thử nghiệm riêng biệt cho việc đào tạo và đánh giá mô hình phân loại tùy chỉnh của Amazon Comprehend. Hoặc chỉ cung cấp một tập dữ liệu cho cả đào tạo và kiểm tra. Comprehend sẽ tự động chọn 10% tập dữ liệu được cung cấp của bạn để sử dụng làm dữ liệu thử nghiệm. Trong ví dụ này, chúng tôi đang cung cấp các tập dữ liệu đào tạo và thử nghiệm riêng biệt.
Ví dụ sau hiển thị tệp CSV chứa tên lớp được liên kết với các tài liệu khác nhau.
Khi mô hình phân loại tùy chỉnh được đào tạo, nó có thể nắm bắt các loại bảo hiểm khác nhau trên tài liệu (Bảo hiểm nhà, ô tô hoặc nhân thọ).
Huấn luyện trình nhận dạng thực thể tùy chỉnh (NER) của Amazon Comprehend bằng dữ liệu huấn luyện
Tập dữ liệu đào tạo về Nhận dạng thực thể tùy chỉnh (NER) của Amazon Comprehend có thể được chuẩn bị theo một trong hai cách khác nhau:
- Chú thích – Cung cấp bộ dữ liệu chứa các thực thể được chú thích để huấn luyện chế độ
- Danh sách thực thể (chỉ văn bản thuần túy) – Cung cấp danh sách các thực thể và loại nhãn của chúng (chẳng hạn như “Tên công ty bảo hiểm”) và một bộ tài liệu không có chú thích chứa các thực thể đó để đào tạo mô hình
Để biết thêm thông tin, tham khảo Đang chuẩn bị dữ liệu đào tạo trình nhận dạng thực thể.
Khi đào tạo một mô hình bằng danh sách thực thể, chúng ta cần cung cấp hai thông tin: danh sách tên thực thể với các loại thực thể tùy chỉnh liên quan và một tập hợp các tài liệu không được chú thích trong đó các thực thể xuất hiện.
Việc đào tạo tự động yêu cầu phải có hai loại thông tin: tài liệu mẫu và danh sách thực thể hoặc chú thích. Sau khi đào tạo trình nhận dạng, bạn có thể sử dụng nó để phát hiện các thực thể tùy chỉnh trong tài liệu của mình. Bạn có thể nhanh chóng phân tích một lượng nhỏ văn bản trong thời gian thực hoặc bạn có thể phân tích một lượng lớn tài liệu bằng công việc không đồng bộ.
Bạn có thể chuẩn bị các tập dữ liệu đào tạo và thử nghiệm riêng biệt cho việc đào tạo và đánh giá mô hình trình nhận dạng thực thể tùy chỉnh của Amazon Comprehend. Hoặc chỉ cung cấp một tập dữ liệu cho cả đào tạo và kiểm tra. Amazon Comprehend sẽ tự động chọn 10% tập dữ liệu được cung cấp của bạn để sử dụng làm dữ liệu thử nghiệm. Trong ví dụ dưới đây, chúng tôi đã chỉ định tập dữ liệu huấn luyện là Documents.S3Uri
Dưới InputDataConfig
.
Ví dụ sau hiển thị tệp CSV chứa các thực thể:
Sau khi đào tạo mô hình thực thể tùy chỉnh (NER), nó sẽ có thể trích xuất các thực thể khác nhau như “PAYOUT
","INSURANCE_COMPANY
","LAW_FIRM
","POLICY_HOLDER_NAME
","POLICY_NUMBER
".
Tạo điểm cuối của trình phân loại tùy chỉnh và thực thể tùy chỉnh (NER) của Amazon Comprehend
Điểm cuối của Amazon Comprehend giúp các mô hình tùy chỉnh của bạn có sẵn để phân loại theo thời gian thực. Sau khi tạo điểm cuối, bạn có thể thực hiện các thay đổi đối với điểm cuối đó khi nhu cầu kinh doanh của bạn phát triển. Ví dụ: bạn có thể giám sát việc sử dụng điểm cuối của mình và áp dụng tính năng tự động điều chỉnh quy mô để tự động thiết lập việc cung cấp điểm cuối phù hợp với nhu cầu dung lượng của bạn. Bạn có thể quản lý tất cả các điểm cuối của mình từ một chế độ xem duy nhất và khi không cần điểm cuối nữa, bạn có thể xóa điểm cuối đó để tiết kiệm chi phí. Amazon Comprehend hỗ trợ cả tùy chọn đồng bộ và không đồng bộ, nếu trường hợp sử dụng của bạn không cần phân loại theo thời gian thực thì bạn có thể gửi công việc hàng loạt tới Amazon Comprehend để phân loại dữ liệu không đồng bộ.
Đối với trường hợp sử dụng này, bạn tạo một điểm cuối để cung cấp mô hình tùy chỉnh của mình cho hoạt động phân tích theo thời gian thực.
Để đáp ứng nhu cầu xử lý văn bản của bạn, bạn chỉ định các đơn vị suy luận cho điểm cuối và mỗi đơn vị cho phép thông lượng 100 ký tự mỗi giây. Sau đó bạn có thể điều chỉnh thông lượng lên hoặc xuống.
Tạo và triển khai hàm Lambda để làm giàu nội dung sau trích xuất
Hàm Lambda sau trích xuất cho phép bạn triển khai logic để xử lý văn bản được Amazon Kendra trích xuất từ tài liệu đã nhập. Hàm sau trích xuất mà chúng tôi đã cấu hình sẽ triển khai mã để gọi Amazon Comprehend nhằm phát hiện các thực thể tùy chỉnh và tùy chỉnh phân loại tài liệu từ văn bản được Amazon Kendra trích xuất, đồng thời sử dụng chúng để cập nhật siêu dữ liệu tài liệu, được trình bày dưới dạng các khía cạnh trong tìm kiếm Amazon Kendra . Mã chức năng được nhúng trong sổ ghi chép. Các PostExtractionLambda
mã hoạt động như sau:
- Chia văn bản trang thành các phần không vượt quá giới hạn độ dài byte tối đa của phần hiểu
detect_entities
API. (Nhìn thấy Giới hạn ).
LƯU Ý tập lệnh sử dụng thuật toán phân tách độ dài ký tự đơn giản để đơn giản – các trường hợp sử dụng sản xuất nên triển khai phân chia ranh giới chồng chéo hoặc câu, dựa trên độ dài byte UTF8. - Đối với mỗi phần của văn bản, hãy gọi các điểm cuối hiểu theo thời gian thực cho các thực thể tùy chỉnh và bộ phân loại tùy chỉnh để phát hiện các loại thực thể sau: [“
PAYOUT
","INSURANCE_COMPANY
","LAW_FIRM
","POLICY_HOLDER_NAME
","POLICY_NUMBER
","INSURANCE_TYPE
"]. - Lọc ra các thực thể được phát hiện nằm dưới ngưỡng điểm tin cậy. Chúng tôi đang sử dụng ngưỡng 0.50, nghĩa là chỉ những thực thể có độ tin cậy 50% trở lên mới được sử dụng. Điều này có thể được điều chỉnh dựa trên trường hợp sử dụng và yêu cầu.
- Theo dõi số lượng tần số của từng thực thể.
- Chỉ chọn N (10) thực thể duy nhất hàng đầu cho mỗi trang, dựa trên tần suất xuất hiện.
- Để phân loại tài liệu, trình phân loại nhiều lớp chỉ gán một lớp cho mỗi tài liệu. Trong chức năng Lambda này, các tài liệu sẽ được phân loại là Bảo hiểm ô tô, Bảo hiểm nhà ở hoặc Bảo hiểm nhân thọ.
Lưu ý rằng tại thời điểm viết bài này, CDE chỉ hỗ trợ các cuộc gọi đồng bộ hoặc nếu nó phải không đồng bộ thì cần có một vòng chờ rõ ràng. Để trích xuất sau Lambda, thời gian thực hiện tối đa là 1 phút. Logic tùy chỉnh Lambda có thể được thay đổi dựa trên các yêu cầu phù hợp với trường hợp sử dụng của bạn.
Tạo và điền chỉ mục Amazon Kendra
Trong bước này, chúng tôi sẽ nhập dữ liệu vào chỉ mục Amazon Kendra và làm cho người dùng có thể tìm kiếm được dữ liệu đó. Trong quá trình nhập, chúng ta sẽ sử dụng hàm Lambda được tạo ở bước trước làm bước trích xuất sau và hàm Lambda sẽ gọi các điểm cuối phân loại tùy chỉnh và nhận dạng thực thể tùy chỉnh (NER) để tạo các trường siêu dữ liệu tùy chỉnh.
Các bước cấp cao để thực hiện giải pháp này như sau:
- Tạo Chỉ số Amazon Kendra.
- Tạo Nguồn dữ liệu Amazon Kendra – Có nhiều nguồn dữ liệu khác nhau có thể được sử dụng để nhập tập dữ liệu. Trong bài đăng này, chúng tôi đang sử dụng nhóm S3.
- Tạo các khía cạnh
Law_Firm
,Payout
,Insurance_Company
,Policy_Number
,Policy_Holder_Name
,Insurance_Type
với kiểu chuỗi là ‘STRING_LIST_VALUE
'. - Tạo CDE Kendra và trỏ nó tới hàm Lambda sau trích xuất đã tạo trước đó.
- Thực hiện quá trình đồng bộ hóa để nhập tập dữ liệu.
Sau khi hoàn tất, bạn có thể điền dữ liệu bảo hiểm vào chỉ mục bằng cách sử dụng Kendra CDE với lambda sau trích xuất, bạn có thể lọc các tìm kiếm dựa trên các loại thực thể tùy chỉnh và phân loại tùy chỉnh dưới dạng trường siêu dữ liệu tùy chỉnh.
Sử dụng các thực thể được trích xuất để lọc tìm kiếm trong Kendra
Bây giờ chỉ mục đã được điền và sẵn sàng để sử dụng. Trong bảng điều khiển Amazon Kendra, chọn Tìm kiếm nội dung được lập chỉ mục trong Quản lý dữ liệu và làm như sau.
Truy vấn như sau: Danh sách bảo hiểm không thành công do nộp muộn?
Kết quả hiển thị câu trả lời từ loại chính sách – HOME INSURANCE
và mang lại text_18
và text_14
là kết quả hàng đầu.
Chọn “Lọc kết quả tìm kiếm” ở bên trái. Bây giờ bạn sẽ thấy tất cả các loại Thực thể và giá trị phân loại được trích xuất bằng Comprehend, đồng thời với mỗi giá trị thực thể và phân loại, bạn sẽ thấy số lượng tài liệu phù hợp.
Theo INSURANCE_TYPE
chọn “Bảo hiểm ô tô” và sau đó bạn sẽ nhận được câu trả lời từ text_25
tập tin.
Lưu ý rằng kết quả của bạn có thể hơi khác so với kết quả hiển thị trong ảnh chụp màn hình.
Hãy thử tìm kiếm bằng các truy vấn của riêng bạn và quan sát cách các thực thể và phân loại tài liệu được Amazon Comprehend xác định nhanh chóng cho phép bạn:
- Xem cách kết quả tìm kiếm của bạn được phân phối trên các danh mục.
- Thu hẹp tìm kiếm của bạn bằng cách lọc theo bất kỳ giá trị thực thể/phân loại nào.
Làm sạch
Sau khi bạn đã thử nghiệm tìm kiếm và dùng thử sổ ghi chép được cung cấp trong kho lưu trữ Github, hãy xóa cơ sở hạ tầng bạn đã cung cấp trong tài khoản AWS của mình để tránh mọi khoản phí không mong muốn. Bạn có thể chạy các ô dọn dẹp trong sổ ghi chép. Ngoài ra, bạn có thể xóa tài nguyên theo cách thủ công thông qua bảng điều khiển AWS:
- Chỉ số Amazon Kendra
- Hiểu các điểm cuối của trình phân loại tùy chỉnh và nhận dạng thực thể tùy chỉnh (NER)
- Hiểu các mô hình tùy chỉnh của trình phân loại tùy chỉnh và nhận dạng thực thể tùy chỉnh (NER)
- Hàm Lambda
- Xô S3
- Vai trò và chính sách của IAM
Kết luận
Trong bài đăng này, chúng tôi đã trình bày cách các thực thể tùy chỉnh và trình phân loại tùy chỉnh của Amazon Comprehend cho phép tìm kiếm Amazon Kendra được hỗ trợ bởi tính năng CDE để giúp người dùng cuối thực hiện tìm kiếm tốt hơn trên dữ liệu có cấu trúc/phi cấu trúc. Các thực thể tùy chỉnh của Amazon Comprehend và trình phân loại tùy chỉnh khiến nó trở nên rất hữu ích cho các trường hợp sử dụng khác nhau và dữ liệu miền cụ thể khác nhau. Để biết thêm thông tin về cách sử dụng Amazon Comprehend, hãy tham khảo Tài nguyên dành cho nhà phát triển của Amazon Am hiểu và đối với Amazon Kendra, hãy tham khảo Tài nguyên dành cho nhà phát triển Amazon Kendra.
Hãy thử giải pháp này cho trường hợp sử dụng của bạn. Chúng tôi mời bạn để lại phản hồi của bạn trong phần bình luận.
Về các tác giả
Amit Chaudhary là Kiến trúc sư giải pháp cấp cao tại Amazon Web Services. Lĩnh vực trọng tâm của anh ấy là AI/ML và anh ấy giúp khách hàng về AI tổng hợp, mô hình ngôn ngữ lớn và kỹ thuật nhanh chóng. Ngoài công việc, Amit thích dành thời gian cho gia đình.
Yanyan Zhang là Nhà khoa học dữ liệu cấp cao trong nhóm Cung cấp năng lượng với Dịch vụ chuyên nghiệp của AWS. Cô ấy rất nhiệt tình giúp đỡ khách hàng giải quyết các vấn đề thực tế bằng kiến thức AI/ML. Gần đây, trọng tâm của cô là khám phá tiềm năng của Generative AI và LLM. Ngoài công việc, cô thích đi du lịch, tập thể dục và khám phá những điều mới.
Nikhil Jha là Giám đốc tài khoản kỹ thuật cấp cao tại Amazon Web Services. Các lĩnh vực trọng tâm của anh ấy bao gồm AI / ML và phân tích. Khi rảnh rỗi, anh ấy thích chơi cầu lông với con gái và khám phá các hoạt động ngoài trời.
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
- PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
- Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
- PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
- nguồn: https://aws.amazon.com/blogs/machine-learning/use-custom-metadata-created-by-amazon-comprehend-to-intelligently-process-insurance-claims-using-amazon-kendra/
- : có
- :là
- :không phải
- :Ở đâu
- $ LÊN
- 1
- 1.3
- 10
- 100
- 19
- 2025
- 33
- 50
- 500
- 7
- 9
- a
- Có khả năng
- Giới thiệu
- truy cập
- Theo
- Tài khoản
- Kế toán
- chính xác
- ngang qua
- thêm vào
- thêm
- Ngoài ra
- Ngoài ra
- địa chỉ
- Sau
- AI
- AI / ML
- thuật toán
- Tất cả
- cho phép
- dọc theo
- Đã
- Ngoài ra
- đàn bà gan dạ
- Amazon hiểu
- Amazon Kendra
- Amazon Web Services
- số lượng
- an
- phân tích
- phân tích
- phân tích
- và
- trả lời
- bất kì
- api
- API
- xuất hiện
- Các Ứng Dụng
- áp dụng
- Đăng Nhập
- phương pháp tiếp cận
- thích hợp
- kiến trúc
- LÀ
- KHU VỰC
- khu vực
- AS
- liên kết
- At
- luật sư
- tác giả
- tự động
- tự động hóa
- tự động
- có sẵn
- tránh
- AWS
- Dịch vụ chuyên nghiệp của AWS
- dựa
- BE
- được
- trước
- phía dưới
- Hơn
- Ngoài
- thân hình
- cả hai
- ranh giới
- Mang lại
- Xây dựng
- kinh doanh
- nhưng
- by
- cuộc gọi
- gọi là
- Cuộc gọi
- CAN
- khả năng
- khả năng
- Sức chứa
- nắm bắt
- trường hợp
- trường hợp
- đố
- Nguyên nhân
- Tế bào
- nhất định
- thay đổi
- Những thay đổi
- tính cách
- nhân vật
- tải
- Chọn
- Các thành phố
- City
- tuyên bố
- tốt nghiệp lớp XNUMX
- các lớp học
- phân loại
- phân loại
- Phân loại
- trong sáng
- mã
- bộ sưu tập
- Cột
- Cột
- Bình luận
- Các công ty
- công ty
- hoàn thành
- Hoàn thành
- phức tạp
- hiểu
- khái niệm
- sự tự tin
- cấu hình
- kết nối
- Hãy xem xét
- An ủi
- tiêu thụ
- chứa
- chứa
- nội dung
- bối cảnh
- tiếp tục
- ước
- TẬP ĐOÀN
- Chi phí
- có thể
- tạo
- tạo ra
- khách hàng
- khách hàng
- tùy chỉnh
- dữ liệu
- làm giàu dữ liệu
- quản lý dữ liệu
- nhà khoa học dữ liệu
- tập dữ liệu
- cơ sở dữ liệu
- bộ dữ liệu
- Ngày
- sâu sắc hơn
- Mặc định
- định nghĩa
- xác định
- giao hàng
- bộ
- triển khai
- mô tả
- phát hiện
- phát hiện
- Nhà phát triển
- khác nhau
- khác nhau
- thảo luận
- Giao diện
- phân phối
- khác nhau
- lặn
- do
- tài liệu
- tài liệu
- miền
- don
- dont
- xuống
- hai
- suốt trong
- e
- E&T
- mỗi
- dễ dàng
- dễ sử dụng
- Hiệu quả
- hay
- el
- nhúng
- cho phép
- Điểm cuối
- năng lượng
- Kỹ Sư
- nâng cao
- nâng cao
- làm giàu
- làm giàu
- Doanh nghiệp
- doanh nghiệp
- thực thể
- thực thể
- Môi trường
- lỗi
- thiết yếu
- đánh giá
- phát triển
- ví dụ
- ví dụ
- quá
- Trừ
- ngoại lệ
- Dành riêng
- thực hiện
- Thoát
- dự kiến
- khám phá
- Khám phá
- biểu thức
- thêm
- ngoài
- trích xuất
- khai thác
- khía cạnh
- thất bại
- gia đình
- Đặc tính
- Tính năng
- thông tin phản hồi
- vài
- Lĩnh vực
- Tập tin
- Các tập tin
- Nộp hồ sơ
- lọc
- lọc
- bộ lọc
- Cuối cùng
- Tìm kiếm
- Công ty
- Tên
- phù hợp với
- cố định
- Tập trung
- theo
- tiếp theo
- sau
- Trong
- hình thức
- định dạng
- các hình thức
- tần số
- từ
- chức năng
- xa hơn
- tạo ra
- thế hệ
- thế hệ
- Trí tuệ nhân tạo
- được
- GitHub
- Phát triển
- Có
- có
- he
- chăm sóc sức khỏe
- giúp đỡ
- giúp đỡ
- giúp
- cô
- cấp độ cao
- cao hơn
- cao nhất
- cao
- của mình
- Trang Chủ
- Độ đáng tin của
- Hướng dẫn
- HTML
- HTTPS
- i
- IDC
- xác định
- xác định
- if
- minh họa
- hình ảnh
- thực hiện
- thực hiện
- thực hiện
- in
- bao gồm
- kết hợp
- Tăng lên
- tăng
- chỉ số
- lập chỉ mục
- hệ thống riêng biệt,
- thông tin
- Cơ sở hạ tầng
- đầu vào
- những hiểu biết
- ví dụ
- bảo hiểm
- Thông minh
- quan tâm
- Quốc Tế
- Công ty Cổ phần Dữ liệu Quốc tế (IDC)
- trong
- mời
- viện dẫn
- tham gia
- IT
- Việc làm
- json
- kiến thức
- nhãn
- Nhãn
- Ngôn ngữ
- lớn
- Trễ, muộn
- Luật
- công ty luật
- LEARN
- học tập
- ít nhất
- Rời bỏ
- trái
- Chiều dài
- Cuộc sống
- Lượt thích
- Có khả năng
- LIMIT
- Danh sách
- Chức năng
- LLM
- logic
- còn
- Xem
- yêu
- máy
- học máy
- làm cho
- LÀM CHO
- quản lý
- quản lý
- quản lý
- giám đốc
- thủ công
- sản xuất
- phù hợp
- tối đa
- Có thể..
- có nghĩa là
- có nghĩa
- Phương tiện truyền thông
- Gặp gỡ
- Siêu dữ liệu
- phút
- Chế độ
- kiểu mẫu
- mô hình
- thời điểm
- Màn Hình
- chi tiết
- hầu hết
- nhiều
- phải
- hỗ trợ
- tên
- tên
- đặt tên
- hẹp
- Cần
- cần thiết
- nhu cầu
- Mới
- nlp
- Không
- máy tính xách tay
- tại
- con số
- số
- vật
- đối tượng
- tuân theo
- xảy ra
- of
- on
- hàng loạt
- ONE
- có thể
- Tùy chọn
- Các lựa chọn
- or
- cơ quan
- tổ chức
- Nền tảng khác
- vfoXNUMXfipXNUMXhfpiXNUMXufhpiXNUMXuf
- ra
- ngoài trời
- đề cương
- bên ngoài
- riêng
- trang
- đôi
- đam mê
- Họa tiết
- mỗi
- Thực hiện
- quyền
- miếng
- Trơn
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- chơi
- Điểm
- điều luật
- đông dân cư
- phần
- có thể
- Bài đăng
- bài viết
- tiềm năng
- -
- ưa thích
- Chuẩn bị
- chuẩn bị
- trình bày
- trước
- trước đây
- nguyên tắc
- Trước khi
- ưu tiên
- đặc quyền
- vấn đề
- quá trình
- xử lý
- Sản xuất
- Sản lượng
- chuyên nghiệp
- đề xuất
- cho
- cung cấp
- nhà cung cấp dịch vụ
- nhà cung cấp
- cung cấp
- cung cấp
- truy vấn
- Mau
- dấu ngoặc kép
- khác nhau,
- Đọc
- sẵn sàng
- thực
- thời gian thực
- nhận
- nhận
- gần đây
- công nhận
- công nhận
- công nhận
- giới thiệu
- xem
- tài liệu tham khảo
- đều đặn
- kho
- đại diện
- cần phải
- Yêu cầu
- đòi hỏi
- nghiên cứu
- Thông tin
- kết quả
- Kết quả
- trở lại
- xem xét
- Vai trò
- vai trò
- HÀNG
- chạy
- thời gian chạy
- tương tự
- Lưu
- mở rộng quy mô
- Nhà khoa học
- Điểm số
- kịch bản
- Tìm kiếm
- tìm kiếm
- tìm kiếm
- Thứ hai
- Phần
- phần
- an ninh
- xem
- chọn
- cao cấp
- kết án
- riêng biệt
- dịch vụ
- DỊCH VỤ
- định
- bộ
- chị ấy
- nên
- hiển thị
- cho thấy
- thể hiện
- Chương trình
- có ý nghĩa
- đơn giản
- đơn giản hóa
- duy nhất
- Các trang web
- Kích thước máy
- nhỏ
- So
- Mạng xã hội
- truyền thông xã hội
- Bài đăng trên mạng xã hội
- giải pháp
- Giải pháp
- động SOLVE
- nguồn
- Không gian
- riêng
- đặc biệt
- quy định
- Chi
- Tách
- lan tràn
- Tiêu chuẩn
- Bước
- Các bước
- hàng
- lưu trữ
- Chuỗi
- Đệ trình
- trình
- như vậy
- hỗ trợ
- Hỗ trợ
- đồng bộ hóa.
- Hãy
- nhóm
- Kỹ thuật
- thử nghiệm
- Kiểm tra
- văn bản
- hơn
- việc này
- Sản phẩm
- thông tin
- thế giới
- cung cấp their dịch
- Them
- sau đó
- Đó
- Kia là
- họ
- điều
- điều này
- những
- ngưỡng
- Thông qua
- thông lượng
- thời gian
- đến
- hàng đầu
- theo dõi
- Train
- đào tạo
- Hội thảo
- Đi du lịch
- điều trị
- cố gắng
- thử
- điều chỉnh
- hai
- kiểu
- loại
- Dưới
- gạch
- độc đáo
- đơn vị
- các đơn vị
- không mong muốn
- Cập nhật
- sử dụng
- ca sử dụng
- đã sử dụng
- Người sử dụng
- sử dụng
- sử dụng
- hợp lệ
- giá trị
- Các giá trị
- khác nhau
- Lớn
- rất
- Xem
- Lượt xem
- khối lượng
- chờ đợi
- muốn
- muốn
- Đường..
- cách
- we
- web
- các dịch vụ web
- trang web
- TỐT
- Điều gì
- Là gì
- khi nào
- cái nào
- trong khi
- trắng
- sẽ
- với
- ở trong
- không có
- từ
- Công việc
- đang làm việc
- tập thể dục
- công trinh
- thế giới
- thế giới
- viết
- viết
- Bạn
- trên màn hình
- zephyrnet