Sử dụng siêu dữ liệu tùy chỉnh được tạo bởi Amazon Comprehend để xử lý yêu cầu bảo hiểm một cách thông minh bằng Amazon Kendra

Được xuất bản lại bởi Plato

Người theo dõi: 0

Dữ liệu có cấu trúc, được định nghĩa là dữ liệu theo một mẫu cố định, chẳng hạn như thông tin được lưu trữ trong các cột trong cơ sở dữ liệu và dữ liệu phi cấu trúc, thiếu biểu mẫu hoặc mẫu cụ thể như văn bản, hình ảnh hoặc bài đăng trên mạng xã hội, cả hai đều tiếp tục phát triển khi chúng được sản xuất và tiêu thụ bởi các tổ chức khác nhau. Chẳng hạn, theo Tập đoàn Dữ liệu Quốc tế (IDC), khối lượng dữ liệu của thế giới dự kiến sẽ tăng gấp 2025 lần vào năm 2, trong đó dữ liệu phi cấu trúc chiếm một phần đáng kể. Doanh nghiệp có thể muốn thêm siêu dữ liệu tùy chỉnh như loại tài liệu (biểu mẫu W-XNUMX hoặc cuống phiếu lương), nhiều loại thực thể khác nhau như tên, tổ chức và địa chỉ, ngoài siêu dữ liệu tiêu chuẩn như loại tệp, ngày tạo hoặc kích thước để mở rộng thông minh tìm kiếm trong khi nhập tài liệu. Siêu dữ liệu tùy chỉnh giúp các tổ chức, doanh nghiệp phân loại thông tin theo cách ưa thích của họ. Ví dụ: siêu dữ liệu có thể được sử dụng để lọc và tìm kiếm. Khách hàng có thể tạo siêu dữ liệu tùy chỉnh bằng cách sử dụng Amazon hiểu, một dịch vụ xử lý ngôn ngữ tự nhiên (NLP) do AWS quản lý để trích xuất thông tin chi tiết về nội dung của tài liệu và nhập thông tin đó vào Amazon Kendra cùng với dữ liệu của họ vào chỉ mục. Amazon Kendra là dịch vụ tìm kiếm doanh nghiệp có độ chính xác cao và dễ sử dụng được hỗ trợ bởi Machine Learning (AWS). Sau đó, siêu dữ liệu tùy chỉnh có thể được sử dụng để làm phong phú nội dung tốt hơn lọc và khía cạnh khả năng. Trong Amazon Kendra, các khía cạnh là các chế độ xem có phạm vi của một tập hợp kết quả tìm kiếm. Ví dụ: bạn có thể cung cấp kết quả tìm kiếm cho các thành phố trên khắp thế giới, nơi tài liệu được lọc theo thành phố cụ thể mà chúng được liên kết. Bạn cũng có thể tạo các khía cạnh để hiển thị kết quả của một tác giả cụ thể.

Các công ty bảo hiểm đang phải chịu gánh nặng với số lượng yêu cầu bồi thường ngày càng tăng mà họ phải xử lý. Ngoài ra, sự phức tạp của việc xử lý yêu cầu bồi thường cũng ngày càng tăng do có nhiều loại tài liệu bảo hiểm liên quan và các thực thể tùy chỉnh trong mỗi tài liệu này. Trong bài đăng này, chúng tôi mô tả một trường hợp sử dụng để làm phong phú nội dung tùy chỉnh cho các nhà cung cấp bảo hiểm. Nhà cung cấp bảo hiểm nhận được yêu cầu thanh toán từ luật sư của người thụ hưởng đối với các loại bảo hiểm khác nhau, chẳng hạn như bảo hiểm nhà, ô tô và nhân thọ. Trong trường hợp sử dụng này, tài liệu mà nhà cung cấp bảo hiểm nhận được không chứa bất kỳ siêu dữ liệu nào cho phép tìm kiếm nội dung dựa trên các thực thể và lớp nhất định. Nhà cung cấp bảo hiểm muốn lọc nội dung Kendra dựa trên các thực thể và lớp tùy chỉnh dành riêng cho miền kinh doanh của họ. Bài đăng này minh họa cách bạn có thể tự động hóa và đơn giản hóa việc tạo siêu dữ liệu bằng cách sử dụng các mô hình tùy chỉnh của Amazon Comprehend. Siêu dữ liệu được tạo có thể được tùy chỉnh trong quá trình nhập bằng Amazon Kendra Làm giàu tài liệu tùy chỉnh (CDE) logic tùy chỉnh.

Hãy xem một số ví dụ về tìm kiếm trên Amazon Kendra có hoặc không có khả năng lọc và khía cạnh.

Trong ảnh chụp màn hình sau, Amazon Kendra cung cấp kết quả tìm kiếm nhưng không có tùy chọn nào để thu hẹp hơn nữa kết quả tìm kiếm bằng cách sử dụng bất kỳ bộ lọc nào.

Sử dụng siêu dữ liệu tùy chỉnh do Amazon Comprehend tạo để xử lý các yêu cầu bảo hiểm một cách thông minh bằng Amazon Kendra | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Ảnh chụp màn hình sau đây cho thấy kết quả tìm kiếm của Amazon Kendra có thể được lọc bằng cách sử dụng các khía cạnh khác nhau như Công ty luật, Số chính sách, được tạo bởi siêu dữ liệu tùy chỉnh để thu hẹp kết quả tìm kiếm.

Giải pháp được thảo luận trong bài đăng này cũng có thể dễ dàng áp dụng cho các doanh nghiệp/trường hợp sử dụng khác, chẳng hạn như chăm sóc sức khỏe, sản xuất và nghiên cứu.

Tổng quan về giải pháp

Trong giải pháp được đề xuất này, chúng tôi sẽ 1) phân loại các yêu cầu bồi thường bảo hiểm được gửi thành các loại khác nhau và 2) truy xuất các thực thể cụ thể về bảo hiểm từ các tài liệu này. Khi quá trình này hoàn tất, tài liệu có thể được chuyển đến bộ phận thích hợp hoặc quy trình tiếp theo.

Sơ đồ sau đây phác thảo kiến trúc giải pháp được đề xuất.

Amazon hiểu phân loại tùy chỉnh API được sử dụng để sắp xếp tài liệu của bạn thành các danh mục (lớp) mà bạn xác định. Phân loại tùy chỉnh là một quá trình gồm hai bước. Trước tiên, bạn huấn luyện một mô hình phân loại tùy chỉnh (còn gọi là bộ phân loại) để nhận ra các lớp mà bạn quan tâm. Sau đó, bạn sử dụng mô hình của mình để phân loại số lượng bộ tài liệu bất kỳ.

Amazon hiểu công nhận thực thể tùy chỉnh tính năng được sử dụng để xác định các loại thực thể cụ thể (tên công ty bảo hiểm, tên công ty bảo hiểm, số hợp đồng) ngoài những gì có sẵn trong các loại thực thể chung theo mặc định. Xây dựng mô hình nhận dạng thực thể tùy chỉnh là cách tiếp cận hiệu quả hơn so với việc sử dụng kết hợp chuỗi hoặc biểu thức chính quy để trích xuất các thực thể từ tài liệu. Mô hình nhận dạng thực thể tùy chỉnh có thể tìm hiểu bối cảnh nơi những tên đó có thể xuất hiện. Ngoài ra, tính năng khớp chuỗi sẽ không phát hiện các thực thể có lỗi chính tả hoặc tuân theo các quy ước đặt tên mới, trong khi điều này có thể thực hiện được bằng cách sử dụng mô hình tùy chỉnh.

Trước khi tìm hiểu sâu hơn, hãy dành chút thời gian khám phá Amazon Kendra. Amazon Kendra là dịch vụ tìm kiếm doanh nghiệp có độ chính xác cao và dễ sử dụng được hỗ trợ bởi machine learning. Nó cho phép người dùng tìm thấy thông tin họ cần trong lượng nội dung khổng lồ trải khắp tổ chức của họ, từ các trang web và cơ sở dữ liệu đến các trang mạng nội bộ. Trước tiên, chúng tôi sẽ tạo chỉ mục Amazon Kendra để nhập tài liệu. Trong khi nhập dữ liệu, điều cần thiết là phải xem xét khái niệm Làm giàu dữ liệu tùy chỉnh (CDE). CDE cho phép bạn nâng cao khả năng tìm kiếm bằng cách kết hợp kiến thức bên ngoài vào chỉ mục tìm kiếm. Để biết thêm thông tin, hãy tham khảo Làm giàu tài liệu của bạn trong quá trình nhập. Trong bài đăng này, logic CDE gọi các API tùy chỉnh của Amazon Comprehend để làm phong phú thêm tài liệu với các lớp và thực thể được xác định. Cuối cùng, chúng tôi sử dụng trang tìm kiếm Amazon Kendra để hiển thị cách siêu dữ liệu nâng cao khả năng tìm kiếm bằng cách thêm khả năng lọc và phân loại.

Các bước cấp cao để thực hiện giải pháp này như sau:

Huấn luyện trình phân loại tùy chỉnh Amazon Comprehend bằng dữ liệu huấn luyện
Huấn luyện khả năng nhận dạng thực thể tùy chỉnh của Amazon Comprehend bằng dữ liệu huấn luyện
Tạo trình phân loại tùy chỉnh Amazon Comprehend và điểm cuối nhận dạng thực thể tùy chỉnh
Tạo và triển khai hàm Lambda để làm giàu nội dung sau trích xuất
Tạo và điền chỉ mục Amazon Kendra
Sử dụng các thực thể được trích xuất để lọc tìm kiếm trong Amazon Kendra

Chúng tôi cũng đã cung cấp một ứng dụng mẫu trong Repo GitHub để tham khảo.

Bảo mật dữ liệu và cân nhắc IAM

Với ưu tiên hàng đầu là bảo mật, giải pháp này tuân theo nguyên tắc cấp phép ít đặc quyền nhất đối với các dịch vụ và tính năng được sử dụng. Vai trò IAM được phân loại tùy chỉnh và nhận dạng thực thể tùy chỉnh của Amazon Comprehend chỉ có quyền truy cập vào tập dữ liệu từ nhóm thử nghiệm. Dịch vụ Amazon Kendra có quyền truy cập vào một bộ chứa S3 cụ thể và hàm Lambda dùng để gọi các API hiểu rõ. Hàm Lambda chỉ có quyền gọi API Amazon Comprehend. Để biết thêm thông tin, hãy xem lại phần 1.2 và 1.3 trong sổ tay.

Chúng tôi khuyên bạn nên thực hiện những việc sau trong môi trường phi sản xuất trước khi triển khai giải pháp trong môi trường sản xuất.

Huấn luyện trình phân loại tùy chỉnh Comprehend bằng dữ liệu huấn luyện

Phân loại tùy chỉnh của Amazon Comprehend hỗ trợ hai loại định dạng dữ liệu cho tệp chú thích:

Vì dữ liệu của chúng tôi đã được gắn nhãn và lưu trữ trong tệp CSV nên chúng tôi sẽ sử dụng định dạng tệp CSV cho tệp chú thích làm ví dụ. Chúng tôi phải cung cấp dữ liệu đào tạo được gắn nhãn dưới dạng văn bản được mã hóa UTF-8 trong tệp CSV. Không bao gồm hàng tiêu đề trong tệp CSV. Việc thêm hàng tiêu đề vào tệp của bạn có thể gây ra lỗi thời gian chạy. Một ví dụ về tệp CSV dữ liệu đào tạo như sau:

CLASS, Text of document 1
CLASS, Text of document 2

Để chuẩn bị dữ liệu huấn luyện phân loại, hãy tham khảo Chuẩn bị dữ liệu huấn luyện phân loại. Đối với mỗi hàng trong tệp CSV, cột đầu tiên chứa một hoặc nhiều nhãn lớp. Nhãn lớp có thể là bất kỳ chuỗi UTF-8 hợp lệ nào. Chúng tôi khuyên bạn nên sử dụng tên lớp rõ ràng và không trùng lặp về ý nghĩa. Tên có thể bao gồm khoảng trắng và có thể bao gồm nhiều từ được kết nối bằng dấu gạch dưới hoặc dấu gạch nối. Không để lại bất kỳ ký tự khoảng trắng nào trước hoặc sau dấu phẩy ngăn cách các giá trị trong một hàng.

Tiếp theo, bạn sẽ huấn luyện bằng cách sử dụng Chế độ nhiều lớp or Chế độ nhiều nhãn. Cụ thể, ở chế độ nhiều lớp, phân loại chỉ định một lớp cho mỗi tài liệu, trong khi ở chế độ nhiều nhãn, các lớp riêng lẻ đại diện cho các danh mục khác nhau không loại trừ lẫn nhau. Trong trường hợp của chúng tôi, chúng tôi sẽ sử dụng chế độ Multi-Class cho các mô hình Văn bản thuần túy.

Bạn có thể chuẩn bị các tập dữ liệu đào tạo và thử nghiệm riêng biệt cho việc đào tạo và đánh giá mô hình phân loại tùy chỉnh của Amazon Comprehend. Hoặc chỉ cung cấp một tập dữ liệu cho cả đào tạo và kiểm tra. Comprehend sẽ tự động chọn 10% tập dữ liệu được cung cấp của bạn để sử dụng làm dữ liệu thử nghiệm. Trong ví dụ này, chúng tôi đang cung cấp các tập dữ liệu đào tạo và thử nghiệm riêng biệt.

Ví dụ sau hiển thị tệp CSV chứa tên lớp được liên kết với các tài liệu khác nhau.

Sử dụng siêu dữ liệu tùy chỉnh do Amazon Comprehend tạo để xử lý các yêu cầu bảo hiểm một cách thông minh bằng Amazon Kendra | Dịch vụ web của Amazon PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Hình thức hồ sơ – Loại bảo hiểm, Nội dung hồ sơ 1

Khi mô hình phân loại tùy chỉnh được đào tạo, nó có thể nắm bắt các loại bảo hiểm khác nhau trên tài liệu (Bảo hiểm nhà, ô tô hoặc nhân thọ).

Huấn luyện trình nhận dạng thực thể tùy chỉnh (NER) của Amazon Comprehend bằng dữ liệu huấn luyện

Tập dữ liệu đào tạo về Nhận dạng thực thể tùy chỉnh (NER) của Amazon Comprehend có thể được chuẩn bị theo một trong hai cách khác nhau:

Chú thích – Cung cấp bộ dữ liệu chứa các thực thể được chú thích để huấn luyện chế độ
Danh sách thực thể (chỉ văn bản thuần túy) – Cung cấp danh sách các thực thể và loại nhãn của chúng (chẳng hạn như “Tên công ty bảo hiểm”) và một bộ tài liệu không có chú thích chứa các thực thể đó để đào tạo mô hình

Để biết thêm thông tin, tham khảo Đang chuẩn bị dữ liệu đào tạo trình nhận dạng thực thể.

Khi đào tạo một mô hình bằng danh sách thực thể, chúng ta cần cung cấp hai thông tin: danh sách tên thực thể với các loại thực thể tùy chỉnh liên quan và một tập hợp các tài liệu không được chú thích trong đó các thực thể xuất hiện.

Việc đào tạo tự động yêu cầu phải có hai loại thông tin: tài liệu mẫu và danh sách thực thể hoặc chú thích. Sau khi đào tạo trình nhận dạng, bạn có thể sử dụng nó để phát hiện các thực thể tùy chỉnh trong tài liệu của mình. Bạn có thể nhanh chóng phân tích một lượng nhỏ văn bản trong thời gian thực hoặc bạn có thể phân tích một lượng lớn tài liệu bằng công việc không đồng bộ.

Bạn có thể chuẩn bị các tập dữ liệu đào tạo và thử nghiệm riêng biệt cho việc đào tạo và đánh giá mô hình trình nhận dạng thực thể tùy chỉnh của Amazon Comprehend. Hoặc chỉ cung cấp một tập dữ liệu cho cả đào tạo và kiểm tra. Amazon Comprehend sẽ tự động chọn 10% tập dữ liệu được cung cấp của bạn để sử dụng làm dữ liệu thử nghiệm. Trong ví dụ dưới đây, chúng tôi đã chỉ định tập dữ liệu huấn luyện là Documents.S3Uri Dưới InputDataConfig.

Ví dụ sau hiển thị tệp CSV chứa các thực thể:

Sau khi đào tạo mô hình thực thể tùy chỉnh (NER), nó sẽ có thể trích xuất các thực thể khác nhau như “PAYOUT","INSURANCE_COMPANY","LAW_FIRM","POLICY_HOLDER_NAME","POLICY_NUMBER".

Tạo điểm cuối của trình phân loại tùy chỉnh và thực thể tùy chỉnh (NER) của Amazon Comprehend

Điểm cuối của Amazon Comprehend giúp các mô hình tùy chỉnh của bạn có sẵn để phân loại theo thời gian thực. Sau khi tạo điểm cuối, bạn có thể thực hiện các thay đổi đối với điểm cuối đó khi nhu cầu kinh doanh của bạn phát triển. Ví dụ: bạn có thể giám sát việc sử dụng điểm cuối của mình và áp dụng tính năng tự động điều chỉnh quy mô để tự động thiết lập việc cung cấp điểm cuối phù hợp với nhu cầu dung lượng của bạn. Bạn có thể quản lý tất cả các điểm cuối của mình từ một chế độ xem duy nhất và khi không cần điểm cuối nữa, bạn có thể xóa điểm cuối đó để tiết kiệm chi phí. Amazon Comprehend hỗ trợ cả tùy chọn đồng bộ và không đồng bộ, nếu trường hợp sử dụng của bạn không cần phân loại theo thời gian thực thì bạn có thể gửi công việc hàng loạt tới Amazon Comprehend để phân loại dữ liệu không đồng bộ.

Đối với trường hợp sử dụng này, bạn tạo một điểm cuối để cung cấp mô hình tùy chỉnh của mình cho hoạt động phân tích theo thời gian thực.

Để đáp ứng nhu cầu xử lý văn bản của bạn, bạn chỉ định các đơn vị suy luận cho điểm cuối và mỗi đơn vị cho phép thông lượng 100 ký tự mỗi giây. Sau đó bạn có thể điều chỉnh thông lượng lên hoặc xuống.

Tạo và triển khai hàm Lambda để làm giàu nội dung sau trích xuất

Hàm Lambda sau trích xuất cho phép bạn triển khai logic để xử lý văn bản được Amazon Kendra trích xuất từ tài liệu đã nhập. Hàm sau trích xuất mà chúng tôi đã cấu hình sẽ triển khai mã để gọi Amazon Comprehend nhằm phát hiện các thực thể tùy chỉnh và tùy chỉnh phân loại tài liệu từ văn bản được Amazon Kendra trích xuất, đồng thời sử dụng chúng để cập nhật siêu dữ liệu tài liệu, được trình bày dưới dạng các khía cạnh trong tìm kiếm Amazon Kendra . Mã chức năng được nhúng trong sổ ghi chép. Các PostExtractionLambda mã hoạt động như sau:

Chia văn bản trang thành các phần không vượt quá giới hạn độ dài byte tối đa của phần hiểu detect_entities API. (Nhìn thấy Giới hạn ).
LƯU Ý tập lệnh sử dụng thuật toán phân tách độ dài ký tự đơn giản để đơn giản – các trường hợp sử dụng sản xuất nên triển khai phân chia ranh giới chồng chéo hoặc câu, dựa trên độ dài byte UTF8.
Đối với mỗi phần của văn bản, hãy gọi các điểm cuối hiểu theo thời gian thực cho các thực thể tùy chỉnh và bộ phân loại tùy chỉnh để phát hiện các loại thực thể sau: [“PAYOUT","INSURANCE_COMPANY","LAW_FIRM","POLICY_HOLDER_NAME","POLICY_NUMBER","INSURANCE_TYPE"].
Lọc ra các thực thể được phát hiện nằm dưới ngưỡng điểm tin cậy. Chúng tôi đang sử dụng ngưỡng 0.50, nghĩa là chỉ những thực thể có độ tin cậy 50% trở lên mới được sử dụng. Điều này có thể được điều chỉnh dựa trên trường hợp sử dụng và yêu cầu.
Theo dõi số lượng tần số của từng thực thể.
Chỉ chọn N (10) thực thể duy nhất hàng đầu cho mỗi trang, dựa trên tần suất xuất hiện.
Để phân loại tài liệu, trình phân loại nhiều lớp chỉ gán một lớp cho mỗi tài liệu. Trong chức năng Lambda này, các tài liệu sẽ được phân loại là Bảo hiểm ô tô, Bảo hiểm nhà ở hoặc Bảo hiểm nhân thọ.

#The function to read the input text and detect entities in it using Comprehend def entity_detector(doc_text): #List of JSON objects to store entities entity_data = dict() #List of observed text strings recognized as categories category_text = dict() #Frequency of each text string text_frequency = dict() for et in categories: entity_data[ et ] = [] category_text[ et ] = [] text_frequency[ et ] = dict() #Make detect_entities_v2 call in a loop to work with the text limit for i in range(0, len(doc_text), compre_text_size): try: entities = compre.detect_entities(Text=doc_text[i:i+compre_text_size], LanguageCode='en', EndpointArn=endpoint_custom_entity) except Exception as e: logger.info("Exiting - detect_entities_v2 terminated with exception") return [] for e in entities["Entities"]: #For each of the recognized entities take only those that have confidence score higher than min_score, #are printable, dont contain quotes and are previously unseen if ((e["Score"] > min_score) and (e["Text"].isprintable()) and (not '"' in e["Text"]) and (not e["Text"].upper() in category_text[e["Type"]])): #Append the text to entity data to be used for a Kendra custom attribute entity_data[e["Type"]].append(e["Text"]) #Keep track of text in upper case so that we don't treat the same text written in different cases differently category_text[e["Type"]].append(e["Text"].upper()) #Keep track of the frequency of the text so that we can take the text with highest frequency of occurrance text_frequency[e["Type"]][e["Text"].upper()] = 1 elif (e["Text"].upper() in category_text[e["Type"]]): #Keep track of the frequency of the text so that we can take the text with highest frequency of occurrance text_frequency[e["Type"]][e["Text"].upper()] += 1 #The Kendra attribute metadata JSON object to be populated metadata = dict() for et in categories: metadata[et] = [] #Take at most elimit number of recognized text strings having the highest frequency of occurrance el = [pair[0] for pair in sorted(text_frequency[et].items(), key=lambda item: item[1], reverse=True)][0:elimit] for d in entity_data[et]: if (d.upper() in el): metadata[et].append(d) for md in metadata: metaUL.append({ "name": md, "value": { "stringListValue": metadata[md] } }) return metaUL

Lưu ý rằng tại thời điểm viết bài này, CDE chỉ hỗ trợ các cuộc gọi đồng bộ hoặc nếu nó phải không đồng bộ thì cần có một vòng chờ rõ ràng. Để trích xuất sau Lambda, thời gian thực hiện tối đa là 1 phút. Logic tùy chỉnh Lambda có thể được thay đổi dựa trên các yêu cầu phù hợp với trường hợp sử dụng của bạn.

Tạo và điền chỉ mục Amazon Kendra

Trong bước này, chúng tôi sẽ nhập dữ liệu vào chỉ mục Amazon Kendra và làm cho người dùng có thể tìm kiếm được dữ liệu đó. Trong quá trình nhập, chúng ta sẽ sử dụng hàm Lambda được tạo ở bước trước làm bước trích xuất sau và hàm Lambda sẽ gọi các điểm cuối phân loại tùy chỉnh và nhận dạng thực thể tùy chỉnh (NER) để tạo các trường siêu dữ liệu tùy chỉnh.

Các bước cấp cao để thực hiện giải pháp này như sau:

Tạo Chỉ số Amazon Kendra.
Tạo Nguồn dữ liệu Amazon Kendra – Có nhiều nguồn dữ liệu khác nhau có thể được sử dụng để nhập tập dữ liệu. Trong bài đăng này, chúng tôi đang sử dụng nhóm S3.
Tạo các khía cạnh Law_Firm, Payout, Insurance_Company, Policy_Number, Policy_Holder_Name, Insurance_Type với kiểu chuỗi là ‘STRING_LIST_VALUE'.
Tạo CDE Kendra và trỏ nó tới hàm Lambda sau trích xuất đã tạo trước đó.
Thực hiện quá trình đồng bộ hóa để nhập tập dữ liệu.

Sau khi hoàn tất, bạn có thể điền dữ liệu bảo hiểm vào chỉ mục bằng cách sử dụng Kendra CDE với lambda sau trích xuất, bạn có thể lọc các tìm kiếm dựa trên các loại thực thể tùy chỉnh và phân loại tùy chỉnh dưới dạng trường siêu dữ liệu tùy chỉnh.

Sử dụng các thực thể được trích xuất để lọc tìm kiếm trong Kendra

Bây giờ chỉ mục đã được điền và sẵn sàng để sử dụng. Trong bảng điều khiển Amazon Kendra, chọn Tìm kiếm nội dung được lập chỉ mục trong Quản lý dữ liệu và làm như sau.

Truy vấn như sau: Danh sách bảo hiểm không thành công do nộp muộn?

Kết quả hiển thị câu trả lời từ loại chính sách – HOME INSURANCE và mang lại text_18 và text_14 là kết quả hàng đầu.

Chọn “Lọc kết quả tìm kiếm” ở bên trái. Bây giờ bạn sẽ thấy tất cả các loại Thực thể và giá trị phân loại được trích xuất bằng Comprehend, đồng thời với mỗi giá trị thực thể và phân loại, bạn sẽ thấy số lượng tài liệu phù hợp.

Theo INSURANCE_TYPE chọn “Bảo hiểm ô tô” và sau đó bạn sẽ nhận được câu trả lời từ text_25 tập tin.

Lưu ý rằng kết quả của bạn có thể hơi khác so với kết quả hiển thị trong ảnh chụp màn hình.

Hãy thử tìm kiếm bằng các truy vấn của riêng bạn và quan sát cách các thực thể và phân loại tài liệu được Amazon Comprehend xác định nhanh chóng cho phép bạn:

Xem cách kết quả tìm kiếm của bạn được phân phối trên các danh mục.
Thu hẹp tìm kiếm của bạn bằng cách lọc theo bất kỳ giá trị thực thể/phân loại nào.

Làm sạch

Sau khi bạn đã thử nghiệm tìm kiếm và dùng thử sổ ghi chép được cung cấp trong kho lưu trữ Github, hãy xóa cơ sở hạ tầng bạn đã cung cấp trong tài khoản AWS của mình để tránh mọi khoản phí không mong muốn. Bạn có thể chạy các ô dọn dẹp trong sổ ghi chép. Ngoài ra, bạn có thể xóa tài nguyên theo cách thủ công thông qua bảng điều khiển AWS:

Chỉ số Amazon Kendra
Hiểu các điểm cuối của trình phân loại tùy chỉnh và nhận dạng thực thể tùy chỉnh (NER)
Hiểu các mô hình tùy chỉnh của trình phân loại tùy chỉnh và nhận dạng thực thể tùy chỉnh (NER)
Hàm Lambda
Xô S3
Vai trò và chính sách của IAM

Kết luận

Trong bài đăng này, chúng tôi đã trình bày cách các thực thể tùy chỉnh và trình phân loại tùy chỉnh của Amazon Comprehend cho phép tìm kiếm Amazon Kendra được hỗ trợ bởi tính năng CDE để giúp người dùng cuối thực hiện tìm kiếm tốt hơn trên dữ liệu có cấu trúc/phi cấu trúc. Các thực thể tùy chỉnh của Amazon Comprehend và trình phân loại tùy chỉnh khiến nó trở nên rất hữu ích cho các trường hợp sử dụng khác nhau và dữ liệu miền cụ thể khác nhau. Để biết thêm thông tin về cách sử dụng Amazon Comprehend, hãy tham khảo Tài nguyên dành cho nhà phát triển của Amazon Am hiểu và đối với Amazon Kendra, hãy tham khảo Tài nguyên dành cho nhà phát triển Amazon Kendra.

Hãy thử giải pháp này cho trường hợp sử dụng của bạn. Chúng tôi mời bạn để lại phản hồi của bạn trong phần bình luận.

Về các tác giả

Amit Chaudhary là Kiến trúc sư giải pháp cấp cao tại Amazon Web Services. Lĩnh vực trọng tâm của anh ấy là AI/ML và anh ấy giúp khách hàng về AI tổng hợp, mô hình ngôn ngữ lớn và kỹ thuật nhanh chóng. Ngoài công việc, Amit thích dành thời gian cho gia đình.

Yanyan Zhang là Nhà khoa học dữ liệu cấp cao trong nhóm Cung cấp năng lượng với Dịch vụ chuyên nghiệp của AWS. Cô ấy rất nhiệt tình giúp đỡ khách hàng giải quyết các vấn đề thực tế bằng kiến thức AI/ML. Gần đây, trọng tâm của cô là khám phá tiềm năng của Generative AI và LLM. Ngoài công việc, cô thích đi du lịch, tập thể dục và khám phá những điều mới.

Nikhil Jha là Giám đốc tài khoản kỹ thuật cấp cao tại Amazon Web Services. Các lĩnh vực trọng tâm của anh ấy bao gồm AI / ML và phân tích. Khi rảnh rỗi, anh ấy thích chơi cầu lông với con gái và khám phá các hoạt động ngoài trời.

Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
nguồn: https://aws.amazon.com/blogs/machine-learning/use-custom-metadata-created-by-amazon-comprehend-to-intelligently-process-insurance-claims-using-amazon-kendra/

Dấu thời gian: 5 Tháng mười hai, 2023

Dấu thời gian: Tháng Mười Một 7, 2023

Được xuất bản lại bởi Plato

Phát hiện và phân loại phần mềm độc hại với Amazon Rekognition

Tự động xác thực tài liệu và phát hiện gian lận trong quy trình bảo lãnh phát hành thế chấp bằng các dịch vụ AI của AWS: Phần 1 | Dịch vụ web của Amazon

Giảm tới 90% mức tiêu thụ năng lượng cho khối lượng công việc học máy của bạn với các bộ tăng tốc được xây dựng có mục đích của AWS | Dịch vụ web của Amazon

Roadshow AI sáng tạo ở Bắc Mỹ với AWS và Ôm Mặt | Dịch vụ web của Amazon

Làm phong phú các luồng tin tức theo thời gian thực với Thư viện dữ liệu Refinitiv, dịch vụ AWS và Amazon SageMaker

Phiên bản Amazon EC2 DL2q dành cho suy luận AI hiệu suất cao, tiết kiệm chi phí hiện đã có sẵn rộng rãi | Dịch vụ web của Amazon

“ID + Selfie” – Cải thiện việc xác minh danh tính kỹ thuật số bằng AWS

Khai thác sức mạnh của dữ liệu doanh nghiệp với AI tổng hợp: Thông tin chuyên sâu từ Amazon Kendra, LangChain và các mô hình ngôn ngữ lớn | Dịch vụ web của Amazon

Về chúng tôi

Tìm kiếm dọc & Ai

Nền tảng

NHẬN THÔNG TIN

Tài khoản