Cải thiện độ chính xác của tìm kiếm với Trình kiểm tra chính tả trong Amazon Kendra PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Cải thiện độ chính xác của tìm kiếm với Trình kiểm tra chính tả trong Amazon Kendra

Amazon Kendra là một dịch vụ tìm kiếm thông minh được hỗ trợ bởi máy học. Bạn có thể nhận được đề xuất chính tả cho các thuật ngữ sai chính tả trong các truy vấn của mình bằng cách sử dụng Trình kiểm tra chính tả Amazon Kendra. Trình kiểm tra chính tả giúp giảm tần suất truy vấn trả về kết quả không liên quan bằng cách cung cấp đề xuất chính tả cho các cụm từ không được công nhận.

Trong bài đăng này, chúng tôi khám phá cách sử dụng Amazon Kendra Spell Checker trên Bảng điều khiển quản lý AWS, cũng như cách bật Trình kiểm tra chính tả trong ứng dụng tìm kiếm do Amazon Kendra cung cấp thông qua Giao diện dòng lệnh AWS (AWS CLI) và AWS SDK.

Sử dụng Amazon Kendra Spell Checker trên bảng điều khiển

Bạn có thể tự động nhận đề xuất chính tả cho các truy vấn Amazon Kendra sai chính tả của mình khi truy vấn thông qua bảng điều khiển.

Trên bảng điều khiển Amazon Kendra, chọn chỉ mục mong muốn của bạn, sau đó chọn Tìm kiếm nội dung được lập chỉ mục trong ngăn điều hướng. Đảm bảo rằng chỉ mục đã chọn có tài liệu được nhập; trong bài đăng này, chúng tôi sử dụng tài liệu AWS mẫu được tìm thấy trong Nguồn dữ liệu của ngăn điều hướng.

Trên bảng điều khiển tìm kiếm Amazon Kendra, chỉ cần gửi một truy vấn như bạn thường làm. Các cụm từ sai chính tả trong truy vấn được thay thế bằng các cụm từ đề xuất trong phần "Ý của bạn là" của bảng điều khiển tìm kiếm.

Cải thiện độ chính xác của tìm kiếm với Trình kiểm tra chính tả trong Amazon Kendra PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Việc chọn truy vấn được đề xuất sẽ gửi một truy vấn mới với cách viết đã sửa.

Cải thiện độ chính xác của tìm kiếm với Trình kiểm tra chính tả trong Amazon Kendra PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Như bạn có thể thấy, kết quả truy vấn được cung cấp thông qua truy vấn đề xuất có liên quan hơn đáng kể, nhờ Trình kiểm tra chính tả!

Sử dụng Amazon Kendra Spell Checker trong các ứng dụng tìm kiếm

Các ứng dụng tìm kiếm do Amazon Kendra cung cấp có thể nhanh chóng và dễ dàng bật Trình kiểm tra chính tả thông qua AWS CLI hoặc AWS SDK mà chúng ta sẽ giới thiệu trong phần này. Ngoài ra, chúng tôi xem xét một ví dụ về cách xử lý phản hồi của Trình kiểm tra chính tả.

AWSCLI

Hãy xem cách người dùng AWS CLI có thể chọn tham gia Amazon Kendra Spell Checker để nhận đề xuất chính tả cho các cụm từ truy vấn sai chính tả. Chúng tôi sử dụng AWS CLI để truy vấn Amazon Kendra như thường lệ, chỉ với một thay đổi nhỏ: chúng tôi bao gồm --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true tranh luận:

$ aws kendra query --query-text "what is knedar" --index-id [YOUR_INDEX_ID] --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true

Ngoài các kết quả truy vấn thông thường, phản hồi từ Amazon Kendra hiện chứa SpellCorrectedQueries đối tượng, nếu có bất kỳ gợi ý chính tả nào cho truy vấn. Để biết thêm thông tin, hãy xem SpellCorrectQuery.

// Full query response omitted for brevity "SpellCorrectedQueries": [ { "SuggestedQueryText": "what is kendra", "Corrections": [ { "BeginOffset": 8, "EndOffset": 14, "Term": "knedar", "CorrectedTerm": "kendra" } ] }
]

SDK AWS

Tiếp theo, hãy cùng xem qua cách Amazon Kendra cung cấp chức năng kiểm tra lỗi chính tả cho người dùng AWS SDK. Đối với ví dụ này, chúng tôi sử dụng Python 3. Chúng tôi gửi một truy vấn có một vài lỗi chính tả và in ra SpellCorrectedQueries đối tượng trong phản hồi:

import boto3 kendra = boto3.client('kendra') index_id = '[YOUR_INDEX_ID]'
query_text = 'kendra fre teir hours'
spell_correction_configuration = { 'IncludeQuerySpellCheckSuggestions': True } response = kendra.query( IndexId = index_id, QueryText = query_text, SpellCorrectionConfiguration = spell_correction_configuration
) print(response['SpellCorrectedQueries'])

Phản hồi từ Amazon Kendra hiện chứa các gợi ý chính tả dự kiến:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Xử lý phản hồi Kiểm tra chính tả của Amazon Kendra

Bây giờ chúng ta đã xem qua cách nhận đề xuất chính tả theo chương trình thông qua AWS CLI hoặc AWS SDK, chúng ta có thể kiểm tra cách chúng ta biến phản hồi thành truy vấn đề xuất mà con người có thể đọc được. Đối với ví dụ này, chúng tôi sử dụng đầu ra mẫu từ phần trước:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Mỗi trang web SpellCorrectedQuery có hai chìa khóa: SuggestedQueryTextCorrections.

  • SuggestedQueryText ánh xạ tới một chuỗi chứa truy vấn được cập nhật với các sửa lỗi chính tả được đề xuất.
  • Corrections ánh xạ tới danh sách Correction các đối tượng, chứa phần bù đầu và phần cuối của phần sửa, cũng như cụm từ gốc từ truy vấn và gợi ý chính tả cho cụm từ đó.

Đối với ví dụ của chúng tôi, chúng tôi muốn hiển thị văn bản truy vấn được đề xuất với các thuật ngữ mới được đề xuất được in nghiêng, tương tự như những gì được thực hiện trên bảng điều khiển Amazon Kendra. Để đạt được điều này, chúng ta có thể thêm các thẻ mở in nghiêng HTML <i> tại BeginOffset của mỗi Correction và các thẻ đóng in nghiêng HTML </i> tại EndOffset của mỗi Correction trong Corrections danh sách. Lưu ý rằng BeginOffsetEndOffset dựa trên độ dài của các điều khoản đã sửa, không phải các điều khoản gốc.

Thêm các thẻ in nghiêng vào SuggestedQueryText cung cấp cho chúng tôi văn bản truy vấn đề xuất sau:

kendra <i>free</i> <i>tier</i> hours

Như bạn có thể thấy, Amazon Kendra Spell Checker giúp việc thêm chức năng kiểm tra lỗi chính tả vào ứng dụng tìm kiếm của bạn trở nên đơn giản.

Kết luận

Trình kiểm tra chính tả là một tính năng mới, mạnh mẽ do Amazon Kendra cung cấp. Trình kiểm tra chính tả là một cách đơn giản, hiệu quả để giảm nhanh số lượng truy vấn không hữu ích bằng cách cung cấp các đề xuất chính tả cho người dùng cuối đối với các cụm từ sai chính tả.

Trình kiểm tra chính tả có sẵn trong tất cả Khu vực AWS nơi Amazon Kendra khả dụng và hỗ trợ tất cả các ngôn ngữ hiện được Amazon Kendra hỗ trợ.

Để tìm hiểu thêm về Amazon Kendra, hãy truy cập Trang sản phẩm Amazon Kendra.


Lưu ý

Cải thiện độ chính xác của tìm kiếm với Trình kiểm tra chính tả trong Amazon Kendra PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Matthew Peretick là Kỹ sư phát triển phần mềm tại Amazon Web Services có trụ sở tại Thành phố New York. Matthew là thành viên của nhóm Amazon Kendra tập trung vào việc nâng cao trải nghiệm truy vấn Amazon Kendra.

Dấu thời gian:

Thêm từ Học máy AWS