ปรับปรุงความแม่นยำในการค้นหาด้วยตัวตรวจการสะกดใน Amazon Kendra PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

ปรับปรุงความแม่นยำในการค้นหาด้วยตัวตรวจการสะกดใน Amazon Kendra

อเมซอน เคนดรา เป็นบริการค้นหาอัจฉริยะที่ขับเคลื่อนโดยการเรียนรู้ของเครื่อง คุณสามารถรับคำแนะนำการสะกดคำสำหรับคำที่สะกดผิดในข้อความค้นหาของคุณโดยใช้ เครื่องตรวจตัวสะกดของ Amazon Kendra. ตัวตรวจสอบการสะกดช่วยลดความถี่ของข้อความค้นหาที่แสดงผลลัพธ์ที่ไม่เกี่ยวข้องโดยให้คำแนะนำการสะกดคำสำหรับคำที่ไม่รู้จัก

ในโพสต์นี้ เราจะสำรวจวิธีใช้ Amazon Kendra Spell Checker บน คอนโซลการจัดการ AWSรวมถึงวิธีเปิดใช้งานตัวตรวจสอบการสะกดในแอปพลิเคชันการค้นหาที่ขับเคลื่อนโดย Amazon Kendra ผ่าน อินเทอร์เฟซบรรทัดคำสั่ง AWS AWS (AWS CLI) และ AWS SDK

ใช้ Amazon Kendra Spell Checker บนคอนโซล

คุณสามารถรับคำแนะนำการสะกดคำสำหรับคำค้นหา Amazon Kendra ที่สะกดผิดได้โดยอัตโนมัติเมื่อทำการสืบค้นผ่านคอนโซล

บนคอนโซล Amazon Kendra เลือกดัชนีที่คุณต้องการ จากนั้นเลือก ค้นหาเนื้อหาที่จัดทำดัชนี ในบานหน้าต่างนำทาง ตรวจสอบให้แน่ใจว่าดัชนีที่เลือกมีการนำเข้าเอกสาร ในโพสต์นี้ เราใช้ตัวอย่างเอกสาร AWS ที่พบใน แหล่งข้อมูล ส่วนของบานหน้าต่างนำทาง

บนคอนโซลการค้นหาของ Amazon Kendra เพียงส่งคำค้นหาตามปกติ คำที่สะกดผิดในข้อความค้นหาจะถูกแทนที่ด้วยคำที่แนะนำในส่วน "คุณหมายถึง" ของคอนโซลการค้นหา

ปรับปรุงความแม่นยำในการค้นหาด้วยตัวตรวจการสะกดใน Amazon Kendra PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

การเลือกคิวรีที่แนะนำจะส่งคิวรีใหม่ที่มีการสะกดคำที่ถูกต้อง

ปรับปรุงความแม่นยำในการค้นหาด้วยตัวตรวจการสะกดใน Amazon Kendra PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

อย่างที่คุณเห็น ผลลัพธ์การสืบค้นที่ให้ผ่านคำค้นหาที่แนะนำนั้นมีความเกี่ยวข้องมากขึ้นอย่างมาก ต้องขอบคุณตัวตรวจสอบการสะกดคำ

ใช้ Amazon Kendra Spell Checker ในแอปพลิเคชันการค้นหา

แอปพลิเคชันการค้นหาที่ขับเคลื่อนโดย Amazon Kendra สามารถเปิดใช้งานตัวตรวจสอบการสะกดผ่าน AWS CLI หรือ AWS SDK ได้อย่างรวดเร็วและง่ายดาย ซึ่งเราจะอธิบายในส่วนนี้ นอกจากนี้ เรายังยกตัวอย่างวิธีประมวลผลการตอบกลับของตัวตรวจสอบการสะกด

AWS CLI

มาดูกันว่าผู้ใช้ AWS CLI สามารถเลือกใช้ Amazon Kendra Spell Checker เพื่อรับคำแนะนำการสะกดคำสำหรับคำค้นหาที่สะกดผิดได้อย่างไร เราใช้ AWS CLI เพื่อสอบถาม Amazon Kendra ตามปกติ โดยมีการเปลี่ยนแปลงเพียงเล็กน้อยเท่านั้น: เรารวม --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true ข้อโต้แย้ง:

$ aws kendra query --query-text "what is knedar" --index-id [YOUR_INDEX_ID] --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true

นอกจากผลลัพธ์การสืบค้นปกติแล้ว การตอบสนองจาก Amazon Kendra ในตอนนี้ยังมี a SpellCorrectedQueries ออบเจ็กต์ หากมีข้อเสนอแนะการสะกดคำสำหรับข้อความค้นหา ดูข้อมูลเพิ่มเติมได้ที่ สะกดแก้ไขแบบสอบถาม.

// Full query response omitted for brevity "SpellCorrectedQueries": [ { "SuggestedQueryText": "what is kendra", "Corrections": [ { "BeginOffset": 8, "EndOffset": 14, "Term": "knedar", "CorrectedTerm": "kendra" } ] }
]

AWS SDK

ต่อไป มาดูวิธีที่ Amazon Kendra มีฟังก์ชันตรวจสอบการสะกดสำหรับผู้ใช้ AWS SDK สำหรับตัวอย่างนี้ เราใช้ Python 3 เราส่งคำถามที่มีการสะกดผิดเล็กน้อย และพิมพ์ SpellCorrectedQueries วัตถุในการตอบสนอง:

import boto3 kendra = boto3.client('kendra') index_id = '[YOUR_INDEX_ID]'
query_text = 'kendra fre teir hours'
spell_correction_configuration = { 'IncludeQuerySpellCheckSuggestions': True } response = kendra.query( IndexId = index_id, QueryText = query_text, SpellCorrectionConfiguration = spell_correction_configuration
) print(response['SpellCorrectedQueries'])

คำตอบจาก Amazon Kendra ตอนนี้มีคำแนะนำการสะกดคำที่คาดไว้:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

ประมวลผลการตอบกลับการตรวจสอบตัวสะกดของ Amazon Kendra

ตอนนี้เราได้พูดถึงวิธีการรับคำแนะนำการสะกดคำโดยทางโปรแกรมผ่าน AWS CLI หรือ AWS SDK แล้ว เราสามารถตรวจสอบวิธีที่เราเปลี่ยนการตอบกลับเป็นข้อความค้นหาที่แนะนำที่มนุษย์อ่านได้ สำหรับตัวอย่างนี้ เราใช้เอาต์พุตตัวอย่างจากส่วนก่อนหน้า:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

แต่ละ SpellCorrectedQuery มีสองปุ่ม: SuggestedQueryText และ Corrections.

  • SuggestedQueryText แมปกับสตริงที่มีข้อความค้นหาที่อัปเดตพร้อมการแก้ไขตัวสะกดที่แนะนำ
  • Corrections แผนที่ไปยังรายการของ Correction ออบเจ็กต์ ซึ่งมีจุดเริ่มต้นและจุดสิ้นสุดของการแก้ไข เช่นเดียวกับคำดั้งเดิมจากข้อความค้นหาและคำแนะนำการสะกดคำสำหรับคำนั้น

สำหรับตัวอย่างของเรา เราต้องการแสดงข้อความค้นหาที่แนะนำโดยใช้คำที่แนะนำใหม่เป็นตัวเอียง คล้ายกับที่ทำในคอนโซล Amazon Kendra เพื่อให้บรรลุสิ่งนี้ เราสามารถเพิ่มแท็กเปิด HTML ตัวเอียง <i> ที่ BeginOffset ของแต่ละ Correction และแท็กปิด HTML ตัวเอียง </i> ที่ EndOffset ของแต่ละ Correction ใน Corrections รายการ. สังเกตว่า BeginOffset และ EndOffset อิงตามความยาวของเงื่อนไขที่แก้ไข ไม่ใช่เงื่อนไขเดิม

การเพิ่มแท็กตัวเอียงไปที่ SuggestedQueryText ให้ข้อความค้นหาที่แนะนำต่อไปนี้แก่เรา:

kendra <i>free</i> <i>tier</i> hours

อย่างที่คุณเห็น Amazon Kendra Spell Checker ทำให้การเพิ่มฟังก์ชันการตรวจตัวสะกดในแอปพลิเคชันการค้นหาของคุณเป็นเรื่องง่าย

สรุป

เครื่องตรวจการสะกดเป็นคุณลักษณะใหม่ที่มีประสิทธิภาพที่นำเสนอโดย Amazon Kendra เครื่องตรวจการสะกดเป็นวิธีที่ง่ายและมีประสิทธิภาพในการลดจำนวนการสืบค้นที่ไม่เป็นประโยชน์อย่างรวดเร็วโดยให้คำแนะนำการสะกดคำแก่ผู้ใช้ปลายทางสำหรับคำที่สะกดผิด

ตัวตรวจสอบการสะกดมีอยู่ในทั้งหมด ภูมิภาค AWS ที่ซึ่ง Amazon Kendra พร้อมให้บริการและรองรับทุกภาษาที่ Amazon Kendra รองรับในปัจจุบัน

หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Amazon Kendra โปรดไปที่ หน้าผลิตภัณฑ์ Amazon Kendra.


เกี่ยวกับผู้เขียน

ปรับปรุงความแม่นยำในการค้นหาด้วยตัวตรวจการสะกดใน Amazon Kendra PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.แมทธิว เพเรติก เป็นวิศวกรพัฒนาซอฟต์แวร์ที่ Amazon Web Services ซึ่งตั้งอยู่ในนิวยอร์กซิตี้ Matthew เป็นสมาชิกของทีม Amazon Kendra ที่มุ่งเน้นในการปรับปรุงประสบการณ์การสืบค้นของ Amazon Kendra

ประทับเวลา:

เพิ่มเติมจาก AWS Machine Learning AWS

จัดแพ็คเกจและปรับใช้ ML และ LLM แบบคลาสสิกได้อย่างง่ายดายด้วย Amazon SageMaker ตอนที่ 2: ประสบการณ์ผู้ใช้เชิงโต้ตอบใน SageMaker Studio | อเมซอนเว็บเซอร์วิส

โหนดต้นทาง: 1920475
ประทับเวลา: พฤศจิกายน 30, 2023