Javítsa a keresési pontosságot az Amazon Kendra PlatoBlockchain Data Intelligence helyesírás-ellenőrzőjével. Függőleges keresés. Ai.

Javítsa a keresési pontosságot az Amazon Kendra Helyesírás-ellenőrzőjével

Amazon Kendra egy intelligens keresőszolgáltatás gépi tanulással. Helyesírási javaslatokat kaphat a lekérdezésekben szereplő hibásan írt kifejezésekre, ha használja a Amazon Kendra helyesírás-ellenőrző. A Helyesírás-ellenőrző segít csökkenteni az irreleváns eredményeket visszaadó lekérdezések gyakoriságát azáltal, hogy helyesírási javaslatokat ad az ismeretlen kifejezésekre.

Ebben a bejegyzésben megvizsgáljuk, hogyan használhatjuk az Amazon Kendra Helyesírás-ellenőrzőt a AWS felügyeleti konzol, valamint a Helyesírás-ellenőrző engedélyezése egy Amazon Kendra-alapú keresőalkalmazásban a AWS parancssori interfész (AWS CLI) és AWS SDK.

Használja az Amazon Kendra Helyesírás-ellenőrzőt a konzolon

Automatikusan kaphat helyesírási javaslatokat a hibásan írt Amazon Kendra-lekérdezésekhez, amikor a konzolon keresztül kérdez le.

Az Amazon Kendra konzolon válassza ki a kívánt indexet, majd válassza ki Indexelt tartalom keresése a navigációs ablakban. Győződjön meg arról, hogy a kiválasztott index tartalmaz dokumentumokat; Ebben a bejegyzésben a minta AWS-dokumentációt használjuk, amely megtalálható a Adatforrások szakaszában.

Az Amazon Kendra keresőkonzolon egyszerűen küldjön be egy lekérdezést a szokásos módon. A lekérdezésben szereplő hibásan írt kifejezéseket a rendszer a keresőkonzol „Ugyan értette” részében javasolt kifejezésekkel helyettesíti.

Javítsa a keresési pontosságot az Amazon Kendra PlatoBlockchain Data Intelligence helyesírás-ellenőrzőjével. Függőleges keresés. Ai.

A javasolt lekérdezés kiválasztásakor új lekérdezés érkezik a helyesírással.

Javítsa a keresési pontosságot az Amazon Kendra PlatoBlockchain Data Intelligence helyesírás-ellenőrzőjével. Függőleges keresés. Ai.

Amint látja, a javasolt lekérdezés által biztosított lekérdezési eredmények a Helyesírás-ellenőrzőnek köszönhetően lényegesen relevánsabbak!

Használja az Amazon Kendra Helyesírás-ellenőrzőt a keresőalkalmazásokban

Az Amazon Kendra által üzemeltetett keresőalkalmazások gyorsan és egyszerűen engedélyezhetik a Helyesírás-ellenőrzőt az AWS CLI-n vagy az AWS SDK-n keresztül, amelyeket ebben a részben végigjárunk. Ezenkívül áttekintünk egy példát a Helyesírás-ellenőrző válaszának feldolgozására.

AWS CLI

Nézzük meg, hogyan iratkozhatnak fel az AWS CLI-felhasználók az Amazon Kendra Spell Checker programba, hogy helyesírási javaslatokat kapjanak a hibásan írt lekérdezési kifejezésekre. Az Amazon Kendra lekérdezéséhez szokás szerint az AWS CLI-t használjuk, egyetlen apró változtatással: beletesszük a --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true érv:

$ aws kendra query --query-text "what is knedar" --index-id [YOUR_INDEX_ID] --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true

A normál lekérdezési eredmények mellett az Amazon Kendra válasza mostantól tartalmazza a SpellCorrectedQueries objektumot, ha vannak helyesírási javaslatok a lekérdezéshez. További információkért lásd SpellCorrectedQuery.

// Full query response omitted for brevity "SpellCorrectedQueries": [ { "SuggestedQueryText": "what is kendra", "Corrections": [ { "BeginOffset": 8, "EndOffset": 14, "Term": "knedar", "CorrectedTerm": "kendra" } ] }
]

AWS SDK

Ezután nézzük meg, hogyan biztosít az Amazon Kendra helyesírás-ellenőrző funkciót az AWS SDK-felhasználók számára. Ebben a példában a Python 3-at használjuk. Elküldünk egy lekérdezést néhány helyesírási hibával, és kinyomtatjuk a SpellCorrectedQueries objektum a válaszban:

import boto3 kendra = boto3.client('kendra') index_id = '[YOUR_INDEX_ID]'
query_text = 'kendra fre teir hours'
spell_correction_configuration = { 'IncludeQuerySpellCheckSuggestions': True } response = kendra.query( IndexId = index_id, QueryText = query_text, SpellCorrectionConfiguration = spell_correction_configuration
) print(response['SpellCorrectedQueries'])

Az Amazon Kendra válasza most tartalmazza a várt helyesírási javaslatokat:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Az Amazon Kendra Helyesírás-ellenőrző válaszának feldolgozása

Most, hogy áttekintettük, hogyan kaphatunk programozottan helyesírási javaslatokat az AWS CLI-n vagy az AWS SDK-n keresztül, megvizsgálhatjuk, hogyan alakíthatjuk a választ ember által olvasható javasolt lekérdezéssé. Ebben a példában az előző szakasz mintakimenetét használjuk:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Minden SpellCorrectedQuery két kulcsa van: SuggestedQueryText és a Corrections.

  • SuggestedQueryText leképezi a frissített lekérdezést tartalmazó karakterláncot a javasolt helyesírási javításokkal.
  • Corrections listához térképezi Correction objektumok, amely tartalmazza a javítás kezdeti és záró eltolását, valamint a lekérdezésből származó eredeti kifejezést és az adott kifejezésre vonatkozó helyesírási javaslatot.

Példánkban a javasolt lekérdezési szöveget dőlt betűvel szeretnénk megjeleníteni az újonnan javasolt kifejezésekkel, hasonlóan ahhoz, amit az Amazon Kendra konzolon tesznek. Ennek érdekében dőlt betűs HTML nyitócímkéket adhatunk hozzá <i> a BeginOffset Az egyes Correction és HTML dőlt zárócímkék </i> a EndOffset Az egyes Correction a Corrections lista. Vegye figyelembe, hogy BeginOffset és a EndOffset a javított kifejezések hosszán alapulnak, nem az eredeti kifejezéseken.

A dőlt betűs címkék hozzáadása a SuggestedQueryText a következő javasolt lekérdezési szöveget adja:

kendra <i>free</i> <i>tier</i> hours

Amint látja, az Amazon Kendra Spell Checker egyszerűvé teszi a helyesírás-ellenőrző funkció hozzáadását keresőalkalmazásához.

Következtetés

A Helyesírás-ellenőrző az Amazon Kendra új, hatékony funkciója. A Helyesírás-ellenőrző egy egyszerű, hatékony módszer a nem hasznos lekérdezések számának gyors csökkentésére azáltal, hogy helyesírási javaslatokat ad a végfelhasználóknak a hibásan írt kifejezésekre.

A Helyesírás-ellenőrző mindenben elérhető AWS régiók ahol az Amazon Kendra elérhető, és támogatja az Amazon Kendra által jelenleg támogatott összes nyelvet.

Ha többet szeretne megtudni az Amazon Kendráról, látogassa meg a Amazon Kendra termékoldal.


A szerzőről

Javítsa a keresési pontosságot az Amazon Kendra PlatoBlockchain Data Intelligence helyesírás-ellenőrzőjével. Függőleges keresés. Ai.Matthew Peretick a New York-i székhelyű Amazon Web Services szoftverfejlesztő mérnöke. Matthew az Amazon Kendra csapat tagja, amely az Amazon Kendra lekérdezési élményének javítására összpontosít.

Időbélyeg:

Még több AWS gépi tanulás