Förbättra söknoggrannheten med stavningskontrollen i Amazon Kendra PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Förbättra söknoggrannheten med stavningskontrollen i Amazon Kendra

Amazon Kendra är en intelligent söktjänst som drivs av maskininlärning. Du kan få stavningsförslag för felstavade termer i dina frågor genom att använda Amazon Kendra stavningskontroll. Stavningskontrollen hjälper till att minska frekvensen av frågor som returnerar irrelevanta resultat genom att ge stavningsförslag för okända termer.

I det här inlägget utforskar vi hur man använder Amazon Kendra Spell Checker på AWS Management Console, samt hur du aktiverar stavningskontrollen i en Amazon Kendra-driven sökapplikation via AWS-kommandoradsgränssnitt (AWS CLI) och AWS SDK.

Använd Amazon Kendra stavningskontroll på konsolen

Du kan automatiskt få stavningsförslag för dina felstavade Amazon Kendra-frågor när du frågar via konsolen.

På Amazon Kendra-konsolen, välj önskat index och välj sedan Sök efter indexerat innehåll i navigeringsfönstret. Se till att det valda indexet har matat in dokument; i det här inlägget använder vi AWS-exempeldokumentationen som finns i Datakällor avsnittet i navigeringsfönstret.

På Amazon Kendras sökkonsol skickar du helt enkelt en fråga som du brukar. Felstavade termer i frågan ersätts med föreslagna termer i avsnittet "Menade du" i sökkonsolen.

Förbättra söknoggrannheten med stavningskontrollen i Amazon Kendra PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Om du väljer den föreslagna frågan skickas en ny fråga med den korrigerade stavningen.

Förbättra söknoggrannheten med stavningskontrollen i Amazon Kendra PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Som du kan se är frågeresultaten som tillhandahålls genom den föreslagna frågan betydligt mer relevanta, tack vare stavningskontrollen!

Använd Amazon Kendra stavningskontroll i sökapplikationer

Sökapplikationer som drivs av Amazon Kendra kan snabbt och enkelt aktivera stavningskontroll genom AWS CLI eller AWS SDK, som vi går igenom i det här avsnittet. Dessutom går vi igenom ett exempel på hur man bearbetar stavningskontrollsvaret.

AWS CLI

Låt oss titta på hur AWS CLI-användare kan välja Amazon Kendra Spell Checker för att få stavningsförslag för felstavade frågetermer. Vi använder AWS CLI för att fråga Amazon Kendra som vanligt, med bara en liten ändring: vi inkluderar --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true argument:

$ aws kendra query --query-text "what is knedar" --index-id [YOUR_INDEX_ID] --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true

Förutom de normala frågeresultaten innehåller svaret från Amazon Kendra nu en SpellCorrectedQueries objekt, om det finns några stavningsförslag för frågan. För mer information, se SpellCorrectedQuery.

// Full query response omitted for brevity "SpellCorrectedQueries": [ { "SuggestedQueryText": "what is kendra", "Corrections": [ { "BeginOffset": 8, "EndOffset": 14, "Term": "knedar", "CorrectedTerm": "kendra" } ] }
]

AWS SDK

Låt oss sedan gå igenom hur Amazon Kendra tillhandahåller stavningskontrollfunktioner för AWS SDK-användare. För det här exemplet använder vi Python 3. Vi skickar en fråga med några stavfel och skriver ut SpellCorrectedQueries objekt i svaret:

import boto3 kendra = boto3.client('kendra') index_id = '[YOUR_INDEX_ID]'
query_text = 'kendra fre teir hours'
spell_correction_configuration = { 'IncludeQuerySpellCheckSuggestions': True } response = kendra.query( IndexId = index_id, QueryText = query_text, SpellCorrectionConfiguration = spell_correction_configuration
) print(response['SpellCorrectedQueries'])

Svaret från Amazon Kendra innehåller nu de förväntade stavningsförslagen:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Bearbeta svaret från Amazon Kendra stavningskontroll

Nu när vi har gått igenom hur man programmässigt får stavningsförslag genom antingen AWS CLI eller AWS SDK, kan vi undersöka hur vi förvandlar svaret till en av människor läsbar föreslagen fråga. För det här exemplet använder vi exempelutdata från föregående avsnitt:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Varje SpellCorrectedQuery har två nycklar: SuggestedQueryText och Corrections.

  • SuggestedQueryText mappar till en sträng som innehåller den uppdaterade frågan med de föreslagna stavningskorrigeringarna.
  • Corrections kartor till en lista över Correction objekt, som innehåller början och slutförskjutningen av korrigeringen, såväl som den ursprungliga termen från frågan och stavningsförslaget för den termen.

För vårt exempel vill vi visa den föreslagna frågetexten med de nyligen föreslagna termerna kursiverade, liknande det som görs på Amazon Kendra-konsolen. För att uppnå detta kan vi lägga till HTML-kursiv öppningstaggar <i> vid BeginOffset av varje Correction och HTML-kursiv stängningstaggar </i> vid EndOffset av varje Correction i Corrections lista. Anteckna det BeginOffset och EndOffset baseras på längden på de korrigerade termerna, inte de ursprungliga termerna.

Lägger till taggarna med kursiv stil till SuggestedQueryText ger oss följande föreslagna frågetext:

kendra <i>free</i> <i>tier</i> hours

Som du kan se gör Amazon Kendra Spell Checker det enkelt att lägga till stavningskontrollfunktioner till din sökapplikation.

Slutsats

Stavningskontroll är en ny, kraftfull funktion som erbjuds av Amazon Kendra. Stavningskontrollen är ett enkelt och effektivt sätt att snabbt minska antalet ohjälpsamma frågor genom att ge slutanvändare stavningsförslag för felstavade termer.

Stavningskontrollen är tillgänglig i alla AWS-regioner där Amazon Kendra är tillgängligt och stöder alla språk som för närvarande stöds av Amazon Kendra.

För att lära dig mer om Amazon Kendra, besök Amazon Kendra produktsida.


Om författaren

Förbättra söknoggrannheten med stavningskontrollen i Amazon Kendra PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.Matthew Peretick är en mjukvaruutvecklingsingenjör på Amazon Web Services baserad i New York City. Matthew är medlem i Amazon Kendra-teamet som fokuserar på att förbättra Amazon Kendra-frågeupplevelsen.

Tidsstämpel:

Mer från AWS maskininlärning