Îmbunătățiți acuratețea căutării cu Spell Checker în Amazon Kendra PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Îmbunătățiți acuratețea căutării cu Verificatorul ortografic din Amazon Kendra

Amazon Kendra este un serviciu de căutare inteligent alimentat de machine learning. Puteți primi sugestii de ortografie pentru termenii greșiți în interogările dvs. utilizând Verificator ortografic Amazon Kendra. Verificatorul ortografic ajută la reducerea frecvenței interogărilor care returnează rezultate irelevante, oferind sugestii de ortografie pentru termeni nerecunoscuți.

În această postare, explorăm cum să folosiți Amazon Kendra Spell Checker pe Consola de administrare AWS, precum și cum să activați Verificatorul ortografic într-o aplicație de căutare alimentată de Amazon Kendra prin intermediul Interfața liniei de comandă AWS (AWS CLI) și AWS SDK.

Utilizați Amazon Kendra Spell Checker pe consolă

Puteți primi automat sugestii de ortografie pentru interogările Amazon Kendra scrise greșit atunci când interogați prin consolă.

Pe consola Amazon Kendra, alegeți indexul dorit, apoi alegeți Căutați conținut indexat în panoul de navigare. Asigurați-vă că indexul selectat are documente ingerate; în această postare, folosim exemplul de documentație AWS găsit în documentul Surse de date secțiunea panoului de navigare.

Pe consola de căutare Amazon Kendra, pur și simplu trimiteți o interogare așa cum ați face de obicei. Termenii greșiți din interogare sunt înlocuiți cu termenii sugerați în secțiunea „Vrei să spui” a consolei de căutare.

Îmbunătățiți acuratețea căutării cu Spell Checker în Amazon Kendra PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Alegerea interogării sugerate trimite o nouă interogare cu ortografia corectată.

Îmbunătățiți acuratețea căutării cu Spell Checker în Amazon Kendra PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

După cum puteți vedea, rezultatele interogării furnizate prin interogarea sugerată sunt semnificativ mai relevante, datorită Verificatorului ortografic!

Utilizați Amazon Kendra Spell Checker în aplicațiile de căutare

Aplicațiile de căutare bazate pe Amazon Kendra pot activa rapid și ușor Verificatorul ortografic prin AWS CLI sau AWS SDK, pe care le parcurgem în această secțiune. În plus, trecem peste un exemplu de procesare a răspunsului Verificatorului ortografic.

AWS CLI

Să vedem cum utilizatorii AWS CLI se pot înscrie la Amazon Kendra Spell Checker pentru a primi sugestii de ortografie pentru termenii de interogare greșit. Folosim AWS CLI pentru a interoga Amazon Kendra ca de obicei, cu o singură modificare mică: includem --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true argument:

$ aws kendra query --query-text "what is knedar" --index-id [YOUR_INDEX_ID] --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true

Pe lângă rezultatele normale ale interogării, răspunsul de la Amazon Kendra conține acum un SpellCorrectedQueries obiect, dacă există sugestii de ortografie pentru interogare. Pentru mai multe informații, vezi SpellCorrectedQuery.

// Full query response omitted for brevity "SpellCorrectedQueries": [ { "SuggestedQueryText": "what is kendra", "Corrections": [ { "BeginOffset": 8, "EndOffset": 14, "Term": "knedar", "CorrectedTerm": "kendra" } ] }
]

SDK AWS

În continuare, să vedem cum Amazon Kendra oferă funcționalitate de verificare ortografică pentru utilizatorii AWS SDK. Pentru acest exemplu, folosim Python 3. Trimitem o interogare cu câteva erori de ortografie și imprimăm SpellCorrectedQueries obiect în răspuns:

import boto3 kendra = boto3.client('kendra') index_id = '[YOUR_INDEX_ID]'
query_text = 'kendra fre teir hours'
spell_correction_configuration = { 'IncludeQuerySpellCheckSuggestions': True } response = kendra.query( IndexId = index_id, QueryText = query_text, SpellCorrectionConfiguration = spell_correction_configuration
) print(response['SpellCorrectedQueries'])

Răspunsul de la Amazon Kendra conține acum sugestiile de ortografie așteptate:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Procesați răspunsul Amazon Kendra Spell Check

Acum că am analizat cum să obținem sugestii de ortografie în mod programatic prin intermediul AWS CLI sau AWS SDK, putem examina modul în care transformăm răspunsul într-o interogare sugerată care poate fi citită de om. Pentru acest exemplu, folosim exemplul de ieșire din secțiunea anterioară:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Fiecare SpellCorrectedQuery are doua chei: SuggestedQueryText și Corrections.

  • SuggestedQueryText mapează la un șir care conține interogarea actualizată cu corecțiile de ortografie sugerate.
  • Corrections hărți la o listă de Correction obiecte, care conține decalajul de început și de sfârșit al corecției, precum și termenul original din interogare și sugestia de ortografie pentru termenul respectiv.

Pentru exemplul nostru, dorim să arătăm textul de interogare sugerat cu termenii nou sugerați în cursive, similar cu ceea ce se face pe consola Amazon Kendra. Pentru a realiza acest lucru, putem adăuga etichete de deschidere HTML cursive <i> de la BeginOffset fiecărei Correction și etichete de închidere HTML cursive </i> de la EndOffset fiecărei Correction în Corrections listă. Rețineți că BeginOffset și EndOffset se bazează pe lungimea termenilor corectați, nu pe termenii originali.

Adăugarea etichetelor italice la SuggestedQueryText ne oferă următorul text de interogare sugerat:

kendra <i>free</i> <i>tier</i> hours

După cum puteți vedea, Amazon Kendra Spell Checker simplifică adăugarea funcționalității de verificare ortografică la aplicația dvs. de căutare.

Concluzie

Verificatorul ortografic este o funcție nouă și puternică oferită de Amazon Kendra. Verificatorul ortografic este o modalitate simplă și eficientă de a reduce rapid numărul de interogări inutile, oferind sugestii de ortografie utilizatorilor finali pentru termenii greșiți.

Verificatorul ortografic este disponibil în toate Regiunile AWS unde Amazon Kendra este disponibil și acceptă toate limbile acceptate în prezent de Amazon Kendra.

Pentru a afla mai multe despre Amazon Kendra, vizitați Pagina produsului Amazon Kendra.


Despre autor

Îmbunătățiți acuratețea căutării cu Spell Checker în Amazon Kendra PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Matthew Peretick este inginer de dezvoltare software la Amazon Web Services cu sediul în New York City. Matthew este membru al echipei Amazon Kendra care se concentrează pe îmbunătățirea experienței de interogare Amazon Kendra.

Timestamp-ul:

Mai mult de la Învățare automată AWS