Izboljšajte natančnost iskanja s preverjanjem črkovanja v Amazon Kendra PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Izboljšajte natančnost iskanja s preverjanjem črkovanja v Amazon Kendra

Amazonska Kendra je inteligentna iskalna storitev, ki jo poganja strojno učenje. Predloge za črkovanje napačno črkovanih izrazov v svojih poizvedbah lahko prejmete tako, da uporabite Amazon Kendra črkovalnik. Preverjevalnik črkovanja pomaga zmanjšati pogostost poizvedb, ki vrnejo nepomembne rezultate, tako da ponudi predloge črkovanja za neprepoznane izraze.

V tej objavi raziskujemo, kako uporabljati Amazon Kendra Spell Checker na Konzola za upravljanje AWS, kot tudi, kako omogočiti črkovalnik v iskalni aplikaciji, ki jo poganja Amazon Kendra, prek Vmesnik ukazne vrstice AWS (AWS CLI) in AWS SDK.

Uporabite Amazon Kendra Spell Checker na konzoli

Pri poizvedovanju prek konzole lahko samodejno prejmete predloge črkovanja za napačno črkovane poizvedbe Amazon Kendra.

Na konzoli Amazon Kendra izberite želeni indeks in nato izberite Iskanje po indeksirani vsebini v navigacijskem podoknu. Prepričajte se, da izbrani indeks vsebuje dokumente; v tej objavi uporabljamo vzorčno dokumentacijo AWS, ki jo najdete v Viri podatkov v navigacijskem podoknu.

Na iskalni konzoli Amazon Kendra preprosto oddajte poizvedbo kot običajno. Napačno črkovani izrazi v poizvedbi so nadomeščeni s predlaganimi izrazi v razdelku »Ali ste mislili« v iskalni konzoli.

Izboljšajte natančnost iskanja s preverjanjem črkovanja v Amazon Kendra PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Če izberete predlagano poizvedbo, pošljete novo poizvedbo s popravljenim črkovanjem.

Izboljšajte natančnost iskanja s preverjanjem črkovanja v Amazon Kendra PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Kot lahko vidite, so rezultati poizvedbe, posredovani s predlagano poizvedbo, bistveno bolj ustrezni, zahvaljujoč črkovalniku!

Uporabite Amazon Kendra Spell Checker v iskalnih aplikacijah

Iskalne aplikacije, ki jih poganja Amazon Kendra, lahko hitro in preprosto omogočijo preverjanje črkovanja prek AWS CLI ali AWS SDK, ki ju obravnavamo v tem razdelku. Poleg tega si bomo ogledali primer, kako obdelati odgovor črkovalnika.

AWS CLI

Poglejmo, kako se lahko uporabniki AWS CLI odločijo za črkovalnik Amazon Kendra za prejemanje predlogov črkovanja za napačno črkovane izraze poizvedbe. AWS CLI uporabljamo za poizvedovanje Amazon Kendra kot običajno, le z eno majhno spremembo: vključimo --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true argument:

$ aws kendra query --query-text "what is knedar" --index-id [YOUR_INDEX_ID] --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true

Poleg običajnih rezultatov poizvedbe odgovor Amazon Kendre zdaj vsebuje SpellCorrectedQueries objekt, če obstajajo predlogi za črkovanje za poizvedbo. Za več informacij glejte SpellCorrectedQuery.

// Full query response omitted for brevity "SpellCorrectedQueries": [ { "SuggestedQueryText": "what is kendra", "Corrections": [ { "BeginOffset": 8, "EndOffset": 14, "Term": "knedar", "CorrectedTerm": "kendra" } ] }
]

AWS SDK

Nato si poglejmo, kako Amazon Kendra zagotavlja funkcijo preverjanja črkovanja za uporabnike AWS SDK. Za ta primer uporabljamo Python 3. Predložimo poizvedbo z nekaj črkovalnimi napakami in natisnemo SpellCorrectedQueries objekt v odgovoru:

import boto3 kendra = boto3.client('kendra') index_id = '[YOUR_INDEX_ID]'
query_text = 'kendra fre teir hours'
spell_correction_configuration = { 'IncludeQuerySpellCheckSuggestions': True } response = kendra.query( IndexId = index_id, QueryText = query_text, SpellCorrectionConfiguration = spell_correction_configuration
) print(response['SpellCorrectedQueries'])

Odgovor Amazon Kendre zdaj vsebuje pričakovane predloge črkovanja:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Obdelajte odgovor Amazon Kendra Spell Check

Zdaj, ko smo preučili, kako programsko pridobiti črkovalne predloge prek AWS CLI ali AWS SDK, lahko preučimo, kako spremenimo odgovor v človeku berljivo predlagano poizvedbo. Za ta primer uporabimo vzorčni rezultat iz prejšnjega razdelka:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

vsak SpellCorrectedQuery ima dva ključa: SuggestedQueryText in Corrections.

  • SuggestedQueryText preslika v niz, ki vsebuje posodobljeno poizvedbo s predlaganimi popravki črkovanja.
  • Corrections preslika na seznam Correction objektov, ki vsebuje začetni in končni odmik popravka ter izvirni izraz iz poizvedbe in črkovalni predlog za ta izraz.

Za naš primer želimo prikazati predlagano besedilo poizvedbe z na novo predlaganimi izrazi v poševnem tisku, podobno kot se to naredi na konzoli Amazon Kendra. Da bi to dosegli, lahko dodamo začetne oznake HTML italic <i> pri BeginOffset vsakega Correction in HTML ležeče zaključne oznake </i> pri EndOffset vsakega Correction v Corrections seznam. Upoštevajte to BeginOffset in EndOffset temeljijo na dolžini popravljenih izrazov, ne na izvirnih izrazih.

Dodajanje oznak ležečega tiska v SuggestedQueryText nam ponudi naslednje predlagano besedilo poizvedbe:

kendra <i>free</i> <i>tier</i> hours

Kot lahko vidite, Amazon Kendra Spell Checker omogoča preprosto dodajanje funkcije preverjanja črkovanja vaši iskalni aplikaciji.

zaključek

Preverjevalnik črkovanja je nova, zmogljiva funkcija, ki jo ponuja Amazon Kendra. Preverjevalnik črkovanja je preprost in učinkovit način za hitro zmanjšanje števila neuporabnih poizvedb, tako da končnim uporabnikom ponudi črkovalne predloge za napačno črkovane izraze.

Preverjevalnik črkovanja je na voljo v vseh AWS Regije kjer je Amazon Kendra na voljo, in podpira vse jezike, ki jih trenutno podpira Amazon Kendra.

Če želite izvedeti več o Amazon Kendra, obiščite Stran izdelka Amazon Kendra.


O Author

Izboljšajte natančnost iskanja s preverjanjem črkovanja v Amazon Kendra PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.Matthew Peretick je inženir za razvoj programske opreme pri Amazon Web Services s sedežem v New Yorku. Matthew je član ekipe Amazon Kendra, ki se osredotoča na izboljšanje izkušnje s poizvedbami Amazon Kendra.

Časovni žig:

Več od Strojno učenje AWS