Forbedre søgenøjagtigheden med Stavekontrol i Amazon Kendra PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Forbedre søgenøjagtigheden med Stavekontrol i Amazon Kendra

Amazon Kendra er en intelligent søgetjeneste drevet af maskinlæring. Du kan modtage staveforslag til fejlstavede udtryk i dine forespørgsler ved at bruge Amazon Kendra stavekontrol. Stavekontrol hjælper med at reducere hyppigheden af ​​forespørgsler, der returnerer irrelevante resultater ved at give staveforslag til ikke-genkendte termer.

I dette indlæg undersøger vi, hvordan du bruger Amazon Kendra Stavekontrol på AWS Management Console, samt hvordan du aktiverer stavekontrol i en Amazon Kendra-drevet søgeapplikation gennem AWS kommandolinjegrænseflade (AWS CLI) og AWS SDK.

Brug Amazon Kendra Stavekontrol på konsollen

Du kan automatisk modtage staveforslag til dine fejlstavede Amazon Kendra-forespørgsler, når du forespørger gennem konsollen.

På Amazon Kendra-konsollen skal du vælge dit ønskede indeks og derefter vælge Søg efter indekseret indhold i navigationsruden. Sørg for, at det valgte indeks har indlæst dokumenter; i dette indlæg bruger vi AWS-eksempeldokumentationen, der findes i Data kilder sektion af navigationsruden.

På Amazon Kendra-søgekonsollen skal du blot indsende en forespørgsel, som du plejer. Fejlstavede termer i forespørgslen erstattes med foreslåede termer i sektionen "Mente du" i søgekonsollen.

Forbedre søgenøjagtigheden med Stavekontrol i Amazon Kendra PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Hvis du vælger den foreslåede forespørgsel, sendes en ny forespørgsel med den rettede stavemåde.

Forbedre søgenøjagtigheden med Stavekontrol i Amazon Kendra PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Som du kan se, er forespørgselsresultaterne fra den foreslåede forespørgsel betydeligt mere relevante takket være stavekontrol!

Brug Amazon Kendra Stavekontrol i søgeapplikationer

Søgeapplikationer drevet af Amazon Kendra kan hurtigt og nemt aktivere stavekontrol gennem AWS CLI eller AWS SDK, som vi gennemgår i dette afsnit. Derudover gennemgår vi et eksempel på, hvordan man behandler Stavekontrol-svaret.

AWS CLI

Lad os se på, hvordan AWS CLI-brugere kan tilmelde sig Amazon Kendra Stavekontrol for at modtage staveforslag til fejlstavede forespørgselsudtryk. Vi bruger AWS CLI til at forespørge Amazon Kendra som sædvanlig, med kun en lille ændring: vi inkluderer --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true argument:

$ aws kendra query --query-text "what is knedar" --index-id [YOUR_INDEX_ID] --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true

Ud over de normale forespørgselsresultater indeholder svaret fra Amazon Kendra nu en SpellCorrectedQueries objekt, hvis der er nogle staveforslag til forespørgslen. For mere information, se SpellCorrectedQuery.

// Full query response omitted for brevity "SpellCorrectedQueries": [ { "SuggestedQueryText": "what is kendra", "Corrections": [ { "BeginOffset": 8, "EndOffset": 14, "Term": "knedar", "CorrectedTerm": "kendra" } ] }
]

AWS SDK

Lad os derefter gennemgå, hvordan Amazon Kendra leverer stavekontrolfunktionalitet til AWS SDK-brugere. Til dette eksempel bruger vi Python 3. Vi sender en forespørgsel med et par stavefejl og udskriver SpellCorrectedQueries objekt i svaret:

import boto3 kendra = boto3.client('kendra') index_id = '[YOUR_INDEX_ID]'
query_text = 'kendra fre teir hours'
spell_correction_configuration = { 'IncludeQuerySpellCheckSuggestions': True } response = kendra.query( IndexId = index_id, QueryText = query_text, SpellCorrectionConfiguration = spell_correction_configuration
) print(response['SpellCorrectedQueries'])

Svaret fra Amazon Kendra indeholder nu de forventede staveforslag:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Behandl Amazon Kendra Stavekontrol-svaret

Nu hvor vi har gennemgået, hvordan man programmæssigt får staveforslag gennem enten AWS CLI eller AWS SDK, kan vi undersøge, hvordan vi forvandler svaret til en foreslået forespørgsel, der kan læses af mennesker. Til dette eksempel bruger vi eksempeloutputtet fra det forrige afsnit:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Hver SpellCorrectedQuery har to nøgler: SuggestedQueryText , Corrections.

  • SuggestedQueryText maps til en streng, der indeholder den opdaterede forespørgsel med de foreslåede staverettelser.
  • Corrections kort til en liste over Correction objekter, som indeholder begyndelses- og slutforskydningen af ​​rettelsen, såvel som den oprindelige term fra forespørgslen og staveforslaget for det pågældende udtryk.

For vores eksempel ønsker vi at vise den foreslåede forespørgselstekst med de nyligt foreslåede termer i kursiv, svarende til hvad der gøres på Amazon Kendra-konsollen. For at opnå dette kan vi tilføje HTML kursiv åbningstags <i> ved BeginOffset af hver Correction og HTML kursiv afsluttende tags </i> ved EndOffset af hver Correction i Corrections liste. Noter det BeginOffset , EndOffset er baseret på længden af ​​de korrigerede termer, ikke de originale termer.

Tilføjelse af kursiv-tags til SuggestedQueryText giver os følgende foreslåede forespørgselstekst:

kendra <i>free</i> <i>tier</i> hours

Som du kan se, gør Amazon Kendra Stavekontrol det nemt at tilføje stavekontrolfunktionalitet til din søgeapplikation.

Konklusion

Stavekontrol er en ny, kraftfuld funktion, der tilbydes af Amazon Kendra. Stavekontrol er en enkel, effektiv måde til hurtigt at reducere antallet af uhensigtsmæssige forespørgsler ved at give staveforslag til slutbrugere for fejlstavede udtryk.

Stavekontrol er tilgængelig i alle AWS-regioner hvor Amazon Kendra er tilgængelig, og understøtter alle sprog, der i øjeblikket understøttes af Amazon Kendra.

For at lære mere om Amazon Kendra, besøg Amazon Kendra produktside.


Om forfatteren

Forbedre søgenøjagtigheden med Stavekontrol i Amazon Kendra PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Matthew Peretick er softwareudviklingsingeniør hos Amazon Web Services med base i New York City. Matthew er medlem af Amazon Kendra-teamet, der fokuserer på at forbedre Amazon Kendra-forespørgselsoplevelsen.

Tidsstempel:

Mere fra AWS maskinindlæring