Βελτιώστε την ακρίβεια αναζήτησης με τον ορθογραφικό έλεγχο στο Amazon Kendra PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Βελτιώστε την ακρίβεια αναζήτησης με τον ορθογραφικό έλεγχο στο Amazon Kendra

Amazon Kendra είναι μια έξυπνη υπηρεσία αναζήτησης που υποστηρίζεται από μηχανική μάθηση. Μπορείτε να λαμβάνετε προτάσεις ορθογραφίας για όρους που έχουν ανορθογραφήσει στα ερωτήματά σας χρησιμοποιώντας το Ορθογραφικός έλεγχος Amazon Kendra. Ο ορθογραφικός έλεγχος συμβάλλει στη μείωση της συχνότητας των ερωτημάτων που επιστρέφουν άσχετα αποτελέσματα παρέχοντας προτάσεις ορθογραφίας για μη αναγνωρισμένους όρους.

Σε αυτήν την ανάρτηση, διερευνούμε πώς να χρησιμοποιήσετε τον ορθογραφικό έλεγχο Amazon Kendra στο Κονσόλα διαχείρισης AWS, καθώς και πώς να ενεργοποιήσετε τον ορθογραφικό έλεγχο σε μια εφαρμογή αναζήτησης που υποστηρίζεται από το Amazon Kendra μέσω του Διεπαφή γραμμής εντολών AWS (AWS CLI) και AWS SDK.

Χρησιμοποιήστε τον ορθογραφικό έλεγχο Amazon Kendra στην κονσόλα

Μπορείτε να λαμβάνετε αυτόματα προτάσεις ορθογραφίας για τα ανορθόγραφα ερωτήματά σας στο Amazon Kendra κατά την υποβολή ερωτημάτων μέσω της κονσόλας.

Στην κονσόλα Amazon Kendra, επιλέξτε το ευρετήριο που θέλετε και μετά επιλέξτε Αναζήτηση περιεχομένου με ευρετήριο στο παράθυρο πλοήγησης. Βεβαιωθείτε ότι το επιλεγμένο ευρετήριο έχει απορροφήσει έγγραφα. σε αυτήν την ανάρτηση, χρησιμοποιούμε το δείγμα τεκμηρίωσης AWS που βρίσκεται στο Πηγές δεδομένων τμήμα του παραθύρου πλοήγησης.

Στην κονσόλα αναζήτησης Amazon Kendra, απλώς υποβάλετε ένα ερώτημα όπως θα κάνατε συνήθως. Οι ανορθόγραφοι όροι στο ερώτημα αντικαθίστανται από τους προτεινόμενους όρους στην ενότητα "Μήπως εννοούσατε" της κονσόλας αναζήτησης.

Βελτιώστε την ακρίβεια αναζήτησης με τον ορθογραφικό έλεγχο στο Amazon Kendra PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Επιλέγοντας το προτεινόμενο ερώτημα υποβάλλεται ένα νέο ερώτημα με τη διορθωμένη ορθογραφία.

Βελτιώστε την ακρίβεια αναζήτησης με τον ορθογραφικό έλεγχο στο Amazon Kendra PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Όπως μπορείτε να δείτε, τα αποτελέσματα ερωτημάτων που παρέχονται μέσω του προτεινόμενου ερωτήματος είναι σημαντικά πιο σχετικά, χάρη στον Ορθογραφικό Έλεγχο!

Χρησιμοποιήστε τον ορθογραφικό έλεγχο Amazon Kendra σε εφαρμογές αναζήτησης

Οι εφαρμογές αναζήτησης που υποστηρίζονται από το Amazon Kendra μπορούν γρήγορα και εύκολα να ενεργοποιήσουν τον Ορθογραφικό Έλεγχο μέσω του AWS CLI ή του AWS SDK, το οποίο εξετάζουμε σε αυτήν την ενότητα. Επιπλέον, παρουσιάζουμε ένα παράδειγμα του τρόπου επεξεργασίας της απάντησης του ορθογραφικού ελέγχου.

AWS CLI

Ας δούμε πώς οι χρήστες του AWS CLI μπορούν να επιλέξουν τον Ορθογραφικό Έλεγχο του Amazon Kendra για να λάβουν προτάσεις ορθογραφίας για όρους ερωτημάτων με ανορθόγραφους όρους. Χρησιμοποιούμε το AWS CLI για να ρωτήσουμε το Amazon Kendra ως συνήθως, με μία μόνο μικρή αλλαγή: συμπεριλαμβάνουμε το --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true διαφωνία:

$ aws kendra query --query-text "what is knedar" --index-id [YOUR_INDEX_ID] --spell-correction-configuration IncludeQuerySpellCheckSuggestions=true

Εκτός από τα κανονικά αποτελέσματα ερωτημάτων, η απάντηση από το Amazon Kendra περιέχει τώρα ένα SpellCorrectedQueries αντικείμενο, εάν υπάρχουν προτάσεις ορθογραφίας για το ερώτημα. Για περισσότερες πληροφορίες, βλ SpellCorectedQuery.

// Full query response omitted for brevity "SpellCorrectedQueries": [ { "SuggestedQueryText": "what is kendra", "Corrections": [ { "BeginOffset": 8, "EndOffset": 14, "Term": "knedar", "CorrectedTerm": "kendra" } ] }
]

AWS SDK

Στη συνέχεια, ας δούμε πώς το Amazon Kendra παρέχει λειτουργικότητα ορθογραφικού ελέγχου για χρήστες AWS SDK. Για αυτό το παράδειγμα, χρησιμοποιούμε Python 3. Υποβάλλουμε ένα ερώτημα με μερικά ορθογραφικά λάθη και εκτυπώνουμε το SpellCorrectedQueries αντικείμενο στην απάντηση:

import boto3 kendra = boto3.client('kendra') index_id = '[YOUR_INDEX_ID]'
query_text = 'kendra fre teir hours'
spell_correction_configuration = { 'IncludeQuerySpellCheckSuggestions': True } response = kendra.query( IndexId = index_id, QueryText = query_text, SpellCorrectionConfiguration = spell_correction_configuration
) print(response['SpellCorrectedQueries'])

Η απάντηση από το Amazon Kendra περιέχει τώρα τις αναμενόμενες προτάσεις ορθογραφίας:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Επεξεργαστείτε την απάντηση ορθογραφικού ελέγχου Amazon Kendra

Τώρα που εξετάσαμε τον τρόπο λήψης προτάσεων ορθογραφίας μέσω προγραμματισμού είτε μέσω του AWS CLI είτε του AWS SDK, μπορούμε να εξετάσουμε πώς μετατρέπουμε την απάντηση σε ένα προτεινόμενο ερώτημα αναγνώσιμο από τον άνθρωπο. Για αυτό το παράδειγμα, χρησιμοποιούμε το δείγμα εξόδου από την προηγούμενη ενότητα:

[ { 'SuggestedQueryText': 'kendra free tier hours', 'Corrections': [ { 'BeginOffset': 7, 'EndOffset': 11, 'Term': 'fre', 'CorrectedTerm': 'free' }, { 'BeginOffset': 12, 'EndOffset': 16, 'Term': 'teir', 'CorrectedTerm': 'tier' } ] }
]

Κάθε SpellCorrectedQuery έχει δύο κλειδιά: SuggestedQueryText και Corrections.

  • SuggestedQueryText αντιστοιχίζει σε μια συμβολοσειρά που περιέχει το ενημερωμένο ερώτημα με τις προτεινόμενες ορθογραφικές διορθώσεις.
  • Corrections χάρτες σε μια λίστα με Correction αντικείμενα, το οποίο περιέχει τη μετατόπιση αρχής και λήξης της διόρθωσης, καθώς και τον αρχικό όρο από το ερώτημα και την ορθογραφική πρόταση για αυτόν τον όρο.

Για το παράδειγμά μας, θέλουμε να δείξουμε το προτεινόμενο κείμενο ερωτήματος με τους νέους προτεινόμενους όρους πλάγια γράμματα, παρόμοια με αυτό που γίνεται στην κονσόλα Amazon Kendra. Για να το πετύχουμε αυτό, μπορούμε να προσθέσουμε πλάγιες ετικέτες ανοίγματος HTML <i> κατά τη BeginOffset εκάστου Correction και πλάγιες ετικέτες κλεισίματος HTML </i> κατά τη EndOffset εκάστου Correction στο Corrections λίστα. Σημειώστε ότι BeginOffset και EndOffset βασίζονται στο μήκος των διορθωμένων όρων και όχι στους αρχικούς όρους.

Προσθήκη των πλάγιων ετικετών στο SuggestedQueryText μας δίνει το ακόλουθο προτεινόμενο κείμενο ερωτήματος:

kendra <i>free</i> <i>tier</i> hours

Όπως μπορείτε να δείτε, το Amazon Kendra Spell Checker διευκολύνει την προσθήκη λειτουργιών ορθογραφικού ελέγχου στην εφαρμογή αναζήτησής σας.

Συμπέρασμα

Ο ορθογραφικός έλεγχος είναι μια νέα, ισχυρή δυνατότητα που προσφέρεται από το Amazon Kendra. Ο ορθογραφικός έλεγχος είναι ένας απλός, αποτελεσματικός τρόπος για να μειώσετε γρήγορα τον αριθμό των μη χρήσιμων ερωτημάτων παρέχοντας ορθογραφικές προτάσεις στους τελικούς χρήστες για ανορθόγραφους όρους.

Ο ορθογραφικός έλεγχος είναι διαθέσιμος σε όλα Περιοχές AWS όπου είναι διαθέσιμο το Amazon Kendra και υποστηρίζει όλες τις γλώσσες που υποστηρίζονται αυτήν τη στιγμή από το Amazon Kendra.

Για να μάθετε περισσότερα για το Amazon Kendra, επισκεφθείτε τη διεύθυνση Σελίδα προϊόντος Amazon Kendra.


Σχετικά με το Συγγραφέας

Βελτιώστε την ακρίβεια αναζήτησης με τον ορθογραφικό έλεγχο στο Amazon Kendra PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Μάθιου Πέρτικ είναι Μηχανικός Ανάπτυξης Λογισμικού στην Amazon Web Services με έδρα τη Νέα Υόρκη. Ο Matthew είναι μέλος της ομάδας Amazon Kendra που επικεντρώνεται στη βελτίωση της εμπειρίας ερωτημάτων Amazon Kendra.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS