Améliorez la précision de la transcription des appels client-agent grâce au vocabulaire personnalisé dans Amazon Transcribe PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Améliorez la précision de la transcription des appels client-agent avec un vocabulaire personnalisé dans Amazon Transcribe

De nombreux AWS Clients ont utilisé avec succès Amazon Transcribe pour convertir avec précision, efficacité et automatiquement les conversations audio de leurs clients en texte et en extraire des informations exploitables. Ces informations peuvent vous aider à améliorer en permanence les processus et les produits qui améliorent directement la qualité et l'expérience de vos clients.

Dans de nombreux pays, comme l'Inde, l'anglais n'est pas la principale langue de communication. Les conversations des clients indiens contiennent des langues régionales comme l'hindi, avec des mots et des phrases en anglais prononcés au hasard tout au long des appels. Dans les fichiers multimédias source, il peut y avoir des noms propres, des acronymes, des mots ou des phrases spécifiques à un domaine dont le modèle Amazon Transcribe par défaut n'a pas connaissance. Les transcriptions de ces fichiers multimédias peuvent avoir des orthographes inexactes pour ces mots.

Dans cet article, nous montrons comment vous pouvez fournir plus d'informations à Amazon Transcribe avec vocabulaires personnalisés pour mettre à jour la façon dont Amazon Transcribe gère la transcription de vos fichiers audio avec une terminologie spécifique à l'entreprise. Nous montrons les étapes pour améliorer la précision des transcriptions pour les appels en hinglish (appels en hindi indien contenant des mots et des phrases en anglais indien). Vous pouvez utiliser le même processus pour transcrire des appels audio avec n'importe quel langue prise en charge par Amazon Transcribe. Après avoir créé des vocabulaires personnalisés, vous pouvez transcrire des appels audio avec précision et à grande échelle en utilisant notre analyse post-appel solution, dont nous parlerons plus tard dans cet article.

Vue d'ensemble de la solution

Nous utilisons l'appel audio hindi indien suivant (SampleAudio.wav) avec des mots anglais aléatoires pour illustrer le processus.

Nous vous guiderons ensuite à travers les étapes de haut niveau suivantes :

  1. Transcrivez le fichier audio à l'aide du modèle Amazon Transcribe Hindi par défaut.
  2. Mesurer la précision du modèle.
  3. Entraînez le modèle avec un vocabulaire personnalisé.
  4. Mesurez la précision du modèle formé.

Pré-requis

Avant de commencer, nous devons confirmer que le fichier audio d'entrée répond aux transcrire les exigences d'entrée de données.

A monophonique enregistrement, également appelé mono, contient un signal audio, dans lequel tous les éléments audio de l'agent et du client sont combinés en un seul canal. UN stéréophonique enregistrement, également appelé stéréo, contient deux signaux audio pour capturer les éléments audio de l'agent et du client dans deux canaux distincts. Chaque fichier d'enregistrement agent-client contient deux canaux audio, un pour l'agent et un pour le client.

Les enregistrements audio basse fidélité, tels que les enregistrements téléphoniques, utilisent généralement des taux d'échantillonnage de 8,000 16,000 Hz. Amazon Transcribe prend en charge le traitement des fichiers audio enregistrés mono et haute fidélité avec des fréquences d'échantillonnage comprises entre 48,000 XNUMX et XNUMX XNUMX Hz.

Pour de meilleurs résultats de transcription et pour distinguer clairement les mots prononcés par l'agent et le client, nous vous recommandons d'utiliser des fichiers audio enregistrés à une fréquence d'échantillonnage de 8,000 XNUMX Hz et dont les canaux stéréo sont séparés.

Vous pouvez utiliser un outil comme ffmpeg pour valider vos fichiers audio d'entrée depuis la ligne de commande :

ffmpeg -i SampleAudio.wav

Dans la réponse renvoyée, vérifiez la ligne commençant par Stream dans la section Input et confirmez que les fichiers audio sont à 8,000 XNUMX Hz et que les canaux stéréo sont séparés :

Input #0, wav, from 'SampleAudio.wav':
Duration: 00:01:06.36, bitrate: 256 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 8000 Hz, stereo, s16, 256 kb/s

Lorsque vous créez un pipeline pour traiter un grand nombre de fichiers audio, vous pouvez automatiser cette étape pour filtrer les fichiers qui ne répondent pas aux exigences.

Comme étape préalable supplémentaire, créez un compartiment Amazon Simple Storage Service (Amazon S3) pour héberger les fichiers audio à transcrire. Pour obtenir des instructions, reportez-vous à Créez votre premier compartiment S3.Puis télécharger le fichier audio au compartiment S3.

Transcrire le fichier audio avec le modèle par défaut

Maintenant nous pouvons démarrer un Amazon Transcribe appelez le travail d'analyse à l'aide du fichier audio que nous avons téléchargé. Dans cet exemple, nous utilisons le Console de gestion AWS pour transcrire le fichier audio.Vous pouvez également utiliser le Interface de ligne de commande AWS (AWS CLI) ou AWS SDK.

  1. Sur la console Amazon Transcribe, choisissez Analyse d'appel dans le volet de navigation.
  2. Selectionnez Tâches d'analyse d'appels.
  3. Selectionnez Créer un emploi.
  4. Pour Nom, entrez un nom.
  5. Pour Paramètres de langue, sélectionnez Langue spécifique.
  6. Pour Langue, choisissez Hindi, IN (salut-IN).
  7. Pour Type de modèle, sélectionnez Modèle général.
  8. Pour Emplacement du fichier d'entrée sur S3, accédez au compartiment S3 contenant le fichier audio chargé.Améliorez la précision de la transcription des appels client-agent grâce au vocabulaire personnalisé dans Amazon Transcribe PlatoBlockchain Data Intelligence. Recherche verticale. Aï.
  9. Dans le Des données de sortie section, laissez les valeurs par défaut.
  10. Dans le Autorisations d'accès section, sélectionnez Créer un rôle IAM.
  11. Créer un nouveau Gestion des identités et des accès AWS (IAM) nommé HindiTranscription qui fournit des autorisations de service Amazon Transcribe pour lire les fichiers audio du compartiment S3 et utiliser le Service de gestion des clés AWS (AWS KMS) clé à déchiffrer.Améliorez la précision de la transcription des appels client-agent grâce au vocabulaire personnalisé dans Amazon Transcribe PlatoBlockchain Data Intelligence. Recherche verticale. Aï.
  12. Dans le Configurer le travail section, laissez les valeurs par défaut, y compris Vocabulaire personnalisé désélectionné.
  13. Selectionnez Créer un emploi transcrire le fichier audio.

Améliorez la précision de la transcription des appels client-agent grâce au vocabulaire personnalisé dans Amazon Transcribe PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Lorsque le statut de la tâche est Terminé, vous pouvez revoir la transcription en choisissant la tâche (SampleAudio).

Améliorez la précision de la transcription des appels client-agent grâce au vocabulaire personnalisé dans Amazon Transcribe PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Les phrases du client et de l'agent sont clairement séparées, ce qui nous aide à identifier si le client ou l'agent a prononcé des mots ou des phrases spécifiques.

Mesurer la précision du modèle

Le taux d'erreur de mots (WER) est la mesure recommandée et la plus couramment utilisée pour évaluer la précision des systèmes de reconnaissance automatique de la parole (ASR). L'objectif est de réduire le WER autant que possible pour améliorer la précision du système ASR.

Pour calculer WER, procédez comme suit. Ce message utilise l'open-source asr-évaluation outil d'évaluation pour calculer WER, mais d'autres outils tels que SCTK or JiWER Sont également disponibles.

  1. Installer le asr-evaluation outil, qui rend le script wer disponible sur votre ligne de commande.
    Utilisez une ligne de commande sur les plates-formes macOS ou Linux pour exécuter les commandes wer présentées plus loin dans la publication.
  2. Copiez la transcription de la page des détails de la tâche Amazon Transcribe dans un fichier texte nommé hypothesis.txt.
    Lorsque vous copiez la transcription à partir de la console, vous remarquerez un nouveau caractère de ligne entre les mots Agent :, Customer :, et l'écriture hindi.
    Les nouveaux caractères de ligne ont été supprimés pour économiser de l'espace dans ce message. Si vous choisissez d'utiliser le texte tel quel à partir de la console, assurez-vous que le fichier texte de référence que vous créez contient également les caractères de nouvelle ligne, car l'outil wer compare ligne par ligne.
  3. Passez en revue l'intégralité de la transcription et identifiez les mots ou les phrases qui doivent être corrigés :
    Témoignages : हेलो,
    Agent : ? सेम है। Plus d'informations ता कर सकती हूँ।
    Témoignages : मैं बहुत दिनों उनसे Plus d'informations क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    Agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार Plus d'informations
    Témoignages  :                                          ्राई करूँगा।
    Agent :
    Témoignages : सिरियसली एनी टिप्स Poulet शेर
    Agent : आप टेक्सी यूस कर लो ड्रैब और पार्किंग का प्राब्लम नहीं होगा।
    Témoignages Les mots en surbrillance sont ceux que le modèle Amazon Transcribe par défaut n'a pas rendus correctement.
  4. Créez un autre fichier texte nommé reference.txt, en remplaçant les mots en surbrillance par les mots souhaités que vous vous attendez à voir dans la transcription :
    Témoignages : हेलो,
    Agent : से मैं । Plus d'informations ता कर सकती हूँ।
    Témoignages : मैं बहुत दिनोंसे Plus d'informations क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    Agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार Plus d'informations
    Témoignages  :                                          ्राई करूँगा।
    Agent :
    Témoignages : सिरियसली एनी टिप्स यू केन शेर
    Agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।
    Témoignages :
  5. Utilisez la commande suivante pour comparer les fichiers texte de référence et d'hypothèse que vous avez créés :
    wer -i reference.txt hypothesis.txt

    Vous obtenez la sortie suivante:

    REF: customer : हेलो,
    
    HYP: customer : हेलो,
    
    SENTENCE 1
    
    Correct = 100.0% 3 ( 3)
    
    Errors = 0.0% 0 ( 3)
    
    REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    SENTENCE 2
    
    Correct = 84.0% 21 ( 25)
    
    Errors = 16.0% 4 ( 25)
    
    REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    SENTENCE 3
    
    Correct = 96.0% 24 ( 25)
    
    Errors = 8.0% 2 ( 25)
    
    REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    SENTENCE 4
    
    Correct = 83.3% 20 ( 24)
    
    Errors = 16.7% 4 ( 24)
    
    REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    SENTENCE 5
    
    Correct = 100.0% 14 ( 14)
    
    Errors = 0.0% 0 ( 14)
    
    REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    SENTENCE 6
    
    Correct = 100.0% 12 ( 12)
    
    Errors = 0.0% 0 ( 12)
    
    REF: customer : सिरियसली एनी टिप्स यू केन शेर
    
    HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर
    
    SENTENCE 7
    
    Correct = 75.0% 6 ( 8)
    
    Errors = 25.0% 2 ( 8)
    
    REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।
    
    HYP: agent : आप टेक्सी यूस कर लो ड्रैब और पार्किंग का प्राब्लम नहीं होगा।
    
    SENTENCE 8
    
    Correct = 92.9% 13 ( 14)
    
    Errors = 7.1% 1 ( 14)
    
    REF: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    SENTENCE 9
    
    Correct = 100.0% 7 ( 7)
    
    Errors = 0.0% 0 ( 7)
    
    Sentence count: 9
    
    WER: 9.848% ( 13 / 132)
    
    WRR: 90.909% ( 120 / 132)
    
    SER: 55.556% ( 5 / 9)

La commande wer compare le texte des fichiers reference.txt ainsi que hypothesis.txt. Il signale les erreurs pour chaque phrase ainsi que le nombre total d'erreurs (RET : 9.848 % ( 13 / 132)) dans l'intégralité de la transcription.

De la sortie précédente, nous avons signalé 13 erreurs sur 132 mots dans la transcription. Ces erreurs peuvent être de trois types :

  • Erreurs de substitution – Ceux-ci se produisent lorsqu'Amazon Transcribe écrit un mot à la place d'un autre. Par exemple, dans notre transcription, le mot "महीना (Mahina)" a été écrit au lieu de "मिनार (Minar) » dans la phrase 4.
  • Erreurs de suppression - Ceux-ci se produisent lorsqu'Amazon Transcribe manque un mot entièrement dans la transcription. Dans notre transcription, le mot "सौथ (Sud) » a été omis dans la phrase 2.
  • Erreurs d'insertion – Ceux-ci se produisent lorsqu'Amazon Transcribe insère un mot qui n'a pas été prononcé. Nous ne voyons aucune erreur d'insertion dans notre transcription.

Observations de la transcription créée par le modèle par défaut

Nous pouvons faire les observations suivantes sur la base de la transcription :

  • Le WER total est de 9.848%, ce qui signifie que 90.152% des mots sont transcrits avec précision.
  • Le modèle hindi par défaut transcrit avec précision la plupart des mots anglais. En effet, le modèle par défaut est formé pour reconnaître les mots anglais les plus courants prêts à l'emploi. Le modèle est également entraîné à reconnaître la langue hinglish, où des mots anglais apparaissent au hasard dans les conversations en hindi. Par exemple:
    • गुड मोर्निग – Bonjour (phrase 2).
    • ट्रेवल एजेंसी – Agence de voyage (phrase 2).
    • Merci beaucoup (phrase 9).
  • La phrase 4 contient le plus d'erreurs, qui sont les noms de lieux de la ville indienne d'Hyderabad :
    • हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार Plus d'informations

Dans l'étape suivante, nous montrons comment corriger les mots surlignés dans la phrase précédente à l'aide d'un vocabulaire personnalisé dans Amazon Transcribe :

  • ?? महीना (Carboniser Mahina) devrait être चार मिनार (Carboniser Saper)
  • ??कुंडा फो (Golcusda Four) devrait être गोलकोंडा फोर्ट (Golcosda Fort)
  • लार जंग (Salar Jung) devrait être ??लार जंग (Saagrand Jung)

Entraînez le modèle par défaut avec un vocabulaire personnalisé

À créer un vocabulaire personnalisé, vous devez créer un fichier texte dans un format tabulaire avec les mots et les phrases pour former le modèle Amazon Transcribe par défaut. Votre tableau doit contenir les quatre colonnes (Phrase, SoundsLike, IPAet DisplayAs), mais le Phrase colonne est la seule qui doit contenir une entrée sur chaque ligne. Vous pouvez laisser les autres colonnes vides. Chaque colonne doit être séparée par une tabulation, même si certaines colonnes sont laissées vides. Par exemple, si vous quittez le IPA ainsi que SoundsLike colonnes vides pour une ligne, le Phrase ainsi que DisplaysAs les colonnes de cette ligne doivent être séparées par trois caractères de tabulation (entre Phrase ainsi que IPA, IPA ainsi que SoundsLikeet SoundsLike ainsi que DisplaysAs).

Pour entraîner le modèle avec un vocabulaire personnalisé, procédez comme suit :

  1. Créer un fichier nommé HindiCustomVocabulary.txt avec le contenu suivant.
    Phrase ipa sons comme des affichages गोलकुंडा-फोर गोलकोंडा फोर्ट सालार-जंग सा-लार-जंग सालार जंग चार-महीना चार मिनारface

    Vous ne pouvez utiliser que des caractères pris en charge pour votre langue. Référez-vous à votre langue Jeu de caractères pour en savoir plus.

    Les colonnes contiennent les informations suivantes :

    1. Phrase – Contient les mots ou les phrases que vous souhaitez retranscrire avec précision. Les mots ou expressions en surbrillance dans la transcription créée par le modèle Amazon Transcribe par défaut apparaissent dans cette colonne. Ces mots sont généralement des acronymes, des noms propres ou des mots et expressions spécifiques à un domaine dont le modèle par défaut n'a pas connaissance. Il s'agit d'un champ obligatoire pour chaque ligne du tableau de vocabulaire personnalisé. Dans notre transcription, pour corriger "गोलकुंडा फोर (Golcunda Four)" de la phrase 4, utilisez "गोलकुंडा-फोर (Golcunda-Four)" dans cette colonne. Si votre entrée contient plusieurs mots, séparez chaque mot par un trait d'union (-); n'utilisez pas d'espaces.
    2. IPA – Contient les mots ou les phrases représentant les sons de la parole sous forme écrite. La colonne est facultative ; vous pouvez laisser ses lignes vides. Cette colonne est destinée aux orthographes phonétiques utilisant uniquement les caractères de l'alphabet phonétique international (IPA). Reportez-vous au jeu de caractères hindi pour connaître les caractères IPA autorisés pour la langue hindi. Dans notre exemple, nous n'utilisons pas IPA. Si vous avez une entrée dans cette colonne, votre SoundsLike colonne doit être vide.
    3. SoundsLike - Contient des mots ou des phrases décomposées en petits morceaux (généralement basés sur des syllabes ou des mots courants) pour fournir une prononciation pour chaque morceau en fonction de la façon dont ce morceau sonne. Cette colonne est facultative ; vous pouvez laisser les lignes vides. N'ajoutez du contenu à cette colonne que si votre entrée comprend un mot non standard, tel qu'un nom de marque, ou pour corriger un mot qui est mal transcrit. Dans notre transcription, pour corriger « सलार जंग (Salar Jung) » de la phrase 4, utilisez « सा-लार-जंग (Saa-lar-jung) » dans cette colonne. N'utilisez pas d'espaces dans cette colonne. Si vous avez une entrée dans cette colonne, votre IPA colonne doit être vide.
    4. DisplaysAs – Contient des mots ou des phrases avec les orthographes que vous souhaitez voir dans la sortie de transcription pour les mots ou les phrases dans le Phrase champ. Cette colonne est facultative ; vous pouvez laisser les lignes vides. Si vous ne spécifiez pas ce champ, Amazon Transcribe utilise le contenu du Phrase champ dans le fichier de sortie. Par exemple, dans notre transcription, pour corriger « गोलकुंडा फोर (Golcunda Four) » de la phrase 4, utilisez « गोलकोंडा फोर्ट (Golconda Fort) » dans cette colonne.
  2. Téléchargement le fichier texte (HindiCustomVocabulary.txt) à un compartiment S3. Maintenant, nous créons un vocabulaire personnalisé dans Amazon Transcribe.
  3. Sur la console Amazon Transcribe, choisissez Vocabulaire personnalisé dans le volet de navigation.
  4. Pour Nom, entrez un nom.
  5. Pour Langue, choisissez Hindi, IN (salut-IN).
  6. Pour Source d'entrée de vocabulaire, sélectionnez Emplacement S3.
  7. Pour Emplacement du fichier de vocabulaire sur S3, entrez le chemin S3 du HindiCustomVocabulary.txt fichier.
  8. Selectionnez Créer du vocabulaire. Améliorez la précision de la transcription des appels client-agent grâce au vocabulaire personnalisé dans Amazon Transcribe PlatoBlockchain Data Intelligence. Recherche verticale. Aï.
  9. Transcrire le SampleAudio.wav fichier avec le vocabulaire personnalisé, avec les paramètres suivants :
    1. Pour Nom du travail , Entrer SampleAudioCustomVocabulary.
    2. Pour Langue, choisissez Hindi, IN (salut-IN).
    3. Pour Emplacement du fichier d'entrée sur S3, accédez à l'emplacement de SampleAudio.wav.
    4. Pour Rôle IAM, sélectionnez Utiliser un rôle IAM existant et choisissez le rôle que vous avez créé précédemment.
    5. Dans le Configurer le travail section, sélectionnez Vocabulaire personnalisé et choisissez le vocabulaire personnalisé HindiCustomVocabulary.
  10. Selectionnez Créer un emploi.

Améliorez la précision de la transcription des appels client-agent grâce au vocabulaire personnalisé dans Amazon Transcribe PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Mesurer la précision du modèle après avoir utilisé un vocabulaire personnalisé

Copiez la transcription de la page des détails de la tâche Amazon Transcribe dans un fichier texte nommé hypothesis-custom-vocabulary.txt:

Témoignages : हेलो,

Agent : लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

Témoignages  :                                                         ें सोच रहा था। Plus d'informations कती हैं?

Agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार Plus d'informations

Témoignages  :                                          ्राई करूँगा।

Agent :

Témoignages :

Agent : ्लम नहीं होगा।

Témoignages :

Notez que les mots surlignés sont transcrits comme vous le souhaitez.

Exécutez le wer commande à nouveau avec la nouvelle transcription :

wer -i reference.txt hypothesis-custom-vocabulary.txt

Vous obtenez la sortie suivante:

REF: customer : हेलो,

HYP: customer : हेलो,

SENTENCE 1

Correct = 100.0% 3 ( 3)

Errors = 0.0% 0 ( 3)

REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

SENTENCE 2

Correct = 84.0% 21 ( 25)

Errors = 16.0% 4 ( 25)

REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

SENTENCE 3

Correct = 96.0% 24 ( 25)

Errors = 8.0% 2 ( 25)

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

SENTENCE 5

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

SENTENCE 6

Correct = 100.0% 12 ( 12)

Errors = 0.0% 0 ( 12)

REF: customer : सिरियसली एनी टिप्स यू केन शेर

HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर

SENTENCE 7

Correct = 75.0% 6 ( 8)

Errors = 25.0% 2 ( 8)

REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

HYP: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

SENTENCE 8

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: customer : ग्रेट आइडिया थैंक्यू सो मच।

HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।

SENTENCE 9

Correct = 100.0% 7 ( 7)

Errors = 0.0% 0 ( 7)

Sentence count: 9

WER: 6.061% ( 8 / 132)

WRR: 94.697% ( 125 / 132)

SER: 33.333% ( 3 / 9)

Observations de la transcription créées avec un vocabulaire personnalisé

Le WER total est de 6.061%, ce qui signifie que 93.939% des mots sont transcrits avec précision.

Comparons la sortie wer pour la phrase 4 avec et sans vocabulaire personnalisé. Ce qui suit est sans vocabulaire personnalisé :

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 83.3% 20 ( 24)

Errors = 16.7% 4 ( 24)

Ce qui suit est avec un vocabulaire personnalisé :

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

Il n'y a pas d'erreurs dans la phrase 4. Les noms des lieux sont transcrits avec précision à l'aide d'un vocabulaire personnalisé, réduisant ainsi le WER global de 9.848 % à 6.061 % pour ce fichier audio. Cela signifie que la précision de la transcription s'est améliorée de près de 4 %.

Comment le vocabulaire personnalisé a amélioré la précision

Nous avons utilisé le vocabulaire personnalisé suivant :

Phrase IPA SoundsLike DisplayAs

गोलकुंडा-फोर गोलकोंडा फोर्ट

सालार-जंग सा-लार-जंग सालार जंग

चार-महीना चार मिनार

Amazon Transcribe vérifie s'il y a des mots dans le fichier audio qui sonnent comme les mots mentionnés dans le Phrase colonne. Ensuite, le modèle utilise les entrées du IPA, SoundsLikeet DisplaysAs colonnes pour ces mots spécifiques à transcrire avec les orthographes souhaitées.

Avec ce vocabulaire personnalisé, lorsqu'Amazon Transcribe identifie un mot qui ressemble à "गोलकुंडा-फोर (Golcunda-Four)", il transcrit ce mot comme "गोलकोंडा फोर्ट (Golconda Fort)".

Recommandations

La précision de la transcription dépend également de paramètres tels que la prononciation des locuteurs, les locuteurs qui se chevauchent, la vitesse de la parole et le bruit de fond. Par conséquent, nous vous recommandons de suivre le processus avec une variété d'appels (avec différents clients, agents, interruptions, etc.) qui couvrent les mots spécifiques à un domaine les plus couramment utilisés pour vous permettre de créer un vocabulaire personnalisé complet.

Dans cet article, nous avons appris le processus pour améliorer la précision de la transcription d'un appel audio à l'aide d'un vocabulaire personnalisé. Pour traiter chaque jour des milliers d'enregistrements d'appels de votre centre de contact, vous pouvez utiliser analyse post-appel, une solution de bout en bout entièrement automatisée, évolutive et économique qui prend en charge la plupart des tâches lourdes. Il vous suffit de télécharger vos fichiers audio dans un compartiment S3 et, en quelques minutes, la solution fournit des analyses d'appels telles que les sentiments dans une interface utilisateur Web. L'analyse post-appel fournit des informations exploitables pour repérer les tendances émergentes, identifier les opportunités de coaching des agents et évaluer le sentiment général des appels.L'analyse post-appel est un solution open source que vous pouvez déployer en utilisant AWS CloudFormation.

Notez que les vocabulaires personnalisés n'utilisent pas le contexte dans lequel les mots ont été prononcés, ils se concentrent uniquement sur les mots individuels que vous fournissez. Pour améliorer encore la précision, vous pouvez utiliser modèles de langue personnalisés. Contrairement aux vocabulaires personnalisés, qui associent la prononciation à l'orthographe, les modèles de langage personnalisés apprennent le contexte associé à un mot donné. Cela inclut comment et quand un mot est utilisé, et la relation qu'un mot a avec d'autres mots. Pour créer un modèle de langue personnalisé, vous pouvez utiliser les transcriptions dérivées du processus que nous avons appris pour une variété d'appels et les combiner avec le contenu de vos sites Web ou manuels d'utilisation contenant des mots et des phrases spécifiques à un domaine.

Pour obtenir la plus grande précision de transcription avec les transcriptions par lots, vous pouvez utiliser des vocabulaires personnalisés en conjonction avec vos modèles de langue personnalisés.

Conclusion

Dans cet article, nous avons fourni des étapes détaillées pour traiter avec précision les fichiers audio en hindi contenant des mots anglais à l'aide de l'analyse des appels et des vocabulaires personnalisés dans Amazon Transcribe. Vous pouvez utiliser ces mêmes étapes pour traiter les appels audio avec n'importe quel langue prise en charge par Amazon Transcribe.

Une fois que vous avez obtenu les transcriptions avec la précision souhaitée, vous pouvez améliorer vos conversations agent-client en formant vos agents. Vous pouvez également comprendre les sentiments et les tendances de vos clients. À l'aide des fonctions de diarisation du locuteur, de détection de l'intensité et de filtrage du vocabulaire dans l'analyse des appels, vous pouvez identifier si c'est l'agent ou le client qui a élevé le ton ou prononcé des mots spécifiques. Vous pouvez classer les appels en fonction de mots spécifiques à un domaine, capturer des informations exploitables et exécuter des analyses pour améliorer vos produits. Enfin, vous pouvez traduire vos relevés de notes en anglais ou dans d'autres langues prises en charge de votre choix à l'aide de Amazon Traduire.


À propos des auteurs

Améliorez la précision de la transcription des appels client-agent grâce au vocabulaire personnalisé dans Amazon Transcribe PlatoBlockchain Data Intelligence. Recherche verticale. Aï. Sarat Guttikonda est un architecte de solutions principal dans le secteur public mondial d'AWS. Sarat aime aider les clients à automatiser, gérer et gouverner leurs ressources cloud sans sacrifier l'agilité de l'entreprise. Pendant son temps libre, il aime construire des Legos avec son fils et jouer au tennis de table.

Améliorez la précision de la transcription des appels client-agent grâce au vocabulaire personnalisé dans Amazon Transcribe PlatoBlockchain Data Intelligence. Recherche verticale. Aï.Lavanya Sood est un architecte de solutions dans le secteur public mondial AWS basé à New Delhi, en Inde. Lavanya aime apprendre de nouvelles technologies et aider les clients dans leur parcours d'adoption du cloud. Dans ses temps libres, elle aime voyager et essayer différents aliments.

Horodatage:

Plus de Apprentissage automatique AWS