在 Amazon Transcribe PlatoBlockchain Data Intelligence 中使用自定义词汇提高客户代理呼叫的转录准确性。 垂直搜索。 哎。

在 Amazon Transcribe 中使用自定义词汇提高客户代理呼叫的转录准确性

许多 AWS 客户 已经成功使用 亚马逊转录 准确、高效、自动地将客户的音频对话转换为文本,并从中提取可操作的见解。 这些见解可以帮助您不断改进直接改善客户质量和体验的流程和产品。

在许多国家,例如印度,英语并不是主要的交流语言。 印度客户的对话包含印地语等区域语言,在整个通话过程中随机使用英语单词和短语。 在源媒体文件中,可能存在默认 Amazon Transcribe 模型无法识别的专有名词、特定于域的首字母缩略词、单词或短语。 此类媒体文件的转录可能对这些单词有不准确的拼写。

在这篇文章中,我们将演示如何向 Amazon Transcribe 提供更多信息 自定义词汇 使用业务特定术语更新 Amazon Transcribe 处理音频文件转录的方式。 我们展示了提高 Hinglish 呼叫(包含印度英语单词和短语的印度印地语呼叫)转录准确性的步骤。 您可以使用相同的流程使用任何 支持的语言 由亚马逊转录。 创建自定义词汇表后,您可以使用我们的 通话后分析 解决方案,我们将在本文后面讨论。

解决方案概述

我们使用以下印度印地语语音通话(SampleAudio.wav) 用随机的英文单词来演示这个过程。

然后,我们将引导您完成以下高级步骤:

  1. 使用默认的 Amazon Transcribe Hindi 模型转录音频文件。
  2. 测量模型精度。
  3. 使用自定义词汇训练模型。
  4. 测量训练模型的准确性。

先决条件

在开始之前,我们需要确认输入的音频文件符合 转录数据输入要求.

A 单音 录音,也称为 , 包含一个音频信号,其中代理和客户的所有音频元素组合成一个通道。 一个 立体声 录音,也称为 立体声,包含两个音频信号,用于在两个单独的通道中捕获代理和客户的音频元素。 每个座席-客户录音文件包含两个音频通道,一个用于座席,一个用于客户。

电话录音等低保真录音通常使用 8,000 Hz 采样率。 Amazon Transcribe 支持处理单声道录制文件以及采样率在 16,000–48,000 Hz 之间的高保真音频文件。

为了提高转录结果并清楚地区分座席和客户所说的话,我们建议使用以 8,000 Hz 采样率录制且立体声声道分离的音频文件。

你可以使用像这样的工具 ffmpeg的 从命令行验证您的输入音频文件:

ffmpeg -i SampleAudio.wav

在返回的响应中,检查 Input 部分中以 Stream 开头的行,并确认音频文件为 8,000 Hz 和立体声声道分离:

Input #0, wav, from 'SampleAudio.wav':
Duration: 00:01:06.36, bitrate: 256 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 8000 Hz, stereo, s16, 256 kb/s

当您构建管道来处理大量音频文件时,您可以自动执行此步骤以过滤不符合要求的文件。

作为附加的先决条件步骤,创建一个 Amazon Simple Storage Service (Amazon S3) 存储桶来托管要转录的音频文件。 有关说明,请参阅 创建您的第一个 S3 存储桶。然后 上传音频文件 到 S3 存储桶。

使用默认模型转录音频文件

现在我们可以 启动 Amazon Transcribe 使用我们上传的音频文件调用分析作业。在此示例中,我们使用 AWS管理控制台 转录音频文件。您也可以使用 AWS命令行界面 (AWS CLI) 或 AWS 开发工具包。

  1. 在 Amazon Transcribe 控制台上,选择 通话分析 在导航窗格中。
  2. 呼叫分析工作.
  3. 建立工作.
  4. 针对 名字,输入名称。
  5. 针对 语言设定, 选择 特定语言.
  6. 针对 语言,选择 印地语,印第安纳州 (hi-IN).
  7. 针对 型号类型, 选择 通用型号.
  8. 针对 S3 上的输入文件位置,浏览到包含已上传音频文件的 S3 存储桶。在 Amazon Transcribe PlatoBlockchain Data Intelligence 中使用自定义词汇提高客户代理呼叫的转录准确性。 垂直搜索。 哎。
  9. 输出数据 部分,保留默认值。
  10. 存取权限 部分,选择 创建一个IAM角色.
  11. 创建一个新的 AWS身份和访问管理 (IAM) 名为 HindiTranscription 的角色,提供 Amazon Transcribe 服务权限以从 S3 存储桶读取音频文件并使用 AWS密钥管理服务 (AWS KMS) 密钥解密。在 Amazon Transcribe PlatoBlockchain Data Intelligence 中使用自定义词汇提高客户代理呼叫的转录准确性。 垂直搜索。 哎。
  12. 配置作业 部分,保留默认值,包括 自定义词汇 取消选择。
  13. 建立工作 转录音频文件。

在 Amazon Transcribe PlatoBlockchain Data Intelligence 中使用自定义词汇提高客户代理呼叫的转录准确性。 垂直搜索。 哎。

当作业状态为 Complete 时,您可以通过选择作业 (SampleAudio) 来查看转录。

在 Amazon Transcribe PlatoBlockchain Data Intelligence 中使用自定义词汇提高客户代理呼叫的转录准确性。 垂直搜索。 哎。

客户和座席的句子被清楚地分开,这有助于我们识别客户或座席是否说出了任何特定的单词或短语。

测量模型精度

单词错误率 (WER) 是评估自动语音识别 (ASR) 系统准确性的推荐且最常用的指标。 目标是尽可能降低 WER 以提高 ASR 系统的准确性。

要计算 WER,请完成以下步骤。 这篇文章使用开源 评估 计算WER的评估工具,但其他工具如 科技 or 吉尔 也可用。

  1. Install 安装asr-evaluation 工具,它使 wer 脚本在您的命令行上可用。
    在 macOS 或 Linux 平台上使用命令行来运行本文后面显示的 wer 命令。
  2. 将 Amazon Transcribe 作业详细信息页面中的脚本复制到名为 hypothesis.txt.
    当您从控制台复制转录时,您会注意到单词之间有一个换行符 Agent :, Customer :, 和印地语脚本。
    新行字符已被删除以节省这篇文章的空间。 如果您选择从控制台按原样使用文本,请确保您创建的参考文本文件也包含换行符,因为 wer 工具会逐行比较。
  3. 查看整个成绩单并确定需要更正的任何单词或短语:
    对客户的 : हेलो,
    经纪人 : गुड मोर्निग इंडिया ट् 你 सेमहै। लहीहूँसेमैंमैं。हूँ
    对客户的 : मैंबहुत दिनोंउनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन
    经纪人 :हाँबिल्कुल। हैदराबादमेंबहुतसा冰箱उनमेंसे चा冰箱 जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर
    对客户的 :हथैंकमैंमैंअगलेसंडेसंडेसंडेसंडेको
    经纪人 : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चा
    对客户的 : सिरियसलीएनीटिप्स शेर
    经纪人 : आप टेक्सी यूस कर लो ड्रैब और पार्किंग का प् 你
    对客户的 : ग्रेट आइडिया थैंक्यू सो मच।突出显示的单词是默认 Amazon Transcribe 模型未正确呈现的单词。
  4. 创建另一个名为的文本文件 reference.txt,用您希望在转录中看到的所需单词替换突出显示的单词:
    对客户的 : हेलो,
    经纪人 : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी सेमैं । लहीहूँसेमैंमैं。हूँ
    对客户的 : मैंबहुत दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन
    经纪人 : हाँ बिल्कुल। हैदराबादमेंबहुतसा冰箱उनमेंसे चार मिना冰箱 जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर
    对客户的 :हथैंकमैंमैंअगलेसंडेसंडेसंडेसंडेको
    经纪人 : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चा
    对客户的 : सिरियसलीएनीटिप्स यूकेन शेर
    经纪人 : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प् 你
    对客户的 : ग्冰箱
  5. 使用以下命令比较您创建的参考和假设文本文件:
    wer -i reference.txt hypothesis.txt

    您将获得以下输出:

    REF: customer : हेलो,
    
    HYP: customer : हेलो,
    
    SENTENCE 1
    
    Correct = 100.0% 3 ( 3)
    
    Errors = 0.0% 0 ( 3)
    
    REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।
    
    SENTENCE 2
    
    Correct = 84.0% 21 ( 25)
    
    Errors = 16.0% 4 ( 25)
    
    REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?
    
    SENTENCE 3
    
    Correct = 96.0% 24 ( 25)
    
    Errors = 8.0% 2 ( 25)
    
    REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।
    
    SENTENCE 4
    
    Correct = 83.3% 20 ( 24)
    
    Errors = 16.7% 4 ( 24)
    
    REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।
    
    SENTENCE 5
    
    Correct = 100.0% 14 ( 14)
    
    Errors = 0.0% 0 ( 14)
    
    REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।
    
    SENTENCE 6
    
    Correct = 100.0% 12 ( 12)
    
    Errors = 0.0% 0 ( 12)
    
    REF: customer : सिरियसली एनी टिप्स यू केन शेर
    
    HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर
    
    SENTENCE 7
    
    Correct = 75.0% 6 ( 8)
    
    Errors = 25.0% 2 ( 8)
    
    REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।
    
    HYP: agent : आप टेक्सी यूस कर लो ड्रैब और पार्किंग का प्राब्लम नहीं होगा।
    
    SENTENCE 8
    
    Correct = 92.9% 13 ( 14)
    
    Errors = 7.1% 1 ( 14)
    
    REF: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।
    
    SENTENCE 9
    
    Correct = 100.0% 7 ( 7)
    
    Errors = 0.0% 0 ( 7)
    
    Sentence count: 9
    
    WER: 9.848% ( 13 / 132)
    
    WRR: 90.909% ( 120 / 132)
    
    SER: 55.556% ( 5 / 9)

wer 命令比较文件中的文本 reference.txthypothesis.txt. 它报告每个句子的错误以及错误总数(错误率:9.848% ( 13 / 132)) 在整个成绩单中。

从前面的输出中,我们在成绩单的 13 个单词中报告了 132 个错误。 这些错误可以是三种类型:

  • 替换错误 – 当 Amazon Transcribe 用一个词代替另一个词时,就会出现这种情况。 例如,在我们的成绩单中,“महीना (Mahina)”被写成“而不是”मिनार (Minar)”在第 4 句中。
  • 删除错误 – 当 Amazon Transcribe 在成绩单中完全漏掉一个单词时,就会出现这种情况。在我们的成绩单中,“सौथ (南)”在第 2 句中被遗漏。
  • 插入错误 – 当 Amazon Transcribe 插入未说出的单词时,就会出现这些情况。 我们在成绩单中看不到任何插入错误。

来自默认模型创建的成绩单的观察结果

我们可以根据成绩单做出以下观察:

  • 总 WER 为 9.848%,这意味着 90.152% 的单词被准确转录。
  • 默认的印地语模型准确地转录了大部分英语单词。 这是因为默认模型经过训练可以立即识别最常见的英语单词。 该模型还经过训练以识别 Hinglish 语言,其中英语单词随机出现在印地语对话中。 例如:
    • गुड मोर्निग – 早上好(第 2 句)。
    • ट्रेवल एजेंसी – 旅行社(第 2 句)。
    • ग्रेट आइडिया थैंक्यू सो मच – 非常感谢您(第 9 句)。
  • 第 4 句错误最多,是印度城市海得拉巴的地名:
    • हाँबिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीनागोलकुंडाफोरसलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर

在下一步中,我们将演示如何使用 Amazon Transcribe 中的自定义词汇来更正前一句中突出显示的单词:

  • चार महीना (字符 玛希纳(Mahina)) 应该是चार मिनार (字符 破坏)
  • 圆形的कुंडाफो佣金 (戈尔cu恩达佛ur) 应该是गोलकोंडाफो参考 (戈尔co恩达佛rt)
  • लारजंग (Salar Jung) 应该是 सालारजंग (拉荣格)

使用自定义词汇表训练默认模型

创建自定义词汇表,您需要使用单词和短语以表格格式构建文本文件,以训练默认的 Amazon Transcribe 模型。 您的表必须包含所有四列(Phrase, SoundsLike, IPADisplayAs),但 Phrase column 是唯一必须在每一行包含一个条目的列。 您可以将其他列留空。 每列必须用制表符分隔,即使有些列是空的。 例如,如果您离开 IPASoundsLike 列为空的一行,则 PhraseDisplaysAs 该行中的列必须用三个制表符分隔(在 PhraseIPA, IPASoundsLikeSoundsLikeDisplaysAs).

要使用自定义词汇表训练模型,请完成以下步骤:

  1. 创建一个名为 HindiCustomVocabulary.txt 有以下内容。
    短语ipa的声音般的示例示出了示例。

    您只能使用您的语言支持的字符。 参考你的语言 字符集 了解详情。

    这些列包含以下信息:

    1. Phrase - 包含您要准确转录的单词或短语。 默认 Amazon Transcribe 模型创建的转录本中突出显示的单词或短语出现在此列中。 这些词通常是默认模型不知道的首字母缩略词、专有名词或特定领域的词和短语。 这是自定义词汇表中每一行的必填字段。 在我们的成绩单中,要更正第 4 句中的“गोलकुंडा फोर(戈尔昆达四)”,请在本栏中使用“गोलकुंडा-फोर(戈尔昆达四)”。 如果您的条目包含多个单词,请用连字符 (-) 分隔每个单词; 不要使用空格。
    2. IPA – 包含以书面形式表示语音的单词或短语。 该列是可选的; 您可以将其行留空。 此列旨在用于仅使用国际音标 (IPA) 中的字符的拼音。 有关印地语语言允许的 IPA 字符,请参阅印地语字符集。 在我们的示例中,我们没有使用 IPA。 如果您在此列中有条目,您的 SoundsLike 列必须为空。
    3. SoundsLike – 包含分解成较小片段的单词或短语(通常基于音节或常用单词),以根据片段的发音为每个片段提供发音。 此栏是可选的; 您可以将行留空。 仅当您的条目包含非标准单词(例如品牌名称)或纠正错误转录的单词时,才向此列添加内容。 在我们的成绩单中,要更正第 4 句中的“सलार जंग (Salar Jung)”,请在本栏中使用“सा-लार-जंग (Saa-lar-jung)”。 不要在此列中使用空格。 如果您在此列中有条目,您的 IPA 列必须为空。
    4. DisplaysAs – 包含带有您希望在转录输出中看到的拼写的单词或短语 Phrase 场地。 此栏是可选的; 您可以将行留空。 如果您未指定此字段,Amazon Transcribe 将使用 Phrase 输出文件中的字段。 例如,在我们的成绩单中,要更正第 4 句中的“गोलकुंडा फोर (Golcunda Four)”,请在本栏中使用“गोलकोंडा फोर्ट (Golconda Fort)”。
  2. 上传 文本文件(HindiCustomVocabulary.txt) 到 S3 存储桶。现在我们在 Amazon Transcribe 中创建自定义词汇表。
  3. 在 Amazon Transcribe 控制台上,选择 自定义词汇 在导航窗格中。
  4. 针对 名字,输入名称。
  5. 针对 语言,选择 印地语,印第安纳州 (hi-IN).
  6. 针对 词汇输入源, 选择 S3位置.
  7. 针对 S3 上的词汇文件位置,进入S3路径 HindiCustomVocabulary.txt 文件中。
  8. 创建词汇. 在 Amazon Transcribe PlatoBlockchain Data Intelligence 中使用自定义词汇提高客户代理呼叫的转录准确性。 垂直搜索。 哎。
  9. 转录 SampleAudio.wav 带有自定义词汇表的文件,具有以下参数:
    1. 针对 工作名称 ,输入 SampleAudioCustomVocabulary.
    2. 针对 语言,选择 印地语,印第安纳州 (hi-IN).
    3. 针对 S3 上的输入文件位置,浏览到的位置 SampleAudio.wav.
    4. 针对 IAM角色, 选择 使用现有的IAM角色 并选择您之前创建的角色。
    5. 配置作业 部分,选择 自定义词汇 并选择自定义词汇 HindiCustomVocabulary.
  10. 建立工作.

在 Amazon Transcribe PlatoBlockchain Data Intelligence 中使用自定义词汇提高客户代理呼叫的转录准确性。 垂直搜索。 哎。

使用自定义词汇后测量模型准确性

将 Amazon Transcribe 作业详细信息页面中的脚本复制到名为 hypothesis-custom-vocabulary.txt:

对客户的 : हेलो,

经纪人 : गुड मोर्निग इंडिया ट्रेवल एजेंसी सेम हैत लहीहूँसेमैंमैं。हूँ

对客户的 :मैंबहुतदिनोंददटकेकेेेमें क्या आप मुझे कुछ अच्छे लोकेशन

经纪人 : हाँ बिल्कुल। हैदराबादमेंबहुतसा冰箱उनमेंसेचार मिनारगोलकोंडाफो 你 जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर

对客户的 :हथैंकमैंमैंअगलेसंडेसंडेसंडेसंडेको

经纪人 : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चा

对客户的 : सिरियसलीएनीटिप्सचिकनशेर

经纪人 :आपआपयूसलोलोलोलोकिंग

对客户的 : ग्冰箱

请注意,突出显示的单词是根据需要转录的。

运行 wer 使用新的成绩单再次命令:

wer -i reference.txt hypothesis-custom-vocabulary.txt

您将获得以下输出:

REF: customer : हेलो,

HYP: customer : हेलो,

SENTENCE 1

Correct = 100.0% 3 ( 3)

Errors = 0.0% 0 ( 3)

REF: agent : गुड मोर्निग सौथ इंडिया ट्रेवल एजेंसी से मैं । लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

HYP: agent : गुड मोर्निग *** इंडिया ट्रेवल एजेंसी ** सेम है। लावन्या बात कर रही हूँ किस तरह से मैं आपकी सहायता कर सकती हूँ।

SENTENCE 2

Correct = 84.0% 21 ( 25)

Errors = 16.0% 4 ( 25)

REF: customer : मैं बहुत ***** दिनोंसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

HYP: customer : मैं बहुत दिनों उनसे हैदराबाद ट्रेवल के बारे में सोच रहा था। क्या आप मुझे कुछ अच्छे लोकेशन के बारे में बता सकती हैं?

SENTENCE 3

Correct = 96.0% 24 ( 25)

Errors = 8.0% 2 ( 25)

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

REF: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

HYP: customer : हाँ बढिया थैंक यू मैं अगले सैटरडे और संडे को ट्राई करूँगा।

SENTENCE 5

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

HYP: agent : एक सजेशन वीकेंड में ट्रैफिक ज्यादा रहने के चांसेज है।

SENTENCE 6

Correct = 100.0% 12 ( 12)

Errors = 0.0% 0 ( 12)

REF: customer : सिरियसली एनी टिप्स यू केन शेर

HYP: customer : सिरियसली एनी टिप्स ** चिकन शेर

SENTENCE 7

Correct = 75.0% 6 ( 8)

Errors = 25.0% 2 ( 8)

REF: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

HYP: agent : आप टेक्सी यूस कर लो ड्रैव और पार्किंग का प्राब्लम नहीं होगा।

SENTENCE 8

Correct = 100.0% 14 ( 14)

Errors = 0.0% 0 ( 14)

REF: customer : ग्रेट आइडिया थैंक्यू सो मच।

HYP: customer : ग्रेट आइडिया थैंक्यू सो मच।

SENTENCE 9

Correct = 100.0% 7 ( 7)

Errors = 0.0% 0 ( 7)

Sentence count: 9

WER: 6.061% ( 8 / 132)

WRR: 94.697% ( 125 / 132)

SER: 33.333% ( 3 / 9)

使用自定义词汇创建的成绩单中的观察结果

总 WER 为 6.061%,这意味着 93.939% 的单词被准确转录。

让我们比较使用和不使用自定义词汇表的第 4 句的 wer 输出。 以下是没有自定义词汇的:

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार महीना गोलकुंडा फोर सलार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 83.3% 20 ( 24)

Errors = 16.7% 4 ( 24)

以下是自定义词汇表:

REF: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

HYP: agent : हाँ बिल्कुल। हैदराबाद में बहुत सारे प्लेस है। उनमें से चार मिनार गोलकोंडा फोर्ट सालार जंग म्यूजियम और बिरला प्लेनेटोरियम मशहूर है।

SENTENCE 4

Correct = 100.0% 24 ( 24)

Errors = 0.0% 0 ( 24)

第 4 句没有错误。在自定义词汇的帮助下准确地转录了地名,从而将该音频文件的整体 WER 从 9.848% 降低到 6.061%。 这意味着转录的准确性提高了近 4%。

自定义词汇如何提高准确性

我们使用了以下自定义词汇:

Phrase IPA SoundsLike DisplayAs

गोलकुंडा-फोर गोलकोंडा फोर्ट

सालार-जंग सा-लार-जंग सालार जंग

चार-महीना चार मिनार

Amazon Transcribe 检查音频文件中是否有任何单词听起来像 Phrase 柱子。 然后模型使用 IPA, SoundsLikeDisplaysAs 这些特定单词的列以使用所需的拼写进行转录。

使用此自定义词汇表,当 Amazon Transcribe 识别出听起来像“गोलकुंडा-फोर (Golcunda-Four)”的单词时,它会将该单词转录为“गोलकोंडा फोर्ट (Golconda Fort)”。

图书馆推荐

转录的准确性还取决于说话者的发音、说话者重叠、说话速度和背景噪音等参数。 因此,我们建议您使用涵盖最常用的特定领域词汇的各种呼叫(与不同的客户、座席、中断等)来遵循该流程,以便您构建一个全面的自定义词汇表。

在这篇文章中,我们学习了使用自定义词汇来提高转录一个音频呼叫的准确性的过程。 要每天处理数以千计的联络中心通话录音,您可以使用 通话后分析,一个完全自动化、可扩展且具有成本效益的端到端解决方案,可以处理大部分繁重的工作。 您只需将音频文件上传到 S3 存储桶,几分钟内,该解决方案即可在 Web UI 中提供类似情绪的呼叫分析。 通话后分析提供可操作的见解,以发现新兴趋势、确定座席指导机会并评估通话的总体情绪。通话后分析是一种 开源解决方案 您可以使用 AWS CloudFormation.

请注意,自定义词汇表不使用说出单词的上下文,它们只关注您提供的单个单词。 为了进一步提高准确性,您可以使用 自定义语言模型. 与将发音与拼写相关联的自定义词汇表不同,自定义语言模型学习与给定单词关联的上下文。 这包括一个词的使用方式和时间,以及一个词与其他词的关系。 要创建自定义语言模型,您可以使用从我们为各种呼叫学习的过程中获得的转录,并将它们与您的网站或包含特定领域单词和短语的用户手册中的内容相结合。

要通过批量转录实现最高的转录准确度,您可以将自定义词汇表与您的自定义语言模型结合使用。

结论

在这篇文章中,我们提供了详细的步骤,以使用 Amazon Transcribe 中的呼叫分析和自定义词汇表准确处理包含英语单词的印地语音频文件。 您可以使用这些相同的步骤来处理与任何 支持的语言 由亚马逊转录。

在以所需的准确性导出转录后,您可以通过培训代理来改善代理与客户的对话。 您还可以了解客户的情绪和趋势。 借助呼叫分析中的说话者分类、响度检测和词汇过滤功能,您可以确定是座席还是客户提高了语气或说出了任何特定的词。 您可以根据特定领域的词语对呼叫进行分类,获取可操作的见解,并运行分析以改进您的产品。 最后,您可以使用以下方式将您的成绩单翻译成英语或您选择的其他支持的语言 亚马逊翻译.


作者简介

在 Amazon Transcribe PlatoBlockchain Data Intelligence 中使用自定义词汇提高客户代理呼叫的转录准确性。 垂直搜索。 哎。 萨拉特·古蒂孔达 是 AWS 全球公共部门的高级解决方案架构师。 Sarat 喜欢在不牺牲业务敏捷性的情况下帮助客户自动化、管理和治理他们的云资源。 在空闲时间,他喜欢和儿子一起拼乐高积木和打乒乓球。

在 Amazon Transcribe PlatoBlockchain Data Intelligence 中使用自定义词汇提高客户代理呼叫的转录准确性。 垂直搜索。 哎。拉瓦尼亚苏德 是位于印度新德里的 AWS 全球公共部门的解决方案架构师。 Lavanya 喜欢学习新技术并帮助客户进行云采用之旅。 在空闲时间,她喜欢旅行和尝试不同的食物。

时间戳记:

更多来自 AWS机器学习