Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe

Если вы работаете в стране с несколькими официальными языками или в нескольких регионах, ваши аудиофайлы могут содержать разные языки. Участники могут говорить на совершенно разных языках или могут переключаться между языками. Рассмотрим звонок в службу поддержки клиентов, чтобы сообщить о проблеме в районе со значительным многоязычным населением. Хотя разговор может начинаться на одном языке, вполне возможно, что клиент может перейти на другой язык для описания проблемы, в зависимости от уровня комфорта или предпочтений использования других языков. Аналогичным образом представитель службы поддержки клиентов может переключаться между языками при передаче инструкций по эксплуатации или устранению неполадок.

Минимум 3 секунды звука, Amazon транскрибировать может автоматически идентифицировать и эффективно генерировать стенограммы на языках, на которых говорят в аудиозаписи, не требуя, чтобы люди указывали языки. Это относится к различным вариантам использования, таким как расшифровка звонков клиентов, преобразование голосовой почты в текст, запись взаимодействий на собраниях, отслеживание общения пользователей на форумах или мониторинг рабочих процессов производства и локализации медиаконтента.

В этом посте описаны шаги по расшифровке многоязычного аудиофайла с помощью Amazon Transcribe. Мы обсудим, как сделать аудиофайлы доступными для Amazon Transcribe и включить расшифровку многоязычных аудиофайлов при вызове API Amazon Transcribe.

Обзор решения

Amazon Transcribe — это сервис AWS, который упрощает преобразование речи в текст. Добавить функцию преобразования речи в текст в любое приложение очень просто с помощью Amazon Transcribe, службы автоматического распознавания речи (ASR). Вы можете принимать аудиовход с помощью Amazon Transcribe, создавать четкие стенограммы, которые легко читать и просматривать, повышать точность с помощью настройки и фильтровать информацию для защиты конфиденциальности клиентов.

В решении также используется Простой сервис хранения Amazon (Amazon S3), сервис хранения объектов, созданный для хранения и извлечения любого объема данных из любого места. Это простая служба хранения данных, которая предлагает лучшую в отрасли надежность, доступность, производительность, безопасность и практически неограниченную масштабируемость по очень низкой цене. Когда вы храните данные в Amazon S3, вы работаете с ресурсами, известными как ковши и объекты. Ведро — это контейнер для объектов. Объект — это файл и любые метаданные, описывающие файл.

В этом посте мы проведем вас через следующие шаги по внедрению многоязычного решения для транскрипции аудио:

  1. Создайте корзину S3.
  2. Загрузите свой аудиофайл в корзину.
  3. Создайте задание транскрипции.
  4. Просмотрите результат задания.

Предпосылки

Для этого прохождения у вас должны быть следующие предпосылки:

Amazon Transcribe предоставляет возможность хранить транскрибированные выходные данные либо в корзине S3, управляемой службой, либо в корзине S3, управляемой клиентом. Для этого сообщения Amazon Transcribe записывает результаты в корзину SXNUMX, управляемую службой.

Обратите внимание, что Amazon Transcribe является региональной службой, и вызываемые конечные точки API Amazon Transcribe должны находиться в том же регионе, что и корзины S3.

Создайте корзину S3 для хранения входных аудиофайлов.

Чтобы создать корзину S3, выполните следующие действия:

  1. На консоли Amazon S3 выберите Создать ведро.
  2. Что касается Название ковша, введите глобально уникальное имя корзины.
  3. Что касается AWS Регион, выберите тот же регион, что и ваши конечные точки API Amazon Transcribe.
    Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.
  4. Оставьте все значения по умолчанию как есть.
  5. Выберите Создать ведро.
    Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Загрузите свой аудиофайл в корзину S3

Загрузите свой многоязычный аудиофайл в корзину S3 в своей учетной записи AWS. Для целей этого упражнения мы используем следующий образец многоязычный аудиофайл. Он фиксирует звонок в службу поддержки на английском и испанском языках..

  1. На консоли Amazon S3 выберите Ведра в навигационной панели.
  2. Выберите корзину, которую вы создали ранее, для хранения входных аудиофайлов.
  3. Выберите Загрузите.
    Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.
  4. Выберите Добавить файлы.
    Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.
  5. Выберите аудиофайл, который вы хотите транскрибировать с вашего локального компьютера.
    Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.
  6. Выберите Загрузите.
    Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Ваш аудиофайл скоро будет доступен в корзине S3.

Создайте задание транскрипции

После загрузки аудиофайла мы теперь создаем задание транскрипции.

  1. В консоли Amazon Transcribe выберите Работа транскрипции в навигационной панели.
  2. Выберите Создать работу.
    Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.
  3. Что касается Имя, введите уникальное имя задания.
    Это также будет имя выходного файла стенограммы.
  4. Что касается Языковые настройки, наведите на Автоматическая идентификация нескольких языков.
    Эта функция позволяет Amazon Transcribe автоматически определять и расшифровывать все языки, на которых говорят в аудиофайле.
    Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.
  5. Что касается Языковые опции для автоматической идентификации языка, оставьте его невыбранным.
    Amazon Transcribe автоматически идентифицирует и расшифровывает все языки, на которых звучит аудио. Чтобы повысить точность транскрипции, вы можете дополнительно выбрать два или более языков, на которых, как вы знаете, говорили в аудио.
    Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.
  6. Что касается Тип модели, только Общая модель вариант доступен на момент написания этого поста.
  7. Что касается Входные данные, выберите Обзор S3.
  8. Выберите исходный аудиофайл, который мы загрузили ранее.
    Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.
  9. Что касается Выходные данные, вы можете выбрать либо Сегмент S3, управляемый сервисом or Указанный клиентом сегмент S3. Для этого поста выберите Сегмент S3, управляемый службой.
    Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.
  10. Выберите Следующая.
  11. Выберите Создать работу.

Просмотрите результат задания

Когда задание транскрипции завершено, откройте задание транскрипции.
Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Прокрутите вниз до Предварительный просмотр транскрипции раздел. Аудио транскрипция отображается на Текст вкладка Транскрипция включает как английскую, так и испанскую части разговора.
Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

При желании вы можете загрузить копию стенограммы в виде файла JSON, который вы могли бы использовать для дальнейшего аналитика после звонка.

Убирать

Чтобы избежать будущих расходов, очистите и удалите корзину S3, которую вы создали для хранения входного исходного аудиофайла. Убедитесь, что файлы хранятся в другом месте, потому что это навсегда удалит все объекты, содержащиеся в корзине. В консоли Amazon Transcribe выберите и удалите задание, ранее созданное для расшифровки.

Заключение

В этом посте мы создали сквозной рабочий процесс для автоматизации идентификации и расшифровки многоязычных аудиофайлов без написания кода. Мы использовали новую функциональность Amazon Transcribe для автоматического определения разных языков в аудиофайле и правильной расшифровки каждого языка.

Для получения дополнительной информации обратитесь к Идентификация языка с пакетными заданиями транскрипции.


Об авторах

Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.Муртуза Бутвала является старшим архитектором решений в AWS и интересуется технологиями AI/ML. Ему нравится работать с клиентами, чтобы помочь им достичь результатов в бизнесе. Вне работы он любит активный отдых и проводит время с семьей.

Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.Виктор Рохо увлечен AI / ML и разработкой программного обеспечения. Он помог запустить Amazon Alexa в США и Мексике. Он также представил Amazon Textract для партнеров AWS и запустил AWS Contact Center Intelligence (CCI). В настоящее время он является глобальным техническим руководителем Conversational AI Partners.

Автоматически определяйте языки в многоязычном аудио с помощью Amazon Transcribe PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.Бабу Сринивасан является AWS Sr. Specialist SA (Language AI Services) из Чикаго. Он занимается Amazon Transcribe (преобразование речи в текст), помогая нашим клиентам использовать услуги ИИ для решения бизнес-задач. Вне работы он любит работать с деревом и устраивать магические шоу.

Отметка времени:

Больше от Машинное обучение AWS