Создание субтитров для видеоконтента создает проблемы независимо от того, насколько велика или мала организация. Чтобы решить эти проблемы, Amazon транскрибировать имеет полезную функцию, позволяющую создавать субтитры непосредственно в сервисе. Для начала не требуется машинного обучения (ML) или написания кода. В этом посте вы узнаете, как настроить рабочий процесс без кода для создания видеосубтитров с помощью Amazon Transcribe в вашей учетной записи Amazon Web Services.
Субтитры против скрытых титров
Условия субтитры и субтитры обычно используются взаимозаменяемо, и оба относятся к произносимому тексту, отображаемому на экране. Однако основное различие между субтитрами и закрытыми титрами (на основе отраслевых определений и определений доступности) заключается в том, что скрытые титры содержат как транскрипцию произносимого слова, так и описание фоновой музыки или звуков, встречающихся на звуковой дорожке, для более широкого использования специальных возможностей. . Этот пост посвящен только созданию расшифрованных файлов субтитров с произносимыми словами с использованием технологии автоматического распознавания речи (ASR), которые не содержат идентификацию говорящего, звуковые эффекты или описания музыки. Amazon Transcribe поддерживает стандартные для отрасли форматы SubRip Text (*.srt) и текстовые дорожки веб-видео (*.vtt) для создание субтитров.
На следующем изображении показан пример субтитров, включенных в веб-видеоплеере.
Субтитры приносят пользу создателям видео, расширяя охват и инклюзивность их видеоконтента. Отображая звуковую часть видео на экране, субтитры делают аудио/видео контент доступным для более широкой аудитории, в том числе для тех, для кого не является родным языком, и для тех, кто находится в среде, где звук неслышен.
Хотя преимущества субтитров очевидны, создатели видео традиционно сталкивались с препятствиями при создании субтитров. Препятствия возникают из-за трудоемких и ресурсоемких требований традиционного процесса создания, который в значительной степени зависит от ручного труда. Традиционные методы создания субтитров выполняются вручную и могут занимать от нескольких дней до нескольких недель, поэтому они могут быть несовместимы со всеми производственными графиками. Точно так же многие компании используют услуги ручного транскрибирования, но эти процессы часто не масштабируются и обходятся дорого в обслуживании. Amazon Transcribe упрощает преобразование речи в текст с помощью технологий на основе машинного обучения и помогает создателям видео решить эти проблемы.
Обзор решения
В этом посте рассматривается рабочий процесс без кода для создания субтитров с использованием Простой сервис хранения Amazon (Amazon S3) и Amazon Transcribe.
Amazon S3 — это объектное хранилище, созданное для хранения и извлечения любого объема данных из любого места. Этот пост описывает процесс создать ведро S3 и загрузите аудиофайл. Когда пользователи хранят данные в Amazon S3, они работают с ресурсами, известными как сегменты и объекты. А ведро является контейнером для объектов. Ан объект — это файл и любые метаданные, описывающие этот файл.
Amazon Transcribe – это служба ASR, которая использует полностью управляемые и постоянно обучаемые модели машинного обучения для преобразования аудио- и видеофайлов в текст. Входные и выходные данные Amazon Transcribe хранятся в Amazon S3. Amazon Transcribe берет аудиоданные, будь то медиафайл в корзине Amazon S3 или медиапоток, и преобразует их в текстовые данные. Amazon Transcribe позволяет принимать входные аудиозаписи, создавать легко читаемые стенограммы с высокой степенью точности, настраивать выходные данные в соответствии со словарем, относящимся к предметной области, с помощью пользовательские языковые модели (КЛМ) и пользовательские словарии фильтровать контент, чтобы обеспечить конфиденциальность клиентов. Клиенты могут использовать Amazon Transcribe для различных бизнес-приложений, включая расшифровка голосовых вызовов службы поддержки клиентов, генерация субтитров на аудио/видео контенти проводить (текстовый) контент-анализ по аудио/видео контенту. В этом посте мы демонстрируем создание задания транскрипции и просмотр результата задания.
Если вы предпочитаете пошаговое видеоруководство, обратитесь к эпизоду видеозакусок Amazon Transcribe. Создание видео субтитров без написания кода.
Предпосылки
Чтобы пройти через решение, у вас должны быть следующие предварительные условия:
- An Аккаунт AWS с достаточным Управление идентификацией и доступом AWS (IAM) права пользователя
- Аудио/видеофайл с произнесенными словами в формате Язык, поддерживаемый Amazon Transcribe и в поддерживаемый формат ввода
Если у вас еще нет образца аудио/видеофайла, вы можете создать его с помощью приложения для записи видео на своем компьютере или смартфоне. Убедитесь, что вы четко говорите в микрофон, чтобы обеспечить высочайшее качество транскрипции при записи. Другой вариант — найти бесплатную загрузку с произносимым словом, например подкастили видеопрохождение, представленное в этом посте, который может быть обработан Amazon Transcribe. Записанный или загруженный файл должен быть доступен на вашем рабочем столе для загрузки в вашу учетную запись AWS.
Прежде чем приступить к работе, ознакомьтесь с Amazon транскрибировать и Amazon S3 страницы с ценами на услуги.
Создайте корзины S3
Для этого поста мы создадим две корзины S3, чтобы разделить ввод и вывод.
- На консоли Amazon S3 выберите Создать ведро.
- Дайте каждому сегменту глобально уникальное имя.
- Используйте параметры по умолчанию, чтобы обеспечить соответствие политикам вашей организации.
- Включите управление версиями корзины и шифрование на стороне сервера по умолчанию (рекомендуемые).
- Выберите Создать ведро.
На следующем снимке экрана показана конфигурация входного сегмента.
Ведро S3 для ввода теперь готово для загрузки аудио/видеофайла. На момент публикации этой максимальный размер входных данных для Amazon Transcribe — 2 ГБ.. Если видеофайл превышает этот объем или находится в формат, изначально не поддерживаемый Amazon Transcribeрассмотрите возможность использования AWS Elemental MediaConvert в создать аудиовыход. Это выгодно, поскольку аудиофайлы обычно намного меньше видеофайлов, а Amazon Transcribe требует только звуковую дорожку, а не видеодорожку для создания расшифровки и субтитров.
Загрузите исходный файл в корзину S3.
Чтобы загрузить исходный файл, выполните следующие действия:
- В консоли Amazon S3 выберите корзину ввода.
- Выберите Загрузите.
- Выберите файл на рабочем столе.
- Примите класс хранилища и параметры шифрования по умолчанию или измените их в соответствии с политиками вашей организации.
- Выберите Загрузите.
Создать задание транскрипции
Теперь, когда входной файл готов в Amazon S3, мы создаем задание транскрипции в Amazon Transcribe.
- На Консоль Amazon Transcribe, выберите Работа транскрипции в навигационной панели.
- Выберите Создать работу.
В этом пошаговом руководстве в основном используются параметры по умолчанию; однако вам следует выбрать конфигурацию, наиболее соответствующую требованиям вашей организации.
- Что касается Имя, введите имя для этого задания и результирующий файл.
- Что касается Языковые настройки, наведите на Конкретный язык.
- Что касается Язык, выберите исходный язык входного файла.
- Что касается Тип моделиВыбрать Общая модель.
Мы используем общую модель для этой демонстрации, но мы рекомендуем вам изучить обучение и использование пользовательские языковые модели для повышения точности для конкретных случаев использования, таких как отраслевые термины или аббревиатуры. Чтобы глубже погрузиться в пользовательские языковые модели, посмотрите видеоролик об Amazon Transcribe. Использование пользовательских языковых моделей (CLM) для повышения точности транскрипции.
- Что касается Расположение входного файла на S3, выберите Обзор S3.
- Выберите входной сегмент и аудио/видеофайл для расшифровки.
- Что касается Информация о типе местоположения выходных данных, наведите на Указанный клиентом сегмент S3.
- Что касается Место назначения выходного файла на S3, выберите Обзор S3.
- Выберите только что созданный выходной сегмент.
Ассоциация Формат файла субтитров Раздел предоставляет два наиболее важных варианта всего этого поста. Выходные данные в формате *.srt и *.vtt можно выбрать в рамках задания расшифровки Amazon Transcribe. На момент написания этой статьи выбор одного или обоих вариантов не увеличивает стоимость работы Amazon Transcribe.
Это значение относится к начальному номеру первого субтитра в последовательности. Если вы не уверены, какое значение выбрать, 1 является наиболее распространенным.
- Когда настройки установлены, выберите Следующая.
- Настройте любые дополнительные параметры в соответствии с вашими потребностями.
Amazon Transcribe предлагает варианты аудиоидентификации для каналы or динамики, альтернативные результаты, Редакция PII, фильтрация словарного запасаи пользовательский словарь. Для этого конкретного поста вы можете пропустить эти параметры конфигурации. Для более глубокого ознакомления с вариантами конфигурации работы просмотрите эпизоды видеозакусок Amazon Transcribe для пользовательский словарь, пользовательские языковые моделии фильтрация словарного запаса.
Просмотрите результат задания
Начнется задание транскрипции для создания субтитров к видео. Состояние задания, как показано на следующем снимке экрана, отображается на панели сведений о задании. Когда задание будет завершено, выберите расположение выходных данных, чтобы найти вновь созданные субтитры в корзине S3.
Субтитры обозначаются расширениями *.srt или *.vtt. Когда вы выбираете объект в корзине S3, у вас есть возможность скачать файл.
Поскольку эти субтитры представлены в текстовом формате, любой текстовый редактор может просмотреть и отредактировать полученную расшифровку. Сравнение файлов *.srt и *.vtt обнаруживает много общего с небольшими различиями.
Ниже приведен пример формата *.srt:
Ниже приведен пример формата *.vtt:
Цифры указывают порядок отображения субтитров. Тайм-код указывает, когда отображаются субтитры. Текст — это сам текст субтитров.
Любые изменения или исправления теперь возможны непосредственно в текстовом редакторе и остаются совместимыми при сохранении с расширением *.srt или *.vtt. Вы также можете просмотреть изменения на самой видеоплатформе, в приложении для редактирования видео или в видеоплеере.
VLC — популярный кроссплатформенный видеоплеер с открытым исходным кодом, который поддерживает субтитры *.srt и *.vtt. Чтобы автоматически воспроизводить субтитры поверх видео в VLC, поместите исходное видео и файл субтитров в один и тот же каталог с одинаковым именем файла перед расширением файла.
Теперь, когда вы открываете видеофайл в VLC, файл субтитров должен автоматически обнаруживаться и воспроизводиться в окне видеоплеера.
Убирать
Чтобы не нести расходы в будущем, пустой и удалять корзины S3, используемые для ввода и вывода. Убедитесь, что у вас есть все необходимые файлы, так как это навсегда удалит все объекты, содержащиеся в корзинах. На Расшифровать консоль, выберите и удалите все задания, которые больше не нужны.
Заключение
Теперь вы создали полный сквозной рабочий процесс создания субтитров, чтобы расширить и ускорить процесс создания видеосубтитров, и все это без написания кода. За несколько минут вы создали сегменты хранилища S3, загрузили файл в Amazon S3 и использовали Amazon Transcribe для создания субтитров. Затем вы можете загрузить полученные файлы субтитров *.srt и *.vtt для просмотра и загрузить их на целевую платформу.
Этот рабочий процесс сосредоточен на аудио- и видеосубтитрах, созданных с помощью технологии автоматического распознавания речи (ASR) в Amazon Transcribe специально для рабочих процессов с видео. Сам по себе этот рабочий процесс не является заменой процесса создания скрытых субтитров с участием человека, который может соответствовать более высоким стандартам доступности, включая идентификацию говорящего, звуковые эффекты, описание музыки и проверку на точность редактирования. Вы можете использовать метод редактирования текста, описанный в этом посте, чтобы добавить эти элементы после завершения первоначального задания Amazon Transcribe. Кроме того, для более продвинутого создания, предварительного просмотра и редактирования субтитров в браузере вы можете изучить развертывание Локализация контента на AWS решение, проверенное AWS Solution Architects и включающее руководство по внедрению. Это решение предлагает дополнительные функции, такие как предварительный просмотр в браузере и редактирование субтитров, перевод субтитров от Amazon Translateи возможности компьютерного зрения, предлагаемые Апостол.
Если вам понравилась эта демонстрация возможностей Amazon Transcribe по созданию субтитров, рассмотрите возможность более глубокого изучения дополнительных функций и возможностей для ускорения ваших рабочих процессов со звуком и видео. Дополнительные сведения и примеры кода для поддержки автоматизации и масштабирования создания субтитров см. Создание субтитров к видео. Удачи вам в ваших исследованиях и разработке рабочего процесса создания субтитров.
Об авторе
Джейсон О'Мэлли является старшим архитектором партнерских решений в AWS, поддерживающим партнеров, разрабатывающих решения для индустрии мультимедиа, коммуникаций и технологий. До прихода в AWS Джейсон 13 лет работал в индустрии медиа и развлечений в таких компаниях, как Team Coco Конана О'Брайена, WarnerMedia и Media.Monks. Джейсон начал свою карьеру в области телевизионного производства и пост-продакшна, прежде чем создавать мультимедийные рабочие нагрузки на AWS. Когда Джейсон не создает решения для партнеров и клиентов, его можно найти за приключениями с женой и сыном или за чтением материалов об устойчивом развитии.
- Коинсмарт. Лучшая в Европе биржа биткойнов и криптовалют.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. БЕСПЛАТНЫЙ ДОСТУП.
- КриптоХок. Альткоин Радар. Бесплатная пробная версия.
- Источник: https://aws.amazon.com/blogs/machine-learning/create-video-subtitles-with-amazon-transcribe-using-this-no-code-workflow/
- "
- 10
- 100
- 7
- О нас
- ускорять
- доступ
- доступность
- Учетная запись
- дополнительный
- адрес
- продвинутый
- Все
- уже
- Amazon
- Amazon Web Services
- количество
- Другой
- откуда угодно
- Применение
- Приложения
- аудитория
- аудио
- Автоматический
- Автоматизация
- доступен
- AWS
- фон
- польза
- Преимущества
- ЛУЧШЕЕ
- граница
- Строительство
- бизнес
- Бизнес-приложения
- возможности
- Подписи
- Карьера
- случаев
- проблемы
- расходы
- Выберите
- класс
- закрыто
- код
- Общий
- Связь
- Компании
- комплекс
- Соответствие закону
- компьютер
- Конфигурация
- Консоли
- Container
- содержание
- Создайте
- создали
- Создающий
- создание
- Создатели
- изготовленный на заказ
- клиент
- Служба поддержки игроков
- Клиенты
- данным
- более глубокий
- демонстрировать
- развертывание
- описано
- компьютера
- подробнее
- развивающийся
- трудный
- непосредственно
- не
- домен
- скачать
- редактор
- эффекты
- усилие
- элементы
- поощрять
- шифрование
- Enter
- Развлечения
- Окружающая среда
- существенный
- пример
- опыт
- исследование
- Больше
- расширения
- сталкиваются
- Особенность
- Особенности
- Во-первых,
- внимание
- фокусируется
- после
- формат
- вперед
- найденный
- будущее
- Общие
- порождать
- порождающий
- ГЛОБАЛЬНО
- хорошо
- полезный
- помогает
- High
- высший
- Наем
- Как
- Однако
- HTTPS
- огромный
- Идентификация
- Личность
- изображение
- осуществлять
- улучшенный
- включает в себя
- В том числе
- Сопричастность
- индекс
- промышленность
- вход
- интегрировать
- вопросы
- IT
- саму трезвость
- работа
- Джобс
- известный
- язык
- больше
- изучение
- уровень
- расположение
- удачи
- машина
- обучение с помощью машины
- поддерживать
- ДЕЛАЕТ
- управляемого
- способ
- руководство
- вручную
- Вопрос
- Медиа
- методы
- ML
- модель
- Модели
- БОЛЕЕ
- самых
- Музыка
- Навигация
- необходимо
- номер
- номера
- предложенный
- Предложения
- открытый
- Опция
- Опции
- заказ
- организация
- часть
- особый
- партнер
- партнеры
- Платформа
- Играть
- игрок
- игры
- сборах
- состояния потока
- Популярное
- возможное
- предварительный просмотр
- цены
- первичный
- процесс
- Процессы
- производит
- Производство
- приводит
- достигать
- Reading
- оставаться
- обязательный
- Требования
- Полезные ресурсы
- Итоги
- обзоре
- Шкала
- масштабирование
- экран
- обслуживание
- Услуги
- установка
- показанный
- просто
- Размер
- небольшой
- смартфон
- твердый
- Решение
- Решения
- Кто-то
- его
- Динамик
- динамики
- конкретно
- стандарт
- стандартов
- Начало
- и политические лидеры
- начинается
- Статус:
- диск
- магазин
- поток
- поддержка
- Поддержанный
- поддержки
- Поддержка
- Стабильность
- с
- команда
- технологии
- Технологии
- телевидение
- Источник
- следовательно
- Через
- время
- кропотливый
- Название
- трек
- традиционный
- Традиционно
- Обучение
- Переводы
- типично
- созданного
- использование
- пользователей
- использовать
- ценностное
- разнообразие
- прошедшая проверка
- Видео
- Вид
- видение
- Смотреть
- Web
- веб-сервисы
- в то время как
- в
- без
- слова
- Работа
- письмо
- лет
- Уступать
- YouTube