Створення субтитрів для відеоконтенту створює проблеми, незалежно від того, наскільки велика чи мала організація. Щоб вирішити ці виклики, Амазонська розшифровка має корисну функцію, яка дозволяє створювати субтитри безпосередньо в службі. Для початку не потрібно машинне навчання (ML) або написання коду. Ця публікація допоможе вам налаштувати робочий процес без коду для створення відеосубтитрів за допомогою Amazon Transcribe у вашому обліковому записі Amazon Web Services.
Субтитри проти субтитрів
Умови субтитри та закриті титри зазвичай використовуються як взаємозамінні, і обидва стосуються усного тексту, що відображається на екрані. Однак основна відмінність між субтитрами та закритими субтитрами (на основі визначень галузі та доступності) полягає в тому, що закриті субтитри містять як транскрипцію вимовленого слова, так і опис фонової музики чи звуків, що виникають у аудіодоріжці для більшої доступності. . Ця публікація зосереджена лише на створенні транскрибованих файлів субтитрів усного слова за допомогою технології автоматичного розпізнавання мовлення (ASR), які не містять ідентифікації динаміка, звукових ефектів або музичних описів. Amazon Transcribe підтримує стандартні формати SubRip Text (*.srt) і Web Video Text Tracks (*.vtt) для створення субтитрів.
На наступному зображенні показано приклад субтитрів, увімкнених у веб-програвачі відео.
Субтитри приносять користь творцям відео, розширюючи як охоплення, так і інклюзивність їхнього відеоконтенту. Відображаючи розмовну аудіочастину відео на екрані, субтитри роблять аудіо-/відеоконтент доступним для більшої аудиторії, включно з тими, хто не є носієм рідної мови, і тим, хто перебуває в середовищі, де звук не чутно.
Хоча переваги субтитрів очевидні, автори відео традиційно стикаються з перешкодами у створенні субтитрів. Перешкоди виникають через трудомісткі та ресурсомісткі вимоги традиційного процесу створення, що значною мірою покладається на ручні зусилля. Традиційні методи створення субтитрів виконуються вручну і можуть зайняти від кількох днів до тижнів, тому вони можуть бути несумісними з усіма графіками виробництва. Так само багато компаній використовують послуги ручної транскрипції, але ці процеси часто не масштабуються і дорогі в обслуговуванні. Amazon Transcribe спрощує для вас перетворення мовлення в текст за допомогою технологій на основі ML і допомагає розробникам відео вирішувати ці проблеми.
Огляд рішення
У цій публікації описано робочий процес без коду для створення субтитрів Служба простого зберігання Amazon (Amazon S3) і Amazon Transcribe.
Amazon S3 — це об’єктне сховище, створене для зберігання та отримання будь-якої кількості даних з будь-якого місця. У цій публікації описано процес до створити відро S3 і завантажте аудіофайл. Коли користувачі зберігають дані в Amazon S3, вони працюють з ресурсами, відомими як сегменти та об’єкти. А відро є контейнером для об’єктів. An об'єкт це файл і будь-які метадані, які описують цей файл.
Amazon Transcribe — це служба ASR, яка використовує повністю керовані та безперервно навчальні моделі ML для перетворення аудіо/відео файлів у текст. Вхідні та вихідні дані Amazon Transcribe зберігаються в Amazon S3. Amazon Transcribe приймає аудіодані, будь то медіа-файл у відсі Amazon S3, або медіа-потік, і перетворює їх у текстові дані. Amazon Transcribe дозволяє отримувати аудіо вхідні дані, створювати легко читані стенограми з високим ступенем точності, налаштовувати вихідні дані для певного домену за допомогою власні мовні моделі (CLM) і користувацькі словники та фільтруйте вміст, щоб забезпечити конфіденційність клієнтів. Клієнти можуть використовувати Amazon Transcribe для різних бізнес-додатків, у тому числі транскрипція голосових дзвінків служби підтримки клієнтів, генерація субтитрів для аудіо/відео контенту та проводити (текстовий) аналіз контенту на аудіо/відео вміст. У цій публікації ми демонструємо створення завдання для транскрипції та перегляд результатів роботи.
Якщо ви віддаєте перевагу відео-покрокові інструкції, перегляньте епізод із відеозакусками Amazon Transcribe Створення субтитрів відео без написання коду.
Передумови
Щоб пройти через рішення, ви повинні мати такі передумови:
- An Обліковий запис AWS з достатнім Управління ідентифікацією та доступом AWS (IAM) привілеї користувача
- Аудіо/відеофайл із вимовленими словами в Підтримувана мова Amazon Transcribe і в а підтримуваний формат введення
Якщо у вас ще немає зразка аудіо/відеофайлу, ви можете створити його за допомогою програми для запису відео на комп’ютері або смартфоні. Переконайтеся, що ви говорите чітко в мікрофон, щоб забезпечити найвищий рівень якості транскрипції під час запису. Інший варіант – знайти безкоштовне завантаження з усним словом, наприклад, подкастабо відео інструкції, представлене в цій публікації, яку може проковтувати Amazon Transcribe. Записаний або завантажений файл має бути доступним на вашому робочому столі для завантаження в обліковий запис AWS.
Перш ніж почати, перегляньте Амазонська розшифровка та Amazon S3 сторінки цін на послуги.
Створіть сегменти S3
Для цієї публікації ми створюємо два відра S3, щоб розділити вхід і вихід.
- На консолі Amazon S3 виберіть Створити відро.
- Дайте кожному відру глобально унікальну назву.
- Використовуйте налаштування за замовчуванням, щоб забезпечити відповідність політикам вашої організації.
- включити версійне керування та шифрування за замовчуванням на стороні сервера (рекомендується).
- Вибирати Створити відро.
На наступному знімку екрана показано конфігурацію для вхідного сегмента.
Відро S3 для введення тепер готове для завантаження аудіо/відео файлу. На момент виходу цієї публікації в максимальний розмір введення для Amazon Transcribe становить 2 ГБ. Якщо відеофайл перевищує цю кількість або знаходиться у форматі a формат, який не підтримується Amazon Transcribe, розгляньте можливість використання AWS Elemental MediaConvert до створити вихід лише аудіо. Це вигідно, оскільки аудіофайли зазвичай набагато менші за відеофайли, а Amazon Transcribe для створення транскрипцій і субтитрів вимагає лише аудіодоріжку, а не відеодоріжку.
Завантажте вихідний файл у відро S3
Щоб завантажити вихідний файл, виконайте такі дії:
- На консолі Amazon S3 виберіть вхідний сегмент.
- Вибирати Завантажувати.
- Виберіть файл на робочому столі.
- Прийміть клас зберігання за замовчуванням і налаштування шифрування або змініть їх відповідно до політик вашої організації.
- Вибирати Завантажувати.
Створіть завдання на транскрипцію
Коли вхідний файл готовий в Amazon S3, ми створюємо завдання транскрипції в Amazon Transcribe.
- на Консоль Amazon Transcribeвиберіть Роботи з транскрипції у навігаційній панелі.
- Вибирати Створити роботу.
У цьому покроковому посібнику в основному використовуються параметри за замовчуванням; однак вам слід вибрати конфігурацію, яка найкраще відповідає вимогам вашої організації.
- для ІМ'Я, введіть ім'я для цього завдання та отриманого файлу.
- для Налаштування мовивиберіть Специфічна мова.
- для Language, виберіть вихідну мову вхідного файлу.
- для Тип моделі¸ виберіть Загальна модель.
Ми використовуємо загальну модель для цієї демонстрації, але рекомендуємо вам вивчити навчання та використання власні мовні моделі для покращення точності для конкретних випадків використання, таких як галузеві терміни чи абревіатури. Щоб глибше зануритися в власні мовні моделі, перегляньте відеозакуску Amazon Transcribe Використання спеціальних мовних моделей (CLM) для підвищення точності транскрипції.
- для Розташування вхідного файлу на S3виберіть Перегляньте S3.
- Виберіть вхідний сегмент і аудіо/відео файл, який потрібно транскрибувати.
- для Вивести інформацію про тип розташування данихвиберіть Ковш S3 вказав клієнт.
- для Місце призначення вихідного файлу на S3виберіть Перегляньте S3.
- Виберіть щойно створений вихідний сегмент.
Команда Формат файлу субтитрів розділ містить два найважливіші параметри всієї цієї публікації. Ви можете вибрати вихідні дані у форматі *.srt і *.vtt як частину завдання транскрипції Amazon Transcribe. На момент написання цієї статті вибір одного або обох не додає додаткових витрат на роботу Amazon Transcribe.
Це значення відноситься до початкового номера першого субтитра в послідовності. Якщо ви не впевнені, яке значення вибрати, 1 є найпоширенішим.
- Коли налаштування встановлені, виберіть МАЙБУТНІ.
- Налаштуйте будь-які додаткові параметри відповідно до ваших потреб.
Amazon Transcribe надає варіанти ідентифікації звуку для канали or динаміки, альтернативні результати, Редакція PII, фільтрація словникового запасу та користувацький словниковий запас. Для цієї конкретної публікації ви можете пропустити ці параметри конфігурації. Щоб глибше зануритися в параметри налаштування роботи, перегляньте епізоди відеозакусок Amazon Transcribe користувацький словниковий запас, власні мовні моделі та фільтрація словникового запасу.
Перегляньте результати роботи
Почнеться завдання транскрипції для створення субтитрів відео. Стан завдання, як показано на наступному знімку екрана, відображається на панелі відомостей про роботу. Коли завдання буде завершено, виберіть розташування вихідних даних, щоб знайти щойно створені субтитри у сегменті S3.
Субтитри визначаються розширеннями *.srt або *.vtt. Коли ви вибираєте об’єкт у сегменті S3, у вас є можливість завантажити файл.
Оскільки ці субтитри мають формат звичайного тексту, будь-який текстовий редактор може переглядати та редагувати отриману транскрипцію. Порівняння файлів *.srt і *.vtt виявляє багато подібності з незначними відмінностями.
Нижче наведено приклад формату *.srt:
Нижче наведено приклад формату *.vtt:
Цифри вказують порядок відображення субтитрів. Часовий код вказує, коли відображаються субтитри. Текст є самим текстом субтитрів.
Будь-які зміни або редакції тепер можливі безпосередньо в текстовому редакторі і залишаються сумісні, якщо їх зберігати з розширенням *.srt або *.vtt. Ви також можете попередньо переглянути зміни на самій відеоплатформі, у програмі для редагування відео або у відеопрогравачі.
VLC — популярний з відкритим вихідним кодом і кросплатформний відеопрогравач, який підтримує субтитри *.srt і *.vtt. Щоб автоматично відтворювати субтитри поверх відео у VLC, розмістіть оригінальне відео та файл субтитрів в одному каталозі з точною назвою файлу перед розширенням файлу.
Тепер, коли ви відкриваєте відеофайл у VLC, файл субтитрів повинен автоматично виявлятися та відтворюватися у вікні відеопрогравача.
Прибирати
Щоб уникнути додаткових витрат, порожній та видаляти відра S3, що використовуються для введення та виведення. Переконайтеся, що у вас збережено всі необхідні файли, оскільки це назавжди видалить усі об’єкти, що містяться в сегментах. На Консоль транскрибування, виберіть та видаліть усі завдання, які більше не потрібні.
Висновок
Тепер ви створили повний наскрізний робочий процес створення субтитрів, щоб розширити та прискорити процес створення субтитрів відео, і все це без написання коду. За кілька хвилин ви створили сегменти зберігання S3, завантажили файл на Amazon S3 та використали Amazon Transcribe для створення субтитрів. Потім ви можете завантажити отримані файли субтитрів *.srt і *.vtt для перегляду та завантажити їх на цільову платформу.
Цей робочий процес зосереджений на аудіо/відео субтитрах, створених за допомогою технології автоматичного розпізнавання мовлення (ASR) в Amazon Transcribe спеціально для робочих процесів відео. Сам по собі цей робочий процес не може замінити людський процес створення субтитрів, який може відповідати вищим стандартам доступності, зокрема ідентифікації динаміка, звукових ефектів, опису музики та перевірки точності редагування. Ви можете використовувати метод редагування тексту, описаний у цій публікації, щоб додати ці елементи після завершення початкового завдання Amazon Transcribe. Крім того, для розширеного створення, попереднього перегляду та редагування субтитрів у веб-переглядачі ви можете дослідити розгортання Локалізація вмісту на AWS рішення, яке перевірено AWS Solution Architects і включає в себе посібник із впровадження. Це рішення пропонує додаткові функції, такі як попередній перегляд і редагування субтитрів у браузері, переклад субтитрів на основі Amazon Translate, а також можливості комп’ютерного зору, які пропонує Amazon Rekognition.
Якщо вам сподобалася ця демонстрація здатності Amazon Transcribe створювати субтитри, подумайте про те, щоб глибше зануритися в додаткові функції та можливості для прискорення ваших аудіо/відео робочих процесів. Додаткову інформацію та зразки коду для підтримки автоматизації та масштабування створення субтитрів див Створення субтитрів для відео. Успіхів у дослідженні та розвитку робочого процесу створення субтитрів.
Про автора
Джейсон О'Меллі є старшим архітектором партнерських рішень у AWS, який підтримує партнерів у розробці рішень для медіа, комунікацій та технологічної галузі. Перш ніж приєднатися до AWS, Джейсон провів 13 років у медіа та індустрії розваг у таких компаніях, як Conan O'Brien's Team Coco, WarnerMedia та Media.Monks. Джейсон розпочав свою кар'єру з телевізійного виробництва та постпродакшн, перш ніж створювати медіа-навантаження на AWS. Коли Джейсон не створює рішення для партнерів і клієнтів, його можна знайти в пригодах зі своєю дружиною та сином або читаючи про екологічність.
- Coinsmart. Найкраща в Європі біржа біткойн та криптовалют.
- Платоблокчейн. Web3 Metaverse Intelligence. Розширені знання. БЕЗКОШТОВНИЙ ДОСТУП.
- CryptoHawk. Альткойн Радар. Безкоштовне випробування.
- Джерело: https://aws.amazon.com/blogs/machine-learning/create-video-subtitles-with-amazon-transcribe-using-this-no-code-workflow/
- "
- 10
- 100
- 7
- МЕНЮ
- прискорювати
- доступ
- доступність
- рахунки
- Додатковий
- адреса
- просунутий
- ВСІ
- вже
- Amazon
- Amazon Web Services
- кількість
- Інший
- де-небудь
- додаток
- застосування
- аудиторія
- аудіо
- автоматичний
- автоматизація
- доступний
- AWS
- фон
- користь
- Переваги
- КРАЩЕ
- border
- Створюємо
- бізнес
- Бізнес-додатки
- можливості
- Підписи
- кар'єра
- випадків
- проблеми
- вантажі
- Вибирати
- клас
- закрито
- код
- загальний
- зв'язку
- Компанії
- комплекс
- дотримання
- комп'ютер
- конфігурація
- Консоль
- Контейнер
- зміст
- створювати
- створений
- створення
- створення
- Творці
- виготовлений на замовлення
- клієнт
- Контакти
- Клієнти
- дані
- глибше
- демонструвати
- розгортання
- описаний
- робочий стіл
- деталі
- розвивається
- важкий
- безпосередньо
- Ні
- домен
- скачати
- редактор
- ефекти
- зусилля
- елементи
- заохочувати
- шифрування
- Що натомість? Створіть віртуальну версію себе у
- розваги
- Навколишнє середовище
- істотний
- приклад
- досвід
- дослідження
- дослідити
- Розширення
- стикаються
- особливість
- риси
- Перший
- увагу
- фокусується
- після
- формат
- Вперед
- знайдений
- майбутнє
- Загальне
- породжувати
- породжує
- Глобально
- добре
- корисний
- допомагає
- Високий
- вище
- прокат
- Як
- Однак
- HTTPS
- величезний
- Ідентифікація
- Особистість
- зображення
- здійснювати
- поліпшений
- includes
- У тому числі
- Інклюзивність
- індекс
- промисловість
- вхід
- інтегрувати
- питання
- IT
- сам
- робота
- Джобс
- відомий
- мова
- більше
- вивчення
- рівень
- розташування
- удача
- машина
- навчання за допомогою машини
- підтримувати
- РОБОТИ
- вдалося
- манера
- керівництво
- вручну
- Матерія
- Медіа
- методика
- ML
- модель
- Моделі
- більше
- найбільш
- музика
- навігація
- необхідно
- номер
- номера
- запропонований
- Пропозиції
- відкрити
- варіант
- Опції
- порядок
- організація
- частина
- приватність
- партнер
- партнери
- платформа
- Play
- гравець
- ігри
- Політика
- бідні
- популярний
- це можливо
- попередній перегляд
- ціни без прихованих комісій
- первинний
- процес
- процеси
- виробляти
- Production
- забезпечує
- якість
- досягати
- читання
- залишатися
- вимагається
- Вимога
- ресурси
- результати
- огляд
- шкала
- Масштабування
- Екран
- обслуговування
- Послуги
- установка
- показаний
- простий
- Розмір
- невеликий
- смартфон
- solid
- рішення
- Рішення
- Хтось
- її
- Гучномовець
- динаміки
- конкретно
- standard
- стандартів
- старт
- почалася
- починається
- Статус
- зберігання
- зберігати
- потік
- підтримка
- Підтриманий
- Підтримуючий
- Опори
- Sustainability
- взяття
- команда
- Технології
- Технологія
- телебачення
- Джерело
- отже
- через
- час
- трудомісткий
- назва
- трек
- традиційний
- традиційно
- Навчання
- Переклад
- типово
- створеного
- використання
- користувачі
- використовувати
- значення
- різноманітність
- перевірено
- Відео
- вид
- бачення
- годинник
- Web
- веб-сервіси
- в той час як
- в
- без
- слова
- Work
- лист
- років
- вихід
- YouTube