Pembuatan subtitle pada konten video menimbulkan tantangan tidak peduli seberapa besar atau kecil organisasi tersebut. Untuk menjawab tantangan tersebut, Amazon Transkripsikan memiliki fitur bermanfaat yang memungkinkan pembuatan subtitle langsung di dalam layanan. Tidak ada pembelajaran mesin (ML) atau penulisan kode yang diperlukan untuk memulai. Posting ini memandu Anda melalui pengaturan alur kerja tanpa kode untuk membuat subtitle video menggunakan Amazon Transcribe dalam akun Amazon Web Services Anda.
Subtitel vs. teks tertutup
Istilah sub judul dan keterangan tertutup biasanya digunakan secara bergantian, dan keduanya merujuk pada teks lisan yang ditampilkan di layar. Namun, perbedaan utama antara subtitel dan teks tertutup (berdasarkan definisi industri dan aksesibilitas) adalah teks tertutup berisi transkripsi kata yang diucapkan serta deskripsi musik latar atau suara yang terjadi dalam trek audio untuk pengalaman aksesibilitas yang lebih kaya. . Posting ini hanya berfokus pada pembuatan file subtitle kata lisan yang ditranskripsi menggunakan teknologi pengenalan ucapan otomatis (ASR) yang tidak mengandung identifikasi pembicara, efek suara, atau deskripsi musik. Amazon Transcribe mendukung format SubRip Text (*.srt) dan Web Video Text Tracks (*.vtt) standar industri untuk pembuatan subtitle.
Gambar berikut menunjukkan contoh subtitle yang diaktifkan dalam pemutar video web.
Subtitel menguntungkan pembuat video dengan memperluas jangkauan dan inklusivitas konten video mereka. Dengan menampilkan bagian audio yang diucapkan dari video di layar, subtitle membuat konten audio/video dapat diakses oleh audiens yang lebih besar, termasuk mereka yang bukan penutur bahasa asli dan mereka yang berada di lingkungan di mana suara tidak terdengar.
Meskipun manfaat subtitle jelas, pembuat video secara tradisional menghadapi hambatan dalam pembuatan subtitle. Hambatan muncul karena persyaratan yang memakan waktu dan sumber daya yang intensif dari proses pembuatan tradisional yang sangat bergantung pada upaya manual. Metode subtitling tradisional bersifat manual dan dapat memakan waktu berhari-hari hingga berminggu-minggu, dan oleh karena itu mungkin tidak kompatibel dengan semua jadwal produksi. Demikian juga, banyak perusahaan menggunakan layanan transkripsi manual, tetapi proses ini sering kali tidak berskala dan mahal untuk pemeliharaannya. Amazon Transcribe memudahkan Anda mengonversi ucapan ke teks menggunakan teknologi berbasis ML dan membantu pembuat video mengatasi masalah ini.
Ikhtisar solusi
Posting ini berjalan melalui alur kerja tanpa kode untuk menghasilkan subtitle menggunakan Layanan Penyimpanan Sederhana Amazon (Amazon S3) dan Amazon Transcribe.
Amazon S3 adalah penyimpanan objek yang dibuat untuk menyimpan dan mengambil data dalam jumlah berapa pun dari mana saja. Posting ini berjalan melalui proses untuk buat ember S3 dan mengunggah file audio. Saat pengguna menyimpan data di Amazon S3, mereka bekerja dengan sumber daya yang dikenal sebagai bucket dan objek. A ember adalah wadah untuk benda-benda. Sebuah obyek adalah file dan metadata apa pun yang menjelaskan file itu.
Amazon Transcribe adalah layanan ASR yang menggunakan model ML yang terkelola sepenuhnya dan terus dilatih untuk mengonversi file audio/video menjadi teks. Input dan output Amazon Transcribe disimpan di Amazon S3. Amazon Transcribe mengambil data audio, baik file media di bucket Amazon S3 atau aliran media, dan mengonversinya menjadi data teks. Amazon Transcribe memungkinkan Anda menyerap input audio, menghasilkan transkrip yang mudah dibaca dengan tingkat akurasi yang tinggi, menyesuaikan output Anda untuk kosakata khusus domain menggunakan model bahasa kustom (CLM) dan kosakata khusus, dan filter konten untuk memastikan privasi pelanggan. Pelanggan dapat memilih untuk menggunakan Amazon Transcribe untuk berbagai aplikasi bisnis, termasuk transkripsi panggilan layanan pelanggan berbasis suara, pembuatan subtitle pada konten audio/video, dan melakukan analisis isi (berbasis teks) pada konten audio/video. Untuk postingan ini, kami mendemonstrasikan pembuatan tugas transkripsi dan meninjau keluaran tugas.
Jika Anda lebih suka panduan video, lihat episode makanan ringan video Amazon Transcribe Membuat subtitle video tanpa menulis kode apa pun.
Prasyarat
Untuk menelusuri solusi, Anda harus memiliki prasyarat berikut:
- An Akun AWS dengan cukup Identitas AWS dan Manajemen Akses (IAM) hak istimewa pengguna
- File audio/video dengan kata-kata yang diucapkan dalam file Bahasa yang didukung Amazon Transkripsi dan dalam format masukan yang didukung
Jika Anda belum memiliki sampel file audio/video, Anda dapat membuatnya menggunakan aplikasi perekaman video di komputer atau smartphone Anda. Pastikan Anda berbicara dengan jelas ke mikrofon untuk memastikan tingkat kualitas transkripsi tertinggi saat merekam. Pilihan lain adalah menemukan unduhan yang tersedia secara gratis yang menampilkan kata yang diucapkan, seperti podcast, atau panduan video yang disediakan di posting ini, yang dapat diserap oleh Amazon Transcribe. File yang direkam atau diunduh harus dapat diakses di desktop Anda untuk diunggah ke akun AWS Anda.
Sebelum Anda memulai, tinjau Amazon Transkripsikan dan Amazon S3 halaman harga untuk harga layanan.
Buat ember S3
Untuk posting ini, kami membuat dua ember S3 untuk memisahkan input dan output.
- Pada konsol Amazon S3, pilih Buat ember.
- Beri setiap ember nama yang unik secara global.
- Gunakan pengaturan default untuk memastikan kepatuhan dengan kebijakan organisasi Anda.
- Aktifkan versi ember dan enkripsi sisi server default (disarankan).
- Pilih Buat ember.
Tangkapan layar berikut menunjukkan konfigurasi untuk ember masukan.
Bucket S3 untuk input sekarang siap untuk mengupload file audio/video. Pada saat publikasi ini, ukuran input maksimum untuk Amazon Transcribe adalah 2 GB. Jika file video melebihi jumlah tersebut atau dalam format yang tidak didukung secara asli oleh Amazon Transcribe, pertimbangkan untuk menggunakan Konversi Media Elemen AWS untuk buat output audio saja. Ini bermanfaat karena file audio biasanya jauh lebih kecil daripada file video dan Amazon Transcribe hanya memerlukan trek audio, dan bukan trek video, untuk menghasilkan transkripsi dan subtitle.
Unggah file sumber ke ember S3
Untuk mengunggah file sumber Anda, selesaikan langkah-langkah berikut:
- Di konsol Amazon S3, pilih keranjang input Anda.
- Pilih Unggah.
- Pilih file dari desktop Anda.
- Terima kelas penyimpanan default dan pengaturan enkripsi atau ubah berdasarkan kebijakan organisasi Anda.
- Pilih Unggah.
Buat tugas transkripsi
Dengan file input yang siap di Amazon S3, sekarang kami membuat tugas transkripsi di Amazon Transcribe.
- pada Konsol Amazon Transcribe, pilih Pekerjaan transkripsi di panel navigasi.
- Pilih Ciptakan pekerjaan.
Panduan ini sebagian besar menggunakan opsi default; namun, Anda harus memilih konfigurasi yang paling sesuai dengan persyaratan organisasi Anda.
- Untuk Nama, masukkan nama untuk pekerjaan ini dan file yang dihasilkan.
- Untuk Pengaturan bahasa, pilih bahasa tertentu.
- Untuk Bahasa, pilih bahasa sumber file input.
- Untuk Tipe modelPilih Model umum.
Kami menggunakan model umum untuk demo ini, tetapi kami mendorong Anda untuk menjelajahi pelatihan dan penggunaan model bahasa kustom untuk meningkatkan akurasi untuk kasus penggunaan tertentu seperti istilah atau akronim khusus industri. Untuk mempelajari lebih dalam tentang model bahasa khusus, tonton video snack Amazon Transcribe Menggunakan Model Bahasa Kustom (CLM) untuk meningkatkan akurasi transkripsi.
- Untuk Masukkan lokasi file di S3, pilih Jelajahi S3.
- Pilih bucket input dan file audio/video yang akan ditranskripsi.
- Untuk Keluarkan info tipe lokasi data, pilih Bucket S3 yang ditentukan pelanggan.
- Untuk Tujuan file keluaran pada S3, pilih Jelajahi S3.
- Pilih keranjang keluaran yang baru dibuat.
Grafik Format file subtitle section menyediakan dua opsi paling penting dari keseluruhan postingan ini. Anda dapat memilih output berformat *.srt dan *.vtt sebagai bagian dari tugas transkripsi Amazon Transcribe. Pada saat penulisan ini, memilih salah satu atau keduanya tidak menambahkan biaya tambahan apa pun ke pekerjaan Amazon Transcribe.
Nilai ini mengacu pada nomor awal dari subjudul pertama secara berurutan. Jika Anda tidak yakin nilai mana yang harus dipilih, 1 adalah yang paling umum.
- Saat pengaturan sudah ada, pilih Selanjutnya.
- Konfigurasikan pengaturan opsional apa pun sesuai kebutuhan Anda.
Amazon Transcribe menyajikan opsi untuk identifikasi audio untuk saluran or speaker, hasil alternatif, redaksi PII, penyaringan kosakata, dan kosakata khusus. Untuk posting khusus ini, Anda dapat melewati opsi konfigurasi ini. Untuk mempelajari lebih dalam opsi konfigurasi pekerjaan, tonton episode snack video Amazon Transcribe untuk kosakata khusus, model bahasa kustom, dan penyaringan kosakata.
Tinjau hasil pekerjaan
Pekerjaan transkripsi untuk membuat subtitle video Anda dimulai. Status pekerjaan, seperti yang ditunjukkan pada tangkapan layar berikut, ditampilkan di panel detail pekerjaan. Saat pekerjaan selesai, pilih lokasi data output untuk menemukan subtitle yang baru dibuat di bucket S3.
Subtitle diidentifikasi dengan ekstensi *.srt atau *.vtt. Saat Anda memilih objek di ember S3, Anda memiliki opsi untuk mengunduh file.
Karena subtitle ini dalam format teks biasa, editor teks apa pun dapat melihat dan mengedit transkripsi yang dihasilkan. Membandingkan file *.srt dan *.vtt mengungkapkan banyak kesamaan, dengan sedikit perbedaan.
Berikut ini adalah contoh format *.srt:
Berikut adalah contoh format *.vtt:
Angka-angka menunjukkan urutan subtitle ditampilkan. Kode waktu menunjukkan kapan subtitle ditampilkan. Teks adalah teks subtitle itu sendiri.
Setiap perubahan atau revisi sekarang dapat dilakukan langsung di dalam editor teks dan tetap kompatibel saat disimpan dengan ekstensi *.srt atau *.vtt. Anda juga dapat melihat pratinjau perubahan pada platform video itu sendiri, di dalam aplikasi pengeditan video, atau di dalam pemutar video.
VLC adalah pemutar video open-source dan lintas platform populer yang mendukung subtitle *.srt dan *.vtt. Untuk memutar subtitle secara otomatis melalui video dalam VLC, tempatkan video asli dan file subtitle di direktori yang sama dengan nama file yang sama persis sebelum ekstensi file.
Sekarang ketika Anda membuka file video di dalam VLC, file subtitle akan secara otomatis mendeteksi dan memutar ulang di dalam jendela pemutar video.
Membersihkan
Untuk menghindari timbulnya biaya di masa mendatang, kosong dan hapus ember S3 yang digunakan untuk input dan output. Pastikan Anda memiliki semua file yang diperlukan yang disimpan karena ini akan menghapus secara permanen semua objek yang ada di dalam ember. pada Transkripsikan konsol, pilih dan hapus semua pekerjaan yang tidak lagi diperlukan.
Kesimpulan
Anda sekarang telah membuat alur kerja pembuatan subtitel ujung-ke-ujung yang lengkap untuk menambah dan mempercepat proses pembuatan subjudul video Anda, dan semuanya tanpa menulis kode apa pun. Dalam beberapa menit, Anda membuat bucket penyimpanan S3, mengunggah file ke Amazon S3, dan menggunakan Amazon Transcribe untuk pembuatan subtitle. Anda kemudian dapat mengunduh file subtitle *.srt dan *.vtt yang dihasilkan untuk ditinjau, dan mengunggahnya ke platform tujuan.
Alur kerja ini berfokus pada subtitle audio/video yang dibuat menggunakan teknologi pengenalan ucapan otomatis (ASR) di Amazon Transcribe khusus untuk alur kerja video. Alur kerja ini saja bukan pengganti proses teks tertutup berbasis manusia, yang mampu memenuhi standar aksesibilitas yang lebih tinggi, termasuk identifikasi pembicara, efek suara, deskripsi musik, dan tinjauan salin untuk akurasi. Anda dapat menggunakan metode pengeditan teks yang dijelaskan dalam posting ini untuk menambahkan elemen-elemen ini setelah pekerjaan awal Amazon Transcribe selesai. Selanjutnya, untuk pembuatan subtitle berbasis browser yang lebih canggih, pratinjau, dan pengeditan salinan, Anda dapat menjelajahi penerapan Lokalisasi Konten di AWS solusi yang diperiksa oleh AWS Solution Architects dan mencakup: panduan implementasi. Solusi ini menawarkan fitur tambahan seperti pratinjau dalam browser dan pengeditan subtitle, terjemahan subtitle didukung oleh Amazon Terjemahan, dan kemampuan visi komputer yang ditawarkan oleh Rekognisi Amazon.
Jika Anda menikmati demonstrasi kemampuan Amazon Transcribe ini untuk membuat subtitle, pertimbangkan untuk mempelajari lebih dalam fitur dan kemampuan tambahan untuk mempercepat alur kerja audio/video Anda. Untuk detail tambahan dan contoh kode untuk mendukung otomatisasi dan penskalaan pembuatan subtitle, lihat Membuat subtitle video. Semoga berhasil dalam eksplorasi dan pengembangan alur kerja pembuatan subtitle Anda.
tentang Penulis
Jason O'Malley adalah Arsitek Solusi Mitra Senior di AWS yang mendukung mitra yang merancang solusi industri media, komunikasi, dan teknologi. Sebelum bergabung dengan AWS, Jason menghabiskan 13 tahun di industri media dan hiburan di perusahaan-perusahaan termasuk Conan O'Brien's Team Coco, WarnerMedia, dan Media.Monks. Jason memulai karirnya di produksi televisi dan pascaproduksi sebelum membangun beban kerja media di AWS. Ketika Jason tidak menciptakan solusi untuk mitra dan pelanggan, dia dapat ditemukan bertualang bersama istri dan putranya, atau membaca tentang keberlanjutan.
- Coinsmart. Pertukaran Bitcoin dan Crypto Terbaik Eropa.
- Platoblockchain. Intelijen Metaverse Web3. Pengetahuan Diperkuat. AKSES GRATIS.
- CryptoHawk. Radar Altcoin. Uji Coba Gratis.
- Sumber: https://aws.amazon.com/blogs/machine-learning/create-video-subtitles-with-amazon-transcribe-using-this-no-code-workflow/
- "
- 10
- 100
- 7
- Tentang Kami
- mempercepat
- mengakses
- aksesibilitas
- Akun
- Tambahan
- alamat
- maju
- Semua
- sudah
- Amazon
- Amazon Web Services
- jumlah
- Lain
- di manapun
- Aplikasi
- aplikasi
- para penonton
- audio
- secara otomatis
- mengotomatisasi
- tersedia
- AWS
- latar belakang
- manfaat
- Manfaat
- TERBAIK
- batas
- Bangunan
- bisnis
- Aplikasi Bisnis
- kemampuan
- keterangan
- Lowongan Kerja
- kasus
- tantangan
- beban
- Pilih
- kelas
- tertutup
- kode
- Umum
- komunikasi
- Perusahaan
- kompleks
- pemenuhan
- komputer
- konfigurasi
- konsul
- Wadah
- Konten
- membuat
- dibuat
- membuat
- penciptaan
- pencipta
- adat
- pelanggan
- Layanan Pelanggan
- pelanggan
- data
- lebih dalam
- mendemonstrasikan
- penggelaran
- dijelaskan
- Desktop
- rincian
- berkembang
- sulit
- langsung
- Tidak
- domain
- Download
- editor
- efek
- usaha
- elemen
- mendorong
- enkripsi
- Enter
- Menghibur
- Lingkungan Hidup
- penting
- contoh
- pengalaman
- eksplorasi
- menyelidiki
- ekstensi
- dihadapi
- Fitur
- Fitur
- Pertama
- terfokus
- berfokus
- berikut
- format
- Depan
- ditemukan
- masa depan
- Umum
- menghasilkan
- menghasilkan
- Secara global
- baik
- bermanfaat
- membantu
- High
- lebih tinggi
- menyewa
- Seterpercayaapakah Olymp Trade? Kesimpulan
- Namun
- HTTPS
- besar
- Identifikasi
- identitas
- gambar
- melaksanakan
- ditingkatkan
- termasuk
- Termasuk
- Inklusivitas
- indeks
- industri
- memasukkan
- mengintegrasikan
- masalah
- IT
- Diri
- Pekerjaan
- Jobs
- dikenal
- bahasa
- lebih besar
- pengetahuan
- Tingkat
- tempat
- keberuntungan
- mesin
- Mesin belajar
- memelihara
- MEMBUAT
- berhasil
- cara
- panduan
- manual
- hal
- Media
- metode
- ML
- model
- model
- lebih
- paling
- musik
- Navigasi
- perlu
- jumlah
- nomor
- ditawarkan
- Penawaran
- Buka
- pilihan
- Opsi
- urutan
- organisasi
- bagian
- tertentu
- pasangan
- rekan
- Platform
- Bermain
- pemain
- bermain
- Kebijakan
- miskin
- Populer
- mungkin
- Preview
- di harga
- primer
- proses
- proses
- menghasilkan
- Produksi
- menyediakan
- kualitas
- mencapai
- Bacaan
- tinggal
- wajib
- Persyaratan
- Sumber
- Hasil
- ulasan
- Skala
- skala
- Layar
- layanan
- Layanan
- pengaturan
- ditunjukkan
- Sederhana
- Ukuran
- kecil
- smartphone
- padat
- larutan
- Solusi
- Seseorang
- putra
- Pembicara
- speaker
- Secara khusus
- standar
- standar
- awal
- mulai
- dimulai
- Status
- penyimpanan
- menyimpan
- aliran
- mendukung
- Didukung
- pendukung
- Mendukung
- Keberlanjutan
- pengambilan
- tim
- Teknologi
- Teknologi
- televisi
- Sumber
- karena itu
- Melalui
- waktu
- membuang-buang waktu
- Judul
- jalur
- tradisional
- secara tradisional
- Pelatihan
- Terjemahan
- khas
- unik
- menggunakan
- Pengguna
- Penggunaan
- nilai
- variasi
- diperiksa
- Video
- View
- penglihatan
- Menonton
- jaringan
- layanan web
- sementara
- dalam
- tanpa
- kata
- Kerja
- penulisan
- tahun
- Menghasilkan
- Youtube