ایجاد زیرنویس در محتوای ویدیویی بدون توجه به اینکه سازمان چقدر بزرگ یا کوچک است، چالشهایی را ایجاد میکند. برای رسیدگی به این چالش ها، آمازون رونوشت دارای یک ویژگی مفید است که ایجاد زیرنویس را مستقیماً در داخل سرویس امکان پذیر می کند. برای شروع نیازی به یادگیری ماشینی (ML) یا کدنویسی نیست. این پست شما را در راهاندازی یک گردش کار بدون کد برای ایجاد زیرنویسهای ویدیویی با استفاده از رونویسی آمازون در حساب خدمات وب آمازون خود راهنمایی میکند.
زیرنویس در مقابل زیرنویسهای بسته
شرایط زیرنویس و یادداشت های بسته معمولاً به جای یکدیگر استفاده می شوند و هر دو به متن گفتاری نمایش داده شده روی صفحه اشاره دارند. با این حال، تفاوت اصلی بین زیرنویسها و زیرنویسها (براساس تعاریف صنعت و دسترسپذیری) این است که زیرنویسهای بسته شامل رونویسی کلمه گفتاری و همچنین توصیفی از موسیقی پسزمینه یا صداهایی هستند که در آهنگ صوتی برای یک تجربه دسترسی غنیتر رخ میدهند. . این پست فقط بر ایجاد فایلهای زیرنویس کلمه گفتاری رونویسی شده با استفاده از فناوری تشخیص خودکار گفتار (ASR) تمرکز دارد که حاوی شناسایی بلندگو، جلوههای صوتی یا توضیحات موسیقی نیست. Amazon Transcript از فرمت های استاندارد صنعتی SubRip Text (*.srt) و Web Video Text Tracks (*.vtt) پشتیبانی می کند. ایجاد زیرنویس.
تصویر زیر نمونهای از زیرنویسهایی را نشان میدهد که در یک پخشکننده ویدیوی وب فعال شدهاند.
زیرنویسها با افزایش دسترسی و فراگیری محتوای ویدیویی برای سازندگان ویدیو مفید هستند. با نمایش بخش صوتی گفتاری یک ویدیو بر روی صفحه، زیرنویسها محتوای صوتی/تصویری را برای مخاطبان بزرگتری از جمله مخاطبانی که به زبان مادری صحبت نمیکنند و آنهایی که در محیطی هستند که صدا غیرقابل شنیدن است، در دسترس قرار میدهند.
اگرچه مزایای زیرنویس واضح است، سازندگان ویدیو به طور سنتی با موانعی در ایجاد زیرنویس مواجه بوده اند. موانع به دلیل زمان بر بودن و نیازهای منابع فشرده فرآیند ایجاد سنتی که به شدت به تلاش دستی متکی است، به وجود می آیند. روشهای سنتی زیرنویس دستی هستند و ممکن است روزها تا هفتهها طول بکشد تا تکمیل شود، بنابراین ممکن است با همه برنامههای تولید سازگار نباشد. به همین ترتیب، بسیاری از شرکتها از خدمات رونویسی دستی استفاده میکنند، اما این فرآیندها اغلب مقیاسپذیر نیستند و نگهداری آنها پرهزینه است. Amazon Transcript تبدیل گفتار به متن را با استفاده از فناوریهای مبتنی بر ML برای شما آسان میکند و به سازندگان ویدیو کمک میکند تا این مشکلات را برطرف کنند.
بررسی اجمالی راه حل
این پست از طریق یک گردش کار بدون کد برای تولید زیرنویس با استفاده از آن می گذرد سرویس ذخیره سازی ساده آمازون (Amazon S3) و Amazon Transcript.
آمازون S3 یک ذخیرهسازی شی است که برای ذخیره و بازیابی هر مقدار داده از هر کجا ساخته شده است. این پست از طریق روند به یک سطل S3 ایجاد کنید و یک فایل صوتی آپلود کنید. هنگامی که کاربران داده ها را در آمازون S3 ذخیره می کنند، با منابعی به نام سطل و اشیا کار می کنند. آ سطل ظرفی برای اشیا است. یک هدف یک فایل و هر ابرداده ای است که آن فایل را توصیف می کند.
Amazon Transcribe یک سرویس ASR است که از مدل های ML کاملاً مدیریت شده و آموزش دیده برای تبدیل فایل های صوتی/تصویری به متن استفاده می کند. ورودی ها و خروجی های آمازون رونویسی در آمازون S3 ذخیره می شوند. Amazon Transcript داده های صوتی را می گیرد، یا یک فایل رسانه ای در سطل آمازون S3 یا یک جریان رسانه، و آن را به داده های متنی تبدیل می کند. Amazon Transcript به شما امکان می دهد ورودی صوتی را دریافت کنید، رونوشت های خوانا را با درجه بالایی از دقت تولید کنید، خروجی خود را برای واژگان خاص دامنه سفارشی کنید. مدل های زبان سفارشی (CLM) و واژگان سفارشیو برای اطمینان از حفظ حریم خصوصی مشتری، محتوا را فیلتر کنید. مشتریان می توانند برای انواع برنامه های تجاری، از جمله، استفاده از Amazon Transcript را انتخاب کنند رونویسی تماس های خدمات مشتری مبتنی بر صدا, تولید زیرنویس در محتوای صوتی/تصویریو انجام تحلیل محتوا (مبتنی بر متن). در مورد محتوای صوتی/تصویری برای این پست، ایجاد یک کار رونویسی و بررسی خروجی کار را نشان میدهیم.
اگر ترجیح می دهید یک راهنما ویدیویی داشته باشید، به قسمت تنقلات ویدیویی Amazon Transcribe مراجعه کنید ایجاد زیرنویس ویدیو بدون نوشتن کد.
پیش نیازها
برای گذراندن راه حل، باید پیش نیازهای زیر را داشته باشید:
- An حساب AWS با کافی هویت AWS و مدیریت دسترسی (IAM) امتیازات کاربر
- یک فایل صوتی/تصویری با کلمات گفتاری در یک زبان پشتیبانی شده از رونویسی آمازون و در یک فرمت ورودی پشتیبانی شده
اگر قبلاً یک نمونه فایل صوتی/تصویری ندارید، میتوانید با استفاده از یک برنامه ضبط ویدیو در رایانه یا تلفن هوشمند خود، آن را ایجاد کنید. مطمئن شوید که به وضوح با میکروفون صحبت می کنید تا از بالاترین سطح کیفیت رونویسی هنگام ضبط اطمینان حاصل کنید. گزینه دیگر یافتن یک دانلود رایگان در دسترس است که حاوی کلمه گفتاری باشد، مانند پادکست، یا راهنمای تصویری ارائه شده در این پست، که می تواند توسط Amazon Transcript بلعیده شود. فایل ضبط شده یا دانلود شده باید روی دسکتاپ شما برای آپلود در حساب AWS شما قابل دسترسی باشد.
قبل از شروع، بررسی کنید آمازون رونوشت و آمازون S3 صفحات قیمت گذاری برای قیمت گذاری خدمات
سطل های S3 را ایجاد کنید
برای این پست، دو سطل S3 ایجاد می کنیم تا ورودی و خروجی از هم جدا باشند.
- در کنسول آمازون S3، را انتخاب کنید سطل ایجاد کنید.
- به هر سطل یک نام منحصر به فرد جهانی بدهید.
- از تنظیمات پیش فرض برای اطمینان از مطابقت با سیاست های سازمان خود استفاده کنید.
- فعال نسخه سطلی و رمزگذاری پیش فرض سمت سرور (توصیه شده).
- را انتخاب کنید سطل ایجاد کنید.
تصویر زیر پیکربندی سطل ورودی را نشان می دهد.
سطل S3 برای ورودی اکنون برای آپلود فایل صوتی/تصویری آماده است. در زمان این انتشار، حداکثر اندازه ورودی آمازون رونویسی 2 گیگابایت است. اگر فایل ویدیویی از آن مقدار بیشتر باشد یا در یک قالبی که به صورت بومی توسط Amazon Transcript پشتیبانی نمی شود، استفاده را در نظر بگیرید AWS Elemental MediaConvert به یک خروجی فقط صدا ایجاد کنید. این مفید است زیرا فایلهای صوتی معمولاً بسیار کوچکتر از فایلهای ویدیویی هستند و Amazon Transcript برای تولید رونویسی و زیرنویس فقط به آهنگ صوتی و نه آهنگ ویدیویی نیاز دارد.
فایل منبع را در سطل S3 آپلود کنید
برای آپلود فایل منبع خود، مراحل زیر را انجام دهید:
- در کنسول آمازون S3، سطل ورودی خود را انتخاب کنید.
- را انتخاب کنید بارگذاری.
- فایل را از دسکتاپ خود انتخاب کنید.
- کلاس ذخیره سازی پیش فرض و تنظیمات رمزگذاری را بپذیرید یا آنها را بر اساس خط مشی های سازمان خود تغییر دهید.
- را انتخاب کنید بارگذاری.
یک کار رونویسی ایجاد کنید
با آماده بودن فایل ورودی در آمازون S3، اکنون یک کار رونویسی در آمازون رونویسی ایجاد می کنیم.
- بر کنسول آمازون رونویسی، انتخاب کنید مشاغل رونویسی در صفحه ناوبری
- را انتخاب کنید ایجاد شغل.
این راهنما تا حد زیادی از گزینه های پیش فرض استفاده می کند. با این حال، باید پیکربندی را انتخاب کنید که به بهترین وجه برای نیازهای سازمان شما مناسب است.
- برای نام، یک نام برای این کار و فایل حاصل وارد کنید.
- برای تنظیمات زبان، انتخاب کنید زبان خاص.
- برای زبان، زبان مبدأ فایل ورودی را انتخاب کنید.
- برای نوع مدلانتخاب کنید مدل کلی.
ما از مدل کلی برای این نسخه ی نمایشی استفاده می کنیم، اما شما را تشویق می کنیم که آموزش و استفاده را بررسی کنید مدل های زبان سفارشی برای دقت بهبود یافته برای موارد استفاده خاص مانند اصطلاحات یا کلمات اختصاری خاص صنعت. برای بررسی عمیقتر مدلهای زبان سفارشی، اسنک ویدیویی Amazon Transcribe را تماشا کنید استفاده از مدلهای زبان سفارشی (CLM) برای افزایش دقت رونویسی.
- برای محل فایل ورودی را در S3 وارد کنید، انتخاب کنید S3 را مرور کنید.
- سطل ورودی و فایل صوتی/تصویری را برای رونویسی انتخاب کنید.
- برای اطلاعات نوع مکان داده خروجی، انتخاب کنید سطل S3 مشخص شده توسط مشتری.
- برای مقصد فایل خروجی در S3، انتخاب کنید S3 را مرور کنید.
- سطل خروجی جدید ایجاد شده را انتخاب کنید.
La فرمت فایل زیرنویس بخش دو گزینه ضروری از کل این پست را ارائه می دهد. میتوانید خروجیهای فرمتشده *.srt و *.vtt را به عنوان بخشی از کار رونویسی Amazon Transcript انتخاب کنید. در زمان نگارش این مقاله، انتخاب یک یا هر دو هیچ هزینه اضافی به کار Amazon Transcript اضافه نمی کند.
این مقدار به شماره شروع اولین زیرنویس به ترتیب اشاره دارد. اگر مطمئن نیستید که کدام مقدار را انتخاب کنید، 1 رایج ترین است
- وقتی تنظیمات در جای خود هستند، انتخاب کنید بعدی.
- هر گونه تنظیمات اختیاری را بر اساس نیاز خود پیکربندی کنید.
آمازون رونویسی گزینههایی را برای شناسایی صوتی ارائه میدهد کانال or سخنرانان, نتایج جایگزین, ویرایش PII, فیلتر کردن واژگانو واژگان سفارشی. برای این پست خاص، می توانید از این گزینه های پیکربندی صرف نظر کنید. برای بررسی عمیقتر گزینههای پیکربندی شغل، قسمتهای اسنک ویدئویی Amazon Transcribe را تماشا کنید. واژگان سفارشی, مدل های زبان سفارشیو فیلتر کردن واژگان.
خروجی کار را مرور کنید
کار رونویسی برای ایجاد زیرنویس ویدیوی شما شروع می شود. وضعیت کار، همانطور که در تصویر زیر نشان داده شده است، در پانل جزئیات کار نمایش داده می شود. وقتی کار کامل شد، مکان داده های خروجی را انتخاب کنید تا زیرنویس های جدید ایجاد شده را در سطل S3 قرار دهید.
زیرنویس ها با پسوندهای *.srt یا *.vtt شناسایی می شوند. هنگامی که شیء موجود در سطل S3 را انتخاب می کنید، می توانید فایل را دانلود کنید.
از آنجایی که این زیرنویس ها در قالب متن ساده هستند، هر ویرایشگر متنی می تواند رونویسی حاصل را مشاهده و ویرایش کند. مقایسه فایل های *.srt و *.vtt شباهت های زیادی را با تفاوت های ظریف نشان می دهد.
شکل زیر نمونه ای از فرمت *.srt است:
شکل زیر نمونه ای از فرمت *.vtt است:
اعداد نشان دهنده ترتیب نمایش زیرنویس هستند. کد زمانی نشان می دهد که چه زمانی زیرنویس نمایش داده می شود. متن خود متن زیرنویس است.
هر گونه تغییر یا تجدید نظر اکنون مستقیماً در ویرایشگر متن امکان پذیر است و در صورت ذخیره با پسوند *.srt یا *.vtt سازگار باقی می ماند. همچنین میتوانید تغییرات را در خود پلتفرم ویدیو، داخل یک برنامه ویرایش ویدیو، یا در یک پخشکننده ویدیو پیشنمایش کنید.
VLC یک پخش کننده ویدیوی منبع باز و کراس پلتفرم محبوب است که از زیرنویس های *.srt و *.vtt پشتیبانی می کند. برای پخش خودکار زیرنویسها روی یک ویدیو در VLC، هم ویدیوی اصلی و هم فایل زیرنویس را قبل از پسوند فایل در یک فهرست با همان نام فایل قرار دهید.
اکنون وقتی فایل ویدیویی را در VLC باز میکنید، فایل زیرنویس باید بهطور خودکار در پنجره پخشکننده ویدیو شناسایی و پخش شود.
پاک کردن
برای جلوگیری از تحمیل هزینه های آتی، خالی و حذف کردن سطل های S3 برای ورودی و خروجی استفاده می شود. مطمئن شوید که همه فایلهای لازم را ذخیره کردهاید، زیرا با این کار تمام اشیاء موجود در سطلها برای همیشه حذف میشوند. در رونویسی کنسول، هر شغلی که دیگر مورد نیاز نیست را انتخاب و حذف کنید.
نتیجه
شما اکنون یک گردش کار کامل برای ایجاد زیرنویس انتها به انتها برای تقویت و تسریع فرآیند ایجاد زیرنویس ویدیوی خود ایجاد کردهاید، و همه اینها بدون نوشتن هیچ کدی. در چند دقیقه، سطل های ذخیره سازی S3 ایجاد کردید، یک فایل را در آمازون S3 آپلود کردید و از رونویسی آمازون برای ایجاد زیرنویس استفاده کردید. سپس میتوانید فایلهای زیرنویس *.srt و *.vtt را برای بررسی دانلود کرده و در پلتفرم مقصد آپلود کنید.
این گردش کار بر روی زیرنویسهای صوتی/تصویری ایجاد شده با استفاده از فناوری تشخیص خودکار گفتار (ASR) در Amazon Transcript بهویژه برای گردشهای کاری ویدیویی تمرکز دارد. این گردش کار به تنهایی جایگزینی برای فرآیند زیرنویس بسته مبتنی بر انسان نیست، که میتواند استانداردهای بالاتری را برای دسترسی داشته باشد، از جمله شناسایی بلندگو، جلوههای صوتی، توضیحات موسیقی، و بررسی کپیبرداری برای دقت. شما می توانید از روش ویرایش متنی که در این پست توضیح داده شده است برای اضافه کردن این عناصر پس از تکمیل کار اولیه Amazon Transcript استفاده کنید. علاوه بر این، برای ایجاد پیشرفتهتر، پیشنمایش و ویرایش زیرنویس مبتنی بر مرورگر، میتوانید استقرار زیرنویس را بررسی کنید. محلی سازی محتوا در AWS راه حلی که توسط AWS Solution Architects بررسی شده و شامل یک راهنمای اجرا. این راه حل ویژگی های اضافی مانند پیش نمایش و ویرایش زیرنویس ها در مرورگر، ترجمه زیرنویس توسط ترجمه آمازون، و قابلیت های بینایی کامپیوتری ارائه شده توسط شناسایی آمازون.
اگر از نمایش قابلیت Amazon Transcript برای ایجاد زیرنویس لذت بردید، به بررسی عمیقتر ویژگیها و قابلیتهای اضافی برای سرعت بخشیدن به گردشهای کاری صوتی/تصویری خود فکر کنید. برای جزئیات بیشتر و نمونههای کد برای پشتیبانی از خودکارسازی و مقیاسبندی ایجاد زیرنویس، مراجعه کنید ساخت زیرنویس ویدیو. در کاوش و توسعه گردش کار ایجاد زیرنویس خود موفق باشید.
درباره نویسنده
جیسون اومالی یک معمار راه حل شریک در AWS است که از شرکای پشتیبانی می کند که راه حل های صنعت رسانه، ارتباطات و فناوری را طراحی می کند. قبل از پیوستن به AWS، جیسون 13 سال در صنعت رسانه و سرگرمی در شرکت هایی از جمله تیم کوکو، وارنر مدیا و مدیا مونکز کانن اوبراین گذراند. جیسون قبل از ایجاد حجم کاری رسانه ای در AWS، کار خود را در تولید تلویزیون و پس از تولید آغاز کرد. وقتی جیسون برای شرکا و مشتریان راهحلهایی ایجاد نمیکند، میتوان او را در حال ماجراجویی با همسر و پسرش یا خواندن در مورد پایداری یافت.
- "
- 10
- 100
- 7
- درباره ما
- شتاب دادن
- دسترسی
- دسترسی
- حساب
- اضافی
- نشانی
- پیشرفته
- معرفی
- قبلا
- آمازون
- آمازون خدمات وب
- مقدار
- دیگر
- هر جا
- کاربرد
- برنامه های کاربردی
- حضار
- سمعی
- اتوماتیک
- اتوماسیون
- در دسترس
- AWS
- زمینه
- سود
- مزایای
- بهترین
- مرز
- بنا
- کسب و کار
- برنامه های تجاری
- قابلیت های
- نوشتن شرح تصاویر و
- کاریابی
- موارد
- چالش ها
- بار
- را انتخاب کنید
- کلاس
- بسته
- رمز
- مشترک
- ارتباطات
- شرکت
- پیچیده
- انطباق
- کامپیوتر
- پیکر بندی
- کنسول
- ظرف
- محتوا
- ایجاد
- ایجاد شده
- ایجاد
- ایجاد
- سازندگان
- سفارشی
- مشتری
- خدمات مشتری
- مشتریان
- داده ها
- عمیق تر
- نشان دادن
- استقرار
- شرح داده شده
- دسکتاپ
- جزئیات
- در حال توسعه
- مشکل
- مستقیما
- نمی کند
- دامنه
- دانلود
- سردبیر
- اثرات
- تلاش
- عناصر
- تشویق
- رمزگذاری
- وارد
- سرگرمی
- محیط
- ضروری است
- مثال
- تجربه
- اکتشاف
- اکتشاف
- ضمیمهها
- در مواجهه
- ویژگی
- امکانات
- نام خانوادگی
- متمرکز شده است
- تمرکز
- پیروی
- قالب
- به جلو
- یافت
- آینده
- سوالات عمومی
- تولید می کنند
- مولد
- در سطح جهانی
- خوب
- مفید
- کمک می کند
- زیاد
- بالاتر
- استخدام
- چگونه
- اما
- HTTPS
- بزرگ
- شناسایی
- هویت
- تصویر
- انجام
- بهبود یافته
- شامل
- از جمله
- فراگیری
- شاخص
- صنعت
- ورودی
- ادغام
- مسائل
- IT
- خود
- کار
- شغل ها
- شناخته شده
- زبان
- بزرگتر
- یادگیری
- سطح
- محل
- شانس
- دستگاه
- فراگیری ماشین
- حفظ
- باعث می شود
- اداره می شود
- روش
- کتابچه راهنمای
- دستی
- ماده
- رسانه ها
- روش
- ML
- مدل
- مدل
- بیش
- اکثر
- موسیقی
- جهت یابی
- لازم
- عدد
- تعداد
- ارائه شده
- پیشنهادات
- باز کن
- گزینه
- گزینه
- سفارش
- کدام سازمان ها
- بخش
- ویژه
- شریک
- شرکای
- سکو
- بازی
- بازیکن
- بازی
- سیاست
- فقیر
- محبوب
- ممکن
- پیش نمایش
- قیمت گذاری
- اصلی
- روند
- فرآیندهای
- تولید کردن
- تولید
- فراهم می کند
- کیفیت
- رسیدن به
- مطالعه
- ماندن
- ضروری
- مورد نیاز
- منابع
- نتایج
- این فایل نقد می نویسید:
- مقیاس
- مقیاس گذاری
- پرده
- سرویس
- خدمات
- محیط
- نشان داده شده
- ساده
- اندازه
- کوچک
- گوشی های هوشمند
- جامد
- راه حل
- مزایا
- کسی
- آن
- گوینده
- سخنرانان
- به طور خاص
- استاندارد
- استانداردهای
- شروع
- آغاز شده
- شروع می شود
- وضعیت
- ذخیره سازی
- opbevare
- جریان
- پشتیبانی
- پشتیبانی
- حمایت از
- پشتیبانی از
- پایداری
- مصرف
- تیم
- فن آوری
- پیشرفته
- تلویزیون
- منبع
- از این رو
- از طریق
- زمان
- زمان بر
- عنوان
- مسیر
- سنتی
- به طور سنتی
- آموزش
- ترجمه
- به طور معمول
- منحصر به فرد
- استفاده کنید
- کاربران
- استفاده کنید
- ارزش
- تنوع
- بررسی شده
- تصویری
- چشم انداز
- دید
- تماشا کردن
- وب
- خدمات وب
- در حین
- در داخل
- بدون
- کلمات
- مهاجرت کاری
- نوشته
- سال
- بازده
- یوتیوب