يفرض إنشاء الترجمة على محتوى الفيديو تحديات بغض النظر عن حجم المؤسسة الكبيرة أو الصغيرة. لمواجهة تلك التحديات ، الأمازون النسخ لديه ميزة مفيدة تمكن من إنشاء الترجمة مباشرة داخل الخدمة. لا يلزم تعلم الآلة (ML) أو كتابة التعليمات البرمجية للبدء. يرشدك هذا المنشور من خلال إعداد سير عمل بدون رمز لإنشاء ترجمات فيديو باستخدام Amazon Transcribe داخل حساب Amazon Web Services الخاص بك.
الترجمة مقابل الترجمة والشرح
الشروط عناوين فرعية و تسميات توضيحية مغلقة يشيع استخدامها بالتبادل ، ويشير كلاهما إلى النص المنطوق المعروض على الشاشة. ومع ذلك ، فإن الاختلاف الأساسي بين الترجمة والتعليقات التوضيحية المغلقة (استنادًا إلى تعريفات الصناعة وإمكانية الوصول) هو أن التسميات التوضيحية المغلقة تحتوي على نسخ للكلمة المنطوقة بالإضافة إلى وصف لموسيقى الخلفية أو الأصوات التي تحدث داخل المسار الصوتي للحصول على تجربة وصول أكثر ثراءً . يركز هذا المنشور فقط على إنشاء ملفات ترجمة للكلمات المنطوقة المكتوبة باستخدام تقنية التعرف التلقائي على الكلام (ASR) التي لا تحتوي على تعريف مكبر الصوت أو المؤثرات الصوتية أو أوصاف الموسيقى. تدعم Amazon Transcribe تنسيقات SubRip Text (* .srt) القياسية الصناعية وتنسيقات Web Video Text Tracks (* .vtt) لـ إنشاء الترجمة.
تُظهر الصورة التالية مثالاً على الترجمات التي تم تبديلها داخل مشغل فيديو الويب.
تستفيد الترجمات من منشئي الفيديو من خلال توسيع نطاق وصول محتوى الفيديو الخاص بهم وشمولهم. من خلال عرض جزء الصوت المنطوق من مقطع فيديو على الشاشة ، تتيح الترجمات المصاحبة الوصول إلى محتوى الصوت / الفيديو إلى جمهور أكبر ، بما في ذلك أولئك الذين يتحدثون لغة غير أصلية وتلك الموجودة في بيئة يكون الصوت فيها غير مسموع.
على الرغم من أن فوائد الترجمة واضحة ، إلا أن منشئو الفيديو يواجهون تقليديًا عقبات في إنشاء الترجمة. تنشأ العقبات بسبب المتطلبات التي تستغرق وقتًا طويلاً وتتطلب موارد مكثفة لعملية الإنشاء التقليدية التي تعتمد بشكل كبير على الجهد اليدوي. تعتبر طرق الترجمة التقليدية يدوية ويمكن أن تستغرق أيامًا إلى أسابيع حتى تكتمل ، وبالتالي قد لا تكون متوافقة مع جميع جداول الإنتاج. وبالمثل ، تستخدم العديد من الشركات خدمات النسخ اليدوي ، لكن هذه العمليات غالبًا لا تتسع وتكلف صيانتها. يجعل Amazon Transcribe من السهل عليك تحويل الكلام إلى نص باستخدام التقنيات المستندة إلى ML ويساعد منشئي الفيديو على معالجة هذه المشكلات.
حل نظرة عامة
يسير هذا المنشور من خلال سير عمل بدون رمز لإنشاء ترجمات باستخدام خدمة تخزين أمازون البسيطة (Amazon S3) و Amazon Transcribe.
Amazon S3 عبارة عن تخزين كائنات مصمم لتخزين واسترداد أي كمية من البيانات من أي مكان. هذا المنشور يسير خلال العملية إلى إنشاء دلو S3 وتحميل ملف صوتي. عندما يقوم المستخدمون بتخزين البيانات في Amazon S3 ، فإنهم يعملون مع الموارد المعروفة باسم الحاويات والكائنات. أ دلو هي حاوية للأشياء. ان موضوع هو ملف وأي بيانات وصفية تصف هذا الملف.
Amazon Transcribe هي خدمة ASR تستخدم نماذج ML مُدارة بالكامل ومُدرَّبة باستمرار لتحويل ملفات الصوت / الفيديو إلى نص. يتم تخزين مدخلات ومخرجات Amazon Transcribe في Amazon S3. يأخذ Amazon Transcribe البيانات الصوتية ، إما ملف وسائط في حاوية Amazon S3 أو تدفق وسائط ، ويحولها إلى بيانات نصية. يتيح لك Amazon Transcribe استيعاب إدخال الصوت ، وإنتاج نصوص سهلة القراءة بدرجة عالية من الدقة ، وتخصيص مخرجاتك لمفردات خاصة بالمجال باستخدام نماذج لغة مخصصة (CLM) و المفردات المخصصةو تصفية المحتوى لضمان خصوصية العميل. يمكن للعملاء اختيار استخدام Amazon Transcribe لمجموعة متنوعة من تطبيقات الأعمال ، بما في ذلك نسخ مكالمات خدمة العملاء الصوتية, توليد ترجمات على محتوى الصوت / الفيديوو إجراء تحليل المحتوى (على أساس النص) على محتوى الصوت / الفيديو. بالنسبة لهذا المنشور ، نوضح إنشاء وظيفة نسخ ومراجعة إخراج الوظيفة.
إذا كنت تفضل مقطع فيديو تفصيليًا ، فارجع إلى حلقة وجبات الفيديو الخفيفة من Amazon Transcribe عمل ترجمات فيديو بدون كتابة أي كود.
المتطلبات الأساسية المسبقة
لتصفح الحل ، يجب أن تكون لديك المتطلبات الأساسية التالية:
- An حساب AWS بما يكفي إدارة الهوية والوصول AWS (IAM) امتيازات المستخدم
- ملف صوتي/فيديو يحتوي على كلمات منطوقة بتنسيق اللغة المدعومة من Amazon Transcribe وفي تنسيق الإدخال المدعوم
إذا لم يكن لديك بالفعل نموذج لملف الصوت / الفيديو ، فيمكنك إنشاء واحد باستخدام تطبيق تسجيل الفيديو على جهاز الكمبيوتر أو الهاتف الذكي. تأكد من أنك تتحدث بوضوح في الميكروفون لضمان أعلى مستوى من جودة النسخ عند التسجيل. خيار آخر هو العثور على تنزيل متاح مجانًا يضم الكلمات المنطوقة ، مثل بودكاستالطرق أو إرشادات الفيديو المتوفرة في هذا المنشور، التي يمكن استيعابها بواسطة Amazon Transcribe. يجب أن يكون الملف المسجل أو الذي تم تنزيله متاحًا على سطح المكتب لتحميله إلى حساب AWS الخاص بك.
قبل أن تبدأ ، راجع ملف الأمازون النسخ و الأمازون S3 صفحات التسعير لتسعير الخدمة.
أنشئ حاويات S3
في هذا المنشور ، قمنا بإنشاء حاويتين S3 للحفاظ على فصل المدخلات والمخرجات.
- في وحدة تحكم Amazon S3 ، اختر إنشاء دلو.
- امنح كل مجموعة اسمًا فريدًا عالميًا.
- استخدم الإعدادات الافتراضية لضمان الامتثال لسياسات مؤسستك.
- تفعيل إصدار دلو و التشفير الافتراضي من جانب الخادم (موصى به).
- اختار إنشاء دلو.
تُظهر لقطة الشاشة التالية التكوين لحاوية الإدخال.
حاوية S3 للإدخال جاهزة الآن لتحميل ملف الصوت / الفيديو. في وقت هذا المنشور ، كان الحد الأقصى لحجم الإدخال لـ Amazon Transcribe هو 2 جيجابايت. إذا تجاوز ملف الفيديو هذا المقدار أو كان بتنسيق تنسيق غير مدعوم أصلاً بواسطة Amazon Transcribe، فكر في استخدام AWS عنصري MediaConvert إلى إنشاء إخراج صوتي فقط. يعد هذا مفيدًا لأن الملفات الصوتية عادةً ما تكون أصغر بكثير من ملفات الفيديو ولا يتطلب Amazon Transcribe سوى المسار الصوتي ، وليس مسار الفيديو ، لإنشاء النسخ والترجمات.
قم بتحميل الملف المصدر إلى حاوية S3
لتحميل ملف المصدر الخاص بك ، أكمل الخطوات التالية:
- في وحدة التحكم Amazon S3 ، حدد حاوية الإدخال الخاصة بك.
- اختار تحميل.
- اختر الملف من سطح المكتب الخاص بك.
- اقبل فئة التخزين الافتراضية وإعدادات التشفير أو قم بتعديلها بناءً على سياسات مؤسستك.
- اختار تحميل.
قم بإنشاء وظيفة نسخ
مع تجهيز ملف الإدخال في Amazon S3 ، نقوم الآن بإنشاء وظيفة نسخ في Amazon Transcribe.
- على وحدة تحكم Amazon Transcribe، اختر وظائف النسخ في جزء التنقل.
- اختار خلق وظيفة.
تستخدم هذه الإرشادات إلى حد كبير الخيارات الافتراضية ؛ ومع ذلك ، يجب عليك اختيار التكوين الأنسب لمتطلبات مؤسستك.
- في حالة الاسم، أدخل اسمًا لهذه الوظيفة والملف الناتج.
- في حالة اعدادات اللغة، حدد لغة محددة.
- في حالة اللغة ، اختر لغة المصدر لملف الإدخال.
- في حالة نوع النموذجتحديد النموذج العام.
نستخدم النموذج العام لهذا العرض التوضيحي ، لكننا نشجعك على استكشاف التدريب والاستخدام نماذج لغة مخصصة لتحسين الدقة في حالات استخدام محددة مثل المصطلحات الخاصة بالصناعة أو الاختصارات. للحصول على مزيد من التعمق في نماذج اللغات المخصصة ، شاهد وجبة فيديو Amazon Transcribe الخفيفة استخدام نماذج اللغة المخصصة (CLM) لزيادة دقة النسخ.
- في حالة موقع ملف الإدخال على S3، اختر تصفح S3.
- اختر حاوية الإدخال وملف الصوت / الفيديو المراد نسخهما.
- في حالة معلومات نوع موقع بيانات الإخراج، حدد حدد العميل دلو S3.
- في حالة وجهة ملف الإخراج على S3، اختر تصفح S3.
- اختر حاوية الإخراج المنشأة حديثًا.
• تنسيق ملف الترجمة يوفر القسم الخيارين الأكثر أهمية لهذا المنشور بأكمله. يمكنك تحديد النواتج المنسقة * .srt و * .vtt كجزء من مهمة النسخ في Amazon Transcribe. في وقت كتابة هذه السطور ، لا يضيف تحديد أحدهما أو كليهما أي تكلفة إضافية لوظيفة Amazon Transcribe.
تشير هذه القيمة إلى رقم البداية للترجمة الأولى في التسلسل. إذا لم تكن متأكدًا من القيمة التي تختارها ، 1 هو الأكثر شيوعا.
- عندما تكون الإعدادات في مكانها ، اختر التالى.
- قم بتكوين أي إعدادات اختيارية حسب احتياجاتك.
يقدم Amazon Transcribe خيارات للتعرف الصوتي لـ قنوات or مكبرات الصوت, نتائج بديلة, تنقيح معلومات التعريف الشخصية, تصفية المفرداتو المفردات المخصصة. بالنسبة إلى هذا المنشور المحدد ، يمكنك تخطي خيارات التكوين هذه. للحصول على مزيد من التعمق في خيارات تكوين الوظائف ، شاهد حلقات فيديو Amazon Transcribe الخاصة بالوجبات الخفيفة المفردات المخصصة, نماذج لغة مخصصةو تصفية المفردات.
راجع إخراج الوظيفة
تبدأ مهمة النسخ لإنشاء ترجمات الفيديو الخاصة بك. يتم عرض حالة الوظيفة ، كما هو موضح في لقطة الشاشة التالية ، في لوحة تفاصيل الوظيفة. عند اكتمال المهمة ، اختر موقع بيانات الإخراج لتحديد الترجمة التي تم إنشاؤها حديثًا في حاوية S3.
يتم تحديد الترجمات بواسطة الامتدادات * .srt أو * .vtt. عند تحديد الكائن في حاوية S3 ، يكون لديك خيار تنزيل الملف.
نظرًا لأن هذه الترجمة بتنسيق نص عادي ، يمكن لأي محرر نصوص عرض النسخ الناتجة وتحريرها. تكشف مقارنة ملفات * .srt و * .vtt عن العديد من أوجه التشابه ، مع وجود اختلافات طفيفة.
فيما يلي مثال على تنسيق * .srt:
فيما يلي مثال على تنسيق * .vtt:
تشير الأرقام إلى ترتيب عرض الترجمة. يشير الرمز الزمني إلى وقت عرض الترجمة. النص هو نص الترجمة نفسه.
أي تغييرات أو مراجعات ممكنة الآن مباشرة داخل محرر النصوص وتظل متوافقة عند حفظها بامتداد * .srt أو * .vtt. يمكنك أيضًا معاينة التغييرات على نظام الفيديو الأساسي نفسه ، أو داخل تطبيق تحرير الفيديو ، أو داخل مشغل الفيديو.
VLC هو مشغل فيديو مشهور مفتوح المصدر وعبر الأنظمة الأساسية يدعم ترجمات * .srt و * .vtt. لتشغيل الترجمة تلقائيًا فوق مقطع فيديو داخل VLC ، ضع كلاً من الفيديو الأصلي وملف الترجمة في نفس الدليل بنفس اسم الملف بالضبط قبل امتداد الملف.
الآن عند فتح ملف الفيديو داخل VLC ، يجب أن يكتشف ملف الترجمة تلقائيًا ويعيد تشغيله داخل نافذة مشغل الفيديو.
تنظيف
لتجنب تكبد رسوم في المستقبل ، فارغ و حذف دلاء S3 المستخدمة للإدخال والإخراج. تأكد من تخزين جميع الملفات الضرورية حيث سيؤدي ذلك إلى إزالة جميع الكائنات الموجودة داخل الحاويات بشكل دائم. على ال نسخ وحدة التحكم، حدد وحذف أي وظائف لم تعد مطلوبة.
وفي الختام
لقد قمت الآن بإنشاء سير عمل متكامل لإنشاء الترجمة لزيادة وتسريع عملية إنشاء ترجمات الفيديو ، وكل ذلك دون كتابة أي رمز. في غضون دقائق ، قمت بإنشاء حاويات تخزين S3 ، وتحميل ملف إلى Amazon S3 ، واستخدمت Amazon Transcribe لإنشاء الترجمة. يمكنك بعد ذلك تنزيل ملفات الترجمة * .srt و * .vtt الناتجة لمراجعتها ، وتحميلها إلى النظام الأساسي الوجهة.
ركز سير العمل هذا على ترجمات الصوت / الفيديو التي تم إنشاؤها باستخدام تقنية التعرف التلقائي على الكلام (ASR) في Amazon Transcribe خصيصًا لسير عمل الفيديو. سير العمل هذا وحده ليس بديلاً عن عملية التسميات التوضيحية المغلقة المستندة إلى الإنسان ، والتي تكون قادرة على تلبية معايير أعلى لإمكانية الوصول ، بما في ذلك تحديد السماعات ، والمؤثرات الصوتية ، ووصف الموسيقى ، ومراجعة التحرير من أجل الدقة. يمكنك استخدام طريقة تحرير النص الموضحة في هذا المنشور لإضافة هذه العناصر بعد اكتمال مهمة Amazon Transcribe الأولية. علاوة على ذلك ، لمزيد من إنشاء الترجمة والمعاينة والنسخ المستند إلى المستعرض المتقدم ، يمكنك استكشاف نشر ملف توطين المحتوى على AWS الحل الذي تم فحصه بواسطة AWS Solution Architects ويتضمن امتداد دليل التنفيذ. يقدم هذا الحل ميزات إضافية مثل المعاينة في المتصفح وتحرير الترجمة، ترجمة الترجمة مدعوم من ترجمة أمازون، وقدرات رؤية الكمبيوتر التي تقدمها الأمازون إعادة الاعتراف.
إذا كنت قد استمتعت بهذا العرض التوضيحي لقدرة Amazon Transcribe على إنشاء ترجمات مصاحبة ، ففكر في الغوص بشكل أعمق في الميزات والقدرات الإضافية لتسريع سير عمل الصوت / الفيديو. للحصول على تفاصيل إضافية وعينات التعليمات البرمجية لدعم أتمتة إنشاء الترجمة وتوسيع نطاقها ، يرجى الرجوع إلى إنشاء ترجمات الفيديو. حظًا سعيدًا في استكشافك وتطوير سير عمل إنشاء الترجمة.
عن المؤلف
جايسون أومالي هو مهندس حلول كبير في AWS يدعم الشركاء في تصميم وسائل الإعلام والاتصالات وحلول صناعة التكنولوجيا. قبل الانضمام إلى AWS ، أمضى Jason 13 عامًا في صناعة الإعلام والترفيه في شركات من بينها Team Coco و WarnerMedia و Media.Monks من Conan O'Brien. بدأ Jason مسيرته المهنية في الإنتاج التلفزيوني وما بعد الإنتاج قبل زيادة أعباء العمل الإعلامي على AWS. عندما لا يقوم Jason بإنشاء حلول للشركاء والعملاء ، يمكن العثور عليه وهو يغامر مع زوجته وابنه ، أو يقرأ عن الاستدامة.
- "
- 10
- 100
- 7
- من نحن
- تسريع
- الوصول
- إمكانية الوصول
- حسابي
- إضافي
- العنوان
- متقدم
- الكل
- سابقا
- أمازون
- أمازون ويب سيرفيسز
- كمية
- آخر
- في أى مكان
- تطبيق
- التطبيقات
- جمهور
- سمعي
- أوتوماتيك
- أتمتة
- متاح
- AWS
- خلفية
- تستفيد
- الفوائد
- أفضل
- الحدود
- ابني
- الأعمال
- تطبيقات الأعمال
- قدرات
- تعليق
- التوظيف
- الحالات
- التحديات
- اسعارنا محددة من قبل وزارة العمل
- اختار
- فئة
- صندوق توظيف برأس مال محدود
- الكود
- مشترك
- مجال الاتصالات
- الشركات
- مجمع
- الالتزام
- الكمبيوتر
- الاعداد
- كنسولات
- وعاء
- محتوى
- خلق
- خلق
- خلق
- خلق
- المبدعين
- على
- زبون
- خدمة العملاء
- العملاء
- البيانات
- أعمق
- شرح
- نشر
- وصف
- سطح المكتب
- تفاصيل
- تطوير
- صعبة
- مباشرة
- لا
- نطاق
- بإمكانك تحميله
- رئيس التحرير
- الآثار
- جهد
- عناصر
- شجع
- التشفير
- أدخل
- ترفيه
- البيئة
- أساسي
- مثال
- الخبره في مجال الغطس
- استكشاف
- اكتشف
- اضافات المتصفح
- واجه
- الميزات
- المميزات
- الاسم الأول
- ركز
- ويركز
- متابعيك
- شكل
- إلى الأمام
- وجدت
- مستقبل
- العلاجات العامة
- توليد
- توليد
- على الصعيد العالمي
- خير
- مفيد
- يساعد
- مرتفع
- أعلى
- تأجير
- كيفية
- لكن
- HTTPS
- ضخم
- هوية
- هوية
- صورة
- تنفيذ
- تحسن
- يشمل
- بما فيه
- الشمولية
- مؤشر
- العالمية
- إدخال
- دمج
- مسائل
- IT
- نفسها
- وظيفة
- المشــاريــع
- معروف
- لغة
- أكبر
- تعلم
- مستوى
- موقع
- حظ
- آلة
- آلة التعلم
- المحافظة
- يصنع
- تمكن
- أسلوب
- كتيب
- يدويا
- أمر
- الوسائط
- طرق
- ML
- نموذج
- عارضات ازياء
- الأكثر من ذلك
- أكثر
- موسيقى
- قائمة الإختيارات
- ضروري
- عدد
- أرقام
- عرضت
- عروض
- جاكيت
- خيار
- مزيد من الخيارات
- طلب
- منظمة
- جزء
- خاص
- الشريكة
- شركاء
- المنصة
- بلايستشن
- لاعب
- لعب
- سياسات الخصوصية والبيع
- فقير
- الرائج
- ممكن
- أرسال
- التسعير
- ابتدائي
- عملية المعالجة
- العمليات
- إنتاج
- الإنتــاج
- ويوفر
- جودة
- الوصول
- نادي القراءة
- لا تزال
- مطلوب
- المتطلبات الأساسية
- الموارد
- النتائج
- مراجعة
- حجم
- التحجيم
- شاشة
- الخدمة
- خدماتنا
- ضبط
- أظهرت
- الاشارات
- المقاس
- صغير
- الهاتف الذكي
- الصلبة
- حل
- الحلول
- شخص ما
- هي
- مكبرات الصوت
- مكبرات الصوت
- على وجه التحديد
- معيار
- المعايير
- بداية
- بدأت
- يبدأ
- الحالة
- تخزين
- متجر
- مجرى
- الدعم
- مدعومة
- دعم
- الدعم
- الاستدامة
- مع الأخذ
- فريق
- التكنولوجيا
- تكنولوجيا
- تلفزيون
- المصدر
- وبالتالي
- عبر
- الوقت
- استهلاك الوقت
- عنوان
- مسار
- تقليدي
- تقليديا
- قادة الإيمان
- خدمات ترجمة
- عادة
- فريد من نوعه
- تستخدم
- المستخدمين
- الاستفادة من
- قيمنا
- تشكيلة
- فحص
- فيديو
- المزيد
- رؤيتنا
- شاهد
- الويب
- خدمات ويب
- في حين
- في غضون
- بدون
- كلمات
- للعمل
- جاري الكتابة
- سنوات
- التوزيعات للسهم الواحد
- موقع YouTube