יצירת כתוביות בתוכן וידאו מציבה אתגרים לא משנה כמה גדול או קטן הארגון. כדי להתמודד עם האתגרים האלה, אמזון תעתיק יש תכונה מועילה המאפשרת יצירת כתוביות ישירות בתוך השירות. לא נדרשת למידת מכונה (ML) או כתיבת קוד כדי להתחיל. פוסט זה מנחה אותך דרך הגדרת זרימת עבודה ללא קוד ליצירת כתוביות וידאו באמצעות Amazon Transcribe בחשבון Amazon Web Services שלך.
כתוביות לעומת כתוביות
התנאים כתוביות ו כתוביות משמשים בדרך כלל לסירוגין, ושניהם מתייחסים לטקסט המדובר המוצג על המסך. עם זאת, ההבדל העיקרי בין כתוביות וכתוביות סגורות (בהתבסס על הגדרות התעשייה והנגישות) הוא שהכתוביות הסגורות מכילות הן את תמלול המילה המדוברת והן תיאור של מוסיקת רקע או צלילים המתרחשים ברצועת האודיו עבור חווית נגישות עשירה יותר. . פוסט זה מתמקד רק ביצירת קבצי כתוביות של מילים מדוברות מתומללות באמצעות טכנולוגיית זיהוי דיבור אוטומטי (ASR) שאינם מכילים זיהוי דובר, אפקטים קוליים או תיאורי מוזיקה. Amazon Transcribe תומך בפורמטים הסטנדרטיים של SubRip Text (*.srt) ו-Web Video Text Tracks (*.vtt) עבור יצירת כתוביות.
התמונה הבאה מציגה דוגמה של כתוביות המופעלות בתוך נגן וידאו אינטרנט.
כתוביות מועילות ליוצרי וידאו על ידי הרחבת טווח ההגעה והכלליות של תוכן הווידאו שלהם. על ידי הצגת חלק האודיו המדובר של סרטון וידאו על המסך, כתוביות הופכות תוכן אודיו/וידאו לנגיש לקהל גדול יותר, כולל אלה שאינם דוברי שפת אם וכאלה שנמצאים בסביבה שבה צליל אינו נשמע.
למרות שהיתרונות של כתוביות ברורים, יוצרי וידאו התמודדו באופן מסורתי עם מכשולים ביצירת כתוביות. מכשולים נוצרים עקב הדרישות הגוזלות זמן ועתירות משאבים של תהליך היצירה המסורתי הנשענות במידה רבה על מאמץ ידני. שיטות הכתוביות המסורתיות הן ידניות ויכולות להימשך ימים עד שבועות עד להשלמתן, ולכן עשויות שלא להיות תואמות לכל לוחות הזמנים של ההפקה. כמו כן, חברות רבות משתמשות בשירותי תמלול ידני, אך תהליכים אלו לרוב אינם מותאמים והם יקרים לתחזוקה. Amazon Transcribe מקל עליך להמיר דיבור לטקסט באמצעות טכנולוגיות מבוססות ML ומסייע ליוצרי וידאו לטפל בבעיות אלו.
סקירת פתרונות
פוסט זה עובר על זרימת עבודה ללא קוד ליצירת כתוביות באמצעות שירות אחסון פשוט של אמזון (Amazon S3) ו-Amazon Transcribe.
Amazon S3 הוא אחסון אובייקטים שנבנה לאחסון ואחזור של כל כמות נתונים מכל מקום. פוסט זה עובר על התהליך אל צור דלי S3 ולהעלות קובץ שמע. כאשר משתמשים מאחסנים נתונים באמזון S3, הם עובדים עם משאבים המכונים דליים ואובייקטים. א דלי הוא מיכל לחפצים. א אובייקט הוא קובץ וכל מטא נתונים שמתארים את הקובץ הזה.
Amazon Transcribe הוא שירות ASR המשתמש במודלים ML מנוהלים ומאומנים באופן רציף כדי להמיר קבצי אודיו/וידאו לטקסט. כניסות ויציאות של Amazon Transcribe מאוחסנים ב- Amazon S3. Amazon Transcribe לוקח נתוני אודיו, או קובץ מדיה בדלי של Amazon S3 או זרם מדיה, וממיר אותם לנתוני טקסט. Amazon Transcribe מאפשר לך להטמיע קלט אודיו, לייצר תמלילים קלים לקריאה ברמת דיוק גבוהה, להתאים את הפלט שלך לאוצר מילים ספציפי לתחום באמצעות דגמי שפה בהתאמה אישית (CLM) ו אוצר מילים מותאמים אישית, ו לסנן תוכן כדי להבטיח את פרטיות הלקוח. לקוחות יכולים לבחור להשתמש ב- Amazon Transcribe עבור מגוון יישומים עסקיים, כולל תמלול שיחות מבוססות שירות לקוחות, יצירת כתוביות על תוכן אודיו/וידאו, ו לבצע ניתוח תוכן (מבוסס טקסט). על תוכן אודיו/וידאו. עבור פוסט זה, אנו מדגימים יצירת עבודת תמלול ובדיקת תפוקת המשרה.
אם אתה מעדיף הדרכה בווידאו, עיין בפרק חטיפי הווידאו של Amazon Transcribe יצירת כתוביות וידאו מבלי לכתוב שום קוד.
תנאים מוקדמים
כדי לעבור על הפתרון, עליך לעמוד בדרישות הקדם הבאות:
- An חשבון AWS עם מספיק AWS זהות וניהול גישה (IAM) הרשאות משתמש
- קובץ אודיו/וידאו עם מילים מדוברות ב-an אמזון תמלול שפה נתמכת ב פורמט קלט נתמך
אם עדיין אין לך קובץ אודיו/וידאו לדוגמה, תוכל ליצור אחד באמצעות אפליקציית הקלטת וידאו במחשב או בסמארטפון. ודא שאתה מדבר ברור לתוך המיקרופון כדי להבטיח את הרמה הגבוהה ביותר של איכות תמלול בזמן ההקלטה. אפשרות נוספת היא למצוא הורדה זמינה בחינם הכוללת מילה מדוברת, כמו פודקאסט, או הסבר הווידאו המופיע בפוסט זה, שניתן לבלוע על ידי Amazon Transcribe. הקובץ שהוקלט או שהורד צריך להיות נגיש על שולחן העבודה שלך להעלאה לחשבון AWS שלך.
לפני שתתחיל, סקור את אמזון תעתיק ו אמזון S3 דפי תמחור לתמחור שירות.
צור את הדליים של S3
עבור פוסט זה, אנו יוצרים שני דלי S3 כדי לשמור על הפרדה בין הקלט והפלט.
- במסוף S3 של אמזון בחר צור דלי.
- תן לכל דלי שם ייחודי בעולם.
- השתמש בהגדרות ברירת המחדל כדי להבטיח תאימות למדיניות של הארגון שלך.
- אפשר גרסת דלי ו הצפנת ברירת מחדל בצד השרת (מומלץ).
- בחרו צור דלי.
צילום המסך הבא מציג את התצורה של דלי הקלט.
דלי S3 לקלט מוכן כעת להעלאת קובץ האודיו/וידאו. בזמן פרסום זה, ה גודל הקלט המקסימלי עבור Amazon Transcribe הוא 2 GB. אם קובץ הווידאו חורג מהסכום הזה או נמצא ב-a פורמט שאינו נתמך באופן מקורי על ידי Amazon Transcribe, שקול להשתמש AWS Elemental MediaConvert ל ליצור פלט אודיו בלבד. זה מועיל מכיוון שקובצי אודיו בדרך כלל קטנים בהרבה מקבצי וידאו ואמזון Transcribe דורש רק את רצועת האודיו, ולא את רצועת הווידאו, כדי ליצור תמלילים וכתוביות.
העלה את קובץ המקור לדלי S3
כדי להעלות את קובץ המקור שלך, בצע את השלבים הבאים:
- בקונסולת Amazon S3, בחר את דלי הקלט שלך.
- בחרו העלה.
- בחר את הקובץ משולחן העבודה שלך.
- קבל את הגדרות ברירת המחדל של דרגת האחסון וההצפנה או שנה אותן בהתאם למדיניות הארגון שלך.
- בחרו העלה.
צור עבודת תמלול
עם קובץ הקלט מוכן ב-Amazon S3, אנו יוצרים כעת עבודת תמלול ב-Amazon Transcribe.
- על קונסולת תמלול של אמזון, בחר עבודות תמלול בחלונית הניווט.
- בחרו צור עבודה.
הדרכה זו משתמשת במידה רבה באפשרויות ברירת המחדל; עם זאת, עליך לבחור את התצורה המתאימה ביותר לדרישות הארגון שלך.
- בעד שם, הזן שם עבור העבודה הזו והקובץ שנוצר.
- בעד הגדרות שפה, בחר שפה ספציפית.
- בעד שפה, בחר את שפת המקור של קובץ הקלט.
- בעד סוג דגםבחר דגם כללי.
אנו משתמשים במודל הכללי עבור הדגמה זו, אך אנו ממליצים לך לחקור את ההדרכה והשימוש דגמי שפה בהתאמה אישית לשיפור הדיוק עבור מקרי שימוש ספציפיים כגון מונחים או ראשי תיבות ספציפיים לתעשייה. לצלילה עמוקה יותר לתוך מודלים של שפות מותאמות אישית, צפו בחטיף הווידאו של Amazon Transcribe שימוש במודלים מותאמים אישית של שפה (CLM) כדי להגביר את דיוק התמלול.
- בעד קלט מיקום קובץ ב-S3, בחר דפדף ב- S3.
- בחר את דלי הקלט ואת קובץ האודיו/ווידאו לתמלול.
- בעד פלט מידע על סוג מיקום, בחר דלי S3 שצוין על ידי הלקוח.
- בעד יעד קובץ פלט ב-S3, בחר דפדף ב- S3.
- בחר את דלי הפלט החדש שנוצר.
השמיים פורמט קובץ כתוביות החלק מספק את שתי האפשרויות החיוניות ביותר של כל הפוסט הזה. אתה יכול לבחור את הפלטים בפורמט *.srt ו-*.vtt כחלק מעבודת התמלול של Amazon Transcribe. בזמן כתיבת שורות אלה, בחירה באחד או בשניהם אינה מוסיפה עלות נוספת לעבודת התמלול של Amazon.
ערך זה מתייחס למספר ההתחלתי של הכתובית הראשונה ברצף. אם אינך בטוח באיזה ערך לבחור, 1 הוא הנפוץ ביותר.
- כאשר ההגדרות קיימות, בחר הַבָּא.
- הגדר את כל ההגדרות האופציונליות לפי הצרכים שלך.
Amazon Transcribe מציג אפשרויות לזיהוי אודיו עבור ערוצים or רמקולים, תוצאות חלופיות, עריכת PII, סינון אוצר מילים, ו אוצר מילים בהתאמה אישית. עבור הפוסט הספציפי הזה, אתה יכול לדלג על אפשרויות התצורה הללו. לצלילה עמוקה יותר לתוך אפשרויות תצורת העבודה, צפו בפרקי הוידאו של Amazon Transcribe של חטיפי אוצר מילים בהתאמה אישית, דגמי שפה בהתאמה אישית, ו סינון אוצר מילים.
סקור את פלט העבודה
מלאכת התמלול ליצירת כתוביות הווידאו שלך מתחילה. מצב העבודה, כפי שמוצג בצילום המסך הבא, מוצג בחלונית פרטי העבודה. בסיום העבודה, בחר את מיקום נתוני הפלט כדי לאתר את הכתוביות החדשות שנוצרו בדלי S3.
כתוביות מזוהות על ידי הסיומת *.srt או *.vtt. כאשר אתה בוחר את האובייקט בדלי S3, יש לך אפשרות להוריד את הקובץ.
מכיוון שהכתוביות הללו הן בפורמט טקסט רגיל, כל עורך טקסט יכול להציג ולערוך את התמלול שנוצר. השוואת קבצי *.srt ו-*.vtt חושפת קווי דמיון רבים, עם הבדלים עדינים.
להלן דוגמה לפורמט *.srt:
להלן דוגמה לפורמט *.vtt:
המספרים מציינים את סדר הצגת הכתובית. קוד הזמן מציין מתי מוצגת הכתובית. הטקסט הוא טקסט הכתוביות עצמו.
כל שינוי או תיקונים אפשריים כעת ישירות בתוך עורך הטקסט ונשארים תואמים כאשר נשמרים עם הסיומת *.srt או *.vtt. אתה יכול גם להציג שינויים בתצוגה מקדימה בפלטפורמת הווידאו עצמה, בתוך אפליקציית עריכת וידאו או בתוך נגן וידאו.
VLC הוא נגן וידאו פופולרי בקוד פתוח ובפלטפורמות שונות התומך בכתוביות *.srt ו-*.vtt. כדי להפעיל אוטומטית כתוביות על סרטון בתוך VLC, מקם גם את הסרטון המקורי וגם את קובץ הכתוביות באותה ספרייה עם אותו שם קובץ בדיוק לפני סיומת הקובץ.
כעת כאשר אתה פותח את קובץ הווידאו בתוך VLC, קובץ הכתוביות אמור לזהות ולהפעיל באופן אוטומטי בתוך חלון נגן הווידאו.
לנקות את
כדי להימנע מחיובים עתידיים, ריק ו להסיר דלי S3 המשמשים לקלט ופלט. ודא שכל הקבצים הדרושים מאוחסנים ברשותך מכיוון שהדבר יסיר לצמיתות את כל האובייקטים הכלולים בדליים. על קונסולת תמלול, בחר ומחק את כל העבודות שאינן נחוצות עוד.
סיכום
כעת יצרת זרימת עבודה מלאה ליצירת כתוביות מקצה לקצה כדי להגביר ולהאיץ את תהליך יצירת הכתוביות של הווידאו שלך, והכל מבלי לכתוב שום קוד. תוך דקות, יצרת דלי אחסון של S3, העלית קובץ לאמזון S3 והשתמשת ב- Amazon Transcribe ליצירת כתוביות. לאחר מכן תוכל להוריד את קובצי הכתוביות *.srt ו-*.vtt שהתקבלו לבדיקה, ולהעלות אותם לפלטפורמת היעד.
זרימת עבודה זו התמקדה בכתוביות אודיו/וידאו שנוצרו באמצעות טכנולוגיית זיהוי הדיבור האוטומטי (ASR) ב-Amazon Transcribe במיוחד עבור זרימות עבודה של וידאו. זרימת עבודה זו לבדה אינה מהווה תחליף לתהליך כתוביות סגורות המבוססות על אדם, אשר מסוגל לעמוד בסטנדרטים גבוהים יותר של נגישות, כולל זיהוי רמקולים, אפקטים קוליים, תיאור מוזיקה וסקירת עריכת העתקה לצורך דיוק. אתה יכול להשתמש בשיטת עריכת הטקסט המתוארת בפוסט זה כדי להוסיף אלמנטים אלה לאחר השלמת עבודת התמלול הראשונית של Amazon. יתר על כן, ליצירת כתוביות מתקדמת יותר מבוססת דפדפן, תצוגה מקדימה ועריכה, תוכל לחקור את פריסת לוקליזציה של תוכן ב-AWS פתרון שנבדק על ידי AWS Solution Architects וכולל מדריך יישום. פתרון זה מציע תכונות נוספות כגון תצוגה מקדימה בדפדפן ועריכה של כתוביות, תרגום כתוביות מופעל על ידי אמזון תרגם, ויכולות ראייה ממוחשבת המוצעות על ידי אמזון.
אם נהניתם מהדגמה זו של היכולת של Amazon Transcribe ליצור כתוביות, שקול לצלול עמוק יותר לתוך תכונות ויכולות נוספות כדי להאיץ את זרימות העבודה של האודיו/ווידאו שלכם. לפרטים נוספים ודוגמאות קוד לתמיכה באוטומציה והגדלת יצירת כתוביות, עיין ב יצירת כתוביות וידאו. בהצלחה בחקירתך ובפיתוח זרימת העבודה שלך ליצירת כתוביות.
על המחבר
ג'ייסון אומאלי הוא אדריכל Sr. Partner Solutions ב-AWS התומך בשותפים באדריכלות פתרונות מדיה, תקשורת וטכנולוגיה בתעשיית הטכנולוגיה. לפני שהצטרף ל-AWS, ג'ייסון בילה 13 שנים בתעשיית המדיה והבידור בחברות כולל Team Coco של Conan O'Brien, WarnerMedia ו-Media.Monks. ג'ייסון התחיל את הקריירה שלו בהפקת טלוויזיה ובפוסט-פרודקשן לפני שבנה עומסי מדיה ב-AWS. כאשר ג'ייסון אינו יוצר פתרונות עבור שותפים ולקוחות, ניתן למצוא אותו מסתובב בהרפתקאות עם אשתו ובנו, או קורא על קיימות.
- "
- 10
- 100
- 7
- אודות
- להאיץ
- גישה
- נגישות
- חֶשְׁבּוֹן
- נוסף
- כתובת
- מתקדם
- תעשיות
- כְּבָר
- אמזון בעברית
- אמזון שירותי אינטרנט
- כמות
- אחר
- בְּכָל מָקוֹם
- בקשה
- יישומים
- קהל מאזינים
- אודיו
- מכני עם סלילה אוטומטית
- אוטומציה
- זמין
- AWS
- רקע
- תועלת
- הטבות
- הטוב ביותר
- גבול
- בִּניָן
- עסקים
- יישומים עסקיים
- יכולות
- כיתובים
- קריירה
- מקרים
- האתגרים
- חיובים
- בחרו
- בכיתה
- סגור
- קוד
- Common
- תקשורת
- חברות
- מורכב
- הענות
- המחשב
- תְצוּרָה
- קונסול
- מכולה
- תוכן
- לִיצוֹר
- נוצר
- יוצרים
- יצירה
- יוצרים
- מנהג
- לקוח
- שירות לקוחות
- לקוחות
- נתונים
- עמוק יותר
- להפגין
- פריסה
- מְתוּאָר
- שולחן העבודה
- פרטים
- מתפתח
- קשה
- ישירות
- לא
- תחום
- להורדה
- עורך
- תופעות
- מאמץ
- אלמנטים
- לעודד
- הצף
- זן
- בידור
- סביבה
- חיוני
- דוגמה
- ניסיון
- חקירה
- לחקור
- סיומות
- מתמודד
- מאפיין
- תכונות
- ראשון
- מרוכז
- מתמקד
- הבא
- פוּרמָט
- קדימה
- מצא
- עתיד
- כללי
- ליצור
- יצירת
- ברחבי עולם
- טוב
- מועיל
- עוזר
- גָבוֹהַ
- גבוה יותר
- לִשְׂכּוֹר
- איך
- אולם
- HTTPS
- עצום
- הזדהות
- זהות
- תמונה
- ליישם
- משופר
- כולל
- כולל
- הכלילות
- מדד
- תעשייה
- קלט
- לשלב
- בעיות
- IT
- עצמו
- עבודה
- מקומות תעסוקה
- ידוע
- שפה
- גדול יותר
- למידה
- רמה
- מיקום
- מזל
- מכונה
- למידת מכונה
- לתחזק
- עושה
- הצליח
- דרך
- מדריך ל
- באופן ידני
- דבר
- מדיה
- שיטות
- ML
- מודל
- מודלים
- יותר
- רוב
- כלי נגינה
- ניווט
- הכרחי
- מספר
- מספרים
- מוצע
- המיוחדות שלנו
- לפתוח
- אפשרות
- אפשרויות
- להזמין
- ארגון
- חלק
- מסוים
- שותף
- שותפים
- פלטפורמה
- לְשַׂחֵק
- שחקן
- משחק
- מדיניות
- עני
- פופולרי
- אפשרי
- תצוגה מקדימה
- תמחור
- יְסוֹדִי
- תהליך
- תהליכים
- לייצר
- הפקה
- מספק
- איכות
- לְהַגִיעַ
- קריאה
- להשאר
- נדרש
- דרישות
- משאבים
- תוצאות
- סקירה
- סולם
- דרוג
- מסך
- שרות
- שירותים
- הצבה
- הראה
- פָּשׁוּט
- מידה
- קטן
- טלפון חכם
- מוצק
- פִּתָרוֹן
- פתרונות
- מישהו
- שלה
- רַמקוֹל
- רמקולים
- במיוחד
- תֶקֶן
- תקנים
- התחלה
- החל
- התחלות
- מצב
- אחסון
- חנות
- זרם
- תמיכה
- נתמך
- מסייע
- תומך
- קיימות
- נטילת
- נבחרת
- טכנולוגיות
- טכנולוגיה
- טלוויזיה
- המקור
- לכן
- דרך
- זמן
- דורש זמן רב
- כותרת
- לעקוב
- מסורתי
- באופן מסורתי
- הדרכה
- תרגום
- בדרך כלל
- ייחודי
- להשתמש
- משתמשים
- לנצל
- ערך
- מגוון
- בוטה
- וִידֵאוֹ
- לצפיה
- חזון
- שעון
- אינטרנט
- שירותי אינטרנט
- בזמן
- בתוך
- לְלֹא
- מילים
- תיק עבודות
- כתיבה
- שנים
- תְשׁוּאָה
- YouTube