זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

זיהוי אוטומטי של שפות באודיו רב לשוני באמצעות Amazon Transcribe

אם אתה פועל במדינה עם מספר שפות רשמיות או על פני מספר אזורים, קובצי האודיו שלך יכולים להכיל שפות שונות. ייתכן שהמשתתפים דוברים שפות שונות לחלוטין או עשויים לעבור בין שפות. שקול להתקשר לשירות לקוחות כדי לדווח על בעיה באזור עם אוכלוסייה רב לשונית. למרות שהשיחה יכולה להתחיל בשפה אחת, ייתכן שהלקוח יחליף לשפה אחרת כדי לתאר את הבעיה, בהתאם לרמת הנוחות או העדפות השימוש בשפות אחרות. ברוח דומה, נציג שירות הלקוחות עשוי לעבור בין שפות תוך העברת הוראות הפעלה או פתרון בעיות.

עם לפחות 3 שניות של שמע, אמזון תעתיק יכול לזהות באופן אוטומטי ולייצר תמלילים בשפות המדוברות באודיו ללא צורך בבני אדם כדי לציין את השפות. זה חל על מקרי שימוש שונים כגון תמלול שיחות מלקוחות, המרת הודעות קוליות לטקסט, לכידת אינטראקציות בפגישות, מעקב אחר תקשורת בפורומים של משתמשים, או ניטור ייצור תוכן מדיה ולוקליזציה.

פוסט זה עובר על השלבים לתמלול קובץ אודיו רב שפות באמצעות Amazon Transcribe. אנו דנים כיצד להפוך קבצי אודיו לזמינים עבור Amazon Transcribe ומאפשרים תמלול של קבצי אודיו רב-לשוניים בעת קריאה לממשקי API של Amazon Transcribe.

סקירת פתרונות

Amazon Transcribe הוא שירות AWS שמקל עליך להמיר דיבור לטקסט. הוספת פונקציונליות דיבור לטקסט לכל יישום היא פשוטה בעזרת Amazon Transcribe, שירות זיהוי דיבור אוטומטי (ASR). אתה יכול להטמיע קלט אודיו באמצעות Amazon Transcribe, ליצור תמלילים ברורים שקל לקרוא ולסקור, להגביר את הדיוק עם התאמה אישית ולסנן מידע כדי להגן על פרטיות הלקוח.

הפתרון משתמש גם שירות אחסון פשוט של אמזון (Amazon S3), שירות אחסון אובייקטים שנבנה לאחסון ושליפה של כל כמות נתונים מכל מקום. זהו שירות אחסון פשוט המציע עמידות, זמינות, ביצועים, אבטחה ומדרגיות כמעט בלתי מוגבלת בעלות נמוכה מאוד. כאשר אתה מאחסן נתונים באמזון S3, אתה עובד עם משאבים הידועים בשם דליים ו אובייקטים. דלי הוא מיכל לחפצים. אובייקט הוא קובץ וכל מטא נתונים שמתארים את הקובץ.

בפוסט זה, אנו מדריכים אותך דרך השלבים הבאים ליישום פתרון תמלול אודיו רב-לשוני:

  1. צור דלי S3.
  2. העלה את קובץ השמע שלך לדלי.
  3. צור את עבודת התמלול.
  4. סקור את פלט העבודה.

תנאים מוקדמים

לפריצת דרך זו, יהיו עליכם התנאים המוקדמים הבאים:

Amazon Transcribe מספקים אפשרות לאחסן פלט מתומלל בדלי S3 מנוהל שירות או מנוהל על ידי לקוחות. עבור פוסט זה, יש לנו את Amazon Transcribe לכתוב את התוצאות ל-S3 דלי מנוהל בשירות.

שימו לב ש-Amazon Transcribe הוא שירות אזורי ונקודות הקצה של Amazon Transcribe API הנקראות צריכות להיות באותו אזור כמו דלי S3.

צור דלי S3 לאחסון קבצי קלט האודיו שלך

כדי ליצור את דלי S3 שלך, בצע את השלבים הבאים:

  1. במסוף S3 של אמזון בחר צור דלי.
  2. בעד שם הדלי, הזן שם ייחודי בכל העולם עבור הדלי.
  3. בעד אזור AWS, בחר באותו אזור כמו נקודות הקצה של Amazon Transcribe API שלך.
    זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  4. השאר את כל ברירות המחדל כפי שהן.
  5. בחרו צור דלי.
    זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

העלה את קובץ השמע שלך לדלי S3

העלה את קובץ השמע הרב-לשוני שלך לדלי S3 בחשבון AWS שלך. לצורך תרגיל זה, אנו משתמשים בדוגמה הבאה קובץ שמע רב לשוני. זה לוכד שיחת תמיכת לקוחות הכוללת שפות אנגלית וספרדית.

  1. במסוף S3 של אמזון בחר דליים בחלונית הניווט.
  2. בחר את הדלי שיצרת בעבר לאחסון קבצי האודיו הקלט.
  3. בחרו העלה.
    זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  4. בחרו הוסף קבצים.
    זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  5. בחר את קובץ האודיו שברצונך לתמלל מהמחשב המקומי שלך.
    זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  6. בחרו העלה.
    זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

קובץ השמע שלך יהיה זמין בקרוב בדלי S3.

צור את עבודת התמלול

עם העלאת קובץ האודיו, אנו יוצרים כעת עבודת תמלול.

  1. במסוף התמלול של Amazon, בחר עבודות תמלול בחלונית הניווט.
  2. בחרו צור עבודה.
    זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  3. בעד שם, הזן שם ייחודי למשרה.
    זה יהיה גם השם של קובץ תמליל הפלט.
  4. בעד הגדרות שפה, בחר זיהוי אוטומטי של מספר שפות.
    תכונה זו מאפשרת ל-Amazon Transcribe לזהות ולתמלל אוטומטית את כל השפות המדוברות בקובץ האודיו.
    זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  5. בעד אפשרויות שפה לזיהוי שפה אוטומטי, השאר אותו לא מסומן.
    Amazon Transcribe מזהה ומתמלל אוטומטית את כל השפות המדוברות באודיו. כדי לשפר את דיוק התמלול, אתה יכול לבחור שתי שפות או יותר שאתה יודע שדיברו באודיו.
    זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  6. בעד סוג דגם, רק ה דגם כללי האפשרות זמינה בזמן כתיבת פוסט זה.
  7. בעד נתוני קלט, בחר דפדף ב- S3.
  8. בחר את קובץ מקור האודיו שהעלינו בעבר.
    זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  9. בעד נתוני פלט, אתה יכול לבחור באחד מהם דלי S3 בניהול שירות or דלי S3 שצוין על ידי הלקוח. עבור פוסט זה, בחר דלי S3 בניהול שירות.
    זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  10. בחרו הַבָּא.
  11. בחרו צור עבודה.

סקור את פלט העבודה

כאשר עבודת התמלול הושלמה, פתח את עבודת התמלול.
זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

גלול מטה אל תצוגה מקדימה של תמלול סָעִיף. תמלול השמע מוצג ב- טקסט לשונית. התמלול כולל גם את החלק האנגלי וגם הספרדית של השיחה.
זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

באפשרותך להוריד עותק של התמליל כקובץ JSON, שבו תוכל להשתמש להמשך ניתוח שלאחר שיחה.

לנקות את

כדי להימנע מחיובים עתידיים, רוקן ומחק את דלי S3 שיצרת לאחסון קובץ מקור האודיו הקלט. ודא שהקבצים מאוחסנים במקום אחר מכיוון שזה יסיר לצמיתות את כל האובייקטים הכלולים בדלי. במסוף התמלול של Amazon, בחר ומחק את העבודה שנוצרה קודם לכן עבור התמלול.

סיכום

בפוסט זה, יצרנו זרימת עבודה מקצה לקצה כדי להפוך זיהוי ותמלול אוטומטי של קבצי אודיו רב-לשוניים, מבלי לכתוב קוד כלשהו. השתמשנו בפונקציונליות החדשה ב- Amazon Transcribe כדי לזהות אוטומטית שפות שונות בקובץ שמע ולתמלל כל שפה בצורה נכונה.

למידע נוסף עיין ב זיהוי שפה עם עבודות תמלול אצווה.


על הכותבים

זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.מורטוזה בוטוואלה הוא ארכיטקט פתרונות בכיר ב-AWS עם עניין בטכנולוגיות AI/ML. הוא נהנה לעבוד עם לקוחות כדי לעזור להם להשיג את התוצאות העסקיות שלהם. מחוץ לעבודה, הוא נהנה מפעילויות חוצות ולבלות עם המשפחה.

זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.ויקטור רוג'ו מתלהב מ-AI/ML ופיתוח תוכנה. הוא עזר להפעיל את אמזון אלקסה בארה"ב ובמקסיקו. הוא גם הביא את Amazon Textract ל-AWS Partners והוציא את AWS Contact Center Intelligence (CCI) לדרך. כיום הוא המנהיג הטכנולוגי העולמי עבור שותפי בינה מלאכותית לשיחה.

זיהוי אוטומטי של שפות באודיו רב-לשוני באמצעות Amazon Transcribe PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.באבו סריניוואסן הוא AWS Sr. Specialist SA (Language AI Services) שבסיסה משיקגו. הוא מתמקד ב-Amazon Transcribe (דיבור לטקסט), ועוזר ללקוחותינו להשתמש בשירותי AI כדי לפתור בעיות עסקיות. מחוץ לעבודה, הוא נהנה לעבוד בעץ ולבצע מופעי קסמים.

בול זמן:

עוד מ למידת מכונות AWS