צור אודיו לתוכן במספר שפות עם אותה דמות קולית של TTS ב-Amazon Polly PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

צור אודיו לתוכן במספר שפות עם אותה דמות קולית TTS באמזון פולי

אמזון פולי הוא שירות מוביל מבוסס ענן הממיר טקסט לדיבור אמיתי. לאחר האימוץ של טקסט עצבי לדיבור (NTTS), הרחבנו ללא הרף את סל הקולות הזמינים שלנו על מנת לספק מבחר רחב של דוברים שונים בשפות נתמכות. היום, אנו שמחים להכריז על ארבע תוספות חדשות: פדרו דובר ספרדית אמריקאית, דניאל דובר גרמנית, ליאם דובר צרפתית קנדית וארתור דובר אנגלית בריטית. כמו בכל הקולות העצביים בתיק העבודות שלנו, הקולות האלה מציעים הגייה שוטפת ילידית בשפות היעד שלהם. עם זאת, מה שמייחד את ארבעת הקולות הללו הוא שכולם מבוססים על אותה פרסונה קולית.

פדרו, דניאל, ליאם וארתור עוצבו על פי קול קיים של מתיו אנגלי בארה"ב. בעוד שהלקוחות ממשיכים להעריך את מת'יו על הטבעיות שלו ואיכותו המקצועית, הקול שירת עד כה בלעדית תעבורה דוברת אנגלית. כעת, באמצעות שיטות למידה עמוקה, ניתקנו את הקשר בין השפה לזהות הדובר, מה שאפשר לנו לשמור על שטף ילידים בשפות רבות מבלי שנצטרך להשיג נתונים רב לשוניים מאותו דובר. בפועל, זה אומר שהעברנו את המאפיינים הווקאליים של קול מת'יו האנגלי בארה"ב לספרדית אמריקאית, גרמנית, צרפתית קנדית ואנגלית בריטית, ופתחנו הזדמנויות חדשות ללקוחות אמזון פולי.

קול שנשמע דומה זמין בחמישה אזורים פותח פוטנציאל גדול לצמיחה עסקית. קודם כל, לקוחות עם טביעת רגל גלובלית יכולים ליצור חווית משתמש עקבית בשפות ובאזורים. לדוגמה, מערכת תגובה קולית אינטראקטיבית (IVR) התומכת במספר שפות יכולה כעת לשרת פלחים שונים של לקוחות מבלי לשנות את תחושת המותג. אותו דבר לגבי כל מקרי השימוש האחרים ב-TTS, כגון השמעת כתבות חדשותיות, חומרי חינוך או פודקאסטים.

שנית, הקולות מתאימים ללקוחות אמזון פולי שמחפשים הגייה מקורית של ביטויים זרים בכל אחת מחמש השפות הנתמכות.

שלישית, שחרור פדרו, דניאל, ליאם וארתור משרת את הלקוחות שלנו שאוהבים את אמזון פולי NTTS בספרדית אמריקאית, גרמנית, צרפתית קנדית ואנגלית בריטית אבל מחפשים קול גברי באיכות גבוהה - הם יכולים להשתמש בקולות האלה כדי ליצור אודיו עבור תוכן חד לשוני וצפו לאיכות מעולה המשתווה לקולות NTTS אחרים בשפות אלו.

לבסוף, ניתן להשתמש גם בטכנולוגיה שפיתחנו כדי ליצור את קולות ה-NTTS הגבריים החדשים קולות מותג. הודות לכך, לקוחות Brand Voice יכולים לא רק ליהנות מקול NTTS ייחודי המותאם למותג שלהם, אלא גם לשמור על חוויה עקבית תוך שירות לקהל בינלאומי.

מקרה שימוש לדוגמה

בוא נחקור מקרה שימוש לדוגמה כדי להדגים מה זה אומר בפועל. לקוחות אמזון פולי המכירים את מת'יו עדיין יכולים להשתמש בקול הזה בדרך הרגילה על ידי בחירה מתיו בקונסולת Amazon Polly והזנת כל טקסט שהם רוצים לשמוע בדיבור באנגלית אמריקאית. בתרחיש הבא, אנו יוצרים דגימות אודיו עבור מערכת IVR ("עבור אנגלית, אנא הקש אחת"):

הודות לגרסה זו, כעת תוכל להרחיב את מקרה השימוש כדי לספק חווית אודיו עקבית בשפות שונות. כל הקולות החדשים נשמעים טבעיים ושומרים על מבטא יליד.

  • כדי ליצור דיבור באנגלית בריטית, בחר ארתור ("עבור אנגלית, אנא הקש אחד"):
  • כדי להשתמש בדובר ספרדית בארה"ב, בחרו בפדרו ("Para español, por favor marque dos"):
  • דניאל מציע תמיכה בגרמנית ("Für Deutsch drücken Sie bitte die Drei"):
  • אתה יכול לסנתז טקסט בצרפתית קנדית על ידי בחירת ליאם ("Pour le français, veuillez appuyer sur le quatre"):

שים לב שמלבד דיבור במבטא שונה, קול ארתור האנגלי בבריטניה ימקם את טקסט הקלט בצורה שונה מהקול של מתיו האנגלי בארה"ב. לדוגמה, "1/2/22" ייקרא על ידי ארתור כ"ה-1 בפברואר 2022", ואילו מתיו יקרא אותו כ"2 בינואר 2022".

עכשיו בואו נשלב את ההנחיות האלה:

סיכום

פדרו, דניאל, ליאם וארתור זמינים כקולות עצביים TTS בלבד, כך שכדי ליהנות מהם, עליך להשתמש במנוע העצבי באחד מהמכשירים אזורי AWS התומכים ב- NTTS. אלה איכותיים קולות חד לשוניים בשפות היעד שלהם. העובדה שהפרסונות שלהם עקביות בשפות היא יתרון נוסף, שאנו מקווים שישמח לקוחות העובדים עם תוכן במספר שפות. לפרטים נוספים, עיין ברשימה המלאה שלנו של אמזון פולי קולות טקסט לדיבור , תמחור TTS עצבי, מגבלות שירות, ו שאלות נפוצות, ובקר אצלנו דף תמחור.


על הכותבים

צור אודיו לתוכן במספר שפות עם אותה דמות קולית של TTS ב-Amazon Polly PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.פטריק ויינינה הוא מהנדס שפה שעובד על טקסט לדיבור לאנגלית, גרמנית וספרדית. עם רקע בעיבוד דיבור ושפה, תחומי העניין שלו טמונים בלמידת מכונה כפי שמיושם על פתרונות TTS חזיתיים, במיוחד בהגדרות של משאבים נמוכים. בזמנו הפנוי הוא נהנה להאזין למוזיקה אלקטרונית וללמוד שפות חדשות.

צור אודיו לתוכן במספר שפות עם אותה דמות קולית של TTS ב-Amazon Polly PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.מרתה סמולרק היא מנהלת תוכנית בכירה בצוות טקסט לדיבור של אמזון, שם היא מתמקדת במקרה השימוש ב-Contact Center TTS. היא מגדירה יוזמות Go-to-Market, משתמשת במשוב מלקוחות כדי לבנות את מפת הדרכים של המוצר ומרכזת השקות קוליות של TTS. מחוץ לעבודה, היא אוהבת לצאת לקמפינג עם משפחתה.

בול זמן:

עוד מ למידת מכונות AWS