אמזון פולי הוא טקסט לדיבור שירות המשתמש בטכנולוגיות למידה עמוקה מתקדמות כדי לסנתז דיבור אנושי בעל צלילים טבעיים. הוא משמש במגוון מקרי שימוש, כגון מערכות מרכז קשר, אספקת חוויות משתמש בשיחות עם קולות דמויי אדם לבדיקת סטטוס אוטומטית בזמן אמת, פניות אוטומטיות לחשבון וחיוב, וכן על ידי סוכנויות חדשות כמו הוושינגטון פוסט כדי לאפשר לקוראים להאזין לכתבות חדשותיות.
נכון להיום, אמזון פולי מספקת מעל 60 קולות ב-30+ גרסאות שפה. אמזון פולי משתמשת גם בהקשר כדי לבטא מילים מסוימות בצורה שונה בהתבסס על זמן הפועל ומידע הקשרי אחר. לדוגמה, "קרא" ב"קראתי ספר" (זמן הווה) ו"אני אקרא ספר" (זמן עתיד) מבוטא אחרת.
עם זאת, במצבים מסוימים ייתכן שתרצה להתאים אישית את האופן שבו אמזון פולי מבטאת מילה. לדוגמה, ייתכן שיהיה עליך להתאים את ההגייה לניב מקומי או ללשון העם. שמות של דברים (למשל, ניתן לבטא עגבניה כ טום-אה-טו or טום-איי-טו), אנשים, רחובות או מקומות מבטאים לעתים קרובות בדרכים רבות ושונות.
בפוסט זה, אנו מדגימים כיצד ניתן למנף לקסיקונים ליצירת הגיות מותאמות אישית. אתה יכול ליישם לקסיקונים למקרי שימוש כגון פרסום, חינוך או מוקדים טלפוניים.
התאם אישית את ההגייה באמצעות תג SSML
נניח שאתה מזרם פודקאסט פופולרי מאוסטרליה ואתה משתמש בקול אמזון פולי אוסטרלי באנגלית (אוליביה) כדי להמיר את התסריט שלך לדיבור דמוי אדם. באחד מהסקריפטים שלך, אתה רוצה להשתמש במילים שאינן ידועות לקול אמזון פולי. לדוגמה, ברצונך לשלוח ברכות ל-Mātariki (ראש השנה המאורי) למאזיניך בניו זילנד. עבור תרחישים כאלה, אמזון פולי תומכת בהגייה פונטית, שבה תוכל להשתמש כדי להשיג הגייה שקרובה להגייה הנכונה בשפה הזרה.
אתה יכול להשתמש ב שפת סימון של סינתזת דיבור (SSML) תג כדי להציע הגייה פונטית בתכונת ph. תן לי להראות לך איך אתה יכול להשתמש תג SSML.
ראשית, היכנס לחשבון שלך קונסולת AWS וחפש את אמזון פולי בשורת החיפוש בחלק העליון. בחר Amazon Polly ולאחר מכן בחר בלחצן נסה את פולי.
בקונסולת Amazon Polly, בחר אנגלית אוסטרלית מהתפריט הנפתח של השפה והזן את הטקסט הבא בתיבת הטקסט Input ולאחר מכן לחץ על האזנה כדי לבדוק את ההגייה.
אני מאחל לכולכם מאטריקי שמח מאוד.
דיבור לדוגמה ללא החלת הגייה פונטית:
אם אתה שומע את הנאום לדוגמה למעלה, אתה יכול לשים לב שההגייה של מאטאריקי - מילה שאינה חלק מאנגלית אוסטרלית - לא ממש נקודתית. כעת, בואו נסתכל כיצד בתרחישים כאלה אנו יכולים להשתמש בהגייה פונטית באמצעות תג SSML להתאמה אישית של הנאום שהופק על ידי אמזון פולי.
כדי להשתמש בתגי SSML, הפעל את אפשרות SSML בקונסולת אמזון פולי. לאחר מכן העתק והדבק את סקריפט ה-SSML הבא המכיל הגייה פונטית עבור מאטאריקי שצוין בתוך תכונת ph של תָג.
עם תָג, אמזון פולי משתמש בהגייה שצוינה על ידי תכונת ph במקום ההגייה הסטנדרטית המשויכת כברירת מחדל לשפה שבה משתמש הקול הנבחר.
דיבור לדוגמה לאחר החלת הגייה פונטית:
אם תשמעו את הצליל לדוגמה, תשימו לב שבחרנו בהגייה שונה עבור חלק מהתנועות (למשל, ā) כדי לגרום לאמזון פולי לסנתז את הצלילים הקרובים יותר להגייה הנכונה. עכשיו אולי יש לך שאלה, איך אני יוצר את התעתיק הפונטי "mA:.tA:.ri.ki" למילה מאטאריקי?
אתה יכול ליצור תמלול פונטי על ידי הפניה ל- טבלאות פונמה ו-Viseme עבור השפות הנתמכות. בדוגמה למעלה השתמשנו ב- פונמות לאנגלית אוסטרלית.
אמזון פולי מציעה תמיכה בשני אלפביתים פונטיים: IPA ו-X-Sampa. היתרון של X-Sampa הוא שהם תווי ASCII סטנדרטיים, כך שקל יותר להקליד את התעתיק הפונטי עם מקלדת רגילה. אתה יכול להשתמש בכל אחד מה-IPA או X-Sampa כדי ליצור את התמלילים שלך, אבל הקפד להישאר עקבי עם הבחירה שלך, במיוחד כאשר אתה משתמש בקובץ לקסיקון שנעסוק בסעיף הבא.
כל פונמה בטבלת הפונמות מייצגת צליל דיבור. האותיות המודגשות ב- "דוגמא" העמודה של טבלת ה-Phonme/Viseme בדף האנגלית האוסטרלית המקושרת למעלה מייצגת את החלק של המילה שאליו ה-"Phoneme" מתאים. לדוגמה, הפונמה /j/ מייצגת את הצליל שמשמיע דובר אנגלית אוסטרלית כאשר מבטאים את האות "y" ב-"yes".
התאם אישית את ההגייה באמצעות לקסיקונים
תגי פונמה מתאימים למצבים חד-פעמיים להתאמה אישית של מקרים בודדים, אך הם אינם ניתנים להרחבה. אם אתה מעבד נפח עצום של טקסט, המנוהל על ידי עורכים ומבקרים שונים, אנו ממליצים להשתמש בלקסיקונים. באמצעות לקסיקונים, אתה יכול להשיג עקביות בהוספת הגיות מותאמות אישית ובמקביל להפחית את המאמץ הידני של הכנסת תגי פונמה לתוך הסקריפט.
תרגול טוב הוא שאחרי שתבדוק את ההגייה המותאמת אישית בקונסולת Amazon Polly באמצעות ה תג, אתה יוצר ספרייה של הגיות מותאמות אישית באמצעות לקסיקונים. לאחר העלאת קובץ הלקסיקונים, אמזון פולי תחיל באופן אוטומטי הגיות פונטיות המצוינות בקובץ הלקסיקונים ותבטל את הצורך לספק באופן ידני תָג.
צור קובץ לקסיקון
קובץ לקסיקון מכיל את המיפוי בין מילים ואת ההגייה הפונטית שלהן. מפרט לקסיקון הגייה (PLS) היא המלצת W3C לציון מידע הגייה הדדי. להלן מסמך PLS לדוגמה:
ודא שאתה משתמש בערך הנכון עבור xml:lang
שדה. להשתמש en-AU
אם אתה מעלה את קובץ הלקסיקון לשימוש עם הקול האנגלי האוסטרלי של אמזון פולי. לרשימה מלאה של שפות נתמכות, עיין ב שפות נתמכות על ידי אמזון פולי.
כדי לציין הגייה מותאמת אישית, עליך להוסיף א אלמנט שהוא מיכל לערך מילוני עם אחד או יותר <grapheme>
אלמנט ופרטי הגייה אחד או יותר מסופקים בפנים <phoneme>
אלמנט.
אל האני <grapheme>
הרכיב מכיל את הטקסט המתאר את אורתוגרפיה של אֵלֵמֶנט. אתה יכול להשתמש ב-a <grapheme>
רכיב כדי לציין את המילה שאת ההגייה שלה ברצונך להתאים אישית. אתה יכול להוסיף מרובים <grapheme>
רכיבים כדי לציין את כל וריאציות המילים, למשל עם או בלי מאקרו. ה <grapheme>
האלמנט הוא רגיש לאותיות רישיות, ובמהלך סינתזת דיבור מחרוזת Amazon Polly מתאימה למילים בתוך הסקריפט שלך שאתה ממיר לדיבור. אם נמצא התאמה, הוא משתמש ב- אלמנט, המתאר כיצד ה מבוטא כיצירת תעתיק פונטי.
אתה יכול גם להשתמש <alias>
עבור קיצורים נפוצים. בדוגמה הקודמת של קובץ לקסיקון, NZ משמש ככינוי עבור ניו זילנד. המשמעות היא שבכל פעם שאמזון פולי נתקלת ב-"NZ" (עם רישיות תואמת) בגוף הטקסט, היא תקרא את שתי האותיות האלה כ"ניו זילנד".
למידע נוסף על פורמט קובץ לקסיקון, ראה מפרט לקסיקון ההגייה (PLS) גרסה 1.0 באתר W3C.
אתה יכול לשמור קובץ לקסיקון עם כקובץ .pls או .xml לפני העלאתו לאמזון פולי.
העלה והחל את קובץ הלקסיקון
העלה את קובץ הלקסיקון שלך לאמזון פולי באמצעות ההוראות הבאות:
- בקונסולת אמזון פולי, בחר לקסיקונים בחלונית הניווט.
- לבחור העלה לקסיקון.
- הזן שם ללקסיקון ולאחר מכן בחר קובץ לקסיקון.
- בחר את הקובץ להעלאה.
- לבחור העלה לקסיקון.
אם כבר קיים לקסיקון באותו שם (בין אם קובץ .pls או .xml), העלאת הלקסיקון מחליפה את הלקסיקון הקיים.
עכשיו אתה יכול ליישם את הלקסיקון כדי להתאים אישית את ההגייה.
- לבחור טקסט לדיבור בחלונית הניווט.
- לְהַרְחִיב הגדרות נוספות.
- להדליק התאם אישית את ההגייה.
- בחר את הלקסיקון בתפריט הנפתח.
אתה יכול גם לבחור העלה לקסיקון להעלות קובץ לקסיקון חדש (או גרסה חדשה).
זה מנהג טוב לשלוט בגירסה של קובץ הלקסיקון במאגר קוד מקור. שמירת ההגיות המותאמות אישית בקובץ לקסיקון מבטיחה שתוכלו להתייחס באופן עקבי להגיות פונטיות עבור מילים מסוימות ברחבי הארגון. כמו כן, זכור את מגבלות לקסיקון ההגייה המוזכרות מכסות באמזון פולי עמוד.
בדוק את ההגייה לאחר החלת הלקסיקון
בואו נבצע בדיקה מהירה באמצעות "מאחל לכל המאזינים שלי ב-NZ, מאושרת מאטריקי מאוד" כטקסט הקלט.
אנו יכולים להשוות את קבצי האודיו לפני ואחרי החלת הלקסיקון.
לפני יישום הלקסיקון:
לאחר יישום הלקסיקון:
סיכום
בפוסט זה, דנו כיצד ניתן להתאים אישית הגיות של ראשי תיבות או מילים נפוצות שאינן נמצאות בשפה הנבחרת באמזון פולי. אתה יכול להשתמש תג SSML שהוא מעולה להכנסת התאמות אישיות חד פעמיות או למטרות בדיקה. אנו ממליצים להשתמש בלקסיקון כדי ליצור קבוצה עקבית של הגיות עבור מילים בשימוש תכוף ברחבי הארגון שלך. זה מאפשר לכותבי התוכן שלך להשקיע זמן בכתיבה במקום במשימה המייגעת של הוספת הגיות פונטיות בתסריט באופן חוזר ונשנה. אתה יכול לנסות זאת בחשבון AWS שלך בקונסולת אמזון פולי.
סיכום משאבים
על הכותבים
ראטן קומאר הוא אדריכל פתרונות שבסיסו מאוקלנד, ניו זילנד. הוא עובד עם לקוחות ארגוניים גדולים ומסייע להם לעצב ולבנות יישומים מאובטחים, חסכוניים ואמינים בקנה מידה אינטרנט באמצעות ענן AWS. הוא נלהב מטכנולוגיה ואוהב לחלוק ידע באמצעות פוסטים בבלוג ומפגשי עוויתות.
מאצ'יק טגי הוא מעצב אודיו ראשי ומנהל מוצר עבור קולות פולי ברנד. הוא עבד בתפקיד מקצועי בתעשיית הטכנולוגיה, סרטים, פרסומות ולוקליזציה של משחקים. בשנת 2013, הוא היה מהנדס האודיו הראשון שנשכר לצוות Alexa Text-To-Spech. Maciek היה מעורב בשחרור של 12 קולות Alexa TTS במדינות שונות, למעלה מ-20 קולות של פולי ו-4 קולות סלבריטאים של Alexa. Maciek הוא טריאתלט, ונגן גיטרה אקוסטית נלהב.
- "
- 100
- 116
- אודות
- חֶשְׁבּוֹן
- להשיג
- לרוחב
- מתקדם
- Alexa
- תעשיות
- כְּבָר
- אמזון בעברית
- יישומים
- מריחה
- אודיו
- אוסטרליה
- המכונית
- אוטומטי
- AWS
- לפני
- תועלת
- חיוב
- בלוג
- בלוג הודעות
- גוּף
- גבול
- אריזה מקורית
- מותג
- לִבנוֹת
- שיחה
- קיבולת
- מקרים
- סלבריטאים
- מסוים
- לבחור
- קרוב יותר
- ענן
- קוד
- טור
- קונסול
- צור קשר
- מכולה
- מכיל
- תוכן
- לִשְׁלוֹט
- עלות תועלת
- מדינות
- לכסות
- לִיצוֹר
- יוצרים
- מנהג
- לקוחות
- אספקה
- להפגין
- עיצוב
- מפתח
- אחר
- בְּמַהֲלָך
- חינוך
- מאמץ
- אלמנטים
- בוטל
- מהנדס
- אנגלית
- זן
- מִפְעָל
- במיוחד
- דוגמה
- קיימים
- חוויות
- ראשון
- הבא
- זר
- פוּרמָט
- מצא
- עתיד
- מִשְׂחָק
- ליצור
- טוב
- גדול
- שמח
- עזרה
- איך
- HTTPS
- עצום
- בן אנוש
- תעשייה
- מידע
- קלט
- אינטרנט
- יכולת פעולה הדדית
- מעורב
- IT
- שמירה
- ידע
- שפה
- שפות
- גָדוֹל
- למידה
- תנופה
- סִפְרִיָה
- רשימה
- מקומי
- עושה
- הצליח
- מנהל
- מדריך ל
- באופן ידני
- מיפוי
- להתאים
- תואם
- אומר
- מוּזְכָּר
- יכול
- אכפת לי
- יותר
- סרטים
- מספר
- שמות
- ניווט
- ראש השנה
- ניו זילנד
- חדשות
- נוֹרמָלִי
- המיוחדות שלנו
- אפשרות
- ארגון
- אחר
- חלק
- לוהט
- אֲנָשִׁים
- שחקן
- פודקאסט
- פופולרי
- הודעות
- תרגול
- להציג
- מנהל
- תהליך
- מיוצר
- המוצר
- מקצועי
- לספק
- מספק
- הוצאה לאור
- למטרות
- שאלה
- מָהִיר
- הקוראים
- זמן אמת
- להמליץ
- להפחית
- אָמִין
- מאגר
- לייצג
- מייצג
- להרחבה
- סולם
- חיפוש
- לבטח
- נבחר
- שרות
- הפעלות
- סט
- שיתוף
- So
- מוצק
- פתרונות
- כמה
- קוד מקור
- רַמקוֹל
- מפרט
- לבלות
- תֶקֶן
- מצב
- להשאר
- זרם
- תמיכה
- נתמך
- תומך
- מערכות
- נבחרת
- טק
- תעשיית הטכנולוגיה
- טכנולוגיות
- טכנולוגיה
- מבחן
- בדיקות
- וושינגטון פוסט
- דרך
- זמן
- היום
- חלק עליון
- פִּרפּוּר
- להשתמש
- ערך
- מגוון
- גרסה
- קול
- VOICES
- כֶּרֶך
- W3
- וושינגטון
- אתר
- אם
- ויקיפדיה
- לְלֹא
- מילים
- עבד
- עובד
- כתיבה
- XML
- שנה