כיצד Süddeutsche Zeitung ייעלתה את תהליך קריינות האודיו שלהם עם Amazon Polly PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

כיצד Süddeutsche Zeitung מטיבה את תהליך קריינות האודיו שלהם עם אמזון פולי

זהו פוסט אורח מאת Jakob Kohl, מפתח תוכנה ב- Süddeutsche Zeitung. Süddeutsche Zeitung הוא אחד מהעיתונים האיכותיים המובילים בגרמניה בכל הנוגע למנויים בתשלום ומשתמשים ייחודיים. האתר שלה, SZ.de, מגיע ליותר מ-15 מיליון משתמשים חודשיים ייחודיים החל מאוקטובר 2021.

הודות לרמקולים ופודקאסטים חכמים, תעשיית האודיו חוותה פריחה של ממש בשנים האחרונות. בְּ Süddeutsche צייטונג, אנחנו כל הזמן מחפשים דרכים חדשות להפוך את העיתונות המגוונת שלנו לנגישה עוד יותר. כחלוצים בעיתונות דיגיטלית, אנחנו רוצים לפתוח יותר הזדמנויות עבור Süddeutsche צייטונג הקוראים לצרוך מאמרים. התחלנו לחפש פתרונות שיכולים לספק קריינות אודיו באיכות גבוהה למאמרים שלנו. המטרה הסופית שלנו הייתה להשיק תכונה של "האזנה לכתבה".

בפוסט זה, אנו משתפים כיצד ביצענו אופטימיזציה לתהליך קריינות האודיו שלנו עם אמזון פולי, שירות שהופך אותו טקסט לתוך דיבור אמיתי באמצעות טכנולוגיות למידה עמוקה מתקדמות.

למה אמזון פולי?

אנחנו מאמינים שויקי, העצבית הגרמנית קול אמזון פולי, הוא כרגע הקול הגרמני הטוב ביותר בשוק. אמזון פולי מציעה את התכונה המרשימה לעבור בין שפות, הגייה נכונה למשל כותרות סרטים באנגלית וכן שמות אישיים בשפות שונות (לדוגמה, האזינו למאמר Schall und Wahn באתר שלנו).

חלק גדול מהתשתית שלנו כבר פועל על AWS, אז באמצעות אמזון פולי היה התאמה מושלמת. אנחנו יכולים לשלב את אמזון פולי עם הרכיבים הבאים:

  • An שירות התראה פשוט של אמזון (Amazon SNS) נושא אליו נוכל להירשם למאמרים. המאמרים נשלחים לנושא זה על ידי ה-CMS בכל פעם שהם נשמרים על ידי עורך.
  • An אמזון CloudFront הפצה עם Lambda@Edge למאמרי פרימיום של חומת תשלום, שבהם נוכל לעשות שימוש חוזר עבור גרסאות שמע של מאמרים.

השמיים אמזון פולי API קל לשימוש ומתועד היטב. לקח לנו פחות משבוע לגרום להוכחת הרעיון שלנו לעבוד.

האתגר

מאות מאמרים חדשים מתפרסמים מדי יום ב-SZ.de. לאחר הפרסום הראשוני, הם עשויים להתעדכן מספר פעמים מסיבות שונות - פסקאות חדשות מתווספות במאמרים מונעי חדשות, שגיאות הקלדה מתוקנות, טיזרים משתנים או מטא נתונים עוברים אופטימיזציה למנועי חיפוש.

יצירת דיבור לפרסום ראשוני של מאמר היא פשוטה, מכיוון שצריך לסנתז את כל הטקסט. אבל איך נוכל ליצור במהירות את האודיו עבור גרסאות מעודכנות של מאמרים מבלי לשלם פעמיים עבור אותו תוכן? האתגר הגדול ביותר שלנו היה למנוע שליחת כל הטקסט לאמזון פולי שוב ושוב עבור כל עדכון בודד.

הפתרון הטכני שלנו

בכל פעם שעורך שומר מאמר, הגרסה החדשה של המאמר מתפרסמת לנושא SNS. א AWS למבדה הפונקציה רשומה לנושא זה ונקראת לכל גרסה חדשה של מאמר. פונקציה זו מפעילה את השלבים הבאים:

  1. בדוק אם הגרסה החדשה של המאמר כבר סונתזה לחלוטין. אם כן, הפונקציה נעצרת מיד (זה עלול לקרות כאשר רק מטא נתונים משתנים שלא משפיעים על האודיו).
  2. המר את המאמר לכפולות מסמכי SSML, בערך אחד עבור כל פסקת טקסט.
  3. עבור כל מסמך SSML, הפונקציה בודקת אם הוא כבר סונתז לאודיו באמצעות hashes מחושבים. לדוגמה:
    1. אם מאמר נשמר בפעם הראשונה, יש לסנתז את כל מסמכי ה-SSML.
    2. אם תוקנה שגיאת הקלדה בפסקה בודדת, יש לסנתז מחדש רק את מסמך ה-SSML עבור פסקה זו.
    3. אם נוספה פסקה חדשה למאמר, יש לסנתז רק את מסמך ה-SSML עבור הפסקה החדשה הזו.
  4. שלח את כל מסמכי ה-SSML שעדיין לא מסונתזים בנפרד לאמזון פולי.

בדיקות אלו עוזרות לייעל את הביצועים ולהפחית עלויות על ידי מניעת סינתזה של מאמר שלם מספר פעמים. אנו נמנעים מחיובים נוספים עקב שינויים קלים כגון עריכת כותרת או התאמות מטא נתונים מסיבות SEO.

התרשים הבא ממחיש את זרימת העבודה של הפיתרון.

כיצד Süddeutsche Zeitung ייעלתה את תהליך קריינות האודיו שלהם עם Amazon Polly PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

לאחר שאמזון פולי מסנתז את מסמכי ה-SSML, קובצי האודיו נשלחים לדלי פלט ב שירות אחסון פשוט של אמזון (אמזון S3). פונקציית Lambda שנייה היא האזנה ליצירת אובייקט באותו דלי, ממתינה להשלמת כל קטעי האודיו של מאמר וממזגת אותם לקובץ שמע סופי באמצעות FFmpeg משכבת ​​למבדה. השמע הסופי הזה נשלח לדלי S3 אחר, המשמש כמקור בהפצת CloudFront שלנו. ב-CloudFront, אנו עושים שימוש חוזר בחומת תשלום קיימת עבור מאמרי פרימיום עבור גרסת האודיו המתאימה.

בהתבסס על מודל ה-freemium שלנו, אנו מספקים גרסת אודיו מקוצרת של מאמרי פרימיום. מי שאינם מנויים יכולים להאזין לפסקה הראשונה בחינם, אך נדרשים לרכוש מנוי כדי לגשת למאמר המלא.

סיכום

השילוב של אמזון פולי בתשתית הקיימת שלנו היה פשוט מאוד. התוכן שלנו דורש התאמה אישית מינימלית מכיוון שאנו כוללים רק פסקאות וכמה הפסקות נוספות. החלק המאתגר ביותר היה ביצועים ואופטימיזציה בעלויות, שהשגנו על ידי פיצול המאמר למספר מסמכי SSML התואמים לפסקאות, בדיקת שינויים בכל מסמך SSML ובניית קובץ השמע כולו על ידי מיזוג הפרגמנטים. בעזרת אופטימיזציות אלו, אנו מסוגלים להשיג את הדברים הבאים:

  • הקטן את כמות התווים המסונתזים ב-50% לפחות על ידי סינתזה של שינויים אמיתיים בלבד.
  • צמצם את הזמן שלוקח לשינוי בטקסט המאמר להופיע באודיו מכיוון שיש פחות אודיו לסנתז.
  • הוסף קבצי אודיו שרירותיים בין פסקאות מבלי לסנתז מחדש את כל המאמר. לדוגמה, אנו יכולים לכלול קובץ קול בגרסת האודיו המקוצרת של מאמרי פרימיום כדי להפריד בין הפסקה הראשונה לבין ההערה שלאחר מכן, כי יש צורך במנוי כדי להאזין לגרסה המלאה.

בחודש הראשון לאחר השקת התכונה "האזינו למאמר" במאמרי SZ.de שלנו, קיבלנו הרבה משוב חיובי של משתמשים. הצלחנו להגיע לכמעט 30,000 משתמשים במהלך החודשיים הראשונים לאחר ההשקה. ממשתמשים אלה, כ-2 המירו למנוי בתשלום רק מהאזנה לטיזר של מאמר מאחורי חומת התשלום שלנו. התכונה "האזנה למאמר" אינה מאחורי חומת התשלום שלנו, אך משתמשים יכולים להאזין למאמרי פרימיום במלואם רק אם יש להם מנוי. האתר שלנו מציע גם מאמרים בחינם ללא חומת תשלום. בעתיד, נרחיב את התכונה לפלטפורמות SZ אחרות, במיוחד אפליקציות החדשות שלנו לנייד.


על המחבר

כיצד Süddeutsche Zeitung ייעלתה את תהליך קריינות האודיו שלהם עם Amazon Polly PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.יעקב קוהל הוא מפתח תוכנה ב- Süddeutsche Zeitung, שם הוא נהנה לעבוד עם טכנולוגיות מודרניות בצוות אתר זריז. הוא אחד המפתחים העיקריים של תכונת "האזנה למאמר SZ". בשעות הפנאי הוא אוהב לבנות רהיטי עץ, שבהם העיצוב הטכני והוויזואלי חשוב כמו בפיתוח אתרים.

בול זמן:

עוד מ למידת מכונות AWS