אמזון תעתיק הוא שירות זיהוי דיבור אוטומטי (ASR) מנוהל במלואו המאפשר לך להוסיף יכולות דיבור לטקסט ליישומים שלך. היום, אנו שמחים להכריז על הדור הבא של מערכת בסיס דיבור מרובה מיליארדי פרמטרים המופעלת על ידי מודל, המרחיבה את זיהוי הדיבור האוטומטי למעל 100 שפות. בפוסט זה, אנו דנים בכמה מהיתרונות של מערכת זו, כיצד חברות משתמשות בה וכיצד להתחיל. אנו מספקים גם דוגמה לפלט התעתיק למטה.
מודל בסיס הדיבור של תמלול מאומן באמצעות אלגוריתמים בפיקוח עצמי הטובים בכיתה, כדי ללמוד את הדפוסים האוניברסליים המובנים של דיבור אנושי על פני שפות ומדגשים. הוא מאומן על מיליוני שעות של נתוני אודיו ללא תווית מיותר מ-100 שפות. מתכוני האימון עוברים אופטימיזציה באמצעות דגימת נתונים חכמה כדי לאזן את נתוני האימון בין השפות, מה שמבטיח שגם שפות שמסורתיות חסרות ייצוג מגיעות לרמות דיוק גבוהות.
Carbyne היא חברת תוכנה המפתחת פתרונות מוקדי קשר מבוססי ענן קריטיים למשימה עבור מגיבים לשיחות חירום. המשימה של קארבין היא לעזור לאנשי חירום להציל חיים, והשפה לא יכולה להפריע למטרות שלהם. הנה איך הם משתמשים ב- Amazon Transcribe כדי לממש את המשימה שלהם:
"תרגום Carbyne Live Audio המופעל על ידי AI מכוון ישירות לשיפור תגובת החירום עבור 68 מיליון האמריקאים הדוברים שפה שאינה אנגלית בבית, בנוסף לעד 79 מיליון מבקרים זרים במדינה מדי שנה. על ידי מינוף מודל היסודות הרב-לשוני החדש של Amazon Transcribe מופעל ASR, Carbyne תהיה מצוידת אפילו יותר לדמוקרטיזציה של שירותי חירום מצילי חיים, כי Every. אדם. סופר."
– אלכס דיזנגוף, מייסד שותף ו-CTO של Carbyne.
על ידי מינוף מודל בסיס הדיבור, Amazon Transcribe מספקת שיפור דיוק משמעותי בין 20% ל-50% ברוב השפות. בדיבור טלפוניה, שהוא תחום מאתגר ודל נתונים, שיפור הדיוק נע בין 30% ל-70%. בנוסף לשיפור דיוק ניכר, דגם ASR גדול זה מספק גם שיפורים בקריאות עם סימני פיסוק ורישיות מדויקות יותר. עם הופעת הבינה המלאכותית הגנרטיבית, אלפי ארגונים משתמשים ב- Amazon Transcribe כדי לפתוח תובנות עשירות מתוכן האודיו שלהם. עם דיוק ותמיכה משופרים משמעותית ביותר מ-100 שפות, Amazon Transcribe ישפיע לטובה על כל מקרי השימוש הללו. כל הלקוחות הקיימים והחדשים המשתמשים ב-Amazon Transcribe במצב אצווה יכולים לגשת לזיהוי דיבור המופעל על בסיס בסיס דיבור ללא צורך בשינוי כלשהו בנקודת הקצה של ה-API או בפרמטרי הקלט.
מערכת ASR החדשה מספקת מספר תכונות מפתח בכל 100+ השפות הקשורות לקלות שימוש, התאמה אישית, בטיחות משתמש ופרטיות. אלה כוללים תכונות כגון פיסוק אוטומטי, אוצר מילים מותאם אישית, זיהוי שפה אוטומטי, יומן דובר, ציוני ביטחון ברמת המילה ומסנן אוצר מילים מותאם אישית. התמיכה המורחבת של המערכת במבטאים שונים, סביבות רעש ותנאים אקוסטיים מאפשרת לך להפיק פלטים מדויקים יותר ובכך עוזרת לך להטמיע ביעילות טכנולוגיות קול באפליקציות שלך.
הודות לרמת הדיוק הגבוהה של Amazon Transcribe על פני מבטאים ותנאי רעש שונים, התמיכה שלו במספר רב של שפות והרחב של מערכי תכונות בעלי ערך מוסף, אלפי ארגונים יוסמכו לפתוח תובנות עשירות מתוכן האודיו שלהם, כמו גם להגדיל את הנגישות והגילוי של תוכן האודיו והווידאו שלהם בתחומים שונים. לדוגמה, מרכזי קשר מתמללים ומנתחים שיחות מלקוחות כדי לזהות תובנות ובהמשך לשפר את חווית הלקוח ואת הפרודוקטיביות של הסוכן. מפיקי תוכן ומפיצי מדיה יוצרים באופן אוטומטי כתוביות באמצעות Amazon Transcribe כדי לשפר את נגישות התוכן.
התחל עם Amazon Transcribe
אתה יכול להשתמש ב ממשק שורת הפקודה של AWS (AWS CLI), קונסולת הניהול של AWS, ושונות ערכות SDK של AWS עבור תמלול אצווה והמשך להשתמש באותו StartTranscriptionJob
API כדי לקבל יתרונות ביצועים ממודל ה-ASR המשופר מבלי שתצטרך לבצע שינויים כלשהם בקוד או בפרמטרים מצדך. למידע נוסף על השימוש ב-AWS CLI ובקונסולה, עיין ב תמלול עם AWS CLI ו תמלול עם מסוף הניהול של AWS, בהתאמה.
הצעד הראשון הוא להעלות את קובצי המדיה שלך לתוך קובץ שירות אחסון פשוט של אמזון (Amazon S3) bucket, שירות אחסון אובייקטים שנבנה לאחסון ושליפה של כל כמות נתונים מכל מקום. Amazon S3 מציע עמידות, זמינות, ביצועים, אבטחה ומדרגיות כמעט בלתי מוגבלת בעלות נמוכה מאוד. אתה יכול לבחור לשמור את התמליל שלך בדלי S3 משלך, או לאפשר ל-Amazon Transcribe להשתמש בדלי ברירת מחדל מאובטח. למידע נוסף על שימוש בדלי S3, ראה יצירה, הגדרה ועבודה עם דליים של Amazon S3.
פלט תמלול
Amazon Transcribe משתמש בייצוג JSON עבור הפלט שלו. הוא מספק את תוצאת התמלול בשני פורמטים שונים: פורמט טקסט ופורמט מפורט. שום דבר לא משתנה ביחס לנקודת הקצה של ה-API או לפרמטרי הקלט.
פורמט הטקסט מספק את התמליל כגוש טקסט, בעוד שפורמט מפורט מספק את התמליל בצורה של פריטים מתומללים שהוזמנו בזמן, יחד עם מטא נתונים נוספים לכל פריט. שני הפורמטים קיימים במקביל בקובץ הפלט.
בהתאם לתכונות שתבחר בעת יצירת עבודת התמלול, Amazon Transcribe יוצר תצוגות נוספות ומועשרות של תוצאת התמלול. ראה את הקוד לדוגמה הבא:
הדעות הן כדלקמן:
- תמלילים – מיוצג על ידי ה
transcripts
אלמנט, הוא מכיל רק את פורמט הטקסט של התמליל. בתרחישים מרובי רמקולים ורב-ערוציים, שרשור של כל התמלילים מסופק כבלוק יחיד. - דוברים – מיוצג על ידי ה
speaker_labels
אלמנט, הוא מכיל את הטקסט והפורמטים המפורטים של התמליל מקובצים לפי דובר. זה זמין רק כאשר תכונת ריבוי הרמקולים מופעלת. - ערוצים – מיוצג על ידי ה
channel_labels
אלמנט, הוא מכיל את הטקסט והפורמטים המפורטים של התמליל, מקובצים לפי ערוץ. זה זמין רק כאשר תכונת ריבוי הערוצים מופעלת. - פריטים – מיוצג על ידי ה
items
אלמנט, הוא מכיל רק את הפורמט המפורט של התמליל. בתרחישים מרובי רמקולים ורב-ערוציים, פריטים מועשרים במאפיינים נוספים, המציינים רמקול וערוץ. - פלחים – מיוצג על ידי ה
segments
אלמנט, הוא מכיל את הטקסט והפורמטים המפורטים של התמליל, מקובצים לפי תמלול חלופי. זה זמין רק כאשר תכונת התוצאות החלופיות מופעלת.
סיכום
ב-AWS, אנחנו כל הזמן מחדשים למען הלקוחות שלנו. על ידי הרחבת התמיכה בשפה ב- Amazon Transcribe ליותר מ-100 שפות, אנו מאפשרים ללקוחותינו לשרת משתמשים מרקע לשוני מגוון. זה לא רק משפר את הנגישות, אלא גם פותח אפיקים חדשים לתקשורת וחילופי מידע בקנה מידה עולמי. כדי ללמוד עוד על התכונות הנדונות בפוסט זה, בדוק דף תכונות ו מה הפוסט החדש.
על המחברים
סומית קומאר הוא מנהל מוצר ראשי, טכני בצוות שירותי השפה של AWS AI. יש לו ניסיון של 10 שנים בניהול מוצר במגוון תחומים והוא נלהב מבינה מלאכותית/ML. מחוץ לעבודה, סומיט אוהבת לטייל ונהנית לשחק קריקט וטניס דשא.
ויווק סינג הוא מנהל בכיר, ניהול מוצר בצוות שירותי השפה של AWS AI. הוא מוביל את צוות המוצרים של Amazon Transcribe. לפני שהצטרף ל-AWS, הוא מילא תפקידי ניהול מוצרים בארגונים שונים אחרים של אמזון כמו תשלומי צרכנים וקמעונאות. Vivek מתגורר בסיאטל, וושינגטון ונהנה לרוץ ולטייל.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
- מקור: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/
- :יש ל
- :הוא
- :לֹא
- $ למעלה
- 10
- 100
- 14
- 24
- 7
- a
- אודות
- גישה
- נגישות
- דיוק
- מדויק
- לרוחב
- להוסיף
- תוספת
- נוסף
- הִתגַלוּת
- סוֹכֵן
- AI
- AI / ML
- מכוון
- alex
- אלגוריתמים
- תעשיות
- לאורך
- גם
- חלופה
- אמזון בעברית
- אמזון תעתיק
- אמזון שירותי אינטרנט
- אמריקאים
- כמות
- an
- לנתח
- ו
- להכריז
- מכריז
- מדי שנה
- כל
- בְּכָל מָקוֹם
- API
- יישומים
- ARE
- AS
- At
- אודיו
- מכני עם סלילה אוטומטית
- באופן אוטומטי
- זמינות
- זמין
- שדרות
- AWS
- רקע
- איזון
- BE
- כי
- בשם
- להלן
- הטבות
- מוטב
- בֵּין
- לחסום
- שניהם
- רוחב
- נבנה
- אבל
- by
- שיחה
- שיחות
- CAN
- יכולות
- היוון
- מקרים
- מרכז
- מרכזים
- אתגר
- שינוי
- שינויים
- ערוץ
- ערוצים
- לבדוק
- בחרו
- מייסד שותף
- קוד
- תקשורת
- חברות
- חברה
- השלמת
- תנאים
- אמון
- תצורה
- קונסול
- תמיד
- צרכן
- צור קשר
- מוקדי שירות
- מכיל
- תוכן
- להמשיך
- עלות
- מדינה
- יוצר
- יוצרים
- קריקט
- ראש אגף טכנולוגיה
- מנהג
- לקוח
- חווית לקוח
- לקוחות
- התאמה אישית
- נתונים
- בְּרִירַת מֶחדָל
- מספק
- דמוקרטיזציה
- מפתחת
- אחר
- ישירות
- לדון
- נָדוֹן
- מפיצים
- שונה
- תחום
- תחומים
- עמידות
- להקל
- קלות שימוש
- יעילות
- או
- אלמנט
- שבץ
- חירום
- רשאי
- לאפשר
- מופעל
- מאפשר
- סוף
- נקודת קצה
- אנגלית
- משופר
- משפר
- מועשר
- הבטחתי
- חברות
- סביבות
- מְצוּיָד
- אֲפִילוּ
- כל
- דוגמה
- חליפין
- להתקיים
- קיימים
- מורחב
- מתרחב
- ניסיון
- מאריך
- מאפיין
- תכונות
- שלח
- קבצים
- לסנן
- ראשון
- הבא
- כדלקמן
- בעד
- זר
- טופס
- פוּרמָט
- קרן
- החל מ-
- לגמרי
- ליצור
- גנרטטיבית
- AI Generative
- לקבל
- גלוֹבָּלִי
- קנה מידה גלובלי
- שערים
- שמח
- יש
- he
- הוחזק
- לעזור
- עזרה
- עוזר
- כאן
- hi
- גָבוֹהַ
- עמוד הבית
- שעות
- איך
- איך
- HTML
- http
- HTTPS
- בן אנוש
- הזדהות
- לזהות
- פְּגִיעָה
- לשפר
- משופר
- השבחה
- שיפורים
- in
- לכלול
- להגדיל
- מובילים בתעשייה
- מידע
- הטמון
- חדשנות
- קלט
- תובנות
- למשל
- אל תוך
- IT
- פריטים
- שֶׁלָה
- עבודה
- הצטרפות
- jpg
- ג'סון
- מפתח
- שפה
- שפות
- גָדוֹל
- מוביל
- לִלמוֹד
- רמות
- מינוף
- קו
- לחיות
- חי
- אוהב
- נמוך
- לעשות
- עושה
- הצליח
- ניהול
- מנהל
- מדיה
- מידע נוסף
- מִילִיוֹן
- מיליונים
- משימה
- מצב
- מודל
- יותר
- רוב
- צורך
- חדש
- הדור הבא
- רעש
- שום דבר
- מספר
- אובייקט
- of
- המיוחדות שלנו
- on
- רק
- נפתח
- אופטימיזציה
- or
- ארגונים
- אחר
- שלנו
- הַחוּצָה
- תפוקה
- פלטים
- בחוץ
- יותר
- שֶׁלוֹ
- מקביל
- פרמטר
- פרמטרים
- לוהט
- דפוסי
- תשלומים
- עבור
- ביצועים
- אדם
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- משחק
- חיובי
- הודעה
- מופעל
- מנהל
- קודם
- פְּרָטִיוּת
- לייצר
- מפיק
- המוצר
- ניהול מוצר
- מנהל מוצר
- פִּריוֹן
- נכסים
- לספק
- ובלבד
- מספק
- לרדוף
- לְהַגִיעַ
- הכרה
- להתייחס
- קָשׁוּר
- נציגות
- מיוצג
- כבוד
- בהתאמה
- תגובה
- תוצאה
- תוצאות
- קמעוני
- עשיר
- תפקידים
- ריצה
- בְּטִיחוּת
- אותו
- שמור
- בקרת מערכות ותקשורת
- סולם
- תרחישים
- סיאטל
- לבטח
- אבטחה
- לִרְאוֹת
- מגזרים
- בחר
- לחצני מצוקה לפנסיונרים
- לשרת
- שרות
- שירותים
- סטים
- כמה
- משמעותי
- באופן משמעותי
- פָּשׁוּט
- יחיד
- חכם
- תוכנה
- פתרונות
- כמה
- לדבר
- רַמקוֹל
- רמקולים
- נאום
- זיהוי דיבור
- דיבור-לטקסט
- החל
- מצב
- שלב
- אחסון
- חנות
- פשוט
- כתוצאה מכך
- ניכר
- כתוביות
- כזה
- תמיכה
- מערכת
- נבחרת
- טכני
- טכנולוגיות
- טֶקסט
- מֵאֲשֶׁר
- זֶה
- השמיים
- שֶׁלָהֶם
- בכך
- אלה
- הֵם
- זֶה
- אלפים
- דרך
- אקטואלי
- ל
- היום
- באופן מסורתי
- מְאוּמָן
- הדרכה
- תמליל
- תרגום
- נסיעות
- שתיים
- אוניברסלי
- בלתי מוגבל
- לפתוח
- להשתמש
- משתמש
- משתמשים
- שימושים
- באמצעות
- מגוון
- שונים
- מאוד
- וִידֵאוֹ
- נופים
- כמעט
- מבקרים
- קול
- דֶרֶך..
- we
- אינטרנט
- שירותי אינטרנט
- ברוך הבא
- טוֹב
- מתי
- ואילו
- אשר
- מי
- יצטרך
- עם
- לְלֹא
- תיק עבודות
- עובד
- שנים
- אתה
- זפירנט