בינה מלאכותית משמשת ליצירת הכל תמונות ל טֶקסט ל חלבונים מלאכותיים, ועכשיו נוסף דבר נוסף לרשימה: דיבור. בשבוע שעבר חוקרים מ מיקרוסופט פרסמה מאמר על AI חדש בשם VALL-E שיכול לדמות במדויק את הקול של כל אחד על סמך דגימה באורך של שלוש שניות בלבד. VALL-E אינו סימולטור הדיבור הראשון שנוצר, אבל הוא בנוי בצורה שונה מזו של קודמיו - ועלול לשאת סיכון גדול יותר לשימוש לרעה פוטנציאלי.
רוב המודלים הקיימים של טקסט לדיבור משתמשים בצורות גל (ייצוגים גרפיים של גלי קול כשהם נעים במדיום לאורך זמן) כדי ליצור קולות מזויפים, לצבוט מאפיינים כמו טון או גובה צליל כדי להעריך קול נתון. עם זאת, VALL-E לוקח דגימה של קול של מישהו ומפרק אותו לרכיבים הנקראים אסימונים, ואז משתמש באסימונים האלה כדי ליצור צלילים חדשים על סמך ה"חוקים" שהוא כבר למד על הקול הזה. אם קול עמוק במיוחד, או שדובר מבטא את ה-A שלו בצורה אפית, או שהם מונוטוניים יותר מהממוצע, כל אלו הן תכונות שה-AI היה קולט עליהן ויוכל לשכפל.
המודל מבוסס על טכנולוגיה הנקראת EnCodec מאת Meta, שיצא רק בחלק זה באוקטובר. הכלי משתמש במערכת של שלושה חלקים כדי לדחוס אודיו לקטנה פי 10 מקובצי MP3 ללא הפסד באיכות; יוצריו התכוונו שאחד השימושים שלו הוא שיפור איכות הקול והמוזיקה בשיחות שנעשות בחיבורים ברוחב פס נמוך.
כדי לאמן את VALL-E, יוצריו השתמשו בספריית אודיו בשם LibriLight, ש-60,000 שעות הדיבור שלו באנגלית מורכבות בעיקר מקריינות ספרי שמע. המודל מניב את התוצאות הטובות ביותר שלו כאשר הקול המסונתז דומה לאחד מהקולות מספריית ההדרכה (שיש יותר מ-7,000 מהם, אז זה לא אמור להיות גבוה מדי).
מלבד יצירה מחדש של קול של מישהו, VALL-E גם מדמה את סביבת האודיו מהדגימה של שלוש שניות. קליפ שהוקלט בטלפון יישמע שונה מזה שנוצר באופן אישי, ואם אתה הולך או נוהג תוך כדי שיחה, האקוסטיקה הייחודית של תרחישים אלה נלקחת בחשבון.
חלק דגימות נשמעים מציאותיים למדי, בעוד שאחרים עדיין נוצרים באופן ברור מאוד ממוחשב. אבל יש הבדלים בולטים בין הקולות; אתה יכול לדעת שהם מבוססים על אנשים שיש להם סגנונות דיבור, צלילים ודפוסי אינטונציה שונים.
הצוות שיצר את VALL-E יודע שזה יכול לשמש בקלות רבה שחקנים גרועים; החל מזיוף צלילים של פוליטיקאים או סלבריטאים ועד שימוש בקולות מוכרים כדי לבקש כסף או מידע בטלפון, יש אינספור דרכים לנצל את הטכנולוגיה. הם נמנעו בחוכמה מהפיכת הקוד של VALL-E לזמין לציבור, וכללו הצהרת אתיקה בסוף המאמר שלהם (שלא תעזור הרבה כדי להרתיע כל מי שרוצה להשתמש ב-AI למטרות מרושעות).
סביר להניח שזה רק עניין של זמן עד שכלים דומים יצצו וייפלו לידיים הלא נכונות. החוקרים מציעים שניתן להפחית את הסיכונים שמודלים כמו VALL-E יציגו על ידי בניית מודלים לזיהוי כדי לאמוד אם קטעי אודיו הם אמיתיים או מסונתזים. אם אנחנו צריכים בינה מלאכותית כדי להגן עלינו מפני בינה מלאכותית, איך נדע אם לטכנולוגיות הללו יש השפעה חיובית נטו? הזמן יגיד.
תמונת אשראי: Shutterstock.com/טנצ'ה
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- Platoblockchain. Web3 Metaverse Intelligence. ידע מוגבר. גישה כאן.
- מקור: https://singularityhub.com/2023/01/12/microsofts-new-ai-can-clone-your-voice-in-just-3-seconds/
- 000
- 10
- 7
- a
- יכול
- אודות
- חֶשְׁבּוֹן
- במדויק
- הוסיף
- יתרון
- AI
- תעשיות
- כְּבָר
- ו
- אחר
- כל אחד
- אודיו
- זמין
- מְמוּצָע
- רע
- מבוסס
- לפני
- להיות
- הטוב ביותר
- בֵּין
- הפסקות
- בִּניָן
- נבנה
- נקרא
- שיחות
- לשאת
- ידוענים
- מאפיינים
- קליפים
- קוד
- רכיבים
- שנוצר על ידי מחשב
- חיבורי
- יכול
- לִיצוֹר
- נוצר
- יוצרים
- אשראי
- עמוק
- איתור
- ההבדלים
- אחר
- מטה
- נהיגה
- בקלות
- אנגלית
- סביבה
- אתיקה
- הכל
- קיימים
- פייסבוק
- למדי
- מְזוּיָף
- ליפול
- מוכר
- ראשון
- החל מ-
- ליצור
- GitHub
- נתן
- יותר
- ידיים
- יש
- שעות
- איך
- HTTPS
- פְּגִיעָה
- שיפור
- in
- כלול
- מידע
- IT
- לדעת
- אחרון
- למד
- סִפְרִיָה
- סביר
- רשימה
- ארוך
- את
- עשוי
- עשייה
- דבר
- בינוני
- מודל
- מודלים
- כסף
- יותר
- המהלך
- כלי נגינה
- צורך
- נטו
- חדש
- אוֹקְטוֹבֶּר
- ONE
- להזמין
- אחרים
- מאמר
- חלק
- במיוחד
- דפוסי
- אֲנָשִׁים
- אדם
- טלפון
- לבחור
- גובה הצליל
- שרפים
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- פוליטיקאים
- חיובי
- פוטנציאל
- להציג
- בראש ובראשונה
- להגן
- בפומבי
- למטרות
- איכות
- ממשי
- מציאותי
- מוקלט
- שוחרר
- לבקש
- חוקרים
- תוצאות
- הסיכון
- סיכונים
- תרחישים
- שניות
- Shutterstock
- דומה
- מדמה
- קטן יותר
- So
- קול
- רַמקוֹל
- מדבר
- נאום
- אביב
- הצהרה
- עוד
- מערכת
- לקחת
- לוקח
- מדבר
- נבחרת
- טכנולוגיות
- טכנולוגיה
- טקסט לדיבור
- אל האני
- שֶׁלָהֶם
- דבר
- שְׁלוֹשָׁה
- דרך
- זמן
- פִּי
- ל
- מטבעות
- צליל
- גַם
- כלי
- כלים
- רכבת
- הדרכה
- tweaking
- ייחודי
- us
- להשתמש
- קול
- VOICES
- הליכה
- גלים
- דרכים
- שבוע
- אם
- אשר
- בזמן
- מי
- יצטרך
- היה
- טעות
- ידיים לא נכונות
- תשואות
- אתה
- זפירנט