צור וידאו עם AI וכמה מילים: בדוק את הכלי החדש של Meta PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

צור וידאו עם AI וכמה מילים: בדוק את הכלי החדש של Meta

בינה מלאכותית משתפרת יותר ויותר ביצירת תמונה בתגובה לקומץ מילים, עם מחוללי תמונות AI זמינים לציבור כגון DALL-E 2 ו-Stable Diffusion. כעת, חוקרי Meta לוקחים את הבינה המלאכותית צעד קדימה: הם משתמשים בה כדי לרקוח סרטונים מהנחיית טקסט.

מנכ"ל מטה, מארק צוקרברג פורסם בפייסבוק ביום חמישי על המחקר, הנקרא עשה-א-וידאו, עם קליפ של 20 שניות שחיבר כמה הנחיות טקסט שבהן השתמשו חוקרי Meta והסרטונים שהתקבלו (הקצרים מאוד). ההנחיות כוללות "דובון מצייר דיוקן עצמי", "חללית נוחתת על מאדים", "עצלן תינוק עם כובע סרוג מנסה להבין מחשב נייד", ו"רובוט גולש על גל באוקיינוס".

הסרטונים עבור כל הנחיה הם רק כמה שניות באורך, והם בדרך כלל מראים את מה שההנחיה מציעה (למעט העצלן התינוק, שלא נראה כמו היצור האמיתי), ברזולוציה נמוכה למדי ומעט קופצנית סִגְנוֹן. למרות זאת, זה מדגים כיוון חדש של מחקר בינה מלאכותית כאשר מערכות הופכות טובות יותר ויותר ביצירת תמונות ממילים. אם הטכנולוגיה תשוחרר בסופו של דבר באופן נרחב, היא תעלה הרבה מאותן חששות שמעוררות מערכות טקסט לתמונה, כגון שהיא יכולה לשמש להפצת מידע מוטעה באמצעות וידאו.

דף אינטרנט for Make-A-Video כולל קטעים קצרים אלה ואחרים, שחלקם נראים מציאותיים למדי, כמו סרטון שנוצר בתגובה להנחיה "דגי ליצנים שוחים דרך שונית האלמוגים" או אחד שנועד להראות "זוג צעיר הולך בגשם כבד".

בפוסט שלו בפייסבוק, צוקרברג הצביע על כמה מסובך ליצור תמונה נעה מקומץ מילים.

"הרבה יותר קשה ליצור וידאו מאשר תמונות, כי מעבר לייצור נכון של כל פיקסל, המערכת צריכה גם לחזות כיצד הם ישתנו לאורך זמן", כתב.

מאמר מחקר תיאור העבודה מסביר שהפרויקט משתמש במודל AI טקסט לתמונה כדי להבין כיצד מילים מתכתבות עם תמונות, ובטכניקת AI הידועה בשם למידה ללא פיקוח - שבהם אלגוריתמים נקבו בנתונים שאינם מתויגים כדי להבחין בתבניות בתוכם - כדי להסתכל בסרטונים ולקבוע איך נראית תנועה מציאותית.

כמו במערכות בינה מלאכותיות ופופולריות שמייצרות תמונות מטקסט, החוקרים ציינו כי מודל הבינה המלאכותית של טקסט לתמונה הוכשר על נתוני אינטרנט - מה שאומר שהוא למד "וסביר להניח שהטיות חברתיות מוגזמות, כולל מזיקות", החוקרים כתבתי. הם ציינו שהם סיננו נתונים עבור "תוכן NSFW ומילים רעילות", אך מכיוון שמערכי נתונים יכולים לכלול מיליוני רבים של תמונות וטקסט, ייתכן שלא ניתן יהיה להסיר את כל התוכן הזה.

צוקרברג כתב שמטה מתכננת לשתף את פרויקט Make-A-Video כהדגמה בעתיד.

The-CNN-Wire™ & © 2022 Cable News Network, Inc., חברת Warner Bros. Discovery. כל הזכויות שמורות.

בול זמן:

עוד מ WRAL Techwire