הבינה המלאכותית הקטנטנה החדשה של NVIDIA הופכת תמונות לסצנות תלת מימד מלאות בשניות בלבד אינטליגנציה נתונים PlatoBlockchain. חיפוש אנכי. איי.

ה-AI החדש והקטן של NVIDIA הופך תמונות לסצנות תלת מימד מלאות בשניות בלבד

ai 3D סצינות nvidia andy warhol מחווה סוודר שחור מצלמת פולארויד

הייתה תקופה שהמרת תצלום ישן לתמונה דיגיטלית הרשימה אנשים. בימים אלה אנחנו יכולים לעשות קצת יותר, כמו מביאים לחיים תמונות וינטג' להארי פוטר. והשבוע ביצעה יצרנית השבבים NVIDIA עוד טריק קסם.

בהתבסס על עבודה קודמת, חוקרי NVIDIA הראו כיצד רשת עצבית קטנה מאומנת על כמה עשרות תמונות יכולה להציג את הסצנה המצולמת בתלת מימד מלא. כהדגמה, הצוות הפך תמונות של דוגמנית אוחזת במצלמת פולארויד - אודה לאנדי וורהול - לסצנה תלת מימדית.

העבודה בולטת מכמה סיבות.

ראשית, זה מאוד מהיר. לדגמי AI קודמים נדרשו שעות להתאמן ודקות לעיבוד סצנות תלת-ממדיות. הרשת העצבית של NVIDIA לוקחת לא יותר מכמה דקות לאימון ומציגה את הסצנה תוך עשרות אלפיות שניות. שנית, הבינה המלאכותית עצמה היא זעירה בהשוואה לדגמי השפה העצומים של ימינו. דגמים גדולים כמו GPT-3 מתאמנים על מאות או אלפי יחידות עיבוד גרפיות (GPUs). AI עיבוד התמונה של NVIDIA פועל על GPU יחיד.

העבודה מתבססת על שדות זוהר עצביים (NeRFs), טכניקה שפותחה על ידי חוקרים ב-UC Berkeley, UC San Diego ו-Google Research, לפני כמה שנים. בקיצור, NeRF לוקח מערך נתונים מוגבל - נניח, 36 תצלומים של נושא שצולמו ממגוון זוויות - ולאחר מכן חוזה את הצבע, העוצמה והכיוון של האור המוקרן ממנו כל נקודה בסצנה. כלומר, הרשת העצבית משלימה את הפערים בין התמונות בניחושים הטובים ביותר על סמך נתוני האימון. התוצאה היא חלל תלת מימדי רציף שתפור יחד מהתמונות המקוריות.

התרומה האחרונה של NVIDIA, מתואר בעיתון, שם NeRFs על תרופות משפרי ביצועים. על פי העיתון, השיטה החדשה, המכונה Instant NeRF, מנצלת גישה המכונה קידוד גריד רב-רזולוציה כדי לפשט את ארכיטקטורת האלגוריתם ולהפעיל אותו במקביל על GPU. זה העלה את הביצועים בכמה סדרי גודל - האלגוריתם שלהם פועל עד פי 1,000 מהר יותר, לפי פוסט בבלוג של NVIDIA- מבלי לוותר על האיכות.

NVIDIA מדמיינת שהטכנולוגיה יכולה למצוא את דרכה לרובוטים ולמכוניות בנהיגה עצמית, לעזור להם לדמיין ולהבין טוב יותר את העולם סביבם. זה יכול לשמש גם כדי ליצור אווטרים בעלי נאמנות גבוהה שאנשים יכולים לייבא לעולמות וירטואליים או לשכפל סצנות בעולם הדיגיטלי שבו מעצבים יכולים לשנות ולהתבסס עליהם.

המהירות והגודל של רשתות עצביות חשובות במקרים כאלה, מכיוון שאלגוריתמים ענקיים הדורשים כמויות אדירות של כוח מחשוב אינם יכולים לשמש את רוב האנשים, והם גם לא מעשיים עבור רובוטים ומכוניות ללא חיבורים מהירים ומהימנים לענן.

ההדגמה הייתה חלק מכנס המפתחים של NVIDIA השבוע. דגשים נוספים כללו מערכת למכוניות בנהיגה עצמית שמטרתה מפה 300,000 מיילים של כבישים עד לסנטימטרים עד 2024 ו- מחשב-על בינה מלאכותית לדברי החברה, יהיה המהיר ביותר בעולם עם השחרור (גם טענה תוצרת Meta לאחרונה).

כל זה משתלב היטב נרטיב גדול יותר. העולם הדיגיטלי מדמם לתוך העולם האמיתי, ולהיפך. ולא רק ספרים, מוזיקה, תמונות, מסמכים ותשלומים - אלא אנשים, מקומות ותשתיות. בהתחשב בשבבים של NVIDIA מצטיינים בבינה מלאכותית ובגרפיקה, החברה ממוקמת היטב כדי שתהיה יד בהכל. ואכן, לא מסתפקת ביצירת העתקים דיגיטליים של סצנות בודדות, החברה אמרה שהיא בונה א התאום הדיגיטלי של כדור הארץ מדי.

נכון, זה נהיה יותר ויותר קשה למתוח את הגבול בין הצעות שיווק ומכירות לבין התפתחויות רציניות. זה לא נדיר לראות שילובים של כל מילות הבאז המובילות של הטכנולוגיה - NFTs, metaverse, AI, blockchain-בכותרת אחת. אבל למרות שנראה שהראייה עולה על היכולת, יש הרבה רמזים שנגיע לשם במוקדם או במאוחר.

מיני בינה מלאכותית שיכולה להפוך ערימה של פולארואידים לסצנה תלת מימדית היא רק אחת מהן.

תמונת אשראי: NVIDIA

בול זמן:

עוד מ רכזת הסינגולריות