מה זה GPU? הצ'יפים שמניעים את בום הבינה המלאכותית, ולמה הם שווים טריליונים

מה זה GPU? הצ'יפים שמניעים את בום הבינה המלאכותית, ולמה הם שווים טריליונים

מה זה GPU? השבבים המפעילים את בום הבינה המלאכותית, ולמה הם שווים טריליונים אינטליגנציה נתונים PlatoBlockchain. חיפוש אנכי. איי.

בזמן שהעולם ממהר לעשות שימוש בגל העדכני ביותר של טכנולוגיות בינה מלאכותית, חתיכה אחת של חומרת היי-טק הפכה למצרך חם להפליא: יחידת העיבוד הגרפית, או GPU.

GPU מהשורה הראשונה יכול להימכר בעבור עשרות אלפי דולרים, והיצרנית המובילה Nvidia ראתה את הערכת השוק שלה להמריא מעבר ל-2 טריליון דולר ככל שהביקוש למוצריה עולה.

גם GPUs הם לא רק מוצרי AI מתקדמים. ישנם GPUs פחות חזקים בטלפונים, מחשבים ניידים וקונסולות משחקים.

עד עכשיו אתם בוודאי תוהים: מה זה באמת GPU? ומה עושה אותם כל כך מיוחדים?

מה זה GPU?

GPUs תוכננו במקור בעיקר כדי ליצור ולהציג במהירות סצנות ואובייקטים תלת מימדיים מורכבים, כגון אלו המעורבים במשחקי וידאו ו תכנון בעזרת מחשב תוֹכנָה. GPUs מודרניים גם מטפלים במשימות כגון פירוק זרמי וידאו.

ה"מוח" של רוב המחשבים הוא שבב הנקרא יחידת עיבוד מרכזית (CPU). ניתן להשתמש במעבדים ליצירת סצנות גרפיות ולפירוק סרטונים, אבל הם בדרך כלל הרבה יותר איטיים ופחות יעילים במשימות האלה בהשוואה למעבדי GPU. מעבדים מתאימים יותר למשימות חישוב כלליות, כגון עיבוד תמלילים וגלישה בדפי אינטרנט.

במה שונים GPUs ממעבדים?

מעבד מודרני טיפוסי מורכב מ-8 עד 16 אינץ'ליבות," שכל אחת מהן יכולה לעבד משימות מורכבות באופן רציף.

למעבדי GPU, לעומת זאת, יש אלפי ליבות קטנות יחסית, שנועדו לעבוד בו-זמנית ("במקביל") כדי להשיג עיבוד כולל מהיר. זה הופך אותם למתאימים היטב למשימות הדורשות מספר רב של פעולות פשוטות שניתן לבצע בו זמנית, ולא אחת אחרי השנייה.

GPUs מסורתיים מגיעים בשני טעמים עיקריים.

ראשית, ישנם שבבים עצמאיים, שמגיעים לרוב בכרטיסי הרחבה עבור מחשבים שולחניים גדולים. שנית הם GPUs בשילוב עם CPU באותה חבילת שבבים, שנמצאים לרוב במחשבים ניידים וקונסולות משחק כמו ה-PlayStation 5. בשני המקרים, ה-CPU שולט במה שה-GPU עושה.

מדוע GPUs כל כך שימושיים עבור AI?

מסתבר שניתן לשנות את מטרת ה-GPU לעשות יותר מאשר ליצור סצנות גרפיות.

רבות מטכניקות למידת מכונה שמאחוריהן בינה מלאכותית, כמו רשתות עצביות עמוקות, מסתמכים במידה רבה על צורות שונות של כפל מטריצה.

זוהי פעולה מתמטית שבה קבוצות גדולות מאוד של מספרים מוכפלות ומסכמות יחד. פעולות אלו מתאימות היטב לעיבוד מקביל ולכן ניתן לבצע במהירות רבה על ידי GPUs.

מה הלאה עבור GPUs?

יכולת הריסוק המספרים של GPUs עולה בהתמדה עקב העלייה במספר הליבות ובמהירות הפעולה שלהן. שיפורים אלו מונעים בעיקר על ידי שיפורים בייצור השבבים על ידי חברות כגון TSMC בטיוואן.

גודלם של טרנזיסטורים בודדים - המרכיבים הבסיסיים של כל שבב מחשב - הולך ופוחת, ומאפשר למקם יותר טרנזיסטורים באותה כמות של שטח פיזי.

עם זאת, זה לא כל הסיפור. בעוד שמעבדי GPU מסורתיים שימושיים למשימות חישוב הקשורות ל-AI, הם אינם אופטימליים.

בדיוק כפי שמעבדי GPU תוכננו במקור להאיץ מחשבים על ידי מתן עיבוד מיוחד לגרפיקה, ישנם מאיצים שנועדו להאיץ משימות למידת מכונה. מאיצים אלה מכונים לעתים קרובות כ-GPUs של מרכזי נתונים.

כמה מהמאיצים הפופולריים ביותר, שיוצרו על ידי חברות כמו AMD ו-Nvidia, התחילו את דרכם כמעבדי GPU מסורתיים. עם הזמן, העיצובים שלהם התפתחו כדי להתמודד טוב יותר עם משימות למידת מכונה שונות, למשל על ידי תמיכה ביעילות יותר "צף המוחפורמט מספר.

מאיצים אחרים, כמו של גוגל יחידות עיבוד טנזור ושל Tenstorrent עשר ליבות, תוכננו מהיסוד כדי להאיץ רשתות עצביות עמוקות.

מעבדי GPU של מרכזי נתונים ומאיצי בינה מלאכותית אחרים מגיעים בדרך כלל עם הרבה יותר זיכרון מכרטיסי תוספות GPU מסורתיים, דבר חיוני לאימון דגמי בינה מלאכותית גדולים. ככל שדגם ה-AI גדול יותר, כך הוא מסוגל ומדויק יותר.

כדי להאיץ עוד יותר את ההכשרה ולטפל בדגמי AI גדולים יותר, כגון ChatGPT, ניתן לאגד מעבדי GPU רבים של מרכזי נתונים ליצירת מחשב-על. זה דורש תוכנה מורכבת יותר כדי לרתום כראוי את כוח מחיקת המספרים הזמין. גישה נוספת היא ל ליצור מאיץ אחד גדול מאוד, כמו ה "מעבד בקנה מידה רקיק" בהפקת Cerebras.

האם צ'יפס מיוחדים הם העתיד?

גם המעבדים לא עמדו במקום. למעבדים האחרונים של AMD ו-Intel יש הוראות מובנות ברמה נמוכה שמאיצות את מחיקת המספרים הנדרשת ברשתות עצביות עמוקות. הפונקציונליות הנוספת הזו עוזרת בעיקר במשימות "מסק" - כלומר באמצעות מודלים של AI שכבר פותחו במקומות אחרים.

כדי להכשיר את דגמי הבינה המלאכותית מלכתחילה, עדיין יש צורך במאיצים גדולים דמויי GPU.

אפשר ליצור מאיצים מיוחדים יותר ויותר עבור אלגוריתמים ספציפיים של למידת מכונה. לאחרונה, למשל, חברה בשם Groq הפיקה "יחידת עיבוד שפה” (LPU) תוכנן במיוחד להפעלת דגמי שפות גדולים בנוסח ChatGPT.

עם זאת, יצירת מעבדים מיוחדים אלה דורשת משאבים הנדסיים ניכרים. ההיסטוריה מראה שהשימוש והפופולריות של כל אלגוריתם למידת מכונה נתון נוטים להגיע לשיא ואז לדעוך - כך שחומרה מיוחדת יקרה עשויה להתיישן במהירות.

עם זאת, עבור הצרכן הממוצע, סביר להניח שלא תהיה בעיה. סביר להניח שמעבדי ה-GPU והשבבים האחרים במוצרים שבהם אתה משתמש ימשיכו להיות מהירים יותר בשקט.

מאמר זה פורסם מחדש מתוך שיחה תחת רישיון Creative Commons. קרא את ה מאמר מקורי.

תמונת אשראי: Nvidia

בול זמן:

עוד מ רכזת הסינגולריות