תפקיד ה-CPU ב-AI/ML בר-קיימא

תפקיד ה-CPU ב-AI/ML בר-קיימא

תפקיד ה-CPU ב-AI/ML PlatoBlockchain Data Intelligence בר-קיימא. חיפוש אנכי. איי.

advertorial כאשר בינה מלאכותית מרחיבה את טווח ההגעה שלה על פני סביבות מחשוב עסקיות, ההשפעה שלה גורמת לכמה אפקטים בלתי צפויים. האחרונה של IDC FutureScape הדו"ח, למשל, צופה שכאשר חברות דוהרות להציג מוצרים/שירותים משופרים בינה מלאכותית ולסייע ללקוחותיהן בהטמעת בינה מלאכותית, הטכנולוגיה תהפוך למניע מרכזי לחדשנות.

שינוי אחר מונע בינה מלאכותית מצביע על המידה שבה ייתכן שמרכזי הנתונים יצטרכו לאזן בין מעבדים לבין מאיצי AI נפרדים, כגון GPUs או ארכיטקטורות מיוחדות על מנת לספק את יכולות המחשוב בעלות הביצועים הגבוהים שמפתחי AI רוצים.

זה דיון שמעלה סוגיות קשות עבור בעלי מרכזי נתונים, הן במונחים של השקעה נוספת ב-CAPEX והן בהסתברות ש(בעוד ששיטות המדידה אינן מדויקות) פעולות AI טיפוסיות מונחות GPU צורכות יותר כוח מאשר עומסי IT רגילים.

התמודדות עם תקורה של הספק/פחמן גבוה יותר של בינה מלאכותית היא נקודת כאב נוספת עבור תפעול מרכזי נתונים, אשר חייבת גם להבטיח שארכיטקטורות מחשוב משודרגות המותאמות לבינה מלאכותית יכולות לנהל את דרישות ההספק המוגברות ללא סיכון לעומס יתר של טכנולוגיה או מתקנים קיימים.

אז כאשר הרגולציה המורחבת בממשל קיימות וניהול פחמן דוחפת את הפעולות להפחתת צריכת האנרגיה על פני טווח החומרה והתוכנה של IT, AI מייצג הזדמנות ומכשול כאחד.

הפחתת צריכת החשמל של AI

ביחד, צריכת החשמל המוגברת והתצורות הארכיטקטוניות הנדרשות כדי להתאים לעומסי עבודה של AI ולמידת מכונה מהווים אתגר בלתי נמנע עבור מרכזי נתונים, מסביר סטפן גיליץ', מנהל בינה מלאכותית GTM במרכז המצוינות של AI של אינטל.

"זה די ברור על פני מגזרים ותעשיות אנכיות, בכל מקום שבו יישומים ושירותי AI/למידת מכונה מפותחים, מאומנים ומופעלים, שיכולות ה-IT המקומיות והמתארחות בענן יצטרכו לעבור שדרוגים כדי להתמודד עם כמויות גדולות של נתונים עומסי עבודה אינטנסיביים", אומר גיליץ'. "ברור גם שהשדרוגים האלה יצטרכו לכלול יותר מאשר רק הגברת יכולת המחשוב."

אפשר לעשות הרבה כדי לשפר את הקיימות של מרכזי נתונים ממוקדי בינה מלאכותית, סבור גיליץ', החל בהערכה מחדש של כמה מההנחות סביב נוף ה-AI/Machine Learning. יחידות עיבוד הן מקום טוב להתחיל בו, במיוחד כאשר מחליטים אם מעבדים או GPUs מתאימים יותר למשימה.

מכיוון שבעוד שעומסי עבודה עתירי מחשוב ספציפיים בינה מלאכותית נראים בעלייה (אף אחד לא בטוח באיזה קצב), עיקר עבודת מרכז הנתונים (עומסי העבודה שאינם בינה מלאכותית) חייבת להמשיך להתחמק מדי יום ביומו - ולספק יישום יציב ואסור להפרע את זרמי ההכנסות משירותים.

רוב אלה מטופלים כיום על ידי מעבדים והרכבה מחדש של מרכז נתונים סטנדרטי עם GPUs יקרים יותר, עבור מתקנים רבים מאוד, יהיה עודף לדרישות. במונחים כלליים, GPU צורך יותר וואט מאשר מעבד כדי לבצע משימה דומה. בהתאם לאספקת החשמל לתצורת מתלה נתונה, שילוב GPUs בתשתית מרכז הנתונים מצריך שדרוגים למערכות חלוקת החשמל, למשל, אשר צפויות לגרור עלויות נוספות מראש, בנוסף לחשבונות אנרגיה גבוהים יותר ברגע שהן פועלות.

יתרה מכך, פיתוח המעבד של אינטל ממשיך לחדש. במקרים רבים ניתן להוכיח ש-CPU משיג ביצועים כלליים טובים - ולפעמים טובים יותר - כמו GPU, טוען גיליץ'. וניתן להגדיל את הביצועים שלהם עם טכנולוגיה פורצת דרך כמו Intel® AMX (Advanced Matrix Extensions) מאיץ המובנה במעבדי Intel Xeon מהדור הרביעי.

"מעבדי Intel Xeon יכולים לאפשר למרכז נתונים להרחיב את אימוץ הבינה המלאכותית שלו באמצעות האצת בינה מלאכותית מובנית שמגבירה את ביצועי ה-CPU עבור למידת מכונה, הדרכה והסקת מסקנות", מציין גיליץ'. "בדרך זו, הם יכולים לאמץ מאיצים נפרדים כדי למזער CAPEX ולמקסם את הביצועים תוך מינוף סביבות עיבוד קיימות של Intel Xeon."

צריך לערבב עומסי עבודה של AI ועומסי עבודה שאינם AI

Intel AMX הוא בלוק חומרה ייעודי בליבת המעבד Intel Xeon Scalable המאפשר לעומסי עבודה של בינה מלאכותית לפעול על המעבד במקום להוריד אותם למאיץ נפרד, מה שמספק שיפור משמעותי בביצועים. זה מתאים לעומסי עבודה של בינה מלאכותית כמו מערכות ממליצות למידת מכונה, זיהוי תמונות ועיבוד שפה טבעית, המסתמכות על מתמטיקה מטריצה.

טיעון נוסף בעד מעבדים מוגדלים הוא שהם מספקים מסלול חסכוני למפעילי מרכזי נתונים לבצע יותר מהתחייבויות המעבד הקיימות, להגן על עתיד את הנכסים שלהם כך שיוכלו לקחת על עצמם עומסי עבודה מעורבים ולהציב אותם במצב טוב יותר. לשלוט בצריכת החשמל הכוללת.

זה, בתורו, עשוי לעזור לספקים של שירותי מרכז נתונים (וללקוחותיהם) לעמוד ביעדי קיימות, ולספק נקודת מכירה למפתחי תוכנה (ארגונים או צד שלישי) המחפשים פלטפורמה אופטימלית כדי להציג את היעילות האנרגטית של הקידוד שלהם. תפוקות.

"המציאות היא שבמקום למהר על ההזדמנויות שעומסי עבודה של AI עשויים להבטיח, מפעילי מרכזי נתונים מבינים שעליהם לשקול מגוון ציוויים שמבוססים על דאגות מסחריות כמו בחירות טכנולוגיות", אומר גיליץ'.

ציוויים אלה יכולים לכלול: שילוב של עומסי עבודה בינה מלאכותית עם עומסי עבודה שאינם בינה מלאכותית; שילוב של ערימות חומרה ותוכנה שונות; ומכיוון שהם רוצים להבטיח שיש להם ארכיטקטורה שמתאימה לעומסי עבודה שונים, שילוב של סוגי זרם עבודה שונים.

"השאלות הללו מצביעות על אתגרים מורכבים, מכיוון שלקבלתן נכון יש השפעה על יעילות טכנולוגית ואנרגטית אופטימלית - כאשר יעילות אנרגטית כעת היא אמת מידה לביצועים שישפיעו יותר ויותר על הכדאיות המסחרית של מרכז נתונים", אומר גיליץ'. "אז שוב, זה בעל חשיבות עליונה."

מנקודת המבט של גיליץ', המפתח להסתגלות למציאות המתהווה הזו הוא תהליך צעד של מה שניתן לכנות 'הטמעת AI'. נקודה אחת כאן היא שעומסי עבודה של AI אינם מופרדים מסוגי עומס עבודה אחרים - הם ישולבו בעומסי עבודה קונבנציונליים, במקום לפעול בנפרד.

גיליץ' נותן שיחות ועידה בווידאו כדוגמה לאינטגרציה מדורגת זו: "כבר בזמן הזרמת תעבורת אודיו/וידאו סטנדרטית על פני יישומים סטנדרטיים, AI משולב לביצוע משימות נלוות כמו סיכום, תרגום, תמלול. תכונות כאלה נתמכות היטב על ידי AI.

חיסכון באנרגיה מקצה לקצה

השגת יעילות אנרגטית חייבת להיות משימה אסטרטגית ממש מקצה לקצה, טוען גיליץ'. "היא משתרעת על צד התוכנה כמו גם על ארכיטקטורות החומרה - המנגנון השלם המאפשר תהליך זרימת עבודה נתון. היכן מאוחסנים נתונים כדי להפוך את הגישה ליעילה ביותר - חכמת מחשוב ולכן אנרגיה - האם זה המקום הטוב ביותר להתייעלות אנרגטית?"

הגורם הנוסף שיש להביא להערכה זו הוא לקבוע היכן פועל עומס העבודה. לדוגמה, האם הוא פועל על לקוחות (כגון AI PC המצויד במעבדי Intel Core Ultra, במקום שרתים במרכז הנתונים? האם חלק מעומסי העבודה של AI אלה באמת יכולים להיות מופעלים על לקוחות (לצד שרתים)?

כל אופציה ראויה לבחינה אם היא תעזור להביא את איזון AI-מחשוב/צריכת חשמל להתאמה טובה יותר, טוען גיליץ': "זה כמעט כמו חזרה לרעיון הישן של מחשוב מבוזר."

גיליץ' מוסיף: "לפעמים הלקוחות שלנו שואלים, 'איפה ישחק AI?' - התשובה היא שבינה מלאכותית תשחק בכל מקום. אז באינטל השאיפה שלנו מתמקדת במה שאפשר לכנות ההתאמה האוניברסלית של בינה מלאכותית, מכיוון שאנו מאמינים שהיא תיכנס לכל תחומי היישום".

באינטל זה כולל תוכנות ביניים כמו ממשקי API, שכמו בכל חלק אחר בערימת התוכנה, חייבים להיות יעילים ככל האפשר. 'התפשטות API' יכולה לגרום לעיבוד מיותר, למזער את טביעת הרגל של התשתית שלהם ולחוסר ניטור ובקרה.

"עם אינטל oneAPI, ארגונים יכולים לממש את מלוא ערך החומרה שלהם, לפתח קוד חוצה ארכיטקטורות בעל ביצועים גבוהים ולהכין את היישומים שלהם לצרכים עתידיים", מסביר גיליץ'.

"Intel oneAPI הוא מודל תכנות פתוח, חוצה תעשיות, מבוסס תקנים, מאוחד, מרובה ארכיטקטורות, מרובה ספקים, המספק חווית מפתח משותפת על פני ארכיטקטורות מאיצים - לביצועי יישומים מהירים יותר ופרודוקטיביות משופרת. יוזמת oneAPI מעודדת שיתוף פעולה על מפרט oneAPI והטמעות של oneAPI תואמות ברחבי המערכת האקולוגית."

גיליץ' מוסיף: "oneAPI מספק מחסנית של תוכנת ביניים שלוקחת דברים סטנדרטיים כמו AI Frameworks - כמו Pytorch או TensorFlow [פלטפורמת התוכנה בקוד פתוח עבור AI ו-Machine Learning] - ומתרגמת אותם ברמת מכונה, ו-oneAPI מאפשר דרך יעילה לעשות את זה. משתמשים יכולים להשתמש ב-API משותף ברמת Ai Framework, ויש לנו API (oneAPI) שמתייחס לטעמי החומרה השונים." אז API נפוץ אומר שמשתמשים יכולים ליצור תוכנה פתוחה שניתן לתמוך בערימת תוכנה פתוחה.

ביצועים ברמת GPU ברמת מחירים ברמת המעבד

ההתקדמות ב-IT מונעת בעיקר על ידי ציפייה להתקדמות טכנולוגית מתמשכת הקשורה לשיפורים מונעי תובנות באסטרטגיות הפריסה. זהו מודל המבוסס על מציאת האיזון הטוב ביותר שניתן להשיג בין הוצאה תקציבית והחזר ROI עסקי, והציפייה שתמיד יש לשאוף לחדשנות נוספת. בינה מלאכותית מייצגת את התקופה של האידיאל הזה - היא חכמה מספיק כדי להמציא מחדש את הצעת הערך שלה באמצעות שיפור עצמי מתמיד.

על ידי בניית מאיץ AMX למעבדי Intel Xeon מהדור הרביעי שלה, אינטל מראה כיצד ניתן להשיג ביצועים ברמת ה-GPU בנקודות מחיר ברמת המעבד. זה מאפשר למרכזי נתונים להרחיב את גודלם תוך מיקסום ערך ההחזר של מחוזות העיבוד הקיימים שלהם מבוססי Intel Xeon, אך גם מספק מודל תמחור המוריד את עלות הכניסה ללקוחות עם עומסי עבודה בינה מלאכותית אך תקציבים מוגבלים.

וצריכת החשמל הנמוכה יותר של מעבדים פירושה שניתן להשיג יעילות אנרגטית בצורה הוליסטית לאורך כל הפעילות של מתקן מרכז נתונים - כמו קירור ואוורור - וזו עוד משיכה מנצחת לארכיטקטי תוכנה ומפתחי תוכנה מצפוניים בתחום הקיימות של פתרונות AL.

תרמה על ידי אינטל.

בול זמן:

עוד מ הקופה