एआई के साथ, आपको बड़े हार्डवेयर और सॉफ्टवेयर चित्र प्लेटोब्लॉकचेन डेटा इंटेलिजेंस को देखने की आवश्यकता है। लंबवत खोज. ऐ.

एआई के साथ, आपको बड़े हार्डवेयर और सॉफ्टवेयर की तस्वीर देखने की जरूरत है

प्रायोजित विशेषता डेढ़ दशक हो गए हैं जब शोधकर्ताओं ने यह प्रदर्शित करके तकनीक की दुनिया को चकाचौंध कर दिया कि ग्राफिकल प्रोसेसिंग इकाइयों का उपयोग प्रमुख एआई कार्यों को नाटकीय रूप से तेज करने के लिए किया जा सकता है।

यह अहसास उद्यमों की कल्पना को जकड़ना जारी रखता है। आईडीसी ने बताया है कि जब बुनियादी ढांचे की बात आती है, तो जीपीयू त्वरित गणना और एचपीसी जैसे स्केल-अप तकनीकी नेताओं और आर्किटेक्ट्स के लिए अपने एआई इंफ्रास्ट्रक्चर का निर्माण करने वाले शीर्ष विचारों में से एक हैं।

लेकिन उन सभी संगठनों के लिए जिन्होंने एआई को वास्तविक दुनिया की समस्याओं के लिए सफलतापूर्वक लागू किया है, प्रयोग या पायलट चरण से परे जाने के लिए कई और संघर्ष हैं। आईडीसी का 2021 शोध पाया गया कि एक तिहाई से भी कम उत्तरदाताओं ने अपनी एआई परियोजनाओं को उत्पादन में स्थानांतरित कर दिया था, और उनमें से सिर्फ एक तिहाई "उत्पादन के परिपक्व चरण" तक पहुंच गए थे।

उद्धृत बाधाओं में उद्यम पैमाने पर एआई का समर्थन करने के लिए प्रसंस्करण और डेटा की तैयारी और बुनियादी ढांचे को मजबूत करने में समस्याएं शामिल हैं। आईडीसी ने कहा कि उद्यमों को "उद्देश्य-निर्मित और सही आकार-बुनियादी ढांचे" में निवेश करने की आवश्यकता है।

यहाँ AI समस्या क्या है?

तो एआई के साथ वे संगठन कहां गलत हो रहे हैं? एक कारक यह हो सकता है कि तकनीकी नेता और एआई विशेषज्ञ अन्य कंप्यूट इंजनों, विशेष रूप से आदरणीय सीपीयू की तुलना में जीपीयू पर बहुत अधिक ध्यान देते हुए व्यापक एआई पाइपलाइन पर समग्र रूप से ध्यान देने में विफल हो रहे हैं।

क्योंकि आखिरकार, यह सीपीयू बनाम जीपीयू बनाम एएसआईसी के समर्थन का सवाल नहीं है। बल्कि, यह एआई पाइपलाइन के निर्माण का सबसे अच्छा तरीका खोजने के बारे में है जो आपको विचारों और डेटा और मॉडल निर्माण से लेकर परिनियोजन और अनुमान तक प्राप्त कर सकता है। और इसका मतलब है कि विभिन्न प्रोसेसर आर्किटेक्चर की संबंधित ताकत की सराहना करना, ताकि आप सही समय पर सही कंप्यूट इंजन लागू कर सकें।

इंटेल के वरिष्ठ निदेशक, डेटासेंटर एआई रणनीति और निष्पादन के रूप में, शार्दुल ब्रह्मभट्ट बताते हैं, “सीपीयू का उपयोग क्लाउड में माइक्रोसर्विसेज और पारंपरिक कंप्यूट इंस्टेंसेस के लिए किया गया है। और जीपीयू का उपयोग मीडिया स्ट्रीमिंग, गेमिंग और एआई वर्कलोड जैसे समांतर गणना के लिए किया गया है।

इसलिए हाइपरस्केलर्स और अन्य क्लाउड प्लेयर्स ने अपना ध्यान एआई की ओर लगाया है, यह स्पष्ट हो गया है कि वे विभिन्न कार्यों के लिए इन समान शक्तियों का लाभ उठा रहे हैं।

समानांतर संगणना के आसपास जीपीयू की क्षमताएं उन्हें एआई एल्गोरिदम के प्रशिक्षण के लिए अत्यधिक उपयुक्त बनाती हैं, उदाहरण के लिए। इस बीच, जब कम बैच, कम विलंबता वास्तविक समय अनुमान, और लाइव डेटा का विश्लेषण करने और परिणाम और भविष्यवाणियां देने के लिए उन एल्गोरिदम का उपयोग करने की बात आती है तो सीपीयू के पास बढ़त होती है।

ब्रह्मभट्ट बताते हैं, फिर से कुछ चेतावनी भी हैं, "ऐसी जगहें हैं जहां आप अधिक बैच अनुमान करना चाहते हैं। और वह बैच अनुमान भी कुछ ऐसा है जो जीपीयू या एएसआईसी के माध्यम से किया जा रहा है।

पाइपलाइन नीचे देख रहे हैं

लेकिन एआई पाइपलाइन प्रशिक्षण और अनुमान से परे फैली हुई है। पाइपलाइन के बाईं ओर, डेटा को पूर्व-संसाधित करना पड़ता है, और एल्गोरिदम विकसित होते हैं। सामान्यवादी सीपीयू की यहां महत्वपूर्ण भूमिका है।

वास्तव में, इंटेल के अनुसार, सीपीयू-संचालित "डेटा स्टेज" वर्कलोड के साथ एआई पाइपलाइन में कुल प्रोसेसर गतिविधि के अपेक्षाकृत छोटे अनुपात के लिए जीपीयू का खाता कुल मिलाकर दो तिहाई है (आप एक समाधान संक्षिप्त पढ़ सकते हैं - इंटेल सीपीयू प्रौद्योगिकी के साथ अनुमान का अनुकूलन करें यहाँ)।

और ब्रह्मभट्ट हमें याद दिलाते हैं कि सीपीयू आर्किटेक्चर के अन्य फायदे हैं, जिसमें प्रोग्राम करने की क्षमता भी शामिल है।

"क्योंकि सीपीयू का व्यापक रूप से उपयोग किया गया है, पहले से ही डेवलपर्स और अनुप्रयोगों का एक मौजूदा पारिस्थितिकी तंत्र उपलब्ध है, साथ ही ऐसे उपकरण जो सामान्य प्रयोजन की गणना के लिए उपयोग में आसानी और प्रोग्राम करने की क्षमता प्रदान करते हैं," वे कहते हैं।

"दूसरा, सीपीयू बड़ी मेमोरी स्पेस तक तेजी से पहुंच प्रदान करता है। और फिर तीसरी बात यह है कि यह अधिक असंरचित गणना बनाम जीपीयू [जो] अधिक समानांतर संगणना है। इन कारणों से, सीपीयू डेटा मूवर्स के रूप में काम करते हैं जो जीपीयू को खिलाते हैं, जिससे अनुशंसाकर्ता सिस्टम मॉडल के साथ-साथ ग्राफ न्यूरल नेटवर्क जैसे वर्क लोड को विकसित करने में मदद मिलती है।

एआई विकास के लिए एक खुली योजना

तो एआई डेवलपमेंट पाइपलाइन की योजना बनाते समय हमें क्रमशः सीपीयू और जीपीयू की भूमिकाओं को कैसे देखना चाहिए, चाहे ऑन-प्रिमाइसेस, क्लाउड में, या दोनों को फैलाना हो?

जीपीयू ने एआई विकास में क्रांति ला दी, क्योंकि उन्होंने त्वरण की एक विधि की पेशकश की जो सीपीयू से संचालन को बंद कर देती है। लेकिन इसका मतलब यह नहीं है कि किसी दिए गए काम के लिए यह सबसे समझदार विकल्प है।

जैसा कि इंटेल प्लेटफॉर्म आर्किटेक्ट शरथ राघव बताते हैं, “एआई अनुप्रयोगों में सदिश संगणनाएँ होती हैं। वेक्टर संगणनाएँ समानांतर हैं। एआई वर्कलोड को कुशलता से चलाने के लिए, वेक्टर संगणनाओं के आकार, ऑफलोड विलंबता, समानांतरता और कई अन्य कारकों पर विचार करते हुए सीपीयू और जीपीयू क्षमताओं का फायदा उठाया जा सकता है। लेकिन वह जारी रखता है, "छोटे" कार्य के लिए, ऑफलोडिंग की "लागत" अत्यधिक होगी, और इसे जीपीयू या त्वरक पर चलाने का कोई मतलब नहीं हो सकता है।

सीपीयू अन्य सिस्टम घटकों के साथ घनिष्ठ एकीकरण से भी लाभान्वित हो सकते हैं जो उन्हें एआई कार्य को अधिक तेज़ी से पूरा करने की अनुमति देते हैं। एआई परिनियोजन से अधिकतम मूल्य प्राप्त करने में केवल स्वयं मॉडल चलाने से अधिक शामिल है - मांगी गई अंतर्दृष्टि कुशल प्रीप्रोसेसिंग, अनुमान और पोस्टप्रोसेसिंग ऑपरेशंस पर निर्भर करती है। प्रीप्रोसेसिंग के लिए डेटा तैयार करने की आवश्यकता होती है ताकि प्रशिक्षित मॉडल की इनपुट अपेक्षाओं से मेल खाने से पहले इसे तैयार किया जा सके। उपयोगी जानकारी तब पोस्टप्रोसेसिंग चरण में निष्कर्ष परिणामों से निकाली जाती है।

यदि हम उदाहरण के लिए डेटा सेंटर इंट्रूज़न डिटेक्शन सिस्टम (IDS) के बारे में सोचते हैं, तो समय पर साइबर हमले से किसी भी क्षति को बचाने और रोकने के लिए मॉडल के आउटपुट पर कार्य करना महत्वपूर्ण है। और आम तौर पर, प्रीप्रोसेसिंग और पोस्टप्रोसेसिंग कदम तब अधिक कुशल होते हैं जब उन्हें होस्ट सिस्टम सीपीयू पर किया जाता है क्योंकि वे बाकी वास्तुशिल्प पारिस्थितिकी तंत्र के साथ अधिक निकटता से एकीकृत होते हैं।

शुरुआत के आदेश के तहत प्रदर्शन को बढ़ावा

तो, क्या इसका मतलब GPU त्वरण के लाभों को पूरी तरह से छोड़ देना है? जरूरी नही। Intel कुछ वर्षों से अपने Xeon स्केलेबल CPU में AI त्वरण का निर्माण कर रहा है। डीप लर्निंग मॉडल पर उच्च प्रदर्शन के लिए डीप लर्निंग बूस्ट पहले से ही शामिल है, जबकि इंटेल के उन्नत वेक्टर एक्सटेंशन 512 (एवीएक्स 512) और वेक्टर न्यूरल नेटवर्क एक्सटेंशन (वीएनएनआई) INT8 इंफ्रेंसिंग प्रदर्शन को गति देते हैं। लेकिन DL Boost ब्रेन फ्लोटिंग पॉइंट फॉर्मेट (BF16) का उपयोग प्रशिक्षण वर्कलोड पर प्रदर्शन को बढ़ावा देने के लिए करता है जिसमें उच्च स्तर की सटीकता की आवश्यकता नहीं होती है।

इंटेल के आगामी झियोन स्केलेबल चौथी पीढ़ी के सीपीयू उन्नत मैट्रिक्स गुणन, या एएमएक्स को जोड़ेंगे। यह Intel की गणना के अनुसार पहले के प्रोसेसरों में कार्यान्वित AVX-8 VNNI x512 एक्सटेंशन पर 86 गुना अधिक बढ़ावा देगा, और चौथी पीढ़ी के Intel Xeon स्केलेबल प्रोसेसर को "प्रशिक्षण वर्कलोड और DL एल्गोरिदम जैसे GPU करता है" को संभालने की अनुमति देगा। लेकिन वही त्वरक AI और गैर-AI वर्कलोड के लिए सामान्य CPU कंप्यूट पर भी लागू किए जा सकते हैं।

इसका मतलब यह नहीं है कि इंटेल शुरू से अंत तक एआई पाइपलाइनों के x86 होने की उम्मीद करता है। जब यह पूरी तरह से प्रशिक्षण वर्कलोड को लोड करने के लिए अधिक समझ में आता है जो समांतरता से लाभान्वित होगा, इंटेल अपने हवाना गौडी एआई प्रशिक्षण प्रोसेसर की पेशकश करता है। बेंचमार्क परीक्षणों से पता चलता है कि बाद के शक्तिशाली अमेज़ॅन ईसी2 डीएल1 उदाहरण जो क्लाउड में होस्ट किए गए तुलनात्मक एनवीडिया जीपीयू-आधारित प्रशिक्षण उदाहरणों की तुलना में 40 प्रतिशत बेहतर मूल्य-प्रदर्शन प्रदान कर सकते हैं।

उसी समय, इंटेल का डेटा सेंटर जीपीयू फ्लेक्स सीरीज़ वर्कलोड और ऑपरेशंस के लिए तैयार है, जो कि "लाइटर" और अधिक जटिल एआई मॉडल पर अलग-अलग कार्यान्वयन के साथ एआई अनुमान जैसे समानांतरकरण से लाभान्वित होते हैं। एक अन्य Intel® डेटा सेंटर GPU, जिसका कोडनाम पोंटे वेक्चिओ (PVC) है, शीघ्र ही Argonne National Laboratory में Aurora सुपरकंप्यूटर को शक्ति प्रदान करना शुरू कर देगा।

क्या हम अंत तक जा सकते हैं?

संभावित रूप से, इंटेल का सिलिकॉन अनावश्यक रूप से विभिन्न कंप्यूट इंजनों के बीच डेटा को ऑफ़लोड करने की आवश्यकता को कम करते हुए, संपूर्ण AI पाइपलाइन को रेखांकित कर सकता है। कंपनी के प्रोसेसर - चाहे जीपीयू हो या सीपीयू - अपने वनएपीआई प्रोग्राम के माध्यम से इंटेल ऑप्टिमाइजेशन के साथ ओपन-सोर्स टूलिंग और फ्रेमवर्क पर आधारित एक सामान्य सॉफ्टवेयर मॉडल का भी समर्थन करते हैं।

ब्रह्मभट्ट एक अन्य लाभ के रूप में समुदाय और खुले स्रोत पर आधारित x86 सॉफ्टवेयर पारिस्थितिकी तंत्र के निर्माण में इंटेल की विरासत का हवाला देते हैं। "इंटेल का दर्शन है ... 'पारिस्थितिकी तंत्र को अपनाने दें'। और हमें यह सुनिश्चित करने की आवश्यकता है कि हम निष्पक्ष हैं और पारिस्थितिकी तंत्र के लिए खुले हैं, और हम अपने किसी भी गुप्त सॉस को पारिस्थितिकी तंत्र में वापस प्रदान करते हैं।

"हम एक सामान्य सॉफ़्टवेयर स्टैक का उपयोग कर रहे हैं, मूल रूप से यह सुनिश्चित करने के लिए कि डेवलपर्स को एआई के लिए सीपीयू और जीपीयू के बीच आईपी के अंतर्निहित भेदभाव के बारे में चिंता करने की ज़रूरत नहीं है।"

एक सामान्य सॉफ़्टवेयर स्टैक का यह संयोजन और सही कार्य के लिए सही कंप्यूट इंजन का उपयोग करने पर ध्यान उद्यम में और भी महत्वपूर्ण है। व्यवसाय एआई पर भरोसा कर रहे हैं ताकि उनकी कुछ सबसे अधिक दबाव वाली समस्याओं को हल करने में मदद मिल सके, चाहे वह क्लाउड में हो या प्रेम पर। लेकिन मिश्रित वर्कलोड के लिए पूर्ण विशेषताओं वाले सॉफ़्टवेयर की आवश्यकता होती है, साथ ही सिस्टम स्टैक के रखरखाव और प्रबंधन के लिए, कोड को चलाने के लिए जो कर्नेल में शामिल नहीं है जो त्वरक पर बैठता है।

इसलिए, जब इस प्रश्न का उत्तर देने की बात आती है कि "हम एआई को एंटरप्राइज़ स्केल पर कैसे प्राप्त करते हैं" तो उत्तर बड़ी तस्वीर पर एक नज़र डालने और यह सुनिश्चित करने पर निर्भर हो सकता है कि आप अपने निपटान में हार्डवेयर और सॉफ़्टवेयर किट के पूर्ण पूरक का उपयोग करते हैं।

इंटेल द्वारा प्रायोजित।

समय टिकट:

से अधिक रजिस्टर