OpenAI क्वांटम AI पर अपना दांव क्यों टाल रहा है?

OpenAI क्वांटम AI पर अपना दांव क्यों टाल रहा है?

क्यों OpenAI क्वांटम AI प्लेटोब्लॉकचेन डेटा इंटेलिजेंस पर अपना दांव टाल रहा है। लंबवत खोज. ऐ.

विश्लेषण क्वांटम कंप्यूटिंग को अब एक दशक से अधिक समय हो गया है, लेकिन उद्योग विशेषज्ञों के अनुसार इसमें एआई की अतृप्त भूख को रोकने का रहस्य हो सकता है।

प्रत्येक गुजरते महीने के साथ, बड़े, अधिक पैरामीटर-सघन मॉडल सामने आते हैं और एआई तैनाती के पैमाने का विस्तार होता है। इस वर्ष अकेले मेटा जैसे हाइपरस्केलर्स की योजना है तैनात सैकड़ों हजारों त्वरक। अभी भी OpenAI के संस्थापक सैम ऑल्टमैन हैं आश्वस्त यदि हमें एआई का और अधिक विकास करना है तो हमें बहुत अधिक गणना की आवश्यकता होगी।

इसलिए इसमें कोई आश्चर्य नहीं होना चाहिए कि अपनी नवीनतम नियुक्ति, ओपनएआई के साथ होगा यदि संभव हो तो क्वांटम कंप्यूटिंग पर अपना दांव लगाना होगा। पिछले हफ्ते, एआई जगरनॉट ने PsiQuantum के पूर्व क्वांटम सिस्टम आर्किटेक्ट बेन बार्टलेट को अपने रैंक में शामिल किया।

बार्टलेट एआई ट्रेंडसेटर में क्या करेगा, इसके बारे में और अधिक जानने के लिए हम ओपन एआई के पास पहुंचे, लेकिन हमें कोई जवाब नहीं मिला। हालाँकि उसका जैव कुछ संकेत प्रदान करता है क्योंकि उनके अधिकांश शोध ने क्वांटम भौतिकी, मशीन लर्निंग और नैनोफोटोनिक्स के बीच अंतरसंबंध पर ध्यान केंद्रित किया है, और "मूल रूप से फोटॉन के लिए छोटे रेस ट्रैक डिजाइन करना शामिल है जो उन्हें उपयोगी गणना करने में मदद करता है"

तो OpenAI एक क्वांटम भौतिक विज्ञानी से वास्तव में क्या चाहता है? खैर, क्वांटम अनुकूलन का उपयोग करने से लेकर प्रशिक्षण डेटासेट को सुव्यवस्थित करने या जटिल ग्राफ डेटाबेस को ऑफलोड करने के लिए क्वांटम प्रोसेसिंग इकाइयों (क्यूपीयू) का उपयोग करने से लेकर आधुनिक सेमीकंडक्टर पैकेजिंग की सीमाओं से परे स्केल करने के लिए ऑप्टिक्स का उपयोग करने तक की कुछ संभावनाएं हैं।

तंत्रिका नेटवर्क एक अन्य अनुकूलन समस्या मात्र है

डी-वेव के मरे थॉम बताते हैं कि क्वांटम कंप्यूटिंग में बड़े एआई मॉडल के प्रशिक्षण की दक्षता में काफी सुधार करने की क्षमता है, जिससे उन्हें कम मापदंडों वाले मॉडल से अधिक सटीक उत्तर प्राप्त करने की अनुमति मिलती है। रजिस्टर.

GPT-4 के एक ट्रिलियन मापदंडों से अधिक होने की अफवाह के साथ, यह देखना मुश्किल नहीं है कि यह आकर्षक क्यों हो सकता है। परिमाणीकरण और अन्य संपीड़न रणनीतियों का सहारा लिए बिना, AI मॉडल को FP1 या Int8 परिशुद्धता और उच्च परिशुद्धता पर चलने पर प्रत्येक अरब मापदंडों के लिए लगभग 8GB मेमोरी की आवश्यकता होती है, जो कि उससे काफी अधिक है।

ट्रिलियन पैरामीटर मॉडल उस सीमा के करीब हैं जिसे एक एआई सर्वर कुशलतापूर्वक समायोजित कर सकता है। बड़े मॉडलों का समर्थन करने के लिए एकाधिक सर्वरों को एक साथ जोड़ा जा सकता है, लेकिन बॉक्स छोड़ने पर प्रदर्शन दंड मिलता है।

और वह आज है. और अगर ऑल्टमैन सही है तो ये मॉडल बड़े और अधिक प्रचलित होते जाएंगे। इस प्रकार, कोई भी तकनीक जो ओपनएआई को पैरामीटर गिनती में सार्थक वृद्धि किए बिना अपने मॉडलों की क्षमता बढ़ाने की अनुमति दे सकती है, वह इसे आगे बढ़ा सकती है।

"जैसा कि आप एक मॉडल को प्रशिक्षित कर रहे हैं, मॉडल में जाने वाले मापदंडों की संख्या वास्तव में मॉडल को प्रशिक्षित करने की लागत और जटिलता को बढ़ाती है," सॉफ्टवेयर और एल्गोरिदम के डी-वेव वीपी ट्रेवर लैंटिंग बताते हैं रजिस्टर.

इससे निजात पाने के लिए, वह बताते हैं, डेवलपर्स अक्सर उन सुविधाओं का उप-चयन करेंगे जो उन्हें लगता है कि उस विशेष मॉडल के प्रशिक्षण के लिए सबसे महत्वपूर्ण होंगे, जो बदले में आवश्यक मापदंडों की संख्या को कम कर देता है।

लेकिन पारंपरिक प्रणालियों का उपयोग करके ऐसा करने की कोशिश करने के बजाय, डी-वेव यह मामला बनाता है कि क्वांटम अनुकूलन एल्गोरिदम यह निर्धारित करने में अधिक प्रभावी हो सकता है कि कौन सी सुविधाओं को अंदर या बाहर छोड़ना है।

यदि आप परिचित नहीं हैं, तो अनुकूलन समस्याएं, जैसे कि आमतौर पर पथ खोज या लॉजिस्टिक्स में देखी जाती हैं, क्वांटम कंप्यूटिंग के अब तक के सबसे आशाजनक अनुप्रयोगों में से एक साबित हुई हैं।

थॉम ने कहा, "हमारे क्वांटम कंप्यूटर वास्तव में उन चीजों को अनुकूलित करने में अच्छे हैं जहां चीजें या तो हो रही हैं या नहीं हो रही हैं: जैसे किसी को एक विशेष शेड्यूल सौंपा जा रहा है या एक विशेष डिलीवरी सौंपी जा रही है।" "यदि वे निर्णय स्वतंत्र होते, तो यह ठीक होता, और एक शास्त्रीय कंप्यूटर के लिए ऐसा करना आसान होता, लेकिन वे वास्तव में पूल में अन्य संसाधनों को प्रभावित करते हैं और एक प्रकार का नेटवर्क प्रभाव होता है।"

दूसरे शब्दों में, वास्तविक दुनिया अस्त-व्यस्त है। सड़क पर कई वाहन हो सकते हैं, सड़क बंद हो सकती है, मौसम संबंधी घटनाएं इत्यादि हो सकती हैं। शास्त्रीय कंप्यूटरों की तुलना में, क्वांटम कंप्यूटरों में निहित अद्वितीय विशेषताएं उन्हें सर्वोत्तम मार्ग की पहचान करने के लिए एक साथ इन कारकों का पता लगाने की अनुमति देती हैं।

यह, "पूरी तरह से एक तंत्रिका नेटवर्क के अनुरूप है जहां न्यूरॉन्स या तो फायरिंग कर रहे हैं या फायरिंग नहीं कर रहे हैं, और उनके पास अन्य न्यूरॉन्स के साथ सिनैप्टिक कनेक्शन हैं, जो या तो अन्य न्यूरॉन्स को उत्तेजित करते हैं या फायरिंग से रोकते हैं," थॉम बताते हैं।

और इसका मतलब यह है कि क्वांटम एल्गोरिदम का उपयोग विशिष्ट आवश्यकताओं के लिए एआई प्रशिक्षण डेटासेट को अनुकूलित करने के लिए किया जा सकता है, जिसे प्रशिक्षित करने पर, एक दुबला, अधिक सटीक मॉडल प्राप्त होता है, लैंटिंग ने दावा किया।

क्वांटम नमूनाकरण और ऑफलोडिंग

लंबी अवधि के लिए, डी-वेव और अन्य क्यूपीयू को प्रशिक्षण प्रक्रिया में गहराई से लागू करने के तरीकों की तलाश कर रहे हैं।

इन उपयोग मामलों में से एक में नमूनाकरण के लिए क्वांटम कंप्यूटिंग को लागू करना शामिल है। नमूनाकरण से तात्पर्य है कि कैसे एआई मॉडल, एलएलएम की तरह, यह निर्धारित करते हैं कि अगला शब्द, या अधिक विशेष रूप से टोकन, संभावनाओं के वितरण के आधार पर क्या होना चाहिए। यही कारण है कि अक्सर यह मजाक किया जाता है कि एलएलएम केवल स्टेरॉयड पर स्वतः पूर्ण होते हैं।

“हार्डवेयर नमूने तैयार करने में बहुत अच्छा है, और आप वितरण को ट्यून कर सकते हैं, ताकि आप उन नमूनों के भार को ट्यून कर सकें। और हम जो खोज रहे हैं वह यह है: क्या यह वास्तव में एनीलिंग क्वांटम कंप्यूटिंग को कठिन और अधिक सीधे प्रशिक्षण कार्यभार में सम्मिलित करने का एक अच्छा तरीका है," लैंटिंग ने समझाया।

फ्रांसीसी क्वांटम कंप्यूटिंग स्टार्टअप पास्कल भी आमतौर पर तंत्रिका नेटवर्क में पाए जाने वाले ग्राफ संरचित डेटा सेट को ऑफलोड करने के लिए क्वांटम कंप्यूटिंग लागू करने पर काम कर रहा है।

पास्कल के सह-सीईओ लोइक हेनरीट ने एक साक्षात्कार में बताया, "मशीन लर्निंग में डेटा को शास्त्रीय रूप से प्रस्तुत करने का कोई वास्तविक सरल तरीका नहीं है, क्योंकि ग्राफ़ एक जटिल वस्तु है।" रजिस्टर. "आप ग्राफ़ संरचित डेटा को अपेक्षाकृत स्वाभाविक रूप से क्वांटम गतिशीलता में एम्बेड कर सकते हैं, जो डेटा के उन टुकड़ों के इलाज के कुछ नए तरीकों को जन्म देता है।"

हालाँकि, इसे हासिल करने से पहले, क्वांटम सिस्टम को बहुत बड़ा और बहुत तेज़ होना होगा, हेनरीट ने समझाया।

उन्होंने कहा, "फिलहाल बड़े डेटासेट व्यावहारिक नहीं हैं।" “यही कारण है कि हम क्वैबिट की संख्या पर जोर दे रहे हैं; पुनरावृत्ति दर. क्योंकि अधिक क्वैबिट के साथ आप अधिक डेटा एम्बेड कर सकते हैं।

क्वांटम ग्राफ न्यूरल नेटवर्क के व्यवहार्य बनने से पहले हमें कितना इंतजार करना होगा, यह कहना मुश्किल है। पास्कल के पास पहले से ही 10,000 क्यूबिट प्रणाली है कार्यों में. दुर्भाग्य से, शोध से पता चलता है कि 10,000 त्रुटि-सुधार करने वाली क्वैबिट या लगभग दस लाख भौतिक क्वैबिट वाली प्रणाली भी पर्याप्त नहीं हो सकती है। प्रतिस्पर्धा आधुनिक जीपीयू के साथ।

एक सिलिकॉन फोटोनिक्स खेल?

विदेशी क्वांटम एआई उपयोग के मामलों को छोड़कर, ऐसी अन्य प्रौद्योगिकियां हैं जिन्हें ओपनएआई अपना सकता है जिसके लिए बार्टलेट एक विशेषज्ञ है।

सबसे विशेष रूप से, बार्टलेट के पूर्व नियोक्ता PsiQuantum सिलिकॉन फोटोनिक्स पर आधारित सिस्टम विकसित कर रहे हैं। इससे पता चलता है कि उनकी नियुक्ति ओपनएआई से संबंधित हो सकती है की रिपोर्ट एक कस्टम AI एक्सेलेरेटर पर काम करें।

अयार लैब्स, लाइटमैटर और सेलेस्टियल एआई सहित कई सिलिकॉन फोटोनिक्स स्टार्टअप ने बैंडविड्थ सीमाओं को पार करने के साधन के रूप में प्रौद्योगिकी को आगे बढ़ाया है, जो मशीन लर्निंग प्रदर्शन को सीमित करने वाला एक सीमित कारक बन गया है।

यहां विचार यह है कि आप पूरी तरह से विद्युत सिग्नल की तुलना में प्रकाश के साथ बहुत अधिक दूरी तक बहुत अधिक डेटा भेज सकते हैं। इनमें से कई डिज़ाइनों में, प्रकाश वास्तव में सिलिकॉन में खोदे गए तरंग गाइडों द्वारा ले जाया जाता है, जो "फोटॉन के लिए छोटे रेस ट्रैक डिजाइन करने" जैसा भयानक लगता है।

लाइटमैटर का मानना ​​है कि यह तकनीक चिप छोड़ने वाले डेटा के लिए बैंडविड्थ जुर्माना लगाए बिना कई त्वरक को एक के रूप में कार्य करने की अनुमति देगी। इस बीच दिव्य एक देखता है अवसर त्वरक डाई से सीधे सटे मॉड्यूल को सह-पैकेज करने की आवश्यकता को समाप्त करके जीपीयू के लिए उपलब्ध उच्च-बैंडविड्थ मेमोरी की मात्रा में काफी वृद्धि करना। ये दोनों क्षमताएं बड़े पैमाने पर एआई सिस्टम के साथ काम करने वाली कंपनी के लिए आकर्षक होंगी।

क्या ओपनएआई अंततः क्वांटम एआई या सिलिकॉन फोटोनिक्स को अपनाएगा, यह देखा जाना बाकी है, लेकिन एक ऐसी कंपनी के लिए जिसके संस्थापक लंबे समय तक निवेश करने के लिए अजनबी नहीं हैं, यह ऑल्टमैन द्वारा समर्थित सबसे अजीब बात नहीं होगी। ®

समय टिकट:

से अधिक रजिस्टर