नई 'भौतिकी-प्रेरित' जनरेटिव एआई अपेक्षाओं से अधिक है | क्वांटा पत्रिका

नई 'भौतिकी-प्रेरित' जनरेटिव एआई अपेक्षाओं से अधिक है | क्वांटा पत्रिका

नई 'भौतिकी-प्रेरित' जनरेटिव एआई अपेक्षाओं से अधिक है | क्वांटा पत्रिका प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

परिचय

कृत्रिम बुद्धिमत्ता के उपकरण - विशेष रूप से तंत्रिका नेटवर्क - भौतिकविदों के लिए अच्छे रहे हैं। वर्षों से, इस तकनीक ने शोधकर्ताओं को त्वरक प्रयोगों में कण प्रक्षेप पथ का पुनर्निर्माण करने, नए कणों के साक्ष्य की खोज करने और गुरुत्वाकर्षण तरंगों और एक्सोप्लैनेट का पता लगाने में मदद की है। जबकि एआई उपकरण भौतिकविदों के लिए स्पष्ट रूप से बहुत कुछ कर सकते हैं, मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी के भौतिक विज्ञानी मैक्स टेगमार्क के अनुसार, अब सवाल यह है: "क्या हम कुछ वापस दे सकते हैं?"

टेगमार्क का मानना ​​है कि उनके भौतिक विज्ञानी साथी एआई के विज्ञान में महत्वपूर्ण योगदान दे सकते हैं, और उन्होंने इसे अपनी सर्वोच्च शोध प्राथमिकता बना लिया है। उन्होंने कहा, एक तरह से भौतिक विज्ञानी एआई प्रौद्योगिकी को आगे बढ़ाने में मदद कर सकते हैं, वह तंत्रिका नेटवर्क के "ब्लैक बॉक्स" एल्गोरिदम को प्रतिस्थापित करना होगा, जिनकी कार्यप्रणाली काफी हद तक गूढ़ है, भौतिक प्रक्रियाओं के अच्छी तरह से समझे जाने वाले समीकरणों के साथ।

यह विचार बिल्कुल नया नहीं है. जनरेटिव एआई मॉडल प्रसार पर आधारित है - वह प्रक्रिया, जो उदाहरण के लिए, एक कप कॉफी में डाले गए दूध को समान रूप से फैलाने का कारण बनती है - पहली बार 2015 में सामने आई, और तब से उनके द्वारा उत्पन्न छवियों की गुणवत्ता में काफी सुधार हुआ है। वह तकनीक DALL·E 2 और मिडजर्नी जैसे लोकप्रिय छवि-उत्पादक सॉफ़्टवेयर को शक्ति प्रदान करती है। अब, टेगमार्क और उनके सहयोगी यह सीख रहे हैं कि क्या अन्य भौतिकी-प्रेरित जेनरेटिव मॉडल प्रसार-आधारित मॉडल के साथ-साथ या उससे भी बेहतर काम कर सकते हैं।

पिछले साल के अंत में, टेगमार्क की टीम ने चित्र बनाने की एक आशाजनक नई विधि पेश की, जिसे कहा जाता है पॉइसन प्रवाह जनरेटिव मॉडल (पीएफजीएम)। इसमें डेटा को आवेशित कणों द्वारा दर्शाया जाता है, जो मिलकर एक विद्युत क्षेत्र बनाते हैं जिसके गुण किसी भी क्षण आवेशों के वितरण पर निर्भर करते हैं। इसे पॉइसन प्रवाह मॉडल कहा जाता है क्योंकि आवेशों की गति पॉइसन समीकरण द्वारा नियंत्रित होती है, जो इस सिद्धांत से निकला है कि दो आवेशों के बीच इलेक्ट्रोस्टैटिक बल उनके बीच की दूरी के वर्ग के विपरीत भिन्न होता है (न्यूटोनियन गुरुत्वाकर्षण के निर्माण के समान) .

वह भौतिक प्रक्रिया पीएफजीएम के केंद्र में है। "हमारे मॉडल को अंतरिक्ष में हर बिंदु पर विद्युत क्षेत्र की ताकत और दिशा से लगभग पूरी तरह से चित्रित किया जा सकता है," उन्होंने कहा यिलुन जू, एमआईटी में स्नातक छात्र और पेपर के सह-लेखक। "प्रशिक्षण प्रक्रिया के दौरान तंत्रिका नेटवर्क जो सीखता है वह यह है कि उस विद्युत क्षेत्र का अनुमान कैसे लगाया जाए।" और ऐसा करने पर, यह छवियां बनाना सीख सकता है क्योंकि इस मॉडल में एक छवि को विद्युत क्षेत्र द्वारा संक्षेप में वर्णित किया जा सकता है।

परिचय

पीएफजीएम उसी गुणवत्ता की छवियां बना सकता है जो प्रसार-आधारित दृष्टिकोण द्वारा उत्पादित की जाती हैं और ऐसा 10 से 20 गुना तेजी से होता है। "यह एक भौतिक निर्माण, विद्युत क्षेत्र का उपयोग करता है, जिस तरह से हमने पहले कभी नहीं देखा है," कहा हनानेल हज़ान, टफ्ट्स विश्वविद्यालय में एक कंप्यूटर वैज्ञानिक। "यह हमारे तंत्रिका नेटवर्क को बेहतर बनाने के लिए अन्य भौतिक घटनाओं का उपयोग करने की संभावना का द्वार खोलता है।"

भौतिकी से आयातित समीकरणों पर आधारित होने के अलावा, प्रसार और पॉइसन प्रवाह मॉडल में बहुत कुछ समान है। प्रशिक्षण के दौरान, छवि निर्माण के लिए डिज़ाइन किया गया एक प्रसार मॉडल आम तौर पर एक तस्वीर से शुरू होता है - एक कुत्ता, मान लीजिए - और फिर दृश्य शोर जोड़ता है, प्रत्येक पिक्सेल को यादृच्छिक तरीके से बदलता है जब तक कि इसकी विशेषताएं पूरी तरह से ढकी न हो जाएं (हालांकि पूरी तरह से समाप्त नहीं होती)। फिर मॉडल प्रक्रिया को उलटने का प्रयास करता है और एक कुत्ता उत्पन्न करता है जो मूल के करीब है। एक बार प्रशिक्षित होने के बाद, मॉडल एक खाली कैनवास से शुरू करके सफलतापूर्वक कुत्ते - और अन्य इमेजरी - बना सकता है।

पॉइसन प्रवाह मॉडल लगभग उसी तरह से काम करते हैं। प्रशिक्षण के दौरान, एक आगे की प्रक्रिया होती है, जिसमें एक बार-तीक्ष्ण छवि में धीरे-धीरे शोर जोड़ना शामिल होता है, और एक रिवर्स प्रक्रिया होती है जिसमें मॉडल उस शोर को चरण दर चरण हटाने का प्रयास करता है, जब तक कि प्रारंभिक संस्करण ज्यादातर पुनर्प्राप्त नहीं हो जाता। प्रसार-आधारित पीढ़ी की तरह, सिस्टम अंततः ऐसी छवियां बनाना सीख जाता है जो उसने प्रशिक्षण में कभी नहीं देखीं।

लेकिन पॉइसन मॉडल की अंतर्निहित भौतिकी पूरी तरह से अलग है। प्रसार थर्मोडायनामिक बलों द्वारा संचालित होता है, जबकि पॉइसन प्रवाह इलेक्ट्रोस्टैटिक बलों द्वारा संचालित होता है। उत्तरार्द्ध आवेशों की व्यवस्था का उपयोग करके एक विस्तृत छवि का प्रतिनिधित्व करता है जो एक बहुत ही जटिल विद्युत क्षेत्र बना सकता है। हालाँकि, वह क्षेत्र समय के साथ आवेशों को और अधिक समान रूप से फैलाने का कारण बनता है - जैसे दूध स्वाभाविक रूप से एक कप कॉफी में फैल जाता है। इसका परिणाम यह होता है कि क्षेत्र स्वयं सरल और अधिक समान हो जाता है। लेकिन यह शोर-शराबा वाला एकसमान क्षेत्र पूरी तरह से खाली स्लेट नहीं है; इसमें अभी भी जानकारी के बीज मौजूद हैं जिनसे छवियों को आसानी से इकट्ठा किया जा सकता है।

2023 की शुरुआत में, टीम ने अपने पॉइसन मॉडल को अपग्रेड किया, इसे विस्तारित करना मॉडलों के एक पूरे परिवार को शामिल करने के लिए। संवर्धित संस्करण, पीएफजीएम++ में एक नया पैरामीटर शामिल है, D, जो शोधकर्ताओं को सिस्टम की आयामीता को समायोजित करने की अनुमति देता है। यह एक बड़ा अंतर ला सकता है: परिचित त्रि-आयामी अंतरिक्ष में, किसी चार्ज द्वारा उत्पन्न विद्युत क्षेत्र की ताकत उस चार्ज से दूरी के वर्ग से विपरीत रूप से संबंधित होती है। लेकिन चार आयामों में, क्षेत्र की ताकत व्युत्क्रम घन नियम का पालन करती है। और अंतरिक्ष के हर आयाम के लिए, और हर मूल्य के लिए D, वो रिश्ता कुछ अलग है.

परिचय

उस एकल नवाचार ने पॉइसन प्रवाह मॉडल को कहीं अधिक परिवर्तनशीलता प्रदान की, चरम मामलों में विभिन्न लाभ प्रदान किए गए। कब D कम है, उदाहरण के लिए, मॉडल अधिक मजबूत है, जिसका अर्थ है कि यह विद्युत क्षेत्र का अनुमान लगाने में की गई त्रुटियों के प्रति अधिक सहनशील है। "मॉडल विद्युत क्षेत्र की सटीक भविष्यवाणी नहीं कर सकता," ने कहा ज़िमिंग लियू, एमआईटी में एक और स्नातक छात्र और दोनों पत्रों के सह-लेखक। “हमेशा कुछ विचलन होता है। लेकिन मजबूती का मतलब है कि भले ही आपकी अनुमान त्रुटि अधिक हो, फिर भी आप अच्छी छवियां उत्पन्न कर सकते हैं। तो हो सकता है कि आप अपने सपनों के कुत्ते के साथ न मिलें, लेकिन आप फिर भी कुत्ते जैसी किसी चीज़ के साथ ज़रूर पहुँचेंगे।

दूसरे चरम पर, जब D उच्च है, तंत्रिका नेटवर्क को प्रशिक्षित करना आसान हो जाता है, जिससे इसके कलात्मक कौशल में महारत हासिल करने के लिए कम डेटा की आवश्यकता होती है। सटीक कारण समझाना आसान नहीं है, लेकिन यह इस तथ्य के कारण है कि जब अधिक आयाम होते हैं, तो मॉडल के पास ट्रैक रखने के लिए कम विद्युत क्षेत्र होते हैं - और इसलिए आत्मसात करने के लिए कम डेटा होता है।

उन्नत मॉडल, पीएफजीएम++, "आपको उन दो चरम सीमाओं के बीच अंतरण करने की सुविधा देता है," कहा रोज यू, कैलिफोर्निया विश्वविद्यालय, सैन डिएगो में एक कंप्यूटर वैज्ञानिक।

और इस सीमा के भीतर कहीं न कहीं इसके लिए एक आदर्श मूल्य निहित है D जू ने कहा, यह मजबूती और प्रशिक्षण में आसानी के बीच सही संतुलन बनाता है। “भविष्य के काम का एक लक्ष्य उस पसंदीदा स्थान को खोजने का एक व्यवस्थित तरीका निकालना होगा, ताकि हम सर्वोत्तम संभव का चयन कर सकें D परीक्षण और त्रुटि का सहारा लिए बिना किसी दी गई स्थिति के लिए।

एमआईटी शोधकर्ताओं के लिए एक अन्य लक्ष्य में अधिक भौतिक प्रक्रियाएं ढूंढना शामिल है जो जेनरेटर मॉडल के नए परिवारों के लिए आधार प्रदान कर सकते हैं। नामक एक प्रोजेक्ट के माध्यम से GenPhys, टीम ने पहले ही एक आशाजनक उम्मीदवार की पहचान कर ली है: युकावा क्षमता, जो कमजोर परमाणु बल से संबंधित है। लियू ने कहा, "यह पॉइसन प्रवाह और प्रसार मॉडल से अलग है, जहां कणों की संख्या हमेशा संरक्षित रहती है।" “युकावा क्षमता आपको कणों को नष्ट करने या एक कण को ​​दो भागों में विभाजित करने की अनुमति देती है। उदाहरण के लिए, ऐसा मॉडल जैविक प्रणालियों का अनुकरण कर सकता है जहां कोशिकाओं की संख्या समान नहीं रहनी चाहिए।

यू ने कहा, यह जांच का एक उपयोगी सिलसिला हो सकता है। "यह छवि निर्माण से परे संभावित अनुप्रयोगों के साथ नए एल्गोरिदम और नए जेनरेटिव मॉडल को जन्म दे सकता है।"

और अकेले पीएफजीएम++ पहले ही अपने आविष्कारकों की मूल अपेक्षाओं को पार कर चुका है। उन्हें पहले तो पता ही नहीं चला कि कब D अनंत पर सेट है, उनका एम्पेड-अप पॉइसन प्रवाह मॉडल एक प्रसार मॉडल से अप्रभेद्य हो जाता है। लियू ने इस साल की शुरुआत में की गई गणना में इसका पता लगाया।

मर्ट पिलान्सीस्टैनफोर्ड विश्वविद्यालय के एक कंप्यूटर वैज्ञानिक, इस "एकीकरण" को एमआईटी समूह के काम से उत्पन्न सबसे महत्वपूर्ण परिणाम मानते हैं। "पीएफजीएम++ पेपर," उन्होंने कहा, "पता चलता है कि ये दोनों मॉडल एक व्यापक वर्ग का हिस्सा हैं, [जो] एक दिलचस्प सवाल उठाता है: क्या जेनरेटिव एआई के लिए अन्य भौतिक मॉडल खोज की प्रतीक्षा कर रहे हैं, जो और भी व्यापक एकीकरण का संकेत दे रहे हैं? ”

समय टिकट:

से अधिक क्वांटमगाज़ी