बड़ा भाषा मॉडल भविष्यवाणी करता है कि अकार्बनिक यौगिक कैसे बनाए जाएं - भौतिकी विश्व

बड़ा भाषा मॉडल भविष्यवाणी करता है कि अकार्बनिक यौगिक कैसे बनाए जाएं - भौतिकी विश्व

योजनाबद्ध आरेख यह दर्शाता है कि टीम ने नए मॉडल को कैसे प्रशिक्षित किया

चीन में शोधकर्ताओं ने एक ऐसी प्रणाली बनाने के लिए मौजूदा बड़े भाषा मॉडल (एलएलएम) को ठीक किया है जो एक अकार्बनिक यौगिक को संश्लेषित करने के लिए आवश्यक चरणों की भविष्यवाणी कर सकता है। हालाँकि नए मॉडल, जिसे मैटचैट कहा जाता है, को प्रयोगशाला में नियोजित करने से पहले और अधिक परिशोधन की आवश्यकता है, इसके डेवलपर्स का कहना है कि यह वैज्ञानिक संदर्भ में जेनरेटिव आर्टिफिशियल इंटेलिजेंस को लागू करने में एक महत्वपूर्ण प्रारंभिक प्रयास का प्रतिनिधित्व करता है।

एलएलएम एक प्रकार की कृत्रिम बुद्धिमत्ता है जो पाठ के अनुक्रम से अर्थ निकालती है। ऐसा करने के लिए, उन्हें पहले बड़ी मात्रा में डेटा पर प्रशिक्षित किया जाना चाहिए। हालाँकि, यह प्रशिक्षण अनियंत्रित हो सकता है, जिसका अर्थ है कि एलएलएम को स्व-शिक्षा कहा जाता है। वे बहुत लचीले होते हैं, प्रश्नों का उत्तर देने, पाठ लिखने, भाषाओं का अनुवाद करने और वाक्यों को पूरा करने जैसे कार्य करने में सक्षम होते हैं। प्रसिद्ध उदाहरणों में ओपन एआई का जीपीटी-3 मॉडल और इसका सुलभ स्पिन-ऑफ, चैटजीपीटी शामिल है, जो पहले से ही अपेक्षाकृत कम संख्या में इनपुट या "संकेतों" से भविष्यवाणियां कर सकता है।

एक एलएलएम बनाने के लिए जो अकार्बनिक संश्लेषण को "समझता है", शोधकर्ताओं ने नेतृत्व किया मियाओ लियू, में एक भौतिक विज्ञानी भौतिकी संस्थान, चीनी विज्ञान अकादमी, बीजिंग और के संस्थापक atomly.net, अतिरिक्त वैज्ञानिक डेटा के साथ LLaMA2-7B नामक एक अग्रणी ओपन-सोर्स एलएलएम की आपूर्ति की। ऐसा करने में, लियू कहते हैं, वे "न्यूनतम डेटासेट का उपयोग करके इसे मानव अनुभूति के समान सोचने के लिए सशक्त बनाते हैं"। उन्होंने 13 878 अकार्बनिक यौगिकों से निकाले गए रासायनिक संश्लेषण प्रोटोकॉल का उपयोग करके मॉडल को प्रशिक्षित किया, जिसे उन्होंने संकलित चार मिलियन से अधिक वैज्ञानिक प्रकाशनों के संग्रह से प्राप्त किया था। क्रिस्टिन सीडर और सहयोगियों पर लॉरेंस बर्कले राष्ट्रीय प्रयोगशाला अमेरिका में।

लियू बताते हैं, "यह प्रशिक्षण डेटा मॉडल को अकार्बनिक संश्लेषण प्रश्नों को उसी तरह समझने और प्रतिक्रिया देने की अनुमति देता है जैसे एक जानकार विशेषज्ञ देता है।" “उदाहरण के लिए, जब LiMnO को संश्लेषित करने के बारे में पूछा गया2, मैटचैट एक विस्तृत प्रतिक्रिया प्रदान कर सकता है जिसमें साहित्य में प्रतिक्रिया अग्रदूत, समीकरण और सापेक्ष संदर्भ शामिल हैं।

उनका कहना है कि एक सामान्य आदान-प्रदान कुछ इस तरह दिख सकता है:

प्रश्न: LiMnO2 का संश्लेषण कैसे करें?

उत्तर: LiMnO2 ठोस अवस्था प्रतिक्रिया के माध्यम से Li2CO3 और MnO2 से बनाया जा सकता है। रासायनिक प्रतिक्रिया समीकरण (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2) है। पूर्ववर्तियों को मिश्रित किया जाता है, 800.0 घंटे के लिए हवा में 2.0 डिग्री सेल्सियस पर कैल्सीन किया जाता है, मिश्रित किया जाता है, 800.0 घंटे के लिए हवा में 2.0 डिग्री सेल्सियस पर कैलक्लाइंड किया जाता है। विस्तृत नुस्खा साहित्य में पाया जा सकता है...

एक नई परियोजना का विचार

सूचना प्रौद्योगिकी और एआई विषय पर इंटेल द्वारा आयोजित एक सम्मेलन में भाग लेने के बाद लियू को अगस्त 2023 में मैटचैट परियोजना का विचार आया। लियू कहते हैं, "हालांकि बैठक का विज्ञान से कोई लेना-देना नहीं था, लेकिन मैंने एआई और उसके अनुप्रयोगों में प्रचलित विषयों के बारे में बहुत कुछ सीखा।" "इसने मुझे संश्लेषण नुस्खा भविष्यवाणी में एलएलएम लागू करने के लिए प्रेरित किया।"

परियोजना को साकार करने के लिए, लियू ने एक सहकर्मी के साथ मिलकर काम किया, ज़ोंगगुओ वांग, और एक पीएचडी छात्र, फंकाई झी. जबकि ज़ी ने मॉडल को प्रशिक्षित किया, वांग ने मॉडल का निर्माण किया निःशुल्क उपलब्ध ऑनलाइन प्लेटफ़ॉर्म जो इसे उपयोगकर्ताओं के साथ बातचीत करने में सक्षम बनाता है।

लियू बताते हैं, "हालांकि इस प्रकार के एप्लिकेशन के लिए मैटचैट अंतिम समाधान नहीं हो सकता है, लेकिन हमारा काम एलएलएम को वैज्ञानिक संदर्भ में लागू करने के शुरुआती प्रयासों में से एक का प्रतिनिधित्व करता है।" भौतिकी की दुनिया. "हमें उम्मीद है कि हमारा अध्ययन कई क्षेत्रों में समान एआई टूल के निर्माण के लिए उत्प्रेरक के रूप में काम करेगा।"

आगे देखते हुए, शोधकर्ताओं ने अपने डेटासेट का विस्तार करके और अपने स्वयं के व्यापक सामग्री विज्ञान डेटाबेस, atomly.net से कम्प्यूटेशनल और प्रयोगात्मक डेटा को एकीकृत करके, साथ ही अकार्बनिक सामग्री संश्लेषण के लिए आगामी रोबोट स्वायत्त प्रयोगशाला से मैटचैट की क्षमताओं को परिष्कृत करने की योजना बनाई है। लियू कहते हैं, "इन संसाधनों का लाभ उठाते हुए, हमारा लक्ष्य इस क्षेत्र के लिए उन्नत एआई उपकरण विकसित करना जारी रखना है।"

नए AI मॉडल का विवरण इसमें दिया गया है चीनी भौतिकी बी, और प्रीप्रिंट फॉर्म में दिखाई दिया arXiv लगभग उसी समय जब ए माइक्रोसॉफ्ट के शोधकर्ताओं से प्रीप्रिंट जिन्होंने लोकप्रिय ChatGPT4 LLM का उपयोग करके एक समान उपलब्धि का प्रदर्शन किया।

समय टिकट:

से अधिक भौतिकी की दुनिया