यूएई का नया एआई चैटबॉट 'जैस' अरबी बोलने वालों की जरूरतों को पूरा करता है

यूएई का नया एआई चैटबॉट 'जैस' अरबी बोलने वालों की जरूरतों को पूरा करता है

सीएनएन के अनुसार, संयुक्त अरब अमीरात (यूएई) में शिक्षाविदों, शोधकर्ताओं और इंजीनियरों की एक टीम ने विशेष रूप से दुनिया भर में अरबी भाषा बोलने वाले लोगों की जरूरतों को पूरा करने के लिए 'जैस' नामक एक नए जेनरेटिव एआई चैटबॉट का अनावरण किया।

टीम का तर्क है कि अरबी, छठा सबसे ज्यादा बोली जाने वाली लगभग 272 मिलियन बोलने वालों के साथ दुनिया में भाषा को "मुख्यधारा एआई में कम प्रतिनिधित्व दिया गया है।" वे बड़े भाषा मॉडल (एलएलएम) के रूप में जाने जाने वाले एआई सिस्टम के प्रशिक्षण में अंग्रेजी के प्रभुत्व को खत्म करने की उम्मीद कर रहे हैं।

जैस एआई चैटबॉट मध्य पूर्व पर केंद्रित है

एआई में भाषा का मुद्दा दुनिया भर में चिंता का विषय है। जापान ने हाल ही में अंग्रेजी को छोड़ दिया है क्योंकि देश ने चैटजीपीटी का अपना संस्करण बनाया है। शोधकर्ताओं कहा जबकि OpenAI का चैटबॉट अंग्रेजी में उत्कृष्ट है, यह अक्सर "वर्णमाला प्रणाली, सीमित डेटा और अन्य कारकों में अंतर के कारण" जापानी भाषा में कम पड़ जाता है।

सीएनएन के अनुसार, जायस का नाम संयुक्त अरब अमीरात के एक पर्वत के नाम पर रखा गया है रिपोर्ट कहता है, और कमांड पर कार्य कर सकता है, जैसे कविताएँ लिखना, जैसे ChatGPT या Google का चारण, लेकिन सीमित पैमाने पर। एआई को डेटा के 13 अरब मापदंडों पर प्रशिक्षित किया गया है, जो चैटजीपीटी 3.5 के लगभग 175 अरब मापदंडों की तुलना में बहुत कम है, यह एक बड़े भाषा मॉडल के आकार का माप है, लेकिन इसकी सटीकता नहीं।

अबू धाबी के मोहम्मद बिन जायद यूनिवर्सिटी ऑफ आर्टिफिशियल इंटेलिजेंस (एमबीजेडयूएआई) में प्राकृतिक भाषा प्रसंस्करण के प्रोफेसर टिमोथी बाल्डविन के अनुसार, जैस के डेटासेट को 30 अरब मापदंडों तक विस्तारित करने और इसे केवल पाठ के बजाय छवियों और ग्राफ़ को पढ़ने में सक्षम बनाने की योजना है।

जैस बनाने के लिए विश्वविद्यालय ने सिलिकॉन वैली के सेरेब्रस सिस्टम्स एंड इंसेप्शन, जो यूएई स्थित एआई फर्म जी42 की सहायक कंपनी है, के साथ काम किया। बाल्डविन ने कहा कि मेटा के एलएलएएमए और ओपनएआई के जीपीटी जैसे प्रतिद्वंद्वी एलएलएम अरबी समझ सकते हैं, लेकिन उन्हें मुख्य रूप से ऑनलाइन अंग्रेजी डेटा पर प्रशिक्षित किया जाता है।

जैस के लिए, प्रशिक्षण में अंग्रेजी और अरबी दोनों डेटासेट का संयोजन शामिल था, लेकिन मध्य पूर्व की सामग्री पर जानबूझकर ध्यान केंद्रित किया गया था, जहां अरबी व्यापक रूप से बोली और लिखी जाती है।

बाल्डविन ने कहा कि इस तरह का फोकस एआई चैटबॉट को "अरबी के लिए कोई और क्या हासिल करने में सक्षम है" से आगे जाने की अनुमति देता है।

MBZUAI के अनुसार, जैस का अनूठा प्रशिक्षण चैटबॉट को 'सांस्कृतिक बारीकियों और बोलियों को समझने' में मदद करता है, जिससे यह विभिन्न उद्योगों की एक विस्तृत श्रृंखला के लिए अधिक उपयोगी हो जाता है। डेवलपर्स ने मॉडल को खुले स्रोत में जनता के लिए उपलब्ध कराया, जिसका अर्थ है कि कोई भी इसे अनुकूलित कर सकता है।

यूएई का नया एआई चैटबॉट 'जैस' अरबी बोलने वालों को प्लेटोब्लॉकचेन डेटा इंटेलिजेंस प्रदान करता है। लंबवत खोज. ऐ.

यूएई का नया एआई चैटबॉट 'जैस' अरबी बोलने वालों को प्लेटोब्लॉकचेन डेटा इंटेलिजेंस प्रदान करता है। लंबवत खोज. ऐ.

बोलियों के बीच स्विच करना

बाल्डविन ने सीएनएन को बताया कि जैस का विविध डेटा प्रशिक्षण इसे आधुनिक मानक अरबी की बोलियों के बीच स्विच करने में सक्षम करेगा, जिसका उपयोग आधिकारिक दस्तावेजों और औपचारिक लेखन के लिए किया जाता है, और स्थानीय बोलियां जो आमतौर पर ब्लॉग या सोशल मीडिया पर उपयोग की जाती हैं।

उन्होंने कहा, "वहां निश्चित रूप से सुधार की गुंजाइश है, लेकिन अगर हमारे पास मॉडल के लिए अधिक अनौपचारिक इनपुट हैं तो समझने में सक्षम होने के संदर्भ में मजबूती पर अधिक ध्यान केंद्रित किया गया है।"

अन्य जेनेरिक एआई चैटबॉट्स की तरह, जैस को ऐसे संकेतों का विरोध करने के लिए बनाया गया है जो "विषैला या हानिकारक" उत्तर, बाल्डविन ने कहा, और उन प्रश्नों का उत्तर नहीं देंगे जो "खुद को नुकसान पहुंचाते हैं या लत का संकेत देते हैं।" समलैंगिकता जैसे विषय मुस्लिम मान्यताओं के अनुरूप सीमा से बाहर हैं।

यह भी पढ़ें: चैटजीपीटी की 'अंग्रेजी भाषा' पर निर्भरता ने जापान को अपना खुद का एआई चैटबॉट बनाने के लिए मजबूर कर दिया है

वाशिंगटन, डीसी में मध्य पूर्व संस्थान में रणनीतिक प्रौद्योगिकियों और साइबर सुरक्षा कार्यक्रम के निदेशक मोहम्मद सोलिमन के अनुसार, अंग्रेजी जैसी लैटिन वर्णमाला-आधारित भाषाएँ हावी इंटरनेट, यानी डेटासेट उन भाषाओं में सबसे बड़े हैं।

उन्होंने कहा, "एआई उपकरणों तक पहुंच केवल उन लोगों के लिए बनाने से जो विशिष्ट भाषाएं बोल सकते हैं, समाज के वंचित वर्गों को एआई का लाभ लेने से रोका जा सकता है।"

सीएनएन की रिपोर्ट के अनुसार, सोलिमन ने कहा, "[इन एलएलएम] में अन्य संस्कृतियों के बारे में जागरूकता की कमी है, जिससे विभिन्न पृष्ठभूमि के लोगों के उपयोगकर्ता अनुभव पर प्रतिकूल प्रभाव पड़ रहा है।"

यूएई ने जेनेरिक एआई सिस्टम विकसित करने में महत्वपूर्ण प्रगति की है। नियुक्त करने वाला अमीरात दुनिया का पहला देश था एआई मंत्री 2017 में। यह कथित तौर पर क्षेत्र के सबसे बड़े जेनरेटिव एआई मॉडल, फाल्कन का भी दावा करता है, जिसे मार्च में अबू धाबी के एडवांस्ड टेक्नोलॉजी रिसर्च काउंसिल और टेक्नोलॉजी इनोवेशन इंस्टीट्यूट (टीआईआई) द्वारा जारी किया गया था।

समय टिकट:

से अधिक मेटान्यूज