टेक्नोलॉजी इनोवेशन इंस्टिट्यूट ने Amazon SageMaker पर अत्याधुनिक Falcon LLM 40B फाउंडेशन मॉडल को प्रशिक्षित किया | अमेज़न वेब सेवाएँ

टेक्नोलॉजी इनोवेशन इंस्टिट्यूट ने Amazon SageMaker पर अत्याधुनिक Falcon LLM 40B फाउंडेशन मॉडल को प्रशिक्षित किया | अमेज़न वेब सेवाएँ

यह ब्लॉग पोस्ट एआई-क्रॉस सेंटर यूनिट के कार्यकारी निदेशक-कार्यवाहक मुख्य एआई शोधकर्ता और टीआईआई में एलएलएम परियोजनाओं के लिए प्रोजेक्ट लीड डॉ. एब्तेसम अल्माज़रूई के साथ सह-लिखा गया है।

संयुक्त अरब अमीरात (यूएई) प्रौद्योगिकी नवाचार संस्थान (टीआईआई), अबू धाबी के अनुप्रयुक्त अनुसंधान स्तंभ उन्नत प्रौद्योगिकी अनुसंधान परिषदने फाल्कन एलएलएम लॉन्च किया है, जो 40 बिलियन पैरामीटर्स के साथ एक आधारभूत लार्ज लैंग्वेज मॉडल (एलएलएम) है। टीआईआई एक अग्रणी वैश्विक अनुसंधान केंद्र है जो ज्ञान की सीमाओं को आगे बढ़ाने के लिए समर्पित है। TII के वैज्ञानिकों, शोधकर्ताओं और इंजीनियरों की टीम खोज विज्ञान और परिवर्तनकारी तकनीकों को वितरित करने के लिए काम करती है। टीआईआई का काम उन सफलताओं पर केंद्रित है जो हमारे समाज को भविष्य-प्रमाणित करेंगी। 1 ट्रिलियन टोकन पर प्रशिक्षित, टीआईआई फाल्कन एलएलएम अविश्वसनीय रूप से लागत प्रभावी रहते हुए शीर्ष प्रदर्शन का दावा करता है। Falcon-40B अन्य उच्च प्रदर्शन वाले LLM के प्रदर्शन से मेल खाता है, और जनता में शीर्ष क्रम का ओपन-सोर्स मॉडल है हगिंग फेस ओपन एलएलएम लीडरबोर्ड. यह दो अलग-अलग आकारों - फाल्कन-40बी और फाल्कन-7बी में ओपन-सोर्स के रूप में उपलब्ध है और डेटा प्रीप्रोसेसिंग और मॉडल प्रशिक्षण नौकरियों का उपयोग करके स्क्रैच से बनाया गया था। अमेज़न SageMaker. ओपन-सोर्सिंग फाल्कन 40बी उपयोगकर्ताओं को एआई टूल्स बनाने और अनुकूलित करने में सक्षम बनाता है जो अद्वितीय उपयोगकर्ताओं की जरूरतों को पूरा करते हैं, निर्बाध एकीकरण की सुविधा प्रदान करते हैं और डेटा संपत्तियों के दीर्घकालिक संरक्षण को सुनिश्चित करते हैं। मॉडल वजन कहीं भी डाउनलोड करने, निरीक्षण करने और परिनियोजित करने के लिए उपलब्ध हैं।

7 जून से, दोनों Falcon LLM Amazon SageMaker JumpStart, SageMaker के मशीन लर्निंग (ML) हब में भी उपलब्ध होंगे, जो पूर्व-प्रशिक्षित मॉडल, बिल्ट-इन एल्गोरिदम, और पूर्व-निर्मित समाधान टेम्प्लेट प्रदान करता है, जिससे आपको ML के साथ शीघ्रता से शुरुआत करने में मदद मिलती है। आप कुछ ही क्लिक में फाल्कन एलएलएम को परिनियोजित और उपयोग कर सकते हैं सेजमेकर स्टूडियो या प्रोग्राम के माध्यम से सेजमेकर पायथन एसडीके. फाल्कन एलएलएम के खिलाफ अनुमान लगाने और चलाने के लिए, देखें सेजमेकर जम्पस्टार्ट का परिचय - फाल्कन एलएलएम के साथ टेक्स्ट जेनरेशन उदाहरण नोटबुक।

टेक्नोलॉजी इनोवेशन इंस्टीट्यूट अमेज़ॅन सेजमेकर पर अत्याधुनिक फाल्कन एलएलएम 40बी फाउंडेशन मॉडल का प्रशिक्षण देता है | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

एआई-क्रॉस सेंटर यूनिट के कार्यकारी निदेशक-कार्यवाहक मुख्य एआई शोधकर्ता और टीआईआई में एलएलएम परियोजनाओं के लिए प्रोजेक्ट लीड डॉ. एब्तेसम अल्माज़रूई ने साझा किया:

“हम गर्व से दुनिया के शीर्ष रैंकिंग वाले ओपन-सोर्स भाषा मॉडल, फाल्कन-40बी की आधिकारिक ओपन-सोर्स रिलीज़ की घोषणा करते हैं। फाल्कन-40बी 40बी मापदंडों के साथ एक असाधारण ओपन-सोर्स मॉडल है, जिसे विशेष रूप से केवल-कारण डिकोडर मॉडल के रूप में डिज़ाइन किया गया है। इसे 1,000बी टोकन के विशाल डेटासेट पर प्रशिक्षित किया गया था, जिसमें क्यूरेटेड कॉर्पोरा के साथ परिष्कृत रिफाइंडवेब भी शामिल था। मॉडल को अपाचे 2.0 लाइसेंस के तहत उपलब्ध कराया गया है, जिससे इसकी पहुंच और उपयोगिता सुनिश्चित होती है। हगिंग फेस द्वारा बनाए गए सार्वजनिक लीडरबोर्ड पर फाल्कन-40बी ने एलएलएएमए-65बी, स्टेबलएलएम और एमपीटी जैसे प्रसिद्ध मॉडलों को पीछे छोड़ दिया है। फाल्कन-40बी की वास्तुकला को फ्लैशअटेंशन और मल्टीक्वेरी तकनीकों को शामिल करते हुए अनुमान के लिए अनुकूलित किया गया है।

“यह कदम सामुदायिक जुड़ाव, शिक्षा, वास्तविक दुनिया के अनुप्रयोगों और सहयोग के लिए एआई नवाचार और प्रौद्योगिकी तत्परता स्तर की सीमाओं को आगे बढ़ाने के लिए हमारे समर्पण को दर्शाता है। डॉ. एबतेसम जारी है। “फाल्कन-40बी को एक ओपन-सोर्स मॉडल के रूप में जारी करके, हम शोधकर्ताओं, उद्यमियों और संगठनों को इसकी असाधारण क्षमताओं का उपयोग करने और स्वास्थ्य सेवा से लेकर अंतरिक्ष, वित्त, विनिर्माण से लेकर बायोटेक तक एआई-संचालित समाधानों में प्रगति करने का अवसर प्रदान करते हैं; एआई-संचालित समाधानों की संभावनाएं असीमित हैं। फाल्कन-40बी तक पहुँचने और इसकी उल्लेखनीय क्षमता का पता लगाने के लिए, कृपया जाएँ FalconLLM.tii.ae. एआई के भविष्य को आकार देने और उद्योगों में क्रांति लाने के लिए फाल्कन-40बी की शक्ति का लाभ उठाने में हमारे साथ जुड़ें।

इस पोस्ट में, हम सैजमेकर पर फाल्कन एलएलएम प्रशिक्षण, डेटा क्यूरेशन, ऑप्टिमाइज़ेशन, प्रदर्शन और अगले चरणों के बारे में डॉ. अल्माज़रूई के साथ गहन गोता लगाते हैं।

एलएलएम की एक नई पीढ़ी

एलएलएम प्राकृतिक पाठ अनुक्रमों को पूरा करने के लिए प्रशिक्षित सॉफ्टवेयर एल्गोरिदम हैं। उनके आकार और प्रशिक्षण डेटा की मात्रा के कारण वे बातचीत करते हैं, एलएलएम में प्रभावशाली पाठ प्रसंस्करण क्षमताएं होती हैं, जिसमें संक्षेपण, प्रश्न उत्तर, संदर्भ में सीखने और बहुत कुछ शामिल है।

2020 की शुरुआत में, दुनिया भर के अनुसंधान संगठनों ने मॉडल के आकार पर जोर दिया, यह देखते हुए कि सटीकता मापदंडों की संख्या से संबंधित है। उदाहरण के लिए, GPT-3 (2020) और BLOOM (2022) में लगभग 175 बिलियन पैरामीटर हैं, गोफर (2021) में 230 बिलियन पैरामीटर और MT-NLG (2021) में 530 बिलियन पैरामीटर हैं। 2022 में, हॉफमैन एट अल। ने देखा कि मॉडल पैरामीटर और डेटासेट आकार के बीच गणना का वर्तमान संतुलन इष्टतम नहीं था, और प्रकाशित अनुभवजन्य स्केलिंग कानून यह सुझाव देते हैं कि अधिक डेटा पर प्रशिक्षित छोटे मॉडल के लिए गणना बजट को संतुलित करने से बेहतर प्रदर्शन करने वाले मॉडल हो सकते हैं। उन्होंने 70B पैरामीटर चिनचिला (2022) मॉडल में अपने मार्गदर्शन को लागू किया, जिसने बहुत बड़े मॉडल को मात दी।

SageMaker पर एलएलएम प्रशिक्षण

सेजमेकर एलएलएम सहित मशीन लर्निंग (एमएल) मॉडल के विकास, प्रशिक्षण, ट्यूनिंग और होस्टिंग के लिए प्रबंधित एपीआई का एक संग्रह है। कई ग्राहक अपने एलएलएम वर्कलोड के लिए सेजमेकर पर भरोसा करते हैं, जैसे स्थिरता एआई, AI21 लैब्स, गले लगना, तथा एलजी एआई. SageMaker प्रशिक्षण प्रावधान उपयोगकर्ता-परिभाषित हार्डवेयर कॉन्फ़िगरेशन और कोड के साथ क्लस्टर की गणना करते हैं। गणना कार्यों को प्रति रन बिल किया जाता है, दूसरे के अनुपात में, जिसका अर्थ है कि सेवा का उपयोग नहीं करने पर उपयोगकर्ताओं से GPU क्षमता के लिए शुल्क नहीं लिया जाता है। TII ने फाल्कन एलएलएम को प्रशिक्षित करने के लिए सैजमेकर ट्रेनिंग एपीआई द्वारा प्रदान किए गए क्षणिक समूहों का उपयोग किया, जो 48 ml.p4d.24xबड़े उदाहरणों तक, 384 NVIDIA A100 GPU में संचयी है। अब, TII अगले Falcon LLM को प्रशिक्षित कर रहा है और उनके प्रशिक्षण को 3,136 A100 GPU (392 ml.p4d इंस्टेंसेस) तक बढ़ा दिया है।

विज्ञान की गुणवत्ता और प्रशिक्षण की गति के बार को बढ़ाने के लिए कस्टम नवाचारों की एक अभूतपूर्व मात्रा परियोजना की सभी परतों में चली गई। अगले खंडों में, हम डीप लर्निंग (डीएल) प्रशिक्षण प्रणाली की सभी परतों पर किए गए अनुकूलन टीआईआई का वर्णन करते हैं।

स्केलेबल डेटा क्यूरेशन

नवीनतम पीढ़ी के एलएलएम को प्रशिक्षण डेटा के आकार और गुणवत्ता से ताकत मिलती है। टीम ने उच्च-गुणवत्ता वाले ट्रिलियन-टोकन डेटासेट के शिल्प में विशिष्ट देखभाल की। कई सेजमेकर ट्रेनिंग सीपीयू जॉब्स ने सस्ते, स्केलेबल वेब डेटा के पेटाबाइट्स को एक क्यूरेटेड, सुरक्षित प्रशिक्षण डेटासेट में बदल दिया। स्वचालित सिस्टम ने डेटा को फ़िल्टर और डुप्लिकेट किया; उदाहरण के लिए, ML क्लासिफायर का उपयोग गाली-गलौज को फ़िल्टर करने के लिए किया जाता था। डेटा परिवर्तन कार्यों को चलाने के लिए SageMaker प्रशिक्षण के माध्यम से कुछ API कॉल में ml.c5.18xlarge (72 vCPUs, 144 GB RAM) पर चल रहे CPU जॉब्स को तत्काल किया गया था। अंतर उपयोग मामलों के लिए टीम ने सिंगल-इंस्टेंस और मल्टी-इंस्टेंस दोनों CPU जॉब्स का उपयोग किया। इनमें से कुछ नौकरियों में सैकड़ों समानांतर शेयर-नथिंग आर्किटेक्चर (SNA) जॉब्स का इस्तेमाल किया गया, प्रत्येक एक मशीन पर, और इंटर-वर्कर सिंक्रोनाइज़ेशन की आवश्यकता वाले कार्यों के लिए, टीम ने मल्टी-इंस्टेंस जॉब्स लॉन्च कीं, दर्जनों उदाहरणों और हजारों वीसीपीयू में संचयी। उपाख्यानात्मक रूप से, एक डाउनस्ट्रीम डेटासेट तैयारी कार्य पर, टीम एकल सेजमेकर प्रशिक्षण कार्य में 257 ml.c5.18xlarge तक गई, 18,504 vCPU और 37 TB मेमोरी में संचयी।

प्रशिक्षण थ्रूपुट को अधिकतम करना

प्रशिक्षण लागत और समय-से-बाजार दोनों को कम करने के लिए, टीम ने प्रति सेकंड संसाधित प्रशिक्षण टोकन के अनुपात में प्रशिक्षण गति में तेजी लाने के लिए अनुकूलन के कई दिशाओं का पालन किया और TFLOPs/GPU में मापा गया। टीम ने पूरी तरह से कस्टम 3डी-समानांतर एलएलएम प्रशिक्षण ढांचे का उपयोग किया, जिसमें संकलित जीपीयू कोड में लिखी गई कस्टम अनुकूलित परतें शामिल हैं। आगे की गति प्राप्त करने के लिए टीम ने अपने स्वयं के कस्टम मैट्रिक्स गुणन कार्यान्वयन को लिखने तक का काम किया! टीम ने तर्क भी विकसित किया जो अंतर्निहित नेटवर्क टोपोलॉजी के समांतर संचार को अनुकूलित करता है। अपने प्रारंभिक स्केलिंग प्रयोगों के दौरान, TII 166 GPU पर 147B मॉडल पर 256 TFLOPs/GPU, और 173 GPU पर 13B मॉडल पर 16 TFLOPs/GPU तक पहुंचने में सक्षम था, हमारे ज्ञान में क्लाउड में प्राप्त सबसे तेज़-ज्ञात मॉडल TFLOPs है। 2022 के अंत में परीक्षण का समय।

सर्वर रहित भंडारण

एलएलएम प्रशिक्षण भंडारण गहन है; प्रशिक्षण डेटा के कई टेराबाइट्स को प्रशिक्षण क्लस्टर में भेजने की आवश्यकता होती है, और कई टेराबाइट्स मॉडल चेकपॉइंट्स नियमित रूप से क्लस्टर से स्थायी भंडारण तक वापस जाते हैं। नौकरी फिर से शुरू होने की स्थिति में चेकपॉइंट्स को जितनी जल्दी हो सके प्रशिक्षण क्लस्टर तक पहुंचने की आवश्यकता है। पारंपरिक उच्च-प्रदर्शन कंप्यूटिंग (HPC) में, कंप्यूटिंग नोड्स वितरित फ़ाइल सिस्टम से जुड़े होते हैं, जो POSIX- जैसे इंटरफ़ेस के माध्यम से उच्च-प्रदर्शन I/O और थ्रूपुट प्रदान करते हैं। AWS में, ग्राहक नियमित रूप से उपयोग करते हैं चमक के लिए अमेज़न FSx इस उद्देश्य के लिए फाइल सिस्टम (अधिक विवरण के लिए, देखें चमक और अमेज़न EFS फ़ाइल सिस्टम के लिए Amazon FSx का उपयोग करके Amazon SageMaker पर प्रशिक्षण को गति दें), और हमने बीईजीएफएस के स्व-प्रबंधित उपयोग को भी प्रलेखित किया एक वितरित कंप्यूटर दृष्टि केस स्टडी. लागत और परिचालन सादगी पर उनके ध्यान के कारण, टीम ने फाइल सिस्टम सर्वरों को लागू और संचालित नहीं करने का फैसला किया, बल्कि इसके बजाय सर्वर रहित ऑब्जेक्ट स्टोरेज के शीर्ष पर विशेष रूप से निर्माण करने की चुनौती ली। अमेज़न सरल भंडारण सेवा (अमेज़न एस 3)। Python (Boto3) के लिए AWS SDK का उपयोग करके एक कस्टम S3 डेटासेट वर्ग बनाया गया था, और वैज्ञानिकों को समान कोडबेस के भीतर I/O इंजीनियरिंग और मॉडल विज्ञान पर स्वायत्त रूप से पुनरावृति करने में सक्षम बनाते हुए संतोषजनक प्रदर्शन प्रदान किया।

क्लाइंट-साइड इनोवेशन

एक एलएलएम परियोजना में शायद ही कभी एक प्रशिक्षण कार्य शामिल होता है; प्रारंभिक परीक्षण और अनुभव करने के लिए कई नौकरियों की आवश्यकता होती है। मुख्य उत्पादन प्रशिक्षण के दौरान, कई नौकरियों को जंजीर में बांधा जा सकता है, उदाहरण के लिए कॉन्फ़िगरेशन या सॉफ़्टवेयर संस्करणों को अपडेट करना, पैच तैनात करना या विफलताओं से उबरना। TII के वैज्ञानिकों ने एलएलएम प्रशिक्षण के अनुकूल कस्टम क्लाइंट बनाने के लिए महत्वपूर्ण इंजीनियरिंग का आयोजन किया। SageMaker प्रशिक्षण SDK के शीर्ष पर एक लॉन्चर क्लाइंट बनाया गया था ताकि एक कमांड में कई कार्यात्मकताओं को एक साथ पैक किया जा सके, उदाहरण के लिए कोड वर्जनिंग, डॉकर इमेज बिल्डिंग और जॉब लॉन्च। इसके अतिरिक्त, ए AWS लाम्बा सर्वर रहित कंप्यूट फ़ंक्शन को आवश्यकतानुसार नौकरियों पर नज़र रखने, निगरानी करने और हस्तक्षेप करने के लिए डिज़ाइन किया गया था।

अनुमान गुणवत्ता लेखापरीक्षा के लिए स्लैक बॉट्स का उपयोग करना

प्रशिक्षण के अंत में, टीम ने मॉडल को आंतरिक पर तैनात किया SageMaker होस्टिंग GPU समापन बिंदु रीयल-टाइम इंटरैक्शन के लिए। यथार्थवादी प्रतिक्रिया प्राप्त करने और मॉडल के गुणात्मक गुणवत्ता ऑडिट चलाने के लिए टीम संवाद करने के लिए एक स्लैक बॉट बनाने तक चली गई।

प्रशिक्षण और प्रदर्शन की निगरानी

एलएलएम के प्रशिक्षण के लिए बड़ी मात्रा में कम्प्यूटेशनल संसाधनों की आवश्यकता होती है, जिसमें सीपीयू, जीपीयू और मेमोरी संसाधन शामिल हैं। इसलिए, कम्प्यूटेशनल संसाधनों और उनकी लागत-प्रभावशीलता का इष्टतम उपयोग सुनिश्चित करने के लिए TII को प्रदर्शन और प्रशिक्षण कार्य के निष्क्रिय समय की निगरानी करने की आवश्यकता थी।

स्वचालित निगरानी समाधान बनाने के लिए, TII ने उपयोग किया अमेज़ॅन क्लाउडवॉच प्रशिक्षण कार्यों के लिए जीपीयू, सीपीयू और मेमोरी के उपयोग की निगरानी के लिए अलार्म। क्लाउडवॉच अपरिष्कृत डेटा एकत्र करता है और इसे सैजमेकर प्रशिक्षण कार्य में उपयोग किए जा रहे अंतर्निहित कंटेनर उदाहरणों से पढ़ने योग्य, निकट-वास्तविक समय मेट्रिक्स में संसाधित करता है। उसके बाद, हम इनमें से प्रत्येक मेट्रिक्स के लिए थ्रेसहोल्ड सेट करते हैं, और यदि कोई मेट्रिक थ्रेशोल्ड से नीचे आता है, तो एक अलार्म चालू हो जाता है। यह अलार्म टीआईआई की टीम को कम संसाधन उपयोग के बारे में सूचित करता है, जिससे उन्हें संसाधन उपयोग की बाधाओं को दूर करने के लिए सुधारात्मक कार्रवाई करने की अनुमति मिलती है।

संसाधन उपयोग की निगरानी के अलावा, टीआईआई प्रशिक्षण कार्य संसाधनों के निष्क्रिय समय की निगरानी भी कर सकता है। यदि प्रशिक्षण कार्य संसाधन लंबे समय तक निष्क्रिय रहे, तो यह प्रशिक्षण चक्र के किसी भी स्तर पर अड़चन का संकेत दे सकता है और मैन्युअल जांच की आवश्यकता होती है। कुछ उदाहरणों में, संसाधन उपयोग अभी भी अपेक्षाकृत इष्टतम था, लेकिन प्रशिक्षण प्रक्रिया ही आगे नहीं बढ़ रही थी। इन मामलों के लिए, TII ने लैम्ब्डा फ़ंक्शंस के साथ क्लाउडवॉच अलार्म को क्वेरी करने और उत्पन्न प्रशिक्षण लॉग को पढ़ने के लिए एकीकृत किया, फिर उत्पन्न त्रुटि या लॉग जनरेशन प्रक्रिया की निष्क्रियता के आधार पर स्वचालित कार्रवाई करें (क्लस्टर रुका हुआ है)। अलार्म प्रशिक्षण कार्य को रोकने के लिए एक कार्रवाई को ट्रिगर करता है, जो यह सुनिश्चित करता है कि जब संसाधनों का उपयोग नहीं किया जा रहा हो तो टीआईआई अनावश्यक लागत नहीं लेता है।

निष्कर्ष

SageMaker को मालिकाना, कस्टम इनोवेशन के साथ जोड़ा गया, TII एक ऐसे मॉडल को प्रशिक्षित करने में सक्षम था जो कई आयामों में अत्याधुनिक है: तकनीकी सफलता, विज्ञान की गुणवत्ता, प्रशिक्षण की गति और परिचालन सादगी भी।

“यूएई के फाल्कन 40बी को जारी करना, दुनिया का शीर्ष-रैंक वाला ओपन सोर्स एआई मॉडल, प्रौद्योगिकी नेतृत्व को दर्शाता है, और क्षेत्र में एआई-संचालित नवाचार का मार्ग प्रशस्त करता है।आयन” डॉ. एबटेसम अल्माज़रूई को इंगित करता है; उसे जोड़ते हुए "हम राष्ट्रीय एआई रणनीति 2031 में उल्लिखित उद्देश्यों के प्रति अपनी प्रतिबद्धता प्रदर्शित करते हैं। फाल्कन-40बी द्वारा प्रस्तुत वैश्विक तकनीकी प्रगति में हमारी सक्रिय भागीदारी, ज्ञान-आधारित अर्थव्यवस्था की हमारी खोज में महत्वपूर्ण भूमिका निभाती है। एआई समाधानों में निवेश और विकास के माध्यम से, हमारा लक्ष्य आर्थिक विकास, सामाजिक प्रगति और शैक्षिक प्रगति के लिए नए अवसर पैदा करना है।

“फाल्कन-40बी की ओपन-सोर्स प्रकृति एआई के क्षेत्र में सहयोग, पारदर्शिता, नवाचार और अनुसंधान के प्रति हमारे समर्पण को दर्शाती है। हम उन्नत एआई प्रौद्योगिकी क्षमताओं का लोकतंत्रीकरण करने में विश्वास करते हैं, जिससे फाल्कन-40बी को दुनिया भर के शोधकर्ताओं और संगठनों के लिए सुलभ बनाया जा सके।''

“आगे देखते हुए, हम पाइपलाइन में आने वाले मॉडलों के साथ एआई और प्रौद्योगिकी प्रगति में योगदान देना जारी रखेंगे। इसके अलावा, हम अपने देश में संगठनों और व्यवसायों के भीतर उन्नत एआई तकनीक को अपनाने को सक्रिय रूप से बढ़ावा देंगे, जिससे हमारे रणनीतिक लक्ष्यों के अनुरूप विकास और समृद्धि को बढ़ावा मिलेगा।''

- डॉ. अल्माज़रूई

फाल्कन एलएलएम के बारे में अधिक जानने के लिए वेबसाइट देखें FalconLLM.tii.ae और हगिंग फेस पर मॉडल कार्ड!


लेखक के बारे में

टेक्नोलॉजी इनोवेशन इंस्टीट्यूट अमेज़ॅन सेजमेकर पर अत्याधुनिक फाल्कन एलएलएम 40बी फाउंडेशन मॉडल का प्रशिक्षण देता है | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.डॉ. एब्तेसाम अल्माज़रूई टेक्नोलॉजी इनोवेशन इंस्टीट्यूट (टीआईआई) में कार्यकारी निदेशक-कार्यवाहक मुख्य एआई शोधकर्ता और अल-क्रॉस सेंटर यूनिट के संस्थापक हैं। टेक्नोलॉजी इनोवेशन इंस्टीट्यूट (टीआईआई) में अल-क्रॉस सेंटर यूनिट के संस्थापक के रूप में, डॉ. अल्माज़रूई ने टीआईआई की एआई क्षमताओं को आकार देने में महत्वपूर्ण भूमिका निभाई है। एआई और मशीन लर्निंग में उनकी रणनीतिक दृष्टि और विशेषज्ञता ने उन्हें अभूतपूर्व अनुसंधान पहल का नेतृत्व करने और क्रॉस-फ़ंक्शनल सहयोग को बढ़ावा देने के लिए सशक्त बनाया है, जिसके परिणामस्वरूप कई उद्योगों में अभिनव एआई समाधान प्रदान किए गए हैं।

डॉ. अल्माज़रूई की उल्लेखनीय उपलब्धियों में से एक फाल्कन 40बी के विकास में उनकी महत्वपूर्ण भूमिका है, जो एक अत्याधुनिक एलएलएम है जिसने वैश्विक मान्यता प्राप्त की है। मई 40 में फाल्कन 2023बी के असाधारण प्रदर्शन ने इसे हगिंग फेस के लीडरबोर्ड पर विश्व स्तर पर नंबर एक एलएलएम के रूप में स्थान दिया है। इसके अतिरिक्त, उन्होंने अप्रैल 2022 में जारी दुनिया के सबसे बड़े अरबी बड़े भाषा मॉडल (एलएलएम) नूर के विकास का नेतृत्व किया।

डॉ. अल्माज़रूई को एआई में उनके योगदान के लिए दुनिया भर में मान्यता प्राप्त है और उन्हें क्षेत्र की अन्य प्रतिष्ठित महिलाओं के साथ 2023 की विश्व में अग्रणी एआई महिलाओं की सूची में शामिल किया गया था। वह अच्छी पहल के लिए स्थिरता और एआई की वकालत करने के साथ-साथ अबू धाबी एआई कनेक्ट की सामान्य अध्यक्ष और कई आईईईई अंतर्राष्ट्रीय सम्मेलनों की टीपीसी अध्यक्ष भी हैं।

उनका योगदान टीआईआई में उनके काम से परे है, जहां वह एआई और ब्लॉकचेन के लिए यूएई काउंसिल की बड़ी डेटा विशेषज्ञ उपसमिति का नेतृत्व करती हैं और वायरलेस वर्ल्ड रिसर्च फोरम (डब्ल्यूडब्ल्यूआरएफ) के विश्वव्यापी स्टीयरिंग बोर्ड की सदस्य हैं। वह एक वैज्ञानिक लेखिका, पेटेंट आविष्कारक, उद्यमी और प्रसिद्ध वक्ता हैं, जो लंदन में एआई शिखर सम्मेलन, विश्व एआई कान्स फेस्टिवल और टेक शिखर सम्मेलन जैसे प्रतिष्ठित शिखर सम्मेलनों में अपने मुख्य भाषणों के लिए जानी जाती हैं।

टेक्नोलॉजी इनोवेशन इंस्टीट्यूट अमेज़ॅन सेजमेकर पर अत्याधुनिक फाल्कन एलएलएम 40बी फाउंडेशन मॉडल का प्रशिक्षण देता है | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.विल बद्र दुबई-यूएई में स्थित एक सीनियर मैनेजर एआई/एमएल सॉल्यूशंस आर्किटेक्ट्स हैं जो वैश्विक अमेज़ॅन मशीन लर्निंग टीम के हिस्से के रूप में काम करते हैं। समुदाय को सकारात्मक रूप से प्रभावित करने के लिए नवीन तरीकों से प्रौद्योगिकी का उपयोग करने के बारे में विल भावुक है। अपने खाली समय में, वह गोताखोरी करना, फ़ुटबॉल खेलना और प्रशांत द्वीप समूह का पता लगाना पसंद करते हैं।

टेक्नोलॉजी इनोवेशन इंस्टीट्यूट अमेज़ॅन सेजमेकर पर अत्याधुनिक फाल्कन एलएलएम 40बी फाउंडेशन मॉडल का प्रशिक्षण देता है | अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.ओलिवियर क्रूचांट फ्रांस में स्थित एडब्ल्यूएस में एक मशीन लर्निंग स्पेशलिस्ट सॉल्यूशंस आर्किटेक्ट है। ओलिवियर एडब्ल्यूएस ग्राहकों की मदद करता है - छोटे स्टार्टअप से लेकर बड़े उद्यमों तक - प्रोडक्शन-ग्रेड मशीन लर्निंग एप्लिकेशन को विकसित और तैनात करता है। अपने खाली समय में, उन्हें शोध पत्र पढ़ने और दोस्तों और परिवार के साथ जंगल की खोज करने में आनंद आता है।

समय टिकट:

से अधिक AWS मशीन लर्निंग

डेवलपर उत्पादकता को बढ़ावा देना: डेलॉइट नो-कोड/लो-कोड मशीन लर्निंग के लिए अमेज़ॅन सेजमेकर कैनवास का उपयोग कैसे करता है | अमेज़न वेब सेवाएँ

स्रोत नोड: 1920150
समय टिकट: दिसम्बर 1, 2023