जैसे-जैसे मशीन लर्निंग (एमएल) उद्योगों की एक विस्तृत श्रृंखला में तेजी से प्रचलित हो रही है, संगठनों को अपने ग्राहकों की विविध आवश्यकताओं को पूरा करने के लिए बड़ी संख्या में एमएल मॉडल को प्रशिक्षित करने और सेवा देने की आवश्यकता महसूस हो रही है। विशेष रूप से एक सेवा के रूप में सॉफ्टवेयर (सास) प्रदाताओं के लिए, तेजी से विकसित हो रहे बाजार में प्रतिस्पर्धी बने रहने के लिए हजारों मॉडलों को कुशलतापूर्वक और लागत प्रभावी ढंग से प्रशिक्षित और सेवा देने की क्षमता महत्वपूर्ण है।
हजारों मॉडलों के प्रशिक्षण और सेवा के लिए एक मजबूत और स्केलेबल बुनियादी ढांचे की आवश्यकता होती है, जो यहीं है अमेज़न SageMaker मदद कर सकते है। सेजमेकर एक पूरी तरह से प्रबंधित प्लेटफ़ॉर्म है जो डेवलपर्स और डेटा वैज्ञानिकों को एमएल मॉडल को जल्दी से बनाने, प्रशिक्षित करने और तैनात करने में सक्षम बनाता है, साथ ही एडब्ल्यूएस क्लाउड इंफ्रास्ट्रक्चर का उपयोग करने के लागत-बचत लाभ भी प्रदान करता है।
इस पोस्ट में, हम यह पता लगाएंगे कि आप सेजमेकर सुविधाओं का उपयोग कैसे कर सकते हैं अमेज़न SageMaker प्रसंस्करण, सेजमेकर प्रशिक्षण नौकरियां, और सेजमेकर मल्टी-मॉडल एंडपॉइंट्स (एमएमई), हजारों मॉडलों को लागत प्रभावी तरीके से प्रशिक्षित और सेवा प्रदान करने के लिए। वर्णित समाधान के साथ आरंभ करने के लिए, आप संलग्न नोटबुक का संदर्भ ले सकते हैं GitHub.
उपयोग का मामला: ऊर्जा पूर्वानुमान
इस पोस्ट के लिए, हम एक आईएसवी कंपनी की भूमिका निभाते हैं जो अपने ग्राहकों को उनकी ऊर्जा खपत पर नज़र रखने और पूर्वानुमान प्रदान करके अधिक टिकाऊ बनने में मदद करती है। हमारी कंपनी के 1,000 ग्राहक हैं जो अपने ऊर्जा उपयोग को बेहतर ढंग से समझना चाहते हैं और अपने पर्यावरणीय प्रभाव को कम करने के बारे में सूचित निर्णय लेना चाहते हैं। ऐसा करने के लिए, हम एक सिंथेटिक डेटासेट का उपयोग करते हैं और उसके आधार पर एक एमएल मॉडल को प्रशिक्षित करते हैं नबी प्रत्येक ग्राहक के लिए ऊर्जा खपत का पूर्वानुमान लगाना। सेजमेकर के साथ, हम इन 1,000 मॉडलों को कुशलतापूर्वक प्रशिक्षित और सेवा दे सकते हैं, जिससे हमारे ग्राहकों को उनके ऊर्जा उपयोग में सटीक और कार्रवाई योग्य अंतर्दृष्टि प्रदान की जा सकती है।
जेनरेट किए गए डेटासेट में तीन विशेषताएं हैं:
- ग्राहक आईडी, ग्राहक पहचान - यह प्रत्येक ग्राहक के लिए 0-999 तक का एक पूर्णांक पहचानकर्ता है।
- टाइमस्टैम्प - यह एक दिनांक/समय मान है जो उस समय को इंगित करता है जिस पर ऊर्जा खपत मापी गई थी। टाइमस्टैम्प कोड में निर्दिष्ट प्रारंभ और समाप्ति तिथियों के बीच यादृच्छिक रूप से उत्पन्न होते हैं।
- खपत - यह एक फ्लोट वैल्यू है जो ऊर्जा खपत को इंगित करता है, जिसे कुछ मनमानी इकाइयों में मापा जाता है। उपभोग मूल्य साइनसॉइडल मौसमी के साथ 0-1,000 के बीच यादृच्छिक रूप से उत्पन्न होते हैं।
समाधान अवलोकन
हजारों एमएल मॉडलों को कुशलतापूर्वक प्रशिक्षित करने और सेवा प्रदान करने के लिए, हम निम्नलिखित सेजमेकर सुविधाओं का उपयोग कर सकते हैं:
- SageMaker प्रसंस्करण - सेजमेकर प्रोसेसिंग एक पूरी तरह से प्रबंधित डेटा तैयारी सेवा है जो आपको अपने इनपुट डेटा पर डेटा प्रोसेसिंग और मॉडल मूल्यांकन कार्य करने में सक्षम बनाती है। आप कच्चे डेटा को प्रशिक्षण और अनुमान के लिए आवश्यक प्रारूप में बदलने के साथ-साथ अपने मॉडलों के बैच और ऑनलाइन मूल्यांकन चलाने के लिए सेजमेकर प्रोसेसिंग का उपयोग कर सकते हैं।
- सेजमेकर प्रशिक्षण नौकरियां - आप विभिन्न एल्गोरिदम और इनपुट डेटा प्रकारों पर मॉडलों को प्रशिक्षित करने और प्रशिक्षण के लिए आवश्यक गणना संसाधनों को निर्दिष्ट करने के लिए सेजमेकर प्रशिक्षण नौकरियों का उपयोग कर सकते हैं।
- सेजमेकर एमएमई - मल्टी-मॉडल एंडपॉइंट आपको एक ही एंडपॉइंट पर कई मॉडल होस्ट करने में सक्षम बनाता है, जिससे एक ही एपीआई का उपयोग करके कई मॉडलों से भविष्यवाणियां करना आसान हो जाता है। सेजमेकर एमएमई कई मॉडलों से भविष्यवाणियां प्रदान करने के लिए आवश्यक समापन बिंदुओं की संख्या को कम करके समय और संसाधनों की बचत कर सकते हैं। एमएमई सीपीयू- और जीपीयू-समर्थित मॉडल दोनों की होस्टिंग का समर्थन करते हैं। ध्यान दें कि हमारे परिदृश्य में, हम 1,000 मॉडलों का उपयोग करते हैं, लेकिन यह सेवा की कोई सीमा नहीं है।
निम्नलिखित चित्र समाधान वास्तुकला को दर्शाता है।
वर्कफ़्लो में निम्न चरण शामिल हैं:
- हम डेटा को प्रीप्रोसेस करने और प्रति ग्राहक एक एकल सीएसवी फ़ाइल बनाने और उसे संग्रहीत करने के लिए सेजमेकर प्रोसेसिंग का उपयोग करते हैं अमेज़न सरल भंडारण सेवा (अमेज़न S3)।
- सेजमेकर प्रशिक्षण कार्य को सेजमेकर प्रोसेसिंग कार्य के आउटपुट को पढ़ने और इसे प्रशिक्षण उदाहरणों में राउंड-रॉबिन फैशन में वितरित करने के लिए कॉन्फ़िगर किया गया है। ध्यान दें कि इसे इसके साथ भी हासिल किया जा सकता है अमेज़न SageMaker पाइपलाइन.
- मॉडल कलाकृतियों को प्रशिक्षण कार्य द्वारा अमेज़ॅन एस3 में संग्रहीत किया जाता है, और सीधे सेजमेकर एमएमई से परोसा जाता है।
हजारों मॉडलों को प्रशिक्षण दें
के माध्यम से हजारों मॉडलों के प्रशिक्षण को स्केल करना संभव है distribution
का पैरामीटर प्रशिक्षण इनपुट सेजमेकर पायथन एसडीके में क्लास, जो आपको यह निर्दिष्ट करने की अनुमति देती है कि प्रशिक्षण कार्य के लिए कई प्रशिक्षण उदाहरणों में डेटा कैसे वितरित किया जाता है। के लिए तीन विकल्प हैं distribution
पैरामीटर: FullyReplicated
, ShardedByS3Key
, तथा ShardedByRecord
। ShardedByS3Key
विकल्प का अर्थ है कि प्रशिक्षण डेटा को S3 ऑब्जेक्ट कुंजी द्वारा साझा किया जाता है, प्रत्येक प्रशिक्षण उदाहरण को डेटा का एक अद्वितीय उपसमूह प्राप्त होता है, जिससे दोहराव से बचा जा सकता है। सेजमेकर द्वारा डेटा को प्रशिक्षण कंटेनरों में कॉपी करने के बाद, हम प्रति ग्राहक फ़ाइल एक अद्वितीय मॉडल को प्रशिक्षित करने के लिए फ़ोल्डर और फ़ाइल संरचना को पढ़ सकते हैं। निम्नलिखित एक उदाहरण कोड स्निपेट है:
प्रत्येक सेजमेकर प्रशिक्षण कार्य में सहेजे गए मॉडल को संग्रहीत करता है /opt/ml/model
प्रशिक्षण कंटेनर को संग्रहित करने से पहले उसका फ़ोल्डर a model.tar.gz
फ़ाइल, और फिर प्रशिक्षण कार्य पूरा होने पर इसे Amazon S3 पर अपलोड करता है। पावर उपयोगकर्ता इस प्रक्रिया को सेजमेकर पाइपलाइन के साथ भी स्वचालित कर सकते हैं। एक ही प्रशिक्षण कार्य के माध्यम से एकाधिक मॉडल संग्रहीत करते समय, सेजमेकर एक एकल बनाता है model.tar.gz
फ़ाइल जिसमें सभी प्रशिक्षित मॉडल शामिल हैं। इसका मतलब यह होगा कि, मॉडल की सेवा के लिए, हमें पहले संग्रह को अनपैक करना होगा। इससे बचने के लिए हम प्रयोग करते हैं चौकियों व्यक्तिगत मॉडलों की स्थिति को बचाने के लिए। सेजमेकर प्रशिक्षण कार्य के दौरान बनाए गए चेकपॉइंट्स को अमेज़ॅन एस3 पर कॉपी करने की कार्यक्षमता प्रदान करता है। यहां, चौकियों को डिफ़ॉल्ट के साथ पूर्व-निर्दिष्ट स्थान पर सहेजने की आवश्यकता है /opt/ml/checkpoints
. इन चौकियों का उपयोग बाद में प्रशिक्षण फिर से शुरू करने के लिए या किसी समापन बिंदु पर तैनात करने के लिए एक मॉडल के रूप में किया जा सकता है। सेजमेकर प्रशिक्षण प्लेटफ़ॉर्म एडब्ल्यूएस क्लाउड स्टोरेज और सेजमेकर में प्रशिक्षण नौकरियों के बीच प्रशिक्षण डेटासेट, मॉडल कलाकृतियों, चौकियों और आउटपुट के लिए भंडारण पथ का प्रबंधन कैसे करता है, इसके उच्च-स्तरीय सारांश के लिए, देखें प्रशिक्षण डेटासेट, चेकप्वाइंट, मॉडल कलाकृतियों और आउटपुट के लिए अमेज़ॅन सेजमेकर प्रशिक्षण भंडारण फ़ोल्डर.
निम्नलिखित कोड एक काल्पनिक का उपयोग करता है model.save()
के अंदर कार्य करते हैं train.py
प्रशिक्षण तर्क युक्त स्क्रिप्ट:
सेजमेकर एमएमई के साथ हजारों मॉडलों का स्केल अनुमान
सेजमेकर एमएमई आपको एक एंडपॉइंट कॉन्फ़िगरेशन बनाकर एक ही समय में कई मॉडलों की सेवा करने की अनुमति देता है जिसमें सेवा के लिए सभी मॉडलों की एक सूची शामिल होती है, और फिर उस एंडपॉइंट कॉन्फ़िगरेशन का उपयोग करके एक एंडपॉइंट बनाते हैं। हर बार जब आप कोई नया मॉडल जोड़ते हैं तो एंडपॉइंट को फिर से तैनात करने की कोई आवश्यकता नहीं होती है क्योंकि एंडपॉइंट स्वचालित रूप से निर्दिष्ट S3 पथों में संग्रहीत सभी मॉडलों की सेवा करेगा। इसके साथ यह हासिल किया गया है मल्टी मॉडल सर्वर (एमएमएस), एमएल मॉडल की सेवा के लिए एक ओपन-सोर्स फ्रेमवर्क जिसे नए एमएमई कंटेनर एपीआई के लिए आवश्यकताओं को पूरा करने वाले फ्रंट एंड प्रदान करने के लिए कंटेनरों में स्थापित किया जा सकता है। इसके अलावा, आप अन्य मॉडल सर्वर का भी उपयोग कर सकते हैं मशाल को सुरक्षित रखें और नरमीन. एमएमएस को आपके कस्टम कंटेनर में इंस्टॉल किया जा सकता है सेजमेकर इंट्रेंस टूलकिट. एमएमएस को शामिल करने और अपने मॉडलों की सेवा के लिए इसका उपयोग करने के लिए अपनी डॉकरफाइल को कैसे कॉन्फ़िगर करें, इसके बारे में अधिक जानने के लिए, देखें सेजमेकर मल्टी-मॉडल एंडपॉइंट्स के लिए अपना खुद का कंटेनर बनाएं.
निम्नलिखित कोड स्निपेट दिखाता है कि सेजमेकर पायथन एसडीके का उपयोग करके एमएमई कैसे बनाया जाए:
जब एमएमई लाइव होता है, तो हम भविष्यवाणियां उत्पन्न करने के लिए इसे लागू कर सकते हैं। आमंत्रण किसी भी AWS SDK के साथ-साथ SageMaker Python SDK के साथ भी किया जा सकता है, जैसा कि निम्नलिखित कोड स्निपेट में दिखाया गया है:
किसी मॉडल को कॉल करते समय, मॉडल को शुरुआत में उदाहरण पर अमेज़ॅन एस 3 से लोड किया जाता है, जिसके परिणामस्वरूप नए मॉडल को कॉल करते समय ठंडी शुरुआत हो सकती है। कम-विलंबता अनुमान प्रदान करने के लिए अक्सर उपयोग किए जाने वाले मॉडल को मेमोरी और डिस्क पर कैश किया जाता है।
निष्कर्ष
सेजमेकर हजारों एमएल मॉडलों के प्रशिक्षण और सेवा के लिए एक शक्तिशाली और लागत प्रभावी मंच है। सेजमेकर प्रोसेसिंग, प्रशिक्षण नौकरियां और एमएमई सहित इसकी विशेषताएं, संगठनों को बड़े पैमाने पर हजारों मॉडलों को कुशलतापूर्वक प्रशिक्षित करने और सेवा देने में सक्षम बनाती हैं, साथ ही एडब्ल्यूएस क्लाउड इंफ्रास्ट्रक्चर का उपयोग करने के लागत-बचत लाभों से भी लाभान्वित होती हैं। हजारों मॉडलों को प्रशिक्षण और सेवा प्रदान करने के लिए सेजमेकर का उपयोग कैसे करें, इसके बारे में अधिक जानने के लिए देखें डेटा का प्रसंस्करण, Amazon SageMaker के साथ एक मॉडल को प्रशिक्षित करें और एक कंटेनर में एक समापन बिंदु के पीछे कई मॉडल होस्ट करें.
लेखक के बारे में
डेविड गैलीटेली ईएमईए क्षेत्र में एआई/एमएल के लिए विशेषज्ञ समाधान आर्किटेक्ट हैं। वह ब्रुसेल्स में स्थित है और पूरे बेनेलक्स में ग्राहकों के साथ मिलकर काम करता है। वह बहुत छोटा था, जब से वह 7 साल की उम्र में कोड करना शुरू कर दिया था, तब से वह एक डेवलपर रहा है, उसने विश्वविद्यालय में एआई/एमएल सीखना शुरू कर दिया था, और तब से इसके साथ प्यार हो गया है।
मौरिट्स डी ग्रोट एम्स्टर्डम स्थित अमेज़ॅन वेब सर्विसेज में एक सॉल्यूशन आर्किटेक्ट है। उन्हें मशीन लर्निंग से संबंधित विषयों पर काम करना पसंद है और स्टार्टअप्स के प्रति उनका रुझान है। अपने खाली समय में वह स्कीइंग और स्क्वैश खेलना पसंद करते हैं।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. ऑटोमोटिव/ईवीएस, कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- BlockOffsets. पर्यावरणीय ऑफसेट स्वामित्व का आधुनिकीकरण। यहां पहुंचें।
- स्रोत: https://aws.amazon.com/blogs/machine-learning/scale-training-and-inference-of-thousands-of-ml-models-with-amazon-sagemaker/
- :हैस
- :है
- :नहीं
- :कहाँ
- 000
- 000 ग्राहक
- 1
- 10
- 100
- 12
- 15% तक
- 20
- 7
- a
- क्षमता
- About
- सही
- हासिल
- के पार
- जोड़ना
- इसके अलावा
- फायदे
- बाद
- उम्र
- ऐ / एमएल
- एल्गोरिदम
- सब
- अनुमति देना
- की अनुमति देता है
- पहले ही
- भी
- वीरांगना
- अमेज़न SageMaker
- अमेज़ॅन वेब सेवा
- एम्सटर्डम
- an
- और
- कोई
- एपीआई
- एपीआई
- स्थापत्य
- पुरालेख
- हैं
- तर्क
- AS
- मान लीजिये
- At
- को स्वचालित रूप से
- स्वतः
- से बचने
- से बचने
- एडब्ल्यूएस
- आधारित
- BE
- क्योंकि
- बन
- हो जाता है
- किया गया
- से पहले
- पीछे
- जा रहा है
- लाभ
- लाभ
- बेहतर
- के बीच
- के छात्रों
- ब्रसेल्स
- निर्माण
- लेकिन
- by
- बुला
- कर सकते हैं
- मामला
- कक्षा
- निकट से
- बादल
- क्लाउड इन्फ्रास्ट्रक्चर
- बादल का भंडारण
- कोड
- ठंड
- कंपनी
- प्रतियोगी
- समापन
- गणना करना
- विन्यास
- कॉन्फ़िगर किया गया
- खपत
- कंटेनर
- कंटेनरों
- प्रभावी लागत
- बनाना
- बनाया
- बनाता है
- बनाना
- महत्वपूर्ण
- रिवाज
- ग्राहक
- ग्राहक
- तिथि
- डेटा तैयारी
- डेटा संसाधन
- डेटासेट
- खजूर
- निर्णय
- चूक
- परिभाषित
- परिभाषा
- तैनात
- वर्णित
- डेवलपर
- डेवलपर्स
- सीधे
- प्रदर्शित करता है
- बांटो
- वितरित
- कई
- do
- किया
- दौरान
- से प्रत्येक
- आसान
- कुशलता
- ईएमईए
- सक्षम
- सक्षम बनाता है
- समाप्त
- endpoint
- ऊर्जा
- ऊर्जा की खपत
- ambiental
- मूल्यांकन
- मूल्यांकन
- प्रत्येक
- उद्विकासी
- उदाहरण
- का पता लगाने
- शहीदों
- फैशन
- विशेषताएं
- पट्टिका
- फ़ाइलें
- खोज
- प्रथम
- नाव
- निम्नलिखित
- के लिए
- स्टार्टअप्स के लिए
- पूर्वानुमान
- प्रारूप
- ढांचा
- अक्सर
- से
- सामने
- फ़्रंट एंड
- पूरी तरह से
- समारोह
- कार्यक्षमता
- उत्पन्न
- उत्पन्न
- मिल
- GitHub
- he
- मदद
- मदद करता है
- यहाँ उत्पन्न करें
- उच्च स्तर
- उसके
- मेजबान
- होस्टिंग
- कैसे
- How To
- एचटीएमएल
- http
- HTTPS
- पहचानकर्ता
- दिखाता है
- प्रभाव
- आयात
- in
- शामिल
- शामिल
- सहित
- तेजी
- इंगित करता है
- व्यक्ति
- उद्योगों
- सूचित
- इंफ्रास्ट्रक्चर
- शुरू में
- निवेश
- निविष्टियां
- अंदर
- अंतर्दृष्टि
- installed
- उदाहरण
- में
- IT
- आईटी इस
- खुद
- काम
- नौकरियां
- जेपीजी
- JSON
- कुंजी
- बड़ा
- बाद में
- जानें
- सीख रहा हूँ
- को यह पसंद है
- सीमा
- सूची
- जीना
- स्थानीय स्तर पर
- स्थान
- तर्क
- मोहब्बत
- मशीन
- यंत्र अधिगम
- बनाना
- बनाता है
- कामयाब
- प्रबंधन करता है
- बाजार
- मतलब
- साधन
- मिलना
- याद
- ML
- आदर्श
- मॉडल
- पल
- अधिक
- विभिन्न
- नाम
- आवश्यकता
- जरूरत
- की जरूरत है
- नया
- नहीं
- नोटबुक
- संख्या
- संख्या
- वस्तु
- of
- की पेशकश
- on
- ONE
- ऑनलाइन
- खुला स्रोत
- विकल्प
- ऑप्शंस
- or
- आदेश
- संगठनों
- OS
- अन्य
- हमारी
- हमारी कंपनी
- आउट
- उत्पादन
- अपना
- प्राचल
- विशेष
- पास
- पथ
- प्रति
- निष्पादन
- अवधि
- चित्र
- मंच
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- खेल
- संभव
- पद
- बिजली
- शक्तिशाली
- भविष्यवाणियों
- Predictor
- तैयारी
- प्रचलित
- प्रक्रिया
- प्रसंस्करण
- प्रदान करना
- प्रदाताओं
- प्रदान करता है
- प्रदान कर
- अजगर
- जल्दी से
- बेतरतीब ढंग से उत्पन्न
- रेंज
- लेकर
- तेजी
- कच्चा
- पढ़ना
- वास्तविक समय
- प्राप्त
- को कम करने
- को कम करने
- क्षेत्र
- आवश्यकताएँ
- की आवश्यकता होती है
- उपयुक्त संसाधन चुनें
- परिणाम
- बायोडाटा
- मजबूत
- भूमिका
- रन
- सास
- sagemaker
- SageMaker पाइपलाइन
- वही
- सहेजें
- स्केलेबल
- स्केल
- परिदृश्य
- वैज्ञानिकों
- एसडीके
- सेवा
- सर्वर
- सेवा
- सेवाएँ
- सेवारत
- सेट
- तेज कर दिया
- दिखाया
- दिखाता है
- सरल
- के बाद से
- एक
- टुकड़ा
- सॉफ्टवेयर
- एक सेवा के रूप में सॉफ्टवेयर
- समाधान
- समाधान ढूंढे
- कुछ
- विशेषज्ञ
- विनिर्दिष्ट
- प्रारंभ
- शुरू
- शुरुआत में
- स्टार्टअप
- राज्य
- कदम
- भंडारण
- की दुकान
- संग्रहित
- भंडार
- भंडारण
- संरचना
- सारांश
- समर्थन
- स्थायी
- कृत्रिम
- लक्ष्य
- कार्य
- कि
- RSI
- राज्य
- लेकिन हाल ही
- फिर
- वहाँ।
- इन
- इसका
- हजारों
- तीन
- भर
- पहर
- सेवा मेरे
- विषय
- ट्रैकिंग
- रेलगाड़ी
- प्रशिक्षित
- प्रशिक्षण
- बदालना
- प्रकार
- समझना
- अद्वितीय
- इकाई
- विश्वविद्यालय
- के ऊपर
- प्रयोग
- उपयोग
- प्रयुक्त
- उपयोगकर्ताओं
- का उपयोग करता है
- का उपयोग
- मूल्य
- मान
- विविधता
- बहुत
- के माध्यम से
- W
- करना चाहते हैं
- था
- मार्ग..
- we
- वेब
- वेब सेवाओं
- कुंआ
- कब
- कौन कौन से
- जब
- कौन
- चौड़ा
- विस्तृत श्रृंखला
- मर्जी
- साथ में
- अंदर
- काम
- वर्कफ़्लो
- कार्य
- होगा
- आप
- युवा
- आपका
- जेफिरनेट