ایمیزون سیج میکر جمپ اسٹارٹ میں مثالی نوٹ بک

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

ایمیزون سیج میکر جمپ اسٹارٹ SageMaker کا مشین لرننگ (ML) مرکز ہے جو آپ کو مشین لرننگ کے ساتھ شروع کرنے میں مدد کرنے کے لیے پہلے سے تربیت یافتہ، عوامی طور پر دستیاب ماڈلز کی وسیع اقسام کے مسائل کے لیے فراہم کرتا ہے۔

جمپ سٹارٹ مثال کے طور پر نوٹ بک بھی پیش کرتا ہے جو استعمال کرتی ہے۔ ایمیزون سیج میکر اسپاٹ مثال کی تربیت اور ماڈل کی اقسام اور استعمال کے کیسز کی ایک بڑی قسم پر تجربات جیسی خصوصیات۔ ان مثالوں والی نوٹ بکس میں کوڈ ہوتا ہے جو دکھاتا ہے کہ SageMaker اور JumpStart کا استعمال کرتے ہوئے ML سلوشنز کو کیسے لاگو کیا جائے۔ انہیں آپ کی اپنی ضروریات کے مطابق ڈھال لیا جا سکتا ہے اور اس طرح ایپلی کیشن کی ترقی کو تیز کیا جا سکتا ہے۔

حال ہی میں، ہم نے جمپ اسٹارٹ ان میں 10 نئی نوٹ بکس شامل کیں۔ ایمیزون سیج میکر اسٹوڈیو. یہ پوسٹ ان نئی نوٹ بکس پر مرکوز ہے۔ اس تحریر کے مطابق، جمپ سٹارٹ 56 نوٹ بک پیش کرتا ہے، جس میں جدید ترین نیچرل لینگویج پروسیسنگ (NLP) ماڈل استعمال کرنے سے لے کر ماڈلز کی تربیت کے دوران ڈیٹا سیٹس میں تعصب کو ٹھیک کرنا شامل ہے۔

10 نئی نوٹ بکس درج ذیل طریقوں سے آپ کی مدد کر سکتی ہیں۔

وہ آپ کو اسٹوڈیو میں جمپ اسٹارٹ UI کی طرح چلانے کے لیے مثالی کوڈ پیش کرتے ہیں اور دیکھیں کہ کوڈ کیسے کام کرتا ہے۔
وہ مختلف SageMaker اور JumpStart APIs کا استعمال دکھاتے ہیں۔
وہ ایک تکنیکی حل پیش کرتے ہیں جسے آپ اپنی ضروریات کی بنیاد پر مزید تخصیص کر سکتے ہیں۔

جمپ سٹارٹ کے ذریعے پیش کی جانے والی نوٹ بکوں کی تعداد مستقل بنیادوں پر بڑھ جاتی ہے کیونکہ مزید نوٹ بکس شامل ہوتے ہیں۔ یہ نوٹ بکس پر بھی دستیاب ہیں۔ گاٹہوب.

نوٹ بک کا جائزہ

10 نئی نوٹ بکیں درج ذیل ہیں:

AlexaTM 20B کے ساتھ سیاق و سباق میں سیکھنا - پانچ مثالی کاموں پر زیرو شاٹ اور چند شاٹ لرننگ کے ساتھ سیاق و سباق میں سیکھنے کے لیے AlexaTM 20B کا استعمال کیسے کریں: متن کا خلاصہ، قدرتی زبان کی تخلیق، مشینی ترجمہ، استخراجی سوالوں کے جوابات، اور قدرتی زبان کا اندازہ اور درجہ بندی۔
سیج میکر میں فیئرنس لکیری لرنر - حال ہی میں موجودہ انسانی تعصبات کی نقل کرنے کے نتیجے میں ML الگورتھم میں تعصب کے بارے میں خدشات پیدا ہوئے ہیں۔ یہ نوٹ بک ماڈل پیشین گوئیوں کو مناسب طریقے سے ایڈجسٹ کرنے کے لیے منصفانہ تصورات کا اطلاق کرتی ہے۔
SageMaker تلاش کا استعمال کرتے ہوئے ML تجربات کا نظم کریں - Amazon SageMaker تلاش آپ کو ممکنہ طور پر سینکڑوں اور ہزاروں SageMaker ماڈل ٹریننگ جابز میں سے انتہائی متعلقہ ماڈل ٹریننگ کو تیزی سے تلاش اور جانچنے دیتی ہے۔
سیج میکر نیورل ٹاپک ماڈل - سیج میکر نیورل ٹاپک ماڈل (NTM) ایک غیر زیر نگرانی سیکھنے کا الگورتھم ہے جو مشاہدات کے ایک سیٹ کو الگ الگ زمروں کے مرکب کے طور پر بیان کرنے کی کوشش کرتا ہے۔
ڈرائیونگ کی رفتار کی خلاف ورزیوں کی پیشن گوئی - SageMaker DeepAR الگورتھم کو ایک ساتھ متعدد سڑکوں کے لیے ایک ماڈل کو تربیت دینے کے لیے استعمال کیا جا سکتا ہے، اور متعدد اسٹریٹ کیمروں کی خلاف ورزیوں کی پیش گوئی کی جا سکتی ہے۔
چھاتی کے کینسر کی پیش گوئی - یہ نوٹ بک UCI کے چھاتی کے کینسر کی تشخیصی ڈیٹاسیٹ کا استعمال کرتے ہوئے ایک پیش قیاسی ماڈل تیار کرتی ہے کہ آیا چھاتی کے بڑے پیمانے پر تصویر سومی یا مہلک ٹیومر کی نشاندہی کرتی ہے۔
متعدد ماڈلز سے جوڑ کر پیشن گوئیاں - متعدد ذرائع اور ماڈلز سے پیشین گوئیوں کو یکجا کرنے یا اوسط کرنے سے، ہم عام طور پر ایک بہتر پیشین گوئی حاصل کرتے ہیں۔ یہ نوٹ بک اس تصور کو واضح کرتی ہے۔
SageMaker غیر مطابقت پذیر تخمینہ - غیر مطابقت پذیر تخمینہ قریب قریب حقیقی وقت کے تخمینے کی ضروریات کے لیے ایک نیا تخمینہ اختیار ہے۔ درخواستوں پر کارروائی ہونے میں 15 منٹ تک لگ سکتے ہیں اور اس کا پے لوڈ سائز 1 GB تک ہو سکتا ہے۔
TensorFlow اپنا ماڈل لائیں - اس نوٹ بک کا استعمال کرتے ہوئے مقامی طور پر TensorFlow ماڈل کو تربیت دینے اور SageMaker پر تعینات کرنے کا طریقہ سیکھیں۔
Scikit-learn اپنا ماڈل لائیں - یہ نوٹ بک دکھاتی ہے کہ SageMaker Scikit-learn کنٹینر کے ساتھ پہلے سے تربیت یافتہ Scikit-learn ماڈل کو تیزی سے اس ماڈل کے لیے ایک میزبان اختتامی نقطہ بنانے کے لیے کیسے استعمال کیا جائے۔

شرائط

ان نوٹ بکس کو استعمال کرنے کے لیے، اس بات کو یقینی بنائیں کہ آپ کو اسٹوڈیو تک رسائی ایک ایسے ایگزیکیوشن رول کے ساتھ ہے جو آپ کو SageMaker کی فعالیت کو چلانے کی اجازت دیتا ہے۔ نیچے دی گئی مختصر ویڈیو آپ کو جمپ اسٹارٹ نوٹ بک پر جانے میں مدد کرے گی۔

مندرجہ ذیل حصوں میں، ہم 10 نئے حلوں میں سے ہر ایک کو دیکھتے ہیں اور ان کی کچھ دلچسپ تفصیلات پر تبادلہ خیال کرتے ہیں۔

AlexaTM 20B کے ساتھ سیاق و سباق میں سیکھنا

AlexaTM 20B ایک ملٹی ٹاسک، کثیر لسانی، بڑے پیمانے پر ترتیب سے ترتیب (seq2seq) ماڈل ہے، جو 4 زبانوں میں کامن کرال (mC12) اور Wikipedia ڈیٹا کے مرکب پر تربیت یافتہ ہے، جس میں denoising اور Causal Language Modeling (CLM) کاموں کا استعمال کیا گیا ہے۔ یہ عام سیاق و سباق کی زبان کے کاموں پر جدید ترین کارکردگی کو حاصل کرتا ہے جیسے کہ ایک شاٹ سمریائزیشن اور ون شاٹ مشین ٹرانسلیشن، صرف ڈیکوڈر کو آؤٹ پرفارم کرنے والے ماڈلز جیسے Open AI's GPT3 اور Google's PaLM، جو آٹھ گنا سے زیادہ بڑے ہیں۔

سیاق و سباق میں سیکھنا، جسے بھی کہا جاتا ہے۔ اشارہ، ایک طریقہ سے مراد ہے جہاں آپ کسی نئے کام پر NLP ماڈل استعمال کرتے ہیں بغیر اسے ٹھیک بنائے۔ کام کی چند مثالیں ماڈل کو صرف انفرنس ان پٹ کے حصے کے طور پر فراہم کی جاتی ہیں، ایک پیرا ڈائم کے نام سے جانا جاتا ہے۔ سیاق و سباق میں چند شاٹ سیکھنا. کچھ معاملات میں، ماڈل بغیر کسی تربیتی اعداد و شمار کے بالکل بھی اچھی کارکردگی کا مظاہرہ کر سکتا ہے، صرف اس بات کی وضاحت دی جاتی ہے کہ کیا پیشین گوئی کی جانی چاہیے۔ اسے کہتے ہیں۔ زیرو شاٹ سیاق و سباق میں سیکھنا.

یہ نوٹ بک دکھاتی ہے کہ جمپ سٹارٹ API کے ذریعے AlexaTM 20B کو کیسے تعینات کیا جائے اور اندازہ چلایا جائے۔ یہ یہ بھی ظاہر کرتا ہے کہ کس طرح AlexaTM 20B کو پانچ مثالی کاموں کے ساتھ سیاق و سباق میں سیکھنے کے لیے استعمال کیا جا سکتا ہے: متن کا خلاصہ، قدرتی زبان کی تخلیق، مشینی ترجمہ، استخراجی سوال کا جواب، اور قدرتی زبان کا اندازہ اور درجہ بندی۔

Illustrative notebooks in Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Vertical Search. Ai.

نوٹ بک مندرجہ ذیل کو ظاہر کرتی ہے:

ان میں سے ہر ایک کام کے لیے ایک ہی تربیتی مثال کا استعمال کرتے ہوئے ایک شاٹ متن کا خلاصہ، قدرتی زبان کی تخلیق، اور مشینی ترجمہ
زیرو شاٹ سوال کا جواب دینا اور فطری زبان کا اندازہ پلس ماڈل کا استعمال کرتے ہوئے درجہ بندی، بغیر کسی تربیتی مثال کے فراہم کرنے کی ضرورت۔

اس ماڈل کے خلاف اپنا متن چلانے کی کوشش کریں اور دیکھیں کہ یہ متن کا خلاصہ کیسے کرتا ہے، سوال و جواب نکالتا ہے، یا ایک زبان سے دوسری زبان میں ترجمہ کرتا ہے۔

سیج میکر میں فیئرنس لکیری سیکھنے والا

حال ہی میں موجودہ انسانی تعصبات کی نقل کرنے کے نتیجے میں ML الگورتھم میں تعصب کے بارے میں خدشات پیدا ہوئے ہیں۔ آج کل، کئی ML طریقوں کے مضبوط سماجی اثرات ہیں، مثال کے طور پر وہ بینک قرضوں، انشورنس کی شرحوں، یا اشتہارات کی پیشین گوئی کے لیے استعمال ہوتے ہیں۔ بدقسمتی سے، تاریخی ڈیٹا سے سیکھنے والا الگورتھم قدرتی طور پر ماضی کے تعصبات کا وارث ہوگا۔ یہ نوٹ بک پیش کرتی ہے کہ لکیری سیکھنے والوں کے تناظر میں سیج میکر اور منصفانہ الگورتھم کا استعمال کرکے اس مسئلے پر کیسے قابو پایا جائے۔

یہ منصفانہ پن کے پیچھے کچھ تصورات اور ریاضی کو متعارف کرانے سے شروع ہوتا ہے، پھر یہ ڈیٹا ڈاؤن لوڈ کرتا ہے، ایک ماڈل کو تربیت دیتا ہے، اور آخر میں ماڈل کی پیشین گوئیوں کو مناسب طریقے سے ایڈجسٹ کرنے کے لیے منصفانہ تصورات کا اطلاق کرتا ہے۔

نوٹ بک مندرجہ ذیل کو ظاہر کرتی ہے:

UCI کے بالغ ڈیٹاسیٹ پر ایک معیاری لکیری ماڈل چلانا۔
ماڈل پیشین گوئیوں میں ناانصافی دکھا رہا ہے۔
تعصب کو دور کرنے کے لیے ڈیٹا کو درست کرنا
ماڈل کو دوبارہ تربیت دینا

اس مثال کے کوڈ کا استعمال کرتے ہوئے اپنا ڈیٹا چلانے کی کوشش کریں اور معلوم کریں کہ آیا کوئی تعصب ہے۔ اس کے بعد، اس مثال کے نوٹ بک میں فراہم کردہ فنکشنز کا استعمال کرتے ہوئے اپنے ڈیٹاسیٹ میں تعصب، اگر کوئی ہے، کو ہٹانے کی کوشش کریں۔

SageMaker تلاش کا استعمال کرتے ہوئے ML تجربات کا نظم کریں۔

SageMaker تلاش آپ کو ممکنہ طور پر سینکڑوں اور ہزاروں SageMaker ماڈل ٹریننگ جابز میں سے انتہائی متعلقہ ماڈل ٹریننگ کو تیزی سے ڈھونڈنے اور جانچنے دیتی ہے۔ ایم ایل ماڈل کو تیار کرنے کے لیے مسلسل تجربات، نئے سیکھنے کے الگورتھم کو آزمانے، اور ہائپر پیرامیٹر کو ٹیوننگ کرنے کی ضرورت ہوتی ہے، یہ سب کچھ ماڈل کی کارکردگی اور درستگی پر اس طرح کی تبدیلیوں کے اثرات کو دیکھتے ہوئے ہوتا ہے۔ یہ تکراری مشق اکثر سیکڑوں ماڈل ٹریننگ تجربات اور ماڈل ورژنز کے دھماکے کا باعث بنتی ہے، جس سے جیتنے والے ماڈل کے کنورجن اور دریافت کو سست ہو جاتا ہے۔ اس کے علاوہ، معلوماتی دھماکہ ماڈل ورژن کے نسب کا پتہ لگانا بہت مشکل بنا دیتا ہے—ڈیٹا سیٹس، الگورتھم، اور پیرامیٹرز کا انوکھا امتزاج جس نے اس ماڈل کو پہلی جگہ تیار کیا۔

یہ نوٹ بک دکھاتی ہے کہ SageMaker پر اپنی ماڈل ٹریننگ جابز کو تیزی سے اور آسانی سے منظم کرنے، ٹریک کرنے اور جانچنے کے لیے کس طرح SageMaker تلاش کا استعمال کیا جائے۔ آپ استعمال کیے گئے سیکھنے کے الگورتھم، ہائپر پیرامیٹر سیٹنگز، ٹریننگ ڈیٹا سیٹس، اور یہاں تک کہ ماڈل ٹریننگ جابز پر آپ نے جو ٹیگ شامل کیے ہیں، سے تمام وضاحتی خصوصیات کو تلاش کر سکتے ہیں۔ آپ اپنی ٹریننگ کی کارکردگی کے میٹرکس کی بنیاد پر تیزی سے موازنہ اور درجہ بندی بھی کر سکتے ہیں، جیسے کہ تربیت کے نقصان اور درستگی کی درستگی، اس طرح جیتنے والے ماڈلز کی شناخت کے لیے لیڈر بورڈز بنا سکتے ہیں جنہیں پیداواری ماحول میں تعینات کیا جا سکتا ہے۔ سیج میکر سرچ لائیو ماحول میں تعینات ماڈل ورژن کے مکمل نسب کا فوری طور پر پتہ لگا سکتا ہے، جب تک کہ ڈیٹا سیٹس کو تربیت اور ماڈل کی توثیق میں استعمال نہ کیا جائے۔

نوٹ بک مندرجہ ذیل کو ظاہر کرتی ہے:

ایک لکیری ماڈل کو تین بار تربیت دینا
ان تجربات کو منظم اور جانچنے کے لیے SageMaker تلاش کا استعمال
لیڈر بورڈ میں نتائج کا تصور کرنا
ایک ماڈل کو اختتامی نقطہ پر تعینات کرنا
اختتامی نقطہ سے شروع ہونے والے ماڈل کے نسب کا سراغ لگانا

پیشین گوئی کرنے والے ماڈلز کی اپنی ترقی میں، ہو سکتا ہے آپ کئی تجربات کر رہے ہوں۔ اس طرح کے تجربات میں سیج میکر سرچ کو استعمال کرنے کی کوشش کریں اور تجربہ کریں کہ یہ کس طرح متعدد طریقوں سے آپ کی مدد کر سکتی ہے۔

سیج میکر نیورل ٹاپک ماڈل

سیج میکر نیورل ٹاپک ماڈل (NTM) ایک غیر زیر نگرانی سیکھنے کا الگورتھم ہے جو مشاہدات کے ایک سیٹ کو الگ الگ زمروں کے مرکب کے طور پر بیان کرنے کی کوشش کرتا ہے۔ NTM کا استعمال عام طور پر کسی ٹیکسٹ کارپس کے اندر موجود دستاویزات کے ذریعے اشتراک کردہ عنوانات کی صارف کی مخصوص تعداد کو دریافت کرنے کے لیے کیا جاتا ہے۔ یہاں ہر مشاہدہ ایک دستاویز ہے، خصوصیات ہر لفظ کی موجودگی (یا واقعہ کی گنتی) ہیں، اور زمرے عنوانات ہیں۔ چونکہ یہ طریقہ غیر زیر نگرانی ہے، اس لیے موضوعات کو سامنے نہیں رکھا جاتا ہے اور اس بات کی ضمانت نہیں دی جاتی ہے کہ انسان قدرتی طور پر دستاویزات کی درجہ بندی کیسے کر سکتا ہے۔ عنوانات ہر دستاویز میں پائے جانے والے الفاظ پر امکانی تقسیم کے طور پر سیکھے جاتے ہیں۔ ہر دستاویز، بدلے میں، موضوعات کے مرکب کے طور پر بیان کیا جاتا ہے۔

یہ نوٹ بک 20NewsGroups ڈیٹا سیٹ پر ماڈل کو تربیت دینے کے لیے SageMaker NTM الگورتھم کا استعمال کرتی ہے۔ اس ڈیٹاسیٹ کو ٹاپک ماڈلنگ بینچ مارک کے طور پر بڑے پیمانے پر استعمال کیا گیا ہے۔

نوٹ بک مندرجہ ذیل کو ظاہر کرتی ہے:

NTM ماڈل تیار کرنے کے لیے ڈیٹاسیٹ پر سیج میکر ٹریننگ جاب بنانا
SageMaker اینڈ پوائنٹ کے ساتھ اندازہ لگانے کے لیے ماڈل کا استعمال کرنا
تربیت یافتہ ماڈل کو دریافت کرنا اور سیکھے ہوئے عنوانات کا تصور کرنا

آپ اپنی ٹیکسٹ دستاویزات پر چلانے کے لیے اس نوٹ بک میں آسانی سے ترمیم کر سکتے ہیں اور انہیں مختلف عنوانات میں تقسیم کر سکتے ہیں۔

ڈرائیونگ کی رفتار کی خلاف ورزیوں کی پیش گوئی کریں۔

یہ نوٹ بک SageMaker DeepAR الگورتھم کا استعمال کرتے ہوئے شکاگو کے شہر کے اسپیڈ کیمرہ وائلیشن ڈیٹاسیٹ کا تجزیہ کرکے ٹائم سیریز کی پیشن گوئی کا مظاہرہ کرتی ہے۔ ڈیٹاسیٹ کی میزبانی Data.gov کرتی ہے، اور اس کا انتظام یو ایس جنرل سروسز ایڈمنسٹریشن، ٹیکنالوجی ٹرانسفارمیشن سروس کرتا ہے۔

یہ خلاف ورزیاں کیمرہ سسٹمز کے ذریعے کیپچر کی جاتی ہیں اور شکاگو شہر کے ڈیٹا پورٹل کے ذریعے عوام کی زندگیوں کو بہتر بنانے کے لیے دستیاب ہیں۔ اسپیڈ کیمرا وائلیشن ڈیٹاسیٹ کا استعمال ڈیٹا میں پیٹرن کو جاننے اور بامعنی بصیرت حاصل کرنے کے لیے کیا جا سکتا ہے۔

ڈیٹاسیٹ میں کیمرہ کے متعدد مقامات اور روزانہ کی خلاف ورزیوں کے شمار ہوتے ہیں۔ کیمرے کے لیے ہر روز کی خلاف ورزی کی گنتی کو ایک الگ ٹائم سیریز سمجھا جا سکتا ہے۔ آپ SageMaker DeepAR الگورتھم کو ایک ساتھ متعدد سڑکوں کے لیے ایک ماڈل کو تربیت دینے کے لیے استعمال کر سکتے ہیں، اور متعدد اسٹریٹ کیمروں کی خلاف ورزیوں کی پیش گوئی کر سکتے ہیں۔

نوٹ بک مندرجہ ذیل کو ظاہر کرتی ہے:

SageMaker DeepAR الگورتھم کو ٹائم سیریز ڈیٹاسیٹ پر اسپاٹ انسٹینس کا استعمال کرتے ہوئے تربیت دینا
ٹریفک کی خلاف ورزی کی پیشین گوئیاں کرنے کے لیے تربیت یافتہ ماڈل پر قیاس آرائیاں کرنا

اس نوٹ بک کے ساتھ، آپ سیکھ سکتے ہیں کہ کس طرح ٹائم سیریز کے مسائل کو SageMaker میں DeepAR الگورتھم کا استعمال کرتے ہوئے حل کیا جا سکتا ہے اور اسے اپنے ٹائم سیریز ڈیٹا سیٹس پر لاگو کرنے کی کوشش کریں۔

چھاتی کے کینسر کی پیشن گوئی

یہ نوٹ بک UCI'S چھاتی کے کینسر کی تشخیصی ڈیٹاسیٹ کا استعمال کرتے ہوئے چھاتی کے کینسر کی پیشن گوئی کے لیے ایک مثال لیتی ہے۔ یہ اس ڈیٹاسیٹ کا استعمال اس بات کا پیش قیاسی ماڈل بنانے کے لیے کرتا ہے کہ آیا چھاتی کے بڑے پیمانے پر تصویر سومی یا مہلک ٹیومر کی نشاندہی کرتی ہے۔

نوٹ بک مندرجہ ذیل کو ظاہر کرتی ہے:

سیج میکر استعمال کرنے کے لیے بنیادی سیٹ اپ
ڈیٹاسیٹس کو SageMaker الگورتھم کے ذریعے استعمال ہونے والے پروٹوبف فارمیٹ میں تبدیل کرنا اور اس پر اپ لوڈ کرنا ایمیزون سادہ اسٹوریج سروس (ایمیزون S3)
ڈیٹاسیٹ پر سیج میکر لکیری لرنر ماڈل کی تربیت
تربیت یافتہ ماڈل کی میزبانی کرنا
تربیت یافتہ ماڈل کا استعمال کرتے ہوئے اسکورنگ

آپ سیج میکر کا استعمال کرتے ہوئے کاروباری مسئلے کو حل کرنے کا طریقہ سیکھنے کے لیے اس نوٹ بک کے ذریعے جا سکتے ہیں، اور ماڈل کی تربیت اور میزبانی کے لیے شامل اقدامات کو سمجھ سکتے ہیں۔

ایک سے زیادہ ماڈلز کی پیشین گوئیاں

پیشن گوئی کے کاموں پر ایم ایل کے عملی اطلاق میں، ایک ماڈل اکثر کافی نہیں ہوتا ہے۔ زیادہ تر پیشین گوئی کے مقابلوں میں عام طور پر ایک بہتر پیشن گوئی حاصل کرنے کے لیے متعدد ذرائع سے پیشین گوئیوں کو یکجا کرنے کی ضرورت ہوتی ہے۔ متعدد ذرائع یا ماڈلز سے پیشین گوئیوں کو یکجا کرنے یا اوسط کرنے سے، ہم عام طور پر ایک بہتر پیشین گوئی حاصل کرتے ہیں۔ ایسا اس لیے ہوتا ہے کیونکہ ماڈل کے انتخاب میں کافی غیر یقینی صورتحال ہے اور بہت سے عملی ایپلی کیشنز میں کوئی ایک حقیقی ماڈل نہیں ہے۔ لہذا، مختلف ماڈلز سے پیشین گوئیوں کو یکجا کرنا فائدہ مند ہے۔ Bayesian ادب میں، یہ خیال Bayesian ماڈل اوسط کے طور پر کہا جاتا ہے، اور صرف ایک ماڈل کو منتخب کرنے سے کہیں زیادہ بہتر کام کرتا ہے.

یہ نوٹ بک ایک مثالی مثال پیش کرتی ہے جس کا اندازہ لگایا جاسکتا ہے کہ آیا کوئی شخص اپنی تعلیم، کام کے تجربے، جنس اور مزید کے بارے میں معلومات کی بنیاد پر سالانہ $50,000 سے زیادہ کماتا ہے۔

نوٹ بک مندرجہ ذیل کو ظاہر کرتی ہے:

آپ کی سیج میکر نوٹ بک کی تیاری
SageMaker کا استعمال کرتے ہوئے Amazon S3 سے ڈیٹا سیٹ لوڈ کرنا
ڈیٹا کی چھان بین اور اسے تبدیل کرنا تاکہ اسے سیج میکر الگورتھم کو فیڈ کیا جا سکے۔
SageMaker XGBoost (Extreme Gradient Boosting) الگورتھم کا استعمال کرتے ہوئے ماڈل کا تخمینہ لگانا
جاری پیشین گوئیاں کرنے کے لیے SageMaker پر ماڈل کی میزبانی کرنا
سیج میکر لکیری لرنر طریقہ استعمال کرتے ہوئے دوسرے ماڈل کا تخمینہ لگانا
دونوں ماڈلز کی پیشین گوئیوں کو یکجا کرنا اور مشترکہ پیشین گوئی کا جائزہ لینا
ٹیسٹ ڈیٹاسیٹ پر حتمی پیشین گوئیاں تیار کرنا

اس نوٹ بک کو اپنے ڈیٹاسیٹ پر چلانے اور متعدد الگورتھم استعمال کرنے کی کوشش کریں۔ سیج میکر اور جمپ سٹارٹ کی طرف سے پیش کردہ ماڈلز کے مختلف امتزاج کے ساتھ تجربہ کرنے کی کوشش کریں اور دیکھیں کہ کون سا ماڈل جوڑنا آپ کے اپنے ڈیٹا پر بہترین نتائج دیتا ہے۔

سیج میکر غیر مطابقت پذیر تخمینہ

SageMaker غیر مطابقت پذیر تخمینہ سیج میکر میں ایک نئی صلاحیت ہے جو آنے والی درخواستوں کو قطار میں کھڑا کرتی ہے اور ان پر غیر مطابقت پذیری سے کارروائی کرتی ہے۔ SageMaker فی الحال ML ماڈلز کو تعینات کرنے کے لیے صارفین کے لیے دو تخمینہ کے اختیارات پیش کرتا ہے: کم تاخیر والے کام کے بوجھ کے لیے ایک حقیقی وقت کا اختیار، اور بیچ ٹرانسفارم، سامنے دستیاب ڈیٹا کے بیچوں پر تخمینہ کی درخواستوں پر کارروائی کرنے کا ایک آف لائن آپشن۔ ریئل ٹائم انفرنس 6 MB سے کم کے پے لوڈ سائز والے کام کے بوجھ کے لیے موزوں ہے اور 60 سیکنڈ کے اندر انفرنس کی درخواستوں پر کارروائی کرنے کی ضرورت ہے۔ بیچ ٹرانسفارم ڈیٹا کے بیچوں پر آف لائن اندازہ لگانے کے لیے موزوں ہے۔

غیر مطابقت پذیر تخمینہ قریب قریب حقیقی وقت کے تخمینے کی ضروریات کے لیے ایک نیا تخمینہ اختیار ہے۔ درخواستوں پر کارروائی ہونے میں 15 منٹ تک لگ سکتے ہیں اور اس کا پے لوڈ سائز 1 GB تک ہو سکتا ہے۔ غیر مطابقت پذیر تخمینہ ان کام کے بوجھ کے لیے موزوں ہے جن میں سبسیکنڈ لیٹنسی کے تقاضے نہیں ہوتے ہیں اور جن میں تاخیر کے تقاضوں میں نرمی ہوتی ہے۔ مثال کے طور پر، آپ کو 5 منٹ کے اندر کئی MBs کی ایک بڑی تصویر پر ایک اندازہ لگانے کی ضرورت پڑ سکتی ہے۔ اس کے علاوہ، غیر مطابقت پذیر انفرنس اینڈ پوائنٹس آپ کو اختتامی نقطہ مثال کی گنتی کو صفر پر اسکیل کرکے لاگت کو کنٹرول کرنے دیتے ہیں جب وہ بیکار ہوں، لہذا آپ صرف اس وقت ادائیگی کرتے ہیں جب آپ کے اختتامی نقطہ درخواستوں پر کارروائی کررہے ہوں۔

نوٹ بک مندرجہ ذیل کو ظاہر کرتی ہے:

سیج میکر ماڈل بنانا
اس ماڈل اور غیر مطابقت پذیر انفرنس کنفیگریشن کا استعمال کرتے ہوئے ایک اینڈ پوائنٹ بنانا
اس متضاد اختتامی نقطہ کے خلاف پیشین گوئیاں کرنا

یہ نوٹ بک آپ کو SageMaker ماڈل کے لیے ایک غیر مطابقت پذیر اختتامی نقطہ کو اکٹھا کرنے کی ایک عملی مثال دکھاتی ہے۔

TensorFlow اپنا ماڈل لائیں۔

ایک TensorFlow ماڈل کو مقامی طور پر درجہ بندی کے کام پر تربیت دی جاتی ہے جہاں یہ نوٹ بک چلائی جا رہی ہے۔ پھر اسے سیج میکر اینڈ پوائنٹ پر تعینات کیا جاتا ہے۔

نوٹ بک مندرجہ ذیل کو ظاہر کرتی ہے:

IRIS ڈیٹاسیٹ پر مقامی طور پر TensorFlow ماڈل کو تربیت دینا
اس ماڈل کو SageMaker میں درآمد کرنا
اختتامی نقطہ پر اس کی میزبانی کرنا

اگر آپ کے پاس TensorFlow ماڈل ہیں جو آپ نے خود تیار کیے ہیں، تو یہ مثال نوٹ بک آپ کو SageMaker کے زیر انتظام اختتامی نقطہ پر اپنے ماڈل کی میزبانی کرنے میں مدد کر سکتی ہے۔

اسکِٹ سیکھیں اپنا ماڈل لائیں۔

سیج میکر میں میزبانی شدہ نوٹ بک ماحول، تقسیم شدہ، سرور لیس تربیت، اور ریئل ٹائم ہوسٹنگ کو سپورٹ کرنے کی فعالیت شامل ہے۔ یہ سب سے بہتر کام کرتا ہے جب ان تینوں خدمات کو ایک ساتھ استعمال کیا جائے، لیکن انہیں آزادانہ طور پر بھی استعمال کیا جا سکتا ہے۔ کچھ استعمال کے معاملات میں صرف ہوسٹنگ کی ضرورت پڑ سکتی ہے۔ ہوسکتا ہے کہ ماڈل کو سیج میکر سے پہلے تربیت دی گئی ہو، جو کسی مختلف سروس میں ہو۔

نوٹ بک مندرجہ ذیل کو ظاہر کرتی ہے:

SageMaker Scikit-learn کنٹینر کے ساتھ پہلے سے تربیت یافتہ Scikit-learn ماڈل کا استعمال کرتے ہوئے اس ماڈل کے لیے تیزی سے ایک میزبان اختتامی نقطہ تخلیق کرنا

اگر آپ کے پاس Scikit-learn ماڈلز ہیں جو آپ نے خود تیار کیے ہیں، تو یہ مثالی نوٹ بک آپ کو SageMaker کے زیر انتظام اینڈ پوائنٹ پر اپنے ماڈل کی میزبانی کرنے میں مدد کر سکتی ہے۔

وسائل کو صاف کریں۔

جمپ اسٹارٹ میں نوٹ بک چلانے کے بعد، یقینی بنائیں تمام وسائل کو حذف کریں۔ تاکہ آپ نے اس عمل میں بنائے گئے تمام وسائل کو حذف کر دیا جائے اور آپ کی بلنگ روک دی جائے۔ ان نوٹ بکس میں آخری سیل عام طور پر بنائے گئے اینڈ پوائنٹس کو حذف کر دیتا ہے۔

خلاصہ

اس پوسٹ نے آپ کو 10 نئی مثالوں والی نوٹ بکس سے آگاہ کیا جو حال ہی میں جمپ سٹارٹ میں شامل کیے گئے تھے۔ اگرچہ اس پوسٹ نے ان 10 نئی نوٹ بکوں پر توجہ مرکوز کی ہے، لیکن اس تحریر تک کل 56 دستیاب نوٹ بک ہیں۔ ہم آپ کو اسٹوڈیو میں لاگ ان کرنے اور جمپ سٹارٹ نوٹ بک کو خود دریافت کرنے کی ترغیب دیتے ہیں، اور ان سے فوری قیمت حاصل کرنا شروع کریں۔ مزید معلومات کے لیے رجوع کریں۔ ایمیزون سیج میکر اسٹوڈیو اور سیج میکر جمپ اسٹارٹ.

مصنف کے بارے میں

ڈاکٹر راجو پنماچا AWS میں AI پلیٹ فارمز میں AI/ML ماہر حل آرکیٹیکٹ ہے۔ انہوں نے سٹینفورڈ یونیورسٹی سے پی ایچ ڈی کی ڈگری حاصل کی۔ وہ سیج میکر میں کم/نو کوڈ سوٹ سروسز پر قریب سے کام کرتا ہے جو صارفین کو مشین لرننگ ماڈلز اور سلوشنز کو آسانی سے بنانے اور تعینات کرنے میں مدد کرتی ہے۔

ٹائم اسٹیمپ: دسمبر 1، 2022دسمبر 2، 2022

ٹائم اسٹیمپ: دسمبر 12، 2023

ایمیزون سیج میکر جمپ اسٹارٹ میں مثالی نوٹ بک

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

نوٹ بک کا جائزہ

شرائط

AlexaTM 20B کے ساتھ سیاق و سباق میں سیکھنا

سیج میکر میں فیئرنس لکیری سیکھنے والا

SageMaker تلاش کا استعمال کرتے ہوئے ML تجربات کا نظم کریں۔

سیج میکر نیورل ٹاپک ماڈل

ڈرائیونگ کی رفتار کی خلاف ورزیوں کی پیش گوئی کریں۔

چھاتی کے کینسر کی پیشن گوئی

ایک سے زیادہ ماڈلز کی پیشین گوئیاں

سیج میکر غیر مطابقت پذیر تخمینہ

TensorFlow اپنا ماڈل لائیں۔

اسکِٹ سیکھیں اپنا ماڈل لائیں۔

وسائل کو صاف کریں۔

خلاصہ

مصنف کے بارے میں

سے زیادہ AWS مشین لرننگ

Amazon SageMaker اور Amazon Augmented AI کا استعمال کرتے ہوئے سیٹلائٹ امیجری کے لیے کمپیوٹر وژن کے ساتھ تباہی کے ردعمل کو تیز کریں۔

ایمیزون سیج میکر ڈیٹا رینگلر کے ساتھ گیتھب نمونے استعمال کریں۔

کس طرح شیفز ایمیزون پرسنلائز کے ساتھ بہترین کھانا پیش کرتا ہے۔

AWS Inferentia اور AWS Trainium کے ساتھ Amazon SageMaker جمپ سٹارٹ میں لاما 2 ماڈلز کو فائن ٹیون اور لاگت سے لاگو کریں۔ ایمیزون ویب سروسز

Frugality درستگی پر پورا اترتا ہے: AWS Trainium کے ساتھ GPT NeoX اور Pythia ماڈلز کی سستی تربیت | ایمیزون ویب سروسز

ہمارے متعلق

عمودی تلاش اور Ai

پلیٹ فارم

مربوط رہو

اکاؤنٹ