ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2

ڈیٹا کے معیار اور پیچیدگی پر منحصر ہے، ڈیٹا سائنسدان ڈیٹا کی تیاری کے کاموں میں اپنا 45-80% وقت صرف کرتے ہیں۔ اس کا مطلب یہ ہے کہ ڈیٹا کی تیاری اور صفائی میں حقیقی ڈیٹا سائنس کے کام سے قیمتی وقت لگتا ہے۔ مشین لرننگ (ML) ماڈل کو تیار کردہ ڈیٹا کے ساتھ تربیت دینے اور تعیناتی کے لیے تیار کیے جانے کے بعد، ڈیٹا سائنسدانوں کو اکثر ڈیٹا کی تبدیلیوں کو دوبارہ لکھنا چاہیے جو ML تخمینہ کے لیے ڈیٹا کی تیاری کے لیے استعمال ہوتا ہے۔ یہ ایک مفید ماڈل کو متعین کرنے میں لگنے والے وقت کو بڑھا سکتا ہے جو اس کی خام شکل اور شکل سے ڈیٹا کا اندازہ اور اسکور کر سکتا ہے۔

اس سیریز کے حصہ 1 میں، ہم نے دکھایا کہ ڈیٹا رینگلر کس طرح ایک کو فعال کرتا ہے۔ متحد ڈیٹا کی تیاری اور ماڈل ٹریننگ کے ساتھ تجربہ ایمیزون سیج میکر آٹو پائلٹ صرف چند کلکس میں۔ اس سیریز کے اس دوسرے اور آخری حصے میں، ہم ایک خصوصیت پر توجہ مرکوز کرتے ہیں جس میں شامل اور دوبارہ استعمال کیا جاتا ہے۔ ایمیزون سیج میکر ڈیٹا رینگلر ٹرانسفارمز، جیسے گمشدہ ویلیو امپیوٹرز، آرڈینل یا ون ہاٹ انکوڈرز، اور مزید، ML انفرنس کے لیے آٹو پائلٹ ماڈلز کے ساتھ۔ یہ خصوصیت تخمینہ کے وقت ڈیٹا رینگلر فیچر ٹرانسفارمز کے دوبارہ استعمال کے ساتھ خام ڈیٹا کی خودکار پری پروسیسنگ کو قابل بناتا ہے، جس سے پیداوار میں تربیت یافتہ ماڈل کو تعینات کرنے کے لیے درکار وقت کو مزید کم کیا جاتا ہے۔

حل جائزہ

ڈیٹا رینگلر ML کے لیے ڈیٹا کو جمع کرنے اور تیار کرنے کے لیے ہفتوں سے منٹوں تک کا وقت کم کر دیتا ہے، اور Autopilot خود بخود آپ کے ڈیٹا کی بنیاد پر بہترین ML ماڈلز بناتا، ٹرین کرتا اور ٹیون کرتا ہے۔ آٹو پائلٹ کے ساتھ، آپ اب بھی اپنے ڈیٹا اور ماڈل پر مکمل کنٹرول اور مرئیت برقرار رکھتے ہیں۔ دونوں خدمات ML پریکٹیشنرز کو زیادہ نتیجہ خیز بنانے اور وقت کی قدر کو تیز کرنے کے مقصد سے بنائی گئی ہیں۔

درج ذیل خاکہ ہمارے حل کے فن تعمیر کو واضح کرتا ہے۔

شرائط

چونکہ یہ پوسٹ دو حصوں کی سیریز میں دوسری ہے، اس لیے یقینی بنائیں کہ آپ نے کامیابی کے ساتھ پڑھا اور لاگو کیا ہے۔ حصہ 1 جاری رکھنے سے پہلے

ماڈل کو برآمد اور تربیت دیں۔

حصہ 1 میں، ایم ایل کے لیے ڈیٹا کی تیاری کے بعد، ہم نے اس بات پر تبادلہ خیال کیا کہ آپ ڈیٹا سیٹس کا تجزیہ کرنے اور آٹو پائلٹ میں اعلیٰ معیار کے ایم ایل ماڈلز کو آسانی سے بنانے کے لیے ڈیٹا رینگلر کے مربوط تجربے کو کس طرح استعمال کر سکتے ہیں۔

اس بار، ہم اسی ٹریننگ ڈیٹاسیٹ کے خلاف ایک ماڈل کو تربیت دینے کے لیے ایک بار پھر آٹو پائلٹ انضمام کا استعمال کرتے ہیں، لیکن بلک انفرنس کو انجام دینے کے بجائے، ہم ایک کے خلاف ریئل ٹائم انفرنس انجام دیتے ہیں۔ ایمیزون سیج میکر انفرنس اینڈ پوائنٹ جو ہمارے لیے خود بخود تخلیق ہوتا ہے۔

خودکار اختتامی نقطہ کی تعیناتی کے ذریعے فراہم کردہ سہولت کے علاوہ، ہم یہ ظاہر کرتے ہیں کہ آپ کس طرح تمام ڈیٹا رینگلر فیچر کو سیج میکر سیریل انفرنس پائپ لائن کے طور پر تبدیل کر سکتے ہیں۔ یہ تخمینہ کے وقت ڈیٹا رینگلر فیچر ٹرانسفارمس کے دوبارہ استعمال کے ساتھ خام ڈیٹا کی خودکار پری پروسیسنگ کو قابل بناتا ہے۔

نوٹ کریں کہ یہ فیچر فی الحال صرف ڈیٹا رینگلر کے بہاؤ کے لیے تعاون یافتہ ہے جو جوائن، گروپ بذریعہ، کنکٹینٹ، اور ٹائم سیریز کی تبدیلیوں کا استعمال نہیں کرتے ہیں۔

ہم ڈیٹا رینگلر ڈیٹا فلو UI سے ماڈل کو براہ راست تربیت دینے کے لیے آٹو پائلٹ کے ساتھ نئے ڈیٹا رینگلر انضمام کا استعمال کر سکتے ہیں۔

  1. کے آگے جمع کا نشان منتخب کریں۔ اسکیل اقدار نوڈ، اور منتخب کریں ٹرین ماڈل.
  2. کے لئے ایمیزون S3 مقام، کی وضاحت کریں ایمیزون سادہ اسٹوریج سروس (ایمیزون S3) مقام جہاں سیج میکر آپ کا ڈیٹا برآمد کرتا ہے۔
    اگر پہلے سے طے شدہ طور پر روٹ بالٹی پاتھ کے ساتھ پیش کیا جاتا ہے، تو ڈیٹا رینگلر اس کے تحت ایک انوکھی ایکسپورٹ سب ڈائرکٹری بناتا ہے- آپ کو اس ڈیفالٹ روٹ پاتھ میں ترمیم کرنے کی ضرورت نہیں ہے جب تک کہ آپ نہ چاہیں۔ آٹو پائلٹ اس مقام کا استعمال کسی ماڈل کو خود بخود تربیت دینے کے لیے کرتا ہے، آپ کو بچاتا ہے۔ ڈیٹا رینگلر فلو کے آؤٹ پٹ لوکیشن کی وضاحت کرنے اور پھر آٹو پائلٹ ٹریننگ ڈیٹا کے ان پٹ لوکیشن کی وضاحت کرنے کا وقت۔ اس سے زیادہ ہموار تجربہ ہوتا ہے۔
  3. میں سے انتخاب کریں ایکسپورٹ اور ٹرین تبدیل شدہ ڈیٹا کو ایمیزون S3 میں ایکسپورٹ کرنے کے لیے۔
    ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی
    ایکسپورٹ کامیاب ہونے پر، آپ کو ری ڈائریکٹ کر دیا جاتا ہے۔ ایک آٹو پائلٹ تجربہ بنائیں صفحہ، کے ساتھ ان پٹ ڈیٹا S3 مقام آپ کے لیے پہلے سے ہی بھرا ہوا ہے (یہ پچھلے صفحے کے نتائج سے بھرا ہوا تھا)۔
  4. کے لئے تجربے کا نام، ایک نام درج کریں (یا پہلے سے طے شدہ نام رکھیں)۔
  5. کے لئے ہدفمنتخب کریں نتائج جس کالم کی آپ پیش گوئی کرنا چاہتے ہیں۔
  6. میں سے انتخاب کریں اگلا: تربیت کا طریقہ.
    ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

جیسا کہ پوسٹ میں تفصیل ہے۔ ایمیزون سیج میکر آٹو پائلٹ آٹو گلوون کے ذریعہ چلنے والے نئے جوڑ ٹریننگ موڈ کے ساتھ آٹھ گنا تیز ہے۔، آپ یا تو آٹو پائلٹ کو ڈیٹاسیٹ کے سائز کی بنیاد پر خودکار طور پر ٹریننگ موڈ منتخب کرنے دے سکتے ہیں، یا انسمبلنگ یا ہائپر پیرامیٹر آپٹیمائزیشن (HPO) کے لیے دستی طور پر ٹریننگ موڈ کو منتخب کر سکتے ہیں۔

ہر آپشن کی تفصیلات درج ذیل ہیں:

  • آٹو - آٹو پائلٹ آپ کے ڈیٹا سیٹ کے سائز کی بنیاد پر خودکار طور پر یا تو جوڑ یا HPO موڈ کا انتخاب کرتا ہے۔ اگر آپ کا ڈیٹاسیٹ 100 MB سے بڑا ہے، تو آٹو پائلٹ HPO کا انتخاب کرتا ہے۔ دوسری صورت میں یہ ensembling کا انتخاب کرتا ہے.
  • جوڑنا - آٹو پائلٹ استعمال کرتا ہے۔ آٹوگلون متعدد بیس ماڈلز کو تربیت دینے کی تکنیک جوڑتی ہے اور ماڈل اسٹیکنگ کا استعمال کرتے ہوئے ان کی پیشین گوئیوں کو ایک بہترین پیش گوئی کرنے والے ماڈل میں جوڑتی ہے۔
  • ہائپر پیرامیٹر کی اصلاح - آٹو پائلٹ بائیسیئن آپٹیمائزیشن تکنیک کا استعمال کرتے ہوئے ہائپر پیرامیٹر کو ٹیوننگ کرکے اور آپ کے ڈیٹاسیٹ پر تربیتی ملازمتیں چلا کر ماڈل کا بہترین ورژن تلاش کرتا ہے۔ HPO آپ کے ڈیٹاسیٹ سے سب سے زیادہ متعلقہ الگورتھم کا انتخاب کرتا ہے اور ماڈلز کو ٹیون کرنے کے لیے ہائپر پیرامیٹر کی بہترین رینج چنتا ہے۔ ہماری مثال کے لیے، ہم پہلے سے طے شدہ انتخاب کو چھوڑ دیتے ہیں۔ آٹو.
  1. میں سے انتخاب کریں اگلا: تعیناتی اور جدید ترتیبات جاری رکھنے کے لئے.
    ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی
  2. پر تعیناتی اور جدید ترتیبات صفحہ، تعیناتی کا اختیار منتخب کریں۔
    تعیناتی کے اختیارات کو مزید تفصیل سے سمجھنا ضروری ہے۔ ہم جو منتخب کرتے ہیں اس پر اثر پڑے گا کہ آیا ہم نے پہلے ڈیٹا رینگلر میں جو تبدیلیاں کیں وہ انفرنس پائپ لائن میں شامل ہوں گی:
    • ڈیٹا رینگلر سے ٹرانسفارمز کے ساتھ بہترین ماڈل کو آٹو تعینات کریں۔ - اس تعیناتی کے آپشن کے ساتھ، جب آپ ڈیٹا رینگلر میں ڈیٹا تیار کرتے ہیں اور آٹو پائلٹ کو استعمال کرتے ہوئے کسی ماڈل کو تربیت دیتے ہیں، تربیت یافتہ ماڈل کو ڈیٹا رینگلر کی تمام خصوصیت کے ساتھ تعینات کیا جاتا ہے۔ سیج میکر سیریل انفرنس پائپ لائن. یہ تخمینہ کے وقت ڈیٹا رینگلر فیچر ٹرانسفارمس کے دوبارہ استعمال کے ساتھ خام ڈیٹا کی خودکار پری پروسیسنگ کو قابل بناتا ہے۔ نوٹ کریں کہ انفرنس اینڈ پوائنٹ آپ کے ڈیٹا کا فارمیٹ اسی فارمیٹ میں ہونے کی توقع کرتا ہے جب اسے ڈیٹا رینگلر فلو میں درآمد کیا جاتا ہے۔
    • ڈیٹا رینگلر سے ٹرانسفارمز کے بغیر بہترین ماڈل کو آٹو تعینات کریں۔ - یہ آپشن ریئل ٹائم اینڈ پوائنٹ کو تعینات کرتا ہے جو ڈیٹا رینگلر ٹرانسفارمز کا استعمال نہیں کرتا ہے۔ اس صورت میں، آپ کو اندازہ لگانے سے پہلے اپنے ڈیٹا رینگلر کے بہاؤ میں بیان کردہ تبدیلیوں کو لاگو کرنے کی ضرورت ہے۔
    • بہترین ماڈل کو خود بخود متعین نہ کریں۔ - آپ کو یہ اختیار اس وقت استعمال کرنا چاہیے جب آپ کوئی انفرنس اینڈ پوائنٹ بالکل نہیں بنانا چاہتے۔ یہ مفید ہے اگر آپ بعد میں استعمال کے لیے ایک بہترین ماڈل بنانا چاہتے ہیں، جیسے کہ مقامی طور پر بلک انفرنس کو چلائیں۔ (یہ تعیناتی کا اختیار ہے جسے ہم نے سیریز کے حصہ 1 میں منتخب کیا ہے۔) نوٹ کریں کہ جب آپ اس اختیار کو منتخب کرتے ہیں، تو بنائے گئے ماڈل میں (SageMaker SDK کے ذریعے آٹو پائلٹ کے بہترین امیدوار سے) ڈیٹا رینگلر کی خصوصیت سیج میکر سیریل انفرنس پائپ لائن کے طور پر تبدیل ہوتی ہے۔

    اس پوسٹ کے لیے، ہم استعمال کرتے ہیں۔ ڈیٹا رینگلر سے ٹرانسفارمز کے ساتھ بہترین ماڈل کو آٹو تعینات کریں۔ آپشن.

  3. کے لئے تعیناتی کا اختیارمنتخب ڈیٹا رینگلر سے ٹرانسفارمز کے ساتھ بہترین ماڈل کو آٹو تعینات کریں۔.
  4. دیگر ترتیبات کو بطور ڈیفالٹ چھوڑ دیں۔
  5. میں سے انتخاب کریں اگلا: جائزہ لیں اور تخلیق کریں۔ جاری رکھنے کے لئے.
    پر جائزہ لیں اور تخلیق کریں۔ صفحہ، ہم اپنے آٹو پائلٹ تجربے کے لیے منتخب کردہ ترتیبات کا خلاصہ دیکھتے ہیں۔
  6. میں سے انتخاب کریں تجربہ بنائیں ماڈل بنانے کا عمل شروع کرنے کے لیے۔
    ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

آپ کو آٹو پائلٹ ملازمت کی تفصیل والے صفحہ پر بھیج دیا گیا ہے۔ ماڈلز پر دکھائے جاتے ہیں۔ ماڈل ٹیب جیسے ہی وہ تیار ہوتے ہیں۔ اس بات کی تصدیق کرنے کے لیے کہ عمل مکمل ہو گیا ہے، پر جائیں۔ ملازمت کی پروفائل ٹیب اور تلاش کریں a Completed کے لئے قدر درجہ میدان.

آپ کسی بھی وقت اس آٹو پائلٹ جاب کی تفصیل والے صفحے پر واپس جا سکتے ہیں۔ ایمیزون سیج میکر اسٹوڈیو:

  1. میں سے انتخاب کریں تجربات اور آزمائشیں۔ پر سیج میکر کے وسائل ڈراپ ڈاؤن مینو
  2. آٹو پائلٹ جاب کا نام منتخب کریں جو آپ نے بنایا ہے۔
  3. تجربہ منتخب کریں (دائیں کلک کریں) اور منتخب کریں۔ آٹو ایم ایل جاب کی وضاحت کریں۔.

تربیت اور تعیناتی دیکھیں

جب آٹو پائلٹ تجربہ مکمل کرتا ہے، تو ہم ٹریننگ کے نتائج دیکھ سکتے ہیں اور آٹو پائلٹ جاب کی تفصیل والے صفحہ سے بہترین ماڈل دریافت کر سکتے ہیں۔

لیبل والے ماڈل کو منتخب کریں (دائیں کلک کریں) بہترین ماڈل، اور منتخب کریں ماڈل کی تفصیلات میں کھولیں۔.

ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

۔ کارکردگی ٹیب کئی ماڈل پیمائش کے ٹیسٹ دکھاتا ہے، بشمول کنفیوژن میٹرکس، پریزیشن/ریکال کریو (AUCPR) کے نیچے کا علاقہ، اور ریسیور آپریٹنگ کریکٹرسٹک کریو (ROC) کے نیچے کا علاقہ۔ یہ ماڈل کی توثیق کی مجموعی کارکردگی کو واضح کرتے ہیں، لیکن وہ ہمیں یہ نہیں بتاتے ہیں کہ آیا ماڈل اچھی طرح سے عام ہو جائے گا۔ ہمیں ابھی بھی غیر دیکھے ہوئے ٹیسٹ کے اعداد و شمار پر تشخیص چلانے کی ضرورت ہے تاکہ یہ معلوم ہو سکے کہ ماڈل کس حد تک درست طریقے سے پیش گوئیاں کرتا ہے (اس مثال کے طور پر، ہم پیش گوئی کرتے ہیں کہ آیا کسی فرد کو ذیابیطس ہو گی)۔

ریئل ٹائم اینڈ پوائنٹ کے خلاف تخمینہ لگائیں۔

ماڈل کی کارکردگی کا اندازہ لگانے کے لیے ریئل ٹائم انفرنس انجام دینے کے لیے ایک نئی SageMaker نوٹ بک بنائیں۔ توثیق کے لیے ریئل ٹائم انفرنس چلانے کے لیے نوٹ بک میں درج ذیل کوڈ درج کریں:

import boto3

### Define required boto3 clients

sm_client = boto3.client(service_name="sagemaker")
runtime_sm_client = boto3.client(service_name="sagemaker-runtime")

### Define endpoint name

endpoint_name = ""

### Define input data

payload_str = '5,166.0,72.0,19.0,175.0,25.8,0.587,51'
payload = payload_str.encode()
response = runtime_sm_client.invoke_endpoint(
    EndpointName=endpoint_name,
    ContentType="text/csv",
    Body=payload,
)

response["Body"].read()

اپنی نوٹ بک میں چلانے کے لیے کوڈ ترتیب دینے کے بعد، آپ کو دو متغیرات کو ترتیب دینے کی ضرورت ہے:

  • endpoint_name
  • payload_str

endpoint_name کو ترتیب دیں۔

endpoint_name ریئل ٹائم انفرنس اینڈ پوائنٹ کے نام کی نمائندگی کرتا ہے جو ہمارے لیے خود کار طریقے سے تیار کیا گیا ہے۔ اس سے پہلے کہ ہم اسے ترتیب دیں، ہمیں اس کا نام تلاش کرنے کی ضرورت ہے۔

  1. میں سے انتخاب کریں اختتامی نکات پر سیج میکر کے وسائل ڈراپ ڈاؤن مینو
  2. اختتامی نقطہ کا نام تلاش کریں جس میں آٹو پائلٹ جاب کا نام ہے جو آپ نے اس کے ساتھ منسلک بے ترتیب تار کے ساتھ بنایا ہے۔
  3. تجربہ منتخب کریں (دائیں کلک کریں)، اور منتخب کریں۔ اختتامی نقطہ کی وضاحت کریں۔.
    ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی
    ۔ اختتامی نقطہ کی تفصیلات صفحہ ظاہر ہوتا ہے۔
  4. مکمل اختتامی نقطہ کا نام نمایاں کریں، اور دبائیں۔ Ctrl + C اسے کلپ بورڈ سے کاپی کرنے کے لیے۔
    ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی
  5. اس قدر درج کریں (یقینی بنائیں کہ اس کا حوالہ دیا گیا ہے) endpoint_name اندازہ نوٹ بک میں.
    ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

payload_str کو ترتیب دیں۔

نوٹ بک ڈیفالٹ پے لوڈ سٹرنگ کے ساتھ آتی ہے۔ payload_str جسے آپ اپنے اختتامی نقطہ کو جانچنے کے لیے استعمال کر سکتے ہیں، لیکن مختلف اقدار کے ساتھ تجربہ کرنے کے لیے آزاد محسوس کریں، جیسے کہ آپ کے ٹیسٹ ڈیٹاسیٹ سے۔

ٹیسٹ ڈیٹاسیٹ سے قدریں نکالنے کے لیے، میں دی گئی ہدایات پر عمل کریں۔ حصہ 1 Amazon S3 پر ٹیسٹ ڈیٹاسیٹ برآمد کرنے کے لیے۔ پھر Amazon S3 کنسول پر، آپ اسے ڈاؤن لوڈ کر سکتے ہیں اور Amazon S3 سے فائل استعمال کرنے کے لیے قطاریں منتخب کر سکتے ہیں۔

آپ کے ٹیسٹ ڈیٹاسیٹ میں ہر قطار میں نو کالم ہوتے ہیں، جس کا آخری کالم ہوتا ہے۔ outcome قدر. اس نوٹ بک کوڈ کے لیے، یقینی بنائیں کہ آپ صرف ایک ڈیٹا قطار استعمال کرتے ہیں (کبھی بھی CSV ہیڈر نہیں) payload_str. یہ بھی یقینی بنائیں کہ آپ صرف ایک بھیجتے ہیں۔ payload_str آٹھ کالموں کے ساتھ، جہاں آپ نے نتیجہ کی قدر کو ہٹا دیا ہے۔

مثال کے طور پر، اگر آپ کے ٹیسٹ ڈیٹاسیٹ کی فائلیں درج ذیل کوڈ کی طرح نظر آتی ہیں، اور ہم پہلی قطار کا اصل وقتی تخمینہ کرنا چاہتے ہیں:

Pregnancies,Glucose,BloodPressure,SkinThickness,Insulin,BMI,DiabetesPedigreeFunction,Age,Outcome 
10,115,0,0,0,35.3,0.134,29,0 
10,168,74,0,0,38.0,0.537,34,1 
1,103,30,38,83,43.3,0.183,33,0

ہم نے طے کیا payload_str کرنے کے لئے 10,115,0,0,0,35.3,0.134,29. نوٹ کریں کہ ہم نے اسے کیسے چھوڑا ہے۔ outcome کی قدر 0 آخر میں.

اگر اتفاق سے آپ کے ڈیٹاسیٹ کی ٹارگٹ ویلیو پہلی یا آخری ویلیو نہیں ہے، تو کوما کے ڈھانچے کو برقرار رکھتے ہوئے قدر کو ہٹا دیں۔ مثال کے طور پر، فرض کریں کہ ہم بار کی پیش گوئی کر رہے ہیں، اور ہمارا ڈیٹاسیٹ درج ذیل کوڈ کی طرح لگتا ہے:

foo,bar,foobar
85,17,20

اس صورت میں، ہم نے مقرر کیا payload_str کرنے کے لئے 85,,20.

جب نوٹ بک کو صحیح طریقے سے تشکیل شدہ کے ساتھ چلایا جاتا ہے۔ payload_str اور endpoint_name اقدار، آپ کو کی شکل میں CSV جواب واپس ملتا ہے۔ outcome (0 یا 1)، confidence (0 1).

صفائی ستھرائی

اس بات کو یقینی بنانے کے لیے کہ اس ٹیوٹوریل کو مکمل کرنے کے بعد آپ کو ٹیوٹوریل سے متعلقہ چارجز نہ لگیں، ڈیٹا رینگلر ایپ کو بند کرنا یقینی بنائیں (https://docs.aws.amazon.com/sagemaker/latest/dg/data-wrangler-shut-down.html) کے ساتھ ساتھ تمام نوٹ بک مثالیں جو تخمینہ کے کام انجام دینے کے لیے استعمال ہوتی ہیں۔ اضافی چارجز کو روکنے کے لیے آٹو پائلٹ کی تعیناتی کے ذریعے بنائے گئے انفرنس اینڈ پوائنٹس کو حذف کر دینا چاہیے۔

نتیجہ

اس پوسٹ میں، ہم نے دکھایا کہ ڈیٹا رینگلر اور آٹو پائلٹ کا استعمال کرتے ہوئے آپ کی ڈیٹا پروسیسنگ، فیچر انجینئرنگ، اور ماڈل بلڈنگ کو کیسے مربوط کیا جائے۔ سیریز میں حصہ 1 کی تعمیر کرتے ہوئے، ہم نے روشنی ڈالی کہ آپ کس طرح آسانی سے ڈیٹا رینگلر یوزر انٹرفیس سے آٹو پائلٹ کے ساتھ ریئل ٹائم انفرنس اینڈ پوائنٹ پر ایک ماڈل کو آسانی سے تربیت، ٹیون، اور تعینات کر سکتے ہیں۔ آٹومیٹک اینڈ پوائنٹ کی تعیناتی کے ذریعے فراہم کردہ سہولت کے علاوہ، ہم نے دکھایا کہ آپ ڈیٹا رینگلر فیچر ٹرانسفارمز کو سیج میکر سیریل انفرنس پائپ لائن کے طور پر کیسے تعینات کر سکتے ہیں، جو کہ ڈیٹا رینگلر فیچر کے دوبارہ استعمال کے ساتھ، خام ڈیٹا کی خودکار پری پروسیسنگ فراہم کرتے ہیں۔ اندازہ لگانے کا وقت.

کم کوڈ اور آٹو ایم ایل حل جیسے ڈیٹا رینگلر اور آٹو پائلٹ مضبوط ایم ایل ماڈلز بنانے کے لیے کوڈنگ کے بارے میں گہرے علم کی ضرورت کو دور کرتے ہیں۔ ڈیٹا رینگلر کا استعمال شروع کریں۔ آج یہ تجربہ کرنے کے لیے کہ آٹو پائلٹ کا استعمال کرتے ہوئے ایم ایل ماڈل بنانا کتنا آسان ہے۔


مصنفین کے بارے میں

ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عیجیریمی کوہن AWS کے ساتھ ایک سولیوشن آرکیٹیکٹ ہے جہاں وہ صارفین کو جدید، کلاؤڈ بیسڈ حل بنانے میں مدد کرتا ہے۔ اپنے فارغ وقت میں، وہ ساحل سمندر پر مختصر سیر سے لطف اندوز ہوتا ہے، اپنے خاندان کے ساتھ خلیج کے علاقے کو تلاش کرتا ہے، گھر کے ارد گرد چیزیں ٹھیک کرتا ہے، گھر کے ارد گرد چیزیں توڑتا ہے، اور BBQing کرتا ہے۔

ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عیپردیپ ریڈی SageMaker Low/No Code ML ٹیم میں ایک سینئر پروڈکٹ مینیجر ہے، جس میں SageMaker Autopilot، SageMaker Automatic Model Tuner شامل ہیں۔ کام سے باہر، پردیپ کو راسبیری پائی جیسے کھجور کے سائز کے کمپیوٹرز، اور دیگر گھریلو آٹومیشن ٹیک کے ساتھ پڑھنے، چلانے اور باہر نکلنے کا لطف آتا ہے۔

ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری، ماڈل ٹریننگ، اور تعیناتی - حصہ 2 پلیٹو بلاکچین ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عیڈاکٹر جان ہی Amazon AI کے ساتھ ایک سینئر سافٹ ویئر ڈویلپمنٹ انجینئر ہے، جہاں وہ مشین لرننگ اور تقسیم شدہ کمپیوٹنگ پر توجہ مرکوز کرتا ہے۔ انہوں نے سی ایم یو سے پی ایچ ڈی کی ڈگری حاصل کی۔

ٹائم اسٹیمپ:

سے زیادہ AWS مشین لرننگ