ایمیزون سیج میکر ڈیٹا رینگلر ایک واحد بصری انٹرفیس ہے جو ڈیٹا کو تیار کرنے اور فیچر انجینئرنگ انجام دینے کے لیے درکار وقت کو ہفتوں سے منٹوں تک کم کرتا ہے جس میں ڈیٹا کو منتخب کرنے اور صاف کرنے، فیچرز بنانے، اور مشین لرننگ (ML) ورک فلوز میں ڈیٹا کی تیاری کو بغیر کسی کوڈ کے خودکار کرنے کی صلاحیت ہے۔
سیج میکر ڈیٹا رینگلر سپورٹ کرتا ہے۔ میں Snowflake، ان صارفین کے لیے ایک مقبول ڈیٹا ماخذ ہے جو ML کرنا چاہتے ہیں۔ ہم کسٹمر کے تجربے کو بہتر بنانے کے لیے SageMaker Data Wrangler سے Snowflake کا براہ راست کنکشن شروع کرتے ہیں۔ اس خصوصیت کے آغاز سے پہلے، منتظمین کو ڈیٹا رینگلر میں ML کے لیے خصوصیات بنانے کے لیے Snowflake کے ساتھ مربوط ہونے کے لیے ابتدائی اسٹوریج انضمام کو ترتیب دینے کی ضرورت تھی۔ اس میں فراہمی بھی شامل ہے۔ ایمیزون سادہ اسٹوریج سروس (ایمیزون S3) بالٹیاں، AWS شناخت اور رسائی کا انتظام (IAM) تک رسائی کی اجازتیں، انفرادی صارفین کے لیے Snowflake سٹوریج کا انضمام، اور Amazon S3 میں ڈیٹا کاپیوں کو منظم کرنے یا صاف کرنے کا ایک جاری طریقہ کار۔ یہ عمل سخت ڈیٹا تک رسائی کے کنٹرول والے صارفین اور صارفین کی ایک بڑی تعداد کے لیے قابل توسیع نہیں ہے۔
اس پوسٹ میں، ہم دکھاتے ہیں کہ SageMaker Data Wrangler میں Snowflake کا براہ راست تعلق کس طرح ایڈمنسٹریٹر کے تجربے اور ڈیٹا سائنسدان کے ML ڈیٹا سے کاروباری بصیرت تک کے سفر کو آسان بناتا ہے۔
حل جائزہ
اس حل میں، ہم ML اور کے لیے ڈیٹا کی تیاری کو تیز کرنے کے لیے SageMaker Data Wrangler کا استعمال کرتے ہیں۔ ایمیزون سیج میکر آٹو پائلٹ آپ کے ڈیٹا کی بنیاد پر ML ماڈلز کو خود بخود بنانے، تربیت دینے اور ٹھیک کرنے کے لیے۔ دونوں خدمات کو خاص طور پر پیداواری صلاحیت بڑھانے اور ML پریکٹیشنرز کے لیے وقت کم کرنے کے لیے ڈیزائن کیا گیا ہے۔ ہم SageMaker Data Wrangler سے Snowflake تک ML کے لیے استفسار اور خصوصیات بنانے کے لیے براہ راست تعلق کے ساتھ آسان ڈیٹا تک رسائی کا بھی مظاہرہ کرتے ہیں۔
Snowflake، SageMaker Data Wrangler، اور SageMaker Autopilot کے ساتھ کم کوڈ ML کے عمل کے جائزہ کے لیے نیچے دیے گئے خاکے کا حوالہ دیں۔
ورک فلو میں درج ذیل مراحل شامل ہیں:
- اپنے ڈیٹا کی تیاری اور فیچر انجینئرنگ کے کاموں کے لیے SageMaker Data Wrangler پر جائیں۔
- SageMaker ڈیٹا رینگلر کے ساتھ Snowflake کنکشن قائم کریں۔
- SageMaker Data Wrangler میں اپنے Snowflake ٹیبلز کو دریافت کریں، ایک ML ڈیٹاسیٹ بنائیں، اور فیچر انجینئرنگ انجام دیں۔
- سیج میکر ڈیٹا رینگلر اور سیج میکر آٹو پائلٹ کا استعمال کرتے ہوئے ماڈلز کی تربیت اور جانچ کریں۔
- پیشین گوئیوں کے لیے بہترین ماڈل کو ریئل ٹائم انفرنس اینڈ پوائنٹ پر لوڈ کریں۔
- لانچ شدہ ریئل ٹائم انفرنس اینڈ پوائنٹ کو طلب کرنے کے لیے ایک ازگر نوٹ بک کا استعمال کریں۔
شرائط
اس پوسٹ کے لیے ایڈمنسٹریٹر کو درج ذیل شرائط کی ضرورت ہے:
ڈیٹا سائنسدانوں کے پاس درج ذیل شرائط ہونی چاہئیں
آخر میں، آپ کو Snowflake کے لیے اپنا ڈیٹا تیار کرنا چاہیے۔
- ہم کریڈٹ کارڈ سے لین دین کا ڈیٹا استعمال کرتے ہیں۔ کاگل جعلی کریڈٹ کارڈ ٹرانزیکشنز کا پتہ لگانے کے لیے ایم ایل ماڈلز بنانے کے لیے، اس لیے صارفین سے ان اشیاء کے لیے چارج نہیں کیا جاتا جو انھوں نے نہیں خریدی تھیں۔ ڈیٹا سیٹ میں یورپی کارڈ ہولڈرز کی جانب سے ستمبر 2013 میں کریڈٹ کارڈ کے لین دین شامل ہیں۔
- آپ کو استعمال کرنا چاہئے SnowSQL کلائنٹ اور اسے اپنی مقامی مشین میں انسٹال کریں، تاکہ آپ اسے ڈیٹاسیٹ کو Snowflake ٹیبل پر اپ لوڈ کرنے کے لیے استعمال کر سکیں۔
درج ذیل مراحل بتاتے ہیں کہ ڈیٹاسیٹ کو Snowflake ڈیٹا بیس میں کیسے تیار اور لوڈ کرنا ہے۔ یہ ایک وقتی سیٹ اپ ہے۔
سنو فلیک ٹیبل اور ڈیٹا کی تیاری
اس ایک وقتی سیٹ اپ کے لیے درج ذیل مراحل کو مکمل کریں:
- سب سے پہلے، بطور ایڈمنسٹریٹر، Snowflake ورچوئل گودام، صارف، اور کردار بنائیں، اور دوسرے صارفین جیسے ڈیٹا سائنسدانوں کو ان کے ML استعمال کے کیسز کے لیے ڈیٹا بیس اور اسٹیج ڈیٹا بنانے کے لیے رسائی فراہم کریں:
- ڈیٹا سائنسدان کے طور پر، آئیے اب ایک ڈیٹا بیس بناتے ہیں اور SageMaker Data Wrangler سے ڈیٹا تک رسائی کے لیے Snowflake ڈیٹا بیس میں کریڈٹ کارڈ کے لین دین کو درآمد کرتے ہیں۔ مثال کے مقاصد کے لیے، ہم Snowflake کے نام سے ایک ڈیٹا بیس بناتے ہیں۔
SF_FIN_TRANSACTION
: - ڈیٹا سیٹ CSV فائل کو اپنی مقامی مشین میں ڈاؤن لوڈ کریں اور ڈیٹا کو ڈیٹا بیس ٹیبل میں لوڈ کرنے کے لیے ایک اسٹیج بنائیں۔ ڈیٹا کو تخلیق شدہ مرحلے پر درآمد کرنے کے لیے PUT کمانڈ چلانے سے پہلے ڈاؤن لوڈ کردہ ڈیٹاسیٹ کے مقام کی طرف اشارہ کرنے کے لیے فائل پاتھ کو اپ ڈیٹ کریں:
- نام کی میز بنائیں
credit_card_transactions
: - اسٹیج سے تیار کردہ ٹیبل میں ڈیٹا درآمد کریں:
SageMaker ڈیٹا رینگلر اور Snowflake کنکشن سیٹ کریں۔
SageMaker Data Wrangler کے ساتھ استعمال کرنے کے لیے ڈیٹا سیٹ تیار کرنے کے بعد، آئیے SageMaker Data Wrangler میں ایک نیا Snowflake کنکشن بنائیں sf_fin_transaction
Snowflake میں ڈیٹا بیس اور استفسار کریں۔ credit_card_transaction
ٹیبل:
- میں سے انتخاب کریں میں Snowflake سیج میکر ڈیٹا رینگلر پر کنکشن صفحہ.
- اپنے کنکشن کی شناخت کے لیے ایک نام فراہم کریں۔
- Snowflake ڈیٹا بیس کے ساتھ جڑنے کے لیے اپنا تصدیقی طریقہ منتخب کریں:
- اگر بنیادی توثیق کا استعمال کر رہے ہیں تو، اپنے سنو فلیک ایڈمنسٹریٹر کے ذریعے شیئر کردہ صارف کا نام اور پاس ورڈ فراہم کریں۔ اس پوسٹ کے لیے، ہم گزشتہ مرحلے میں بنائے گئے صارف کی اسناد کا استعمال کرتے ہوئے Snowflake سے جڑنے کے لیے بنیادی تصدیق کا استعمال کرتے ہیں۔
- اگر آپ OAuth استعمال کر رہے ہیں، تو اپنے شناختی فراہم کنندہ کی اسناد فراہم کریں۔
SageMaker Data Wrangler بذریعہ ڈیفالٹ S3 بالٹیز میں ڈیٹا کاپی بنائے بغیر Snowflake سے آپ کے ڈیٹا سے براہ راست استفسار کرتا ہے۔ SageMaker Data Wrangler کی نئی قابل استعمال اضافہ Apache Spark کو Snowflake کے ساتھ ضم کرنے کے لیے استعمال کرتا ہے تاکہ آپ کے ML سفر کے لیے بغیر کسی رکاوٹ کے ڈیٹا سیٹ تیار کیا جا سکے۔
اب تک، ہم نے Snowflake پر ڈیٹا بیس بنایا ہے، CSV فائل کو Snowflake ٹیبل میں درآمد کیا ہے، Snowflake کی اسناد تخلیق کی ہیں، اور Snowflake سے جڑنے کے لیے SageMaker Data Wrangler پر ایک کنیکٹر بنایا ہے۔ کنفیگرڈ Snowflake کنکشن کی توثیق کرنے کے لیے، تخلیق کردہ Snowflake ٹیبل پر درج ذیل استفسار کو چلائیں:
نوٹ کریں کہ اسٹوریج انٹیگریشن آپشن جو پہلے درکار تھا اب ایڈوانس سیٹنگز میں اختیاری ہے۔
Snowflake ڈیٹا کو دریافت کریں۔
استفسار کے نتائج کی توثیق کرنے کے بعد، منتخب کریں۔ درآمد کریں ڈیٹا سیٹ کے طور پر استفسار کے نتائج کو محفوظ کرنے کے لیے۔ ہم اس نکالے گئے ڈیٹاسیٹ کو ریسرچ ڈیٹا کے تجزیہ اور فیچر انجینئرنگ کے لیے استعمال کرتے ہیں۔
آپ SageMaker Data Wrangler UI میں Snowflake سے ڈیٹا کا نمونہ لینے کا انتخاب کر سکتے ہیں۔ دوسرا آپشن یہ ہے کہ سیج میکر ڈیٹا رینگلر پروسیسنگ جابز کا استعمال کرتے ہوئے اپنے ایم ایل ماڈل ٹریننگ کے استعمال کے کیسز کے لیے مکمل ڈیٹا ڈاؤن لوڈ کریں۔
سیج میکر ڈیٹا رینگلر میں تحقیقی ڈیٹا کا تجزیہ کریں۔
ڈیٹا رینگلر کے اندر موجود ڈیٹا کو تربیت دینے سے پہلے انجنیئر کرنے کی ضرورت ہے۔ اس سیکشن میں، ہم SageMaker Data Wrangler کی بلٹ ان صلاحیتوں کا استعمال کرتے ہوئے Snowflake کے ڈیٹا پر فیچر انجینئرنگ کا مظاہرہ کرتے ہیں۔
سب سے پہلے، چلو استعمال کرتے ہیں Data Quality and Insights Report
SageMaker Data Wrangler کے اندر ڈیٹا کے معیار کی خود بخود تصدیق کرنے اور Snowflake سے ڈیٹا میں اسامانیتاوں کا پتہ لگانے کے لیے رپورٹیں تیار کرنے کی خصوصیت۔
آپ اپنے ڈیٹا کو صاف کرنے اور اس پر کارروائی کرنے میں مدد کے لیے رپورٹ کا استعمال کر سکتے ہیں۔ یہ آپ کو معلومات فراہم کرتا ہے جیسے گمشدہ اقدار کی تعداد اور آؤٹ لیرز کی تعداد۔ اگر آپ کو اپنے ڈیٹا کے ساتھ مسائل ہیں، جیسے کہ ہدف کا رساو یا عدم توازن، بصیرت کی رپورٹ ان مسائل کو آپ کی توجہ دلوا سکتی ہے۔ رپورٹ کی تفصیلات کو سمجھنے کے لیے دیکھیں ایمیزون سیج میکر ڈیٹا رینگلر میں ڈیٹا کے معیار اور بصیرت کے ساتھ ڈیٹا کی تیاری کو تیز کریں۔.
SageMaker Data Wrangler کے ذریعے لاگو کردہ ڈیٹا ٹائپ میچنگ کو چیک کرنے کے بعد، درج ذیل مراحل کو مکمل کریں:
- آگے جمع کا نشان منتخب کریں۔ ڈیٹا کی اقسام اور منتخب کریں تجزیہ شامل کریں۔.
- کے لئے تجزیہ کی قسممنتخب کریں ڈیٹا کوالٹی اور بصیرت کی رپورٹ.
- میں سے انتخاب کریں تخلیق کریں.
- اعلی ترجیحی انتباہات کو چیک کرنے کے لیے ڈیٹا کوالٹی اور بصیرت کی رپورٹ کی تفصیلات دیکھیں۔
آپ اپنے ML سفر کو آگے بڑھانے سے پہلے اطلاع دی گئی انتباہات کو حل کرنے کا انتخاب کر سکتے ہیں۔
ہدف کا کالم Class
پیشین گوئی کرنے کے لیے ایک تار کے طور پر درجہ بندی کی جاتی ہے۔ پہلے، باسی خالی حروف کو ہٹانے کے لیے تبدیلی کا اطلاق کریں۔
- میں سے انتخاب کریں قدم شامل کریں۔ اور منتخب کریں فارمیٹ سٹرنگ.
- تبدیلیوں کی فہرست میں، منتخب کریں۔ پٹی بائیں اور دائیں.
- ہٹانے اور منتخب کرنے کے لیے حروف درج کریں۔ شامل کریں.
اگلا، ہم ہدف کالم کو تبدیل کرتے ہیں۔ Class
سٹرنگ ڈیٹا ٹائپ سے بولین تک کیونکہ لین دین یا تو جائز ہے یا دھوکہ دہی۔
- میں سے انتخاب کریں قدم شامل کریں۔.
- میں سے انتخاب کریں کالم کو بطور قسم پارس کریں۔.
- کالم کے لیے، منتخب کریں۔
Class
. - کے لئے سےمنتخب کریں سلک.
- کے لئے کرنے کے لئےمنتخب کریں بولین.
- میں سے انتخاب کریں شامل کریں.
ہدف کالم کی تبدیلی کے بعد، ہم فیچر کالموں کی تعداد کو کم کرتے ہیں، کیونکہ اصل ڈیٹاسیٹ میں 30 سے زیادہ خصوصیات ہیں۔ ہم خصوصیت کی اہمیت پر مبنی طول و عرض کو کم کرنے کے لیے پرنسپل کمپوننٹ اینالیسس (PCA) کا استعمال کرتے ہیں۔ پی سی اے اور جہتی کمی کے بارے میں مزید سمجھنے کے لیے، رجوع کریں۔ پرنسپل اجزاء تجزیہ (PCA) الگورتھم.
- میں سے انتخاب کریں قدم شامل کریں۔.
- میں سے انتخاب کریں طول و عرض میں کمی.
- کے لئے تبدیلمنتخب کریں پرنسپل اجزاء کا تجزیہ.
- کے لئے ان پٹ کالمزٹارگٹ کالم کے علاوہ تمام کالم منتخب کریں۔
Class
. - آگے جمع کا نشان منتخب کریں۔ ڈیٹا کے بہاؤ اور منتخب کریں تجزیہ شامل کریں۔
- کے لئے تجزیہ کی قسممنتخب کریں فوری ماڈل.
- کے لئے تجزیہ کا نام، ایک نام درج کریں۔
- کے لئے لیبلمنتخب کریں
Class
. - میں سے انتخاب کریں رن.
PCA کے نتائج کی بنیاد پر، آپ فیصلہ کر سکتے ہیں کہ ماڈل بنانے کے لیے کون سی خصوصیات استعمال کی جائیں۔ مندرجہ ذیل اسکرین شاٹ میں، گراف ٹارگٹ کلاس کی پیشین گوئی کرنے کے لیے سب سے زیادہ سے کم اہمیت کی بنیاد پر ترتیب دی گئی خصوصیات (یا ڈائمینشنز) کو دکھاتا ہے، جو اس ڈیٹاسیٹ میں ہے کہ آیا لین دین دھوکہ دہی پر مبنی ہے یا درست۔
آپ اس تجزیہ کی بنیاد پر فیچرز کی تعداد کو کم کرنے کا انتخاب کر سکتے ہیں، لیکن اس پوسٹ کے لیے، ہم ڈیفالٹس کو ویسے ہی چھوڑ دیتے ہیں۔
یہ ہمارے فیچر انجینئرنگ کے عمل کو ختم کرتا ہے، حالانکہ آپ فوری ماڈل کو چلانے اور ڈیٹا کوالٹی اور بصیرت کی رپورٹ دوبارہ بنانے کا انتخاب کر سکتے ہیں تاکہ مزید اصلاح کرنے سے پہلے ڈیٹا کو سمجھ سکیں۔
ڈیٹا برآمد کریں اور ماڈل کو تربیت دیں۔
اگلے مرحلے میں، ہم آپ کے ڈیٹا کی بنیاد پر بہترین ML ماڈلز کو خودکار طور پر بنانے، تربیت دینے اور ٹیون کرنے کے لیے SageMaker Autopilot کا استعمال کرتے ہیں۔ SageMaker Autopilot کے ساتھ، آپ اب بھی اپنے ڈیٹا اور ماڈل پر مکمل کنٹرول اور مرئیت برقرار رکھتے ہیں۔
اب جب کہ ہم نے ایکسپلوریشن اور فیچر انجینئرنگ مکمل کر لی ہے، آئیے ڈیٹاسیٹ پر ایک ماڈل کو تربیت دیں اور SageMaker Autopilot کا استعمال کرتے ہوئے ML ماڈل کو تربیت دینے کے لیے ڈیٹا برآمد کریں۔
- پر ٹریننگ ٹیب، منتخب کریں ایکسپورٹ اور ٹرین.
جب ہم اس کے مکمل ہونے کا انتظار کرتے ہیں تو ہم برآمد کی پیشرفت کی نگرانی کر سکتے ہیں۔
آئیے سیج میکر آٹو پائلٹ کو خودکار تربیتی کام چلانے کے لیے کنفیگر کریں جس ہدف کی ہم پیشین گوئی کرنا چاہتے ہیں اور مسئلہ کی قسم کی وضاحت کریں۔ اس معاملے میں، چونکہ ہم ڈیٹا سیٹ کو یہ پیشین گوئی کرنے کی تربیت دے رہے ہیں کہ آیا لین دین دھوکہ دہی پر مبنی ہے یا درست، ہم بائنری درجہ بندی کا استعمال کرتے ہیں۔
- اپنے تجربے کے لیے ایک نام درج کریں، S3 مقام کا ڈیٹا فراہم کریں، اور منتخب کریں۔ اگلا: ہدف اور خصوصیات.
- کے لئے ہدفمنتخب کریں
Class
پیشن گوئی کرنے کے کالم کے طور پر۔ - میں سے انتخاب کریں اگلا: تربیت کا طریقہ.
آئیے SageMaker Autopilot کو ڈیٹا سیٹ کی بنیاد پر تربیت کا طریقہ طے کرنے کی اجازت دیں۔
- کے لئے تربیت کا طریقہ اور الگورتھممنتخب آٹو.
سیج میکر آٹو پائلٹ کے تعاون سے تربیتی طریقوں کے بارے میں مزید سمجھنے کے لیے، ملاحظہ کریں۔ ٹریننگ کے طریقے اور الگورتھم سپورٹ.
- میں سے انتخاب کریں اگلا: تعیناتی اور جدید ترتیبات.
- کے لئے تعیناتی کا اختیارمنتخب کریں ڈیٹا رینگلر سے ٹرانسفارمز کے ساتھ بہترین ماڈل کو خود بخود تعینات کریں۔، جو تجربہ مکمل ہونے کے بعد اندازہ لگانے کے لیے بہترین ماڈل لوڈ کرتا ہے۔
- اپنے اختتامی نقطہ کے لیے ایک نام درج کریں۔
- کے لئے مشین لرننگ کے مسئلے کی قسم منتخب کریں۔منتخب کریں بائنری درجہ بندی.
- کے لئے اعتراض میٹرکمنتخب کریں F1.
- میں سے انتخاب کریں اگلا: جائزہ لیں اور تخلیق کریں۔.
- میں سے انتخاب کریں تجربہ بنائیں.
یہ سیج میکر آٹو پائلٹ جاب شروع کرتا ہے جو تربیتی ملازمتوں کا ایک سیٹ تخلیق کرتا ہے جو مقصدی میٹرک کو بہتر بنانے کے لیے ہائپر پیرامیٹر کے امتزاج کا استعمال کرتا ہے۔
SageMaker Autopilot کے ماڈلز کی تعمیر اور بہترین ML ماڈل کی تشخیص مکمل ہونے کا انتظار کریں۔
بہترین ماڈل کو جانچنے کے لیے ریئل ٹائم انفرنس اینڈ پوائنٹ لانچ کریں۔
SageMaker Autopilot بہترین ماڈل کا تعین کرنے کے لیے تجربات کرتا ہے جو کریڈٹ کارڈ کے لین دین کو جائز یا دھوکہ دہی کے طور پر درجہ بندی کر سکتا ہے۔
جب SageMaker Autopilot تجربہ مکمل کر لیتا ہے، تو ہم تشخیصی میٹرکس کے ساتھ تربیت کے نتائج دیکھ سکتے ہیں اور SageMaker آٹو پائلٹ جاب کی تفصیل کے صفحہ سے بہترین ماڈل کو تلاش کر سکتے ہیں۔
- بہترین ماڈل منتخب کریں اور منتخب کریں۔ ماڈل تعینات کریں۔.
ہم SageMaker Autopilot کے ذریعے بنائے گئے بہترین ماڈل کو جانچنے کے لیے ایک حقیقی وقت کا اندازہ اختتامی نقطہ استعمال کرتے ہیں۔
- منتخب کریں حقیقی وقت کی پیش گوئیاں کریں۔.
اختتامی نقطہ دستیاب ہونے پر، ہم پے لوڈ کو پاس کر سکتے ہیں اور تخمینہ کے نتائج حاصل کر سکتے ہیں۔
آئیے انفرنس اینڈ پوائنٹ کو استعمال کرنے کے لیے ایک Python نوٹ بک لانچ کریں۔
- سیج میکر اسٹوڈیو کنسول پر، نیویگیشن پین میں فولڈر کا آئیکن منتخب کریں اور منتخب کریں۔ نوٹ بک بنائیں.
- تعینات ریئل ٹائم انفرنس اینڈ پوائنٹ کو طلب کرنے کے لیے درج ذیل ازگر کوڈ کا استعمال کریں:
آؤٹ پٹ نتیجہ کو بطور دکھاتا ہے۔ false
، جس سے یہ ظاہر ہوتا ہے کہ نمونہ کی خصوصیت کا ڈیٹا فراڈ نہیں ہے۔
صاف کرو
اس بات کو یقینی بنانے کے لیے کہ اس ٹیوٹوریل کو مکمل کرنے کے بعد آپ کو کوئی چارجز نہ لگیں، سیج میکر ڈیٹا رینگلر ایپلیکیشن کو بند کریں۔ اور نوٹ بک مثال بند کریں اندازہ لگانے کے لیے استعمال کیا جاتا ہے۔ آپ کو بھی چاہئے تخمینہ اختتامی نقطہ کو حذف کریں۔ آپ نے اضافی چارجز کو روکنے کے لیے SageMaker Autopilot کا استعمال کرتے ہوئے تخلیق کیا۔
نتیجہ
اس پوسٹ میں، ہم نے اس عمل میں کوئی بھی درمیانی کاپیاں بنائے بغیر اپنے ڈیٹا کو Snowflake سے براہ راست لانے کا طریقہ دکھایا ہے۔ آپ Snowflake سے براہ راست SageMaker Data Wrangler پر اپنا مکمل ڈیٹا سیٹ نمونہ یا لوڈ کر سکتے ہیں۔ اس کے بعد آپ ڈیٹا کو دریافت کر سکتے ہیں، ڈیٹا کو صاف کر سکتے ہیں، اور SageMaker Data Wrangler کے بصری انٹرفیس کا استعمال کرتے ہوئے فیچرنگ انجینئرنگ کر سکتے ہیں۔
ہم نے اس بات پر بھی روشنی ڈالی کہ آپ کس طرح آسانی سے سیج میکر ڈیٹا رینگلر یوزر انٹرفیس سے سیج میکر آٹو پائلٹ کے ساتھ ماڈل کو آسانی سے تربیت اور ٹیون کر سکتے ہیں۔ سیج میکر ڈیٹا رینگلر اور سیج میکر آٹو پائلٹ انٹیگریشن کے ساتھ، ہم فیچر انجینئرنگ مکمل کرنے کے بعد بغیر کوئی کوڈ لکھے تیزی سے ایک ماڈل بنا سکتے ہیں۔ پھر ہم نے ریئل ٹائم اینڈ پوائنٹ کا استعمال کرتے ہوئے انفرنسز چلانے کے لیے SageMaker Autopilot کے بہترین ماڈل کا حوالہ دیا۔
SageMaker کا استعمال کرتے ہوئے اپنے ڈیٹا کے ساتھ آسانی سے ML ماڈل بنانے کے لیے SageMaker Data Wrangler کے ساتھ نئے Snowflake براہ راست انضمام کو آج ہی آزمائیں۔
مصنفین کے بارے میں
ہری ہرن سریش AWS میں ایک سینئر سولیوشن آرکیٹیکٹ ہے۔ وہ ڈیٹا بیس، مشین لرننگ، اور اختراعی حل ڈیزائن کرنے کا شوق رکھتا ہے۔ AWS میں شامل ہونے سے پہلے، ہری ہرن ایک پروڈکٹ آرکیٹیکٹ، کور بینکنگ کے نفاذ کے ماہر، اور ڈویلپر تھے، اور انہوں نے BFSI تنظیموں کے ساتھ 11 سال سے زیادہ کام کیا۔ ٹیکنالوجی سے باہر، وہ پیراگلائیڈنگ اور سائیکلنگ سے لطف اندوز ہوتا ہے۔
اپراجیتھن ویدیا ناتھن AWS میں پرنسپل انٹرپرائز سلوشنز آرکیٹیکٹ ہیں۔ وہ AWS کلاؤڈ پر انٹرپرائز صارفین کی نقل مکانی اور اپنے کام کے بوجھ کو جدید بنانے میں مدد کرتا ہے۔ وہ ایک کلاؤڈ آرکیٹیکٹ ہے جس کے پاس انٹرپرائز، بڑے پیمانے پر اور تقسیم شدہ سافٹ ویئر سسٹمز کو ڈیزائن اور تیار کرنے کا 23+ سال کا تجربہ ہے۔ وہ ڈیٹا اور فیچر انجینئرنگ ڈومین پر توجہ کے ساتھ مشین لرننگ اور ڈیٹا اینالیٹکس میں مہارت رکھتا ہے۔ وہ میراتھن رنر کا شوقین ہے اور اس کے مشاغل میں پیدل سفر، بائیک چلانا اور اپنی بیوی اور دو لڑکوں کے ساتھ وقت گزارنا شامل ہے۔
ٹم گانا AWS SageMaker میں سافٹ ویئر ڈویلپمنٹ انجینئر ہے، سافٹ ویئر ڈویلپر، کنسلٹنٹ اور ٹیک لیڈر کے طور پر 10+ سال کے تجربے کے ساتھ اس نے قابل توسیع اور قابل اعتماد مصنوعات فراہم کرنے اور پیچیدہ مسائل کو حل کرنے کی صلاحیت کا مظاہرہ کیا ہے۔ اپنے فارغ وقت میں، وہ فطرت، بیرونی دوڑ، پیدل سفر وغیرہ سے لطف اندوز ہوتا ہے۔
Bosco Albuquerque AWS میں ایک سینئر پارٹنر سولیوشن آرکیٹیکٹ ہے اور اسے انٹرپرائز ڈیٹابیس وینڈرز اور کلاؤڈ پرووائیڈرز کے ڈیٹا بیس اور اینالیٹکس پروڈکٹس کے ساتھ کام کرنے کا 20 سال سے زیادہ کا تجربہ ہے۔ اس نے بڑی ٹیکنالوجی کمپنیوں کو ڈیٹا اینالیٹکس سلوشنز ڈیزائن کرنے میں مدد کی ہے اور ڈیٹا اینالیٹکس پلیٹ فارمز اور ڈیٹا پروڈکٹس کو ڈیزائن اور لاگو کرنے میں انجینئرنگ ٹیموں کی قیادت کی ہے۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ آٹوموٹو / ای وی، کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- بلاک آفسیٹس۔ ماحولیاتی آفسیٹ ملکیت کو جدید بنانا۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://aws.amazon.com/blogs/machine-learning/accelerate-time-to-business-insights-with-the-amazon-sagemaker-data-wrangler-direct-connection-to-snowflake/
- : ہے
- : ہے
- : نہیں
- $UP
- 1
- 10
- 100
- 11
- 12
- 14
- 15٪
- 20
- 20 سال
- 2013
- 27
- 30
- 40
- 500
- 7
- 9
- a
- کی صلاحیت
- ہمارے بارے میں
- رفتار کو تیز تر
- تک رسائی حاصل
- اکاؤنٹ
- ایڈیشنل
- منتظمین
- اعلی درجے کی
- کے بعد
- پھر
- AI / ML
- تمام
- کی اجازت
- بھی
- اگرچہ
- ایمیزون
- ایمیزون سیج میکر
- ایمیزون سیج میکر ڈیٹا رینگلر
- ایمیزون ویب سروسز
- رقم
- an
- تجزیہ
- تجزیاتی
- اور
- ایک اور
- کوئی بھی
- اپاچی
- اے پی آئی
- اطلاقی
- کا اطلاق کریں
- کیا
- AS
- خواہشمند
- At
- توجہ
- کی توثیق
- خود کار طریقے سے
- آٹومیٹڈ
- خود کار طریقے سے
- دستیاب
- AWS
- بینکنگ
- کی بنیاد پر
- بنیادی
- BE
- کیونکہ
- اس سے پہلے
- نیچے
- BEST
- بی ایف ایس آئی
- جسم
- دونوں
- لانے
- تعمیر
- عمارت
- تعمیر میں
- کاروبار
- لیکن
- by
- کر سکتے ہیں
- صلاحیتوں
- قبضہ
- کارڈ
- کیس
- مقدمات
- حروف
- الزام عائد کیا
- بوجھ
- چیک کریں
- میں سے انتخاب کریں
- طبقے
- درجہ بندی
- درجہ بندی
- درجہ بندی کرنا۔
- کلائنٹ
- بادل
- کوڈ
- کالم
- کالم
- کے مجموعے
- کمپنیاں
- مکمل
- مکمل
- مکمل کرتا ہے
- مکمل کرنا
- پیچیدہ
- جزو
- تشکیل شدہ
- رابطہ قائم کریں
- کنکشن
- کنسول
- کنسلٹنٹ
- جاری
- کنٹرول
- تبدیل
- کور
- کور بینکنگ
- تخلیق
- بنائی
- پیدا
- تخلیق
- اسناد
- کریڈٹ
- کریڈٹ کارڈ
- گاہک
- گاہک کا تجربہ
- گاہکوں
- اعداد و شمار
- ڈیٹا تک رسائی
- ڈیٹا تجزیہ
- ڈیٹا تجزیات
- ڈیٹا کی تیاری
- ڈیٹا سائنسدان
- ڈیٹا بیس
- ڈیٹا بیس
- فیصلہ کرنا
- پہلے سے طے شدہ
- غلطی
- نجات
- مظاہرہ
- demonstrated,en
- تعیناتی
- تعینات
- تعیناتی
- تفصیل
- ڈیزائن
- ڈیزائن
- ڈیزائننگ
- تفصیلات
- اس بات کا تعین
- ڈیولپر
- ترقی
- ترقی
- طول و عرض
- براہ راست
- براہ راست
- تقسیم کئے
- ڈومین
- نہیں
- نیچے
- ڈاؤن لوڈ، اتارنا
- آسانی سے
- یا تو
- اختتام پوائنٹ
- انجینئر
- انجنیئرنگ
- درج
- انٹرپرائز
- وغیرہ
- یورپی
- تشخیص
- اس کے علاوہ
- موجود ہے
- تجربہ
- تجربہ
- تجربات
- کی تلاش
- تحقیقی ڈیٹا کا تجزیہ
- تلاش
- برآمد
- دور
- نمایاں کریں
- خصوصیات
- خاصیت
- فائل
- مالی
- ختم
- پہلا
- فلوٹ
- توجہ مرکوز
- کے بعد
- کے لئے
- فارمیٹ
- دھوکہ دہی
- سے
- مکمل
- مزید
- پیدا
- حاصل
- فراہم کرتا ہے
- عطا
- گراف
- ہے
- he
- مدد
- مدد
- سب سے زیادہ
- روشنی ڈالی گئی
- ان
- کس طرح
- کیسے
- HTML
- HTTP
- HTTPS
- آئکن
- شناخت
- شناختی
- if
- عدم توازن
- نفاذ
- پر عمل درآمد
- درآمد
- اہمیت
- درآمد
- درآمدات
- کو بہتر بنانے کے
- in
- شامل
- شامل ہیں
- اضافہ
- انفرادی
- معلومات
- ابتدائی
- جدید
- بصیرت
- انسٹال
- ضم
- انضمام
- انٹرفیس
- اندرونی
- میں
- مسائل
- IT
- اشیاء
- ایوب
- نوکریاں
- شمولیت
- سفر
- فوٹو
- JSON
- بڑے
- بڑے پیمانے پر
- شروع
- شروع
- رہنما
- سیکھنے
- چھوڑ دو
- قیادت
- چھوڑ دیا
- جائز
- دو
- لائبریری
- LIMIT
- لسٹ
- لوڈ
- بوجھ
- مقامی
- محل وقوع
- سب سے کم
- مشین
- مشین لرننگ
- بنا
- برقرار رکھنے کے
- بنا
- انتظام
- میراتھن
- کے ملاپ
- مئی..
- میکانزم
- طریقہ
- میٹرک۔
- پیمائش کا معیار
- منتقلی
- منٹ
- لاپتہ
- ML
- ماڈل
- ماڈل
- جدید خطوط پر استوار
- طریقوں
- کی نگرانی
- زیادہ
- نام
- نامزد
- فطرت، قدرت
- سمت شناسی
- ضروریات
- نئی
- اگلے
- نوٹ بک
- اب
- تعداد
- اوہ
- اعتراض
- مقصد
- of
- on
- جاری
- کی اصلاح کریں
- اختیار
- or
- حکم
- تنظیمیں
- اصل
- OS
- دیگر
- ہمارے
- باہر
- پیداوار
- باہر
- پر
- مجموعی جائزہ
- صفحہ
- پین
- پارٹنر
- منظور
- جذباتی
- پاس ورڈ
- راستہ
- انجام دیں
- کارکردگی کا مظاہرہ
- اجازتیں
- پلیٹ فارم
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- علاوہ
- پوائنٹ
- مقبول
- پوسٹ
- پیشن گوئی
- پیش گوئی
- پیشن گوئی
- تیاری
- تیار
- ضروریات
- کی روک تھام
- پچھلا
- پرنسپل
- پرنٹ
- پہلے
- مسئلہ
- مسائل
- عمل
- پروسیسنگ
- مصنوعات
- پیداوری
- حاصل
- پیش رفت
- فراہم
- فراہم کنندہ
- فراہم کرنے والے
- عوامی
- خرید
- مقاصد
- ڈال
- ازگر
- معیار
- سوالات
- فوری
- جلدی سے
- اصل وقت
- کو کم
- کم
- کمی
- قابل اعتماد
- ہٹا
- کی جگہ
- رپورٹ
- اطلاع دی
- رپورٹیں
- درخواست
- ضرورت
- جواب
- نتیجہ
- نتائج کی نمائش
- کا جائزہ لینے کے
- سوار
- کردار
- رن
- دوسرے نمبر پر
- چل رہا ہے
- s
- sagemaker
- محفوظ کریں
- توسیع پذیر
- سائنسدان
- سائنسدانوں
- بغیر کسی رکاوٹ کے
- سیکشن
- بھیجنے
- سینئر
- ستمبر
- سروسز
- مقرر
- ترتیبات
- سیٹ اپ
- مشترکہ
- ہونا چاہئے
- دکھائیں
- شوز
- سائن ان کریں
- سادہ
- آسان
- ایک
- So
- سافٹ ویئر کی
- سوفٹ ویئر کی نشوونما
- حل
- حل
- حل
- نغمہ
- ماخذ
- چنگاری
- ماہر
- مہارت دیتا ہے
- خاص طور پر
- تیزی
- خرچ کرنا۔
- اسٹیج
- شروع ہوتا ہے
- مرحلہ
- مراحل
- ابھی تک
- ذخیرہ
- ذخیرہ
- سخت
- سلک
- سٹوڈیو
- جمع
- کامیاب
- کامیابی کے ساتھ
- اس طرح
- حمایت
- تائید
- کی حمایت کرتا ہے
- سسٹمز
- ٹیبل
- ہدف
- کاموں
- ٹیموں
- ٹیک
- ٹیکنالوجی
- ٹیکنالوجی کمپنیوں
- ٹیسٹ
- کہ
- ۔
- گراف
- ان
- تو
- وہاں.
- وہ
- اس
- ان
- کے ذریعے
- وقت
- کرنے کے لئے
- آج
- ٹرین
- تربیت یافتہ
- ٹریننگ
- ٹرانزیکشن
- معاملات
- تبدیلی
- تبادلوں
- سچ
- سبق
- دو
- قسم
- ui
- سمجھ
- اپ ڈیٹ کریں
- us
- استعمالی
- استعمال کی شرائط
- استعمال کیا جاتا ہے
- رکن کا
- صارف مواجہ
- صارفین
- استعمال
- کا استعمال کرتے ہوئے
- v1
- تصدیق کریں۔
- قیمت
- اقدار
- دکانداروں
- اس بات کی تصدیق
- لنک
- مجازی
- کی نمائش
- انتظار
- چاہتے ہیں
- تھا
- we
- ویب
- ویب خدمات
- مہینے
- تھے
- چاہے
- جس
- جبکہ
- ڈبلیو
- بیوی
- ساتھ
- کے اندر
- بغیر
- کام
- کام کیا
- کام کا بہاؤ
- کام کے بہاؤ
- کام کر
- تحریری طور پر
- سال
- تم
- اور
- زیفیرنیٹ