ایمیزون سیج میکر جمپ سٹارٹ سلوشنز میں مشین لرننگ کے ذریعے کاروباری مسائل کو آخر تک حل کریں۔

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

ایمیزون سیج میکر جمپ اسٹارٹ مشین لرننگ (ML) کے ساتھ شروع کرنے میں آپ کی مدد کرنے کے لیے مسائل کی وسیع اقسام کے لیے پہلے سے تربیت یافتہ، اوپن سورس ماڈل فراہم کرتا ہے۔ جمپ سٹارٹ حل ٹیمپلیٹس بھی فراہم کرتا ہے جو عام استعمال کے معاملات کے لیے بنیادی ڈھانچہ ترتیب دیتے ہیں، اور ایم ایل کے لیے قابل عمل مثال نوٹ بک ایمیزون سیج میکر.

ایک کاروباری صارف کے طور پر، آپ جمپ سٹارٹ حل کے ساتھ درج ذیل کام کر سکتے ہیں:

حل تلاش کریں اور اندازہ لگائیں کہ آپ کی کاروباری ضروریات کے لیے کون سے اچھے میچ ہیں۔
ایک ہی کلک میں حل شروع کریں۔ ایمیزون سیج میکر اسٹوڈیو. یہ ایک شروع کرتا ہے AWS کلاؤڈ فارمیشن مطلوبہ وسائل بنانے کے لیے ٹیمپلیٹ۔
بنیادی نوٹ بک اور ماڈل اثاثوں تک رسائی کے ساتھ اپنی ضروریات کو پورا کرنے کے حل میں ترمیم کریں۔
ایک بار مکمل ہونے کے بعد حاصل کردہ وسائل کو حذف کریں۔

یہ پوسٹ ان پانچ ایم ایل حلوں پر مرکوز ہے جو حال ہی میں پانچ مختلف کاروباری چیلنجوں سے نمٹنے کے لیے شامل کیے گئے ہیں۔ اس تحریر کے مطابق، جمپ اسٹارٹ 23 کاروباری حل پیش کرتا ہے جو مالیاتی لین دین میں دھوکہ دہی کا پتہ لگانے سے لے کر لکھاوٹ کو پہچاننے تک مختلف ہیں۔ جمپ اسٹارٹ کے ذریعے پیش کیے جانے والے حلوں کی تعداد مستقل بنیادوں پر بڑھ جاتی ہے کیونکہ اس میں مزید حل شامل کیے جاتے ہیں۔

حل جائزہ

پانچ نئے حل درج ذیل ہیں:

قیمت کی اصلاح - آپ کے کاروباری مقصد کو حاصل کرنے کے لیے آپ کی مصنوعات یا سروس کی قیمت مقرر کرنے کے لیے بہترین فیصلے کرنے میں مدد کرنے کے لیے حسب ضرورت ایم ایل ماڈلز پیش کرتا ہے، جیسے کہ زیادہ سے زیادہ آمدنی، منافع، یا دیگر حسب ضرورت میٹرکس۔
پرندوں کی نسل کی پیشن گوئی - دکھاتا ہے کہ آپ کس طرح کسی آبجیکٹ کا پتہ لگانے والے ماڈل کو تربیت اور ٹھیک کر سکتے ہیں۔ یہ ٹریننگ امیج کو بڑھانے کے ذریعے ماڈل ٹیوننگ کا مظاہرہ کرتا ہے، اور درستگی کی بہتریوں کو چارٹ کرتا ہے جو تربیتی کام کی تکرار (دوروں) میں ہوتی ہے۔
پھیپھڑوں کے کینسر کی بقا کی پیشن گوئی - یہ دکھاتا ہے کہ آپ کس طرح 2D اور 3D ریڈیومک خصوصیات اور مریض کی آبادیات کو ML الگورتھم میں فیڈ کر سکتے ہیں تاکہ مریض کے پھیپھڑوں کے کینسر سے بچنے کے امکانات کا اندازہ لگایا جا سکے۔ اس پیشین گوئی کے نتائج فراہم کنندگان کو مناسب فعال اقدامات کرنے میں مدد کر سکتے ہیں۔
مالی ادائیگی کی درجہ بندی - لین دین کی معلومات کی بنیاد پر مالی لین دین کی درجہ بندی کرنے کے لیے ML ماڈل کو تربیت دینے اور تعینات کرنے کا طریقہ دکھاتا ہے۔ آپ اس حل کو فراڈ کا پتہ لگانے، پرسنلائزیشن، یا بے ضابطگی کا پتہ لگانے میں ایک درمیانی قدم کے طور پر بھی استعمال کر سکتے ہیں۔
موبائل فون صارفین کے لیے پیش گوئی موبائل کال ٹرانزیکشن ڈیٹاسیٹ کا استعمال کرتے ہوئے تیزی سے چرن پریڈیکشن ماڈل تیار کرنے کا طریقہ دکھاتا ہے۔ یہ ان صارفین کے لیے ایک سادہ سی مثال ہے جو ML میں نئے ہیں۔

شرائط

ان حلوں کو استعمال کرنے کے لیے، اس بات کو یقینی بنائیں کہ آپ کو اسٹوڈیو تک رسائی ایک ایسے ایگزیکیوشن رول کے ساتھ ہے جو آپ کو SageMaker کی فعالیت کو چلانے کی اجازت دیتا ہے۔ اسٹوڈیو میں اپنے صارف کے کردار کے لیے، یقینی بنائیں کہ سیج میکر پروجیکٹس اور جمپ اسٹارٹ آپشن آن ہے.

مندرجہ ذیل حصوں میں، ہم پانچ نئے حلوں میں سے ہر ایک کو دیکھتے ہیں اور اس پر تفصیل سے بات کرتے ہیں کہ یہ کیسے کام کرتا ہے، اس کے ساتھ ساتھ کچھ سفارشات کے ساتھ کہ آپ اسے اپنی کاروباری ضروریات کے لیے کیسے استعمال کر سکتے ہیں۔

قیمت کی اصلاح

کاروبار بہترین نتائج حاصل کرنے کے لیے مختلف لیور استعمال کرنا پسند کرتے ہیں۔ مثال کے طور پر، کسی پروڈکٹ یا سروس کی قیمت ایک لیور ہے جسے کاروبار کنٹرول کر سکتا ہے۔ سوال یہ ہے کہ کس طرح فیصلہ کیا جائے کہ کسی پروڈکٹ یا سروس کو کس قیمت پر مقرر کیا جائے، تاکہ منافع یا آمدنی جیسے کاروباری مقصد کو زیادہ سے زیادہ حاصل کیا جا سکے۔

یہ حل حسب ضرورت ایم ایل ماڈلز فراہم کرتا ہے تاکہ آپ کو اپنے مقصد کو حاصل کرنے کے لیے آپ کے پروڈکٹ یا سروس کی قیمت مقرر کرنے کے لیے بہترین فیصلے کرنے میں مدد ملے، جیسے کہ زیادہ سے زیادہ آمدنی، منافع، یا دیگر حسب ضرورت میٹرکس۔ یہ حل تاریخی اعداد و شمار سے قیمت کے حجم کے تعلقات کو جاننے کے لیے ML اور causal inference اپروچز کا استعمال کرتا ہے، اور حسب ضرورت مقصدی میٹرکس کو بہتر بنانے کے لیے حقیقی وقت میں قیمت کی متحرک سفارشات کرنے کے قابل ہے۔

مندرجہ ذیل اسکرین شاٹ نمونہ ان پٹ ڈیٹا کو دکھاتا ہے۔

حل میں تین حصے شامل ہیں:

قیمت کی لچک کا تخمینہ - اس کا تخمینہ ایک ڈبل ایم ایل الگورتھم کے ذریعے وجہ سے لگایا جاتا ہے۔
حجم کی پیشن گوئی - اس کی پیشن گوئی نبی الگورتھم کا استعمال کرتے ہوئے کی گئی ہے۔
قیمت کی اصلاح - یہ مختلف قیمتوں کے منظرناموں کے ذریعے ایک what-if تخروپن کے ذریعے حاصل کیا جاتا ہے۔

حل آمدنی کو زیادہ سے زیادہ کرنے کے لیے اگلے دن کے لیے تجویز کردہ قیمت فراہم کرتا ہے۔ اس کے علاوہ، آؤٹ پٹس میں تخمینہ قیمت کی لچک شامل ہے، جو کہ ایک قدر ہے جو حجم پر قیمت کے اثر کو ظاہر کرتی ہے، اور ایک پیشن گوئی ماڈل، جو اگلے دن کے حجم کی پیشن گوئی کرنے کے قابل ہے۔ مندرجہ ذیل چارٹ سے پتہ چلتا ہے کہ کس طرح ایک causal ماڈل جس میں حسابی قیمت کی لچک کو شامل کیا گیا ہے، ایک پیشین گوئی کرنے والے ماڈل کے مقابلے میں کس طرح بہتر کارکردگی کا مظاہرہ کرتا ہے (رویے کی قیمت سے بڑے انحراف کے ساتھ) جو کہ ٹائم سیریز ڈیٹا کا استعمال کرتے ہوئے حجم کی پیشن گوئی کے لیے نبی کا استعمال کرتا ہے۔

آپ اس حل کو اپنے کاروبار میں درج ذیل استعمال کے معاملات کے لیے لاگو کر سکتے ہیں:

ریٹیل اسٹور کے لیے سامان کی بہترین قیمت کا تعین کریں۔
کسٹمر کی خریداریوں پر ڈسکاؤنٹ کوپن کے اثر کا اندازہ لگائیں۔
کسی بھی کاروبار میں مختلف ترغیبی طریقوں کے اثر کی پیش گوئی کریں۔

پرندوں کی پرجاتیوں کی پیشن گوئی

آج کاروبار کے لیے کئی کمپیوٹر وژن (CV) ایپلی کیشنز موجود ہیں۔ ان ایپلی کیشنز میں سے ایک آبجیکٹ کا پتہ لگانا ہے، جہاں ایک ML الگورتھم کسی تصویر میں کسی چیز کے ارد گرد ایک باؤنڈنگ باکس کھینچ کر اس کی جگہ کا پتہ لگاتا ہے، اور اس چیز کی قسم کی شناخت کرتا ہے۔ آبجیکٹ کا پتہ لگانے والے ماڈل کو لاگو کرنے کا طریقہ سیکھنا اور اسے ٹھیک ٹیون کرنا ایک ایسی تنظیم کے لیے بہت اہمیت کا حامل ہو سکتا ہے جس کی CV کی ضرورت ہو۔

یہ حل ایک مثال فراہم کرتا ہے کہ سیج میکر الگورتھم کو تصاویر فراہم کرتے وقت باؤنڈنگ باکس کی وضاحتوں کا ترجمہ کیسے کیا جائے۔ یہ حل یہ بھی ظاہر کرتا ہے کہ افقی طور پر پلٹ جانے والی تربیتی تصاویر کو شامل کرکے آبجیکٹ کا پتہ لگانے والے ماڈل کو کیسے بہتر بنایا جائے۔

جب بڑی تعداد میں کلاسز (200 پرندوں کی انواع) ہوں تو آبجیکٹ کا پتہ لگانے کے چیلنجوں کے ساتھ تجربہ کرنے کے لیے ایک نوٹ بک فراہم کی جاتی ہے۔ نوٹ بک یہ بھی دکھاتی ہے کہ تربیتی کام کے دوروں میں ہونے والی درستگی کی بہتری کو کیسے چارٹ کیا جائے۔ مندرجہ ذیل تصویر پرندوں کے ڈیٹاسیٹ سے مثال کی تصاویر دکھاتی ہے۔

یہ حل پانچ مراحل پر مشتمل ہے:

ڈیٹا تیار کریں، بشمول ڈاؤن لوڈ اور RecordIO فائل کی نسل.
آبجیکٹ کا پتہ لگانے کا ماڈل بنائیں اور تربیت دیں۔
ایک اختتامی نقطہ تعینات کریں اور ماڈل کی کارکردگی کا جائزہ لیں۔
توسیع شدہ ڈیٹاسیٹ کے ساتھ دوبارہ آبجیکٹ کا پتہ لگانے کا ماڈل بنائیں اور تربیت دیں۔
ایک اختتامی نقطہ تعینات کریں اور توسیع شدہ ماڈل کی کارکردگی کا جائزہ لیں۔

آپ کو مندرجہ ذیل آؤٹ پٹ کے طور پر ملتا ہے:

آپ کی ٹیسٹ امیج کے خلاف بانڈنگ بکس کے ساتھ آبجیکٹ کا پتہ لگانے کے نتائج
ایک تربیت یافتہ آبجیکٹ کا پتہ لگانے کا ماڈل
ایک تربیت یافتہ آبجیکٹ کا پتہ لگانے والا ماڈل جس میں ایک اضافی توسیع شدہ (پلٹایا گیا) ڈیٹاسیٹ ہے۔
ہر ایک ماڈل کے ساتھ دو الگ الگ اینڈ پوائنٹس تعینات ہیں۔

مندرجہ ذیل چارٹ تربیت کے دوران ماڈل کی تکرار (ایپوچز) کے خلاف ماڈل میں بہتری کو ظاہر کرتا ہے۔

درج ذیل مثالیں دو ٹیسٹ امیجز سے آؤٹ پٹ ہیں۔

آپ اس حل کو اپنے کاروبار میں درج ذیل استعمال کے معاملات کے لیے لاگو کر سکتے ہیں:

پیکیجنگ انڈسٹری میں کنویئر بیلٹ پر اشیاء کا پتہ لگائیں۔
پیزا پر ٹاپنگز کا پتہ لگائیں۔
سپلائی چین آپریشنل ایپلی کیشنز کو لاگو کریں جن میں آبجیکٹ کا پتہ لگانا شامل ہو۔

پھیپھڑوں کے کینسر کی بقا کی پیش گوئی

COVID-19 نے پھیپھڑوں سے متعلق طبی چیلنجوں پر بہت زیادہ توجہ دی۔ اس نے ہسپتالوں، ڈاکٹروں، نرسوں اور ریڈیولوجسٹ پر بھی بہت دباؤ ڈالا ہے۔ اس امکان کا تصور کریں جہاں آپ طبی پریکٹیشنرز کی مدد اور ان کے کام کو تیز کرنے میں مدد کرنے کے لیے ML کو ایک طاقتور ٹول کے طور پر استعمال کر سکتے ہیں۔ اس حل میں، ہم یہ دکھاتے ہیں کہ کس طرح 2D اور 3D ریڈیومک خصوصیات اور مریض کی آبادیات کو ایک ML الگورتھم کو فیڈ کیا جا سکتا ہے تاکہ مریض کے پھیپھڑوں کے کینسر سے بچنے کے امکانات کا اندازہ لگایا جا سکے۔ اس پیشین گوئی کے نتائج فراہم کنندگان کو مناسب فعال اقدامات کرنے میں مدد کر سکتے ہیں۔

یہ حل یہ ظاہر کرتا ہے کہ غیر چھوٹے سیل پھیپھڑوں کے کینسر (این ایس سی ایل سی) ریڈیوجینومکس ڈیٹاسیٹ کے لیے کس طرح توسیع پذیر ایم ایل پائپ لائن بنائی جائے، جس میں آر این اے سیکوینسنگ ڈیٹا، کلینیکل ڈیٹا (ای ایچ آر ڈیٹا کا عکاس) اور طبی امیجز شامل ہیں۔ مشین ماڈل بنانے کے لیے متعدد قسم کے ڈیٹا کا استعمال کرنا کہا جاتا ہے۔ ملٹی ماڈل ایم ایل یہ حل غیر چھوٹے سیل پھیپھڑوں کے کینسر کے ساتھ تشخیص شدہ مریضوں کے بقا کے نتائج کی پیش گوئی کرتا ہے۔

مندرجہ ذیل تصویر غیر چھوٹے سیل پھیپھڑوں کے کینسر (NSCLC) Radiogenomics ڈیٹا سیٹ سے ان پٹ ڈیٹا کی ایک مثال دکھاتی ہے۔

حل کے حصے کے طور پر، کل آر این اے کو ٹیومر ٹشو سے نکالا گیا اور آر این اے کی ترتیب والی ٹیکنالوجی کے ساتھ تجزیہ کیا گیا۔ اگرچہ اصل اعداد و شمار میں 22,000 سے زیادہ جین موجود ہیں، لیکن ہم 21 انتہائی مشترکہ جین کلسٹرز (میٹاجینز) میں سے 10 جین رکھتے ہیں جن کی شناخت کی گئی تھی، جن کی عوامی طور پر دستیاب جین ایکسپریشن کوہورٹس میں توثیق کی گئی تھی، اور تشخیص کے ساتھ منسلک تھے۔

کلینیکل ریکارڈز CSV فارمیٹ میں محفوظ کیے جاتے ہیں۔ ہر قطار ایک مریض سے مطابقت رکھتی ہے، اور کالم مریضوں کے بارے میں معلومات پر مشتمل ہوتے ہیں، بشمول ڈیموگرافکس، ٹیومر کا مرحلہ، اور بقا کی حیثیت۔

جینومک ڈیٹا کے لیے، ہم 21 انتہائی مشترکہ جین کلسٹرز (میٹاجینز) میں سے 10 جین رکھتے ہیں جن کی شناخت کی گئی تھی، جن کی توثیق عوامی طور پر دستیاب جین ایکسپریشن کوہورٹس میں کی گئی تھی، اور تشخیص کے ساتھ منسلک تھے۔

میڈیکل امیجنگ ڈیٹا کے لیے، ہم مریض کی سطح کی 3D ریڈیومک خصوصیات بناتے ہیں جو CT اسکینوں میں مشاہدہ کیے گئے ٹیومر کے سائز، شکل اور بصری خصوصیات کی وضاحت کرتے ہیں۔ ہر مریض کے مطالعہ کے لیے، درج ذیل اقدامات کیے جاتے ہیں:

CT اسکین اور ٹیومر سیگمنٹیشن دونوں کے لیے 2D DICOM سلائس فائلوں کو پڑھیں، انہیں 3D والیوم میں جوڑیں، حجم کو NIfTI فارمیٹ میں محفوظ کریں۔
سی ٹی والیوم اور ٹیومر سیگمنٹیشن کو سیدھ میں کریں تاکہ ہم ٹیومر کے اندر کی گنتی پر توجہ مرکوز کر سکیں۔
پیراڈیومکس لائبریری کا استعمال کرتے ہوئے ٹیومر کے علاقے کی وضاحت کرنے والے ریڈیومک خصوصیات کا حساب لگائیں۔
آٹھ کلاسوں کی 120 ریڈیومک خصوصیات نکالیں، جیسے کہ ٹیومر والے دلچسپی کے علاقے میں تقسیم کی شماریاتی نمائندگی اور شدت کی ہم آہنگی، اور شکل پر مبنی پیمائشیں جو ٹیومر کو مورفولوجیکل طور پر بیان کرتی ہیں۔

ماڈل ٹریننگ کے لیے مریض کا ملٹی ماڈل ویو بنانے کے لیے، ہم تین طریقوں سے فیچر ویکٹرز میں شامل ہوتے ہیں۔ پھر ہم ڈیٹا پر کارروائی کرتے ہیں۔ سب سے پہلے، ہم فیچر اسکیلنگ کا استعمال کرتے ہوئے آزاد خصوصیات کی حد کو معمول پر لاتے ہیں۔ اس کے بعد ہم جہت کو کم کرنے اور اعداد و شمار میں 95 فیصد تغیرات کا باعث بننے والی انتہائی امتیازی خصوصیات کی نشاندہی کرنے کے لیے خصوصیات پر پرنسپل جزو تجزیہ (PCA) کرتے ہیں۔

اس کے نتیجے میں 215 خصوصیات سے 45 پرنسپل اجزاء تک جہتی کمی واقع ہوتی ہے، جو زیر نگرانی سیکھنے والے کے لیے خصوصیات کی تشکیل کرتی ہے۔

یہ حل ایک ML ماڈل تیار کرتا ہے جو NSCLC مریضوں کی بقا کی حیثیت (مردہ یا زندہ) کی امکان کی شکل میں پیش گوئی کرتا ہے۔ ماڈل اور پیشین گوئی کے علاوہ، ہم ماڈل کی وضاحت کے لیے رپورٹیں بھی تیار کرتے ہیں۔ میڈیکل امیجنگ پائپ لائن 3D پھیپھڑوں کے CT والیوم اور ٹیومر کے حصے بصری مقاصد کے لیے تیار کرتی ہے۔

آپ اس حل کو ہیلتھ کیئر اور لائف سائنسز کے استعمال کے کیسز پر لاگو کر سکتے ہیں۔

مالی ادائیگی کی درجہ بندی

کسی کاروبار یا صارف کے تمام مالی لین دین کو لے کر انہیں مختلف زمروں میں منظم کرنا کافی مددگار ثابت ہو سکتا ہے۔ اس سے صارف کو یہ جاننے میں مدد مل سکتی ہے کہ انہوں نے کس زمرے میں کتنا خرچ کیا ہے، اور یہ انتباہات کو بھی بڑھا سکتا ہے جب کسی مخصوص زمرے میں لین دین یا اخراجات غیر متوقع طور پر اوپر یا نیچے جاتے ہیں۔

یہ حل یہ ظاہر کرتا ہے کہ لین دین کی معلومات کی بنیاد پر مالی لین دین کی درجہ بندی کرنے کے لیے ایم ایل ماڈل کو کس طرح تربیت اور تعینات کیا جائے۔ بہت سے بینک اپنے اختتامی صارفین کو ان کے خرچ کرنے کی عادات کا جائزہ دینے کے لیے اسے بطور خدمت فراہم کرتے ہیں۔ آپ اس حل کو فراڈ کا پتہ لگانے، پرسنلائزیشن، یا بے ضابطگی کا پتہ لگانے میں ایک درمیانی قدم کے طور پر بھی استعمال کر سکتے ہیں۔ ہم SageMaker کا استعمال ایک XGBoost ماڈل کو تربیت دینے اور مطلوبہ بنیادی ڈھانچے کے ساتھ تعینات کرنے کے لیے کرتے ہیں۔

مصنوعی ڈیٹاسیٹ جسے ہم اس حل کا مظاہرہ کرنا چاہتے ہیں اس میں درج ذیل خصوصیات ہیں:

ٹرانزیکشن_کیٹیگری - مندرجہ ذیل 19 اختیارات میں سے لین دین کا زمرہ: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Home، اور Pension and insurances.
ریسیور_آئی ڈی - وصول کرنے والی پارٹی کے لیے ایک شناخت کنندہ۔ شناخت کنندہ 16 نمبروں پر مشتمل ہے۔
بھیجنے والے کی شناخت - بھیجنے والی پارٹی کے لیے ایک شناخت کنندہ۔ شناخت کنندہ 16 نمبروں پر مشتمل ہے۔
رقم - وہ رقم جو منتقل کی جاتی ہے۔
ٹائمسٹیمپ - YYYY-MM-DD HH:MM:SS فارمیٹ میں لین دین کا ٹائم اسٹیمپ۔

ڈیٹا سیٹ کے پہلے پانچ مشاہدات درج ذیل ہیں:

اس حل کے لیے، ہم XGBoost استعمال کرتے ہیں، جو گریڈینٹ بوسٹڈ ٹریز الگورتھم کا ایک مقبول اور موثر اوپن سورس نفاذ ہے۔ گریڈینٹ بوسٹنگ ایک زیر نگرانی سیکھنے کا الگورتھم ہے جو آسان اور کمزور ماڈلز کے سیٹ سے تخمینوں کے جوڑ کو ملا کر ہدف کے متغیر کی درست پیش گوئی کرنے کی کوشش کرتا ہے۔ اس کا نفاذ SageMaker بلٹ ان الگورتھم میں دستیاب ہے۔

مالی ادائیگی کی درجہ بندی کا حل چار مراحل پر مشتمل ہے:

ڈیٹا تیار کریں۔
فیچر اسٹور بنائیں۔
ایک XGBoost ماڈل بنائیں اور تربیت دیں۔
ایک اختتامی نقطہ تعینات کریں اور ماڈل کی کارکردگی کا جائزہ لیں۔

ہمیں درج ذیل آؤٹ پٹ ملتا ہے:

ہمارے مثال کے ڈیٹاسیٹ پر مبنی ایک تربیت یافتہ XGBoost ماڈل
ایک سیج میکر اینڈ پوائنٹ جو لین دین کے زمرے کی پیش گوئی کر سکتا ہے۔

اس حل کو چلانے کے بعد، آپ کو درج ذیل کی طرح درجہ بندی کی رپورٹ دیکھنا چاہیے۔

آپ کے کاروبار کے لیے ممکنہ درخواستوں میں درج ذیل شامل ہیں:

خوردہ اور سرمایہ کاری بینکنگ میں مختلف مالیاتی ایپلی کیشنز
جب کسی بھی استعمال کے معاملے میں لین دین کی درجہ بندی کرنے کی ضرورت ہو (صرف مالی نہیں)

موبائیل فون صارفین کے لیے پیشن گوئی منڈلانا

پیشن گوئی گاہک منتھن ایک بہت عام کاروباری ضرورت ہے. متعدد مطالعات سے پتہ چلتا ہے کہ موجودہ گاہک کو برقرار رکھنے کی لاگت نئے گاہک کو حاصل کرنے سے بہت کم ہے۔ چیلنج اکثر ایسے کاروباروں کی طرف سے آتا ہے جن کو یہ سمجھنے میں دشواری ہوتی ہے کہ ایک گاہک کیوں منڈلا رہا ہے، یا ایسا ماڈل بنا رہا ہے جو منتھنی کی پیشین گوئی کرتا ہے۔

اس مثال میں، وہ صارفین جو ML میں نئے ہیں تجربہ کر سکتے ہیں کہ کس طرح موبائل کال ٹرانزیکشن ڈیٹاسیٹ کا استعمال کرتے ہوئے چرن پریڈکشن ماڈل کو تیزی سے تیار کیا جا سکتا ہے۔ یہ حل سیج میکر کا استعمال کرتے ہوئے ایک XGBoost ماڈل کو تربیت دینے اور ایک کسٹمر پروفائل ڈیٹاسیٹ پر تعینات کرنے کے لیے استعمال کرتا ہے تاکہ یہ اندازہ لگایا جا سکے کہ آیا کسی صارف کے موبائل فون آپریٹر کو چھوڑنے کا امکان ہے۔

یہ حل جو ڈیٹاسیٹ استعمال کرتا ہے وہ عوامی طور پر دستیاب ہے اور اس کا تذکرہ ڈینیئل ٹی لارس کی کتاب Discovering Knowledge in Data میں کیا گیا ہے۔ اس کا انتساب مصنف نے یونیورسٹی آف کیلیفورنیا اروائن ریپوزٹری آف مشین لرننگ ڈیٹاسیٹس سے کیا ہے۔

یہ ڈیٹا سیٹ کسی نامعلوم امریکی موبائل آپریٹر کے صارف کے پروفائل کو بیان کرنے کے لیے درج ذیل 21 صفات کا استعمال کرتا ہے۔

ریاست: امریکی ریاست جس میں گاہک رہتا ہے، جس کی نشاندہی دو حرفی مخفف سے ہوتی ہے۔ مثال کے طور پر، OH یا NJ
اکاؤنٹ کی لمبائی: اس اکاؤنٹ کے فعال رہنے کے دنوں کی تعداد
ایریا کوڈ: متعلقہ گاہک کے فون نمبر کا تین ہندسوں والا ایریا کوڈ
فون: بقیہ سات ہندسوں کا فون نمبر
بین الاقوامی منصوبہ: آیا صارف کے پاس بین الاقوامی کالنگ پلان ہے: ہاں/نہیں
VMail پلان: آیا صارف کے پاس صوتی میل کی خصوصیت ہے: ہاں/نہیں
VMail پیغام: ہر ماہ صوتی میل پیغامات کی اوسط تعداد
دن کے منٹ: دن کے دوران استعمال ہونے والے کالنگ منٹوں کی کل تعداد
دن کی کالیں: دن کے دوران کی جانے والی کالوں کی کل تعداد
دن کا چارج: دن کے وقت کی کالوں کی بل کی قیمت
ایو منٹس، ایو کالز، ایو چارج: شام کے وقت کی جانے والی کالوں کے لیے بل کی قیمت
نائٹ منٹ، نائٹ کالز، نائٹ چارج: رات کے وقت کی جانے والی کالوں کے لیے بل کی قیمت
Intl Mins، Intl کالز، Intl چارج: بین الاقوامی کالوں کے لیے بل کی قیمت
CustServ کالز: کسٹمر سروس کو کی گئی کالوں کی تعداد
چرن؟: آیا گاہک نے سروس چھوڑ دی ہے: سچ/غلط

یہ حل تین مراحل پر مشتمل ہے:

ڈیٹا تیار کریں۔
ایک XGBoost ماڈل بنائیں اور تربیت دیں۔
ایک اختتامی نقطہ تعینات کریں اور ماڈل کی کارکردگی کا جائزہ لیں۔

ہمیں درج ذیل آؤٹ پٹ ملتا ہے:

ایک تربیت یافتہ XGBoost ماڈل جو ہمارے مثال کے ڈیٹاسیٹ پر مبنی ہے تاکہ صارف کے منتھن کی پیشن گوئی کی جا سکے۔
ایک سیج میکر اینڈ پوائنٹ جو صارف کے منتھن کی پیش گوئی کر سکتا ہے۔

یہ ماڈل یہ اندازہ لگانے میں مدد کرتا ہے کہ 5,000 موبائل فون صارفین میں سے کتنے اپنے موجودہ موبائل فون آپریٹر کو استعمال کرنا چھوڑ دیں گے۔

مندرجہ ذیل چارٹ ماڈل سے آؤٹ پٹ کے طور پر چرن کی ممکنہ تقسیم کو ظاہر کرتا ہے۔

آپ اسے درج ذیل استعمال کے معاملات کے لیے اپنے کاروبار پر لاگو کر سکتے ہیں:

اپنے کاروبار میں گاہک کے منڈلانے کی پیش گوئی کریں۔
درجہ بندی کریں کہ کون سے گاہک آپ کی مارکیٹنگ ای میل کھول سکتے ہیں اور کون نہیں (بائنری درجہ بندی)
اندازہ لگائیں کہ کون سے طلباء کورس سے باہر ہو سکتے ہیں۔

وسائل کو صاف کریں۔

جمپ سٹارٹ میں حل چلانے کے بعد، انتخاب کرنا یقینی بنائیں تمام وسائل کو حذف کریں۔ لہذا آپ نے اس عمل میں جو وسائل بنائے ہیں وہ حذف ہو جائیں گے اور آپ کی بلنگ روک دی جائے گی۔

خلاصہ

اس پوسٹ نے آپ کو دکھایا کہ جمپ سٹارٹ حل پر مبنی ایم ایل کو لاگو کر کے مختلف کاروباری مسائل کو کیسے حل کیا جائے۔ اگرچہ اس پوسٹ نے پانچ نئے حلوں پر توجہ مرکوز کی ہے جو حال ہی میں جمپ اسٹارٹ میں شامل کیے گئے ہیں، مجموعی طور پر 23 دستیاب حل ہیں۔ ہم آپ کی حوصلہ افزائی کرتے ہیں کہ اسٹوڈیو میں لاگ ان کریں اور جمپ اسٹارٹ حل خود دیکھیں اور ان سے فوری قیمت حاصل کرنا شروع کریں۔ مزید معلومات کے لیے رجوع کریں۔ ایمیزون سیج میکر اسٹوڈیو اور سیج میکر جمپ اسٹارٹ.

نوٹ: اگر آپ کو اپنے AWS ریجن کے جمپ اسٹارٹ کنسول میں مندرجہ بالا پانچ حل نظر نہیں آتے ہیں، تو براہ کرم ایک ہفتہ انتظار کریں اور دوبارہ چیک کریں۔ ہم انہیں مرحلہ وار مختلف علاقوں میں جاری کر رہے ہیں۔

مصنفین کے بارے میں

ڈاکٹر راجو پنماچا AWS میں AI پلیٹ فارمز میں AI/ML ماہر حل آرکیٹیکٹ ہے۔ وہ سیج میکر میں خدمات کے کم کوڈ/نو کوڈ سوٹ پر کام کرتا ہے جو صارفین کو مشین لرننگ ماڈلز اور حل آسانی سے بنانے اور تعینات کرنے میں مدد کرتا ہے۔ گاہکوں کی مدد نہ کرنے پر، وہ نئی جگہوں پر سفر کرنا پسند کرتا ہے۔

منان شاہ ایمیزون ویب سروسز میں سافٹ ویئر ڈویلپمنٹ مینیجر ہے۔ وہ ML کے شوقین ہیں اور no-code/low-code AI/ML پروڈکٹس بنانے پر توجہ دیتے ہیں۔ وہ دوسرے باصلاحیت، تکنیکی لوگوں کو زبردست سافٹ ویئر بنانے کے لیے بااختیار بنانے کی کوشش کرتا ہے۔

ٹائم اسٹیمپ: اکتوبر 31، 2022نومبر 1، 2022

Amazon SageMaker JumpStart سلوشنز میں مشین لرننگ کے ذریعے کاروباری مسائل کو اینڈ ٹو اینڈ حل کریں۔

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

حل جائزہ

شرائط

قیمت کی اصلاح

پرندوں کی پرجاتیوں کی پیشن گوئی

پھیپھڑوں کے کینسر کی بقا کی پیش گوئی

مالی ادائیگی کی درجہ بندی

موبائیل فون صارفین کے لیے پیشن گوئی منڈلانا

وسائل کو صاف کریں۔

خلاصہ

مصنفین کے بارے میں

سے زیادہ AWS مشین لرننگ

ایمیزون سیج میکر پر آر اسٹوڈیو کے ساتھ متوازی ڈیٹا پروسیسنگ

Amazon Transcribe، Amazon Translate، اور Amazon Polly کے ساتھ زبان کی رکاوٹوں کو عبور کریں۔

ایمیزون سیج میکر کے ساتھ AWS Graviton پر مبنی مثالوں پر مشین لرننگ انفرنس ورک بوجھ چلائیں

Amazon SageMaker Data Wrangler میں PySpark اور Altair کوڈ کے ٹکڑوں کے ساتھ تیزی سے ڈیٹا تیار کریں۔

ہمارے متعلق

عمودی تلاش اور Ai

پلیٹ فارم

مربوط رہو

اکاؤنٹ