ایمیزون فراڈ ڈیٹیکٹر کے لیے تعیناتی سے پہلے ماڈل کی کارکردگی کی تشخیص کریں۔

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

آن لائن ایپلی کیشنز کو اپنانے میں اضافے اور انٹرنیٹ صارفین کی بڑھتی ہوئی تعداد کے ساتھ، ڈیجیٹل فراڈ سال بہ سال بڑھ رہا ہے۔ ایمیزون فراڈ ڈیٹیکٹر اعلی درجے کی مشین لرننگ (ML) تکنیکوں کا استعمال کرتے ہوئے ممکنہ طور پر دھوکہ دہی والی آن لائن سرگرمیوں کو بہتر طریقے سے شناخت کرنے میں آپ کی مدد کرنے کے لیے ایک مکمل طور پر منظم سروس فراہم کرتا ہے، اور Amazon سے 20 سال سے زیادہ فراڈ کا پتہ لگانے کی مہارت۔

ایک سے زیادہ استعمال کے معاملات میں دھوکہ دہی کو تیزی سے پکڑنے میں آپ کی مدد کرنے کے لیے، Amazon Fraud Detector موزوں الگورتھم، افزودگی اور خصوصیت کی تبدیلیوں کے ساتھ مخصوص ماڈل پیش کرتا ہے۔ ماڈل ٹریننگ مکمل طور پر خودکار اور پریشانی سے پاک ہے، اور آپ میں دی گئی ہدایات پر عمل کر سکتے ہیں۔ صارف گائیڈ یا متعلقہ بلاگ خطوط شروع کرنے کے لیے تاہم، تربیت یافتہ ماڈلز کے ساتھ، آپ کو یہ فیصلہ کرنے کی ضرورت ہے کہ آیا ماڈل تعیناتی کے لیے تیار ہے۔ اس کے لیے ML، اعدادوشمار، اور دھوکہ دہی کا پتہ لگانے میں کچھ خاص معلومات کی ضرورت ہوتی ہے، اور کچھ عام طریقوں کو جاننا مددگار ثابت ہو سکتا ہے۔

یہ پوسٹ آپ کو ماڈل کی کارکردگی کی تشخیص کرنے اور تعیناتی کے لیے صحیح ماڈل منتخب کرنے میں مدد کرے گی۔ ہم Amazon فراڈ ڈیٹیکٹر کی طرف سے فراہم کردہ میٹرکس کے ذریعے چلتے ہیں، ممکنہ مسائل کی تشخیص میں آپ کی مدد کرتے ہیں، اور ماڈل کی کارکردگی کو بہتر بنانے کے لیے تجاویز فراہم کرتے ہیں۔ نقطہ نظر آن لائن فراڈ انسائٹس (OFI) اور ٹرانزیکشن فراڈ انسائٹس (TFI) ماڈل ٹیمپلیٹس دونوں پر لاگو ہوتے ہیں۔

حل جائزہ

یہ پوسٹ آپ کے ماڈل کی کارکردگی کی تشخیص کے لیے ایک اختتام سے آخر تک عمل فراہم کرتی ہے۔ یہ سب سے پہلے ایمیزون فراڈ ڈیٹیکٹر کنسول پر دکھائے گئے تمام ماڈل میٹرکس کو متعارف کراتا ہے، بشمول AUC، سکور کی تقسیم، کنفیوژن میٹرکس، ROC وکر، اور ماڈل متغیر اہمیت۔ پھر ہم مختلف میٹرکس کا استعمال کرتے ہوئے ماڈل کی کارکردگی کی تشخیص کے لیے تین قدمی نقطہ نظر پیش کرتے ہیں۔ آخر میں، ہم عام مسائل کے لیے ماڈل کی کارکردگی کو بہتر بنانے کے لیے تجاویز فراہم کرتے ہیں۔

شرائط

اپنے ایمیزون فراڈ ڈیٹیکٹر ماڈل میں گہرائی میں جانے سے پہلے، آپ کو درج ذیل شرائط کو پورا کرنے کی ضرورت ہے:

AWS اکاؤنٹ بنائیں۔
ایونٹ کا ڈیٹاسیٹ بنائیں ماڈل ٹریننگ کے لیے۔
اپنا ڈیٹا اپ لوڈ کریں۔ کرنے کے لئے ایمیزون سادہ اسٹوریج سروس (ایمیزون S3) یا اپنے ایونٹ کا ڈیٹا ایمیزون فراڈ ڈیٹیکٹر میں داخل کریں۔.
ایمیزون فراڈ ڈیٹیکٹر ماڈل بنائیں.

ماڈل میٹرکس کی تشریح کریں۔

ماڈل ٹریننگ مکمل ہونے کے بعد، Amazon Fraud Detector ماڈلنگ ڈیٹا کے اس حصے کا استعمال کرتے ہوئے آپ کے ماڈل کی جانچ کرتا ہے جو ماڈل ٹریننگ میں استعمال نہیں کیا گیا تھا۔ یہ پر تشخیصی میٹرکس واپس کرتا ہے۔ ماڈل ورژن اس ماڈل کے لیے صفحہ۔ وہ میٹرکس اس ماڈل کی کارکردگی کی عکاسی کرتے ہیں جس کی آپ پروڈکشن میں تعیناتی کے بعد حقیقی ڈیٹا پر توقع کر سکتے ہیں۔

مندرجہ ذیل اسکرین شاٹ ایمیزون فراڈ ڈیٹیکٹر کے ذریعے واپس کی گئی ماڈل کی کارکردگی کو ظاہر کرتا ہے۔ آپ سکور کی تقسیم (بائیں) پر مختلف حدوں کا انتخاب کر سکتے ہیں، اور کنفیوژن میٹرکس (دائیں) کو اسی کے مطابق اپ ڈیٹ کیا جاتا ہے۔

آپ کارکردگی کو جانچنے اور حکمت عملی کے اصولوں پر فیصلہ کرنے کے لیے درج ذیل نتائج کا استعمال کر سکتے ہیں:

AUC (وکر کے نیچے کا علاقہ) - اس ماڈل کی مجموعی کارکردگی۔ 0.50 کے AUC والا ماڈل سکے کے پلٹنے سے بہتر نہیں ہے کیونکہ یہ بے ترتیب موقع کی نمائندگی کرتا ہے، جب کہ ایک "پرفیکٹ" ماڈل کا سکور 1.0 ہوگا۔ AUC جتنا زیادہ ہوگا، اتنا ہی بہتر آپ کا ماڈل دھوکہ دہی اور جائز کے درمیان فرق کر سکتا ہے۔
سکور کی تقسیم - ماڈل سکور کی تقسیم کا ایک ہسٹوگرام جس میں 100,000 واقعات کی مثال کی آبادی کو فرض کیا گیا ہے۔ ایمیزون فراڈ ڈیٹیکٹر 0-1000 کے درمیان ماڈل اسکور تیار کرتا ہے، جہاں اسکور جتنا کم ہوگا، فراڈ کا خطرہ اتنا ہی کم ہوگا۔ جائز (سبز) اور دھوکہ دہی (نیلی) آبادی کے درمیان بہتر علیحدگی عام طور پر ایک بہتر ماڈل کی نشاندہی کرتی ہے۔ مزید تفصیلات کے لیے دیکھیں ماڈل سکور.
کنفیوژن میٹرکس - ایک جدول جو منتخب کردہ اسکور کی حد کے لیے ماڈل کی کارکردگی کو بیان کرتا ہے، بشمول حقیقی مثبت، حقیقی منفی، غلط مثبت، غلط منفی، حقیقی مثبت شرح (TPR)، اور غلط مثبت شرح (FPR)۔ میز پر شمار 100,0000 واقعات کی مثال کی آبادی کو فرض کرتا ہے۔ مزید تفصیلات کے لیے دیکھیں ماڈل پرفارمنس میٹرکس.
آر او سی (رسیور آپریٹر کی خصوصیت) وکر - ایک پلاٹ جو ماڈل کی تشخیصی صلاحیت کو واضح کرتا ہے، جیسا کہ مندرجہ ذیل اسکرین شاٹ میں دکھایا گیا ہے۔ یہ حقیقی مثبت شرح کو تمام ممکنہ ماڈل سکور کی حدوں پر غلط مثبت شرح کے فنکشن کے طور پر پیش کرتا ہے۔ اس چارٹ کو منتخب کرکے دیکھیں ایڈوانسڈ میٹرکس. اگر آپ نے ایک ماڈل کے متعدد ورژنز کو تربیت دی ہے، تو آپ کارکردگی کی تبدیلی کو چیک کرنے کے لیے مختلف FPR حدیں منتخب کر سکتے ہیں۔
ماڈل متغیر اہمیت – تیار کردہ ماڈل میں ان کے تعاون کی بنیاد پر ماڈل متغیرات کا درجہ، جیسا کہ درج ذیل اسکرین شاٹ میں دکھایا گیا ہے۔ سب سے زیادہ قدر والا ماڈل متغیر ماڈل کے لیے اس ماڈل ورژن کے ڈیٹاسیٹ میں موجود دیگر ماڈل متغیرات کے مقابلے میں زیادہ اہم ہے، اور بطور ڈیفالٹ سب سے اوپر درج ہوتا ہے۔ مزید تفصیلات کے لیے دیکھیں ماڈل متغیر اہمیت.

ماڈل کی کارکردگی کی تشخیص کریں۔

اپنے ماڈل کو پروڈکشن میں تعینات کرنے سے پہلے، آپ کو ماڈل کی کارکردگی کو سمجھنے اور ممکنہ مسائل کی تشخیص کے لیے Amazon Fraud Detector کی واپسی کی میٹرکس کا استعمال کرنا چاہیے۔ ایم ایل ماڈلز کے عام مسائل کو دو اہم اقسام میں تقسیم کیا جا سکتا ہے: ڈیٹا سے متعلق مسائل اور ماڈل سے متعلق مسائل۔ Amazon Fraud Detector نے آپ کے ماڈل کا جائزہ لینے اور بیک اینڈ پر ٹیون کرنے کے لیے توثیق اور ٹیسٹنگ سیٹ کا احتیاط سے استعمال کرتے ہوئے ماڈل سے متعلقہ مسائل کا خیال رکھا ہے۔ اگر آپ کا ماڈل تعیناتی کے لیے تیار ہے یا اس میں ڈیٹا سے متعلق ممکنہ مسائل ہیں تو آپ تصدیق کرنے کے لیے درج ذیل مراحل کو مکمل کر سکتے ہیں:

ماڈل کی مجموعی کارکردگی (AUC اور سکور کی تقسیم) کو چیک کریں۔
کاروباری ضروریات کا جائزہ لیں (کنفیوژن میٹرکس اور ٹیبل)۔
ماڈل متغیر کی اہمیت کو چیک کریں۔

ماڈل کی مجموعی کارکردگی چیک کریں: AUC اور سکور کی تقسیم

مستقبل کے واقعات کی زیادہ درست پیشین گوئی ہمیشہ پیشین گوئی کرنے والے ماڈل کا بنیادی ہدف ہوتا ہے۔ Amazon Fraud Detector کے ذریعے واپس کردہ AUC کا حساب تربیت میں استعمال نہ ہونے والے صحیح نمونے کے ٹیسٹ سیٹ پر کیا جاتا ہے۔ عام طور پر، 0.9 سے زیادہ AUC والا ماڈل ایک اچھا ماڈل سمجھا جاتا ہے۔

اگر آپ کسی ماڈل کا مشاہدہ کرتے ہیں جس کی کارکردگی 0.8 سے کم ہے، تو اس کا عام طور پر مطلب ہے کہ ماڈل میں بہتری کی گنجائش ہے (ہم اس پوسٹ میں بعد میں کم ماڈل کی کارکردگی کے لیے عام مسائل پر بات کرتے ہیں)۔ نوٹ کریں کہ "اچھی" کارکردگی کی تعریف آپ کے کاروبار اور بنیادی ماڈل پر منحصر ہے۔ آپ اپنے ایمیزون فراڈ ڈیٹیکٹر ماڈل کو بہتر بنانے کے لیے اس پوسٹ میں درج مراحل کی پیروی کر سکتے ہیں حالانکہ اس کا AUC 0.8 سے زیادہ ہے۔

دوسری طرف، اگر AUC 0.99 سے زیادہ ہے، تو اس کا مطلب ہے کہ ماڈل ٹیسٹ سیٹ پر دھوکہ دہی اور جائز واقعات کو تقریباً بالکل الگ کر سکتا ہے۔ یہ بعض اوقات "سچ ہونے کے لئے بہت اچھا" منظر نامہ ہوتا ہے (ہم بعد میں اس پوسٹ میں بہت اعلی ماڈل کی کارکردگی کے لئے عام مسائل پر بات کرتے ہیں)۔

مجموعی AUC کے علاوہ، اسکور کی تقسیم بھی آپ کو بتا سکتی ہے کہ ماڈل کتنی اچھی طرح سے فٹ ہے۔ مثالی طور پر، آپ کو پیمانے کے دونوں سروں پر موجود جائز اور دھوکہ دہی کا بڑا حصہ دیکھنا چاہیے، جو اس بات کی نشاندہی کرتا ہے کہ ماڈل اسکور ٹیسٹ سیٹ پر واقعات کی درست درجہ بندی کر سکتا ہے۔

درج ذیل مثال میں، سکور کی تقسیم کا AUC 0.96 ہے۔

اگر جائز اور فراڈ کی تقسیم اوورلیپ ہو جاتی ہے یا مرکز میں مرتکز ہوتی ہے، تو شاید اس کا مطلب ہے کہ ماڈل دھوکہ دہی کے واقعات کو جائز واقعات سے ممتاز کرنے میں اچھی کارکردگی کا مظاہرہ نہیں کرتا ہے، جو اس بات کی نشاندہی کر سکتا ہے کہ تاریخی ڈیٹا کی تقسیم میں تبدیلی ہوئی ہے یا آپ کو مزید ڈیٹا یا خصوصیات کی ضرورت ہے۔

ذیل میں 0.64 کے AUC کے ساتھ سکور کی تقسیم کی ایک مثال ہے۔

اگر آپ کو کوئی ایسا سپلٹ پوائنٹ مل جاتا ہے جو دھوکہ دہی اور جائز واقعات کو تقریباً مکمل طور پر تقسیم کر سکتا ہے، تو اس بات کا بہت زیادہ امکان ہے کہ ماڈل میں لیبل لیک ہونے کا مسئلہ ہے یا فراڈ کے نمونوں کا پتہ لگانا بہت آسان ہے، جو آپ کی توجہ حاصل کرے۔

درج ذیل مثال میں، سکور کی تقسیم کا AUC 1.0 ہے۔

کاروباری ضروریات کا جائزہ لیں: کنفیوژن میٹرکس اور ٹیبل

اگرچہ AUC ماڈل کی کارکردگی کا ایک آسان اشارہ ہے، لیکن ہو سکتا ہے کہ یہ براہ راست آپ کی کاروباری ضرورت کا ترجمہ نہ کرے۔ Amazon فراڈ ڈیٹیکٹر میٹرکس بھی فراہم کرتا ہے جیسے کہ فراڈ کیپچر ریٹ (حقیقی مثبت شرح)، ان جائز واقعات کا فیصد جن کی غلط پیشین گوئی کی گئی ہے بطور فراڈ (غلط مثبت شرح)، اور مزید، جو عام طور پر کاروباری ضروریات کے طور پر استعمال ہوتے ہیں۔ معقول حد تک اچھے AUC والے ماڈل کو تربیت دینے کے بعد، آپ کو اپنی کاروباری ضروریات کے ساتھ ماڈل کا موازنہ ان میٹرکس کے ساتھ کرنا ہوگا۔

کنفیوژن میٹرکس اور ٹیبل آپ کو اثر کا جائزہ لینے اور یہ چیک کرنے کے لیے ایک انٹرفیس فراہم کرتے ہیں کہ آیا یہ آپ کی کاروباری ضروریات کو پورا کرتا ہے۔ نوٹ کریں کہ نمبرز ماڈل کی حد پر منحصر ہوتے ہیں، جہاں حد سے زیادہ اسکور والے ایونٹس کو فراڈ کے طور پر درجہ بندی کیا جاتا ہے اور حد سے کم اسکور والے ایونٹس کو جائز کے طور پر درجہ بندی کیا جاتا ہے۔ آپ اپنی کاروباری ضروریات کے لحاظ سے منتخب کر سکتے ہیں کہ کون سی حد استعمال کرنی ہے۔

مثال کے طور پر، اگر آپ کا ہدف 73% فراڈ کو پکڑنا ہے، تو (جیسا کہ نیچے کی مثال میں دکھایا گیا ہے) آپ 855 جیسی حد کا انتخاب کر سکتے ہیں، جو آپ کو تمام فراڈ کا 73% پکڑنے کی اجازت دیتا ہے۔ تاہم، ماڈل 3% جائز واقعات کو جعلی ہونے کے لیے غلط درجہ بندی بھی کرے گا۔ اگر یہ FPR آپ کے کاروبار کے لیے قابل قبول ہے، تو یہ ماڈل تعیناتی کے لیے اچھا ہے۔ دوسری صورت میں، آپ کو ماڈل کی کارکردگی کو بہتر بنانے کی ضرورت ہے.

ایک اور مثال یہ ہے کہ اگر کسی جائز گاہک کو روکنے یا چیلنج کرنے کی لاگت بہت زیادہ ہے، تو آپ کو کم FPR اور زیادہ درستگی چاہیے۔ اس صورت میں، آپ 950 کی حد کا انتخاب کر سکتے ہیں، جیسا کہ مندرجہ ذیل مثال میں دکھایا گیا ہے، جو 1% جائز صارفین کو فراڈ کے طور پر چھوڑ دے گا، اور 80% شناخت شدہ فراڈ درحقیقت فراڈ ہو گا۔

اس کے علاوہ، آپ متعدد حدوں کا انتخاب کر سکتے ہیں اور مختلف نتائج تفویض کر سکتے ہیں، جیسے بلاک، تفتیش، پاس۔ اگر آپ کو مناسب حدیں اور قواعد نہیں مل رہے ہیں جو آپ کی تمام کاروباری ضروریات کو پورا کرتے ہیں، تو آپ کو اپنے ماڈل کو مزید ڈیٹا اور صفات کے ساتھ تربیت دینے پر غور کرنا چاہیے۔

ماڈل متغیر کی اہمیت کو چیک کریں۔

۔ ماڈل متغیر اہمیت پین دکھاتا ہے کہ ہر متغیر آپ کے ماڈل میں کس طرح حصہ ڈالتا ہے۔ اگر ایک متغیر کی اہمیت دیگر کے مقابلے میں نمایاں طور پر زیادہ ہے، تو یہ لیبل کے رساو کی نشاندہی کر سکتا ہے یا یہ کہ دھوکہ دہی کے نمونوں کا پتہ لگانا بہت آسان ہے۔ نوٹ کریں کہ متغیر کی اہمیت کو آپ کے ان پٹ متغیرات پر جمع کیا جاتا ہے۔ اگر آپ قدرے زیادہ اہمیت کا مشاہدہ کرتے ہیں۔ IP_ADDRESS, CARD_BIN, EMAIL_ADDRESS, PHONE_NUMBER, BILLING_ZIP، یا SHIPPING_ZIP، یہ افزودگی کی طاقت کی وجہ سے ہوسکتا ہے۔

مندرجہ ذیل مثال ماڈل متغیر کی اہمیت کو ظاہر کرتی ہے جس میں لیبل کے ممکنہ رساو کا استعمال کیا جاتا ہے۔ investigation_status.

ماڈل متغیر کی اہمیت آپ کو یہ اشارے بھی دیتی ہے کہ کون سے اضافی متغیرات ممکنہ طور پر ماڈل میں اضافہ کر سکتے ہیں۔ مثال کے طور پر، اگر آپ دیکھتے ہیں کہ AUC کم ہے اور بیچنے والے سے متعلقہ خصوصیات زیادہ اہمیت رکھتی ہیں، تو آپ آرڈر کی مزید خصوصیات جمع کرنے پر غور کر سکتے ہیں جیسے SELLER_CATEGORY, SELLER_ADDRESS، اور SELLER_ACTIVE_YEARS، اور ان متغیرات کو اپنے ماڈل میں شامل کریں۔

کم ماڈل کی کارکردگی کے لیے عام مسائل

اس سیکشن میں، ہم عام مسائل پر بات کرتے ہیں جن کا آپ کو کم ماڈل کی کارکردگی کے حوالے سے سامنا ہو سکتا ہے۔

تاریخی ڈیٹا کی تقسیم بدل گئی۔

تاریخی ڈیٹا کی تقسیم میں اضافہ اس وقت ہوتا ہے جب آپ کے پاس کوئی بڑی کاروباری تبدیلی یا ڈیٹا اکٹھا کرنے کا مسئلہ ہو۔ مثال کے طور پر، اگر آپ نے حال ہی میں اپنی مصنوعات کو ایک نئی مارکیٹ میں لانچ کیا، IP_ADDRESS, EMAIL، اور ADDRESS متعلقہ خصوصیات بالکل مختلف ہو سکتی ہیں، اور دھوکہ دہی کا طریقہ کار بھی بدل سکتا ہے۔ ایمیزون فراڈ ڈیٹیکٹر استعمال کرتا ہے۔ EVENT_TIMESTAMP ڈیٹا کو تقسیم کرنے اور اپنے ڈیٹاسیٹ میں واقعات کے مناسب ذیلی سیٹ پر اپنے ماڈل کا جائزہ لینے کے لیے۔ اگر آپ کے تاریخی ڈیٹا کی تقسیم میں نمایاں تبدیلی آتی ہے، تو تشخیص کا سیٹ تربیتی ڈیٹا سے بہت مختلف ہو سکتا ہے، اور رپورٹ کردہ ماڈل کی کارکردگی کم ہو سکتی ہے۔

آپ اپنے تاریخی ڈیٹا کو دریافت کر کے ڈیٹا کی تقسیم میں تبدیلی کے ممکنہ مسئلے کو چیک کر سکتے ہیں:

استعمال کریں ایمیزون فراڈ ڈیٹیکٹر ڈیٹا پروفائلر یہ چیک کرنے کا ٹول ہے کہ آیا فراڈ کی شرح اور لیبل کی گمشدگی کی شرح وقت کے ساتھ تبدیل ہوئی ہے۔
چیک کریں کہ آیا وقت کے ساتھ متغیر کی تقسیم نمایاں طور پر تبدیل ہوئی ہے، خاص طور پر اعلی متغیر اہمیت والی خصوصیات کے لیے۔
متغیر کی تقسیم کو وقت کے ساتھ ہدف متغیر کے ذریعے چیک کریں۔ اگر آپ حالیہ اعداد و شمار میں ایک زمرے سے نمایاں طور پر زیادہ دھوکہ دہی کے واقعات کا مشاہدہ کرتے ہیں، تو آپ اپنے کاروباری فیصلوں کا استعمال کرتے ہوئے یہ جانچنا چاہیں گے کہ آیا تبدیلی معقول ہے۔

اگر آپ کو لگتا ہے کہ لیبل کی گمشدگی کی شرح بہت زیادہ ہے یا تازہ ترین تاریخوں کے دوران دھوکہ دہی کی شرح میں مسلسل کمی آئی ہے، تو یہ اس بات کا اشارہ ہو سکتا ہے کہ لیبل مکمل طور پر پختہ نہیں ہوئے ہیں۔ آپ کو تازہ ترین ڈیٹا کو خارج کرنا چاہیے یا درست لیبلز جمع کرنے کے لیے زیادہ انتظار کرنا چاہیے، اور پھر اپنے ماڈل کو دوبارہ تربیت دینا چاہیے۔

اگر آپ مخصوص تاریخوں پر دھوکہ دہی کی شرح اور متغیرات میں تیزی سے اضافہ دیکھتے ہیں، تو آپ دو بار جانچنا چاہیں گے کہ آیا یہ کوئی آؤٹ لیئر یا ڈیٹا اکٹھا کرنے کا مسئلہ ہے۔ اس صورت میں، آپ کو ان واقعات کو حذف کرنا چاہیے اور ماڈل کو دوبارہ تربیت دینا چاہیے۔

اگر آپ کو معلوم ہوتا ہے کہ پرانا ڈیٹا آپ کے موجودہ اور مستقبل کے کاروبار کی نمائندگی نہیں کر سکتا، تو آپ کو ڈیٹا کی پرانی مدت کو تربیت سے خارج کر دینا چاہیے۔ اگر آپ Amazon Fraud Detector میں سٹور شدہ ایونٹس استعمال کر رہے ہیں، تو آپ آسانی سے ایک نئے ورژن کو دوبارہ تربیت دے سکتے ہیں اور ٹریننگ جاب کو کنفیگر کرتے وقت مناسب تاریخ کی حد منتخب کر سکتے ہیں۔ اس سے یہ بھی ظاہر ہو سکتا ہے کہ آپ کے کاروبار میں فراڈ کا طریقہ کار وقت کے ساتھ نسبتاً تیزی سے بدل جاتا ہے۔ ماڈل کی تعیناتی کے بعد، آپ کو اپنے ماڈل کو کثرت سے دوبارہ تربیت دینے کی ضرورت پڑ سکتی ہے۔

غلط متغیر قسم کی نقشہ سازی

ایمیزون فراڈ ڈیٹیکٹر متغیر اقسام کی بنیاد پر ڈیٹا کو افزودہ اور تبدیل کرتا ہے۔ یہ ضروری ہے کہ آپ اپنے متغیرات کو صحیح قسم کے مطابق بنائیں تاکہ Amazon Fraud Detector ماڈل آپ کے ڈیٹا کی زیادہ سے زیادہ قیمت لے سکے۔ مثال کے طور پر، اگر آپ نقشہ بناتے ہیں۔ IP کرنے کے لئے CATEGORICAL کے بجائے ٹائپ کریں۔ IP_ADDRESS، آپ کو نہیں ملتا IP-پسدید میں متعلقہ افزودگی۔

عام طور پر، ایمیزون فراڈ ڈیٹیکٹر مندرجہ ذیل اقدامات تجویز کرتا ہے:

اپنے متغیرات کو مخصوص اقسام کے لیے نقشہ بنائیں، جیسے IP_ADDRESS, EMAIL_ADDRESS, CARD_BIN، اور PHONE_NUMBER، تاکہ ایمیزون فراڈ ڈیٹیکٹر اضافی معلومات کو نکال کر ان کی افزودگی کر سکے۔
اگر آپ متغیر کی مخصوص قسم نہیں ڈھونڈ سکتے ہیں، تو اسے تین عمومی اقسام میں سے ایک پر نقشہ بنائیں: NUMERIC, CATEGORICAL، یا FREE_FORM_TEXT.
اگر کوئی متغیر متن کی شکل میں ہے اور اس میں اعلی کارڈنلٹی ہے، جیسے گاہک کا جائزہ یا مصنوعات کی تفصیل، تو آپ کو اس کا نقشہ FREE_FORM_TEXT متغیر کی قسم تاکہ ایمیزون فراڈ ڈیٹیکٹر آپ کے لیے بیک اینڈ پر ٹیکسٹ فیچرز اور ایمبیڈنگز کو نکالے۔ مثال کے طور پر، اگر آپ نقشہ بناتے ہیں۔ url_string کرنے کے لئے FREE_FORM_TEXT، یہ یو آر ایل کو ٹوکنائز کرنے اور ڈاون اسٹریم ماڈل میں فیڈ کرنے کے لیے معلومات نکالنے کے قابل ہے، جس سے اسے URL سے مزید پوشیدہ پیٹرن سیکھنے میں مدد ملے گی۔

اگر آپ کو معلوم ہوتا ہے کہ متغیر کنفیگریشن میں آپ کی کسی بھی قسم کی متغیر کی غلط نقشہ بندی کی گئی ہے، تو آپ اپنی متغیر کی قسم کو تبدیل کر سکتے ہیں اور پھر ماڈل کو دوبارہ تربیت دے سکتے ہیں۔

ناکافی ڈیٹا یا خصوصیات

Amazon فراڈ ڈیٹیکٹر کو آن لائن فراڈ انسائٹس (OFI) یا ٹرانزیکشن فراڈ انسائٹس (TFI) ماڈل کو تربیت دینے کے لیے کم از کم 10,000 ریکارڈز کی ضرورت ہوتی ہے، جن میں سے کم از کم 400 ریکارڈز کی شناخت فراڈ کے طور پر ہوتی ہے۔ TFI یہ بھی تقاضا کرتا ہے کہ ڈیٹاسیٹ کے تنوع کو یقینی بنانے کے لیے جعلی ریکارڈ اور جائز ریکارڈ دونوں ہی کم از کم 100 مختلف اداروں سے آئیں۔ مزید برآں، ایمیزون فراڈ ڈیٹیکٹر کو ماڈلنگ ڈیٹا میں کم از کم دو متغیرات کی ضرورت ہوتی ہے۔ یہ ایک کارآمد ایمیزون فراڈ ڈیٹیکٹر ماڈل بنانے کے لیے ڈیٹا کی کم از کم ضروریات ہیں۔ تاہم، زیادہ ریکارڈز اور متغیرات کا استعمال عام طور پر ML ماڈلز کو آپ کے ڈیٹا سے بنیادی نمونوں کو بہتر طریقے سے سیکھنے میں مدد کرتا ہے۔ جب آپ کم AUC کا مشاہدہ کرتے ہیں یا آپ کی کاروباری ضروریات کو پورا کرنے والی حدیں نہیں پاتے ہیں، تو آپ کو اپنے ماڈل کو مزید ڈیٹا کے ساتھ دوبارہ تربیت دینے یا اپنے ماڈل میں نئی خصوصیات شامل کرنے پر غور کرنا چاہیے۔ عام طور پر، ہم تلاش کرتے ہیں EMAIL_ADDRESS, IP, PAYMENT_TYPE, BILLING_ADDRESS, SHIPPING_ADDRESS، اور DEVICE متعلقہ متغیرات فراڈ کا پتہ لگانے میں اہم ہیں۔

ایک اور ممکنہ وجہ یہ ہے کہ آپ کے کچھ متغیرات میں بہت زیادہ گم شدہ اقدار ہیں۔ یہ دیکھنے کے لیے کہ آیا ایسا ہو رہا ہے، ماڈل ٹریننگ کے پیغامات کو چیک کریں اور رجوع کریں۔ تربیتی ڈیٹا کے مسائل کو حل کریں۔ تجاویز کے لیے

بہت اعلی ماڈل کی کارکردگی کے لیے عام مسائل

اس سیکشن میں، ہم بہت اعلی ماڈل کی کارکردگی سے متعلق عام مسائل پر بات کرتے ہیں۔

لیبل کا رساو

لیبل کا اخراج اس وقت ہوتا ہے جب تربیتی ڈیٹا سیٹ ایسی معلومات کا استعمال کرتے ہیں جس کی پیشین گوئی کے وقت دستیاب ہونے کی توقع نہیں کی جاتی ہے۔ جب پیداواری ماحول میں چلایا جاتا ہے تو یہ ماڈل کی افادیت کا زیادہ اندازہ لگاتا ہے۔

اعلی AUC (1 کے قریب)، بالکل الگ اسکور کی تقسیم، اور ایک متغیر کی نمایاں طور پر زیادہ متغیر اہمیت ممکنہ لیبل کے رساو کے مسائل کے اشارے ہو سکتے ہیں۔ آپ کا استعمال کرتے ہوئے خصوصیات اور لیبل کے درمیان ارتباط بھی چیک کر سکتے ہیں۔ ڈیٹا پروفائلر. خصوصیت اور لیبل کا ارتباط پلاٹ ہر خصوصیت اور لیبل کے درمیان ارتباط کو ظاہر کرتا ہے۔ اگر ایک خصوصیت کا لیبل کے ساتھ 0.99 سے زیادہ تعلق ہے، تو آپ کو جانچنا چاہیے کہ آیا کاروباری فیصلوں کی بنیاد پر فیچر کا صحیح استعمال کیا گیا ہے۔ مثال کے طور پر، قرض کی درخواست کو منظور یا مسترد کرنے کے لیے ایک رسک ماڈل بنانے کے لیے، آپ کو ان خصوصیات کا استعمال نہیں کرنا چاہیے جیسے AMOUNT_PAIDکیونکہ ادائیگی انڈر رائٹنگ کے عمل کے بعد ہوتی ہے۔ اگر آپ کی پیشن گوئی کے وقت کوئی متغیر دستیاب نہیں ہے، تو آپ کو اس متغیر کو ماڈل کی ترتیب سے ہٹانا چاہیے اور ایک نئے ماڈل کو دوبارہ تربیت دینا چاہیے۔

مندرجہ ذیل مثال ہر متغیر اور لیبل کے درمیان ارتباط کو ظاہر کرتی ہے۔ investigation_status لیبل کے ساتھ ایک اعلی ارتباط (1 کے قریب) ہے، لہذا آپ کو دو بار چیک کرنا چاہئے کہ آیا لیبل کے رساو کا مسئلہ ہے.

دھوکہ دہی کے سادہ نمونے۔

جب آپ کے ڈیٹا میں دھوکہ دہی کے نمونے آسان ہوتے ہیں، تو آپ ماڈل کی بہت اعلی کارکردگی کا بھی مشاہدہ کر سکتے ہیں۔ مثال کے طور پر، فرض کریں کہ ماڈلنگ ڈیٹا میں دھوکہ دہی کے تمام واقعات ایک ہی داخلی خدمت فراہم کنندہ کے ذریعے آتے ہیں۔ ماڈل کا انتخاب کرنا سیدھا سیدھا ہے۔ IP-متعلقہ متغیرات اور اعلی اہمیت کے ساتھ ایک "کامل" ماڈل واپس کریں۔ IP.

دھوکہ دہی کے سادہ نمونے ہمیشہ ڈیٹا کے مسئلے کی نشاندہی نہیں کرتے ہیں۔ یہ سچ ہو سکتا ہے کہ آپ کے کاروبار میں دھوکہ دہی کے طریقہ کار کو پکڑنا آسان ہے۔ تاہم، کوئی نتیجہ اخذ کرنے سے پہلے، آپ کو یہ یقینی بنانا ہوگا کہ ماڈل ٹریننگ میں استعمال کیے گئے لیبل درست ہیں، اور ماڈلنگ ڈیٹا زیادہ سے زیادہ دھوکہ دہی کے نمونوں کا احاطہ کرتا ہے۔ مثال کے طور پر، اگر آپ اپنے دھوکہ دہی کے واقعات کو قواعد کی بنیاد پر لیبل لگاتے ہیں، جیسے کہ کسی مخصوص سے تمام ایپلیکیشنز کو لیبل لگانا BILLING_ZIP علاوہ PRODUCT_CATEGORY دھوکہ دہی کے طور پر، ماڈل ان فراڈوں کو آسانی سے قوانین کی تقلید کرکے اور اعلیٰ AUC حاصل کرکے پکڑ سکتا ہے۔

آپ کا استعمال کرتے ہوئے ہر خصوصیت کے مختلف زمروں یا ڈبوں میں لیبل کی تقسیم کو چیک کر سکتے ہیں۔ ڈیٹا پروفائلر. مثال کے طور پر، اگر آپ دیکھتے ہیں کہ دھوکہ دہی کے زیادہ تر واقعات ایک یا چند پروڈکٹ کیٹیگریز سے آتے ہیں، تو یہ فراڈ کے سادہ نمونوں کا اشارہ ہو سکتا ہے، اور آپ کو اس بات کی تصدیق کرنی ہوگی کہ یہ ڈیٹا اکٹھا کرنے یا عمل کی غلطی نہیں ہے۔ اگر خصوصیت پسند ہے۔ CUSTOMER_ID، آپ کو ماڈل ٹریننگ میں خصوصیت کو خارج کرنا چاہئے۔

مندرجہ ذیل مثال مختلف زمروں میں لیبل کی تقسیم کو ظاہر کرتی ہے۔ product_category. تمام دھوکہ دہی دو مصنوعات کی اقسام سے آتی ہے۔

غلط ڈیٹا سیمپلنگ

غلط ڈیٹا سیمپلنگ اس وقت ہو سکتی ہے جب آپ نے نمونہ لیا اور صرف اپنے ڈیٹا کا کچھ حصہ Amazon Fraud Detector کو بھیجا۔ اگر ڈیٹا کو صحیح طریقے سے نمونہ نہیں بنایا گیا ہے اور پیداوار میں ٹریفک کا نمائندہ نہیں ہے، تو رپورٹ کردہ ماڈل کی کارکردگی غلط ہوگی اور ماڈل پیداوار کی پیشین گوئی کے لیے بیکار ہو سکتا ہے۔ مثال کے طور پر، اگر ماڈلنگ ڈیٹا میں دھوکہ دہی کے تمام واقعات کا نمونہ ایشیاء سے لیا جاتا ہے اور تمام جائز واقعات کا نمونہ امریکہ سے لیا جاتا ہے، تو ماڈل دھوکہ دہی اور قانونی کی بنیاد پر الگ کرنا سیکھ سکتا ہے۔ BILLING_COUNTRY. اس صورت میں، ماڈل دیگر آبادیوں پر لاگو کرنے کے لیے عام نہیں ہے۔

عام طور پر، ہم نمونے لیے بغیر تمام تازہ ترین واقعات بھیجنے کا مشورہ دیتے ہیں۔ ڈیٹا کے سائز اور فراڈ کی شرح کی بنیاد پر، Amazon فراڈ ڈیٹیکٹر آپ کے لیے ماڈل ٹریننگ سے پہلے نمونے لیتا ہے۔ اگر آپ کا ڈیٹا بہت بڑا ہے (100 GB سے زیادہ) اور آپ نمونہ لینے اور صرف ایک ذیلی سیٹ بھیجنے کا فیصلہ کرتے ہیں، تو آپ کو تصادفی طور پر اپنے ڈیٹا کا نمونہ لینا چاہیے اور یہ یقینی بنانا چاہیے کہ نمونہ پوری آبادی کا نمائندہ ہے۔ TFI کے لیے، آپ کو ہستی کے لحاظ سے اپنے ڈیٹا کا نمونہ لینا چاہیے، جس کا مطلب ہے کہ اگر ایک ہستی کا نمونہ لیا جاتا ہے، تو آپ کو اس کی تمام تاریخ شامل کرنی چاہیے تاکہ ہستی کی سطح کے مجموعوں کا صحیح حساب لگایا جائے۔ نوٹ کریں کہ اگر آپ Amazon Fraud Detector کو ڈیٹا کا صرف ذیلی سیٹ بھیجتے ہیں تو، اگر ہستیوں کے سابقہ واقعات نہیں بھیجے گئے ہیں تو انفرنس کے دوران ریئل ٹائم ایگریگیٹس غلط ہو سکتے ہیں۔

ایک اور غلط ڈیٹا سیمپلنگ ماڈل بنانے کے لیے صرف ایک دن کے ڈیٹا کی طرح مختصر مدت کے ڈیٹا کا استعمال کر سکتی ہے۔ ڈیٹا متعصب ہو سکتا ہے، خاص طور پر اگر آپ کے کاروبار یا دھوکہ دہی کے حملوں میں موسمی نوعیت ہو۔ ہم عام طور پر دھوکہ دہی کی اقسام کے تنوع کو یقینی بنانے کے لیے ماڈلنگ میں کم از کم دو سائیکلوں (جیسے 2 ہفتے یا 2 ماہ) مالیت کا ڈیٹا شامل کرنے کی تجویز کرتے ہیں۔

نتیجہ

تمام ممکنہ مسائل کی تشخیص اور حل کرنے کے بعد، آپ کو ایک کارآمد Amazon فراڈ ڈیٹیکٹر ماڈل حاصل کرنا چاہیے اور اس کی کارکردگی کے بارے میں پراعتماد ہونا چاہیے۔ اگلے قدم کے لیے، آپ ماڈل اور آپ کے کاروباری قواعد کے ساتھ ایک پتہ لگانے والا بنا سکتا ہے۔، اور شیڈو موڈ کی تشخیص کے لیے اسے پروڈکشن میں تعینات کرنے کے لیے تیار رہیں۔

معاہدہ

ماڈل ٹریننگ کے لیے متغیرات کو کیسے خارج کیا جائے۔

گہرے غوطے کے بعد، آپ ایک متغیر لیک ہدف کی معلومات کی شناخت کر سکتے ہیں، اور اسے ماڈل ٹریننگ سے خارج کرنا چاہتے ہیں۔ آپ ان متغیرات کو چھوڑ کر ماڈل ورژن کو دوبارہ تربیت دے سکتے ہیں جو آپ نہیں چاہتے ہیں درج ذیل مراحل کو مکمل کر کے:

ایمیزون فراڈ ڈیٹیکٹر کنسول پر، نیویگیشن پین میں، منتخب کریں۔ ماڈل.
پر ماڈل صفحہ، وہ ماڈل منتخب کریں جسے آپ دوبارہ تربیت دینا چاہتے ہیں۔
پر عوامل مینو، منتخب کریں ٹرین کا نیا ورژن.
تاریخ کی حد منتخب کریں جسے آپ استعمال کرنا چاہتے ہیں اور منتخب کریں۔ اگلے.
پر تربیت کو ترتیب دیں۔ صفحہ، اس متغیر کو غیر منتخب کریں جسے آپ ماڈل ٹریننگ میں استعمال نہیں کرنا چاہتے۔
اپنے فراڈ لیبلز اور جائز لیبلز کی وضاحت کریں اور آپ ایمیزون فراڈ ڈیٹیکٹر کو بغیر لیبل والے ایونٹس کا استعمال کیسے کرنا چاہتے ہیں، پھر منتخب کریں اگلے.
ماڈل کی ترتیب کا جائزہ لیں اور منتخب کریں۔ ماڈل بنائیں اور تربیت دیں۔.

ایونٹ متغیر کی قسم کو کیسے تبدیل کیا جائے۔

متغیرات دھوکہ دہی کی روک تھام میں استعمال ہونے والے ڈیٹا عناصر کی نمائندگی کرتے ہیں۔ Amazon Fraud Detector میں، تمام متغیرات عالمی ہیں اور تمام ایونٹس اور ماڈلز میں مشترکہ ہیں، جس کا مطلب ہے کہ ایک متغیر کو متعدد واقعات میں استعمال کیا جا سکتا ہے۔ مثال کے طور پر، IP سائن ان ایونٹس سے منسلک ہو سکتا ہے، اور یہ ٹرانزیکشن ایونٹس سے بھی منسلک ہو سکتا ہے۔ قدرتی طور پر، Amazon Fraud Detector نے متغیر کی قسم اور ڈیٹا کی قسم کو ایک بار ایک متغیر بننے کے بعد بند کر دیا ہے۔ موجودہ متغیر کو حذف کرنے کے لیے، آپ کو پہلے تمام متعلقہ ایونٹ کی اقسام اور ماڈلز کو حذف کرنا ہوگا۔ آپ ایمیزون فراڈ ڈیٹیکٹر پر جا کر مخصوص متغیر سے وابستہ وسائل کو چیک کر سکتے ہیں، متغیرات نیویگیشن پین میں، اور متغیر کا نام منتخب کرنا اور وابستہ وسائل.

متغیر اور تمام متعلقہ ایونٹ کی اقسام کو حذف کریں۔

متغیر کو حذف کرنے کے لیے، درج ذیل مراحل کو مکمل کریں:

ایمیزون فراڈ ڈیٹیکٹر کنسول پر، نیویگیشن پین میں، منتخب کریں۔ متغیرات.
وہ متغیر منتخب کریں جسے آپ حذف کرنا چاہتے ہیں۔
میں سے انتخاب کریں وابستہ وسائل ایونٹ کی تمام اقسام کی فہرست دیکھنے کے لیے اس متغیر کا استعمال کیا گیا۔
متغیر کو حذف کرنے سے پہلے آپ کو ان متعلقہ واقعات کی اقسام کو حذف کرنے کی ضرورت ہے۔
متعلقہ ایونٹ کی قسم کے صفحہ پر جانے کے لیے فہرست میں ایونٹ کی اقسام کا انتخاب کریں۔
میں سے انتخاب کریں ذخیرہ شدہ واقعات چیک کرنے کے لیے کہ آیا اس ایونٹ کی قسم کے تحت کوئی ڈیٹا محفوظ ہے۔
اگر ایمیزون فراڈ ڈیٹیکٹر میں واقعات محفوظ ہیں، تو منتخب کریں۔ ذخیرہ شدہ واقعات کو حذف کریں۔ ذخیرہ شدہ واقعات کو حذف کرنے کے لیے۔
جب ڈیلیٹ کا کام مکمل ہو جاتا ہے، "اس ایونٹ کی قسم کے لیے اسٹور شدہ ایونٹس کامیابی کے ساتھ ڈیلیٹ کر دیے گئے" پیغام ظاہر ہوتا ہے۔
میں سے انتخاب کریں وابستہ وسائل.
اگر ڈیٹیکٹر اور ماڈل اس ایونٹ کی قسم سے وابستہ ہیں، تو آپ کو پہلے ان وسائل کو حذف کرنے کی ضرورت ہے۔
اگر ڈٹیکٹر منسلک ہیں، تمام متعلقہ ڈٹیکٹرز کو حذف کرنے کے لیے درج ذیل اقدامات مکمل کریں:
1. پر جانے کے لیے ڈیٹیکٹر کا انتخاب کریں۔ ڈیٹیکٹر کی تفصیلات صفحہ.
2. میں ماڈل ورژن پین، ڈیٹیکٹر کا ورژن منتخب کریں۔
3. ڈیٹیکٹر ورژن کے صفحے پر، منتخب کریں۔ عوامل.
4. اگر ڈیٹیکٹر ورژن فعال ہے، منتخب کریں۔ غیر فعالمنتخب کریں اس ڈیٹیکٹر ورژن کو کسی مختلف ورژن سے بدلے بغیر اسے غیر فعال کریں۔، اور منتخب کریں ڈیٹیکٹر ورژن کو غیر فعال کریں۔
5. ڈیٹیکٹر ورژن غیر فعال ہونے کے بعد، منتخب کریں۔ عوامل اور پھر خارج کر دیں.
6. تمام ڈیٹیکٹر ورژنز کو حذف کرنے کے لیے ان اقدامات کو دہرائیں۔
7. پر ڈیٹیکٹر کی تفصیلات صفحہ، منتخب کریں متعلقہ قواعد.
8. حذف کرنے کے لیے اصول کا انتخاب کریں۔
9. میں سے انتخاب کریں عوامل اور اصول کا ورژن حذف کریں۔.
10. تصدیق کرنے اور منتخب کرنے کے لیے اصول کا نام درج کریں۔ ورژن حذف کریں۔.
11. تمام متعلقہ قوانین کو حذف کرنے کے لیے ان اقدامات کو دہرائیں۔
12. ڈیٹیکٹر کے تمام ورژنز اور متعلقہ قواعد حذف ہونے کے بعد، پر جائیں۔ ڈیٹیکٹر کی تفصیلات صفحہ، منتخب کریں عوامل، اور منتخب کریں ڈیٹیکٹر کو حذف کریں۔.
13. ڈیٹیکٹر کا نام درج کریں اور منتخب کریں۔ ڈیٹیکٹر کو حذف کریں۔.
14. اگلے ڈیٹیکٹر کو حذف کرنے کے لیے ان اقدامات کو دہرائیں۔
اگر کوئی ماڈل ایونٹ کی قسم سے وابستہ ہیں، تو انہیں حذف کرنے کے لیے درج ذیل اقدامات مکمل کریں:
1. ماڈل کا نام منتخب کریں۔
2. میں ماڈل ورژن پین، ورژن کا انتخاب کریں.
3. اگر ماڈل کی حیثیت ہے۔ Activeمنتخب کریں عوامل اور ماڈل ورژن کو ہٹا دیں۔.
4. درج undeploy تصدیق کرنے اور منتخب کرنے کے لیے ماڈل ورژن کو ہٹا دیں۔.
  حیثیت بدل جاتی ہے۔ Undeploying. اس عمل کو مکمل ہونے میں چند منٹ لگتے ہیں۔
5. سٹیٹس بننے کے بعد Ready to deploy، اعمال کا انتخاب کریں اور حذف کریں۔
6. تمام ماڈل ورژنز کو حذف کرنے کے لیے ان اقدامات کو دہرائیں۔
7. ماڈل کی تفصیلات کے صفحہ پر، ایکشنز اور ڈیلیٹ ماڈل کو منتخب کریں۔
8. ماڈل کا نام درج کریں اور ڈیلیٹ ماڈل کا انتخاب کریں۔
9. اگلے ماڈل کو حذف کرنے کے لیے ان اقدامات کو دہرائیں۔
تمام متعلقہ ڈیٹیکٹرز اور ماڈلز کے حذف ہونے کے بعد، منتخب کریں۔ عوامل اور ایونٹ کی قسم کو حذف کریں۔ پر پروگرام کی تفصیلات صفحہ.
ایونٹ کی قسم کا نام درج کریں اور منتخب کریں۔ ایونٹ کی قسم کو حذف کریں۔.
نیویگیشن پین میں، منتخب کریں۔ متغیرات، اور وہ متغیر منتخب کریں جسے آپ حذف کرنا چاہتے ہیں۔
متغیر سے وابستہ تمام ایونٹ کی اقسام کو حذف کرنے کے لیے پہلے کے اقدامات کو دہرائیں۔
پر متغیر تفصیلات صفحہ، منتخب کریں عوامل اور حذف کریں.
متغیر کا نام درج کریں اور منتخب کریں۔ متغیر کو حذف کریں۔.

درست متغیر کی قسم کے ساتھ ایک نیا متغیر بنائیں

ایمیزون فراڈ ڈیٹیکٹر سے متغیر اور تمام متعلقہ ایونٹ کی اقسام، اسٹور شدہ ایونٹس، ماڈلز اور ڈیٹیکٹرز کو حذف کرنے کے بعد، آپ اسی نام کا ایک نیا متغیر بنا سکتے ہیں اور اسے درست متغیر کی قسم سے نقشہ بنا سکتے ہیں۔

ایمیزون فراڈ ڈیٹیکٹر کنسول پر، نیویگیشن پین میں، منتخب کریں۔ متغیرات.
میں سے انتخاب کریں تخلیق کریں.
متغیر کا وہ نام درج کریں جس میں آپ ترمیم کرنا چاہتے ہیں (جسے آپ نے پہلے حذف کیا تھا)۔
درست متغیر کی قسم کو منتخب کریں جس میں آپ تبدیل کرنا چاہتے ہیں۔
میں سے انتخاب کریں متغیر بنائیں۔

ڈیٹا اپ لوڈ کریں اور ماڈل کو دوبارہ تربیت دیں۔

متغیر کی قسم کو اپ ڈیٹ کرنے کے بعد، آپ ڈیٹا کو دوبارہ اپ لوڈ کر سکتے ہیں اور ایک نئے ماڈل کو تربیت دے سکتے ہیں۔ ہدایات کے لیے، رجوع کریں۔ ایمیزون فراڈ ڈیٹیکٹر کی نئی خصوصیات کے ساتھ آن لائن ٹرانزیکشن فراڈ کا پتہ لگائیں۔.

موجودہ ایونٹ کی قسم میں نئے متغیرات کو کیسے شامل کیا جائے۔

موجودہ ایونٹ کی قسم میں نئے متغیرات شامل کرنے کے لیے، درج ذیل مراحل کو مکمل کریں:

پچھلی ٹریننگ CVS فائل میں نئے متغیرات شامل کریں۔
نئی ٹریننگ ڈیٹا فائل کو S3 بالٹی میں اپ لوڈ کریں۔ اپنی ٹریننگ فائل کا ایمیزون S3 مقام نوٹ کریں (مثال کے طور پر، s3://bucketname/path/to/some/object.csv) اور آپ کے کردار کا نام۔
ایمیزون فراڈ ڈیٹیکٹر کنسول پر، نیویگیشن پین میں، منتخب کریں۔ تقریبات.
پر واقعہ کی قسمیں صفحہ، ایونٹ کی قسم کا نام منتخب کریں جس میں آپ متغیرات شامل کرنا چاہتے ہیں۔
پر واقعہ کی قسم تفصیلات کا صفحہ، منتخب کریں۔ عوامل، تو متغیرات شامل کریں۔.
کے تحت اس ایونٹ کے متغیرات کی وضاحت کرنے کا طریقہ منتخب کریں۔منتخب کریں تربیتی ڈیٹاسیٹ سے متغیرات کو منتخب کریں۔.
IAM رول کے لیے، ایک موجودہ IAM رول منتخب کریں یا Amazon S3 میں ڈیٹا تک رسائی کے لیے ایک نیا رول بنائیں۔
کے لئے ڈیٹا لوکیشننئی ٹریننگ فائل کا S3 مقام درج کریں اور منتخب کریں۔ اپ لوڈ کریں۔
موجودہ ایونٹ کی قسم میں موجود نئے متغیرات کو فہرست میں ظاہر ہونا چاہیے۔
میں سے انتخاب کریں متغیرات شامل کریں۔

اب، نئے متغیرات کو موجودہ ایونٹ کی قسم میں شامل کر دیا گیا ہے۔ اگر آپ Amazon Fraud Detector میں سٹور شدہ ایونٹس استعمال کر رہے ہیں، تو سٹور شدہ ایونٹس کے نئے متغیرات ابھی تک غائب ہیں۔ آپ کو نئے متغیرات کے ساتھ تربیتی ڈیٹا ایمیزون فراڈ ڈیٹیکٹر میں درآمد کرنے اور پھر نئے ماڈل ورژن کو دوبارہ تربیت دینے کی ضرورت ہے۔ اسی کے ساتھ تربیت کا نیا ڈیٹا اپ لوڈ کرتے وقت EVENT_ID اور EVENT_TIMESTAMP، نئے ایونٹ کے متغیرات Amazon Fraud Detector میں ذخیرہ شدہ پچھلے ایونٹ کے متغیرات کو اوور رائٹ کر دیتے ہیں۔

مصنفین کے بارے میں

جولیا سو ایمیزون فراڈ ڈیٹیکٹر کے ساتھ ایک ریسرچ سائنٹسٹ ہے۔ وہ مشین لرننگ کی تکنیکوں کا استعمال کرتے ہوئے صارفین کے چیلنجوں کو حل کرنے کے بارے میں پرجوش ہے۔ اپنے فارغ وقت میں، وہ پیدل سفر، پینٹنگ، اور نئی کافی شاپس کی تلاش سے لطف اندوز ہوتی ہے۔

ہاؤ چاؤ ایمیزون فراڈ ڈیٹیکٹر کے ساتھ ایک ریسرچ سائنٹسٹ ہے۔ انہوں نے نارتھ ویسٹرن یونیورسٹی، امریکہ سے الیکٹریکل انجینئرنگ میں پی ایچ ڈی کی ڈگری حاصل کی۔ وہ دھوکہ دہی اور بدسلوکی سے نمٹنے کے لیے مشین لرننگ کی تکنیکوں کو استعمال کرنے کا پرجوش ہے۔

ابھیشیک روی ایمیزون فراڈ ڈیٹیکٹر کے ساتھ ایک سینئر پروڈکٹ مینیجر ہے۔ وہ تکنیکی صلاحیتوں کو بروئے کار لاتے ہوئے ایسی مصنوعات تیار کرنے کے لیے پرجوش ہیں جو صارفین کو خوش کرتے ہیں۔

ٹائم اسٹیمپ: جون 29، 2022

سے زیادہ AWS مشین لرننگ

Frugality درستگی پر پورا اترتا ہے: AWS Trainium کے ساتھ GPT NeoX اور Pythia ماڈلز کی سستی تربیت | ایمیزون ویب سروسز

AWS مشین لرننگ

ماخذ نوڈ: 1218529

ٹائم اسٹیمپ: مارچ 16، 2022

چھوٹی کاریں اور بڑا ہنر کینیڈا کے پالیسی سازوں کو مشین لرننگ کی طاقت دکھاتا ہے۔

ماخذ کلسٹر:

AWS مشین لرننگ

ماخذ نوڈ: 1594996

ٹائم اسٹیمپ: جولائی 26، 2022

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

Frugality درستگی پر پورا اترتا ہے: AWS Trainium کے ساتھ GPT NeoX اور Pythia ماڈلز کی سستی تربیت | ایمیزون ویب سروسز

AWS re:Invent 2022 پر AI/ML کے لیے آپ کا گائیڈ

ایمیزون سیج میکر ڈیٹا رینگلر اور ایمیزون سیج میکر آٹو پائلٹ کے ساتھ متحد ڈیٹا کی تیاری اور ماڈل ٹریننگ

Amazon SageMaker Ground Truth میں Velodyne LiDAR سینسر کے ساتھ LiDAR 3D پوائنٹ کلاؤڈ لیبلنگ

Amazon Personalize اور Amazon OpenSearch Service کے انضمام کے ساتھ اپنے تلاش کے نتائج کو ذاتی بنائیں۔ ایمیزون ویب سروسز

AWS AI خدمات کے ساتھ ذہین دستاویز پروسیسنگ: حصہ 1

ایمیزون سیج میکر ایج مینیجر اور AWS IoT گرین گراس کے ساتھ کنارے پر MLOps

Amazon Textract اور Amazon Comprehend کا استعمال کرتے ہوئے ذہین دستاویز پروسیسنگ کے ساتھ رہن کے دستاویزات پر کارروائی کریں

Amazon Kendra کے لیے Gmail کنیکٹر کا استعمال کرتے ہوئے اپنے Google ورک اسپیس میں تمام ای میلز پر ذہین تلاش کریں۔

Amazon SageMaker JumpStart ماڈلز اور الگورتھم اب API کے ذریعے دستیاب ہیں۔

چھوٹی کاریں اور بڑا ہنر کینیڈا کے پالیسی سازوں کو مشین لرننگ کی طاقت دکھاتا ہے۔

ہمارے متعلق

عمودی تلاش اور Ai

پلیٹ فارم

مربوط رہو

اکاؤنٹ