অনলাইন অ্যাপ্লিকেশন গ্রহণের বৃদ্ধি এবং ইন্টারনেট ব্যবহারকারীদের ক্রমবর্ধমান সংখ্যার সাথে, ডিজিটাল জালিয়াতি বছরের পর বছর বৃদ্ধি পাচ্ছে। আমাজন জালিয়াতি সনাক্তকারী উন্নত মেশিন লার্নিং (এমএল) কৌশল ব্যবহার করে সম্ভাব্য প্রতারণামূলক অনলাইন ক্রিয়াকলাপগুলিকে আরও ভালভাবে শনাক্ত করতে এবং অ্যামাজন থেকে 20 বছরেরও বেশি জালিয়াতি সনাক্তকরণ দক্ষতার সাহায্যে একটি সম্পূর্ণরূপে পরিচালিত পরিষেবা প্রদান করে৷
একাধিক ব্যবহারের ক্ষেত্রে আপনাকে দ্রুত জালিয়াতি ধরতে সাহায্য করার জন্য, Amazon Fraud Detector উপযোগী অ্যালগরিদম, সমৃদ্ধকরণ এবং বৈশিষ্ট্য রূপান্তর সহ নির্দিষ্ট মডেল অফার করে। মডেল প্রশিক্ষণ সম্পূর্ণরূপে স্বয়ংক্রিয় এবং ঝামেলামুক্ত, এবং আপনি নির্দেশাবলী অনুসরণ করতে পারেন ব্যবহারকারী গাইড বা সম্পর্কিত ব্লগ এর লেখাগুলো শুরু করতে. যাইহোক, প্রশিক্ষিত মডেলের সাথে, আপনাকে সিদ্ধান্ত নিতে হবে যে মডেলটি স্থাপনার জন্য প্রস্তুত কিনা। এর জন্য ML, পরিসংখ্যান, এবং জালিয়াতি সনাক্তকরণে নির্দিষ্ট জ্ঞানের প্রয়োজন এবং কিছু সাধারণ পন্থা জানা সহায়ক হতে পারে।
এই পোস্টটি আপনাকে মডেল কর্মক্ষমতা নির্ণয় করতে এবং স্থাপনার জন্য সঠিক মডেল বাছাই করতে সহায়তা করবে। আমরা Amazon Fraud Detector দ্বারা প্রদত্ত মেট্রিক্সের মধ্য দিয়ে হেঁটে যাই, আপনাকে সম্ভাব্য সমস্যাগুলি নির্ণয় করতে সাহায্য করি এবং মডেলের কর্মক্ষমতা উন্নত করার জন্য পরামর্শ প্রদান করি। পদ্ধতিগুলি অনলাইন ফ্রড ইনসাইটস (ওএফআই) এবং ট্রানজ্যাকশন ফ্রড ইনসাইটস (টিএফআই) মডেল টেমপ্লেট উভয়ের ক্ষেত্রেই প্রযোজ্য।
সমাধান ওভারভিউ
এই পোস্টটি আপনার মডেলের কর্মক্ষমতা নির্ণয় করার জন্য একটি এন্ড-টু-এন্ড প্রক্রিয়া প্রদান করে। এটি প্রথমে AUC, স্কোর বিতরণ, বিভ্রান্তি ম্যাট্রিক্স, ROC বক্ররেখা এবং মডেল পরিবর্তনশীল গুরুত্ব সহ Amazon Fraud Detector কনসোলে দেখানো সমস্ত মডেল মেট্রিক্সের সাথে পরিচয় করিয়ে দেয়। তারপরে আমরা বিভিন্ন মেট্রিক্স ব্যবহার করে মডেল কর্মক্ষমতা নির্ণয়ের জন্য একটি তিন-পদক্ষেপ পদ্ধতি উপস্থাপন করি। অবশেষে, আমরা সাধারণ সমস্যাগুলির জন্য মডেলের কর্মক্ষমতা উন্নত করার জন্য পরামর্শ প্রদান করি।
পূর্বশর্ত
আপনার অ্যামাজন জালিয়াতি সনাক্তকারী মডেলের গভীরে যাওয়ার আগে, আপনাকে নিম্নলিখিত পূর্বশর্তগুলি পূরণ করতে হবে:
- একটি AWS অ্যাকাউন্ট তৈরি করুন।
- একটি ইভেন্ট ডেটাসেট তৈরি করুন মডেল প্রশিক্ষণের জন্য।
- আপনার ডেটা আপলোড করুন থেকে আমাজন সিম্পল স্টোরেজ সার্ভিস (Amazon S3) বা অ্যামাজন জালিয়াতি ডিটেক্টরে আপনার ইভেন্ট ডেটা ইনজেস্ট করুন.
- একটি অ্যামাজন জালিয়াতি সনাক্তকারী মডেল তৈরি করুন.
মডেল মেট্রিক্স ব্যাখ্যা করুন
মডেল প্রশিক্ষণ সম্পূর্ণ হওয়ার পরে, Amazon Fraud Detector মডেলিং ডেটার অংশ ব্যবহার করে আপনার মডেলের মূল্যায়ন করে যা মডেল প্রশিক্ষণে ব্যবহার করা হয়নি। এটি মূল্যায়ন মেট্রিক্স প্রদান করে মডেল সংস্করণ সেই মডেলের জন্য পৃষ্ঠা। এই মেট্রিক্সগুলি উত্পাদনে মোতায়েন করার পরে আপনি বাস্তব ডেটাতে যে মডেলের কার্যকারিতা আশা করতে পারেন তা প্রতিফলিত করে।
নিম্নলিখিত স্ক্রিনশটটি অ্যামাজন জালিয়াতি সনাক্তকারী দ্বারা ফিরে আসা মডেলের কর্মক্ষমতার উদাহরণ দেখায়। আপনি স্কোর ডিস্ট্রিবিউশনে বিভিন্ন থ্রেশহোল্ড বেছে নিতে পারেন (বাম), এবং কনফিউশন ম্যাট্রিক্স (ডান) সেই অনুযায়ী আপডেট করা হয়।
কর্মক্ষমতা পরীক্ষা করতে এবং কৌশলের নিয়ম সম্পর্কে সিদ্ধান্ত নিতে আপনি নিম্নলিখিত ফলাফলগুলি ব্যবহার করতে পারেন:
- AUC (বক্ররেখার নিচে এলাকা) - এই মডেলের সামগ্রিক কর্মক্ষমতা. 0.50 এর AUC সহ একটি মডেল একটি কয়েন ফ্লিপের চেয়ে ভাল নয় কারণ এটি এলোমেলো সুযোগের প্রতিনিধিত্ব করে, যেখানে একটি "নিখুঁত" মডেলের স্কোর হবে 1.0৷ AUC যত বেশি হবে, আপনার মডেল তত ভাল জালিয়াতি এবং বৈধতার মধ্যে পার্থক্য করতে পারবে।
- স্কোর বিতরণ - 100,000 ইভেন্টের একটি উদাহরণ জনসংখ্যা অনুমান করে মডেল স্কোর বিতরণের একটি হিস্টোগ্রাম। Amazon Fraud Detector 0-1000 এর মধ্যে মডেল স্কোর তৈরি করে, যেখানে স্কোর যত কম হবে, জালিয়াতির ঝুঁকি তত কম হবে। বৈধ (সবুজ) এবং জালিয়াতি (নীল) জনসংখ্যার মধ্যে ভাল বিচ্ছেদ সাধারণত একটি ভাল মডেল নির্দেশ করে। আরো বিস্তারিত জানার জন্য, দেখুন মডেল স্কোর.
- বিভ্রান্তি ম্যাট্রিক্স - একটি সারণী যা নির্বাচিত প্রদত্ত স্কোর থ্রেশহোল্ডের জন্য মডেল কার্যকারিতা বর্ণনা করে, যার মধ্যে সত্য ইতিবাচক, সত্য নেতিবাচক, মিথ্যা ইতিবাচক, মিথ্যা নেতিবাচক, সত্য পজিটিভ রেট (TPR), এবং মিথ্যা পজিটিভ রেট (FPR) সহ। টেবিলে গণনা 100,0000 ইভেন্টের একটি উদাহরণ জনসংখ্যা অনুমান করে। আরো বিস্তারিত জানার জন্য, দেখুন মডেল কর্মক্ষমতা মেট্রিক্স.
- ROC (রিসিভার অপারেটর চরিত্রগত) বক্ররেখা - একটি প্লট যা মডেলের ডায়গনিস্টিক ক্ষমতাকে চিত্রিত করে, যেমনটি নিম্নলিখিত স্ক্রিনশটে দেখানো হয়েছে। এটি সমস্ত সম্ভাব্য মডেল স্কোর থ্রেশহোল্ডের উপর মিথ্যা ইতিবাচক হারের একটি ফাংশন হিসাবে সত্যিকারের ইতিবাচক হারকে প্লট করে। বেছে নিয়ে এই চার্টটি দেখুন উন্নত মেট্রিক্স. আপনি যদি একটি মডেলের একাধিক সংস্করণ প্রশিক্ষিত করে থাকেন, আপনি কর্মক্ষমতা পরিবর্তন পরীক্ষা করতে বিভিন্ন FPR থ্রেশহোল্ড নির্বাচন করতে পারেন।
- মডেল পরিবর্তনশীল গুরুত্ব - উত্পন্ন মডেলে তাদের অবদানের উপর ভিত্তি করে মডেল ভেরিয়েবলের র্যাঙ্ক, যেমনটি নিম্নলিখিত স্ক্রিনশটে দেখানো হয়েছে। সেই মডেল সংস্করণের জন্য ডেটাসেটের অন্যান্য মডেল ভেরিয়েবলের তুলনায় সর্বোচ্চ মান সহ মডেল ভেরিয়েবলটি মডেলের কাছে বেশি গুরুত্বপূর্ণ এবং ডিফল্টভাবে শীর্ষে তালিকাভুক্ত করা হয়। আরো বিস্তারিত জানার জন্য, দেখুন মডেল পরিবর্তনশীল গুরুত্ব.
মডেল কর্মক্ষমতা নির্ণয়
উত্পাদনে আপনার মডেল স্থাপন করার আগে, মডেলের কার্যকারিতা বুঝতে এবং সম্ভাব্য সমস্যাগুলি নির্ণয় করতে আপনাকে Amazon Fraud Detector ফিরে আসা মেট্রিকগুলি ব্যবহার করতে হবে৷ এমএল মডেলের সাধারণ সমস্যা দুটি প্রধান বিভাগে বিভক্ত করা যেতে পারে: ডেটা-সম্পর্কিত সমস্যা এবং মডেল-সম্পর্কিত সমস্যা। Amazon Fraud Detector আপনার মডেলটিকে মূল্যায়ন করতে এবং ব্যাকএন্ডে টিউন করার জন্য যাচাইকরণ এবং পরীক্ষার সেটগুলি ব্যবহার করে মডেল-সম্পর্কিত সমস্যাগুলির যত্ন নিয়েছে৷ আপনার মডেল স্থাপনের জন্য প্রস্তুত বা সম্ভাব্য ডেটা-সম্পর্কিত সমস্যা আছে কিনা তা যাচাই করতে আপনি নিম্নলিখিত পদক্ষেপগুলি সম্পূর্ণ করতে পারেন:
- সামগ্রিক মডেল কর্মক্ষমতা পরীক্ষা করুন (AUC এবং স্কোর বিতরণ)।
- ব্যবসার প্রয়োজনীয়তা পর্যালোচনা করুন (বিভ্রান্তি ম্যাট্রিক্স এবং টেবিল)।
- মডেল পরিবর্তনশীল গুরুত্ব পরীক্ষা করুন.
সামগ্রিক মডেল কর্মক্ষমতা পরীক্ষা করুন: AUC এবং স্কোর বিতরণ
ভবিষ্যত ইভেন্টগুলির আরও সঠিক ভবিষ্যদ্বাণী সর্বদা একটি ভবিষ্যদ্বাণীমূলক মডেলের প্রাথমিক লক্ষ্য। Amazon Fraud Detector দ্বারা প্রত্যাবর্তিত AUC সঠিকভাবে নমুনাকৃত পরীক্ষার সেটে গণনা করা হয় যা প্রশিক্ষণে ব্যবহৃত হয় না। সাধারণভাবে, 0.9-এর বেশি AUC সহ একটি মডেল একটি ভাল মডেল হিসাবে বিবেচিত হয়।
আপনি যদি 0.8-এর কম পারফরম্যান্স সহ একটি মডেল পর্যবেক্ষণ করেন, তবে এর মানে সাধারণত মডেলটির উন্নতির জন্য জায়গা রয়েছে (আমরা এই পোস্টে পরে কম মডেলের পারফরম্যান্সের জন্য সাধারণ সমস্যাগুলি নিয়ে আলোচনা করব)। মনে রাখবেন যে "ভাল" কর্মক্ষমতার সংজ্ঞা আপনার ব্যবসা এবং বেসলাইন মডেলের উপর নির্ভর করে। আপনি এখনও আপনার Amazon Fraud Detector মডেলটিকে উন্নত করতে এই পোস্টের ধাপগুলি অনুসরণ করতে পারেন যদিও এর AUC 0.8-এর বেশি।
অন্যদিকে, যদি AUC 0.99-এর বেশি হয়, তাহলে এর মানে মডেলটি পরীক্ষা সেটে জালিয়াতি এবং বৈধ ঘটনাগুলিকে প্রায় পুরোপুরি আলাদা করতে পারে। এটি কখনও কখনও একটি "সত্য হতে খুব ভাল" দৃশ্যকল্প (আমরা এই পোস্টে পরে খুব উচ্চ মডেল পারফরম্যান্সের জন্য সাধারণ সমস্যাগুলি নিয়ে আলোচনা করি)।
সামগ্রিক AUC ছাড়াও, স্কোর ডিস্ট্রিবিউশনও আপনাকে বলতে পারে যে মডেলটি কতটা ভালোভাবে ফিট করা হয়েছে। আদর্শভাবে, আপনি স্কেলের দুই প্রান্তে অবস্থিত বেশিরভাগ বৈধ এবং জালিয়াতি দেখতে পাবেন, যা নির্দেশ করে যে মডেল স্কোর পরীক্ষার সেটে ইভেন্টগুলিকে সঠিকভাবে র্যাঙ্ক করতে পারে।
নিম্নলিখিত উদাহরণে, স্কোর বিতরণের একটি AUC 0.96 আছে।
যদি বৈধ এবং জালিয়াতি বিতরণ কেন্দ্রে ওভারল্যাপ করা হয় বা কেন্দ্রীভূত হয়, তাহলে সম্ভবত এর অর্থ হল মডেলটি বৈধ ইভেন্ট থেকে জালিয়াতির ইভেন্টগুলিকে আলাদা করতে ভাল পারফর্ম করে না, যা ঐতিহাসিক ডেটা বিতরণ পরিবর্তিত হতে পারে বা আপনার আরও ডেটা বা বৈশিষ্ট্যের প্রয়োজন হতে পারে।
নিচে 0.64 এর AUC সহ স্কোর বিতরণের একটি উদাহরণ।
আপনি যদি এমন একটি বিভক্ত বিন্দু খুঁজে পান যা জালিয়াতি এবং বৈধ ঘটনাগুলিকে প্রায় পুরোপুরি বিভক্ত করতে পারে, তবে মডেলটিতে একটি লেবেল ফাঁস সমস্যা বা জালিয়াতির ধরণগুলি সনাক্ত করা খুব সহজ, যা আপনার মনোযোগ আকর্ষণ করার একটি উচ্চ সম্ভাবনা রয়েছে৷
নিম্নলিখিত উদাহরণে, স্কোর বিতরণের একটি AUC 1.0 আছে।
ব্যবসার প্রয়োজনীয়তা পর্যালোচনা করুন: বিভ্রান্তি ম্যাট্রিক্স এবং টেবিল
যদিও AUC মডেল পারফরম্যান্সের একটি সুবিধাজনক সূচক, এটি সরাসরি আপনার ব্যবসার প্রয়োজনে অনুবাদ নাও হতে পারে। Amazon Fraud Detector এছাড়াও মেট্রিক্স প্রদান করে যেমন জালিয়াতি ক্যাপচার রেট (সত্য ইতিবাচক হার), বৈধ ইভেন্টের শতাংশ যেগুলিকে জালিয়াতি হিসাবে ভুলভাবে ভবিষ্যদ্বাণী করা হয় (মিথ্যা ইতিবাচক হার), এবং আরও অনেক কিছু, যা সাধারণত ব্যবসার প্রয়োজনীয়তা হিসাবে ব্যবহৃত হয়। আপনি যুক্তিসঙ্গতভাবে ভাল AUC সহ একটি মডেলকে প্রশিক্ষণ দেওয়ার পরে, আপনাকে সেই মেট্রিক্সের সাথে আপনার ব্যবসার প্রয়োজনীয়তার সাথে মডেলটির তুলনা করতে হবে।
বিভ্রান্তি ম্যাট্রিক্স এবং টেবিল আপনাকে প্রভাব পর্যালোচনা করার জন্য একটি ইন্টারফেস প্রদান করে এবং এটি আপনার ব্যবসার চাহিদা পূরণ করে কিনা তা পরীক্ষা করে। মনে রাখবেন যে সংখ্যাগুলি মডেল থ্রেশহোল্ডের উপর নির্ভর করে, যেখানে থ্রেশহোল্ডের চেয়ে বড় স্কোর সহ ইভেন্টগুলিকে জালিয়াতি হিসাবে শ্রেণীবদ্ধ করা হয় এবং থ্রেশহোল্ডের চেয়ে কম স্কোর সহ ইভেন্টগুলিকে বৈধ হিসাবে শ্রেণীবদ্ধ করা হয়৷ আপনার ব্যবসার প্রয়োজনীয়তার উপর নির্ভর করে আপনি কোন থ্রেশহোল্ড ব্যবহার করবেন তা বেছে নিতে পারেন।
উদাহরণস্বরূপ, যদি আপনার লক্ষ্য 73% জালিয়াতি ক্যাপচার করা হয়, তাহলে (নীচের উদাহরণে দেখানো হয়েছে) আপনি একটি থ্রেশহোল্ড বেছে নিতে পারেন যেমন 855, যা আপনাকে সমস্ত জালিয়াতির 73% ক্যাপচার করতে দেয়। যাইহোক, মডেলটি জালিয়াতি হওয়ার জন্য 3% বৈধ ইভেন্টকে ভুল-শ্রেণীবদ্ধ করবে। যদি এই FPR আপনার ব্যবসার জন্য গ্রহণযোগ্য হয়, তাহলে মডেলটি স্থাপনার জন্য ভালো। অন্যথায়, আপনাকে মডেলের কর্মক্ষমতা উন্নত করতে হবে।
আরেকটি উদাহরণ হল যদি একজন বৈধ গ্রাহককে ব্লক করা বা চ্যালেঞ্জ করার খরচ অত্যন্ত বেশি হয়, তাহলে আপনি কম FPR এবং উচ্চ নির্ভুলতা চান। সেই ক্ষেত্রে, আপনি 950-এর একটি থ্রেশহোল্ড বেছে নিতে পারেন, যেমনটি নিম্নলিখিত উদাহরণে দেখানো হয়েছে, যা 1% বৈধ গ্রাহককে জালিয়াতি হিসাবে মিস-শ্রেণিবদ্ধ করবে এবং চিহ্নিত জালিয়াতির 80% প্রকৃতপক্ষে প্রতারণামূলক হবে।
উপরন্তু, আপনি একাধিক থ্রেশহোল্ড চয়ন করতে পারেন এবং বিভিন্ন ফলাফল নির্ধারণ করতে পারেন, যেমন ব্লক, তদন্ত, পাস। আপনি যদি সঠিক থ্রেশহোল্ড এবং নিয়মগুলি খুঁজে না পান যা আপনার সমস্ত ব্যবসার প্রয়োজনীয়তা পূরণ করে, তাহলে আপনাকে আরও ডেটা এবং বৈশিষ্ট্য সহ আপনার মডেলকে প্রশিক্ষণ দেওয়ার কথা বিবেচনা করা উচিত।
মডেল পরিবর্তনশীল গুরুত্ব পরীক্ষা করুন
সার্জারির মডেল পরিবর্তনশীল গুরুত্ব ফলক প্রদর্শন করে কিভাবে প্রতিটি ভেরিয়েবল আপনার মডেলে অবদান রাখে। যদি একটি ভেরিয়েবলের অন্যগুলির তুলনায় উল্লেখযোগ্যভাবে উচ্চ গুরুত্বের মান থাকে, তবে এটি লেবেল ফাঁস নির্দেশ করতে পারে বা জালিয়াতির ধরণগুলি সনাক্ত করা খুব সহজ। নোট করুন যে পরিবর্তনশীল গুরুত্ব আপনার ইনপুট ভেরিয়েবলের সাথে একত্রিত হয়। এর গুরুত্ব একটু বেশি লক্ষ্য করলে IP_ADDRESS
, CARD_BIN
, EMAIL_ADDRESS
, PHONE_NUMBER
, BILLING_ZIP
, বা SHIPPING_ZIP
, এটি সমৃদ্ধকরণের শক্তির কারণে হতে পারে।
নিম্নলিখিত উদাহরণটি ব্যবহার করে একটি সম্ভাব্য লেবেল ফুটো সহ মডেল পরিবর্তনশীল গুরুত্ব দেখায় investigation_status
.
মডেল ভেরিয়েবলের গুরুত্ব আপনাকে ইঙ্গিত দেয় যে অতিরিক্ত ভেরিয়েবলগুলি সম্ভাব্যভাবে মডেলে লিফট আনতে পারে। উদাহরণস্বরূপ, যদি আপনি কম AUC দেখেন এবং বিক্রেতা-সম্পর্কিত বৈশিষ্ট্যগুলি উচ্চ গুরুত্ব দেখায়, আপনি আরও অর্ডার বৈশিষ্ট্য সংগ্রহ করার কথা বিবেচনা করতে পারেন যেমন SELLER_CATEGORY
, SELLER_ADDRESS
, এবং SELLER_ACTIVE_YEARS
, এবং আপনার মডেলে সেই ভেরিয়েবল যোগ করুন।
কম মডেল কর্মক্ষমতা জন্য সাধারণ সমস্যা
এই বিভাগে, আমরা কম মডেল পারফরম্যান্স সম্পর্কিত সাধারণ সমস্যাগুলি নিয়ে আলোচনা করি।
ঐতিহাসিক তথ্য বিতরণ পরিবর্তিত
ঐতিহাসিক ডেটা ডিস্ট্রিবিউশন ড্রিফ্ট ঘটে যখন আপনার একটি বড় ব্যবসায়িক পরিবর্তন বা ডেটা সংগ্রহের সমস্যা হয়। উদাহরণস্বরূপ, যদি আপনি সম্প্রতি একটি নতুন বাজারে আপনার পণ্য চালু করেন, তাহলে IP_ADDRESS
, EMAIL
, এবং ADDRESS
সম্পর্কিত বৈশিষ্ট্য সম্পূর্ণ ভিন্ন হতে পারে, এবং জালিয়াতির পদ্ধতিও পরিবর্তিত হতে পারে। অ্যামাজন জালিয়াতি সনাক্তকারী ব্যবহার করে EVENT_TIMESTAMP
ডেটা বিভক্ত করতে এবং আপনার ডেটাসেটের ইভেন্টগুলির উপযুক্ত উপসেটে আপনার মডেল মূল্যায়ন করতে। যদি আপনার ঐতিহাসিক ডেটা বন্টন উল্লেখযোগ্যভাবে পরিবর্তিত হয়, মূল্যায়ন সেট প্রশিক্ষণ ডেটা থেকে খুব আলাদা হতে পারে, এবং রিপোর্ট করা মডেল কর্মক্ষমতা কম হতে পারে।
আপনি আপনার ঐতিহাসিক ডেটা অন্বেষণ করে সম্ভাব্য ডেটা বিতরণ পরিবর্তনের সমস্যাটি পরীক্ষা করতে পারেন:
- ব্যবহার আমাজন জালিয়াতি সনাক্তকারী ডেটা প্রোফাইলার জালিয়াতির হার এবং লেবেলের অনুপস্থিত হার সময়ের সাথে পরিবর্তিত হয়েছে কিনা তা পরীক্ষা করার সরঞ্জাম।
- সময়ের সাথে পরিবর্তনশীল বিতরণ উল্লেখযোগ্যভাবে পরিবর্তিত হয়েছে কিনা তা পরীক্ষা করুন, বিশেষ করে উচ্চ পরিবর্তনশীল গুরুত্ব সহ বৈশিষ্ট্যগুলির জন্য।
- লক্ষ্য ভেরিয়েবল দ্বারা সময়ের সাথে পরিবর্তনশীল বিতরণ পরীক্ষা করুন। আপনি যদি সাম্প্রতিক ডেটাতে একটি বিভাগ থেকে উল্লেখযোগ্যভাবে আরও বেশি জালিয়াতির ঘটনা লক্ষ্য করেন, তাহলে আপনি আপনার ব্যবসার বিচার ব্যবহার করে পরিবর্তনটি যুক্তিসঙ্গত কিনা তা পরীক্ষা করতে চাইতে পারেন।
যদি আপনি দেখতে পান যে লেবেলের অনুপস্থিত হার খুব বেশি বা সবচেয়ে সাম্প্রতিক তারিখগুলিতে জালিয়াতির হার ধারাবাহিকভাবে কমে গেছে, তাহলে এটি সম্পূর্ণরূপে পরিপক্ক না হওয়া লেবেলগুলির একটি সূচক হতে পারে। আপনার সাম্প্রতিকতম ডেটা বাদ দেওয়া উচিত বা সঠিক লেবেলগুলি সংগ্রহ করার জন্য আরও অপেক্ষা করা উচিত এবং তারপরে আপনার মডেলকে পুনরায় প্রশিক্ষণ দেওয়া উচিত।
আপনি যদি নির্দিষ্ট তারিখে প্রতারণার হার এবং ভেরিয়েবলের একটি তীক্ষ্ণ স্পাইক পর্যবেক্ষণ করেন, তাহলে এটি একটি বহিরাগত বা ডেটা সংগ্রহের সমস্যা কিনা তা আপনি দুবার চেক করতে চাইতে পারেন। সেই ক্ষেত্রে, আপনার সেই ইভেন্টগুলি মুছে ফেলা উচিত এবং মডেলটিকে পুনরায় প্রশিক্ষণ দেওয়া উচিত।
যদি আপনি দেখতে পান যে পুরানো ডেটা আপনার বর্তমান এবং ভবিষ্যতের ব্যবসার প্রতিনিধিত্ব করতে পারে না, তাহলে আপনার প্রশিক্ষণ থেকে ডেটার পুরানো সময়কাল বাদ দেওয়া উচিত। আপনি যদি Amazon Fraud Detector-এ সঞ্চিত ইভেন্টগুলি ব্যবহার করেন, তাহলে আপনি কেবল একটি নতুন সংস্করণকে পুনরায় প্রশিক্ষণ দিতে পারেন এবং প্রশিক্ষণের কাজটি কনফিগার করার সময় সঠিক তারিখের সীমা নির্বাচন করতে পারেন৷ এটি ইঙ্গিতও করতে পারে যে আপনার ব্যবসার জালিয়াতির পদ্ধতি সময়ের সাথে তুলনামূলকভাবে দ্রুত পরিবর্তিত হয়। মডেল স্থাপনের পরে, আপনাকে ঘন ঘন আপনার মডেল পুনরায় প্রশিক্ষণের প্রয়োজন হতে পারে।
অনুপযুক্ত পরিবর্তনশীল টাইপ ম্যাপিং
অ্যামাজন জালিয়াতি সনাক্তকারী পরিবর্তনশীল প্রকারের উপর ভিত্তি করে ডেটা সমৃদ্ধ করে এবং রূপান্তর করে। এটি গুরুত্বপূর্ণ যে আপনি আপনার ভেরিয়েবলগুলিকে সঠিক প্রকারে ম্যাপ করুন যাতে Amazon Fraud Detector মডেল আপনার ডেটার সর্বোচ্চ মান নিতে পারে৷ উদাহরণস্বরূপ, যদি আপনি মানচিত্র IP
থেকে CATEGORICAL
এর পরিবর্তে টাইপ করুন IP_ADDRESS
, আপনি পাবেন না IP-
ব্যাকএন্ডে সম্পর্কিত সমৃদ্ধি।
সাধারণভাবে, অ্যামাজন জালিয়াতি সনাক্তকারী নিম্নলিখিত ক্রিয়াগুলির পরামর্শ দেয়:
- আপনার ভেরিয়েবলগুলিকে নির্দিষ্ট প্রকারে ম্যাপ করুন, যেমন
IP_ADDRESS
,EMAIL_ADDRESS
,CARD_BIN
, এবংPHONE_NUMBER
, যাতে Amazon Fraud Detector অতিরিক্ত তথ্য আহরণ ও সমৃদ্ধ করতে পারে। - আপনি যদি নির্দিষ্ট পরিবর্তনশীল প্রকার খুঁজে না পান তবে এটিকে তিনটি জেনেরিক প্রকারের একটিতে ম্যাপ করুন:
NUMERIC
,CATEGORICAL
, বাFREE_FORM_TEXT
. - যদি একটি ভেরিয়েবল টেক্সট আকারে থাকে এবং উচ্চ কার্ডিনালিটি থাকে, যেমন একটি গ্রাহক পর্যালোচনা বা পণ্যের বিবরণ, তাহলে আপনার এটিকে ম্যাপ করা উচিত
FREE_FORM_TEXT
পরিবর্তনশীল প্রকার যাতে Amazon Fraud Detector আপনার জন্য ব্যাকএন্ডে টেক্সট বৈশিষ্ট্য এবং এম্বেডিং বের করে। উদাহরণস্বরূপ, যদি আপনি মানচিত্রurl_string
থেকেFREE_FORM_TEXT
, এটি ইউআরএলকে টোকেনাইজ করতে এবং ডাউনস্ট্রিম মডেলে ফিড করার জন্য তথ্য বের করতে সক্ষম, যা এটিকে ইউআরএল থেকে আরও লুকানো প্যাটার্ন শিখতে সাহায্য করবে।
আপনি যদি দেখেন যে আপনার ভেরিয়েবলের ধরনগুলির মধ্যে একটি পরিবর্তনশীল কনফিগারেশনে ভুলভাবে ম্যাপ করা হয়েছে, আপনি আপনার পরিবর্তনশীল প্রকার পরিবর্তন করতে পারেন এবং তারপরে মডেলটিকে পুনরায় প্রশিক্ষণ দিতে পারেন।
অপর্যাপ্ত ডেটা বা বৈশিষ্ট্য
একটি অনলাইন জালিয়াতি ইনসাইট (OFI) বা লেনদেন জালিয়াতি অন্তর্দৃষ্টি (TFI) মডেল প্রশিক্ষণের জন্য Amazon Fraud Detector-এর কমপক্ষে 10,000 রেকর্ডের প্রয়োজন, যার মধ্যে অন্তত 400টি রেকর্ড জালিয়াতি হিসাবে চিহ্নিত৷ ডাটাসেটের বৈচিত্র্য নিশ্চিত করার জন্য TFI-এর জন্যও প্রতারণামূলক রেকর্ড এবং বৈধ রেকর্ড উভয়ই কমপক্ষে 100টি ভিন্ন সত্তা থেকে আসা প্রয়োজন। উপরন্তু, Amazon Fraud Detector-এর জন্য মডেলিং ডেটাতে কমপক্ষে দুটি ভেরিয়েবল থাকতে হবে। একটি দরকারী অ্যামাজন জালিয়াতি সনাক্তকারী মডেল তৈরি করার জন্য এগুলি সর্বনিম্ন ডেটা প্রয়োজনীয়তা। যাইহোক, আরও রেকর্ড এবং ভেরিয়েবল ব্যবহার করা সাধারণত ML মডেলগুলিকে আপনার ডেটা থেকে অন্তর্নিহিত নিদর্শনগুলি আরও ভালভাবে শিখতে সহায়তা করে। যখন আপনি একটি কম AUC লক্ষ্য করেন বা আপনার ব্যবসার প্রয়োজনীয়তা পূরণ করে এমন থ্রেশহোল্ড খুঁজে পান না, তখন আপনার মডেলকে আরও ডেটা দিয়ে পুনরায় প্রশিক্ষণ দেওয়ার বা আপনার মডেলে নতুন বৈশিষ্ট্য যোগ করার কথা বিবেচনা করা উচিত। সাধারণত, আমরা খুঁজে EMAIL_ADDRESS
, IP
, PAYMENT_TYPE
, BILLING_ADDRESS
, SHIPPING_ADDRESS
, এবং DEVICE
সম্পর্কিত ভেরিয়েবল জালিয়াতি সনাক্তকরণ গুরুত্বপূর্ণ.
আরেকটি সম্ভাব্য কারণ হল আপনার কিছু ভেরিয়েবলে অনেকগুলি অনুপস্থিত মান রয়েছে। এটি ঘটছে কিনা তা দেখতে, মডেল প্রশিক্ষণ বার্তাগুলি দেখুন এবং পড়ুন প্রশিক্ষণ ডেটা সংক্রান্ত সমস্যা সমাধান করুন পরামর্শের জন্য।
খুব উচ্চ মডেল কর্মক্ষমতা জন্য সাধারণ সমস্যা
এই বিভাগে, আমরা খুব উচ্চ মডেল পারফরম্যান্স সম্পর্কিত সাধারণ সমস্যাগুলি নিয়ে আলোচনা করি।
লেবেল ফুটো
লেবেল ফাঁস ঘটে যখন প্রশিক্ষণ ডেটাসেটগুলি এমন তথ্য ব্যবহার করে যা পূর্বাভাসের সময়ে উপলব্ধ হবে বলে আশা করা যায় না। এটি একটি উত্পাদন পরিবেশে চালানোর সময় মডেলের উপযোগিতাকে অত্যধিক মূল্যায়ন করে।
উচ্চ AUC (1 এর কাছাকাছি), পুরোপুরি পৃথক স্কোর বিতরণ, এবং একটি পরিবর্তনশীলের উল্লেখযোগ্যভাবে উচ্চ পরিবর্তনশীল গুরুত্ব সম্ভাব্য লেবেল ফুটো সমস্যার সূচক হতে পারে। আপনি ব্যবহার করে বৈশিষ্ট্য এবং লেবেলের মধ্যে পারস্পরিক সম্পর্ক পরীক্ষা করতে পারেন ডেটা প্রোফাইলার. দ্য বৈশিষ্ট্য এবং লেবেল পারস্পরিক সম্পর্ক প্লট প্রতিটি বৈশিষ্ট্য এবং লেবেলের মধ্যে পারস্পরিক সম্পর্ক দেখায়। যদি একটি বৈশিষ্ট্য লেবেলের সাথে 0.99-এর বেশি সম্পর্ক থাকে, তাহলে ব্যবসার বিচারের ভিত্তিতে বৈশিষ্ট্যটি সঠিকভাবে ব্যবহার করা হয়েছে কিনা তা আপনার পরীক্ষা করা উচিত। উদাহরণস্বরূপ, একটি ঋণ আবেদন অনুমোদন বা প্রত্যাখ্যান করার জন্য একটি ঝুঁকির মডেল তৈরি করতে, আপনার যেমন বৈশিষ্ট্যগুলি ব্যবহার করা উচিত নয় AMOUNT_PAID
, কারণ পেমেন্ট আন্ডাররাইটিং প্রক্রিয়ার পরে ঘটে। আপনি ভবিষ্যদ্বাণী করার সময় যদি একটি ভেরিয়েবল উপলব্ধ না হয়, তাহলে আপনাকে মডেল কনফিগারেশন থেকে সেই ভেরিয়েবলটি সরিয়ে ফেলতে হবে এবং একটি নতুন মডেলকে পুনরায় প্রশিক্ষণ দিতে হবে।
নিম্নলিখিত উদাহরণটি প্রতিটি পরিবর্তনশীল এবং লেবেলের মধ্যে পারস্পরিক সম্পর্ক দেখায়। investigation_status
লেবেলের সাথে একটি উচ্চ সম্পর্ক (1 এর কাছাকাছি) আছে, তাই লেবেল ফুটো হওয়ার সমস্যা আছে কিনা তা আপনার দুবার পরীক্ষা করা উচিত।
সহজ জালিয়াতি নিদর্শন
যখন আপনার ডেটাতে জালিয়াতির ধরণগুলি সহজ হয়, তখন আপনি খুব উচ্চ মডেলের কার্যক্ষমতাও দেখতে পারেন। উদাহরণস্বরূপ, ধরুন মডেলিং ডেটার সমস্ত জালিয়াতির ঘটনা একই অভ্যন্তরীণ পরিষেবা প্রদানকারীর মাধ্যমে আসে; মডেল বাছাই করার জন্য এটি সোজা IP-
সম্পর্কিত ভেরিয়েবল এবং উচ্চ গুরুত্ব সহ একটি "নিখুঁত" মডেল ফেরত দেয় IP
.
সাধারণ জালিয়াতির ধরণগুলি সর্বদা একটি ডেটা সমস্যা নির্দেশ করে না। এটা সত্য হতে পারে যে আপনার ব্যবসার জালিয়াতির মোডাস অপারেন্ডি ক্যাপচার করা সহজ। যাইহোক, একটি উপসংহারে আসার আগে, আপনাকে নিশ্চিত করতে হবে যে মডেল প্রশিক্ষণে ব্যবহৃত লেবেলগুলি সঠিক, এবং মডেলিং ডেটা যতটা সম্ভব জালিয়াতির ধরণগুলিকে কভার করে৷ উদাহরণস্বরূপ, যদি আপনি নিয়মের উপর ভিত্তি করে আপনার জালিয়াতির ঘটনা লেবেল করেন, যেমন একটি নির্দিষ্ট থেকে সমস্ত অ্যাপ্লিকেশনকে লেবেল করা BILLING_ZIP
যোগ PRODUCT_CATEGORY
জালিয়াতি হিসাবে, মডেলটি নিয়ম অনুকরণ করে এবং একটি উচ্চ AUC অর্জন করে সেই জালিয়াতিগুলিকে সহজেই ধরতে পারে।
আপনি ব্যবহার করে প্রতিটি বৈশিষ্ট্যের বিভিন্ন বিভাগ বা বিন জুড়ে লেবেল বিতরণ পরীক্ষা করতে পারেন ডেটা প্রোফাইলার. উদাহরণস্বরূপ, আপনি যদি দেখেন যে বেশিরভাগ জালিয়াতির ঘটনা এক বা কয়েকটি পণ্য বিভাগ থেকে আসে, তাহলে এটি সাধারণ জালিয়াতির ধরণগুলির একটি সূচক হতে পারে এবং আপনাকে নিশ্চিত করতে হবে যে এটি কোনও ডেটা সংগ্রহ বা প্রক্রিয়া ভুল নয়। যদি ফিচার লাইক হয় CUSTOMER_ID
, মডেল প্রশিক্ষণে আপনার বৈশিষ্ট্যটি বাদ দেওয়া উচিত।
নিম্নলিখিত উদাহরণটি বিভিন্ন শ্রেণীতে লেবেল বিতরণ দেখায় product_category
. সমস্ত জালিয়াতি দুটি পণ্য বিভাগ থেকে আসে।
অনুপযুক্ত ডেটা স্যাম্পলিং
অনুপযুক্ত ডেটা স্যাম্পলিং ঘটতে পারে যখন আপনি নমুনা নেন এবং শুধুমাত্র আপনার ডেটার কিছু অংশ Amazon Fraud Detector-এ পাঠান। যদি ডেটা সঠিকভাবে নমুনা না করা হয় এবং উত্পাদনে ট্র্যাফিকের প্রতিনিধি না হয়, রিপোর্ট করা মডেলের কার্যকারিতা ভুল হবে এবং মডেলটি উত্পাদন পূর্বাভাসের জন্য অকেজো হতে পারে। উদাহরণস্বরূপ, যদি মডেলিং ডেটাতে সমস্ত জালিয়াতি ঘটনা এশিয়া থেকে নমুনা করা হয় এবং সমস্ত বৈধ ইভেন্ট মার্কিন যুক্তরাষ্ট্র থেকে নমুনা করা হয়, তাহলে মডেলটি জালিয়াতি এবং বৈধকে আলাদা করতে শিখতে পারে BILLING_COUNTRY
. সেই ক্ষেত্রে, মডেলটি অন্যান্য জনসংখ্যার জন্য প্রয়োগ করার জন্য জেনেরিক নয়।
সাধারণত, আমরা নমুনা ছাড়াই সব সাম্প্রতিক ইভেন্ট পাঠানোর পরামর্শ দিই। ডেটার আকার এবং জালিয়াতির হারের উপর ভিত্তি করে, Amazon Fraud Detector আপনার জন্য মডেল প্রশিক্ষণের আগে নমুনা নেয়। যদি আপনার ডেটা খুব বড় হয় (100 গিগাবাইটের বেশি) এবং আপনি নমুনা দেওয়ার এবং শুধুমাত্র একটি উপসেট পাঠানোর সিদ্ধান্ত নেন, তাহলে আপনাকে এলোমেলোভাবে আপনার ডেটার নমুনা নিতে হবে এবং নিশ্চিত করুন যে নমুনাটি সমগ্র জনসংখ্যার প্রতিনিধি। TFI-এর জন্য, আপনার সত্তা দ্বারা আপনার ডেটা নমুনা করা উচিত, যার অর্থ যদি একটি সত্তা নমুনা করা হয়, তাহলে আপনাকে তার সমস্ত ইতিহাস অন্তর্ভুক্ত করতে হবে যাতে সত্তা স্তরের সমষ্টি সঠিকভাবে গণনা করা হয়। মনে রাখবেন যে আপনি যদি শুধুমাত্র Amazon Fraud Detector-এ ডেটার একটি উপসেট পাঠান, তাহলে অনুমানের সময় রিয়েল-টাইম অ্যাগ্রিগেটগুলি ভুল হতে পারে যদি সত্তার পূর্ববর্তী ঘটনাগুলি পাঠানো না হয়।
আরেকটি অনুপযুক্ত ডেটা স্যাম্পলিং মডেলটি তৈরি করতে শুধুমাত্র একটি দিনের ডেটার মতো অল্প সময়ের ডেটা ব্যবহার করতে পারে। ডেটা পক্ষপাতদুষ্ট হতে পারে, বিশেষ করে যদি আপনার ব্যবসা বা জালিয়াতি আক্রমণে মৌসুমী থাকে। আমরা সাধারণত জালিয়াতির প্রকারের বৈচিত্র্য নিশ্চিত করতে মডেলিং-এ কমপক্ষে দুটি চক্রের (যেমন 2 সপ্তাহ বা 2 মাস) মূল্যের ডেটা অন্তর্ভুক্ত করার সুপারিশ করি৷
উপসংহার
সমস্ত সম্ভাব্য সমস্যা নির্ণয় এবং সমাধান করার পরে, আপনার একটি দরকারী অ্যামাজন জালিয়াতি সনাক্তকারী মডেল পাওয়া উচিত এবং এর কার্যকারিতা সম্পর্কে আত্মবিশ্বাসী হওয়া উচিত। পরবর্তী ধাপের জন্য, আপনি মডেল এবং আপনার ব্যবসার নিয়ম সহ একটি ডিটেক্টর তৈরি করতে পারে, এবং ছায়া মোড মূল্যায়নের জন্য উৎপাদনে এটি স্থাপন করতে প্রস্তুত থাকুন।
উপাঙ্গ
মডেল প্রশিক্ষণের জন্য ভেরিয়েবলগুলি কীভাবে বাদ দেওয়া যায়
গভীর ডুব দেওয়ার পরে, আপনি একটি পরিবর্তনশীল ফাঁস লক্ষ্য তথ্য সনাক্ত করতে পারেন এবং মডেল প্রশিক্ষণ থেকে এটি বাদ দিতে চান। আপনি নিম্নলিখিত পদক্ষেপগুলি সম্পূর্ণ করার মাধ্যমে আপনি চান না এমন ভেরিয়েবলগুলি বাদ দিয়ে একটি মডেল সংস্করণকে পুনরায় প্রশিক্ষণ দিতে পারেন:
- আমাজন ফ্রড ডিটেক্টর কনসোলে, নেভিগেশন ফলকে, নির্বাচন করুন মডেল.
- উপরে মডেল পৃষ্ঠা, আপনি পুনরায় প্রশিক্ষণ দিতে চান মডেল নির্বাচন করুন.
- উপরে কার্যপ্রণালী মেনু, নির্বাচন করুন নতুন সংস্করণ ট্রেন.
- আপনি যে তারিখ পরিসীমা ব্যবহার করতে চান তা নির্বাচন করুন এবং চয়ন করুন পরবর্তী.
- উপরে প্রশিক্ষণ কনফিগার করুন পৃষ্ঠায়, আপনি মডেল প্রশিক্ষণে ব্যবহার করতে চান না এমন ভেরিয়েবলটি অনির্বাচন করুন।
- আপনার জালিয়াতির লেবেল এবং বৈধ লেবেলগুলি নির্দিষ্ট করুন এবং আপনি কীভাবে অ্যামাজন জালিয়াতি সনাক্তকারীকে লেবেলবিহীন ইভেন্টগুলি ব্যবহার করতে চান, তারপর বেছে নিন পরবর্তী.
- মডেল কনফিগারেশন পর্যালোচনা করুন এবং চয়ন করুন মডেল তৈরি করুন এবং প্রশিক্ষণ দিন.
কিভাবে ইভেন্ট ভেরিয়েবল টাইপ পরিবর্তন করতে হয়
ভেরিয়েবলগুলি জালিয়াতি প্রতিরোধে ব্যবহৃত ডেটা উপাদানগুলির প্রতিনিধিত্ব করে। Amazon Fraud Detector-এ, সমস্ত ভেরিয়েবল বিশ্বব্যাপী এবং সমস্ত ইভেন্ট এবং মডেল জুড়ে শেয়ার করা হয়, যার মানে একাধিক ইভেন্টে একটি ভেরিয়েবল ব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, আইপি সাইন-ইন ইভেন্টগুলির সাথে যুক্ত হতে পারে এবং এটি লেনদেন ইভেন্টগুলির সাথেও যুক্ত হতে পারে৷ স্বাভাবিকভাবেই, অ্যামাজন ফ্রড ডিটেক্টর ভেরিয়েবল তৈরি হয়ে গেলে ভেরিয়েবল টাইপ এবং ডেটা টাইপ লক করে দেয়। একটি বিদ্যমান ভেরিয়েবল মুছতে, আপনাকে প্রথমে সমস্ত সম্পর্কিত ইভেন্ট প্রকার এবং মডেল মুছে ফেলতে হবে। আপনি Amazon Fraud Detector-এ নেভিগেট করে নির্দিষ্ট ভেরিয়েবলের সাথে সম্পর্কিত সংস্থানগুলি পরীক্ষা করতে পারেন, বেছে নিতে পারেন ভেরিয়েবল নেভিগেশন প্যানে, এবং পরিবর্তনশীল নাম নির্বাচন করা এবং সংশ্লিষ্ট সম্পদ.
পরিবর্তনশীল এবং সমস্ত সম্পর্কিত ইভেন্ট প্রকার মুছুন
ভেরিয়েবল মুছতে, নিম্নলিখিত পদক্ষেপগুলি সম্পূর্ণ করুন:
- আমাজন ফ্রড ডিটেক্টর কনসোলে, নেভিগেশন ফলকে, নির্বাচন করুন ভেরিয়েবল.
- আপনি যে ভেরিয়েবলটি মুছতে চান তা বেছে নিন।
- বেছে নিন সংশ্লিষ্ট সম্পদ এই ভেরিয়েবল ব্যবহার করা সমস্ত ইভেন্ট প্রকারের একটি তালিকা দেখতে।
ভেরিয়েবলটি মুছে ফেলার আগে আপনাকে সেই সম্পর্কিত ইভেন্ট প্রকারগুলি মুছতে হবে। - সংশ্লিষ্ট ইভেন্ট টাইপ পৃষ্ঠায় যেতে তালিকা থেকে ইভেন্টের ধরন বেছে নিন।
- বেছে নিন সংরক্ষিত ঘটনা এই ইভেন্ট টাইপের অধীনে কোনো ডেটা সংরক্ষণ করা হয়েছে কিনা তা পরীক্ষা করতে।
- যদি অ্যামাজন জালিয়াতি সনাক্তকারীতে ইভেন্টগুলি সংরক্ষিত থাকে তবে বেছে নিন সঞ্চিত ইভেন্টগুলি মুছুন সংরক্ষিত ঘটনা মুছে ফেলার জন্য.
মুছে ফেলার কাজটি সম্পূর্ণ হলে, "এই ইভেন্টের প্রকারের জন্য সঞ্চিত ইভেন্ট সফলভাবে মুছে ফেলা হয়েছে" বার্তাটি প্রদর্শিত হবে। - বেছে নিন সংশ্লিষ্ট সম্পদ.
যদি ডিটেক্টর এবং মডেলগুলি এই ইভেন্টের সাথে যুক্ত থাকে, তাহলে আপনাকে প্রথমে সেই সংস্থানগুলি মুছতে হবে৷ - যদি ডিটেক্টরগুলি যুক্ত থাকে তবে সমস্ত সম্পর্কিত ডিটেক্টরগুলি মুছে ফেলার জন্য নিম্নলিখিত পদক্ষেপগুলি সম্পূর্ণ করুন:
- যেতে ডিটেক্টর চয়ন করুন ডিটেক্টর বিবরণ পাতা.
- মধ্যে মডেল সংস্করণ প্যানে, ডিটেক্টরের সংস্করণ নির্বাচন করুন।
- আবিষ্কারক সংস্করণ পৃষ্ঠায়, নির্বাচন করুন কার্যপ্রণালী.
- ডিটেক্টর সংস্করণ সক্রিয় হলে, চয়ন করুন কর্মততপরতা বান্দ করানির্বাচন এই ডিটেক্টর সংস্করণটিকে অন্য সংস্করণ দিয়ে প্রতিস্থাপন না করে নিষ্ক্রিয় করুন৷, এবং চয়ন করুন ডিটেক্টর সংস্করণ নিষ্ক্রিয় করুন।
- ডিটেক্টর সংস্করণ নিষ্ক্রিয় করার পরে, নির্বাচন করুন কার্যপ্রণালী এবং তারপর মুছে ফেলা.
- সমস্ত ডিটেক্টর সংস্করণ মুছে ফেলতে এই পদক্ষেপগুলি পুনরাবৃত্তি করুন।
- উপরে ডিটেক্টর বিবরণ পৃষ্ঠা, চয়ন করুন সংশ্লিষ্ট নিয়ম.
- মুছে ফেলার নিয়ম বেছে নিন।
- বেছে নিন কার্যপ্রণালী এবং নিয়ম সংস্করণ মুছুন.
- নিশ্চিত করতে এবং চয়ন করতে নিয়মের নাম লিখুন সংস্করণ মুছুন.
- সমস্ত সম্পর্কিত নিয়ম মুছে ফেলতে এই পদক্ষেপগুলি পুনরাবৃত্তি করুন।
- সব ডিটেক্টর সংস্করণ এবং সংশ্লিষ্ট নিয়ম মুছে ফেলার পরে, যান ডিটেক্টর বিবরণ পৃষ্ঠা, চয়ন করুন কার্যপ্রণালী, এবং চয়ন করুন ডিটেক্টর মুছুন.
- ডিটেক্টরের নাম লিখুন এবং নির্বাচন করুন ডিটেক্টর মুছুন.
- পরবর্তী ডিটেক্টর মুছে ফেলতে এই পদক্ষেপগুলি পুনরাবৃত্তি করুন।
- যদি কোনো মডেল ইভেন্ট প্রকারের সাথে যুক্ত থাকে, সেগুলি মুছে ফেলার জন্য নিম্নলিখিত পদক্ষেপগুলি সম্পূর্ণ করুন:
- মডেলের নাম নির্বাচন করুন।
- মধ্যে মডেল সংস্করণ ফলক, সংস্করণ নির্বাচন করুন।
- মডেল স্ট্যাটাস হলে
Active
নির্বাচন কার্যপ্রণালী এবং মডেল সংস্করণ আনডিপ্লয় করুন. - প্রবেশ করান
undeploy
নিশ্চিত করতে এবং চয়ন করতে মডেল সংস্করণ আনডিপ্লয় করুন.
স্থিতি পরিবর্তিত হয়Undeploying
. প্রক্রিয়াটি সম্পূর্ণ হতে কয়েক মিনিট সময় নেয়। - স্ট্যাটাস হয়ে যাওয়ার পর
Ready to deploy
, অ্যাকশন নির্বাচন করুন এবং মুছুন। - সমস্ত মডেল সংস্করণ মুছে ফেলার জন্য এই পদক্ষেপগুলি পুনরাবৃত্তি করুন৷
- মডেলের বিবরণ পৃষ্ঠায়, অ্যাকশন এবং মডেল মুছুন নির্বাচন করুন।
- মডেলের নাম লিখুন এবং মডেল মুছুন নির্বাচন করুন।
- পরবর্তী মডেল মুছে ফেলার জন্য এই পদক্ষেপগুলি পুনরাবৃত্তি করুন।
- সমস্ত সংশ্লিষ্ট ডিটেক্টর এবং মডেল মুছে ফেলার পরে, নির্বাচন করুন কার্যপ্রণালী এবং ইভেন্টের ধরন মুছুন উপরে অনুষ্ঠানের বিবরণ পাতা.
- ইভেন্টের প্রকারের নাম লিখুন এবং নির্বাচন করুন ইভেন্টের ধরন মুছুন.
- নেভিগেশন ফলকে, নির্বাচন করুন ভেরিয়েবল, এবং আপনি যে ভেরিয়েবলটি মুছতে চান তা নির্বাচন করুন।
- ভেরিয়েবলের সাথে যুক্ত সমস্ত ইভেন্ট প্রকার মুছে ফেলার জন্য আগের পদক্ষেপগুলি পুনরাবৃত্তি করুন।
- উপরে পরিবর্তনশীল বিবরণ পৃষ্ঠা, চয়ন করুন কার্যপ্রণালী এবং মুছে ফেলা.
- ভেরিয়েবলের নাম লিখুন এবং নির্বাচন করুন পরিবর্তনশীল মুছুন.
সঠিক ভেরিয়েবল টাইপ দিয়ে একটি নতুন ভেরিয়েবল তৈরি করুন
আপনি Amazon Fraud Detector থেকে ভেরিয়েবল এবং সমস্ত সম্পর্কিত ইভেন্ট প্রকার, সংরক্ষিত ইভেন্ট, মডেল এবং ডিটেক্টর মুছে ফেলার পরে, আপনি একই নামের একটি নতুন ভেরিয়েবল তৈরি করতে পারেন এবং এটি সঠিক পরিবর্তনশীল প্রকারে ম্যাপ করতে পারেন।
- আমাজন ফ্রড ডিটেক্টর কনসোলে, নেভিগেশন ফলকে, নির্বাচন করুন ভেরিয়েবল.
- বেছে নিন সৃষ্টি.
- আপনি পরিবর্তন করতে চান এমন পরিবর্তনশীল নাম লিখুন (যেটি আপনি আগে মুছে ফেলেছেন)।
- আপনি পরিবর্তন করতে চান সঠিক পরিবর্তনশীল প্রকার নির্বাচন করুন.
- বেছে নিন পরিবর্তনশীল তৈরি করুন।
ডেটা আপলোড করুন এবং মডেলটিকে পুনরায় প্রশিক্ষণ দিন
আপনি পরিবর্তনশীল প্রকার আপডেট করার পরে, আপনি আবার ডেটা আপলোড করতে পারেন এবং একটি নতুন মডেলকে প্রশিক্ষণ দিতে পারেন। নির্দেশাবলীর জন্য, পড়ুন নতুন Amazon Fraud Detector বৈশিষ্ট্য সহ অনলাইন লেনদেন জালিয়াতি সনাক্ত করুন৷.
একটি বিদ্যমান ইভেন্ট টাইপে নতুন ভেরিয়েবল কিভাবে যোগ করবেন
বিদ্যমান ইভেন্ট প্রকারে নতুন ভেরিয়েবল যোগ করতে, নিম্নলিখিত পদক্ষেপগুলি সম্পূর্ণ করুন:
- পূর্ববর্তী প্রশিক্ষণ CVS ফাইলে নতুন ভেরিয়েবল যোগ করুন।
- একটি S3 বালতিতে নতুন প্রশিক্ষণ ডেটা ফাইল আপলোড করুন। আপনার প্রশিক্ষণ ফাইলের Amazon S3 অবস্থান নোট করুন (উদাহরণস্বরূপ,
s3://bucketname/path/to/some/object.csv
) এবং আপনার ভূমিকার নাম। - আমাজন ফ্রড ডিটেক্টর কনসোলে, নেভিগেশন ফলকে, নির্বাচন করুন ঘটনাবলী।
- উপরে ইভেন্টের ধরন পৃষ্ঠা, আপনি ভেরিয়েবল যোগ করতে চান ইভেন্ট ধরনের নাম নির্বাচন করুন.
- উপরে ইভেন্টের ধরণ বিস্তারিত পৃষ্ঠা, নির্বাচন করুন কার্যপ্রণালী, তারপর ভেরিয়েবল যোগ করুন.
- অধীনে এই ইভেন্টের ভেরিয়েবলগুলি কীভাবে সংজ্ঞায়িত করবেন তা চয়ন করুন৷নির্বাচন একটি প্রশিক্ষণ ডেটাসেট থেকে ভেরিয়েবল নির্বাচন করুন.
- IAM ভূমিকার জন্য, একটি বিদ্যমান IAM ভূমিকা নির্বাচন করুন বা Amazon S3-এ ডেটা অ্যাক্সেস করতে একটি নতুন ভূমিকা তৈরি করুন৷
- জন্য ডেটা অবস্থান, নতুন প্রশিক্ষণ ফাইলের S3 অবস্থান লিখুন এবং নির্বাচন করুন আপলোড করুন।
বিদ্যমান ইভেন্টের ধরণে উপস্থিত নয় এমন নতুন ভেরিয়েবল তালিকায় দেখা উচিত।
- বেছে নিন ভেরিয়েবল যোগ করুন।
এখন, বিদ্যমান ইভেন্ট টাইপে নতুন ভেরিয়েবল যোগ করা হয়েছে। আপনি যদি Amazon Fraud Detector-এ সঞ্চিত ইভেন্ট ব্যবহার করেন, তাহলে সঞ্চিত ইভেন্টের নতুন ভেরিয়েবল এখনও অনুপস্থিত। আপনাকে অ্যামাজন জালিয়াতি সনাক্তকারীতে নতুন ভেরিয়েবল সহ প্রশিক্ষণ ডেটা আমদানি করতে হবে এবং তারপরে একটি নতুন মডেল সংস্করণ পুনরায় প্রশিক্ষণ দিতে হবে। নতুন প্রশিক্ষণের ডেটা আপলোড করার সময় একই সাথে EVENT_ID
এবং EVENT_TIMESTAMP
, নতুন ইভেন্ট ভেরিয়েবলগুলি Amazon Fraud Detector-এ সংরক্ষিত পূর্ববর্তী ইভেন্ট ভেরিয়েবলগুলিকে ওভাররাইট করে৷
লেখক সম্পর্কে
জুলিয়া জু অ্যামাজন জালিয়াতি সনাক্তকারীর সাথে একজন গবেষণা বিজ্ঞানী। তিনি মেশিন লার্নিং কৌশল ব্যবহার করে গ্রাহকের চ্যালেঞ্জগুলি সমাধান করার বিষয়ে উত্সাহী। তার অবসর সময়ে, সে হাইকিং, পেইন্টিং এবং নতুন কফি শপ অন্বেষণ উপভোগ করে।
হাও ঝাউ অ্যামাজন জালিয়াতি সনাক্তকারীর সাথে একজন গবেষণা বিজ্ঞানী। তিনি যুক্তরাষ্ট্রের নর্থওয়েস্টার্ন ইউনিভার্সিটি থেকে ইলেকট্রিক্যাল ইঞ্জিনিয়ারিংয়ে পিএইচডি করেছেন। তিনি জালিয়াতি এবং অপব্যবহার মোকাবেলায় মেশিন লার্নিং কৌশল প্রয়োগ করার বিষয়ে উত্সাহী।
অভিষেক রবি আমাজন জালিয়াতি সনাক্তকারীর সাথে একজন সিনিয়র প্রোডাক্ট ম্যানেজার। গ্রাহকদের আনন্দ দেয় এমন পণ্য তৈরি করার জন্য তিনি প্রযুক্তিগত ক্ষমতার ব্যবহার সম্পর্কে উত্সাহী।
- Coinsmart. ইউরোপের সেরা বিটকয়েন এবং ক্রিপ্টো এক্সচেঞ্জ।
- প্লেটোব্লকচেন। Web3 মেটাভার্স ইন্টেলিজেন্স। জ্ঞান প্রসারিত. বিনামূল্যে এক্সেস.
- ক্রিপ্টোহক। Altcoin রাডার। বিনামূল্যে ট্রায়াল.
- সূত্র: https://aws.amazon.com/blogs/machine-learning/diagnose-model-performance-before-deployment-for-amazon-fraud-detector/
- "
- 000
- 10
- 100
- 20 বছর
- 9
- a
- ক্ষমতা
- সম্পর্কে
- প্রবেশ
- তদনুসারে
- হিসাব
- সঠিক
- দিয়ে
- স্টক
- সক্রিয়
- ক্রিয়াকলাপ
- যোগ
- যোগ
- অতিরিক্ত
- গ্রহণ
- অগ্রসর
- আলগোরিদিম
- সব
- অনুমতি
- সর্বদা
- মর্দানী স্ত্রীলোক
- প্রাসঙ্গিক
- আবেদন
- অ্যাপ্লিকেশন
- ফলিত
- প্রয়োগ করা হচ্ছে
- অভিগমন
- পন্থা
- যথাযথ
- অনুমোদন করা
- এলাকায়
- এশিয়া
- যুক্ত
- মনোযোগ
- বৈশিষ্ট্যাবলী
- অটোমেটেড
- সহজলভ্য
- ডেস্কটপ AWS
- বেসলাইন
- কারণ
- আগে
- নিচে
- উত্তম
- মধ্যে
- বাধা
- সীমান্ত
- আনা
- নির্মাণ করা
- ব্যবসায়
- গণিত
- ক্ষমতা
- গ্রেপ্তার
- যত্ন
- কেস
- মামলা
- দঙ্গল
- বিভাগ
- কারণ
- কিছু
- চ্যালেঞ্জ
- চ্যালেঞ্জিং
- পরিবর্তন
- বেছে নিন
- শ্রেণীবদ্ধ
- কফি
- মুদ্রা
- সংগ্রহ করা
- সংগ্রহ
- সংগ্রহ
- যুদ্ধ
- আসা
- সাধারণ
- সম্পূর্ণ
- সম্পূর্ণরূপে
- পরিপূরক
- সুনিশ্চিত
- কনফিগারেশন
- বিশৃঙ্খলা
- বিবেচনা
- কনসোল
- সুবিধাজনক
- পারা
- সৃষ্টি
- নির্মিত
- বর্তমান
- বাঁক
- ক্রেতা
- গ্রাহকদের
- উপাত্ত
- তারিখগুলি
- গভীর
- নির্ভর করে
- নির্ভর করে
- স্থাপন
- মোতায়েন
- বিস্তৃতি
- বিবরণ
- বিস্তারিত
- সনাক্তকরণ
- বিভিন্ন
- ডিজিটাল
- সরাসরি
- আলোচনা করা
- প্রদর্শন
- বিতরণ
- ডিস্ট্রিবিউশন
- বৈচিত্র্য
- না
- বাদ
- সময়
- প্রতি
- সহজে
- উপাদান
- সর্বশেষ সীমা
- প্রান্ত
- প্রকৌশল
- সমৃদ্ধ করা
- প্রবেশ করান
- সত্ত্বা
- সত্তা
- পরিবেশ
- বিশেষত
- মূল্যায়ন
- মূল্যায়ন
- ঘটনা
- ঘটনাবলী
- উদাহরণ
- অপসারণ
- বিদ্যমান
- আশা করা
- প্রত্যাশিত
- ল্যাপারোস্কোপিক পদ্ধতি
- চায়ের
- দ্রুত
- বৈশিষ্ট্য
- বৈশিষ্ট্য
- পরিশেষে
- প্রথম
- অনুসরণ করা
- অনুসরণ
- ফর্ম
- প্রতারণা
- বিনামূল্যে
- থেকে
- ক্রিয়া
- ভবিষ্যৎ
- সাধারণ
- উত্পন্ন
- বিশ্বব্যাপী
- লক্ষ্য
- ভাল
- বৃহত্তর
- Green
- উন্নতি
- ঘটা
- সাহায্য
- সহায়ক
- সাহায্য
- উচ্চ
- ঊর্ধ্বতন
- অত্যন্ত
- ঐতিহাসিক
- ইতিহাস
- ঝুলিতে
- কিভাবে
- কিভাবে
- যাহোক
- HTTPS দ্বারা
- সনাক্ত করা
- প্রভাব
- গুরুত্ব
- গুরুত্বপূর্ণ
- উন্নত করা
- উন্নতি
- অন্তর্ভুক্ত করা
- সুদ্ধ
- ইঙ্গিত
- তথ্য
- ইনপুট
- অর্ন্তদৃষ্টি
- ইন্টারফেস
- Internet
- তদন্ত করা
- IP
- সমস্যা
- সমস্যা
- IT
- কাজ
- আদালতের রায়
- জানা
- জ্ঞান
- লেবেল
- লেবেল
- লেবেলগুলি
- বড়
- বৃহত্তর
- সর্বশেষ
- চালু
- ফুটো
- শিখতে
- শিক্ষা
- উচ্চতা
- উপজীব্য
- তালিকা
- তালিকাভুক্ত
- অবস্থান
- লক
- মেশিন
- মেশিন লার্নিং
- করা
- মেকিং
- পরিচালিত
- পরিচালক
- মানচিত্র
- বাজার
- জরায়ু
- মানে
- বার্তা
- ছন্দোবিজ্ঞান
- হতে পারে
- সর্বনিম্ন
- ML
- মডেল
- মডেল
- মাসের
- অধিক
- সেতু
- বহু
- নেভিগেট
- ন্যাভিগেশন
- চাহিদা
- নেতিবাচক
- নতুন বৈশিষ্ট
- নতুন বাজার
- পরবর্তী
- সংখ্যা
- সংখ্যার
- অফার
- অনলাইন
- অপারেটর
- ক্রম
- অন্যান্য
- অন্যভাবে
- সামগ্রিক
- অংশ
- কামুক
- পেমেন্ট
- শতকরা হার
- কর্মক্ষমতা
- কাল
- বিন্দু
- জনসংখ্যা
- ধনাত্মক
- সম্ভব
- সম্ভাব্য
- ক্ষমতা
- ভবিষ্যদ্বাণী
- বর্তমান
- প্রতিরোধ
- আগে
- প্রাথমিক
- সমস্যা
- প্রক্রিয়া
- পণ্য
- উত্পাদনের
- পণ্য
- প্রদান
- প্রদত্ত
- প্রদানকারী
- উপলব্ধ
- দ্রুত
- পরিসর
- প্রকৃত সময়
- ন্যায্য
- সাম্প্রতিক
- সম্প্রতি
- সুপারিশ করা
- রেকর্ড
- প্রতিফলিত করা
- সংক্রান্ত
- চিত্রিত করা
- প্রতিনিধি
- প্রতিনিধিত্ব করে
- আবশ্যকতা
- প্রয়োজন
- গবেষণা
- Resources
- প্রত্যাবর্তন
- আয়
- এখানে ক্লিক করুন
- উঠন্ত
- ঝুঁকি
- ভূমিকা
- নিয়ম
- চালান
- একই
- স্কেল
- বিজ্ঞানী
- নির্বাচিত
- সেবা
- সেট
- ছায়া
- ভাগ
- দোকান
- সংক্ষিপ্ত
- প্রদর্শনী
- প্রদর্শিত
- সহজ
- আয়তন
- So
- কঠিন
- সমাধানে
- কিছু
- নির্দিষ্ট
- বিভক্ত করা
- শুরু
- পরিসংখ্যান
- অবস্থা
- এখনো
- স্টোরেজ
- কৌশল
- সফলভাবে
- লক্ষ্য
- কারিগরী
- প্রযুক্তি
- টেমপ্লেট
- পরীক্ষা
- পরীক্ষামূলক
- সার্জারির
- তিন
- গোবরাট
- দ্বারা
- সময়
- টুল
- শীর্ষ
- TPR
- ট্রাফিক
- রেলগাড়ি
- প্রশিক্ষণ
- লেনদেন
- রূপান্তরের
- ধরনের
- সাধারণত
- অধীনে
- বোঝা
- বিশ্ববিদ্যালয়
- আপডেট
- us
- মার্কিন
- ব্যবহার
- ব্যবহারকারী
- সাধারণত
- উপযোগ
- বৈধতা
- মূল্য
- সংস্করণ
- চেক
- অপেক্ষা করুন
- কি
- কিনা
- যখন
- ছাড়া
- মূল্য
- would
- বছর
- বছর
- আপনার