Overcome The Machine Learning Cold Start Challenge In Fraud Detection Using Amazon Fraud Detector

بازنشر افلاطون

دنبال: 0

از آنجایی که کسب و کارهای بیشتری حضور آنلاین خود را افزایش می دهند تا به مشتریان خود خدمات بهتری ارائه دهند، الگوهای جدید کلاهبرداری دائماً در حال ظهور هستند. در چشم‌انداز دیجیتال در حال تحول امروزی، جایی که کلاهبرداران در تاکتیک‌های خود پیچیده‌تر می‌شوند، شناسایی و جلوگیری از چنین فعالیت‌های متقلبانه برای شرکت‌ها و موسسات مالی بسیار مهم است.

سیستم‌های تشخیص تقلب مبتنی بر قوانین سنتی در توانایی خود برای تکرار سریع محدود شده‌اند، زیرا بر قوانین و آستانه‌های از پیش تعریف‌شده تکیه می‌کنند تا فعالیت‌های بالقوه جعلی را علامت‌گذاری کنند. این سیستم ها می توانند تعداد زیادی مثبت کاذب ایجاد کنند و حجم تحقیقات دستی انجام شده توسط تیم کلاهبرداری را به میزان قابل توجهی افزایش دهند. علاوه بر این، انسان‌ها مستعد خطا هستند و ظرفیت محدودی برای پردازش مقادیر زیادی از داده‌ها دارند، تلاش‌های دستی برای شناسایی تقلب زمان‌بر است که می‌تواند منجر به از دست رفتن تراکنش‌های متقلبانه، افزایش تلفات و آسیب به اعتبار شود.

یادگیری ماشینی (ML) نقش مهمی در شناسایی تقلب بازی می کند، زیرا می تواند به سرعت و با دقت حجم زیادی از داده ها را برای شناسایی الگوهای غیرعادی و روندهای احتمالی تقلب تجزیه و تحلیل کند. عملکرد مدل کلاهبرداری ML به شدت به کیفیت داده‌هایی که روی آن آموزش داده می‌شود متکی است، و به‌ویژه برای مدل‌های تحت نظارت، داده‌های برچسب‌گذاری شده دقیق بسیار مهم است. در ML، فقدان داده های تاریخی قابل توجه برای آموزش یک مدل، نامیده می شود مشکل شروع سرد.

در دنیای کشف تقلب، چند سناریو سنتی شروع سرد به شرح زیر است:

ساخت یک مدل تقلب دقیق در حالی که فاقد سابقه تراکنش یا موارد کلاهبرداری است
توانایی تشخیص دقیق فعالیت قانونی از تقلب برای مشتریان و حساب های جدید
پرداخت‌های تصمیم‌گیری ریسک به آدرس یا ذینفعی که قبلاً توسط سیستم کلاهبرداری دیده نشده بود

راه های مختلفی برای حل این سناریوها وجود دارد. برای مثال، می‌توانید از مدل‌های عمومی، معروف به مدل‌های یک‌اندازه استفاده کنید، که معمولاً در بالای پلت‌فرم‌های اشتراک‌گذاری داده‌های تقلب مانند کنسرسیوم‌های کلاهبرداری آموزش داده می‌شوند. چالش این رویکرد این است که هیچ تجارتی برابر نیست و بردارهای حمله کلاهبرداری دائما تغییر می کنند.

گزینه دیگر استفاده از یک مدل تشخیص ناهنجاری بدون نظارت برای نظارت بر رفتار غیرعادی در میان رویدادهای مشتری است. چالش این رویکرد این است که همه رویدادهای کلاهبرداری ناهنجاری نیستند و همه ناهنجاری ها در واقع کلاهبرداری نیستند. بنابراین، می توانید انتظار نرخ های مثبت کاذب بالاتری داشته باشید.

در این پست، ما نشان می‌دهیم که چگونه می‌توانید به سرعت یک مدل ML پیشگیری از تقلب در زمان واقعی را با کمتر از 100 رویداد با استفاده از ردیاب تقلب آمازون خصوصیت جدید، شروع سرد، بنابراین به طور چشمگیری مانع ورود به مدل های ML سفارشی را برای بسیاری از سازمان هایی که صرفاً زمان یا توانایی جمع آوری و برچسب گذاری دقیق مجموعه داده های بزرگ را ندارند، کاهش می دهد. علاوه بر این، ما در مورد اینکه چگونه با استفاده از رویدادهای ذخیره‌شده در Amazon Fraud Detector، می‌توانید نتایج را مرور کنید و رویدادها را به درستی برچسب‌گذاری کنید تا مدل‌های خود را دوباره آموزش دهید، در نتیجه اثربخشی اقدامات پیشگیری از تقلب را در طول زمان بهبود می‌بخشید.

بررسی اجمالی راه حل

Amazon Fraud Detector یک سرویس تشخیص کلاهبرداری کاملاً مدیریت شده است که شناسایی فعالیت های بالقوه کلاهبرداری آنلاین را خودکار می کند. شما می‌توانید از Amazon Fraud Detector برای ساخت مدل‌های تشخیص تقلب سفارشی با استفاده از مجموعه داده‌های تاریخی خود استفاده کنید، منطق تصمیم‌گیری را با استفاده از موتور قوانین داخلی اضافه کنید، و جریان‌های کاری تصمیم‌گیری ریسک را با یک کلیک هماهنگ کنید.

پیش از این، برای آموزش یک مدل باید بیش از 10,000 رویداد برچسب‌گذاری شده را با حداقل 400 نمونه تقلب ارائه می‌کردید. با انتشار ویژگی Cold Start، می توانید به سرعت مدلی را با حداقل 100 رویداد و حداقل 50 مورد طبقه بندی شده به عنوان تقلب آموزش دهید. در مقایسه با الزامات داده اولیه، این کاهش 99٪ در داده های تاریخی و کاهش 87٪ در الزامات برچسب است.

ویژگی جدید Cold Start روش‌های هوشمندی را برای غنی‌سازی، گسترش و مدل‌سازی ریسک مجموعه‌های کوچکی از داده‌ها ارائه می‌کند. علاوه بر این، ردیاب تقلب آمازون تخصیص برچسب و نمونه برداری را برای رویدادهای بدون برچسب انجام می دهد.

آزمایش‌های انجام‌شده با مجموعه داده‌های عمومی نشان می‌دهد که با کاهش محدودیت‌ها به 50 تقلب و تنها 100 رویداد، می‌توانید مدل‌های ML تقلبی بسازید که به طور مداوم از مدل‌های بدون نظارت و نیمه‌نظارت بهتر عمل می‌کنند.

عملکرد مدل شروع سرد

توانایی یک مدل ML برای تعمیم و پیش‌بینی دقیق روی داده‌های دیده نشده تحت تأثیر کیفیت و تنوع مجموعه داده آموزشی است. برای مدل های Cold Start، این تفاوتی ندارد. شما باید فرآیندهایی را در جای خود داشته باشید زیرا داده های بیشتری برای برچسب گذاری صحیح این رویدادها و آموزش مجدد مدل ها جمع آوری می شود که در نهایت منجر به عملکرد بهینه مدل می شود.

با نیاز به داده کمتر، ناپایداری عملکرد گزارش شده به دلیل افزایش واریانس مدل و اندازه محدود داده آزمون افزایش می یابد. برای کمک به ایجاد انتظارات مناسب از عملکرد مدل، علاوه بر مدل AUC، آشکارساز تقلب آمازون همچنین معیارهای محدوده عدم قطعیت را گزارش می‌کند. جدول زیر این معیارها را تعریف می کند.

.	.	AUC
.	.	<0.6	0.6 - 0.8	> = 0.8
فاصله عدم قطعیت AUC	> 0.3	عملکرد مدل بسیار پایین است و ممکن است بسیار متفاوت باشد. انتظار عملکرد پایین شناسایی تقلب را داشته باشید.	عملکرد مدل پایین است و ممکن است بسیار متفاوت باشد. انتظار عملکرد محدود کشف تقلب را داشته باشید.	عملکرد مدل ممکن است بسیار متفاوت باشد.
	0.1 - 0.3	عملکرد مدل بسیار پایین است و ممکن است به طور قابل توجهی متفاوت باشد. انتظار عملکرد پایین شناسایی تقلب را داشته باشید.	عملکرد مدل پایین است و ممکن است به طور قابل توجهی متفاوت باشد. انتظار عملکرد محدود کشف تقلب را داشته باشید.	عملکرد مدل ممکن است به طور قابل توجهی متفاوت باشد.
	<0.1	عملکرد مدل بسیار پایین است. انتظار عملکرد پایین شناسایی تقلب را داشته باشید.	عملکرد مدل پایین است. انتظار عملکرد محدود کشف تقلب را داشته باشید.	بدون هشدار

یک مدل شروع سرد را آموزش دهید

آموزش یک مدل کلاهبرداری Cold Start مشابه آموزش هر مدل دیگر تقلب یاب آمازون است. آنچه متفاوت است اندازه مجموعه داده است. شما می توانید مجموعه داده های نمونه برای آموزش شروع سرد را در ما پیدا کنید مخزن GitHub. برای آموزش یک مدل سفارشی آشکارساز تقلب آمازون، می‌توانید عملاً ما را دنبال کنید آموزش. شما می توانید از آموزش کنسول آمازون Fraud Detector یا آموزش SDK برای ساخت، آموزش، و استقرار یک مدل تشخیص تقلب.

پس از آموزش مدل شما، می‌توانید معیارهای عملکرد را بررسی کنید و سپس با تغییر وضعیت آن، آن را به کار بگیرید فعال. برای کسب اطلاعات بیشتر در مورد امتیازهای مدل و معیارهای عملکرد، رجوع کنید به نمرات مدل و معیارهای عملکرد مدل. در این مرحله، اکنون می توانید مدل خود را به آشکارساز خود اضافه کنید قوانین کسب و کار برای تفسیر امتیازهای ریسک که مدل به دست می‌آید، و پیش‌بینی‌های بلادرنگ با استفاده از GetEventPrediction API

مدل تقلب ML بهبود مستمر و حلقه بازخورد

با ویژگی آمازون Fraud Detector Cold Start، می‌توانید به سرعت نقطه پایانی آشکارساز تقلب را راه‌اندازی کنید و فوراً از کسب‌وکار خود محافظت کنید. با این حال، الگوهای کلاهبرداری جدید به طور مداوم در حال ظهور هستند، بنابراین آموزش مجدد مدل های شروع سرد با داده های جدیدتر برای بهبود دقت و اثربخشی پیش بینی ها در طول زمان بسیار مهم است.

برای کمک به تکرار مدل‌های خود، Amazon Fraud Detector به‌طور خودکار همه رویدادهای ارسال شده به سرویس را برای استنباط ذخیره می‌کند. همانطور که در تصویر زیر نشان داده شده است، می‌توانید تغییر یا اعتبارسنجی کنید که پرچم انتقال رویداد در سطح نوع رویداد روشن است.

Overcome the machine learning cold start challenge in fraud detection using Amazon Fraud Detector PlatoBlockchain Data Intelligence. Vertical Search. Ai.

با ویژگی رویدادهای ذخیره شده، می‌توانید از Amazon Fraud Detector SDK برای دسترسی برنامه‌ریزی شده به یک رویداد، بررسی فراداده رویداد و توضیح پیش‌بینی و تصمیم‌گیری آگاهانه درباره ریسک استفاده کنید. علاوه بر این، می‌توانید رویداد را برای بازآموزی مدل آینده و بهبود مستمر مدل برچسب بزنید. نمودار زیر نمونه ای از این گردش کار را نشان می دهد.

Overcome the machine learning cold start challenge in fraud detection using Amazon Fraud Detector PlatoBlockchain Data Intelligence. Vertical Search. Ai.

در قطعه کد زیر، فرآیند برچسب گذاری یک رویداد ذخیره شده را نشان می دهیم:

برای انجام یک پیش‌بینی تقلب در زمان واقعی در یک رویداد، با GetEventPrediction API تماس بگیرید:

import boto3 def get_event_prediction(): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction( detectorId='your_detector_name', detectorVersionId='1', eventId='my-event-id-1234', eventTypeName='your_event_type', entities=[ { 'entityType': 'user', 'entityId': 'A12345' }, ], eventTimestamp= '2023-03-23T21:42:03.658Z', eventVariables={ 'email': 'test@anymockcompany.com', 'ip': '123.123.123.123', 'card_bin': '400022', 'billing_zip': '50401' } ) return(prediction)

پاسخ API:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ]

همانطور که در پاسخ مشاهده می شود، بر اساس قانون موتور تصمیم مطابقت دارد، رویداد باید برای بررسی دستی توسط تیم کلاهبرداری ارسال شود. با جمع‌آوری ابرداده‌های توضیح پیش‌بینی، می‌توانید بینش‌هایی در مورد اینکه چگونه هر متغیر رویداد بر امتیاز پیش‌بینی تقلب مدل تأثیر گذاشته است، به دست آورید.

برای جمع آوری این بینش ها، از get_event_prediction_metada API ها:

import boto3 def get_event_prediction_metadata(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction_metadata( eventId = 'my-event-id-1234', eventTypeName = 'your_event_type', predictionTimestamp = '2023-03-23T21:44:39.318Z', detectorId = 'your_detector_name', detectorVersionId = '1' ) return(prediction)

پاسخ API:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ] { "eventId": "my-event-id-1234", … <REDACTED> … "eventVariables": [ { "name": "ip", "value": "123.123.123.123" }, { "name": "billing_zip", "value": "50401" }, { "name": "email", "value": "test@anymockcompany.com" }, { "name": "card_bin", "value": "400022" } ],
… <REDACTED>
… "evaluations": [ { "evaluationScore": "932.0", "predictionExplanations": { "variableImpactExplanations": [ { "eventVariableName": "billing_zip", "relativeImpact": "1", "logOddsImpact": 1.018196990713477135 }, { "eventVariableName": "ip", "relativeImpact": "0", "logOddsImpact": -0.23122438788414001 }, { "eventVariableName": "email", "relativeImpact": "0", "logOddsImpact": 0.004304269328713417 }, { "eventVariableName": "card_bin", "relativeImpact": "0", "logOddsImpact": -0.011150157079100609 } ],
}

با این بینش ها، تحلیلگر تقلب می تواند یک تصمیم آگاهانه درباره ریسک در مورد رویداد مورد نظر بگیرد و برچسب رویداد را به روز کند.

برای به روز رسانی برچسب رویداد با شماره تماس بگیرید update_event_label API ها:

import boto3 def update_event_label(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.update_event_label( eventId = "my-event-id-1234", eventTypeName = "your_event_type", assignedLabel='1', # Fraud labelTimestamp='2023-03-25T11:20:03.658Z' ) return(prediction)

پاسخ API

{ "ResponseMetadata": { "RequestId": "3e28caa0-2a06-4b8d-9a10-9081811bf22d", "HTTPStatusCode": 200, … <REDACTED> … "RetryAttempts": 0 }
}

به عنوان آخرین مرحله، می توانید بررسی کنید که آیا برچسب رویداد به درستی به روز شده است یا خیر.

برای تأیید برچسب رویداد، با شماره تماس بگیرید get_event API ها:

import boto3 def get_event(): fraudDetector = boto3.client('frauddetector') event = fraudDetector.get_event( eventId='my-event-id-1234', eventTypeName=’your_event_type' ) return(event)

پاسخ API

{ "event": { "eventId": "my-event-id-1234", "eventTimestamp": "2023-03-23T21:42:03.658Z", "eventVariables": { "billing_zip": "50401", "card_bin": "400022", "email": "test@anymockcompany.com", "ip": "123.123.123.123" }, "currentLabel": "1", "labelTimestamp": "2023-03-25T11:20:03.658Z", "entities": [ { "entityType": "user", "entityId": "A12345" } ] }
}

پاک کردن

برای جلوگیری از تحمیل هزینه در آینده، منابع ایجاد شده برای راه حل را حذف کنید.

نتیجه

این پست نشان می‌دهد که چگونه می‌توانید با استفاده از ویژگی جدید Cold Start، آشکارساز تقلب آمازون، به سرعت یک سیستم پیشگیری از کلاهبرداری در زمان واقعی را با چند تا ۱۰۰ رویداد راه‌اندازی کنید. ما در مورد اینکه چگونه می توانید از رویدادهای ذخیره شده برای بررسی نتایج استفاده کنید و رویدادها را به درستی برچسب گذاری کنید و مدل های خود را مجدداً آموزش دهید، به این موضوع پرداختیم که اثربخشی اقدامات پیشگیری از تقلب را در طول زمان بهبود می بخشد.

سرویس‌های AWS کاملاً مدیریت‌شده مانند Amazon Fraud Detector به کاهش زمانی که کسب‌وکارها صرف تجزیه و تحلیل رفتار کاربر برای شناسایی کلاهبرداری در پلتفرم‌های خود می‌کنند و تمرکز بیشتر بر افزایش ارزش کسب‌وکار است، کمک می‌کند. برای کسب اطلاعات بیشتر در مورد اینکه چگونه آشکارساز تقلب آمازون می تواند به کسب و کار شما کمک کند، مراجعه کنید ردیاب تقلب آمازون

درباره نویسنده

مارسل پیویدال یک معمار راه حل خدمات هوش مصنوعی جهانی در سازمان تخصصی جهانی است. مارسل بیش از 20 سال تجربه در حل مشکلات تجاری از طریق فناوری برای فین‌تک‌ها، ارائه‌دهندگان پرداخت، داروسازی و سازمان‌های دولتی دارد. حوزه های فعلی تمرکز او مدیریت ریسک، پیشگیری از تقلب و تأیید هویت است.

جولیا شو یک دانشمند محقق با آشکارساز تقلب آمازون است. او مشتاق حل چالش های مشتری با استفاده از تکنیک های یادگیری ماشین است. او در اوقات فراغت خود از پیاده روی، نقاشی و کاوش در کافی شاپ های جدید لذت می برد.

گیلرمه ریچی یک معمار ارشد راه حل در AWS است که به استارتاپ ها کمک می کند تا هزینه های برنامه های خود را مدرن و بهینه کنند. او با بیش از 10 سال تجربه در شرکت های بخش مالی، در حال حاضر با تیم متخصصان AI/ML کار می کند.

محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
پلاتوبلاک چین. Web3 Metaverse Intelligence. دانش تقویت شده دسترسی به اینجا.
ضرب کردن آینده با آدرین اشلی. دسترسی به اینجا.
منبع: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/

تمبر زمان: آوریل 17، 2023

تمبر زمان: آوریل 5، 2022

بازنشر افلاطون

فرآیند تغییر پس‌زمینه تصویر را با استفاده از Amazon Bedrock و AWS Step Functions | خودکار کنید خدمات وب آمازون

مدل های پایه Mistral 7B از Mistral AI اکنون در Amazon SageMaker در دسترس هستند JumpStart | خدمات وب آمازون

تشخیص و پایش فرکانس بالا منابع نقطه انتشار متان با استفاده از قابلیت‌های جغرافیایی Amazon SageMaker | خدمات وب آمازون

کشف کلاهبرداری در مشاغل تلفن همراه با استفاده از هوش دستگاه GrabDefence و آشکارساز تقلب آمازون

با استفاده از یادگیری ماشینی با Amazon SageMaker، تراکنش های جعلی را شناسایی کنید

محفظه الگوریتم Amazon SageMaker XGBoost را سفارشی کنید

درباره‌ ما

جستجوی عمودی و هوش مصنوعی

سکو

همیشه در ارتباط ماندن

حساب