از آنجایی که کسب و کارهای بیشتری حضور آنلاین خود را افزایش می دهند تا به مشتریان خود خدمات بهتری ارائه دهند، الگوهای جدید کلاهبرداری دائماً در حال ظهور هستند. در چشمانداز دیجیتال در حال تحول امروزی، جایی که کلاهبرداران در تاکتیکهای خود پیچیدهتر میشوند، شناسایی و جلوگیری از چنین فعالیتهای متقلبانه برای شرکتها و موسسات مالی بسیار مهم است.
سیستمهای تشخیص تقلب مبتنی بر قوانین سنتی در توانایی خود برای تکرار سریع محدود شدهاند، زیرا بر قوانین و آستانههای از پیش تعریفشده تکیه میکنند تا فعالیتهای بالقوه جعلی را علامتگذاری کنند. این سیستم ها می توانند تعداد زیادی مثبت کاذب ایجاد کنند و حجم تحقیقات دستی انجام شده توسط تیم کلاهبرداری را به میزان قابل توجهی افزایش دهند. علاوه بر این، انسانها مستعد خطا هستند و ظرفیت محدودی برای پردازش مقادیر زیادی از دادهها دارند، تلاشهای دستی برای شناسایی تقلب زمانبر است که میتواند منجر به از دست رفتن تراکنشهای متقلبانه، افزایش تلفات و آسیب به اعتبار شود.
یادگیری ماشینی (ML) نقش مهمی در شناسایی تقلب بازی می کند، زیرا می تواند به سرعت و با دقت حجم زیادی از داده ها را برای شناسایی الگوهای غیرعادی و روندهای احتمالی تقلب تجزیه و تحلیل کند. عملکرد مدل کلاهبرداری ML به شدت به کیفیت دادههایی که روی آن آموزش داده میشود متکی است، و بهویژه برای مدلهای تحت نظارت، دادههای برچسبگذاری شده دقیق بسیار مهم است. در ML، فقدان داده های تاریخی قابل توجه برای آموزش یک مدل، نامیده می شود مشکل شروع سرد.
در دنیای کشف تقلب، چند سناریو سنتی شروع سرد به شرح زیر است:
- ساخت یک مدل تقلب دقیق در حالی که فاقد سابقه تراکنش یا موارد کلاهبرداری است
- توانایی تشخیص دقیق فعالیت قانونی از تقلب برای مشتریان و حساب های جدید
- پرداختهای تصمیمگیری ریسک به آدرس یا ذینفعی که قبلاً توسط سیستم کلاهبرداری دیده نشده بود
راه های مختلفی برای حل این سناریوها وجود دارد. برای مثال، میتوانید از مدلهای عمومی، معروف به مدلهای یکاندازه استفاده کنید، که معمولاً در بالای پلتفرمهای اشتراکگذاری دادههای تقلب مانند کنسرسیومهای کلاهبرداری آموزش داده میشوند. چالش این رویکرد این است که هیچ تجارتی برابر نیست و بردارهای حمله کلاهبرداری دائما تغییر می کنند.
گزینه دیگر استفاده از یک مدل تشخیص ناهنجاری بدون نظارت برای نظارت بر رفتار غیرعادی در میان رویدادهای مشتری است. چالش این رویکرد این است که همه رویدادهای کلاهبرداری ناهنجاری نیستند و همه ناهنجاری ها در واقع کلاهبرداری نیستند. بنابراین، می توانید انتظار نرخ های مثبت کاذب بالاتری داشته باشید.
در این پست، ما نشان میدهیم که چگونه میتوانید به سرعت یک مدل ML پیشگیری از تقلب در زمان واقعی را با کمتر از 100 رویداد با استفاده از ردیاب تقلب آمازون خصوصیت جدید، شروع سرد، بنابراین به طور چشمگیری مانع ورود به مدل های ML سفارشی را برای بسیاری از سازمان هایی که صرفاً زمان یا توانایی جمع آوری و برچسب گذاری دقیق مجموعه داده های بزرگ را ندارند، کاهش می دهد. علاوه بر این، ما در مورد اینکه چگونه با استفاده از رویدادهای ذخیرهشده در Amazon Fraud Detector، میتوانید نتایج را مرور کنید و رویدادها را به درستی برچسبگذاری کنید تا مدلهای خود را دوباره آموزش دهید، در نتیجه اثربخشی اقدامات پیشگیری از تقلب را در طول زمان بهبود میبخشید.
بررسی اجمالی راه حل
Amazon Fraud Detector یک سرویس تشخیص کلاهبرداری کاملاً مدیریت شده است که شناسایی فعالیت های بالقوه کلاهبرداری آنلاین را خودکار می کند. شما میتوانید از Amazon Fraud Detector برای ساخت مدلهای تشخیص تقلب سفارشی با استفاده از مجموعه دادههای تاریخی خود استفاده کنید، منطق تصمیمگیری را با استفاده از موتور قوانین داخلی اضافه کنید، و جریانهای کاری تصمیمگیری ریسک را با یک کلیک هماهنگ کنید.
پیش از این، برای آموزش یک مدل باید بیش از 10,000 رویداد برچسبگذاری شده را با حداقل 400 نمونه تقلب ارائه میکردید. با انتشار ویژگی Cold Start، می توانید به سرعت مدلی را با حداقل 100 رویداد و حداقل 50 مورد طبقه بندی شده به عنوان تقلب آموزش دهید. در مقایسه با الزامات داده اولیه، این کاهش 99٪ در داده های تاریخی و کاهش 87٪ در الزامات برچسب است.
ویژگی جدید Cold Start روشهای هوشمندی را برای غنیسازی، گسترش و مدلسازی ریسک مجموعههای کوچکی از دادهها ارائه میکند. علاوه بر این، ردیاب تقلب آمازون تخصیص برچسب و نمونه برداری را برای رویدادهای بدون برچسب انجام می دهد.
آزمایشهای انجامشده با مجموعه دادههای عمومی نشان میدهد که با کاهش محدودیتها به 50 تقلب و تنها 100 رویداد، میتوانید مدلهای ML تقلبی بسازید که به طور مداوم از مدلهای بدون نظارت و نیمهنظارت بهتر عمل میکنند.
عملکرد مدل شروع سرد
توانایی یک مدل ML برای تعمیم و پیشبینی دقیق روی دادههای دیده نشده تحت تأثیر کیفیت و تنوع مجموعه داده آموزشی است. برای مدل های Cold Start، این تفاوتی ندارد. شما باید فرآیندهایی را در جای خود داشته باشید زیرا داده های بیشتری برای برچسب گذاری صحیح این رویدادها و آموزش مجدد مدل ها جمع آوری می شود که در نهایت منجر به عملکرد بهینه مدل می شود.
با نیاز به داده کمتر، ناپایداری عملکرد گزارش شده به دلیل افزایش واریانس مدل و اندازه محدود داده آزمون افزایش می یابد. برای کمک به ایجاد انتظارات مناسب از عملکرد مدل، علاوه بر مدل AUC، آشکارساز تقلب آمازون همچنین معیارهای محدوده عدم قطعیت را گزارش میکند. جدول زیر این معیارها را تعریف می کند.
. | . | AUC | ||
. | . | <0.6 | 0.6 - 0.8 | > = 0.8 |
فاصله عدم قطعیت AUC | > 0.3 | عملکرد مدل بسیار پایین است و ممکن است بسیار متفاوت باشد. انتظار عملکرد پایین شناسایی تقلب را داشته باشید. | عملکرد مدل پایین است و ممکن است بسیار متفاوت باشد. انتظار عملکرد محدود کشف تقلب را داشته باشید. | عملکرد مدل ممکن است بسیار متفاوت باشد. |
0.1 - 0.3 | عملکرد مدل بسیار پایین است و ممکن است به طور قابل توجهی متفاوت باشد. انتظار عملکرد پایین شناسایی تقلب را داشته باشید. | عملکرد مدل پایین است و ممکن است به طور قابل توجهی متفاوت باشد. انتظار عملکرد محدود کشف تقلب را داشته باشید. | عملکرد مدل ممکن است به طور قابل توجهی متفاوت باشد. | |
<0.1 | عملکرد مدل بسیار پایین است. انتظار عملکرد پایین شناسایی تقلب را داشته باشید. | عملکرد مدل پایین است. انتظار عملکرد محدود کشف تقلب را داشته باشید. | بدون هشدار |
یک مدل شروع سرد را آموزش دهید
آموزش یک مدل کلاهبرداری Cold Start مشابه آموزش هر مدل دیگر تقلب یاب آمازون است. آنچه متفاوت است اندازه مجموعه داده است. شما می توانید مجموعه داده های نمونه برای آموزش شروع سرد را در ما پیدا کنید مخزن GitHub. برای آموزش یک مدل سفارشی آشکارساز تقلب آمازون، میتوانید عملاً ما را دنبال کنید آموزش. شما می توانید از آموزش کنسول آمازون Fraud Detector یا آموزش SDK برای ساخت، آموزش، و استقرار یک مدل تشخیص تقلب.
پس از آموزش مدل شما، میتوانید معیارهای عملکرد را بررسی کنید و سپس با تغییر وضعیت آن، آن را به کار بگیرید فعال. برای کسب اطلاعات بیشتر در مورد امتیازهای مدل و معیارهای عملکرد، رجوع کنید به نمرات مدل و معیارهای عملکرد مدل. در این مرحله، اکنون می توانید مدل خود را به آشکارساز خود اضافه کنید قوانین کسب و کار برای تفسیر امتیازهای ریسک که مدل به دست میآید، و پیشبینیهای بلادرنگ با استفاده از GetEventPrediction API
مدل تقلب ML بهبود مستمر و حلقه بازخورد
با ویژگی آمازون Fraud Detector Cold Start، میتوانید به سرعت نقطه پایانی آشکارساز تقلب را راهاندازی کنید و فوراً از کسبوکار خود محافظت کنید. با این حال، الگوهای کلاهبرداری جدید به طور مداوم در حال ظهور هستند، بنابراین آموزش مجدد مدل های شروع سرد با داده های جدیدتر برای بهبود دقت و اثربخشی پیش بینی ها در طول زمان بسیار مهم است.
برای کمک به تکرار مدلهای خود، Amazon Fraud Detector بهطور خودکار همه رویدادهای ارسال شده به سرویس را برای استنباط ذخیره میکند. همانطور که در تصویر زیر نشان داده شده است، میتوانید تغییر یا اعتبارسنجی کنید که پرچم انتقال رویداد در سطح نوع رویداد روشن است.
با ویژگی رویدادهای ذخیره شده، میتوانید از Amazon Fraud Detector SDK برای دسترسی برنامهریزی شده به یک رویداد، بررسی فراداده رویداد و توضیح پیشبینی و تصمیمگیری آگاهانه درباره ریسک استفاده کنید. علاوه بر این، میتوانید رویداد را برای بازآموزی مدل آینده و بهبود مستمر مدل برچسب بزنید. نمودار زیر نمونه ای از این گردش کار را نشان می دهد.
در قطعه کد زیر، فرآیند برچسب گذاری یک رویداد ذخیره شده را نشان می دهیم:
- برای انجام یک پیشبینی تقلب در زمان واقعی در یک رویداد، با GetEventPrediction API تماس بگیرید:
همانطور که در پاسخ مشاهده می شود، بر اساس قانون موتور تصمیم مطابقت دارد، رویداد باید برای بررسی دستی توسط تیم کلاهبرداری ارسال شود. با جمعآوری ابردادههای توضیح پیشبینی، میتوانید بینشهایی در مورد اینکه چگونه هر متغیر رویداد بر امتیاز پیشبینی تقلب مدل تأثیر گذاشته است، به دست آورید.
- برای جمع آوری این بینش ها، از
get_event_prediction_metada
API ها:
پاسخ API:
با این بینش ها، تحلیلگر تقلب می تواند یک تصمیم آگاهانه درباره ریسک در مورد رویداد مورد نظر بگیرد و برچسب رویداد را به روز کند.
- برای به روز رسانی برچسب رویداد با شماره تماس بگیرید
update_event_label
API ها:
پاسخ API
به عنوان آخرین مرحله، می توانید بررسی کنید که آیا برچسب رویداد به درستی به روز شده است یا خیر.
- برای تأیید برچسب رویداد، با شماره تماس بگیرید
get_event
API ها:
پاسخ API
پاک کردن
برای جلوگیری از تحمیل هزینه در آینده، منابع ایجاد شده برای راه حل را حذف کنید.
نتیجه
این پست نشان میدهد که چگونه میتوانید با استفاده از ویژگی جدید Cold Start، آشکارساز تقلب آمازون، به سرعت یک سیستم پیشگیری از کلاهبرداری در زمان واقعی را با چند تا ۱۰۰ رویداد راهاندازی کنید. ما در مورد اینکه چگونه می توانید از رویدادهای ذخیره شده برای بررسی نتایج استفاده کنید و رویدادها را به درستی برچسب گذاری کنید و مدل های خود را مجدداً آموزش دهید، به این موضوع پرداختیم که اثربخشی اقدامات پیشگیری از تقلب را در طول زمان بهبود می بخشد.
سرویسهای AWS کاملاً مدیریتشده مانند Amazon Fraud Detector به کاهش زمانی که کسبوکارها صرف تجزیه و تحلیل رفتار کاربر برای شناسایی کلاهبرداری در پلتفرمهای خود میکنند و تمرکز بیشتر بر افزایش ارزش کسبوکار است، کمک میکند. برای کسب اطلاعات بیشتر در مورد اینکه چگونه آشکارساز تقلب آمازون می تواند به کسب و کار شما کمک کند، مراجعه کنید ردیاب تقلب آمازون
درباره نویسنده
مارسل پیویدال یک معمار راه حل خدمات هوش مصنوعی جهانی در سازمان تخصصی جهانی است. مارسل بیش از 20 سال تجربه در حل مشکلات تجاری از طریق فناوری برای فینتکها، ارائهدهندگان پرداخت، داروسازی و سازمانهای دولتی دارد. حوزه های فعلی تمرکز او مدیریت ریسک، پیشگیری از تقلب و تأیید هویت است.
جولیا شو یک دانشمند محقق با آشکارساز تقلب آمازون است. او مشتاق حل چالش های مشتری با استفاده از تکنیک های یادگیری ماشین است. او در اوقات فراغت خود از پیاده روی، نقاشی و کاوش در کافی شاپ های جدید لذت می برد.
گیلرمه ریچی یک معمار ارشد راه حل در AWS است که به استارتاپ ها کمک می کند تا هزینه های برنامه های خود را مدرن و بهینه کنند. او با بیش از 10 سال تجربه در شرکت های بخش مالی، در حال حاضر با تیم متخصصان AI/ML کار می کند.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- پلاتوبلاک چین. Web3 Metaverse Intelligence. دانش تقویت شده دسترسی به اینجا.
- ضرب کردن آینده با آدرین اشلی. دسترسی به اینجا.
- منبع: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/
- : دارد
- :است
- :نه
- :جایی که
- 000
- 1
- 10
- 100
- 20
- سال 20
- 200
- 39
- 50
- 7
- 8
- 9
- a
- توانایی
- قادر
- درباره ما
- دسترسی
- دقت
- دقیق
- به درستی
- فعالیت ها
- فعالیت
- نشانی
- سازمان
- AI
- خدمات هوش مصنوعی
- AI / ML
- معرفی
- همچنین
- آمازون
- ردیاب تقلب آمازون
- در میان
- مقدار
- an
- روانکاو
- تحلیل
- تجزیه و تحلیل
- و
- تشخیص ناهنجاری
- هر
- API
- برنامه های کاربردی
- روش
- هستند
- مناطق
- AS
- At
- حمله
- خودکار می کند
- بطور خودکار
- AWS
- سد
- مستقر
- BE
- زیرا
- شدن
- تبدیل شدن به
- قبل از
- ذینفع
- بهتر
- خود راه انداز
- ساختن
- ساخته شده در
- کسب و کار
- کسب و کار
- دکمه
- by
- صدا
- نام
- CAN
- ظرفیت
- به چالش
- چالش ها
- تغییر دادن
- متغیر
- بار
- طبقه بندی
- کلیک
- رمز
- کشت
- جمع آوری
- COM
- شرکت
- مقایسه
- کنسول
- به طور مداوم
- زمینه
- مداوم
- هزینه
- ایجاد شده
- بحرانی
- بسیار سخت
- جاری
- در حال حاضر
- سفارشی
- مشتری
- مشتریان
- سفارشی
- داده ها
- به اشتراک گذاری داده ها
- مجموعه داده ها
- تصمیم
- تعریف می کند
- نشان دادن
- نشان
- گسترش
- کشف
- مختلف
- دیجیتال
- بحث و تبادل نظر
- بحث کردیم
- تمیز دادن
- تنوع
- do
- آیا
- به طور چشمگیری
- رانندگی
- هر
- اثر
- تلاش
- هر دو
- پست الکترونیک
- سنگ سنباده
- نقطه پایانی
- موتور
- غنی سازی
- اشخاص
- ورود
- ارزیابی
- واقعه
- حوادث
- مثال
- مثال ها
- انتظار
- انتظار
- تجربه
- توضیح
- بررسی
- گسترش
- غلط
- ویژگی
- باز خورد
- کمی از
- نهایی
- مالی
- موسسات مالی
- بخش مالی
- پیدا کردن
- fintechs
- تمرکز
- به دنبال
- پیروی
- برای
- تقلب
- کشف تقلب
- جلوگیری از کلاه برداری
- کلاهبرداران
- جعلی
- فعالیت متقلبانه
- رایگان
- از جانب
- کاملا
- بعلاوه
- آینده
- افزایش
- جمع آوری
- تولید می کنند
- جهانی
- دولت
- تا حد زیادی
- دست
- آیا
- he
- به شدت
- کمک
- کمک
- بالاتر
- تاریخی
- تاریخ
- چگونه
- اما
- HTML
- HTTPS
- انسان
- یکسان
- شناسایی
- هویت
- تایید هویت
- بلافاصله
- نهفته
- بهبود
- بهبود
- بهبود
- in
- افزایش
- افزایش
- افزایش
- افزایش
- اطلاع
- اول
- بینش
- بی ثباتی
- موسسات
- هوشمند
- به
- تحقیقات
- IP
- IT
- ITS
- JPG
- شناخته شده
- برچسب
- عدم
- چشم انداز
- بزرگ
- برجسته
- یاد گرفتن
- یادگیری
- سطح
- پسندیدن
- محدود شده
- محدودیت
- کوچک
- تلفات
- کم
- پایین آوردن
- دستگاه
- فراگیری ماشین
- ساخت
- ساخت
- اداره می شود
- مدیریت
- کتابچه راهنمای
- بسیاری
- تطبیق
- معیارهای
- متاداده
- روش
- متریک
- قدرت
- حد اقل
- ML
- مدل
- مدل
- نوین کردن
- مانیتور
- بیش
- علاوه بر این
- چندگانه
- نام
- جدید
- اکنون
- عدد
- of
- on
- آنلاین
- فقط
- بهینه
- بهینه سازی
- گزینه
- or
- کدام سازمان ها
- سازمان های
- دیگر
- ما
- بهتر از
- روی
- غلبه بر
- خود
- برترین
- احساساتی
- الگوهای
- پرداخت
- ارائه دهندگان پرداخت
- مبلغ پرداختی
- کارایی
- انجام می دهد
- مواد و محصولات دارویی
- محل
- سیستم عامل
- افلاطون
- هوش داده افلاطون
- PlatoData
- نقطه
- مثبت
- ممکن
- پست
- بالقوه
- پیش گویی
- پیش بینی
- حضور
- جلوگیری
- پیشگیری
- مشکلات
- روند
- فرآیندهای
- حفاظت
- ارائه
- ارائه دهندگان
- فراهم می کند
- عمومی
- کیفیت
- سوال
- به سرعت
- محدوده
- نرخ
- زمان واقعی
- كاهش دادن
- آزاد
- گزارش
- گزارش ها
- نیاز
- مورد نیاز
- تحقیق
- منابع
- پاسخ
- نتیجه
- نتایج
- این فایل نقد می نویسید:
- خطر
- مدیریت ریسک
- نقش
- قانون
- قوانین
- سناریوها
- دانشمند
- نمره
- sdk
- بخش
- ارشد
- خدمت
- سرویس
- خدمات
- مجموعه
- اشتراک
- مغازه ها
- باید
- نشان
- نشان داده شده
- نشان می دهد
- قابل توجه
- به طور قابل توجهی
- به سادگی
- اندازه
- کوچک
- So
- راه حل
- مزایا
- حل
- حل کردن
- برخی از
- مصنوعی
- متخصص
- متخصصان
- به طور خاص
- خرج کردن
- شروع
- نوپا
- وضعیت
- گام
- ذخیره شده
- پرده
- چنین
- سطح
- سیستم
- سیستم های
- جدول
- تاکتیک
- تیم
- تکنیک
- پیشرفته
- آزمون
- نسبت به
- که
- La
- جهان
- شان
- در نتیجه
- از این رو
- اینها
- آنها
- این
- از طریق
- زمان
- زمان بر
- به
- امروز
- با هم
- بالا
- سنتی
- قطار
- آموزش دیده
- آموزش
- معاملات
- روند
- به طور معمول
- در نهایت
- تردید
- بروزرسانی
- به روز شده
- استفاده کنید
- کاربر
- با استفاده از
- تصدیق
- ارزش
- تایید
- بررسی
- بازدید
- حجم
- جلد
- بود
- راه
- we
- چی
- که
- در حین
- با
- گردش کار
- کارگر
- جهان
- سال
- شما
- شما
- زفیرنت