Подолайте проблему холодного старту машинного навчання у виявленні шахрайства за допомогою Amazon Fraud Detector

Перевидано Платоном

читають: 0

Оскільки все більше компаній збільшують свою присутність в Інтернеті, щоб краще обслуговувати своїх клієнтів, постійно з’являються нові схеми шахрайства. У сучасному цифровому середовищі, яке постійно розвивається, де шахраї стають все більш витонченими у своїй тактиці, виявлення та запобігання таким шахрайським діям стало першорядним для компаній і фінансових установ.

Традиційні системи виявлення шахрайства, засновані на правилах, обмежені здатністю швидко виконувати повторні дії, оскільки вони покладаються на попередньо визначені правила та порогові значення для позначення потенційно шахрайської діяльності. Ці системи можуть генерувати велику кількість хибних спрацьовувань, значно збільшуючи обсяг ручних розслідувань, які виконує команда шахраїв. Крім того, люди також схильні до помилок і мають обмежені можливості для обробки великих обсягів даних, через що ручні зусилля для виявлення шахрайства забирають багато часу, що може призвести до пропуску шахрайських транзакцій, збільшення втрат і шкоди репутації.

Машинне навчання (ML) відіграє вирішальну роль у виявленні шахрайства, оскільки воно може швидко й точно аналізувати великі обсяги даних для виявлення аномальних моделей і можливих тенденцій шахрайства. Ефективність моделі шахрайства ML значною мірою залежить від якості даних, на яких вона навчається, і, зокрема, для контрольованих моделей, точні позначені дані є вирішальними. У ML відсутність значущих історичних даних для навчання моделі називається проблема холодного запуску.

У світі виявлення шахрайства нижче наведено кілька традиційних сценаріїв холодного запуску:

Побудова точної моделі шахрайства без відсутності історії транзакцій або випадків шахрайства
Можливість точно відрізнити законну діяльність від шахрайства для нових клієнтів і облікових записів
Платежі з прийняттям рішення про ризик на адресу або бенефіціара, яких система шахрайства раніше не бачала

Є кілька способів вирішення цих сценаріїв. Наприклад, ви можете використовувати загальні моделі, відомі як універсальні моделі, які зазвичай навчаються на платформах обміну даними про шахрайство, як-от консорціуми шахраїв. Проблема такого підходу полягає в тому, що немає рівних бізнесів, а вектори шахрайських атак постійно змінюються.

Іншим варіантом є використання моделі неконтрольованого виявлення аномалій для моніторингу та виявлення незвичайної поведінки серед подій клієнтів. Проблема цього підходу полягає в тому, що не всі випадки шахрайства є аномаліями, і не всі аномалії є справді шахрайством. Таким чином, ви можете очікувати вищих показників помилкових позитивних результатів.

У цьому дописі ми покажемо, як можна швидко запустити модель ML для запобігання шахрайству в режимі реального часу з лише 100 подіями за допомогою Детектор шахрайства Amazon нова функція, Холодний старт, тим самим різко знижуючи бар’єр доступу до користувацьких моделей машинного навчання для багатьох організацій, які просто не мають часу чи можливості збирати та точно маркувати великі набори даних. Крім того, ми обговорюємо, як за допомогою збережених подій Amazon Fraud Detector ви можете переглядати результати та правильно маркувати події, щоб перенавчити свої моделі, тим самим підвищуючи ефективність заходів із запобігання шахрайству з часом.

Огляд рішення

Amazon Fraud Detector — це повністю керована служба виявлення шахрайства, яка автоматизує виявлення потенційно шахрайських дій в Інтернеті. Ви можете використовувати Amazon Fraud Detector, щоб створювати налаштовані моделі виявлення шахрайства, використовуючи ваш власний історичний набір даних, додавати логіку прийняття рішень за допомогою вбудованого механізму правил і організовувати робочі процеси прийняття рішень про ризик одним натисканням кнопки.

Раніше вам потрібно було надати понад 10,000 400 позначених подій із принаймні 100 прикладами шахрайства, щоб навчити модель. З випуском функції Cold Start ви можете швидко навчити модель із мінімум 50 подіями та принаймні 99 класифікованими як шахрайство. Порівняно з початковими вимогами до даних, це на 87% менше історичних даних і на XNUMX% менше вимог до етикеток.

Нова функція Cold Start надає інтелектуальні методи для збагачення, розширення та моделювання ризиків невеликих наборів даних. Крім того, Amazon Fraud Detector виконує призначення міток і вибірку для немаркованих подій.

Експерименти, проведені з загальнодоступними наборами даних, показують, що, знизивши обмеження до 50 випадків шахрайства та лише 100 подій, ви можете створити моделі ML для шахрайства, які стабільно перевершують неконтрольовані та напівконтрольовані моделі.

Продуктивність моделі Cold Start

На здатність моделі ML узагальнювати та робити точні прогнози на основі невидимих даних впливає якість і різноманітність навчального набору даних. Для моделей із холодним пуском це не відрізняється. Ви повинні мати процеси, оскільки збирається більше даних, щоб правильно позначати ці події та перенавчати моделі, що зрештою призведе до оптимальної продуктивності моделі.

З нижчими вимогами до даних нестабільність звітної продуктивності зростає через збільшення дисперсії моделі та обмежений розмір тестових даних. Щоб допомогти вам сформувати правильні очікування продуктивності моделі, окрім AUC моделі, Amazon Fraud Detector також повідомляє показники діапазону невизначеності. У наведеній нижче таблиці визначено ці показники.

.	.	AUC
.	.	<0.6	0.6 - 0.8	> = 0.8
Інтервал невизначеності AUC	> 0.3	Продуктивність моделі дуже низька і може сильно відрізнятися. Очікуйте низьку ефективність виявлення шахрайства.	Продуктивність моделі низька і може сильно відрізнятися. Очікуйте обмежену ефективність виявлення шахрайства.	Продуктивність моделі може сильно відрізнятися.
	0.1 - 0.3	Продуктивність моделі дуже низька і може значно відрізнятися. Очікуйте низьку ефективність виявлення шахрайства.	Продуктивність моделі низька і може значно відрізнятися. Очікуйте обмежену ефективність виявлення шахрайства.	Продуктивність моделі може істотно відрізнятися.
	<0.1	Продуктивність моделі дуже низька. Очікуйте низьку ефективність виявлення шахрайства.	Продуктивність моделі низька. Очікуйте обмежену ефективність виявлення шахрайства.	Без попередження

Навчання моделі Cold Start

Навчання моделі шахрайства Cold Start ідентично навчанню будь-якої іншої моделі Amazon Fraud Detector; що відрізняється, так це розмір набору даних. Ви можете знайти зразки наборів даних для тренінгу Cold Start у нашому Репо GitHub. Щоб навчити спеціальну модель Amazon Fraud Detector, виконайте наші практичні заняття підручник. Ви можете використовувати або Посібник консолі Amazon Fraud Detector або Підручник з SDK створити, навчити та розгорнути модель виявлення шахрайства.

Після навчання вашої моделі ви можете переглянути показники продуктивності, а потім розгорнути її, змінивши її статус на Active. Щоб дізнатися більше про оцінки моделі та показники ефективності, див Модельні оцінки та Показники ефективності моделі. Тепер ви можете додати свою модель до свого детектора, додати бізнес-правила інтерпретувати показники ризику, які видає модель, і робити прогнози в реальному часі за допомогою GetEventPrediction API.

Безперервне вдосконалення моделі ML для шахрайства та цикл зворотного зв’язку

За допомогою функції Amazon Fraud Detector Cold Start ви можете швидко запустити кінцеву точку детектора шахрайства та негайно почати захищати свій бізнес. Однак постійно з’являються нові моделі шахрайства, тому дуже важливо перенавчити моделі Cold Start новими даними, щоб з часом підвищити точність і ефективність прогнозів.

Щоб допомогти вам повторювати свої моделі, Amazon Fraud Detector автоматично зберігає всі події, надіслані в службу для висновку. Ви можете змінити або підтвердити, що прапор надсилання подій увімкнено на рівні типу події, як показано на наступному знімку екрана.

Overcome the machine learning cold start challenge in fraud detection using Amazon Fraud Detector PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Завдяки функції збережених подій ви можете використовувати Amazon Fraud Detector SDK для програмного доступу до події, перегляду метаданих події та пояснення прогнозу та прийняття обґрунтованого рішення щодо ризику. Крім того, ви можете позначити подію для майбутнього перепідготовки моделі та постійного вдосконалення моделі. На наступній діаграмі показано приклад цього робочого процесу.

Overcome the machine learning cold start challenge in fraud detection using Amazon Fraud Detector PlatoBlockchain Data Intelligence. Vertical Search. Ai.

У наведених нижче фрагментах коду ми демонструємо процес позначення збереженої події:

Щоб зробити прогноз шахрайства в реальному часі щодо події, викличте GetEventPrediction API:

import boto3 def get_event_prediction(): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction( detectorId='your_detector_name', detectorVersionId='1', eventId='my-event-id-1234', eventTypeName='your_event_type', entities=[ { 'entityType': 'user', 'entityId': 'A12345' }, ], eventTimestamp= '2023-03-23T21:42:03.658Z', eventVariables={ 'email': 'test@anymockcompany.com', 'ip': '123.123.123.123', 'card_bin': '400022', 'billing_zip': '50401' } ) return(prediction)

Відповідь API:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ]

Як видно у відповіді, на основі відповідного правила механізму прийняття рішень подію слід надіслати на перевірку вручну командою з шахрайства. Збираючи метадані пояснення прогнозу, ви можете отримати уявлення про те, як кожна змінна події вплинула на оцінку прогнозу шахрайства моделі.

Щоб зібрати цю інформацію, ми використовуємо get_event_prediction_metada API:

import boto3 def get_event_prediction_metadata(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction_metadata( eventId = 'my-event-id-1234', eventTypeName = 'your_event_type', predictionTimestamp = '2023-03-23T21:44:39.318Z', detectorId = 'your_detector_name', detectorVersionId = '1' ) return(prediction)

Відповідь API:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ] { "eventId": "my-event-id-1234", … <REDACTED> … "eventVariables": [ { "name": "ip", "value": "123.123.123.123" }, { "name": "billing_zip", "value": "50401" }, { "name": "email", "value": "test@anymockcompany.com" }, { "name": "card_bin", "value": "400022" } ],
… <REDACTED>
… "evaluations": [ { "evaluationScore": "932.0", "predictionExplanations": { "variableImpactExplanations": [ { "eventVariableName": "billing_zip", "relativeImpact": "1", "logOddsImpact": 1.018196990713477135 }, { "eventVariableName": "ip", "relativeImpact": "0", "logOddsImpact": -0.23122438788414001 }, { "eventVariableName": "email", "relativeImpact": "0", "logOddsImpact": 0.004304269328713417 }, { "eventVariableName": "card_bin", "relativeImpact": "0", "logOddsImpact": -0.011150157079100609 } ],
}

Завдяки цій статистиці аналітик шахрайства може прийняти обґрунтоване рішення щодо ризику щодо відповідної події та оновити мітку події.

Щоб оновити мітку події, зателефонуйте за номером update_event_label API:

import boto3 def update_event_label(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.update_event_label( eventId = "my-event-id-1234", eventTypeName = "your_event_type", assignedLabel='1', # Fraud labelTimestamp='2023-03-25T11:20:03.658Z' ) return(prediction)

Відповідь API

{ "ResponseMetadata": { "RequestId": "3e28caa0-2a06-4b8d-9a10-9081811bf22d", "HTTPStatusCode": 200, … <REDACTED> … "RetryAttempts": 0 }
}

Як останній крок, ви можете перевірити, чи правильно оновлено мітку події.

Щоб перевірити мітку події, зателефонуйте get_event API:

import boto3 def get_event(): fraudDetector = boto3.client('frauddetector') event = fraudDetector.get_event( eventId='my-event-id-1234', eventTypeName=’your_event_type' ) return(event)

Відповідь API

{ "event": { "eventId": "my-event-id-1234", "eventTimestamp": "2023-03-23T21:42:03.658Z", "eventVariables": { "billing_zip": "50401", "card_bin": "400022", "email": "test@anymockcompany.com", "ip": "123.123.123.123" }, "currentLabel": "1", "labelTimestamp": "2023-03-25T11:20:03.658Z", "entities": [ { "entityType": "user", "entityId": "A12345" } ] }
}

Прибирати

Щоб уникнути майбутніх витрат, видаліть ресурси, створені для рішення.

Висновок

Ця публікація продемонструвала, як можна швидко запустити систему запобігання шахрайству в режимі реального часу з декількома 100 подіями за допомогою нової функції Cold Start Amazon Fraud Detector. Ми обговорили, як ви можете використовувати збережені події для перегляду результатів і правильного позначення подій і перенавчання ваших моделей, покращуючи ефективність заходів із запобігання шахрайству з часом.

Повністю керовані сервіси AWS, такі як Amazon Fraud Detector, допомагають скоротити час, який компанії витрачають на аналіз поведінки користувачів, щоб виявити шахрайство на своїх платформах, і більше зосереджуються на підвищенні цінності бізнесу. Щоб дізнатися більше про те, як Amazon Fraud Detector може допомогти вашому бізнесу, відвідайте Детектор шахрайства Amazon.

Про авторів

Марсель Півідаль є старшим глобальним архітектором рішень AI Services у Всесвітній організації спеціалістів. Марсель має більш ніж 20-річний досвід вирішення бізнес-проблем за допомогою технологій для фінансових технологій, платіжних постачальників, фармацевтичних та державних установ. Нині його сфера уваги — управління ризиками, запобігання шахрайству та перевірка особи.

Джулія Сю є науковим співробітником Amazon Fraud Detector. Вона захоплена вирішенням проблем клієнтів за допомогою методів машинного навчання. У вільний час вона полюбляє піші прогулянки, малює та досліджує нові кав’ярні.

Гільєрме Річчі є старшим архітектором рішень в AWS, який допомагає стартапам модернізувати та оптимізувати витрати на їхні програми. Маючи понад 10 років досвіду роботи з компаніями у фінансовому секторі, зараз він працює разом із командою спеціалістів зі штучного інтелекту та ML.

Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
Платоблокчейн. Web3 Metaverse Intelligence. Розширені знання. Доступ тут.
Карбування майбутнього з Адріенн Ешлі. Доступ тут.
джерело: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/

Часова мітка: Квітень 17, 2023

Часова мітка: Березень 10, 2023

Перевидано Платоном

Використовуйте Amazon SageMaker Data Wrangler в Amazon SageMaker Studio з конфігурацією життєвого циклу за замовчуванням

Зменште енергоспоживання робочих навантажень машинного навчання до 90% за допомогою спеціально розроблених прискорювачів AWS | Веб-сервіси Amazon

Покращуйте своїх помічників із самообслуговування за допомогою нових генеративних функцій ШІ в Amazon Lex | Веб-сервіси Amazon

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки