Оскільки все більше компаній збільшують свою присутність в Інтернеті, щоб краще обслуговувати своїх клієнтів, постійно з’являються нові схеми шахрайства. У сучасному цифровому середовищі, яке постійно розвивається, де шахраї стають все більш витонченими у своїй тактиці, виявлення та запобігання таким шахрайським діям стало першорядним для компаній і фінансових установ.
Традиційні системи виявлення шахрайства, засновані на правилах, обмежені здатністю швидко виконувати повторні дії, оскільки вони покладаються на попередньо визначені правила та порогові значення для позначення потенційно шахрайської діяльності. Ці системи можуть генерувати велику кількість хибних спрацьовувань, значно збільшуючи обсяг ручних розслідувань, які виконує команда шахраїв. Крім того, люди також схильні до помилок і мають обмежені можливості для обробки великих обсягів даних, через що ручні зусилля для виявлення шахрайства забирають багато часу, що може призвести до пропуску шахрайських транзакцій, збільшення втрат і шкоди репутації.
Машинне навчання (ML) відіграє вирішальну роль у виявленні шахрайства, оскільки воно може швидко й точно аналізувати великі обсяги даних для виявлення аномальних моделей і можливих тенденцій шахрайства. Ефективність моделі шахрайства ML значною мірою залежить від якості даних, на яких вона навчається, і, зокрема, для контрольованих моделей, точні позначені дані є вирішальними. У ML відсутність значущих історичних даних для навчання моделі називається проблема холодного запуску.
У світі виявлення шахрайства нижче наведено кілька традиційних сценаріїв холодного запуску:
- Побудова точної моделі шахрайства без відсутності історії транзакцій або випадків шахрайства
- Можливість точно відрізнити законну діяльність від шахрайства для нових клієнтів і облікових записів
- Платежі з прийняттям рішення про ризик на адресу або бенефіціара, яких система шахрайства раніше не бачала
Є кілька способів вирішення цих сценаріїв. Наприклад, ви можете використовувати загальні моделі, відомі як універсальні моделі, які зазвичай навчаються на платформах обміну даними про шахрайство, як-от консорціуми шахраїв. Проблема такого підходу полягає в тому, що немає рівних бізнесів, а вектори шахрайських атак постійно змінюються.
Іншим варіантом є використання моделі неконтрольованого виявлення аномалій для моніторингу та виявлення незвичайної поведінки серед подій клієнтів. Проблема цього підходу полягає в тому, що не всі випадки шахрайства є аномаліями, і не всі аномалії є справді шахрайством. Таким чином, ви можете очікувати вищих показників помилкових позитивних результатів.
У цьому дописі ми покажемо, як можна швидко запустити модель ML для запобігання шахрайству в режимі реального часу з лише 100 подіями за допомогою Детектор шахрайства Amazon нова функція, Холодний старт, тим самим різко знижуючи бар’єр доступу до користувацьких моделей машинного навчання для багатьох організацій, які просто не мають часу чи можливості збирати та точно маркувати великі набори даних. Крім того, ми обговорюємо, як за допомогою збережених подій Amazon Fraud Detector ви можете переглядати результати та правильно маркувати події, щоб перенавчити свої моделі, тим самим підвищуючи ефективність заходів із запобігання шахрайству з часом.
Огляд рішення
Amazon Fraud Detector — це повністю керована служба виявлення шахрайства, яка автоматизує виявлення потенційно шахрайських дій в Інтернеті. Ви можете використовувати Amazon Fraud Detector, щоб створювати налаштовані моделі виявлення шахрайства, використовуючи ваш власний історичний набір даних, додавати логіку прийняття рішень за допомогою вбудованого механізму правил і організовувати робочі процеси прийняття рішень про ризик одним натисканням кнопки.
Раніше вам потрібно було надати понад 10,000 400 позначених подій із принаймні 100 прикладами шахрайства, щоб навчити модель. З випуском функції Cold Start ви можете швидко навчити модель із мінімум 50 подіями та принаймні 99 класифікованими як шахрайство. Порівняно з початковими вимогами до даних, це на 87% менше історичних даних і на XNUMX% менше вимог до етикеток.
Нова функція Cold Start надає інтелектуальні методи для збагачення, розширення та моделювання ризиків невеликих наборів даних. Крім того, Amazon Fraud Detector виконує призначення міток і вибірку для немаркованих подій.
Експерименти, проведені з загальнодоступними наборами даних, показують, що, знизивши обмеження до 50 випадків шахрайства та лише 100 подій, ви можете створити моделі ML для шахрайства, які стабільно перевершують неконтрольовані та напівконтрольовані моделі.
Продуктивність моделі Cold Start
На здатність моделі ML узагальнювати та робити точні прогнози на основі невидимих даних впливає якість і різноманітність навчального набору даних. Для моделей із холодним пуском це не відрізняється. Ви повинні мати процеси, оскільки збирається більше даних, щоб правильно позначати ці події та перенавчати моделі, що зрештою призведе до оптимальної продуктивності моделі.
З нижчими вимогами до даних нестабільність звітної продуктивності зростає через збільшення дисперсії моделі та обмежений розмір тестових даних. Щоб допомогти вам сформувати правильні очікування продуктивності моделі, окрім AUC моделі, Amazon Fraud Detector також повідомляє показники діапазону невизначеності. У наведеній нижче таблиці визначено ці показники.
. | . | AUC | ||
. | . | <0.6 | 0.6 - 0.8 | > = 0.8 |
Інтервал невизначеності AUC | > 0.3 | Продуктивність моделі дуже низька і може сильно відрізнятися. Очікуйте низьку ефективність виявлення шахрайства. | Продуктивність моделі низька і може сильно відрізнятися. Очікуйте обмежену ефективність виявлення шахрайства. | Продуктивність моделі може сильно відрізнятися. |
0.1 - 0.3 | Продуктивність моделі дуже низька і може значно відрізнятися. Очікуйте низьку ефективність виявлення шахрайства. | Продуктивність моделі низька і може значно відрізнятися. Очікуйте обмежену ефективність виявлення шахрайства. | Продуктивність моделі може істотно відрізнятися. | |
<0.1 | Продуктивність моделі дуже низька. Очікуйте низьку ефективність виявлення шахрайства. | Продуктивність моделі низька. Очікуйте обмежену ефективність виявлення шахрайства. | Без попередження |
Навчання моделі Cold Start
Навчання моделі шахрайства Cold Start ідентично навчанню будь-якої іншої моделі Amazon Fraud Detector; що відрізняється, так це розмір набору даних. Ви можете знайти зразки наборів даних для тренінгу Cold Start у нашому Репо GitHub. Щоб навчити спеціальну модель Amazon Fraud Detector, виконайте наші практичні заняття підручник. Ви можете використовувати або Посібник консолі Amazon Fraud Detector або Підручник з SDK створити, навчити та розгорнути модель виявлення шахрайства.
Після навчання вашої моделі ви можете переглянути показники продуктивності, а потім розгорнути її, змінивши її статус на Active. Щоб дізнатися більше про оцінки моделі та показники ефективності, див Модельні оцінки та Показники ефективності моделі. Тепер ви можете додати свою модель до свого детектора, додати бізнес-правила інтерпретувати показники ризику, які видає модель, і робити прогнози в реальному часі за допомогою GetEventPrediction API.
Безперервне вдосконалення моделі ML для шахрайства та цикл зворотного зв’язку
За допомогою функції Amazon Fraud Detector Cold Start ви можете швидко запустити кінцеву точку детектора шахрайства та негайно почати захищати свій бізнес. Однак постійно з’являються нові моделі шахрайства, тому дуже важливо перенавчити моделі Cold Start новими даними, щоб з часом підвищити точність і ефективність прогнозів.
Щоб допомогти вам повторювати свої моделі, Amazon Fraud Detector автоматично зберігає всі події, надіслані в службу для висновку. Ви можете змінити або підтвердити, що прапор надсилання подій увімкнено на рівні типу події, як показано на наступному знімку екрана.
Завдяки функції збережених подій ви можете використовувати Amazon Fraud Detector SDK для програмного доступу до події, перегляду метаданих події та пояснення прогнозу та прийняття обґрунтованого рішення щодо ризику. Крім того, ви можете позначити подію для майбутнього перепідготовки моделі та постійного вдосконалення моделі. На наступній діаграмі показано приклад цього робочого процесу.
У наведених нижче фрагментах коду ми демонструємо процес позначення збереженої події:
- Щоб зробити прогноз шахрайства в реальному часі щодо події, викличте GetEventPrediction API:
Як видно у відповіді, на основі відповідного правила механізму прийняття рішень подію слід надіслати на перевірку вручну командою з шахрайства. Збираючи метадані пояснення прогнозу, ви можете отримати уявлення про те, як кожна змінна події вплинула на оцінку прогнозу шахрайства моделі.
- Щоб зібрати цю інформацію, ми використовуємо
get_event_prediction_metada
API:
Відповідь API:
Завдяки цій статистиці аналітик шахрайства може прийняти обґрунтоване рішення щодо ризику щодо відповідної події та оновити мітку події.
- Щоб оновити мітку події, зателефонуйте за номером
update_event_label
API:
Відповідь API
Як останній крок, ви можете перевірити, чи правильно оновлено мітку події.
- Щоб перевірити мітку події, зателефонуйте
get_event
API:
Відповідь API
Прибирати
Щоб уникнути майбутніх витрат, видаліть ресурси, створені для рішення.
Висновок
Ця публікація продемонструвала, як можна швидко запустити систему запобігання шахрайству в режимі реального часу з декількома 100 подіями за допомогою нової функції Cold Start Amazon Fraud Detector. Ми обговорили, як ви можете використовувати збережені події для перегляду результатів і правильного позначення подій і перенавчання ваших моделей, покращуючи ефективність заходів із запобігання шахрайству з часом.
Повністю керовані сервіси AWS, такі як Amazon Fraud Detector, допомагають скоротити час, який компанії витрачають на аналіз поведінки користувачів, щоб виявити шахрайство на своїх платформах, і більше зосереджуються на підвищенні цінності бізнесу. Щоб дізнатися більше про те, як Amazon Fraud Detector може допомогти вашому бізнесу, відвідайте Детектор шахрайства Amazon.
Про авторів
Марсель Півідаль є старшим глобальним архітектором рішень AI Services у Всесвітній організації спеціалістів. Марсель має більш ніж 20-річний досвід вирішення бізнес-проблем за допомогою технологій для фінансових технологій, платіжних постачальників, фармацевтичних та державних установ. Нині його сфера уваги — управління ризиками, запобігання шахрайству та перевірка особи.
Джулія Сю є науковим співробітником Amazon Fraud Detector. Вона захоплена вирішенням проблем клієнтів за допомогою методів машинного навчання. У вільний час вона полюбляє піші прогулянки, малює та досліджує нові кав’ярні.
Гільєрме Річчі є старшим архітектором рішень в AWS, який допомагає стартапам модернізувати та оптимізувати витрати на їхні програми. Маючи понад 10 років досвіду роботи з компаніями у фінансовому секторі, зараз він працює разом із командою спеціалістів зі штучного інтелекту та ML.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- Платоблокчейн. Web3 Metaverse Intelligence. Розширені знання. Доступ тут.
- Карбування майбутнього з Адріенн Ешлі. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/
- : має
- :є
- : ні
- :де
- 000
- 1
- 10
- 100
- 20
- 20 роки
- 200
- 39
- 50
- 7
- 8
- 9
- a
- здатність
- Здатний
- МЕНЮ
- доступ
- точність
- точний
- точно
- діяльності
- діяльність
- адреса
- агентства
- AI
- Послуги ШІ
- AI / ML
- ВСІ
- Також
- Amazon
- Детектор шахрайства Amazon
- серед
- суми
- an
- аналітик
- аналізувати
- Аналізуючи
- та
- виявлення аномалії
- будь-який
- API
- застосування
- підхід
- ЕСТЬ
- області
- AS
- At
- атака
- автоматизує
- автоматично
- AWS
- бар'єр
- заснований
- BE
- оскільки
- ставати
- становлення
- перед тим
- бенефіціар
- Краще
- Bootstrap
- будувати
- вбудований
- бізнес
- підприємства
- button
- by
- call
- званий
- CAN
- потужність
- виклик
- проблеми
- зміна
- заміна
- вантажі
- класифікований
- клацання
- код
- кави
- збирати
- COM
- Компанії
- порівняний
- Консоль
- постійно
- контекст
- безперервний
- витрати
- створений
- критичний
- вирішальне значення
- Поточний
- В даний час
- виготовлений на замовлення
- клієнт
- Клієнти
- налаштувати
- дані
- обмін даними
- набори даних
- рішення
- Визначає
- демонструвати
- продемонстрований
- розгортання
- Виявлення
- різний
- цифровий
- обговорювати
- обговорювалися
- розрізняти
- різноманітність
- do
- Не знаю
- різко
- водіння
- кожен
- ефективність
- зусилля
- або
- з'являються
- Кінцева точка
- двигун
- збагачення
- юридичні особи
- запис
- оцінки
- Event
- Події
- приклад
- Приклади
- очікувати
- очікування
- досвід
- пояснення
- Дослідження
- розширення
- false
- особливість
- зворотний зв'язок
- кілька
- остаточний
- фінансовий
- Фінансові установи
- Фінансовий сектор
- знайти
- фініки
- Сфокусувати
- стежити
- після
- для
- шахрайство
- виявлення шахрайства
- ЗАПОБІГАННЯ ШАХРАЙСТВУ
- шахраї
- шахрайський
- шахрайська діяльність
- Безкоштовна
- від
- повністю
- Крім того
- майбутнє
- Отримувати
- збір
- породжувати
- Глобальний
- Уряд
- значно
- практичний
- Мати
- he
- сильно
- допомога
- допомогу
- вище
- історичний
- історія
- Як
- Однак
- HTML
- HTTPS
- Людей
- однаковий
- ідентифікувати
- Особистість
- ідентичність Перевірка
- негайно
- вплив
- удосконалювати
- поліпшення
- поліпшення
- in
- Augmenter
- збільшений
- Збільшує
- зростаючий
- повідомив
- початковий
- розуміння
- нестабільність
- установи
- Розумний
- в
- Дослідження
- IP
- IT
- ЙОГО
- JPG
- відомий
- етикетка
- відсутність
- ландшафт
- великий
- провідний
- УЧИТЬСЯ
- вивчення
- рівень
- як
- обмеженою
- рамки
- трохи
- втрати
- низький
- Опускання
- машина
- навчання за допомогою машини
- зробити
- Робить
- вдалося
- управління
- керівництво
- багато
- відповідає
- заходи
- метадані
- методика
- Метрика
- може бути
- мінімальний
- ML
- модель
- Моделі
- модернізувати
- монітор
- більше
- Більше того
- множинний
- ім'я
- Нові
- зараз
- номер
- of
- on
- онлайн
- тільки
- оптимальний
- Оптимізувати
- варіант
- or
- організація
- організації
- Інше
- наші
- Вищі результати
- над
- Подолати
- власний
- Першорядний
- пристрасний
- моделі
- оплата
- постачальники платежів
- платежі
- продуктивність
- виступає
- Pharma
- місце
- Платформи
- plato
- Інформація про дані Платона
- PlatoData
- точка
- позитивний
- це можливо
- пошта
- потенційно
- прогноз
- Прогнози
- наявність
- попередження
- Попередження
- проблеми
- процес
- процеси
- захищає
- забезпечувати
- провайдери
- забезпечує
- громадськість
- якість
- питання
- швидко
- діапазон
- ставки
- реального часу
- зменшити
- звільнити
- Повідомляється
- Звіти
- вимога
- Вимога
- дослідження
- ресурси
- відповідь
- результат
- результати
- огляд
- Risk
- управління ризиками
- Роль
- Правило
- Правила
- сценарії
- вчений
- рахунок
- Sdk
- сектор
- старший
- служити
- обслуговування
- Послуги
- набори
- поділ
- магазинів
- Повинен
- Показувати
- показаний
- Шоу
- значний
- істотно
- просто
- Розмір
- невеликий
- So
- рішення
- Рішення
- ВИРІШИТИ
- Розв’язування
- деякі
- складний
- спеціаліст
- Фахівці
- конкретно
- витрачати
- старт
- Стартапи
- Статус
- Крок
- зберігати
- магазинів
- такі
- поверхню
- система
- Systems
- таблиця
- тактика
- команда
- методи
- Технологія
- тест
- ніж
- Що
- Команда
- світ
- їх
- тим самим
- отже
- Ці
- вони
- це
- через
- час
- трудомісткий
- до
- сьогоднішній
- разом
- топ
- традиційний
- поїзд
- навчений
- Навчання
- Transactions
- Тенденції
- типово
- Зрештою
- Невизначеність
- Оновити
- оновлений
- використання
- користувач
- використання
- ПЕРЕВІР
- значення
- перевірка
- перевірити
- візит
- обсяг
- Обсяги
- було
- способи
- we
- Що
- який
- в той час як
- з
- Робочі процеси
- робочий
- світ
- років
- Ти
- вашу
- зефірнет