Діагностуйте продуктивність моделі перед розгортанням для Amazon Fraud Detector

Перевидано Платоном

читають: 0

Із зростанням поширення онлайн-додатків і зростанням кількості користувачів Інтернету кількість цифрового шахрайства з року в рік зростає. Детектор шахрайства Amazon надає повністю керований сервіс, який допоможе вам краще виявляти потенційно шахрайські дії в Інтернеті за допомогою передових методів машинного навчання (ML) і більш ніж 20-річного досвіду виявлення шахрайства від Amazon.

Щоб допомогти вам швидше виявляти шахрайство в різних випадках використання, Amazon Fraud Detector пропонує конкретні моделі зі спеціальними алгоритмами, збагаченнями та перетвореннями функцій. Навчання моделі є повністю автоматизованим і безпроблемним, і ви можете слідувати інструкціям у керівництво користувача або споріднені блогах щоб почати. Однак з навченими моделями вам потрібно вирішити, чи готова модель до розгортання. Для цього потрібні певні знання з ML, статистики та виявлення шахрайства, і може бути корисним знати деякі типові підходи.

Ця публікація допоможе вам діагностувати продуктивність моделі та вибрати правильну модель для розгортання. Ми розглядаємо показники, які надає Amazon Fraud Detector, допомагаємо вам діагностувати потенційні проблеми та надаємо пропозиції щодо покращення продуктивності моделі. Підходи застосовні як до шаблонів моделі Online Fraud Insights (OFI), так і до Transaction Fraud Insights (TFI).

Огляд рішення

Ця публікація містить наскрізний процес діагностики продуктивності вашої моделі. Спочатку він представляє всі показники моделі, які відображаються на консолі Amazon Fraud Detector, включаючи AUC, розподіл балів, матрицю плутанини, криву ROC і важливість змінної моделі. Потім ми представляємо триетапний підхід для діагностики ефективності моделі за допомогою різних показників. Нарешті, ми надаємо пропозиції щодо покращення продуктивності моделі для типових проблем.

Передумови

Перш ніж глибоко заглибитися в свою модель Amazon Fraud Detector, вам потрібно виконати наступні передумови:

Створіть обліковий запис AWS.
Створіть набір даних подій для модельного навчання.
Завантажте свої дані до Служба простого зберігання Amazon (Amazon S3) або передавати дані про події в Amazon Fraud Detector.
Створіть модель Amazon Fraud Detector.

Інтерпретація показників моделі

Після завершення навчання моделі Amazon Fraud Detector оцінює вашу модель, використовуючи частину даних моделювання, які не використовувалися під час навчання моделі. Він повертає показники оцінки на Модель версії для цієї моделі. Ці показники відображають продуктивність моделі, яку ви можете очікувати на реальних даних після розгортання в робочій версії.

На наступному знімку екрана показано приклад продуктивності моделі, яку повертає Amazon Fraud Detector. Ви можете вибрати різні порогові значення для розподілу балів (ліворуч), і матриця помилок (праворуч) оновлюється відповідно.

Щоб перевірити продуктивність і прийняти рішення щодо правил стратегії, можна використати наступні дані:

AUC (площа під кривою) – Загальна продуктивність цієї моделі. Модель з AUC 0.50 не краща за підкидання монети, оскільки вона представляє випадковий шанс, тоді як «ідеальна» модель матиме оцінку 1.0. Що вища AUC, то краще ваша модель може розрізняти шахрайство від законних.
Розподіл балів – Гістограма модельного розподілу показників за припущенням зразкової сукупності 100,000 0 подій. Amazon Fraud Detector генерує оцінки моделі від 1000 до XNUMX, причому що нижча оцінка, то менший ризик шахрайства. Кращий розподіл між законними (зеленим) і шахрайськими (синім) групами зазвичай вказує на кращу модель. Докладніше див Модельні оцінки.
Матриця плутанини – Таблиця, яка описує продуктивність моделі для вибраного заданого порогового значення балів, включаючи істинно позитивні, істинно негативні, хибнопозитивні, хибнонегативні, істинно позитивний показник (TPR) і хибнопозитивний рівень (FPR). Підрахунок у таблиці передбачає 100,0000 XNUMX подій. Докладніше див Показники ефективності моделі.
Крива ROC (Receiver Operator Characteristic). – Графік, який ілюструє діагностичні можливості моделі, як показано на наступному знімку екрана. Він будує графік істинної позитивної частоти як функції помилкової позитивної частоти за всіма можливими пороговими значеннями моделі. Перегляньте цю діаграму, вибравши Розширені показники. Якщо ви навчили кілька версій однієї моделі, ви можете вибрати різні порогові значення FPR, щоб перевірити зміну продуктивності.
Важливість змінної моделі – Ранг змінних моделі на основі їх внеску в згенеровану модель, як показано на наступному знімку екрана. Змінна моделі з найвищим значенням є важливішою для моделі, ніж інші змінні моделі в наборі даних для цієї версії моделі, і за замовчуванням вона вказана вгорі. Докладніше див Важливість змінної моделі.

Діагностувати продуктивність моделі

Перш ніж розгортати свою модель у виробництві, вам слід використати показники, які повертає Amazon Fraud Detector, щоб зрозуміти продуктивність моделі та діагностувати можливі проблеми. Загальні проблеми моделей ML можна розділити на дві основні категорії: проблеми, пов’язані з даними, і проблеми, пов’язані з моделлю. Amazon Fraud Detector подбав про проблеми, пов’язані з моделлю, ретельно використовуючи набори перевірки та тестування, щоб оцінити та налаштувати вашу модель на сервері. Ви можете виконати наступні кроки, щоб перевірити, чи готова ваша модель до розгортання або має можливі проблеми, пов’язані з даними:

Перевірте загальну ефективність моделі (AUC і розподіл балів).
Перегляньте бізнес-вимоги (матриця помилок і таблиця).
Перевірте важливість змінної моделі.

Перевірте загальну ефективність моделі: AUC і розподіл балів

Більш точне передбачення майбутніх подій завжди є основною метою прогнозної моделі. Значення AUC, яке повертає Amazon Fraud Detector, обчислюється на основі правильно відібраного тестового набору, який не використовується в навчанні. Загалом, модель з AUC більше 0.9 вважається хорошою моделлю.

Якщо ви спостерігаєте модель із продуктивністю, нижчою за 0.8, це зазвичай означає, що модель має місце для вдосконалення (ми обговоримо поширені проблеми низької продуктивності моделі далі в цій публікації). Зауважте, що визначення «хорошої» продуктивності значною мірою залежить від вашого бізнесу та базової моделі. Ви все одно можете виконувати кроки, наведені в цій публікації, щоб покращити свою модель Amazon Fraud Detector, навіть якщо її AUC перевищує 0.8.

З іншого боку, якщо AUC перевищує 0.99, це означає, що модель може майже ідеально відокремити шахрайство від законних подій у тестовому наборі. Іноді це «занадто добре, щоб бути правдою» (ми обговорюємо типові проблеми для дуже високої продуктивності моделі далі в цій публікації).

Окрім загального AUC, розподіл балів також може визначити, наскільки добре підходить модель. В ідеалі ви повинні бачити основну частину законних і шахрайських подій, розташованих на двох кінцях шкали, що вказує на те, що оцінка моделі може точно ранжувати події в тестовому наборі.

У наступному прикладі розподіл балів має AUC 0.96.

Якщо розподіл законних і шахрайських даних перекривався або зосереджувався в центрі, це, ймовірно, означає, що модель погано розрізняє події шахрайства від законних подій, що може вказувати на зміну розподілу історичних даних або на те, що вам потрібно більше даних чи функцій.

Нижче наведено приклад розподілу балів із AUC 0.64.

Якщо ви можете знайти точку розділення, яка може майже ідеально розділити шахрайство та законні події, існує висока ймовірність того, що в моделі є проблема витоку міток або шаблони шахрайства занадто легко виявити, що повинно привернути вашу увагу.

У наступному прикладі розподіл балів має AUC 1.0.

Перегляньте бізнес-вимоги: матриця плутанини та таблиця

Незважаючи на те, що AUC є зручним індикатором продуктивності моделі, він може не відповідати вимогам вашого бізнесу. Amazon Fraud Detector також надає такі показники, як рівень виявлення шахрайства (рівень справжнього позитивного результату), відсоток законних подій, які неправильно передбачувано як шахрайство (рівень помилкового позитивного результату), тощо, які частіше використовуються як вимоги до бізнесу. Після того, як ви навчите модель із достатньо хорошим AUC, вам потрібно порівняти модель із вимогами вашого бізнесу за допомогою цих показників.

Матриця помилок і таблиця надають вам інтерфейс для перегляду впливу та перевірки, чи він відповідає потребам вашого бізнесу. Зауважте, що цифри залежать від порогу моделі, де події з оцінками, вищими за порогове значення, класифікуються як шахрайство, а події з оцінками, нижчими за порогове значення, класифікуються як законні. Ви можете вибрати, який поріг використовувати залежно від потреб вашого бізнесу.

Наприклад, якщо ваша мета — зафіксувати 73% випадків шахрайства, тоді (як показано в прикладі нижче) ви можете вибрати порогове значення, наприклад 855, яке дозволить вам зафіксувати 73% усіх шахрайств. Однак модель також неправильно класифікує 3% законних подій як шахрайські. Якщо цей FPR прийнятний для вашого бізнесу, то модель підходить для розгортання. В іншому випадку потрібно покращити продуктивність моделі.

Інший приклад: якщо вартість блокування або виклику законного клієнта надзвичайно висока, тоді вам потрібен низький FPR і висока точність. У цьому випадку ви можете вибрати порогове значення 950, як показано в наступному прикладі, що не класифікуватиме 1% законних клієнтів як шахрайство, а 80% виявленого шахрайства насправді буде шахрайством.

Крім того, ви можете вибрати кілька порогових значень і призначити різні результати, наприклад заблокувати, дослідити, пройти. Якщо ви не можете знайти відповідні порогові значення та правила, які задовольняють усі ваші бізнес-вимоги, вам слід розглянути можливість навчання моделі за допомогою додаткових даних і атрибутів.

Перевірте важливість змінної моделі

Команда Важливість змінної моделі панель відображає, як кожна змінна впливає на вашу модель. Якщо одна змінна має значно вищу важливість, ніж інші, це може вказувати на витік етикетки або те, що шаблони шахрайства занадто легко виявити. Зауважте, що важливість змінної агрегується до ваших вхідних змінних. Якщо ви спостерігаєте трохи більшу важливість IP_ADDRESS, CARD_BIN, EMAIL_ADDRESS, PHONE_NUMBER, BILLING_ZIPабо SHIPPING_ZIP, можливо, через силу збагачення.

У наступному прикладі показано важливість змінної моделі з використанням потенційного витоку мітки investigation_status.

Важливість змінної моделі також дає вам підказки про те, які додаткові змінні потенційно можуть сприяти розвитку моделі. Наприклад, якщо ви спостерігаєте низький AUC, а функції, пов’язані з продавцем, мають високу важливість, ви можете розглянути можливість збору додаткових функцій замовлення, таких як SELLER_CATEGORY, SELLER_ADDRESS та SELLER_ACTIVE_YEARSі додайте ці змінні до своєї моделі.

Поширені проблеми низької продуктивності моделі

У цьому розділі ми обговорюємо типові проблеми, з якими ви можете зіткнутися щодо низької продуктивності моделі.

Розподіл історичних даних змінено

Зміщення розподілу історичних даних трапляється, коли у вас є великі зміни в бізнесі або виникають проблеми зі збором даних. Наприклад, якщо ви нещодавно випустили свій продукт на новий ринок, IP_ADDRESS, EMAIL та ADDRESS пов’язані функції можуть бути зовсім іншими, а спосіб дії шахрайства також може змінитися. Використовує Amazon Fraud Detector EVENT_TIMESTAMP щоб розділити дані та оцінити вашу модель на відповідній підмножині подій у вашому наборі даних. Якщо розподіл ваших історичних даних суттєво зміниться, набір для оцінювання може сильно відрізнятися від даних навчання, а продуктивність моделі може бути низькою.

Ви можете перевірити потенційну проблему зміни розподілу даних, дослідивши свої історичні дані:

Використовувати Профайлер даних Amazon Fraud Detector інструмент, щоб перевірити, чи рівень шахрайства та відсутня етикетка змінилися з часом.
Перевірте, чи суттєво змінився розподіл змінної з часом, особливо для функцій із високою важливістю змінної.
Перевірте розподіл змінних у часі за цільовими змінними. Якщо ви спостерігаєте значно більше подій шахрайства з однієї категорії в останніх даних, ви можете перевірити, чи зміна обґрунтована, використовуючи свої бізнес-судження.

Якщо ви виявите, що кількість відсутніх міток є дуже високою або рівень шахрайства постійно знижувався протягом останніх дат, це може означати, що мітки не повністю зрілі. Вам слід виключити найновіші дані або почекати довше, щоб зібрати точні мітки, а потім перенавчити свою модель.

Якщо ви спостерігаєте різкий сплеск рівня шахрайства та змінних у конкретні дати, ви можете ще раз перевірити, чи це викид чи проблема зі збором даних. У такому випадку вам слід видалити ці події та перенавчити модель.

Якщо ви виявите, що застарілі дані не можуть представити ваш поточний і майбутній бізнес, ви повинні виключити старий період даних із навчання. Якщо ви використовуєте збережені події в Amazon Fraud Detector, ви можете просто перенавчати нову версію та вибрати відповідний діапазон дат під час налаштування завдання навчання. Це також може означати, що методи шахрайства у вашому бізнесі змінюються відносно швидко з часом. Після розгортання моделі вам може знадобитися часто перенавчати її.

Неправильне відображення типу змінної

Amazon Fraud Detector збагачує та перетворює дані на основі типів змінних. Важливо зіставити свої змінні з правильним типом, щоб модель Amazon Fraud Detector могла отримати максимальне значення ваших даних. Наприклад, якщо нанести карту IP до CATEGORICAL типу замість IP_ADDRESS, ви не розумієте IP-пов’язані збагачення у серверній частині.

Загалом Amazon Fraud Detector пропонує такі дії:

Зіставте свої змінні на певні типи, наприклад IP_ADDRESS, EMAIL_ADDRESS, CARD_BIN та PHONE_NUMBER, щоб Amazon Fraud Detector міг отримати та збагатити додаткову інформацію.
Якщо ви не можете знайти певний тип змінної, зіставте її з одним із трьох загальних типів: NUMERIC, CATEGORICALабо FREE_FORM_TEXT.
Якщо змінна має текстову форму та має високу потужність, як-от огляд клієнта чи опис продукту, вам слід зіставити її з FREE_FORM_TEXT змінного типу, щоб Amazon Fraud Detector витягував для вас текстові функції та вбудовування на серверній частині. Наприклад, якщо нанести карту url_string до FREE_FORM_TEXT, він може токенізувати URL-адресу та витягувати інформацію для передачі в низхідну модель, що допоможе дізнатися більше прихованих шаблонів із URL-адреси.

Якщо ви виявите, що будь-який із ваших типів змінних неправильно зіставляється в конфігурації змінної, ви можете змінити тип змінної, а потім перенавчити модель.

Недостатньо даних або функцій

Amazon Fraud Detector потребує принаймні 10,000 400 записів для навчання моделі Online Fraud Insights (OFI) або Transaction Fraud Insights (TFI), принаймні 100 із цих записів визначено як шахрайські. TFI також вимагає, щоб як шахрайські записи, так і законні записи надходили від принаймні XNUMX різних об’єктів кожна, щоб забезпечити різноманітність набору даних. Крім того, Amazon Fraud Detector вимагає, щоб дані моделювання мали принаймні дві змінні. Це мінімальні вимоги до даних для створення корисної моделі Amazon Fraud Detector. Однак використання більшої кількості записів і змінних зазвичай допомагає моделям ML краще вивчати основні шаблони з ваших даних. Якщо ви спостерігаєте низький AUC або не можете знайти порогові значення, які відповідають вашим бізнес-вимогам, вам слід перенавчити свою модель із додаванням додаткових даних або додати нові функції до вашої моделі. Зазвичай ми знаходимо EMAIL_ADDRESS, IP, PAYMENT_TYPE, BILLING_ADDRESS, SHIPPING_ADDRESS та DEVICE пов’язані змінні важливі для виявлення шахрайства.

Іншою можливою причиною є те, що деякі з ваших змінних містять занадто багато пропущених значень. Щоб перевірити, чи це відбувається, перегляньте повідомлення про навчання моделі та зверніться до Вирішення проблем з навчальними даними для пропозицій.

Загальні проблеми для дуже високої продуктивності моделі

У цьому розділі ми обговорюємо типові проблеми, пов’язані з дуже високою продуктивністю моделі.

Витік етикетки

Витік міток відбувається, коли навчальні набори даних використовують інформацію, яка, як очікується, не буде доступною під час передбачення. Він переоцінює корисність моделі під час роботи у робочому середовищі.

Висока AUC (близько до 1), ідеально відокремлений розподіл балів і значно вища важливість однієї змінної можуть бути індикаторами потенційних проблем з витоком етикетки. Ви також можете перевірити кореляцію між функціями та міткою за допомогою Профайлер даних, Співвідношення ознак і міток графік показує кореляцію між кожною ознакою та міткою. Якщо одна функція має кореляцію понад 0.99 із міткою, ви повинні перевірити, чи ця функція використовується належним чином на основі ділових суджень. Наприклад, щоб побудувати модель ризику для схвалення або відхилення заявки на кредит, вам не слід використовувати такі функції, як AMOUNT_PAID, тому що виплати відбуваються після процесу андеррайтингу. Якщо змінна недоступна на момент, коли ви робите прогноз, вам слід видалити цю змінну з конфігурації моделі та перенавчити нову модель.

У наступному прикладі показано кореляцію між кожною змінною та міткою. investigation_status має високу кореляцію (близьку до 1) з міткою, тому вам слід ще раз перевірити, чи є проблема витоку мітки.

Прості схеми шахрайства

Якщо шаблони шахрайства у ваших даних прості, ви також можете спостерігати дуже високу продуктивність моделі. Наприклад, припустімо, що всі події шахрайства в даних моделювання надходять через одного внутрішнього постачальника послуг; модель легко вибрати IP-пов’язаних змінних і повертає «ідеальну» модель з високою важливістю IP.

Прості схеми шахрайства не завжди вказують на проблему з даними. Цілком правда, що методи шахрайства у вашому бізнесі легко виявити. Однак перш ніж зробити висновок, вам потрібно переконатися, що мітки, які використовуються під час навчання моделі, точні, а дані моделювання охоплюють якомога більше моделей шахрайства. Наприклад, якщо ви позначаєте події шахрайства на основі правил, як-от позначення всіх програм із певного BILLING_ZIP плюс PRODUCT_CATEGORY як шахрайство, модель може легко виловити ці шахрайства шляхом імітації правил і досягнення високого AUC.

Ви можете перевірити розподіл міток між різними категоріями або бункерами кожної функції за допомогою Профайлер даних. Наприклад, якщо ви помітили, що більшість подій шахрайства походять з однієї чи кількох категорій продуктів, це може свідчити про прості шаблони шахрайства, і вам потрібно підтвердити, що це не помилка збору даних або процесу. Якщо функція схожа CUSTOMER_ID, вам слід виключити цю функцію в моделях навчання.

У наступному прикладі показано розподіл міток між різними категоріями product_category. Усе шахрайство походить від двох категорій продуктів.

Неправильна вибірка даних

Неналежна вибірка даних може статися, якщо ви взяли вибірку та надіслали лише частину даних до Amazon Fraud Detector. Якщо вибірка даних не виконується належним чином і не є репрезентативною для робочого трафіку, звіт про продуктивність моделі буде неточним, і модель може бути марною для прогнозування виробництва. Наприклад, якщо всі події шахрайства в даних моделювання взято з Азії, а всі законні події – із США, модель може навчитися відокремлювати шахрайство від законних на основі BILLING_COUNTRY. У цьому випадку модель не є загальною для застосування до інших популяцій.

Зазвичай ми пропонуємо надсилати всі останні події без вибірки. На основі обсягу даних і рівня шахрайства Amazon Fraud Detector робить вибірку перед навчанням моделі. Якщо ваші дані завеликі (понад 100 ГБ), і ви вирішите взяти вибірку та надіслати лише підмножину, вам слід випадково вибрати свої дані та переконатися, що вибірка є репрезентативною для всієї сукупності. Для TFI вам слід робити вибірку даних за об’єктами, що означає, що якщо вибірка здійснюється з одного об’єкта, ви повинні включити всю його історію, щоб агрегати на рівні об’єкта обчислювалися правильно. Зауважте, що якщо ви надсилаєте до Amazon Fraud Detector лише підмножину даних, сукупні дані в реальному часі під час висновку можуть бути неточними, якщо не буде надіслано попередні події об’єктів.

Ще одним неправильним відбором даних може бути лише використання короткого періоду даних, як-от даних за один день, для створення моделі. Дані можуть бути упередженими, особливо якщо ваш бізнес або шахрайські атаки мають сезонний характер. Зазвичай ми рекомендуємо включати в моделювання дані щонайменше за два цикли (наприклад, 2 тижні або 2 місяці), щоб забезпечити різноманітність типів шахрайства.

Висновок

Після діагностики та вирішення всіх потенційних проблем ви повинні отримати корисну модель Amazon Fraud Detector і бути впевненими в її продуктивності. Для наступного кроку ви можна створити детектор із моделлю та вашими бізнес-правилами, і будьте готові розгорнути його у виробництві для оцінки тіньового режиму.

Додаток

Як виключити змінні для навчання моделі

Після глибокого занурення ви можете визначити змінну цільову інформацію про витік і захочете виключити її з навчання моделі. Ви можете перенавчити версію моделі, виключивши непотрібні змінні, виконавши такі кроки:

На консолі Amazon Fraud Detector на панелі навігації виберіть моделі.
на моделі виберіть модель, яку хочете перенавчати.
на Дії меню, виберіть Тренувати нову версію.
Виберіть діапазон дат, який ви хочете використовувати, і виберіть МАЙБУТНІ.
на Налаштувати навчання зніміть вибір змінної, яку ви не хочете використовувати в навчанні моделі.
Укажіть ваші мітки шахрайства та законні мітки та те, як ви хочете, щоб Amazon Fraud Detector використовував події без міток, а потім виберіть МАЙБУТНІ.
Перегляньте комплектацію моделі та виберіть Створення та навчання моделі.

Як змінити тип змінної події

Змінні представляють елементи даних, які використовуються для запобігання шахрайству. У Amazon Fraud Detector усі змінні є глобальними та спільними для всіх подій і моделей, що означає, що одну змінну можна використовувати в кількох подіях. Наприклад, IP може бути пов’язаний із подіями входу, а також із подіями транзакцій. Звичайно, Amazon Fraud Detector заблокував тип змінної та тип даних після створення змінної. Щоб видалити наявну змінну, потрібно спочатку видалити всі пов’язані типи та моделі подій. Ви можете перевірити ресурси, пов’язані з конкретною змінною, перейшовши до Amazon Fraud Detector, вибравши Змінні на навігаційній панелі та виберіть назву змінної та Пов'язані ресурси.

Видаліть змінну та всі пов’язані типи подій

Щоб видалити змінну, виконайте такі дії:

На консолі Amazon Fraud Detector на панелі навігації виберіть Змінні.
Виберіть змінну, яку потрібно видалити.
Вибирати Пов'язані ресурси щоб переглянути список усіх типів подій, які використовували цю змінну.
Вам потрібно видалити ці пов’язані типи подій перед видаленням змінної.
Виберіть типи подій у списку, щоб перейти на сторінку відповідного типу події.
Вибирати Збережені події щоб перевірити, чи зберігаються дані під цим типом події.
Виберіть, якщо в Amazon Fraud Detector зберігаються події Видалити збережені події щоб видалити збережені події.
Коли завдання видалення буде завершено, з’явиться повідомлення «Збережені події для цього типу події успішно видалено».
Вибирати Пов'язані ресурси.
Якщо детектори та моделі пов’язані з цим типом подій, спершу потрібно видалити ці ресурси.
Якщо сповіщувачі пов’язані, виконайте наступні дії, щоб видалити всі пов’язані сповіщувачі:
1. Виберіть детектор, до якого потрібно перейти Деталі детектора стр.
2. У Модельні версії виберіть версію детектора.
3. Виберіть на сторінці версії детектора Дії.
4. Якщо версія детектора активна, виберіть дезактивувативиберіть Деактивуйте цю версію детектора, не замінюючи її іншою версією, і вибрати Деактивувати версію детектора.
5. Після вимкнення версії детектора виберіть Дії , А потім видаляти.
6. Повторіть ці дії, щоб видалити всі версії детектора.
7. на Деталі детектора сторінку, виберіть Пов'язані правила.
8. Виберіть правило для видалення.
9. Вибирати Дії та Видалити версію правила.
10. Введіть назву правила для підтвердження та виберіть Видалити версію.
11. Повторіть ці дії, щоб видалити всі пов’язані правила.
12. Після видалення всіх версій детектора та пов’язаних правил перейдіть до Деталі детектора сторінку, виберіть Дії, і вибрати Видалити детектор.
13. Введіть назву детектора та виберіть Видалити детектор.
14. Повторіть ці дії, щоб видалити наступний детектор.
Якщо будь-які моделі пов’язані з типом події, виконайте такі дії, щоб видалити їх:
1. Виберіть назву моделі.
2. У Модельні версії виберіть версію.
3. Якщо статус моделі є Activeвиберіть Дії та Скасувати розгортання версії моделі.
4. Що натомість? Створіть віртуальну версію себе у undeploy для підтвердження та вибору Скасувати розгортання версії моделі.
  Статус змінюється на Undeploying. Процес триває кілька хвилин.
5. Після статус стає Ready to deploy, виберіть Дії та Видалити.
6. Повторіть ці дії, щоб видалити всі версії моделі.
7. На сторінці деталей моделі виберіть «Дії» та «Видалити модель».
8. Введіть назву моделі та виберіть Видалити модель.
9. Повторіть ці дії, щоб видалити наступну модель.
Після видалення всіх пов’язаних детекторів і моделей виберіть Дії та Видалити тип події на Деталі події стр.
Введіть назву типу події та виберіть Видалити тип події.
На панелі навігації виберіть Змінніі виберіть змінну, яку потрібно видалити.
Повторіть попередні кроки, щоб видалити всі типи подій, пов’язані зі змінною.
на Змінні деталі сторінку, виберіть Дії та Видалити.
Введіть назву змінної та виберіть Видалити змінну.

Створіть нову змінну з правильним типом змінної

Після видалення змінної та всіх пов’язаних типів подій, збережених подій, моделей і детекторів із Amazon Fraud Detector ви можете створити нову змінну з таким же ім’ям і зіставити її з правильним типом змінної.

На консолі Amazon Fraud Detector на панелі навігації виберіть Змінні.
Вибирати Створювати.
Введіть назву змінної, яку ви хочете змінити (ту, яку ви видалили раніше).
Виберіть правильний тип змінної, на який потрібно змінити.
Вибирати Створіть змінну.

Завантажте дані та перенавчіть модель

Після оновлення типу змінної можна знову завантажити дані та навчити нову модель. Інструкції див Виявляйте шахрайство в Інтернеті за допомогою нових функцій детектора шахрайства Amazon.

Як додати нові змінні до існуючого типу події

Щоб додати нові змінні до наявного типу події, виконайте такі дії:

Додайте нові змінні до попереднього навчального файлу CVS.
Завантажте новий файл тренувальних даних у сегмент S3. Зверніть увагу на розташування вашого файлу навчання в Amazon S3 (наприклад, s3://bucketname/path/to/some/object.csv) і ваша роль.
На консолі Amazon Fraud Detector на панелі навігації виберіть Події
на Типи подій виберіть назву типу події, до якої потрібно додати змінні.
на Тип події деталі, виберіть Дії, То Додайте змінні.
під Виберіть, як визначити змінні цієї подіївиберіть Виберіть змінні з навчального набору даних.
Для ролі IAM виберіть наявну роль IAM або створіть нову роль для доступу до даних в Amazon S3.
для Розташування даних, введіть розташування S3 для нового навчального файлу та виберіть Завантажити.
Нові змінні, яких немає в існуючому типі події, мають з’явитися в списку.
Вибирати Додайте змінні.

Тепер нові змінні додано до існуючого типу події. Якщо ви використовуєте збережені події в Amazon Fraud Detector, нові змінні збережених подій усе ще відсутні. Вам потрібно імпортувати навчальні дані з новими змінними в Amazon Fraud Detector, а потім перенавчити нову версію моделі. Під час завантаження нових даних навчання з тими самими EVENT_ID та EVENT_TIMESTAMP, нові змінні події перезаписують попередні змінні події, що зберігаються в Amazon Fraud Detector.

Про авторів

Джулія Сю є науковим співробітником Amazon Fraud Detector. Вона захоплена вирішенням проблем клієнтів за допомогою методів машинного навчання. У вільний час вона полюбляє піші прогулянки, малює та досліджує нові кав’ярні.

Хао Чжоу є вченим-дослідником із Amazon Fraud Detector. Має докторську ступінь з електротехніки в Північно-Західному університеті, США. Він захоплений застосуванням техніки машинного навчання для боротьби з шахрайством і зловживаннями.

Абхішек Раві є старшим менеджером із продуктів Amazon Fraud Detector. Він захоплений використанням технічних можливостей для створення продуктів, які захоплюють клієнтів.

Часова мітка: 29 Червня, 2022.

Часова мітка: Травень 18, 2022

Рекомендуйте своїм користувачам найпопулярніші товари за допомогою нового рецепту Amazon Personalize

Створюйте та навчайте моделі комп’ютерного зору для визначення положень автомобіля на зображеннях за допомогою Amazon SageMaker і Amazon Rekognition | Веб-сервіси Amazon

Кластер джерел:

AWS Машинне навчання

Вихідний вузол: 1870831

Часова мітка: Серпень 3, 2023

Прискорення навчання великомасштабної нейронної мережі на ЦП за допомогою ThirdAI і AWS Graviton | Веб-сервіси Amazon

Кластер джерел:

AWS Машинне навчання

Вихідний вузол: 1953126

Часова мітка: Лютий 29, 2024

Перевидано Платоном

Створіть платформу агрономічних даних за допомогою геопросторових можливостей Amazon SageMaker

Як оцінити якість синтетичних даних – вимірювання з точки зору вірності, корисності та конфіденційності

Використовуйте Amazon Lex для запису вуличних адрес

Прискорення навчання великомасштабної нейронної мережі на ЦП за допомогою ThirdAI і AWS Graviton | Веб-сервіси Amazon

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки