Преодолеть проблему холодного запуска машинного обучения при обнаружении мошенничества с помощью Amazon Fraud Detector

Переиздано Платоном

Читают: 0

По мере того, как все больше компаний расширяют свое присутствие в Интернете, чтобы лучше обслуживать своих клиентов, постоянно появляются новые схемы мошенничества. В сегодняшнем постоянно развивающемся цифровом ландшафте, где мошенники становятся все более изощренными в своей тактике, обнаружение и предотвращение таких мошеннических действий стало первостепенной задачей для компаний и финансовых учреждений.

Традиционные системы обнаружения мошенничества на основе правил ограничены своей способностью быстро выполнять итерации, поскольку они полагаются на заранее определенные правила и пороговые значения для выявления потенциально мошеннических действий. Эти системы могут генерировать большое количество ложных срабатываний, что значительно увеличивает объем ручных расследований, проводимых группой по борьбе с мошенничеством. Кроме того, люди также подвержены ошибкам и имеют ограниченные возможности для обработки больших объемов данных, поэтому ручные усилия по обнаружению мошенничества отнимают много времени, что может привести к упущенным мошенническим транзакциям, увеличению убытков и репутационному ущербу.

Машинное обучение (МО) играет решающую роль в обнаружении мошенничества, поскольку оно может быстро и точно анализировать большие объемы данных для выявления аномальных закономерностей и возможных тенденций мошенничества. Производительность модели мошенничества ML в значительной степени зависит от качества данных, на которых она обучается, и, особенно для контролируемых моделей, точные помеченные данные имеют решающее значение. В ML отсутствие значимых исторических данных для обучения модели называется проблема с холодным запуском.

В мире обнаружения мошенничества есть несколько традиционных сценариев холодного запуска:

Построение точной модели мошенничества при отсутствии истории транзакций или случаев мошенничества
Возможность точно отличить законную деятельность от мошенничества для новых клиентов и учетных записей.
Платежи с принятием решения о риске на адрес или получателя, которых ранее система мошенничества не видела

Есть несколько способов решить эти сценарии. Например, вы можете использовать общие модели, известные как универсальные модели, которые обычно обучаются на платформах обмена данными о мошенничестве, таких как консорциумы по борьбе с мошенничеством. Проблема с этим подходом заключается в том, что нет равных бизнесу, а векторы мошеннических атак постоянно меняются.

Другой вариант — использовать неконтролируемую модель обнаружения аномалий для отслеживания и обнаружения необычного поведения среди событий клиентов. Проблема с этим подходом заключается в том, что не все случаи мошенничества являются аномалиями, и не все аномалии действительно являются мошенничеством. Следовательно, вы можете ожидать более высоких показателей ложных срабатываний.

В этом посте мы покажем, как можно быстро запустить модель машинного обучения для предотвращения мошенничества в режиме реального времени, используя всего лишь 100 событий, используя Амазон детектор мошенничества новая особенность, Холодный запуск, тем самым значительно снижая барьер входа в пользовательские модели машинного обучения для многих организаций, у которых просто нет времени или возможности собирать и точно маркировать большие наборы данных. Кроме того, мы обсудим, как с помощью сохраненных событий Amazon Fraud Detector можно просматривать результаты и правильно маркировать события для переобучения своих моделей, тем самым со временем повышая эффективность мер по предотвращению мошенничества.

Обзор решения

Amazon Fraud Detector — это полностью управляемая служба обнаружения мошенничества, которая автоматизирует обнаружение потенциально мошеннических действий в Интернете. Вы можете использовать Amazon Fraud Detector для создания настраиваемых моделей обнаружения мошенничества с использованием собственного набора исторических данных, добавления логики принятия решений с помощью встроенного механизма правил и управления рабочими процессами принятия решений о рисках одним нажатием кнопки.

Раньше для обучения модели требовалось предоставить более 10,000 400 помеченных событий с не менее чем 100 примерами мошенничества. С выпуском функции «Холодный старт» вы можете быстро обучить модель с минимум 50 событиями и не менее 99 классифицированными как мошенничество. По сравнению с требованиями к первоначальным данным это на 87 % меньше исторических данных и на XNUMX % меньше требований к маркировке.

Новая функция «Холодный старт» предоставляет интеллектуальные методы обогащения, расширения и моделирования рисков для небольших наборов данных. Кроме того, Amazon Fraud Detector выполняет присвоение меток и выборку немаркированных событий.

Эксперименты, проведенные с общедоступными наборами данных, показывают, что, снизив ограничения до 50 мошенничеств и только 100 событий, вы можете создавать модели машинного обучения мошенничества, которые неизменно превосходят неконтролируемые и частично контролируемые модели.

Производительность модели «Холодный старт»

На способность модели машинного обучения обобщать и делать точные прогнозы по невидимым данным влияет качество и разнообразие обучающего набора данных. Для моделей с холодным пуском это ничем не отличается. У вас должны быть процессы, поскольку собирается больше данных для правильной маркировки этих событий и переобучения моделей, что в конечном итоге приводит к оптимальной производительности модели.

При более низких требованиях к данным нестабильность сообщаемой производительности увеличивается из-за увеличения дисперсии модели и ограниченного размера тестовых данных. Чтобы помочь вам построить правильное ожидание производительности модели, помимо AUC модели, Amazon Fraud Detector также сообщает метрики диапазона неопределенности. В следующей таблице определены эти показатели.

.	.	ППК
.	.	<0.6	0.6 – 0.8	> = 0.8
Интервал неопределенности AUC	> 0.3	Производительность модели очень низкая и может сильно различаться. Ожидайте низкой эффективности обнаружения мошенничества.	Производительность модели низкая и может сильно различаться. Ожидайте ограниченную эффективность обнаружения мошенничества.	Производительность модели может сильно различаться.
	0.1 – 0.3	Производительность модели очень низкая и может значительно различаться. Ожидайте низкой эффективности обнаружения мошенничества.	Производительность модели низкая и может значительно различаться. Ожидайте ограниченную эффективность обнаружения мошенничества.	Производительность модели может существенно различаться.
	<0.1	Производительность модели очень низкая. Ожидайте низкой эффективности обнаружения мошенничества.	Производительность модели низкая. Ожидайте ограниченную эффективность обнаружения мошенничества.	Нет предупреждения

Обучите модель холодного запуска

Обучение модели мошенничества с «холодным стартом» идентично обучению любой другой модели Amazon Fraud Detector. отличается размером набора данных. Вы можете найти образцы наборов данных для обучения «Холодному старту» в нашем GitHub репо. Чтобы обучить пользовательскую модель Amazon Fraud Detector, вы можете следовать нашим практическим рекомендациям. учебник. Вы можете использовать Руководство по работе с консолью Amazon Fraud Detector или SDK учебник для создания, обучения и развертывания модели обнаружения мошенничества.

После обучения модели вы можете просмотреть показатели производительности, а затем развернуть ее, изменив ее статус на Активные. Чтобы узнать больше о показателях модели и показателях производительности, см. Оценка модели и Метрики производительности модели. На этом этапе вы можете добавить свою модель к вашему детектору, добавить деловые правила интерпретировать оценки риска, которые выводит модель, и делать прогнозы в реальном времени, используя GetEventPrediction API.

Постоянное совершенствование модели Fraud ML и цикл обратной связи

С помощью функции холодного запуска Amazon Fraud Detector вы можете быстро запустить конечную точку детектора мошенничества и немедленно приступить к защите своего бизнеса. Однако постоянно появляются новые модели мошенничества, поэтому очень важно переобучать модели «холодного старта» с использованием новых данных, чтобы со временем повысить точность и эффективность прогнозов.

Чтобы упростить итерацию моделей, Amazon Fraud Detector автоматически сохраняет все события, отправленные в сервис, для вывода. Вы можете изменить или проверить, включен ли флаг приема событий на уровне типа события, как показано на следующем снимке экрана.

Решите проблему холодного запуска машинного обучения при обнаружении мошенничества с помощью Amazon Fraud Detector PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Благодаря функции сохраненных событий вы можете использовать SDK Amazon Fraud Detector для программного доступа к событию, просмотра метаданных события и объяснения прогноза, а также принятия обоснованного решения о рисках. Кроме того, вы можете пометить событие для будущего переобучения модели и постоянного улучшения модели. На следующей диаграмме показан пример этого рабочего процесса.

В следующих фрагментах кода мы демонстрируем процесс маркировки сохраненного события:

Чтобы сделать прогноз мошенничества в реальном времени для события, вызовите API GetEventPrediction:

import boto3 def get_event_prediction(): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction( detectorId='your_detector_name', detectorVersionId='1', eventId='my-event-id-1234', eventTypeName='your_event_type', entities=[ { 'entityType': 'user', 'entityId': 'A12345' }, ], eventTimestamp= '2023-03-23T21:42:03.658Z', eventVariables={ 'email': 'test@anymockcompany.com', 'ip': '123.123.123.123', 'card_bin': '400022', 'billing_zip': '50401' } ) return(prediction)

Ответ API:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ]

Как видно из ответа, на основе совпадения правила механизма принятия решений группа по борьбе с мошенничеством должна отправить событие на проверку вручную. Собирая метаданные объяснения прогноза, вы можете получить представление о том, как каждая переменная события повлияла на оценку прогноза мошенничества модели.

Для сбора этих данных мы используем get_event_prediction_metada API:

import boto3 def get_event_prediction_metadata(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction_metadata( eventId = 'my-event-id-1234', eventTypeName = 'your_event_type', predictionTimestamp = '2023-03-23T21:44:39.318Z', detectorId = 'your_detector_name', detectorVersionId = '1' ) return(prediction)

Ответ API:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ] { "eventId": "my-event-id-1234", … <REDACTED> … "eventVariables": [ { "name": "ip", "value": "123.123.123.123" }, { "name": "billing_zip", "value": "50401" }, { "name": "email", "value": "test@anymockcompany.com" }, { "name": "card_bin", "value": "400022" } ],
… <REDACTED>
… "evaluations": [ { "evaluationScore": "932.0", "predictionExplanations": { "variableImpactExplanations": [ { "eventVariableName": "billing_zip", "relativeImpact": "1", "logOddsImpact": 1.018196990713477135 }, { "eventVariableName": "ip", "relativeImpact": "0", "logOddsImpact": -0.23122438788414001 }, { "eventVariableName": "email", "relativeImpact": "0", "logOddsImpact": 0.004304269328713417 }, { "eventVariableName": "card_bin", "relativeImpact": "0", "logOddsImpact": -0.011150157079100609 } ],
}

Благодаря этим сведениям аналитик мошенничества может принять обоснованное решение о риске рассматриваемого события и обновить метку события.

Чтобы обновить метку события, вызовите update_event_label API:

import boto3 def update_event_label(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.update_event_label( eventId = "my-event-id-1234", eventTypeName = "your_event_type", assignedLabel='1', # Fraud labelTimestamp='2023-03-25T11:20:03.658Z' ) return(prediction)

Ответ API

{ "ResponseMetadata": { "RequestId": "3e28caa0-2a06-4b8d-9a10-9081811bf22d", "HTTPStatusCode": 200, … <REDACTED> … "RetryAttempts": 0 }
}

В качестве последнего шага вы можете проверить, правильно ли обновлена метка события.

Чтобы проверить метку события, вызовите get_event API:

import boto3 def get_event(): fraudDetector = boto3.client('frauddetector') event = fraudDetector.get_event( eventId='my-event-id-1234', eventTypeName=’your_event_type' ) return(event)

Ответ API

{ "event": { "eventId": "my-event-id-1234", "eventTimestamp": "2023-03-23T21:42:03.658Z", "eventVariables": { "billing_zip": "50401", "card_bin": "400022", "email": "test@anymockcompany.com", "ip": "123.123.123.123" }, "currentLabel": "1", "labelTimestamp": "2023-03-25T11:20:03.658Z", "entities": [ { "entityType": "user", "entityId": "A12345" } ] }
}

Убирать

Чтобы избежать будущих расходов, удалите ресурсы, созданные для решения.

Заключение

В этом посте показано, как можно быстро запустить систему предотвращения мошенничества в режиме реального времени с несколькими или даже 100 событиями, используя новую функцию холодного запуска Amazon Fraud Detector. Мы обсудили, как вы можете использовать сохраненные события для просмотра результатов и правильной маркировки событий и переобучения своих моделей, повышая эффективность мер по предотвращению мошенничества с течением времени.

Полностью управляемые сервисы AWS, такие как Amazon Fraud Detector, помогают компаниям сократить время, затрачиваемое на анализ поведения пользователей для выявления мошенничества на своих платформах, и больше сосредоточиться на повышении эффективности бизнеса. Чтобы узнать больше о том, как Amazon Fraud Detector может помочь вашему бизнесу, посетите Детектор мошенничества Amazon.

Об авторах

Марсель Пивидаль является глобальным старшим архитектором решений AI Services Solutions во Всемирной организации специалистов. Марсель имеет более чем 20-летний опыт решения бизнес-задач с помощью технологий для финтех-компаний, платежных систем, фармацевтики и государственных учреждений. В настоящее время он занимается управлением рисками, предотвращением мошенничества и проверкой личности.

Юлия Сюй — научный сотрудник Amazon Fraud Detector. Она увлечена решением проблем клиентов с использованием методов машинного обучения. В свободное время она любит ходить в походы, рисовать и исследовать новые кофейни.

Гильерме Риччи является старшим архитектором решений в AWS, помогая стартапам модернизировать и оптимизировать затраты на свои приложения. Обладая более чем 10-летним опытом работы с компаниями финансового сектора, в настоящее время он работает вместе с командой специалистов AI/ML.

SEO-контент и PR-распределение. Получите усиление сегодня.
Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
Чеканка будущего с Эдриенн Эшли. Доступ здесь.
Источник: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/

Отметка времени: 17 апреля 2023

Отметка времени: 10 Марта, 2023

Переиздано Платоном

Используйте Amazon SageMaker Data Wrangler в Amazon SageMaker Studio с конфигурацией жизненного цикла по умолчанию.

Сокращение энергопотребления рабочих нагрузок машинного обучения до 90 % с помощью специально разработанных ускорителей AWS | Веб-сервисы Амазонки

Повысьте качество своих помощников по самообслуживанию с помощью новых функций генеративного искусственного интеллекта в Amazon Lex | Веб-сервисы Amazon

О Нас

Вертикальный поиск и AI

Платформа

Оставайтесь на связи

Учетная запись