По мере того, как все больше компаний расширяют свое присутствие в Интернете, чтобы лучше обслуживать своих клиентов, постоянно появляются новые схемы мошенничества. В сегодняшнем постоянно развивающемся цифровом ландшафте, где мошенники становятся все более изощренными в своей тактике, обнаружение и предотвращение таких мошеннических действий стало первостепенной задачей для компаний и финансовых учреждений.
Традиционные системы обнаружения мошенничества на основе правил ограничены своей способностью быстро выполнять итерации, поскольку они полагаются на заранее определенные правила и пороговые значения для выявления потенциально мошеннических действий. Эти системы могут генерировать большое количество ложных срабатываний, что значительно увеличивает объем ручных расследований, проводимых группой по борьбе с мошенничеством. Кроме того, люди также подвержены ошибкам и имеют ограниченные возможности для обработки больших объемов данных, поэтому ручные усилия по обнаружению мошенничества отнимают много времени, что может привести к упущенным мошенническим транзакциям, увеличению убытков и репутационному ущербу.
Машинное обучение (МО) играет решающую роль в обнаружении мошенничества, поскольку оно может быстро и точно анализировать большие объемы данных для выявления аномальных закономерностей и возможных тенденций мошенничества. Производительность модели мошенничества ML в значительной степени зависит от качества данных, на которых она обучается, и, особенно для контролируемых моделей, точные помеченные данные имеют решающее значение. В ML отсутствие значимых исторических данных для обучения модели называется проблема с холодным запуском.
В мире обнаружения мошенничества есть несколько традиционных сценариев холодного запуска:
- Построение точной модели мошенничества при отсутствии истории транзакций или случаев мошенничества
- Возможность точно отличить законную деятельность от мошенничества для новых клиентов и учетных записей.
- Платежи с принятием решения о риске на адрес или получателя, которых ранее система мошенничества не видела
Есть несколько способов решить эти сценарии. Например, вы можете использовать общие модели, известные как универсальные модели, которые обычно обучаются на платформах обмена данными о мошенничестве, таких как консорциумы по борьбе с мошенничеством. Проблема с этим подходом заключается в том, что нет равных бизнесу, а векторы мошеннических атак постоянно меняются.
Другой вариант — использовать неконтролируемую модель обнаружения аномалий для отслеживания и обнаружения необычного поведения среди событий клиентов. Проблема с этим подходом заключается в том, что не все случаи мошенничества являются аномалиями, и не все аномалии действительно являются мошенничеством. Следовательно, вы можете ожидать более высоких показателей ложных срабатываний.
В этом посте мы покажем, как можно быстро запустить модель машинного обучения для предотвращения мошенничества в режиме реального времени, используя всего лишь 100 событий, используя Амазон детектор мошенничества новая особенность, Холодный запуск, тем самым значительно снижая барьер входа в пользовательские модели машинного обучения для многих организаций, у которых просто нет времени или возможности собирать и точно маркировать большие наборы данных. Кроме того, мы обсудим, как с помощью сохраненных событий Amazon Fraud Detector можно просматривать результаты и правильно маркировать события для переобучения своих моделей, тем самым со временем повышая эффективность мер по предотвращению мошенничества.
Обзор решения
Amazon Fraud Detector — это полностью управляемая служба обнаружения мошенничества, которая автоматизирует обнаружение потенциально мошеннических действий в Интернете. Вы можете использовать Amazon Fraud Detector для создания настраиваемых моделей обнаружения мошенничества с использованием собственного набора исторических данных, добавления логики принятия решений с помощью встроенного механизма правил и управления рабочими процессами принятия решений о рисках одним нажатием кнопки.
Раньше для обучения модели требовалось предоставить более 10,000 400 помеченных событий с не менее чем 100 примерами мошенничества. С выпуском функции «Холодный старт» вы можете быстро обучить модель с минимум 50 событиями и не менее 99 классифицированными как мошенничество. По сравнению с требованиями к первоначальным данным это на 87 % меньше исторических данных и на XNUMX % меньше требований к маркировке.
Новая функция «Холодный старт» предоставляет интеллектуальные методы обогащения, расширения и моделирования рисков для небольших наборов данных. Кроме того, Amazon Fraud Detector выполняет присвоение меток и выборку немаркированных событий.
Эксперименты, проведенные с общедоступными наборами данных, показывают, что, снизив ограничения до 50 мошенничеств и только 100 событий, вы можете создавать модели машинного обучения мошенничества, которые неизменно превосходят неконтролируемые и частично контролируемые модели.
Производительность модели «Холодный старт»
На способность модели машинного обучения обобщать и делать точные прогнозы по невидимым данным влияет качество и разнообразие обучающего набора данных. Для моделей с холодным пуском это ничем не отличается. У вас должны быть процессы, поскольку собирается больше данных для правильной маркировки этих событий и переобучения моделей, что в конечном итоге приводит к оптимальной производительности модели.
При более низких требованиях к данным нестабильность сообщаемой производительности увеличивается из-за увеличения дисперсии модели и ограниченного размера тестовых данных. Чтобы помочь вам построить правильное ожидание производительности модели, помимо AUC модели, Amazon Fraud Detector также сообщает метрики диапазона неопределенности. В следующей таблице определены эти показатели.
. | . | ППК | ||
. | . | <0.6 | 0.6 – 0.8 | > = 0.8 |
Интервал неопределенности AUC | > 0.3 | Производительность модели очень низкая и может сильно различаться. Ожидайте низкой эффективности обнаружения мошенничества. | Производительность модели низкая и может сильно различаться. Ожидайте ограниченную эффективность обнаружения мошенничества. | Производительность модели может сильно различаться. |
0.1 – 0.3 | Производительность модели очень низкая и может значительно различаться. Ожидайте низкой эффективности обнаружения мошенничества. | Производительность модели низкая и может значительно различаться. Ожидайте ограниченную эффективность обнаружения мошенничества. | Производительность модели может существенно различаться. | |
<0.1 | Производительность модели очень низкая. Ожидайте низкой эффективности обнаружения мошенничества. | Производительность модели низкая. Ожидайте ограниченную эффективность обнаружения мошенничества. | Нет предупреждения |
Обучите модель холодного запуска
Обучение модели мошенничества с «холодным стартом» идентично обучению любой другой модели Amazon Fraud Detector. отличается размером набора данных. Вы можете найти образцы наборов данных для обучения «Холодному старту» в нашем GitHub репо. Чтобы обучить пользовательскую модель Amazon Fraud Detector, вы можете следовать нашим практическим рекомендациям. учебник. Вы можете использовать Руководство по работе с консолью Amazon Fraud Detector или SDK учебник для создания, обучения и развертывания модели обнаружения мошенничества.
После обучения модели вы можете просмотреть показатели производительности, а затем развернуть ее, изменив ее статус на Активные. Чтобы узнать больше о показателях модели и показателях производительности, см. Оценка модели и Метрики производительности модели. На этом этапе вы можете добавить свою модель к вашему детектору, добавить деловые правила интерпретировать оценки риска, которые выводит модель, и делать прогнозы в реальном времени, используя GetEventPrediction API.
Постоянное совершенствование модели Fraud ML и цикл обратной связи
С помощью функции холодного запуска Amazon Fraud Detector вы можете быстро запустить конечную точку детектора мошенничества и немедленно приступить к защите своего бизнеса. Однако постоянно появляются новые модели мошенничества, поэтому очень важно переобучать модели «холодного старта» с использованием новых данных, чтобы со временем повысить точность и эффективность прогнозов.
Чтобы упростить итерацию моделей, Amazon Fraud Detector автоматически сохраняет все события, отправленные в сервис, для вывода. Вы можете изменить или проверить, включен ли флаг приема событий на уровне типа события, как показано на следующем снимке экрана.
Благодаря функции сохраненных событий вы можете использовать SDK Amazon Fraud Detector для программного доступа к событию, просмотра метаданных события и объяснения прогноза, а также принятия обоснованного решения о рисках. Кроме того, вы можете пометить событие для будущего переобучения модели и постоянного улучшения модели. На следующей диаграмме показан пример этого рабочего процесса.
В следующих фрагментах кода мы демонстрируем процесс маркировки сохраненного события:
- Чтобы сделать прогноз мошенничества в реальном времени для события, вызовите API GetEventPrediction:
Как видно из ответа, на основе совпадения правила механизма принятия решений группа по борьбе с мошенничеством должна отправить событие на проверку вручную. Собирая метаданные объяснения прогноза, вы можете получить представление о том, как каждая переменная события повлияла на оценку прогноза мошенничества модели.
- Для сбора этих данных мы используем
get_event_prediction_metada
API:
Ответ API:
Благодаря этим сведениям аналитик мошенничества может принять обоснованное решение о риске рассматриваемого события и обновить метку события.
- Чтобы обновить метку события, вызовите
update_event_label
API:
Ответ API
В качестве последнего шага вы можете проверить, правильно ли обновлена метка события.
- Чтобы проверить метку события, вызовите
get_event
API:
Ответ API
Убирать
Чтобы избежать будущих расходов, удалите ресурсы, созданные для решения.
Заключение
В этом посте показано, как можно быстро запустить систему предотвращения мошенничества в режиме реального времени с несколькими или даже 100 событиями, используя новую функцию холодного запуска Amazon Fraud Detector. Мы обсудили, как вы можете использовать сохраненные события для просмотра результатов и правильной маркировки событий и переобучения своих моделей, повышая эффективность мер по предотвращению мошенничества с течением времени.
Полностью управляемые сервисы AWS, такие как Amazon Fraud Detector, помогают компаниям сократить время, затрачиваемое на анализ поведения пользователей для выявления мошенничества на своих платформах, и больше сосредоточиться на повышении эффективности бизнеса. Чтобы узнать больше о том, как Amazon Fraud Detector может помочь вашему бизнесу, посетите Детектор мошенничества Amazon.
Об авторах
Марсель Пивидаль является глобальным старшим архитектором решений AI Services Solutions во Всемирной организации специалистов. Марсель имеет более чем 20-летний опыт решения бизнес-задач с помощью технологий для финтех-компаний, платежных систем, фармацевтики и государственных учреждений. В настоящее время он занимается управлением рисками, предотвращением мошенничества и проверкой личности.
Юлия Сюй — научный сотрудник Amazon Fraud Detector. Она увлечена решением проблем клиентов с использованием методов машинного обучения. В свободное время она любит ходить в походы, рисовать и исследовать новые кофейни.
Гильерме Риччи является старшим архитектором решений в AWS, помогая стартапам модернизировать и оптимизировать затраты на свои приложения. Обладая более чем 10-летним опытом работы с компаниями финансового сектора, в настоящее время он работает вместе с командой специалистов AI/ML.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
- Чеканка будущего с Эдриенн Эшли. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/
- :имеет
- :является
- :нет
- :куда
- 000
- 1
- 10
- 100
- 20
- 20 лет
- 200
- 39
- 50
- 7
- 8
- 9
- a
- способность
- в состоянии
- О нас
- доступ
- точность
- точный
- точно
- активно
- деятельность
- адрес
- агентствах
- AI
- Услуги искусственного интеллекта
- AI / ML
- Все
- причислены
- Amazon
- Амазон детектор мошенничества
- среди
- суммы
- an
- аналитик
- анализировать
- анализ
- и
- обнаружение аномалии
- любой
- API
- Приложения
- подхода
- МЫ
- области
- AS
- At
- атаковать
- автоматы
- автоматически
- AWS
- барьер
- основанный
- BE
- , так как:
- становиться
- становление
- до
- бенефициар
- Лучшая
- Начальная загрузка
- строить
- встроенный
- бизнес
- бизнес
- кнопка
- by
- призывают
- под названием
- CAN
- Пропускная способность
- вызов
- проблемы
- изменение
- изменения
- расходы
- классифицированный
- нажмите на
- код
- Кофе
- собирать
- COM
- Компании
- сравненный
- Консоли
- постоянно
- контекст
- (CIJ)
- Расходы
- создали
- критической
- решающее значение
- Текущий
- В настоящее время
- изготовленный на заказ
- клиент
- Клиенты
- подгонянный
- данным
- обмен данными
- Наборы данных
- решение
- Определяет
- демонстрировать
- убивают
- развертывание
- обнаружение
- различный
- Интернет
- обсуждать
- обсуждается
- выделить
- Разнообразие
- do
- Dont
- драматично
- вождение
- каждый
- эффективность
- усилия
- или
- появление
- Конечная точка
- Двигатель
- обогащение
- лиц
- запись
- оценки
- События
- События
- пример
- Примеры
- ожидать
- ожидание
- опыт
- объяснение
- Исследование
- простирающийся
- ложный
- Особенность
- Обратная связь
- несколько
- окончательный
- финансовый
- Финансовые институты
- Финансовый сектор
- Найдите
- fintechs
- Фокус
- следовать
- после
- Что касается
- мошенничество
- обнаружение мошенничества
- ПРЕДОТВРАЩЕНИЕ МОШЕННИЧЕСТВА
- мошенники
- и мошенническими
- мошенническая деятельность
- Бесплатно
- от
- полностью
- Более того
- будущее
- Gain
- сбор
- порождать
- Глобальный
- Правительство
- значительно
- практический
- Есть
- he
- сильно
- помощь
- помощь
- высший
- исторический
- история
- Как
- Однако
- HTML
- HTTPS
- Людей
- идентичный
- определения
- Личность
- Идентичность Проверка
- немедленно
- влияние
- улучшать
- улучшение
- улучшение
- in
- Увеличение
- расширились
- Увеличивает
- повышение
- сообщил
- начальный
- размышления
- нестабильность
- учреждения
- Умный
- в
- Исследования
- IP
- IT
- ЕГО
- JPG
- известный
- этикетка
- Отсутствие
- пейзаж
- большой
- ведущий
- УЧИТЬСЯ
- изучение
- уровень
- такое как
- Ограниченный
- рамки
- мало
- потери
- Низкий
- Снижение
- машина
- обучение с помощью машины
- сделать
- Создание
- управляемого
- управление
- руководство
- многих
- соответствует
- меры
- Метаданные
- методы
- Метрика
- может быть
- минимальный
- ML
- модель
- Модели
- модернизировать
- монитор
- БОЛЕЕ
- Более того
- с разными
- имя
- Новые
- сейчас
- номер
- of
- on
- онлайн
- только
- оптимальный
- Оптимизировать
- Опция
- or
- организация
- организации
- Другое
- наши
- опережать
- за
- Преодолеть
- собственный
- Первостепенный
- страстный
- паттеранами
- оплата
- платежные системы
- платежи
- производительность
- выполняет
- Фармацевтика
- Часть
- Платформы
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- Точка
- положительный
- возможное
- После
- потенциально
- прогноз
- Predictions
- присутствие
- предупреждение
- предотвращение
- проблемам
- процесс
- Процессы
- защищающий
- обеспечивать
- поставщики
- приводит
- что такое варган?
- вопрос
- быстро
- ассортимент
- Стоимость
- реального времени
- уменьшить
- освободить
- Сообщается
- Отчеты
- требование
- Требования
- исследованиям
- Полезные ресурсы
- ответ
- результат
- Итоги
- обзоре
- Снижение
- управление рисками
- Роли
- Правило
- условиями,
- Сценарии
- Ученый
- Гол
- SDK
- сектор
- старший
- служить
- обслуживание
- Услуги
- Наборы
- разделение
- магазинов
- должен
- показывать
- показанный
- Шоу
- значительный
- существенно
- просто
- Размер
- небольшой
- So
- Решение
- Решения
- РЕШАТЬ
- Решение
- некоторые
- сложный
- специалист
- специалисты
- конкретно
- тратить
- Начало
- Стартапы
- Статус:
- Шаг
- хранить
- магазины
- такие
- Поверхность
- система
- системы
- ТАБЛИЦЫ
- тактика
- команда
- снижения вреда
- Технологии
- тестXNUMX
- чем
- который
- Ассоциация
- мир
- их
- тем самым
- следовательно
- Эти
- они
- этой
- Через
- время
- кропотливый
- в
- Сегодняшних
- вместе
- топ
- традиционный
- Train
- специалистов
- Обучение
- Сделки
- Тенденции
- типично
- В конечном счете
- Неопределенность
- Обновление ПО
- обновление
- использование
- Информация о пользователе
- через
- VALIDATE
- ценностное
- проверка
- проверить
- Войти
- объем
- тома
- законопроект
- способы
- we
- Что
- который
- в то время как
- Рабочие процессы
- работает
- Мир
- лет
- Ты
- ВАШЕ
- зефирнет