Supere el desafío del arranque en frío del aprendizaje automático en la detección de fraudes utilizando Amazon Fraud Detector

Reeditado por Platón

seguidores: 0

A medida que más empresas aumentan su presencia en línea para servir mejor a sus clientes, surgen constantemente nuevos patrones de fraude. En el panorama digital actual en constante evolución, donde los estafadores son cada vez más sofisticados en sus tácticas, detectar y prevenir tales actividades fraudulentas se ha vuelto primordial para las empresas y las instituciones financieras.

Los sistemas tradicionales de detección de fraude basados en reglas tienen un límite en su capacidad de iteración rápida, ya que se basan en reglas y umbrales predefinidos para señalar actividades potencialmente fraudulentas. Estos sistemas pueden generar una gran cantidad de falsos positivos, aumentando significativamente el volumen de investigaciones manuales realizadas por el equipo de fraude. Además, los humanos también son propensos a errores y tienen una capacidad limitada para procesar grandes cantidades de datos, lo que hace que los esfuerzos manuales para detectar fraudes consuman mucho tiempo, lo que puede resultar en transacciones fraudulentas perdidas, mayores pérdidas y daños a la reputación.

El aprendizaje automático (ML) juega un papel crucial en la detección del fraude porque puede analizar de forma rápida y precisa grandes volúmenes de datos para identificar patrones anómalos y posibles tendencias de fraude. El rendimiento del modelo de fraude de ML depende en gran medida de la calidad de los datos en los que se entrena y, específicamente para los modelos supervisados, los datos etiquetados precisos son cruciales. En ML, la falta de datos históricos significativos para entrenar un modelo se denomina problema de arranque en frio.

En el mundo de la detección de fraudes, los siguientes son algunos escenarios tradicionales de arranque en frío:

Construir un modelo de fraude preciso sin tener un historial de transacciones o casos de fraude
Ser capaz de distinguir con precisión la actividad legítima del fraude para nuevos clientes y cuentas
Pagos de decisión de riesgo a una dirección o beneficiario nunca antes visto por el sistema de fraude

Hay varias formas de resolver estos escenarios. Por ejemplo, puede usar modelos genéricos, conocidos como modelos de talla única, que normalmente se entrenan sobre plataformas de intercambio de datos de fraude como consorcios de fraude. El desafío con este enfoque es que ningún negocio es igual y los vectores de ataque de fraude cambian constantemente.

Otra opción es usar un modelo de detección de anomalías no supervisado para monitorear y detectar comportamientos inusuales entre los eventos de los clientes. El desafío con este enfoque es que no todos los eventos de fraude son anomalías, y no todas las anomalías son de hecho fraude. Por lo tanto, puede esperar tasas de falsos positivos más altas.

En esta publicación, mostramos cómo puede iniciar rápidamente un modelo de ML de prevención de fraude en tiempo real con tan solo 100 eventos usando el Detector de fraudes de Amazon nueva caracteristica, Inicio fresco, lo que reduce drásticamente la barrera de entrada a los modelos de ML personalizados para muchas organizaciones que simplemente no tienen el tiempo o la capacidad para recopilar y etiquetar con precisión grandes conjuntos de datos. Además, analizamos cómo al usar los eventos almacenados de Amazon Fraud Detector, puede revisar los resultados y etiquetar correctamente los eventos para volver a entrenar sus modelos, mejorando así la eficacia de las medidas de prevención del fraude con el tiempo.

Resumen de la solución

Amazon Fraud Detector es un servicio de detección de fraude totalmente administrado que automatiza la detección de actividades potencialmente fraudulentas en línea. Puede usar Amazon Fraud Detector para crear modelos de detección de fraude personalizados con su propio conjunto de datos históricos, agregar lógica de decisiones con el motor de reglas incorporado y organizar flujos de trabajo de decisiones de riesgo con solo hacer clic en un botón.

Anteriormente, tenía que proporcionar más de 10,000 400 eventos etiquetados con al menos 100 ejemplos de fraude para entrenar un modelo. Con el lanzamiento de la función Cold Start, puede entrenar rápidamente un modelo con un mínimo de 50 eventos y al menos 99 clasificados como fraude. En comparación con los requisitos de datos iniciales, esta es una reducción del 87 % en los datos históricos y una reducción del XNUMX % en los requisitos de las etiquetas.

La nueva función Cold Start proporciona métodos inteligentes para enriquecer, ampliar y modelar riesgos en pequeños conjuntos de datos. Además, Amazon Fraud Detector realiza asignaciones de etiquetas y toma muestras de eventos no etiquetados.

Los experimentos realizados con conjuntos de datos públicos muestran que, al reducir los límites a 50 fraudes y solo 100 eventos, puede crear modelos de ML de fraude que superan constantemente a los modelos no supervisados y semisupervisados.

Rendimiento del modelo de arranque en frío

La capacidad de un modelo de ML para generalizar y hacer predicciones precisas sobre datos ocultos se ve afectada por la calidad y la diversidad del conjunto de datos de entrenamiento. Para los modelos Cold Start, esto no es diferente. Debe tener procesos implementados a medida que se recopilan más datos para etiquetar correctamente estos eventos y volver a entrenar los modelos, lo que en última instancia conduce a un rendimiento óptimo del modelo.

Con un requisito de datos más bajo, la inestabilidad del rendimiento informado aumenta debido a la mayor varianza del modelo y al tamaño limitado de los datos de prueba. Para ayudarlo a generar la expectativa correcta de rendimiento del modelo, además del AUC del modelo, Amazon Fraud Detector también informa métricas de rango de incertidumbre. La siguiente tabla define estas métricas.

.	.	AUC
.	.	<0.6	0.6 – 0.8	> = 0.8
Intervalo de incertidumbre AUC	> 0.3	El rendimiento del modelo es muy bajo y puede variar mucho. Espere un bajo rendimiento de detección de fraude.	El rendimiento del modelo es bajo y puede variar mucho. Espere un rendimiento de detección de fraude limitado.	El rendimiento del modelo puede variar mucho.
	0.1 – 0.3	El rendimiento del modelo es muy bajo y puede variar significativamente. Espere un bajo rendimiento de detección de fraude.	El rendimiento del modelo es bajo y puede variar significativamente. Espere un rendimiento de detección de fraude limitado.	El rendimiento del modelo puede variar significativamente.
	<0.1	El rendimiento del modelo es muy bajo. Espere un bajo rendimiento de detección de fraude.	El rendimiento del modelo es bajo. Espere un rendimiento de detección de fraude limitado.	Sin advertencia

Entrenar un modelo de arranque en frío

El entrenamiento de un modelo de fraude Cold Start es idéntico al entrenamiento de cualquier otro modelo de Amazon Fraud Detector; lo que difiere es el tamaño del conjunto de datos. Puede encontrar conjuntos de datos de muestra para el entrenamiento de arranque en frío en nuestro Repo de GitHub. Para entrenar un modelo personalizado de Amazon Fraud Detector, puede seguir nuestras prácticas tutoriales. Puede utilizar el Tutorial de la consola de Amazon Fraud Detector o de Tutorial de SDK para construir, entrenar e implementar un modelo de detección de fraude.

Después de entrenar su modelo, puede revisar las métricas de rendimiento y luego implementarlo cambiando su estado a Active. Para obtener más información sobre las puntuaciones del modelo y las métricas de rendimiento, consulte Puntuaciones del modelo y Métricas de rendimiento del modelo. En este punto, ahora puede agregar su modelo a su detector, agregar reglas de negocio para interpretar las puntuaciones de riesgo que genera el modelo y hacer predicciones en tiempo real utilizando el Obtener Predicción de Evento API.

Bucle de retroalimentación y mejora continua del modelo de Fraud ML

Con la función de inicio en frío de Amazon Fraud Detector, puede iniciar rápidamente un punto final de detector de fraude y comenzar a proteger sus negocios de inmediato. Sin embargo, constantemente surgen nuevos patrones de fraude, por lo que es fundamental volver a entrenar los modelos Cold Start con datos más nuevos para mejorar la precisión y la eficacia de las predicciones con el tiempo.

Para ayudarlo a iterar sus modelos, Amazon Fraud Detector almacena automáticamente todos los eventos enviados al servicio para su inferencia. Puede cambiar o validar que el indicador de ingestión de eventos esté activado en el nivel de tipo de evento, como se muestra en la siguiente captura de pantalla.

Supere el desafío del arranque en frío del aprendizaje automático en la detección de fraude utilizando Amazon Fraud Detector PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Con la función de eventos almacenados, puede utilizar el SDK de Amazon Fraud Detector para acceder mediante programación a un evento, revisar los metadatos del evento y la explicación de la predicción, y tomar una decisión de riesgo informada. Además, puede etiquetar el evento para la futura actualización del modelo y la mejora continua del modelo. El siguiente diagrama muestra un ejemplo de este flujo de trabajo.

Supere el desafío del arranque en frío del aprendizaje automático en la detección de fraude utilizando Amazon Fraud Detector PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

En los siguientes fragmentos de código, demostramos el proceso para etiquetar un evento almacenado:

Para hacer una predicción de fraude en tiempo real en un evento, llame a la API GetEventPrediction:

import boto3 def get_event_prediction(): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction( detectorId='your_detector_name', detectorVersionId='1', eventId='my-event-id-1234', eventTypeName='your_event_type', entities=[ { 'entityType': 'user', 'entityId': 'A12345' }, ], eventTimestamp= '2023-03-23T21:42:03.658Z', eventVariables={ 'email': 'test@anymockcompany.com', 'ip': '123.123.123.123', 'card_bin': '400022', 'billing_zip': '50401' } ) return(prediction)

Respuesta de API:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ]

Como se ve en la respuesta, según la regla del motor de decisión coincidente, el equipo de fraude debe enviar el evento para que lo revise manualmente. Al recopilar los metadatos de la explicación de la predicción, puede obtener información sobre cómo cada variable de evento afectó la puntuación de predicción de fraude del modelo.

Para recopilar esta información, utilizamos el get_event_prediction_metada API:

import boto3 def get_event_prediction_metadata(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.get_event_prediction_metadata( eventId = 'my-event-id-1234', eventTypeName = 'your_event_type', predictionTimestamp = '2023-03-23T21:44:39.318Z', detectorId = 'your_detector_name', detectorVersionId = '1' ) return(prediction)

Respuesta de API:

{ "modelScores": [ { "modelVersion": { "modelId": "your_model_name", "modelType": "TRANSACTION_FRAUD_INSIGHTS", "modelVersionNumber": "1.0" }, "scores": { "your_model_insightscore": 932 } } ], "ruleResults": [ { "ruleId": "high_risk_score", "outcomes": [ "high_risk_send_for_manual_review" ] } ] { "eventId": "my-event-id-1234", … <REDACTED> … "eventVariables": [ { "name": "ip", "value": "123.123.123.123" }, { "name": "billing_zip", "value": "50401" }, { "name": "email", "value": "test@anymockcompany.com" }, { "name": "card_bin", "value": "400022" } ],
… <REDACTED>
… "evaluations": [ { "evaluationScore": "932.0", "predictionExplanations": { "variableImpactExplanations": [ { "eventVariableName": "billing_zip", "relativeImpact": "1", "logOddsImpact": 1.018196990713477135 }, { "eventVariableName": "ip", "relativeImpact": "0", "logOddsImpact": -0.23122438788414001 }, { "eventVariableName": "email", "relativeImpact": "0", "logOddsImpact": 0.004304269328713417 }, { "eventVariableName": "card_bin", "relativeImpact": "0", "logOddsImpact": -0.011150157079100609 } ],
}

Con esta información, el analista de fraude puede tomar una decisión de riesgo informada sobre el evento en cuestión y actualizar la etiqueta del evento.

Para actualizar la etiqueta del evento llame al update_event_label API:

import boto3 def update_event_label(event, context): fraudDetector = boto3.client('frauddetector') prediction = fraudDetector.update_event_label( eventId = "my-event-id-1234", eventTypeName = "your_event_type", assignedLabel='1', # Fraud labelTimestamp='2023-03-25T11:20:03.658Z' ) return(prediction)

Respuesta de API

{ "ResponseMetadata": { "RequestId": "3e28caa0-2a06-4b8d-9a10-9081811bf22d", "HTTPStatusCode": 200, … <REDACTED> … "RetryAttempts": 0 }
}

Como paso final, puede verificar si la etiqueta del evento se actualizó correctamente.

Para verificar la etiqueta del evento, llame al get_event API:

import boto3 def get_event(): fraudDetector = boto3.client('frauddetector') event = fraudDetector.get_event( eventId='my-event-id-1234', eventTypeName=’your_event_type' ) return(event)

Respuesta de API

{ "event": { "eventId": "my-event-id-1234", "eventTimestamp": "2023-03-23T21:42:03.658Z", "eventVariables": { "billing_zip": "50401", "card_bin": "400022", "email": "test@anymockcompany.com", "ip": "123.123.123.123" }, "currentLabel": "1", "labelTimestamp": "2023-03-25T11:20:03.658Z", "entities": [ { "entityType": "user", "entityId": "A12345" } ] }
}

Limpiar

Para evitar incurrir en cargos futuros, elimine los recursos creados para la solución.

Conclusión

Esta publicación demostró cómo puede iniciar rápidamente un sistema de prevención de fraudes en tiempo real con unos 100 eventos utilizando la nueva función de inicio en frío de Amazon Fraud Detector. Discutimos cómo puede usar eventos almacenados para revisar resultados y etiquetar correctamente los eventos y volver a entrenar sus modelos, mejorando la efectividad de las medidas de prevención de fraude con el tiempo.

Los servicios de AWS totalmente administrados, como Amazon Fraud Detector, ayudan a reducir el tiempo que las empresas dedican a analizar el comportamiento de los usuarios para identificar el fraude en sus plataformas y centrarse más en generar valor empresarial. Para obtener más información sobre cómo Amazon Fraud Detector puede ayudar a su empresa, visite Detector de fraudes de Amazon.

Acerca de los autores

Marcelo Pividal es Arquitecto Sr. Global de Soluciones de Servicios de IA en la Organización Mundial de Especialistas. Marcel tiene más de 20 años de experiencia resolviendo problemas comerciales a través de la tecnología para FinTechs, proveedores de pagos, farmacéuticas y agencias gubernamentales. Sus áreas de enfoque actuales son la gestión de riesgos, la prevención del fraude y la verificación de identidad.

julia xu es un científico investigador de Amazon Fraud Detector. Le apasiona resolver los desafíos de los clientes utilizando técnicas de aprendizaje automático. En su tiempo libre, le gusta caminar, pintar y explorar nuevas cafeterías.

Guillermo Ricci es Arquitecto de Soluciones Sénior en AWS, ayudando a Startups a modernizar y optimizar los costos de sus aplicaciones. Con más de 10 años de experiencia en empresas del sector financiero, actualmente trabaja junto al equipo de especialistas en AI/ML.

Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
Platoblockchain. Inteligencia del Metaverso Web3. Conocimiento amplificado. Accede Aquí.
Acuñando el futuro con Adryenn Ashley. Accede Aquí.
Fuente: https://aws.amazon.com/blogs/machine-learning/overcome-the-machine-learning-cold-start-challenge-in-fraud-detection-using-amazon-fraud-detector/

Sello de tiempo: Abril 17, 2023

Sello de tiempo: 10 de marzo, 2023

Reeditado por Platón

Utilice Amazon SageMaker Data Wrangler en Amazon SageMaker Studio con una configuración de ciclo de vida predeterminada

Reduzca el consumo de energía de sus cargas de trabajo de aprendizaje automático hasta en un 90 % con los aceleradores especialmente diseñados de AWS | Servicios web de Amazon

Mejore sus asistentes de autoservicio con nuevas funciones de IA generativa en Amazon Lex | Servicios web de Amazon

Sobre Nosotros

Búsqueda vertical y Ai

Productos

Manténganse Conectados

Mi Cuenta