Diagnosticar el rendimiento del modelo antes de la implementación de Amazon Fraud Detector

Reeditado por Platón

seguidores: 0

Con el crecimiento en la adopción de aplicaciones en línea y el creciente número de usuarios de Internet, el fraude digital aumenta año tras año. Detector de fraudes de Amazon proporciona un servicio completamente administrado para ayudarlo a identificar mejor las actividades en línea potencialmente fraudulentas utilizando técnicas avanzadas de aprendizaje automático (ML) y más de 20 años de experiencia en detección de fraudes de Amazon.

Para ayudarlo a detectar fraudes más rápido en múltiples casos de uso, Amazon Fraud Detector ofrece modelos específicos con algoritmos personalizados, enriquecimientos y transformaciones de funciones. El entrenamiento del modelo está completamente automatizado y sin complicaciones, y puede seguir las instrucciones en el guía del usuario O relacionado entradas del blog Para empezar. Sin embargo, con modelos entrenados, debe decidir si el modelo está listo para su implementación. Esto requiere cierto conocimiento en ML, estadísticas y detección de fraude, y puede ser útil conocer algunos enfoques típicos.

Esta publicación lo ayudará a diagnosticar el rendimiento del modelo y elegir el modelo correcto para la implementación. Analizamos las métricas proporcionadas por Amazon Fraud Detector, lo ayudamos a diagnosticar posibles problemas y brindamos sugerencias para mejorar el rendimiento del modelo. Los enfoques son aplicables tanto a las plantillas de modelo de Online Fraud Insights (OFI) como a las de Transaction Fraud Insights (TFI).

Resumen de la solución

Esta publicación proporciona un proceso integral para diagnosticar el rendimiento de su modelo. En primer lugar, presenta todas las métricas del modelo que se muestran en la consola de Amazon Fraud Detector, incluidas las AUC, la distribución de puntuaciones, la matriz de confusión, la curva ROC y la importancia de las variables del modelo. Luego presentamos un enfoque de tres pasos para diagnosticar el rendimiento del modelo usando diferentes métricas. Finalmente, proporcionamos sugerencias para mejorar el rendimiento del modelo para problemas típicos.

Requisitos previos

Antes de profundizar en su modelo de Amazon Fraud Detector, debe completar los siguientes requisitos previos:

Cree una cuenta de AWS.
Crear un conjunto de datos de eventos para la formación de modelos.
Sube tus datos a Servicio de almacenamiento simple de Amazon (Amazon S3) o ingiera los datos de su evento en Amazon Fraud Detector.
Cree un modelo de detector de fraudes de Amazon.

Interpretar las métricas del modelo

Una vez completada la capacitación del modelo, Amazon Fraud Detector evalúa su modelo utilizando parte de los datos de modelado que no se usaron en la capacitación del modelo. Devuelve las métricas de evaluación en el Versión del modelo pagina de ese modelo. Esas métricas reflejan el rendimiento del modelo que puede esperar en datos reales después de la implementación en producción.

La siguiente captura de pantalla muestra el rendimiento del modelo de ejemplo devuelto por Amazon Fraud Detector. Puede elegir diferentes umbrales en la distribución de puntajes (izquierda) y la matriz de confusión (derecha) se actualiza en consecuencia.

Puede utilizar los siguientes resultados para comprobar el rendimiento y decidir las reglas de la estrategia:

AUC (área bajo la curva) – El rendimiento general de este modelo. Un modelo con AUC de 0.50 no es mejor que lanzar una moneda porque representa una probabilidad aleatoria, mientras que un modelo "perfecto" tendrá una puntuación de 1.0. Cuanto mayor sea el AUC, mejor podrá su modelo distinguir entre fraudes y legítimos.
Distribución de puntuación – Un histograma de distribuciones de puntuación del modelo suponiendo una población de ejemplo de 100,000 eventos. Amazon Fraud Detector genera puntajes de modelo entre 0 y 1000, donde cuanto más bajo es el puntaje, menor es el riesgo de fraude. Una mejor separación entre las poblaciones legítimas (verde) y fraudulentas (azul) generalmente indica un mejor modelo. Para más detalles, consulte Puntuaciones del modelo.
Matriz de confusión – Una tabla que describe el rendimiento del modelo para el umbral de puntuación dado seleccionado, incluidos los positivos verdaderos, los negativos verdaderos, los falsos positivos, los falsos negativos, la tasa de verdaderos positivos (TPR) y la tasa de falsos positivos (FPR). El conteo en la tabla asume una población de ejemplo de 100,0000 eventos. Para más detalles, consulte Métricas de rendimiento del modelo.
Curva ROC (característica del operador del receptor) – Un gráfico que ilustra la capacidad de diagnóstico del modelo, como se muestra en la siguiente captura de pantalla. Traza la tasa de verdaderos positivos como una función de la tasa de falsos positivos sobre todos los umbrales de puntuación del modelo posibles. Vea este gráfico eligiendo Métricas avanzadas. Si ha entrenado varias versiones de un modelo, puede seleccionar diferentes umbrales de FPR para comprobar el cambio de rendimiento.
Importancia de la variable modelo – El rango de las variables del modelo en función de su contribución al modelo generado, como se muestra en la siguiente captura de pantalla. La variable del modelo con el valor más alto es más importante para el modelo que las demás variables del modelo en el conjunto de datos para esa versión del modelo, y aparece en la parte superior de forma predeterminada. Para más detalles, consulte Importancia de la variable modelo.

Diagnosticar el rendimiento del modelo

Antes de implementar su modelo en producción, debe usar las métricas que devolvió Amazon Fraud Detector para comprender el rendimiento del modelo y diagnosticar los posibles problemas. Los problemas comunes de los modelos ML se pueden dividir en dos categorías principales: problemas relacionados con los datos y problemas relacionados con el modelo. Amazon Fraud Detector se ha ocupado de los problemas relacionados con el modelo utilizando cuidadosamente conjuntos de validación y prueba para evaluar y ajustar su modelo en el backend. Puede completar los siguientes pasos para validar si su modelo está listo para la implementación o tiene posibles problemas relacionados con los datos:

Compruebe el rendimiento general del modelo (AUC y distribución de puntuación).
Revisar los requisitos comerciales (matriz de confusión y tabla).
Compruebe la importancia de la variable del modelo.

Verifique el rendimiento general del modelo: AUC y distribución de puntajes

La predicción más precisa de eventos futuros es siempre el objetivo principal de un modelo predictivo. El AUC devuelto por Amazon Fraud Detector se calcula en un conjunto de prueba correctamente muestreado que no se usó en el entrenamiento. En general, un modelo con un AUC superior a 0.9 se considera un buen modelo.

Si observa un modelo con un rendimiento inferior a 0.8, generalmente significa que el modelo puede mejorar (discutimos los problemas comunes del bajo rendimiento del modelo más adelante en esta publicación). Tenga en cuenta que la definición de "buen" rendimiento depende en gran medida de su negocio y del modelo de referencia. Todavía puede seguir los pasos de esta publicación para mejorar su modelo de Amazon Fraud Detector aunque su AUC sea superior a 0.8.

Por otro lado, si el AUC es superior a 0.99, significa que el modelo puede separar casi perfectamente los eventos fraudulentos y legítimos en el conjunto de prueba. Este es a veces un escenario "demasiado bueno para ser verdad" (discutimos problemas comunes para un rendimiento de modelo muy alto más adelante en esta publicación).

Además del AUC general, la distribución de puntajes también puede indicar qué tan bien se ajusta el modelo. Idealmente, debería ver la mayor parte de los eventos legítimos y fraudulentos ubicados en los dos extremos de la escala, lo que indica que la puntuación del modelo puede clasificar con precisión los eventos en el conjunto de prueba.

En el siguiente ejemplo, la distribución de puntuación tiene un AUC de 0.96.

Si la distribución legítima y de fraude se superpuso o se concentró en el centro, probablemente signifique que el modelo no funciona bien para distinguir los eventos de fraude de los eventos legítimos, lo que podría indicar que la distribución de datos históricos cambió o que necesita más datos o características.

El siguiente es un ejemplo de distribución de puntuación con un AUC de 0.64.

Si puede encontrar un punto de división que pueda dividir casi perfectamente el fraude y los eventos legítimos, existe una alta probabilidad de que el modelo tenga un problema de fuga de etiquetas o que los patrones de fraude sean demasiado fáciles de detectar, lo que debería llamar su atención.

En el siguiente ejemplo, la distribución de puntuación tiene un AUC de 1.0.

Revisar los requisitos comerciales: tabla y matriz de confusión

Aunque AUC es un indicador conveniente del rendimiento del modelo, es posible que no se traduzca directamente en los requisitos de su negocio. Amazon Fraud Detector también proporciona métricas como la tasa de captura de fraude (tasa de verdaderos positivos), el porcentaje de eventos legítimos que se pronostican incorrectamente como fraude (tasa de falsos positivos) y más, que se usan más comúnmente como requisitos comerciales. Después de entrenar un modelo con un AUC razonablemente bueno, debe comparar el modelo con los requisitos de su negocio con esas métricas.

La matriz y la tabla de confusión le brindan una interfaz para revisar el impacto y verificar si cumple con las necesidades de su negocio. Tenga en cuenta que los números dependen del umbral del modelo, donde los eventos con puntajes superiores al umbral se clasifican como fraude y los eventos con puntajes inferiores al umbral se clasifican como legítimos. Puede elegir qué umbral usar según los requisitos de su negocio.

Por ejemplo, si su objetivo es capturar el 73 % de los fraudes, entonces (como se muestra en el ejemplo a continuación) puede elegir un umbral como 855, que le permite capturar el 73 % de todos los fraudes. Sin embargo, el modelo también clasificará erróneamente el 3 % de los eventos legítimos como fraudulentos. Si este FPR es aceptable para su negocio, entonces el modelo es bueno para la implementación. De lo contrario, debe mejorar el rendimiento del modelo.

Otro ejemplo es si el costo de bloquear o desafiar a un cliente legítimo es extremadamente alto, entonces desea un FPR bajo y alta precisión. En ese caso, puede elegir un umbral de 950, como se muestra en el siguiente ejemplo, que clasificará incorrectamente el 1 % de los clientes legítimos como fraude y el 80 % del fraude identificado será realmente fraudulento.

Además, puede elegir múltiples umbrales y asignar diferentes resultados, como bloquear, investigar, aprobar. Si no puede encontrar umbrales y reglas adecuados que satisfagan todos los requisitos de su negocio, debería considerar entrenar su modelo con más datos y atributos.

Comprobar la importancia de la variable del modelo

El Importancia de la variable modelo El panel muestra cómo cada variable contribuye a su modelo. Si una variable tiene un valor de importancia significativamente más alto que las demás, podría indicar una fuga de etiquetas o que los patrones de fraude son demasiado fáciles de detectar. Tenga en cuenta que la importancia de la variable se vuelve a agregar a sus variables de entrada. Si observa una importancia ligeramente mayor de IP_ADDRESS, CARD_BIN, EMAIL_ADDRESS, PHONE_NUMBER, BILLING_ZIPo SHIPPING_ZIP, podría ser debido al poder de enriquecimiento.

El siguiente ejemplo muestra la importancia de la variable del modelo con una posible fuga de etiquetas usando investigation_status.

La importancia de la variable del modelo también le da pistas sobre las variables adicionales que podrían mejorar el modelo. Por ejemplo, si observa un AUC bajo y las características relacionadas con el vendedor muestran una gran importancia, podría considerar recopilar más características de pedidos, como SELLER_CATEGORY, SELLER_ADDRESSy SELLER_ACTIVE_YEARSy agregue esas variables a su modelo.

Problemas comunes para el bajo rendimiento del modelo

En esta sección, analizamos los problemas comunes que puede encontrar con respecto al bajo rendimiento del modelo.

La distribución de datos históricos cambió

La desviación de distribución de datos históricos ocurre cuando tiene un gran cambio comercial o un problema de recopilación de datos. Por ejemplo, si recientemente lanzó su producto en un nuevo mercado, el IP_ADDRESS, EMAILy ADDRESS las características relacionadas podrían ser completamente diferentes y el modus operandi del fraude también podría cambiar. Usos del detector de fraude de Amazon EVENT_TIMESTAMP para dividir datos y evaluar su modelo en el subconjunto apropiado de eventos en su conjunto de datos. Si la distribución de datos históricos cambia significativamente, el conjunto de evaluación podría ser muy diferente de los datos de entrenamiento y el rendimiento del modelo informado podría ser bajo.

Puede verificar el posible problema de cambio de distribución de datos explorando sus datos históricos:

Ingrese al Analizador de datos del detector de fraude de Amazon herramienta para verificar si la tasa de fraude y la tasa de pérdida de la etiqueta cambiaron con el tiempo.
Compruebe si la distribución de variables a lo largo del tiempo cambió significativamente, especialmente para características con una importancia variable alta.
Compruebe la distribución de variables en el tiempo por variables objetivo. Si observa significativamente más eventos de fraude de una categoría en datos recientes, es posible que desee verificar si el cambio es razonable utilizando sus juicios comerciales.

Si encuentra que la tasa de falta de la etiqueta es muy alta o que la tasa de fraude disminuyó constantemente durante las fechas más recientes, podría ser un indicador de que las etiquetas no han madurado por completo. Debe excluir los datos más recientes o esperar más tiempo para recopilar las etiquetas precisas y luego volver a entrenar su modelo.

Si observa un aumento brusco de la tasa de fraude y las variables en fechas específicas, es posible que desee volver a verificar si se trata de un problema de recopilación de datos o de valores atípicos. En ese caso, debe eliminar esos eventos y volver a entrenar el modelo.

Si encuentra que los datos desactualizados no pueden representar su negocio actual y futuro, debe excluir el período anterior de datos de la capacitación. Si está utilizando eventos almacenados en Amazon Fraud Detector, simplemente puede volver a entrenar una nueva versión y seleccionar el intervalo de fechas adecuado mientras configura el trabajo de entrenamiento. Eso también puede indicar que el modus operandi del fraude en su negocio cambia relativamente rápido con el tiempo. Después de la implementación del modelo, es posible que deba volver a entrenar su modelo con frecuencia.

Asignación de tipo de variable incorrecta

Amazon Fraud Detector enriquece y transforma los datos en función de los tipos de variables. Es importante que asigne sus variables al tipo correcto para que el modelo de Amazon Fraud Detector pueda tomar el valor máximo de sus datos. Por ejemplo, si mapeas IP En el correo electrónico “Su Cuenta de Usuario en su Nuevo Sistema XNUMXCX”. CATEGORICAL tipo en lugar de IP_ADDRESS, no entiendes IP-enriquecimientos relacionados en el backend.

En general, Amazon Fraud Detector sugiere las siguientes acciones:

Asigne sus variables a tipos específicos, como IP_ADDRESS, EMAIL_ADDRESS, CARD_BINy PHONE_NUMBER, para que Amazon Fraud Detector pueda extraer y enriquecer información adicional.
Si no puede encontrar el tipo de variable específico, asígnelo a uno de los tres tipos genéricos: NUMERIC, CATEGORICALo FREE_FORM_TEXT.
Si una variable está en forma de texto y tiene una alta cardinalidad, como una reseña de un cliente o una descripción del producto, debe asignarla al FREE_FORM_TEXT tipo de variable para que Amazon Fraud Detector extraiga funciones de texto e incrustaciones en el backend por usted. Por ejemplo, si mapeas url_string a FREE_FORM_TEXT, puede tokenizar la URL y extraer información para alimentar el modelo descendente, lo que lo ayudará a aprender más patrones ocultos de la URL.

Si encuentra que alguno de sus tipos de variables está asignado incorrectamente en la configuración de variables, puede cambiar su tipo de variable y luego volver a entrenar el modelo.

Datos o características insuficientes

Amazon Fraud Detector requiere al menos 10,000 400 registros para entrenar un modelo de Online Fraud Insights (OFI) o Transaction Fraud Insights (TFI), con al menos 100 de esos registros identificados como fraudulentos. TFI también requiere que tanto los registros fraudulentos como los registros legítimos provengan de al menos XNUMX entidades diferentes cada una para garantizar la diversidad del conjunto de datos. Además, Amazon Fraud Detector requiere que los datos de modelado tengan al menos dos variables. Esos son los requisitos mínimos de datos para construir un modelo útil de Amazon Fraud Detector. Sin embargo, usar más registros y variables generalmente ayuda a los modelos de ML a aprender mejor los patrones subyacentes de sus datos. Cuando observa un AUC bajo o no puede encontrar umbrales que cumplan con los requisitos de su negocio, debe considerar volver a entrenar su modelo con más datos o agregar nuevas características a su modelo. Por lo general, encontramos EMAIL_ADDRESS, IP, PAYMENT_TYPE, BILLING_ADDRESS, SHIPPING_ADDRESSy DEVICE las variables relacionadas son importantes en la detección del fraude.

Otra causa posible es que algunas de sus variables contengan demasiados valores faltantes. Para ver si eso está sucediendo, verifique los mensajes de entrenamiento del modelo y consulte Solucionar problemas de datos de entrenamiento para sugerencias.

Problemas comunes para un rendimiento de modelo muy alto

En esta sección, analizamos los problemas comunes relacionados con el rendimiento muy alto del modelo.

Fuga de etiquetas

La fuga de etiquetas ocurre cuando los conjuntos de datos de entrenamiento usan información que no se esperaría que estuviera disponible en el momento de la predicción. Sobreestima la utilidad del modelo cuando se ejecuta en un entorno de producción.

Un AUC alto (cerca de 1), una distribución de puntuación perfectamente separada y una importancia variable significativamente más alta de una variable podrían ser indicadores de posibles problemas de fuga de etiquetas. También puede verificar la correlación entre las características y la etiqueta usando el Analizador de datos. Correlación de características y etiquetas El gráfico muestra la correlación entre cada característica y la etiqueta. Si una función tiene una correlación superior a 0.99 con la etiqueta, debe verificar si la función se usa correctamente en función de los juicios comerciales. Por ejemplo, para crear un modelo de riesgo para aprobar o rechazar una solicitud de préstamo, no debe usar funciones como AMOUNT_PAID, porque los pagos se realizan después del proceso de suscripción. Si una variable no está disponible en el momento en que realiza la predicción, debe eliminar esa variable de la configuración del modelo y volver a entrenar un nuevo modelo.

El siguiente ejemplo muestra la correlación entre cada variable y la etiqueta. investigation_status tiene una alta correlación (cercana a 1) con la etiqueta, por lo que debe volver a verificar si hay un problema de fuga de la etiqueta.

Patrones de fraude simples

Cuando los patrones de fraude en sus datos son simples, también puede observar un rendimiento muy alto del modelo. Por ejemplo, suponga que todos los eventos de fraude en los datos de modelado provienen del mismo proveedor de servicios interno; es sencillo para el modelo elegir el IP-variables relacionadas y devolver un modelo "perfecto" con alta importancia de IP.

Los patrones de fraude simples no siempre indican un problema de datos. Podría ser cierto que el modus operandi del fraude en su negocio es fácil de capturar. Sin embargo, antes de llegar a una conclusión, debe asegurarse de que las etiquetas utilizadas en el entrenamiento del modelo sean precisas y que los datos del modelo cubran tantos patrones de fraude como sea posible. Por ejemplo, si etiqueta sus eventos de fraude según reglas, como etiquetar todas las aplicaciones de un BILLING_ZIP más PRODUCT_CATEGORY como fraude, el modelo puede detectar fácilmente esos fraudes simulando las reglas y logrando un AUC alto.

Puede verificar la distribución de etiquetas en diferentes categorías o contenedores de cada característica usando el Analizador de datos. Por ejemplo, si observa que la mayoría de los eventos de fraude provienen de una o varias categorías de productos, podría ser un indicador de patrones de fraude simples y debe confirmar que no se trata de un error de procesamiento o recopilación de datos. Si la característica es como CUSTOMER_ID, debe excluir la función en el entrenamiento del modelo.

El siguiente ejemplo muestra la distribución de etiquetas en diferentes categorías de product_category. Todo fraude proviene de dos categorías de productos.

Muestreo de datos inadecuado

El muestreo de datos incorrecto puede ocurrir cuando realizó un muestreo y solo envió parte de sus datos a Amazon Fraud Detector. Si los datos no se muestrean correctamente y no son representativos del tráfico en producción, el rendimiento del modelo informado será inexacto y el modelo podría ser inútil para la predicción de producción. Por ejemplo, si todos los eventos de fraude en los datos del modelo se muestrean en Asia y todos los eventos legítimos se muestrean en los EE. UU., el modelo podría aprender a separar el fraude y el legítimo según BILLING_COUNTRY. En ese caso, el modelo no es genérico para ser aplicado a otras poblaciones.

Por lo general, sugerimos enviar todos los eventos más recientes sin muestreo. Según el tamaño de los datos y la tasa de fraude, Amazon Fraud Detector realiza un muestreo antes de la capacitación del modelo para usted. Si sus datos son demasiado grandes (más de 100 GB) y decide muestrear y enviar solo un subconjunto, debe muestrear sus datos al azar y asegurarse de que la muestra sea representativa de toda la población. Para TFI, debe muestrear sus datos por entidad, lo que significa que si se muestrea una entidad, debe incluir todo su historial para que los agregados a nivel de entidad se calculen correctamente. Tenga en cuenta que si solo envía un subconjunto de datos a Amazon Fraud Detector, los agregados en tiempo real durante la inferencia pueden ser inexactos si no se envían los eventos anteriores de las entidades.

Otro muestreo de datos incorrecto podría ser solo usar un período corto de datos, como los datos de un día, para construir el modelo. Los datos pueden estar sesgados, especialmente si su negocio o los ataques de fraude son estacionales. Por lo general, recomendamos incluir al menos dos ciclos (como 2 semanas o 2 meses) de datos en el modelo para garantizar la diversidad de tipos de fraude.

Conclusión

Después de diagnosticar y resolver todos los posibles problemas, debe obtener un modelo útil de Amazon Fraud Detector y estar seguro de su rendimiento. Para el siguiente paso, usted puede crear un detector con el modelo y sus reglas de negocioy prepárese para implementarlo en producción para una evaluación en modo sombra.

Apéndice

Cómo excluir variables para el entrenamiento del modelo

Después de la inmersión profunda, es posible que identifique la información de un objetivo de fuga variable y desee excluirla del entrenamiento del modelo. Puede volver a entrenar una versión del modelo excluyendo las variables que no desea completando los siguientes pasos:

En la consola de Amazon Fraud Detector, en el panel de navegación, elija fexibles.
En fexibles página, elija el modelo que desea volver a entrenar.
En Acciones menú, seleccione Entrena nueva versión.
Seleccione el intervalo de fechas que desea utilizar y elija Siguiente.
En Configurar entrenamiento página, anule la selección de la variable que no desea utilizar en el entrenamiento del modelo.
Especifique sus etiquetas de fraude y etiquetas legítimas y cómo desea que Amazon Fraud Detector use eventos no etiquetados, luego elija Siguiente.
Revise la configuración del modelo y elija Crear y entrenar modelo.

Cómo cambiar el tipo de variable de evento

Las variables representan elementos de datos utilizados en la prevención del fraude. En Amazon Fraud Detector, todas las variables son globales y se comparten entre todos los eventos y modelos, lo que significa que una variable podría usarse en varios eventos. Por ejemplo, la IP podría estar asociada con eventos de inicio de sesión y también podría estar asociada con eventos de transacción. Naturalmente, Amazon Fraud Detector bloqueó el tipo de variable y el tipo de datos una vez que se creó una variable. Para eliminar una variable existente, primero debe eliminar todos los tipos y modelos de eventos asociados. Puede verificar los recursos asociados con la variable específica navegando a Amazon Fraud Detector, eligiendo Variables en el panel de navegación, y eligiendo el nombre de la variable y Recursos asociados.

Eliminar la variable y todos los tipos de eventos asociados

Para eliminar la variable, complete los siguientes pasos:

En la consola de Amazon Fraud Detector, en el panel de navegación, elija Variables.
Elija la variable que desea eliminar.
Elige Recursos asociados para ver una lista de todos los tipos de eventos utilizados en esta variable.
Debe eliminar esos tipos de eventos asociados antes de eliminar la variable.
Elija los tipos de eventos en la lista para ir a la página de tipos de eventos asociados.
Elige Eventos almacenados para verificar si hay datos almacenados en este tipo de evento.
Si hay eventos almacenados en Amazon Fraud Detector, elija Eliminar eventos almacenados para eliminar los eventos almacenados.
Cuando se completa el trabajo de eliminación, aparece el mensaje "Los eventos almacenados para este tipo de evento se eliminaron con éxito".
Elige Recursos asociados.
Si los detectores y los modelos están asociados con este tipo de evento, primero debe eliminar esos recursos.
Si los detectores están asociados, complete los siguientes pasos para eliminar todos los detectores asociados:
1. Elija el detector para ir a la Detalles del detector .
2. En Versiones del modelo panel, elija la versión del detector.
3. En la página de la versión del detector, elija Acciones.
4. Si la versión del detector está activa, elija Desactivar, escoger Desactivar esta versión de detector sin reemplazarla por una versión diferente, y elige Desactivar versión detector.
5. Una vez desactivada la versión del detector, elija Acciones y luego Borrar.
6. Repita estos pasos para eliminar todas las versiones del detector.
7. En Detalles del detector página, elige Reglas asociadas.
8. Elija la regla para eliminar.
9. Elige Acciones y Eliminar versión de regla.
10. Ingrese el nombre de la regla para confirmar y elija Eliminar versión.
11. Repita estos pasos para eliminar todas las reglas asociadas.
12. Después de eliminar todas las versiones del detector y las reglas asociadas, vaya a la Detalles del detector página, elige Acciones, y elige Eliminar detector.
13. Ingrese el nombre del detector y elija Eliminar detector.
14. Repita estos pasos para eliminar el siguiente detector.
Si algún modelo está asociado con el tipo de evento, complete los siguientes pasos para eliminarlo:
1. Elige el nombre del modelo.
2. En Versiones del modelo panel, elija la versión.
3. Si el estado del modelo es Active, escoger Acciones y Anular la implementación de la versión del modelo.
4. Participar undeploy para confirmar y elegir Anular la implementación de la versión del modelo.
  El estado cambia a Undeploying. El proceso tarda unos minutos en completarse.
5. Después de que el estado se vuelve Ready to deploy, seleccione Acciones y Eliminar.
6. Repita estos pasos para eliminar todas las versiones del modelo.
7. En la página de detalles del modelo, elija Acciones y Eliminar modelo.
8. Introduzca el nombre del modelo y elija Eliminar modelo.
9. Repita estos pasos para eliminar el siguiente modelo.
Después de eliminar todos los detectores y modelos asociados, elija Acciones y Eliminar tipo de evento en Detalles del evento .
Introduce el nombre del tipo de evento y elige Eliminar tipo de evento.
En el panel de navegación, elija Variablesy elija la variable que desea eliminar.
Repita los pasos anteriores para eliminar todos los tipos de eventos asociados con la variable.
En Detalles variables página, elige Acciones y Eliminar.
Introduzca el nombre de la variable y seleccione Eliminar variable.

Crear una nueva variable con el tipo de variable correcto

Una vez que haya eliminado la variable y todos los tipos de eventos asociados, eventos almacenados, modelos y detectores de Amazon Fraud Detector, puede crear una nueva variable con el mismo nombre y asignarla al tipo de variable correcto.

En la consola de Amazon Fraud Detector, en el panel de navegación, elija Variables.
Elige Crear.
Ingrese el nombre de la variable que desea modificar (el que eliminó anteriormente).
Seleccione el tipo de variable correcto al que desea cambiar.
Elige Crear variable.

Cargar datos y volver a entrenar el modelo

Después de actualizar el tipo de variable, puede volver a cargar los datos y entrenar un nuevo modelo. Para obtener instrucciones, consulte Detecte el fraude de transacciones en línea con las nuevas funciones de Amazon Fraud Detector.

Cómo agregar nuevas variables a un tipo de evento existente

Para agregar nuevas variables al tipo de evento existente, complete los siguientes pasos:

Agregue las nuevas variables al archivo CVS de entrenamiento anterior.
Cargue el nuevo archivo de datos de entrenamiento en un depósito de S3. Tenga en cuenta la ubicación de Amazon S3 de su archivo de formación (por ejemplo, s3://bucketname/path/to/some/object.csv) y el nombre de su función.
En la consola de Amazon Fraud Detector, en el panel de navegación, elija Eventos.
En Tipos de eventos página, elija el nombre del tipo de evento que desea agregar variables.
En Tipo de evento página de detalles, elija Acciones, entonces Añadir variables.
under Elija cómo definir las variables de este evento, escoger Seleccionar variables de un conjunto de datos de entrenamiento.
Para el rol de IAM, seleccione un rol de IAM existente o cree un nuevo rol para acceder a los datos en Amazon S3.
Ubicación de datos, ingrese la ubicación S3 del nuevo archivo de capacitación y elija Subir.
Las nuevas variables que no están presentes en el tipo de evento existente deberían aparecer en la lista.
Elige Agregar variables.

Ahora, las nuevas variables se han agregado al tipo de evento existente. Si está utilizando eventos almacenados en Amazon Fraud Detector, aún faltan las nuevas variables de los eventos almacenados. Debe importar los datos de entrenamiento con las nuevas variables a Amazon Fraud Detector y luego volver a entrenar una nueva versión del modelo. Al cargar los nuevos datos de entrenamiento con el mismo EVENT_ID y EVENT_TIMESTAMP, las nuevas variables de eventos sobrescriben las variables de eventos anteriores almacenadas en Amazon Fraud Detector.

Acerca de los autores

julia xu es un científico investigador de Amazon Fraud Detector. Le apasiona resolver los desafíos de los clientes utilizando técnicas de aprendizaje automático. En su tiempo libre, le gusta caminar, pintar y explorar nuevas cafeterías.

hao zhou es un científico investigador con Amazon Fraud Detector. Tiene un doctorado en ingeniería eléctrica de la Northwestern University, EE. UU. Le apasiona aplicar técnicas de aprendizaje automático para combatir el fraude y el abuso.

Abhishek Ravi es gerente sénior de productos en Amazon Fraud Detector. Le apasiona aprovechar las capacidades técnicas para crear productos que deleiten a los clientes.

Sello de tiempo: Sábado, Junio 29, 2022

Sello de tiempo: 29 de febrero de 2024

Reeditado por Platón

Cree una plataforma de datos agronómicos con las capacidades geoespaciales de Amazon SageMaker

Cómo evaluar la calidad de los datos sintéticos: medir desde la perspectiva de la fidelidad, la utilidad y la privacidad

Utilice Amazon Lex para capturar direcciones de calles

Acelerando el entrenamiento de redes neuronales a gran escala en CPU con ThirdAI y AWS Graviton | Servicios web de Amazon

Sobre Nosotros

Búsqueda vertical y Ai

Productos

Manténganse Conectados

Mi Cuenta