Diagnosticar o desempenho do modelo antes da implantação do Amazon Fraud Detector

Republicado por Platão

seguidores: 0

Com o crescimento da adoção de aplicativos online e o número crescente de usuários da internet, a fraude digital está aumentando ano após ano. Detector de fraude da Amazon fornece um serviço totalmente gerenciado para ajudá-lo a identificar melhor atividades on-line potencialmente fraudulentas usando técnicas avançadas de aprendizado de máquina (ML) e mais de 20 anos de experiência em detecção de fraudes da Amazon.

Para ajudar você a detectar fraudes mais rapidamente em vários casos de uso, o Amazon Fraud Detector oferece modelos específicos com algoritmos, enriquecimentos e transformações de recursos personalizados. O treinamento do modelo é totalmente automatizado e descomplicado, e você pode seguir as instruções no guia de utilizador. ou relacionado postagens no blog para começar. No entanto, com modelos treinados, você precisa decidir se o modelo está pronto para implantação. Isso requer certo conhecimento em ML, estatísticas e detecção de fraudes, e pode ser útil conhecer algumas abordagens típicas.

Esta postagem ajudará você a diagnosticar o desempenho do modelo e escolher o modelo certo para implantação. Analisamos as métricas fornecidas pelo Amazon Fraud Detector, ajudamos você a diagnosticar possíveis problemas e fornecemos sugestões para melhorar o desempenho do modelo. As abordagens são aplicáveis aos modelos de modelo do Online Fraud Insights (OFI) e do Transaction Fraud Insights (TFI).

Visão geral da solução

Esta postagem fornece um processo de ponta a ponta para diagnosticar o desempenho do seu modelo. Primeiro, ele apresenta todas as métricas de modelo mostradas no console do Amazon Fraud Detector, incluindo AUC, distribuição de pontuação, matriz de confusão, curva ROC e importância da variável do modelo. Em seguida, apresentamos uma abordagem de três etapas para diagnosticar o desempenho do modelo usando diferentes métricas. Por fim, fornecemos sugestões para melhorar o desempenho do modelo para problemas típicos.

Pré-requisitos

Antes de se aprofundar no modelo do Amazon Fraud Detector, você precisa concluir os seguintes pré-requisitos:

Crie uma conta da AWS.
Criar um conjunto de dados de evento para treinamento de modelos.
Carregue seus dados para Serviço de armazenamento simples da Amazon (Amazon S3) ou ingerir seus dados de eventos no Amazon Fraud Detector.
Crie um modelo do Amazon Fraud Detector.

Interpretar as métricas do modelo

Após a conclusão do treinamento do modelo, o Amazon Fraud Detector avalia seu modelo usando parte dos dados de modelagem que não foram usados no treinamento do modelo. Ele retorna as métricas de avaliação no Versão do modelo página para esse modelo. Essas métricas refletem o desempenho do modelo que você pode esperar em dados reais após a implantação na produção.

A captura de tela a seguir mostra o desempenho do modelo de exemplo retornado pelo Amazon Fraud Detector. Você pode escolher diferentes limites na distribuição de pontuação (esquerda) e a matriz de confusão (direita) é atualizada de acordo.

Você pode usar as seguintes descobertas para verificar o desempenho e decidir sobre as regras da estratégia:

AUC (área sob a curva) – O desempenho geral deste modelo. Um modelo com AUC de 0.50 não é melhor do que uma moeda ao ar porque representa uma chance aleatória, enquanto um modelo “perfeito” terá uma pontuação de 1.0. Quanto maior o AUC, melhor o seu modelo pode distinguir entre fraudes e legítimas.
Distribuição de pontuação – Um histograma de distribuições de pontuação do modelo assumindo uma população de exemplo de 100,000 eventos. O Amazon Fraud Detector gera pontuações de modelo entre 0 e 1000, onde quanto menor a pontuação, menor o risco de fraude. Uma melhor separação entre populações legítimas (verde) e fraudulentas (azul) normalmente indica um modelo melhor. Para mais detalhes, consulte Pontuação do modelo.
Matriz de confusão – Uma tabela que descreve o desempenho do modelo para o limite de pontuação selecionado, incluindo verdadeiro positivo, verdadeiro negativo, falso positivo, falso negativo, taxa de verdadeiro positivo (TPR) e taxa de falso positivo (FPR). A contagem na tabela assume uma população de exemplo de 100,0000 eventos. Para mais detalhes, consulte Métricas de desempenho do modelo.
Curva ROC (Receiver Operator Characteristic) – Um gráfico que ilustra a capacidade de diagnóstico do modelo, conforme mostrado na captura de tela a seguir. Ele plota a taxa de verdadeiros positivos em função da taxa de falsos positivos em todos os limites de pontuação do modelo possíveis. Veja este gráfico escolhendo Métricas Avançadas. Se você treinou várias versões de um modelo, pode selecionar diferentes limites de FPR para verificar a mudança de desempenho.
Importância da variável do modelo – A classificação das variáveis do modelo com base em sua contribuição para o modelo gerado, conforme mostrado na captura de tela a seguir. A variável de modelo com o valor mais alto é mais importante para o modelo do que as outras variáveis de modelo no conjunto de dados para essa versão de modelo e é listada na parte superior por padrão. Para mais detalhes, consulte Importância da variável do modelo.

Diagnosticar o desempenho do modelo

Antes de implantar seu modelo em produção, você deve usar as métricas retornadas pelo Amazon Fraud Detector para entender o desempenho do modelo e diagnosticar os possíveis problemas. Os problemas comuns dos modelos de ML podem ser divididos em duas categorias principais: problemas relacionados a dados e problemas relacionados ao modelo. O Amazon Fraud Detector cuidou dos problemas relacionados ao modelo usando cuidadosamente conjuntos de validação e teste para avaliar e ajustar seu modelo no back-end. Você pode concluir as etapas a seguir para validar se seu modelo está pronto para implantação ou tem possíveis problemas relacionados a dados:

Verifique o desempenho geral do modelo (AUC e distribuição de pontuação).
Revisar os requisitos de negócios (matriz e tabela de confusão).
Verifique a importância da variável do modelo.

Verifique o desempenho geral do modelo: AUC e distribuição de pontuação

A previsão mais precisa de eventos futuros é sempre o objetivo principal de um modelo preditivo. O AUC retornado pelo Amazon Fraud Detector é calculado em um conjunto de teste com amostra adequada não usado no treinamento. Em geral, um modelo com AUC maior que 0.9 é considerado um bom modelo.

Se você observar um modelo com desempenho inferior a 0.8, geralmente significa que o modelo tem espaço para melhorias (discutimos problemas comuns para baixo desempenho do modelo posteriormente neste post). Observe que a definição de “bom” desempenho depende muito do seu negócio e do modelo de linha de base. Você ainda pode seguir as etapas desta postagem para melhorar seu modelo do Amazon Fraud Detector, mesmo que seu AUC seja maior que 0.8.

Por outro lado, se a AUC for superior a 0.99, significa que o modelo pode separar quase perfeitamente a fraude e os eventos legítimos no conjunto de teste. Às vezes, esse é um cenário “bom demais para ser verdade” (discutimos problemas comuns para desempenho muito alto do modelo posteriormente neste post).

Além da AUC geral, a distribuição de pontuação também pode informar o quão bem o modelo está ajustado. Idealmente, você deve ver a maior parte das fraudes e legítimas localizadas nas duas extremidades da escala, o que indica que a pontuação do modelo pode classificar com precisão os eventos no conjunto de teste.

No exemplo a seguir, a distribuição de pontuação tem uma AUC de 0.96.

Se a distribuição legítima e de fraude se sobrepuser ou se concentrar no centro, provavelmente significa que o modelo não funciona bem na distinção entre eventos de fraude e eventos legítimos, o que pode indicar que a distribuição de dados históricos foi alterada ou que você precisa de mais dados ou recursos.

O seguinte é um exemplo de distribuição de pontuação com uma AUC de 0.64.

Se você puder encontrar um ponto de divisão que possa dividir quase perfeitamente a fraude e os eventos legítimos, há uma grande chance de que o modelo tenha um problema de vazamento de rótulo ou os padrões de fraude sejam muito fáceis de detectar, o que deve chamar sua atenção.

No exemplo a seguir, a distribuição de pontuação tem uma AUC de 1.0.

Revisar os requisitos de negócios: matriz e tabela de confusão

Embora o AUC seja um indicador conveniente do desempenho do modelo, ele pode não se traduzir diretamente em seus requisitos de negócios. O Amazon Fraud Detector também fornece métricas como taxa de captura de fraude (taxa de verdadeiro positivo), porcentagem de eventos legítimos que são previstos incorretamente como fraude (taxa de falso positivo) e muito mais, que são mais comumente usadas como requisitos de negócios. Depois de treinar um modelo com uma AUC razoavelmente boa, você precisa comparar o modelo com seus requisitos de negócios com essas métricas.

A matriz de confusão e a tabela fornecem uma interface para revisar o impacto e verificar se ele atende às suas necessidades de negócios. Observe que os números dependem do limite do modelo, onde eventos com pontuações maiores que o limite são classificados como fraude e eventos com pontuações inferiores ao limite são classificados como legítimos. Você pode escolher qual limite usar dependendo de seus requisitos de negócios.

Por exemplo, se seu objetivo é capturar 73% das fraudes, então (como mostrado no exemplo abaixo) você pode escolher um limite como 855, que permite capturar 73% de todas as fraudes. No entanto, o modelo também classificará incorretamente 3% de eventos legítimos como fraudulentos. Se este FPR for aceitável para sua empresa, então o modelo é bom para implantação. Caso contrário, você precisa melhorar o desempenho do modelo.

Outro exemplo é se o custo para bloquear ou desafiar um cliente legítimo for extremamente alto, então você deseja um baixo FPR e alta precisão. Nesse caso, você pode escolher um limite de 950, conforme mostrado no exemplo a seguir, que classificará incorretamente 1% dos clientes legítimos como fraude e 80% das fraudes identificadas serão realmente fraudulentas.

Além disso, você pode escolher vários limites e atribuir diferentes resultados, como bloquear, investigar, passar. Se você não encontrar limites e regras adequados que satisfaçam todos os seus requisitos de negócios, considere treinar seu modelo com mais dados e atributos.

Verifique a importância da variável do modelo

A Importância da variável do modelo painel exibe como cada variável contribui para o seu modelo. Se uma variável tiver um valor de importância significativamente maior do que as outras, isso pode indicar vazamento de rótulo ou que os padrões de fraude são muito fáceis de detectar. Observe que a importância da variável é agregada de volta às suas variáveis de entrada. Se você observar uma importância um pouco maior de IP_ADDRESS, CARD_BIN, EMAIL_ADDRESS, PHONE_NUMBER, BILLING_ZIPou SHIPPING_ZIP, talvez por causa do poder de enriquecimento.

O exemplo a seguir mostra a importância da variável do modelo com um possível vazamento de etiqueta usando investigation_status.

A importância da variável do modelo também fornece dicas de quais variáveis adicionais podem potencialmente aumentar o modelo. Por exemplo, se você observar baixo AUC e recursos relacionados ao vendedor mostrarem alta importância, considere coletar mais recursos de pedido, como SELLER_CATEGORY, SELLER_ADDRESS e SELLER_ACTIVE_YEARSe adicione essas variáveis ao seu modelo.

Problemas comuns para baixo desempenho do modelo

Nesta seção, discutimos problemas comuns que você pode encontrar em relação ao baixo desempenho do modelo.

A distribuição de dados históricos foi alterada

O desvio de distribuição de dados históricos acontece quando você tem uma grande mudança nos negócios ou um problema de coleta de dados. Por exemplo, se você lançou recentemente seu produto em um novo mercado, o IP_ADDRESS, EMAIL e ADDRESS recursos relacionados podem ser completamente diferentes, e o modus operandi da fraude também pode mudar. Usos do Amazon Fraud Detector EVENT_TIMESTAMP para dividir dados e avaliar seu modelo no subconjunto apropriado de eventos em seu conjunto de dados. Se a distribuição de dados históricos mudar significativamente, o conjunto de avaliação poderá ser muito diferente dos dados de treinamento e o desempenho do modelo relatado poderá ser baixo.

Você pode verificar o possível problema de alteração na distribuição de dados explorando seus dados históricos:

Use o Perfilador de dados do Amazon Fraud Detector ferramenta para verificar se a taxa de fraude e a taxa de falta do rótulo mudaram ao longo do tempo.
Verifique se a distribuição de variáveis ao longo do tempo mudou significativamente, especialmente para recursos com alta importância de variável.
Verifique a distribuição de variáveis ao longo do tempo por variáveis de destino. Se você observar significativamente mais eventos de fraude de uma categoria em dados recentes, convém verificar se a alteração é razoável usando seus julgamentos de negócios.

Se você achar que a taxa de falta do rótulo é muito alta ou a taxa de fraude caiu consistentemente durante as datas mais recentes, pode ser um indicador de rótulos não totalmente amadurecidos. Você deve excluir os dados mais recentes ou esperar mais tempo para coletar os rótulos precisos e, em seguida, treinar novamente seu modelo.

Se você observar um pico acentuado na taxa de fraude e variáveis em datas específicas, convém verificar novamente se é um problema de coleta de dados ou outlier. Nesse caso, você deve excluir esses eventos e treinar novamente o modelo.

Se você achar que os dados desatualizados não podem representar seus negócios atuais e futuros, exclua o período antigo de dados do treinamento. Se estiver usando eventos armazenados no Amazon Fraud Detector, você pode simplesmente treinar novamente uma nova versão e selecionar o intervalo de datas adequado enquanto configura o trabalho de treinamento. Isso também pode indicar que o modus operandi da fraude em seu negócio muda de forma relativamente rápida ao longo do tempo. Após a implantação do modelo, pode ser necessário treinar novamente seu modelo com frequência.

Mapeamento de tipo de variável inadequado

O Amazon Fraud Detector enriquece e transforma os dados com base nos tipos de variáveis. É importante mapear suas variáveis para o tipo correto para que o modelo do Amazon Fraud Detector possa obter o valor máximo de seus dados. Por exemplo, se você mapear IP ao CATEGORICAL digite em vez de IP_ADDRESS, você não recebe o IP-enriquecimentos relacionados no back-end.

Em geral, o Amazon Fraud Detector sugere as seguintes ações:

Mapeie suas variáveis para tipos específicos, como IP_ADDRESS, EMAIL_ADDRESS, CARD_BIN e PHONE_NUMBER, para que o Amazon Fraud Detector possa extrair e enriquecer informações adicionais.
Se você não encontrar o tipo de variável específico, mapeie-o para um dos três tipos genéricos: NUMERIC, CATEGORICALou FREE_FORM_TEXT.
Se uma variável estiver em forma de texto e tiver alta cardinalidade, como uma avaliação do cliente ou descrição do produto, você deve mapeá-la para o FREE_FORM_TEXT tipo de variável para que o Amazon Fraud Detector extraia recursos de texto e incorporações no back-end para você. Por exemplo, se você mapear url_string para FREE_FORM_TEXT, é capaz de tokenizar o URL e extrair informações para alimentar o modelo downstream, o que o ajudará a aprender mais padrões ocultos do URL.

Se você descobrir que algum dos tipos de variáveis está mapeado incorretamente na configuração de variáveis, você pode alterar o tipo de variável e, em seguida, treinar novamente o modelo.

Dados ou recursos insuficientes

O Amazon Fraud Detector requer pelo menos 10,000 registros para treinar um modelo Online Fraud Insights (OFI) ou Transaction Fraud Insights (TFI), com pelo menos 400 desses registros identificados como fraudulentos. A TFI também exige que tanto os registros fraudulentos quanto os legítimos venham de pelo menos 100 entidades diferentes cada para garantir a diversidade do conjunto de dados. Além disso, o Amazon Fraud Detector exige que os dados de modelagem tenham pelo menos duas variáveis. Esses são os requisitos mínimos de dados para criar um modelo útil do Amazon Fraud Detector. No entanto, usar mais registros e variáveis geralmente ajuda os modelos de ML a aprender melhor os padrões subjacentes de seus dados. Quando você observa uma AUC baixa ou não consegue encontrar limites que atendam aos seus requisitos de negócios, considere treinar novamente seu modelo com mais dados ou adicionar novos recursos ao seu modelo. Normalmente, encontramos EMAIL_ADDRESS, IP, PAYMENT_TYPE, BILLING_ADDRESS, SHIPPING_ADDRESS e DEVICE variáveis relacionadas são importantes na detecção de fraudes.

Outra causa possível é que algumas de suas variáveis contêm muitos valores ausentes. Para ver se isso está acontecendo, verifique as mensagens de treinamento do modelo e consulte Solucionar problemas de dados de treinamento para sugestões.

Problemas comuns para desempenho de modelo muito alto

Nesta seção, discutimos problemas comuns relacionados ao desempenho muito alto do modelo.

Vazamento de etiquetas

O vazamento de rótulo ocorre quando os conjuntos de dados de treinamento usam informações que não deveriam estar disponíveis no momento da previsão. Ele superestima a utilidade do modelo quando executado em um ambiente de produção.

AUC alta (próxima de 1), distribuição de pontuação perfeitamente separada e importância variável significativamente maior de uma variável podem ser indicadores de possíveis problemas de vazamento de rótulo. Você também pode verificar a correlação entre os recursos e o rótulo usando o Perfilador de dados. O Correlação de recursos e rótulos gráfico mostra a correlação entre cada recurso e o rótulo. Se um recurso tiver mais de 0.99 de correlação com o rótulo, você deve verificar se o recurso é usado corretamente com base em julgamentos de negócios. Por exemplo, para construir um modelo de risco para aprovar ou recusar um pedido de empréstimo, você não deve usar recursos como AMOUNT_PAID, pois os pagamentos acontecem após o processo de subscrição. Se uma variável não estiver disponível no momento em que você fizer a previsão, remova essa variável da configuração do modelo e treine novamente um novo modelo.

O exemplo a seguir mostra a correlação entre cada variável e rótulo. investigation_status tem uma alta correlação (próxima de 1) com o rótulo, então você deve verificar novamente se há um problema de vazamento de rótulo.

Padrões de fraude simples

Quando os padrões de fraude em seus dados são simples, você também pode observar um desempenho muito alto do modelo. Por exemplo, suponha que todos os eventos de fraude nos dados de modelagem venham do mesmo Provedor de Serviços Interno; é simples para o modelo escolher o IP-variáveis relacionadas e retornam um modelo “perfeito” com alta importância de IP.

Padrões de fraude simples nem sempre indicam um problema de dados. Pode ser verdade que o modus operandi da fraude em seu negócio seja fácil de capturar. No entanto, antes de chegar a uma conclusão, você precisa garantir que os rótulos usados no treinamento do modelo sejam precisos e que os dados de modelagem cubram o maior número possível de padrões de fraude. Por exemplo, se você rotular seus eventos de fraude com base em regras, como rotular todos os aplicativos de um BILLING_ZIP mais PRODUCT_CATEGORY como fraude, o modelo pode facilmente detectar essas fraudes simulando as regras e obtendo uma AUC alta.

Você pode verificar a distribuição de rótulos em diferentes categorias ou compartimentos de cada recurso usando o Perfilador de dados. Por exemplo, se você observar que a maioria dos eventos de fraude vem de uma ou algumas categorias de produtos, pode ser um indicador de padrões de fraude simples e você precisa confirmar que não é uma coleta de dados ou erro de processo. Se o recurso é como CUSTOMER_ID, você deve excluir o recurso no treinamento do modelo.

O exemplo a seguir mostra a distribuição de rótulos em diferentes categorias de product_category. Todas as fraudes vêm de duas categorias de produtos.

Amostragem de dados inadequada

A amostragem de dados inadequada pode ocorrer quando você fez uma amostra e enviou apenas parte de seus dados para o Amazon Fraud Detector. Se os dados não forem amostrados corretamente e não forem representativos do tráfego em produção, o desempenho do modelo relatado será impreciso e o modelo poderá ser inútil para a previsão de produção. Por exemplo, se todos os eventos de fraude nos dados de modelagem forem amostrados da Ásia e todos os eventos legítimos forem amostrados dos EUA, o modelo pode aprender a separar fraude e legítimo com base em BILLING_COUNTRY. Nesse caso, o modelo não é genérico para ser aplicado a outras populações.

Normalmente, sugerimos enviar todos os eventos mais recentes sem amostragem. Com base no tamanho dos dados e na taxa de fraude, o Amazon Fraud Detector faz amostragem antes do treinamento do modelo para você. Se seus dados forem muito grandes (mais de 100 GB) e você decidir amostrar e enviar apenas um subconjunto, você deve amostrar seus dados aleatoriamente e certificar-se de que a amostra seja representativa de toda a população. Para TFI, você deve amostrar seus dados por entidade, o que significa que se uma entidade for amostrada, você deve incluir todo o seu histórico para que os agregados de nível de entidade sejam calculados corretamente. Observe que, se você enviar apenas um subconjunto de dados ao Amazon Fraud Detector, as agregações em tempo real durante a inferência poderão ser imprecisas se os eventos anteriores das entidades não forem enviados.

Outra amostragem de dados imprópria pode ser usar apenas um curto período de dados, como dados de um dia, para construir o modelo. Os dados podem ser tendenciosos, especialmente se seus negócios ou ataques de fraude tiverem sazonalidade. Geralmente, recomendamos incluir pelo menos dois ciclos (como 2 semanas ou 2 meses) de dados na modelagem para garantir a diversidade de tipos de fraude.

Conclusão

Depois de diagnosticar e resolver todos os possíveis problemas, você deve obter um modelo útil do Amazon Fraud Detector e ter certeza de seu desempenho. Para o próximo passo, você pode criar um detector com o modelo e suas regras de negócios, e esteja pronto para implantá-lo em produção para uma avaliação do modo sombra.

Apêndice

Como excluir variáveis para treinamento de modelo

Após o mergulho profundo, você pode identificar uma informação de destino de vazamento variável e desejar excluí-la do treinamento do modelo. Você pode treinar novamente uma versão de modelo, excluindo as variáveis que não deseja, concluindo as etapas a seguir:

No console do Amazon Fraud Detector, no painel de navegação, escolha Modelos.
No Modelos página, escolha o modelo que deseja treinar novamente.
No Opções menu, escolha Treinar nova versão.
Selecione o intervalo de datas que deseja usar e escolha Próximo.
No Configure o treinamento página, desmarque a variável que você não deseja usar no treinamento do modelo.
Especifique seus rótulos de fraude e rótulos legítimos e como você deseja que o Amazon Fraud Detector use eventos não rotulados e escolha Próximo.
Revise a configuração do modelo e escolha Criar e treinar modelo.

Como alterar o tipo de variável de evento

Variáveis representam elementos de dados usados na prevenção de fraudes. No Amazon Fraud Detector, todas as variáveis são globais e compartilhadas em todos os eventos e modelos, o que significa que uma variável pode ser usada em vários eventos. Por exemplo, o IP pode ser associado a eventos de entrada e também a eventos de transação. Naturalmente, o Amazon Fraud Detector bloqueou o tipo de variável e o tipo de dados assim que uma variável é criada. Para excluir uma variável existente, você precisa primeiro excluir todos os tipos e modelos de eventos associados. Você pode verificar os recursos associados à variável específica navegando até o Amazon Fraud Detector, escolhendo Variáveis no painel de navegação e escolhendo o nome da variável e Recursos associados.

Exclua a variável e todos os tipos de eventos associados

Para excluir a variável, conclua as etapas a seguir:

No console do Amazon Fraud Detector, no painel de navegação, escolha Variáveis.
Escolha a variável que deseja excluir.
Escolha Recursos associados para visualizar uma lista de todos os tipos de eventos usados nesta variável.
Você precisa excluir esses tipos de eventos associados antes de excluir a variável.
Escolha os tipos de evento na lista para ir para a página do tipo de evento associado.
Escolha Eventos armazenados para verificar se algum dado está armazenado neste tipo de evento.
Se houver eventos armazenados no Amazon Fraud Detector, escolha Excluir eventos armazenados para excluir os eventos armazenados.
Quando a tarefa de exclusão estiver concluída, a mensagem “Os eventos armazenados para este tipo de evento foram excluídos com sucesso” é exibida.
Escolha Recursos associados.
Se detectores e modelos estiverem associados a esse tipo de evento, você precisará excluir esses recursos primeiro.
Se os detectores estiverem associados, conclua as etapas a seguir para excluir todos os detectores associados:
1. Escolha o detector para ir ao Detalhes do detector Disputas de Comerciais.
2. No Versões de modelo painel, escolha a versão do detector.
3. Na página da versão do detector, escolha Opções.
4. Se a versão do detector estiver ativa, escolha Desativar, escolha Desative esta versão do detector sem substituí-lo por uma versão diferentee escolha Desative a versão do detector.
5. Após a versão do detector ser desativada, escolha Opções e depois Apagar.
6. Repita essas etapas para excluir todas as versões do detector.
7. No Detalhes do detector página, escolha Regras associadas.
8. Escolha a regra a ser excluída.
9. Escolha Opções e Excluir versão da regra.
10. Insira o nome da regra para confirmar e escolha Excluir versão.
11. Repita essas etapas para excluir todas as regras associadas.
12. Depois que todas as versões do detector e regras associadas forem excluídas, vá para o Detalhes do detector página, escolha Opçõese escolha Excluir detector.
13. Digite o nome do detector e escolha Excluir detector.
14. Repita essas etapas para excluir o próximo detector.
Se algum modelo estiver associado ao tipo de evento, conclua as etapas a seguir para excluí-lo:
1. Escolha o nome do modelo.
2. No Versões de modelo painel, escolha a versão.
3. Se o status do modelo for Active, escolha Opções e Desinstalar versão do modelo.
4. Entrar undeploy para confirmar e escolher Desinstalar versão do modelo.
  O estado muda para Undeploying. O processo leva alguns minutos para ser concluído.
5. Depois que o status se torna Ready to deploy, escolha Ações e Excluir.
6. Repita essas etapas para excluir todas as versões do modelo.
7. Na página Detalhes do modelo, escolha Ações e Excluir modelo.
8. Insira o nome do modelo e selecione Excluir modelo.
9. Repita essas etapas para excluir o próximo modelo.
Depois que todos os detectores e modelos associados forem excluídos, escolha Opções e Excluir tipo de evento na Detalhes do evento Disputas de Comerciais.
Insira o nome do tipo de evento e escolha Excluir tipo de evento.
No painel de navegação, escolha Variáveise escolha a variável que deseja excluir.
Repita as etapas anteriores para excluir todos os tipos de eventos associados à variável.
No Detalhes da variável página, escolha Opções e Excluir.
Insira o nome da variável e selecione Excluir variável.

Crie uma nova variável com o tipo de variável correto

Depois de excluir a variável e todos os tipos de eventos associados, eventos armazenados, modelos e detectores do Amazon Fraud Detector, você pode criar uma nova variável com o mesmo nome e mapeá-la para o tipo de variável correto.

No console do Amazon Fraud Detector, no painel de navegação, escolha Variáveis.
Escolha Crie.
Digite o nome da variável que você deseja modificar (aquele que você excluiu anteriormente).
Selecione o tipo de variável correto para o qual você deseja alterar.
Escolha Criar variável.

Carregar dados e treinar novamente o modelo

Depois de atualizar o tipo de variável, você pode carregar os dados novamente e treinar um novo modelo. Para obter instruções, consulte Detecte fraudes em transações online com os novos recursos do Amazon Fraud Detector.

Como adicionar novas variáveis a um tipo de evento existente

Para adicionar novas variáveis ao tipo de evento existente, conclua as etapas a seguir:

Adicione as novas variáveis ao arquivo CVS de treinamento anterior.
Faça upload do novo arquivo de dados de treinamento para um bucket do S3. Anote o local do Amazon S3 do seu arquivo de treinamento (por exemplo, s3://bucketname/path/to/some/object.csv) e o nome da sua função.
No console do Amazon Fraud Detector, no painel de navegação, escolha Eventos
No Tipos de eventos página, escolha o nome do tipo de evento ao qual deseja adicionar variáveis.
No Tipo de evento página de detalhes, escolha Opções, Em seguida Adicionar variáveis.
Debaixo Escolha como definir as variáveis deste evento, escolha Selecione variáveis de um conjunto de dados de treinamento.
Para função do IAM, selecione uma função do IAM existente ou crie uma nova função para acessar dados no Amazon S3.
Escolha Localização de dados, insira o local S3 do novo arquivo de treinamento e escolha Carregar.
As novas variáveis não presentes no tipo de evento existente devem aparecer na lista.
Escolha Adicione variáveis.

Agora, as novas variáveis foram adicionadas ao tipo de evento existente. Se você estiver usando eventos armazenados no Amazon Fraud Detector, as novas variáveis dos eventos armazenados ainda estarão ausentes. Você precisa importar os dados de treinamento com as novas variáveis para o Amazon Fraud Detector e, em seguida, treinar novamente uma nova versão do modelo. Ao carregar os novos dados de treinamento com o mesmo EVENT_ID e EVENT_TIMESTAMP, as novas variáveis de evento substituem as variáveis de evento anteriores armazenadas no Amazon Fraud Detector.

Sobre os autores

Júlia Xu é um cientista de pesquisa com o Amazon Fraud Detector. Ela é apaixonada por resolver os desafios dos clientes usando técnicas de Machine Learning. Em seu tempo livre, ela gosta de caminhar, pintar e explorar novos cafés.

Hao Zhou é um cientista pesquisador da Amazon Fraud Detector. Ele possui um PhD em engenharia elétrica pela Northwestern University, EUA. Ele adora aplicar técnicas de aprendizado de máquina para combater fraudes e abusos.

Abhishek Ravi é gerente de produto sênior do Amazon Fraud Detector. Ele é apaixonado por alavancar os recursos técnicos para criar produtos que encantam os clientes.

Carimbo de hora: 29 de Junho de 2022

Carimbo de hora: 29 fevereiro de 2024