Aprendizado profundo explicado visualmente

Compreendendo o aprendizado profundo usando exemplos visuais

Foto por Julien Tromeur on Unsplash

O aprendizado profundo é uma das técnicas de IA mais poderosas, porém pode ser difícil de entender. Neste blog, tentarei explicar o aprendizado profundo usando recursos visuais e exemplos.

A arquitetura de aprendizagem profunda é inspirada na forma como nosso cérebro funciona. É uma conexão de neurônios. Os modelos de aprendizagem profunda podem ter muitos parâmetros. O número de parâmetros é baseado no número de camadas e neurônios, que podem crescer exponencialmente para arquiteturas sofisticadas.

Neste blog, abordarei um caso de uso comercial de detecção de fraude financeira. Um dos maiores desafios na detecção de fraudes é o problema do desequilíbrio de classes, o que significa que os dados utilizados para treinar modelos de aprendizado de máquina apresentam pouquíssimos casos de fraude.

Arquitetura de aprendizagem profunda (imagem do autor)

É como treinar um modelo de aprendizado de máquina para encontrar uma agulha em um palheiro. A detecção de fraude é um problema especial que justifica uma abordagem sofisticada, como a arquitetura de aprendizagem profunda.

No exemplo, pegarei dados do sistema de transações bancárias. Os dados são mostrados aqui. Os dados possuem o tipo de movimentação financeira, valor, bem como origem e destino, saldo antigo e saldo novo. Também existe um sinalizador que indica se a transação foi fraudulenta ou não.

A citação do conjunto de dados está disponível no final do blog.

Dados de detecção de fraude (imagem do autor)

Os dados são divididos em dados de treinamento e teste. O modelo de aprendizagem profunda é desenvolvido no conjunto de treinamento e depois validado nos dados de teste. Então este modelo pode ser usado para prever fraudes em dados não vistos.

Divisão de treinamento/teste (imagem do autor)

O modelo de aprendizagem profunda para previsão de fraudes é mostrado aqui. Os neurônios de entrada correspondem aos dados da transação. Cada neurônio corresponde a uma coluna nos dados de entrada, como tipo de transação, valor e informações de saldo na origem e no destino.

Existe uma camada intermediária e depois a camada final que possui dois neurônios, um que prevê a não fraude e o outro que prevê a não fraude.

As linhas são sinais transmitidos entre as diferentes camadas. Uma linha verde indica um sinal positivo e uma linha vermelha indica um sinal negativo

O modelo de aprendizagem profunda para detecção de fraudes (imagem do autor)

Vemos que o neurônio 1_0 está passando um sinal positivo para o neurônio Fraude.

Isso significa que ele aprendeu profundamente como é uma transação fraudulenta! Isto é emocionante!

O neurônio 1_0 está passando um sinal positivo para o neurônio 2_1 (fraude) (imagem do autor)

Vamos dar uma espiada no neurônio 1_0!

Dentro do neurônio 1_0 (imagem do autor)

O gráfico de radar é uma representação do que o neurônio aprendeu sobre os dados. Uma linha azul indica um valor alto e uma linha vermelha indica um valor baixo. O gráfico de radar indica um equilíbrio antigo e novo alto, mas quase semelhante, na origem. No entanto, há uma diferença muito grande entre o antigo e o novo equilíbrio no destino.

Tal situação é um indício de fraude. Esta situação pode ser mostrada visualmente a seguir.

Mostrando visualmente como é uma transação fraudulenta (imagem do autor)

Aqui é mostrada a precisão do modelo de aprendizado profundo usando uma matriz de confusão.

Matriz de confusão (imagem do autor)

No total, são cerca de 95000 transações, das quais 62 são fraudulentas, o que é extremamente inferior ao total da transação. No entanto, o modelo de aprendizagem profunda está indo bem, pois é capaz de identificar 52 corretamente como fraude, o que também é chamado de verdadeiro positivo (tp).

Há 1 falso positivo (fp), ou seja, não é uma fraude, mas o modelo sinalizou incorretamente como fraude. Portanto a precisão, que é tp / (tp +fp), é igual a 98%.

Além disso, existem 10 falsos negativos (fn), o que significa que são transações fraudulentas, mas nosso modelo não é capaz de prevê-las. Portanto, a medida de recuperação que é tp / (tp +fn) que é 83%

A arquitetura de aprendizagem profunda é muito poderosa, pois ajuda a resolver problemas complexos, como detecção de fraudes. Uma maneira visual de analisar a arquitetura de aprendizagem profunda é útil para compreender a arquitetura e também como ela resolve o problema

Citação de fonte de dados para conjuntos de dados financeiros sintéticos para detecção de fraudes

Os conjuntos de dados financeiros sintéticos para detecção de fraude estão disponíveis aqui: https://www.kaggle.com/competitions/spaceship-titanic/overview

Conforme especificado na seção Licença, ele possui uma licença CC BY-SA 4.0.

  • Partilhar — copie e redistribua o material em qualquer meio ou formato
  • Adaptar — remixar, transformar e construir sobre o material para qualquer finalidade, mesmo comercialmente.

. junte-se ao Médio com meu link de indicação.

. Inscreva-se para me manter informado sempre que eu lançar uma nova história.

Você pode visitar meu site para fazer análises sem codificação. https://experiencedatascience.com

No site, você também pode participar dos próximos workshops de IA para uma experiência interessante e inovadora em ciência de dados e IA.

Aqui está um link para meu canal no YouTube
https://www.youtube.com/c/DataScienceDemonstrated

Aprendizado profundo explicado visualmente republicado da fonte https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

->

Carimbo de hora:

Mais de Consultores Blockchain