L'apprentissage profond expliqué visuellement

Republié par Platon

Suiveurs: 0

Comprendre l'apprentissage profond à l'aide d'exemples visuels

L’apprentissage profond est l’une des techniques d’IA les plus puissantes, mais elle peut être difficile à comprendre. Dans ce blog, je vais tenter d'expliquer l'apprentissage profond à l'aide de visuels et d'exemples.

L’architecture du deep learning s’inspire du fonctionnement de notre cerveau. C'est une connexion de neurones. Les modèles d’apprentissage profond peuvent avoir de nombreux paramètres. Le nombre de paramètres est basé sur le nombre de couches et de neurones, qui peut croître de façon exponentielle pour une architecture sophistiquée.

Dans ce blog, je prendrai un cas d'utilisation commerciale de détection de fraude financière. L’un des plus grands défis de la détection de la fraude est le problème du déséquilibre des classes, ce qui signifie que les données utilisées pour entraîner les modèles d’apprentissage automatique comportent très peu de cas de fraude.

Architecture d'apprentissage profond (image de l'auteur)

C’est comme entraîner un modèle d’apprentissage automatique pour trouver une aiguille dans une botte de foin. La détection de la fraude est un problème particulier qui justifie une approche sophistiquée telle que l'architecture de deep learning.

Dans l'exemple, je prendrai les données du système de transactions bancaires. Les données ressemblent à celles présentées ici. Les données contiennent le type de transaction financière, le montant, ainsi que l'origine et la destination de l'ancien solde et du nouveau solde. Il existe également un indicateur qui indique si la transaction était frauduleuse ou non.

La citation de l'ensemble de données est disponible à la fin du blog.

Données de détection de fraude (image de l'auteur)

Les données sont divisées en données de formation et de test. Le modèle d'apprentissage profond est développé sur l'ensemble d'entraînement puis il est validé sur les données de test. Ce modèle peut ensuite être utilisé pour prédire la fraude sur des données invisibles.

Répartition Train / Test (image de l'auteur)

Le modèle d'apprentissage profond pour la prédiction de la fraude est présenté ici. Les neurones d'entrée correspondent aux données de transaction. Chaque neurone correspond à une colonne dans les données d'entrée telles que le type de transaction, le montant et les informations sur le solde à l'origine et à la destination.

Il y a une couche intermédiaire puis la couche finale qui comporte deux neurones, l'un qui prédit la non-fraude et l'autre qui prédit l'absence de fraude.

Les lignes sont des signaux transmis entre les différentes couches. Une ligne verte indique un signal positif et une ligne rouge indique un signal négatif

Le modèle d'apprentissage profond pour la détection des fraudes (image de l'auteur)

Nous voyons que le neurone 1_0 transmet un signal positif au neurone Fraud.

Cela signifie qu’il a appris en profondeur à quoi ressemble une transaction frauduleuse ! C'est excitant !

Le neurone 1_0 transmet un signal positif au neurone 2_1 (fraude) (image de l'auteur)

Jetons un coup d'œil à l'intérieur du neurone 1_0 !

À l'intérieur du neurone 1_0 (image de l'auteur)

Le graphique radar est une représentation de ce que le neurone a appris à propos des données. Une ligne bleue indique une valeur élevée et une ligne rouge indique une valeur faible. Le graphique radar indique un équilibre ancien et nouveau élevé, mais presque similaire à l'origine. Cependant, il existe une très grande différence entre l’ancien et le nouveau solde à destination.

Une telle situation est une indication de fraude. Cette situation peut être illustrée visuellement ci-dessous.

Montrant visuellement à quoi ressemble une transaction frauduleuse (image de l'auteur)

Voici la précision du modèle d'apprentissage en profondeur utilisant une matrice de confusion.

Matrice de confusion (image de l'auteur)

Au total, il y a environ 95000 62 transactions, dont 52 transactions frauduleuses, ce qui est extrêmement inférieur au total des transactions. Cependant, le modèle d'apprentissage en profondeur fonctionne bien car il est capable d'identifier correctement XNUMX comme une fraude, également appelée vrai positif (tp).

Il y a 1 faux positif (fp), ce qui signifie qu'il ne s'agit pas d'une fraude, mais que le modèle l'a signalé à tort comme une fraude. La précision, qui est tp / (tp +fp), est donc égale à 98 %.

De plus, il existe 10 faux négatifs (fn), ce qui signifie qu’il s’agit de transactions frauduleuses, mais notre modèle n’est pas capable de les prédire. Donc le rappel de mesure qui est tp / (tp +fn) soit 83%

L'architecture d'apprentissage profond est très puissante car elle permet de résoudre des problèmes complexes tels que la détection des fraudes. Une manière visuelle d'analyser l'architecture du deep learning est utile pour comprendre l'architecture ainsi que la manière dont elle résout le problème.

Citation de sources de données pour des ensembles de données financières synthétiques pour la détection des fraudes

Les ensembles de données financières synthétiques pour la détection des fraudes sont disponibles ici : https://www.kaggle.com/competitions/spaceship-titanic/overview

Comme spécifié dans la section Licence, il dispose d'une licence CC BY-SA 4.0.

Partager — copier et redistribuer le matériel sur n'importe quel support ou format
Adapter - remixer, transformer et construire sur le matériel à toutes fins, même commercialement.

Veuillez rejoindre Medium avec mon lien de parrainage.

Veuillez inscrire pour rester informé chaque fois que je publie une nouvelle histoire.

Vous pouvez visiter mon site Web pour effectuer des analyses sans codage. https://experiencedatascience.com

Sur le site Web, vous pouvez également participer aux prochains ateliers sur l'IA pour une expérience intéressante et innovante en matière de science des données et d'IA.

Voici un lien vers ma chaîne YouTube
https://www.youtube.com/c/DataScienceDemonstrated

Deep Learning visuellement expliqué republié à partir de la source https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

Horodatage: 7 novembre 20227 novembre 2022