Învățare profundă explicată vizual

Republicat de Platon

Urmaritori: 0

Înțelegerea învățării profunde folosind exemple vizuale

Fotografie de julien Tromeur on Unsplash

Învățarea profundă este una dintre cele mai puternice tehnici AI, cu toate acestea, poate fi dificil de înțeles. În acest blog, voi încerca să explic învățarea profundă folosind imagini și exemple.

Arhitectura de învățare profundă este inspirată de modul în care funcționează creierul nostru. Este o conexiune a neuronilor. Modelele de învățare profundă pot avea mulți parametri. Numărul de parametri se bazează pe numărul de straturi și neuroni, care pot crește exponențial pentru o arhitectură sofisticată.

În acest blog, voi analiza un caz de utilizare în afaceri al detectării fraudelor financiare. Una dintre cele mai mari provocări în detectarea fraudelor este problema dezechilibrului de clasă, ceea ce înseamnă că datele utilizate pentru antrenarea modelelor de învățare automată au foarte puține cazuri de fraudă.

Arhitectură de învățare profundă (imaginea autorului)

Este ca și cum antrenați un model de învățare automată pentru a găsi un ac într-un car de fân. Detectarea fraudei este o problemă specială care justifică o abordare sofisticată, cum ar fi arhitectura de învățare profundă.

În exemplu, voi lua date din sistemul de tranzacții bancare. Datele arată așa cum se arată aici. Datele au tipul tranzacției financiare, suma, precum și soldul vechi de origine și destinație și sold nou. Există, de asemenea, un steag care indică dacă tranzacția a fost frauduloasă sau nu.

Citarea pentru setul de date este disponibilă la sfârșitul blogului.

Date de detectare a fraudei (imagine după autor)

Datele sunt împărțite în date de antrenament și de testare. Modelul de deep learning este dezvoltat pe setul de antrenament și apoi este validat pe datele testului. Apoi, acest model poate fi folosit pentru a prezice frauda pe date nevăzute.

Împărțire tren/test (imagine după autor)

Modelul de deep learning pentru predicția fraudei este prezentat aici. Neuronii de intrare corespund datelor tranzacției. Fiecare neuron corespunde unei coloane din datele de intrare, cum ar fi tipul de tranzacție, suma și informațiile de sold la origine și destinație.

Există un strat intermediar și apoi stratul final care are doi neuroni, unul care prezice non-fraudă și celălalt care prezice nu-fraudă.

Liniile sunt semnale transmise între diferitele straturi. O linie verde indică un semnal pozitiv și o linie roșie indică un semnal negativ

Modelul de deep learning pentru detectarea fraudei (imagine după autor)

Vedem că neuronul 1_0 transmite un semnal pozitiv neuronului Fraud.

Aceasta înseamnă că a învățat profund cum arată o tranzacție frauduloasă! Acest lucru este incitant!

Neuronul 1_0 transmite un semnal pozitiv neuronului 2_1 (fraudă) (imaginea autorului)

Să aruncăm o privire în interiorul neuronului 1_0!

În interiorul neuronului 1_0 (imaginea autorului)

Diagrama radar este o reprezentare a ceea ce neuronul a învățat despre date. O linie albastră indică o valoare ridicată, iar o linie roșie indică o valoare scăzută. Graficul radar indică un echilibru vechi și nou ridicat, dar aproape similar la origine. Cu toate acestea, există o diferență foarte mare între vechiul și noul echilibru la destinație.

O astfel de situație este un indiciu de fraudă. Această situație poate fi prezentată vizual mai jos.

Arătând vizual cum arată tranzacția frauduloasă (imagine după autor)

Aici este prezentată acuratețea modelului de învățare profundă folosind o matrice de confuzie.

Matricea de confuzie (imagine după autor)

În total, sunt aproximativ 95000 de tranzacții, dintre care sunt 62 de tranzacții frauduloase, ceea ce este extrem de mai puțin decât tranzacția totală. Cu toate acestea, modelul de deep-learning face bine, deoarece este capabil să identifice corect 52 ca fraudă, ceea ce este numit și adevărat pozitiv (tp)

Există 1 fals pozitiv (fp), adică nu este o fraudă, dar modelul a semnalat incorect ca fraudă. Deci precizia, care este tp / (tp +fp), este egală cu 98%.

De asemenea, există 10 false negative (fn), ceea ce înseamnă că sunt tranzacții frauduloase, dar modelul nostru nu este capabil să le prezică. Deci, reamintirea măsurii care este tp / (tp + fn) care este 83%

Arhitectura de învățare profundă este foarte puternică, deoarece ajută la rezolvarea problemelor complexe, cum ar fi detectarea fraudelor. O modalitate vizuală de a analiza arhitectura de învățare profundă este utilă în înțelegerea arhitecturii, precum și a modului în care rezolvă problema

Citare surse de date pentru seturi de date financiare sintetice pentru detectarea fraudelor

Seturile de date financiare sintetice pentru detectarea fraudelor sunt disponibile aici: https://www.kaggle.com/competitions/spaceship-titanic/overview

După cum este specificat în secțiunea Licență, are o licență CC BY-SA 4.0.

Distribuie — copiați și redistribuiți materialul în orice mediu sau format
Adapta — remixați, transformați și construiți pe baza materialului pentru orice scop, chiar și comercial.

Te rugăm să ne contactezi alăturați-vă la Medium cu linkul meu de recomandare.

Te rugăm să ne contactezi subscrie să fiu informat ori de câte ori lansez o nouă poveste.

Puteți vizita site-ul meu pentru a face analize cu codificare zero. https://experiencedatascience.com

Pe site-ul web, puteți participa și la viitoarele ateliere de lucru AI pentru o experiență interesantă și inovatoare în domeniul științei datelor și AI.

Iată un link către canalul meu de YouTube
https://www.youtube.com/c/DataScienceDemonstrated

Deep Learning explicat vizual Republicat din sursa https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 prin https://towardsdatascience.com/feed

<!–

Timestamp-ul: Noiembrie 7, 2022Noiembrie 7, 2022