Dyb læring visuelt forklaret

Forstå dyb læring ved hjælp af visuelle eksempler

Photo by julien Tromeur on Unsplash

Deep learning er en af ​​de mest kraftfulde AI-teknikker, men den kan være svær at forstå. I denne blog vil jeg forsøge at forklare dyb læring ved hjælp af billeder og eksempler.

Deep learning-arkitektur er inspireret af, hvordan vores hjerne fungerer. Det er en forbindelse af neuroner. Deep learning-modeller kan have mange parametre. Antallet af parametre er baseret på antallet af lag og neuroner, som kan vokse eksponentielt for sofistikeret arkitektur.

I denne blog vil jeg tage en virksomhedsbrugssag om afsløring af økonomisk svindel. En af de største udfordringer inden for svindeldetektion er problemet med klasseubalance, hvilket betyder, at de data, der bruges til at træne maskinlæringsmodeller, har meget få tilfælde af svindel.

Deep learning arkitektur (billede af forfatter)

Det er som at træne en maskinlæringsmodel til at finde en nål i en høstak. Detektion af svindel er et særligt problem, der retfærdiggør at have en sofistikeret tilgang, såsom deep learning-arkitektur.

I eksemplet vil jeg tage data fra banktransaktionssystemet. Dataene ser ud som vist her. Dataene har typen af ​​finansiel transaktion, beløb samt oprindelse og destination gammel saldo og ny saldo. Der er også et flag, der angiver, om transaktionen var svigagtig eller ej.

Citatet for datasættet er tilgængeligt i slutningen af ​​bloggen.

Data for registrering af svindel (billede af forfatter)

Dataene er opdelt i trænings- og testdata. Den dybe læringsmodel udvikles på træningssættet og derefter valideres den på testdataene. Så kan denne model bruges til at forudsige svindel på usete data.

Tog / Test split (billede af forfatter)

Den dybe læringsmodel til forudsigelse af bedrageri er vist her. Inputneuronerne svarer til transaktionsdataene. Hver neuron svarer til en kolonne i inputdata, såsom typen af ​​transaktion, beløb og saldoinformation ved oprindelse og destination.

Der er et mellemlag og derefter det sidste lag, som har to neuroner, en som forudsiger ikke-svig og den anden som forudsiger ingen svig.

Linjerne er signaler, der sendes mellem de forskellige lag. En grøn linje indikerer et positivt signal og en rød linje indikerer et negativt signal

Den dybe læringsmodel til afsløring af svindel (billede af forfatter)

Vi ser, at neuron 1_0 sender et positivt signal til neuronsvindel.

Det betyder, at den har dybt lært, hvordan en svigagtig transaktion ser ud! Det her er spændende!

Neuron 1_0 sender et positivt signal til neuron 2_1 (svindel) (billede af forfatter)

Lad os kigge ind i neuron 1_0!

Inde i neuron 1_0 (billede af forfatter)

Radardiagrammet er en repræsentation af, hvad neuronen har lært om dataene. En blå linje angiver en høj værdi, og en rød linje angiver en lav værdi. Radarkortet indikerer en høj, men næsten ens gammel og ny balance ved oprindelsen. Der er dog meget stor forskel på den gamle og den nye balance på destinationen.

En sådan situation er et tegn på bedrageri. Denne situation kan vises visuelt nedenfor.

Visuelt, hvordan svigagtig transaktion ser ud (billede efter forfatter)

Her er vist nøjagtigheden af ​​den dybe læringsmodel ved hjælp af en forvirringsmatrix.

Forvirringsmatrix (billede af forfatter)

I alt er der omkring 95000 transaktioner, hvoraf der er 62 svigagtige transaktioner, hvilket er ekstremt mindre end den samlede transaktion. Deep-learning-modellen gør det dog godt, da den er i stand til at identificere 52 korrekt som svindel, hvilket også kaldes sand positiv (tp)

Der er 1 falsk positiv (fp), hvilket betyder, at det ikke er svindel, men modellen har fejlagtigt markeret det som svindel. Så præcisionen, som er tp / (tp +fp), er lig med 98%.

Der er også 10 falske negativer (fn), hvilket betyder, at de er svigagtige transaktioner, men vores model er ikke i stand til at forudsige dem. Så tilbagekaldelse af mål, som er tp / (tp + fn), som er 83 %

Deep learning-arkitektur er meget kraftfuld, da den hjælper med at løse komplekse problemer, såsom afsløring af svindel. En visuel måde at analysere dyb læringsarkitektur på er nyttig til at forstå arkitekturen samt hvordan den løser problemet

Datakildehenvisning til syntetiske finansielle datasæt til afsløring af svindel

De syntetiske finansielle datasæt til afsløring af svindel er data tilgængelige her: https://www.kaggle.com/competitions/spaceship-titanic/overview

Som angivet i afsnittet Licens har den en licens CC BY-SA 4.0.

  • Del — kopiere og videredistribuere materialet i ethvert medie eller format
  • Tilpasse — remix, transformer og bygge videre på materialet til ethvert formål, også kommercielt.

Vær venlig at slutte sig til Medium med mit henvisningslink.

Vær venlig at Hold mig opdateret for at holde mig orienteret, hver gang jeg udgiver en ny historie.

Du kan besøge min hjemmeside for at lave analyser uden kodning. https://experiencedatascience.com

På hjemmesiden kan du også deltage i kommende AI-workshops for en interessant og innovativ datavidenskab og AI-oplevelse.

Her er et link til min YouTube-kanal
https://www.youtube.com/c/DataScienceDemonstrated

Deep Learning visuelt forklaret Genudgivet fra kilde https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

->

Tidsstempel:

Mere fra Blockchain-konsulenter