Diep leren visueel uitgelegd

Heruitgegeven door Plato

volgers: 0

Deep learning begrijpen met behulp van visuele voorbeelden

Deep learning is een van de krachtigste AI-technieken, maar het kan moeilijk te begrijpen zijn. In deze blog zal ik proberen deep learning uit te leggen met behulp van beeldmateriaal en voorbeelden.

Deep learning-architectuur is geïnspireerd op de manier waarop ons brein werkt. Het is een verbinding van neuronen. Deep learning-modellen kunnen veel parameters hebben. Het aantal parameters is gebaseerd op het aantal lagen en neuronen, dat exponentieel kan groeien voor geavanceerde architectuur.

In deze blog behandel ik een zakelijk gebruik van de detectie van financiële fraude. Een van de grootste uitdagingen bij het opsporen van fraude is het probleem van onevenwicht tussen klassen, wat betekent dat de gegevens die worden gebruikt om machine learning-modellen te trainen zeer weinig gevallen van fraude bevatten.

Deep learning-architectuur (afbeelding door auteur)

Het is alsof je een machine learning-model traint om een speld in een hooiberg te vinden. Fraudedetectie is een bijzonder probleem dat een geavanceerde aanpak, zoals deep learning-architectuur, rechtvaardigt.

In het voorbeeld neem ik gegevens uit het banktransactiesysteem. De gegevens zien eruit zoals hier weergegeven. De gegevens bevatten het type financiële transactie, het bedrag, de herkomst en bestemming van het oude saldo en het nieuwe saldo. Er is ook een vlag die aangeeft of de transactie frauduleus was of niet.

De bronvermelding voor de dataset is beschikbaar aan het einde van de blog.

Fraudedetectiegegevens (afbeelding door auteur)

De gegevens worden opgesplitst in trainings- en testgegevens. Het deep learning-model wordt ontwikkeld op de trainingsset en vervolgens gevalideerd op de testgegevens. Dan kan dit model gebruikt worden om fraude met ongeziene data te voorspellen.

Trein / Test-splitsing (afbeelding door auteur)

Het deep learning-model voor fraudevoorspelling wordt hier weergegeven. De invoerneuronen komen overeen met de transactiegegevens. Elk neuron komt overeen met een kolom in de invoergegevens, zoals het type transactie, bedrag en saldo-informatie bij de oorsprong en de bestemming.

Er is één tussenlaag en vervolgens de laatste laag die twee neuronen heeft, één die geen fraude voorspelt en de andere die geen fraude voorspelt.

De lijnen zijn signalen die tussen de verschillende lagen worden doorgegeven. Een groene lijn geeft een positief signaal aan en een rode lijn geeft een negatief signaal aan

Het deep learning-model voor fraudedetectie (afbeelding door auteur)

We zien dat neuron 1_0 een positief signaal doorgeeft aan neuronfraude.

Dit betekent dat het bedrijf diepgaand heeft geleerd hoe een frauduleuze transactie eruit ziet! Dit is spannend !

Neuron 1_0 geeft een positief signaal door aan neuron 2_1 (fraude) (afbeelding door auteur)

Laten we een kijkje nemen in neuron 1_0!

Binnenin het neuron 1_0 (afbeelding door auteur)

Het radardiagram is een weergave van wat het neuron over de gegevens heeft geleerd. Een blauwe lijn geeft een hoge waarde aan en een rode lijn geeft een lage waarde aan. De radarkaart geeft een hoog, maar vrijwel gelijkaardig oud en nieuw evenwicht aan bij de oorsprong. Er is echter een heel groot verschil tussen het oude en het nieuwe evenwicht op de bestemming.

Een dergelijke situatie is een indicatie van fraude. Deze situatie kan hieronder visueel worden weergegeven.

Visueel laten zien hoe een frauduleuze transactie eruit ziet (afbeelding door auteur)

Hier wordt de nauwkeurigheid van het deep learning-model weergegeven met behulp van een verwarringsmatrix.

Verwarringsmatrix (afbeelding door auteur)

In totaal zijn er ongeveer 95000 transacties, waarvan 62 frauduleuze transacties, wat extreem minder is dan de totale transactie. Het deep-learningmodel doet het echter goed omdat het 52 correct kan identificeren als fraude, ook wel true positive (tp) genoemd.

Er is 1 fout-positief (fp), wat betekent dat het geen fraude is, maar dat het model dit ten onrechte als fraude heeft gemarkeerd. De precisie, die tp / (tp +fp) is, is dus gelijk aan 98%.

Er zijn ook 10 valse negatieven (fn), wat betekent dat het frauduleuze transacties zijn, maar ons model kan deze niet voorspellen. Dus de maatherinnering die tp / (tp + fn) is, wat 83% is

Deep learning-architectuur is zeer krachtig omdat het complexe problemen zoals fraudedetectie helpt oplossen. Een visuele manier om deep learning-architectuur te analyseren is nuttig om de architectuur te begrijpen en om te zien hoe deze het probleem oplost

Gegevensbroncitatie voor synthetische financiële datasets voor fraudedetectie

De synthetische financiële datasets voor fraudedetectie zijn hier beschikbaar: https://www.kaggle.com/competitions/spaceship-titanic/overview

Zoals gespecificeerd in de sectie Licentie, heeft het een licentie CC BY-SA 4.0.

Delen — kopieer en distribueer het materiaal in elk medium of formaat
Aanpassen — remix, transformeer en bouw voort op het materiaal voor elk doel, zelfs commercieel.

Alstublieft sluit je aan bij Middel met mijn verwijzingslink.

Alstublieft abonneren om op de hoogte te blijven wanneer ik een nieuw verhaal vrijgeef.

U kunt mijn website bezoeken om analyses te maken zonder codering. https://experiencedatascience.com

Op de website kun je ook deelnemen aan komende AI-workshops voor een interessante en innovatieve data science- en AI-ervaring.

Hier is een link naar mijn YouTube-kanaal
https://www.youtube.com/c/DataScienceDemonstrated

Diep leren visueel uitgelegd Opnieuw gepubliceerd vanuit de bron https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

Tijdstempel: 7 november 20227 november 2022