Deep learning begrijpen met behulp van visuele voorbeelden
Deep learning is een van de krachtigste AI-technieken, maar het kan moeilijk te begrijpen zijn. In deze blog zal ik proberen deep learning uit te leggen met behulp van beeldmateriaal en voorbeelden.
Deep learning-architectuur is geรฏnspireerd op de manier waarop ons brein werkt. Het is een verbinding van neuronen. Deep learning-modellen kunnen veel parameters hebben. Het aantal parameters is gebaseerd op het aantal lagen en neuronen, dat exponentieel kan groeien voor geavanceerde architectuur.
In deze blog behandel ik een zakelijk gebruik van de detectie van financiรซle fraude. Een van de grootste uitdagingen bij het opsporen van fraude is het probleem van onevenwicht tussen klassen, wat betekent dat de gegevens die worden gebruikt om machine learning-modellen te trainen zeer weinig gevallen van fraude bevatten.
Het is alsof je een machine learning-model traint om een โโspeld in een hooiberg te vinden. Fraudedetectie is een bijzonder probleem dat een geavanceerde aanpak, zoals deep learning-architectuur, rechtvaardigt.
In het voorbeeld neem ik gegevens uit het banktransactiesysteem. De gegevens zien eruit zoals hier weergegeven. De gegevens bevatten het type financiรซle transactie, het bedrag, de herkomst en bestemming van het oude saldo en het nieuwe saldo. Er is ook een vlag die aangeeft of de transactie frauduleus was of niet.
De bronvermelding voor de dataset is beschikbaar aan het einde van de blog.
De gegevens worden opgesplitst in trainings- en testgegevens. Het deep learning-model wordt ontwikkeld op de trainingsset en vervolgens gevalideerd op de testgegevens. Dan kan dit model gebruikt worden om fraude met ongeziene data te voorspellen.
Het deep learning-model voor fraudevoorspelling wordt hier weergegeven. De invoerneuronen komen overeen met de transactiegegevens. Elk neuron komt overeen met een kolom in de invoergegevens, zoals het type transactie, bedrag en saldo-informatie bij de oorsprong en de bestemming.
Er is รฉรฉn tussenlaag en vervolgens de laatste laag die twee neuronen heeft, รฉรฉn die geen fraude voorspelt en de andere die geen fraude voorspelt.
De lijnen zijn signalen die tussen de verschillende lagen worden doorgegeven. Een groene lijn geeft een positief signaal aan en een rode lijn geeft een negatief signaal aan
We zien dat neuron 1_0 een positief signaal doorgeeft aan neuronfraude.
Dit betekent dat het bedrijf diepgaand heeft geleerd hoe een frauduleuze transactie eruit ziet! Dit is spannend !
Laten we een kijkje nemen in neuron 1_0!
Het radardiagram is een weergave van wat het neuron over de gegevens heeft geleerd. Een blauwe lijn geeft een hoge waarde aan en een rode lijn geeft een lage waarde aan. De radarkaart geeft een hoog, maar vrijwel gelijkaardig oud en nieuw evenwicht aan bij de oorsprong. Er is echter een heel groot verschil tussen het oude en het nieuwe evenwicht op de bestemming.
Een dergelijke situatie is een indicatie van fraude. Deze situatie kan hieronder visueel worden weergegeven.
Hier wordt de nauwkeurigheid van het deep learning-model weergegeven met behulp van een verwarringsmatrix.
In totaal zijn er ongeveer 95000 transacties, waarvan 62 frauduleuze transacties, wat extreem minder is dan de totale transactie. Het deep-learningmodel doet het echter goed omdat het 52 correct kan identificeren als fraude, ook wel true positive (tp) genoemd.
Er is 1 fout-positief (fp), wat betekent dat het geen fraude is, maar dat het model dit ten onrechte als fraude heeft gemarkeerd. De precisie, die tp / (tp +fp) is, is dus gelijk aan 98%.
Er zijn ook 10 valse negatieven (fn), wat betekent dat het frauduleuze transacties zijn, maar ons model kan deze niet voorspellen. Dus de maatherinnering die tp / (tp + fn) is, wat 83% is
Deep learning-architectuur is zeer krachtig omdat het complexe problemen zoals fraudedetectie helpt oplossen. Een visuele manier om deep learning-architectuur te analyseren is nuttig om de architectuur te begrijpen en om te zien hoe deze het probleem oplost
Gegevensbroncitatie voor synthetische financiรซle datasets voor fraudedetectie
De synthetische financiรซle datasets voor fraudedetectie zijn hier beschikbaar: https://www.kaggle.com/competitions/spaceship-titanic/overview
Zoals gespecificeerd in de sectie Licentie, heeft het een licentie CC BY-SA 4.0.
- Delen โ kopieer en distribueer het materiaal in elk medium of formaat
- Aanpassen โ remix, transformeer en bouw voort op het materiaal voor elk doel, zelfs commercieel.
Alstublieft sluit je aan bij Middel met mijn verwijzingslink.
Alstublieft abonneren om op de hoogte te blijven wanneer ik een nieuw verhaal vrijgeef.
U kunt mijn website bezoeken om analyses te maken zonder codering. https://experiencedatascience.com
Op de website kun je ook deelnemen aan komende AI-workshops voor een interessante en innovatieve data science- en AI-ervaring.
Hier is een link naar mijn YouTube-kanaal
https://www.youtube.com/c/DataScienceDemonstrated
Diep leren visueel uitgelegd Opnieuw gepubliceerd vanuit de bron https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rssโ-7f60cf5620c9โ4 via https://towardsdatascience.com/feed
<!โ
->
- Bitcoin
- bizbouwermike
- blockchain
- blockchain-naleving
- blockchain-conferentie
- Blockchain-adviseurs
- coinbase
- vindingrijk
- Overeenstemming
- cryptoconferentie
- crypto mijnbouw
- cryptogeld
- gedecentraliseerde
- Defi
- Digitale activa
- ethereum
- machine learning
- niet-vervangbare token
- Plato
- plato ai
- Plato gegevensintelligentie
- Platoblockchain
- PlatoData
- platogamen
- Veelhoek
- Bewijs van het belang
- W3
- zephyrnet