Deep Learning visuelt forklart

Forstå dyp læring ved hjelp av visuelle eksempler

Photo by julien Tromeur on Unsplash

Dyplæring er en av de kraftigste AI-teknikkene, men den kan være vanskelig å forstå. I denne bloggen vil jeg forsøke å forklare dyp læring ved hjelp av bilder og eksempler.

Deep learning arkitektur er inspirert av hvordan hjernen vår fungerer. Det er en forbindelse av nevroner. Dyplæringsmodeller kan ha mange parametere. Antall parametere er basert på antall lag og nevroner, som kan vokse eksponentielt for sofistikert arkitektur.

I denne bloggen vil jeg ta et tilfelle av økonomisk svindeloppdagelse. En av de største utfordringene innen svindeldeteksjon er problemet med klasseubalanse, som betyr at dataene som brukes til å trene maskinlæringsmodeller har svært få tilfeller av svindel.

Dyplæringsarkitektur (bilde av forfatter)

Det er som å trene en maskinlæringsmodell for å finne en nål i en høystakk. Svindeloppdagelse er et spesielt problem som rettferdiggjør å ha en sofistikert tilnærming som dyp læringsarkitektur.

I eksemplet vil jeg ta data fra banktransaksjonssystemet. Dataene ser ut som vist her. Dataene har typen finansiell transaksjon, beløp, samt opprinnelse og destinasjon gammel saldo og ny saldo. Det er også et flagg som indikerer om transaksjonen var uredelig eller ikke.

Sitatet for datasettet er tilgjengelig på slutten av bloggen.

Data for svindeloppdagelse (bilde etter forfatter)

Dataene er delt inn i trenings- og testdata. Den dype læringsmodellen utvikles på treningssettet og deretter valideres den på testdataene. Da kan denne modellen brukes til å forutsi svindel på usett data.

Tog-/testdeling (bilde av forfatter)

Den dype læringsmodellen for svindelprediksjon er vist her. Inngangsnevronene tilsvarer transaksjonsdataene. Hvert nevron tilsvarer en kolonne i inndataene som transaksjonstype, beløp og saldoinformasjon ved opprinnelse og destinasjon.

Det er ett mellomlag og deretter det siste laget som har to nevroner, ett som forutsier ikke-svindel og det andre som forutsier ikke-svindel.

Linjene er signaler som sendes mellom de forskjellige lagene. En grønn linje indikerer et positivt signal og en rød linje indikerer et negativt signal

Den dype læringsmodellen for svindeloppdagelse (bilde av forfatter)

Vi ser at nevron 1_0 sender et positivt signal til nevronsvindel.

Dette betyr at den har dypt lært hvordan en svindeltransaksjon ser ut! Dette er spennende !

Neuron 1_0 sender et positivt signal til nevron 2_1 (svindel) (bilde av forfatter)

La oss kikke inn i nevron 1_0!

Inne i nevronet 1_0 (bilde av forfatter)

Radardiagrammet er en representasjon av hva nevronet har lært om dataene. En blå linje indikerer en høy verdi, og en rød linje indikerer en lav verdi. Radarkartet indikerer en høy, men nesten lik gammel og ny balanse ved origo. Det er imidlertid en veldig stor forskjell mellom gammel og ny balanse på destinasjonen.

En slik situasjon er en indikasjon på svindel. Denne situasjonen kan vises visuelt nedenfor.

Viser visuelt hvordan uredelig transaksjon ser ut (bilde etter forfatter)

Vist her er nøyaktigheten til dyplæringsmodellen ved hjelp av en forvirringsmatrise.

Forvirringsmatrise (bilde av forfatter)

Totalt er det rundt 95000 62 transaksjoner, hvorav det er 52 svindeltransaksjoner, noe som er ekstremt mindre enn den totale transaksjonen. Imidlertid gjør dyplæringsmodellen det bra ettersom den er i stand til å identifisere XNUMX korrekt som svindel, som også kalles sann positiv (tp)

Det er 1 falsk positiv (fp), noe som betyr at det ikke er svindel, men modellen har feilaktig flagget det som svindel. Så presisjonen, som er tp / (tp +fp), tilsvarer 98%.

Det er også 10 falske negativer (fn), som betyr at de er falske transaksjoner, men vår modell er ikke i stand til å forutsi dem. Så tilbakekallingen som er tp / (tp +fn) som er 83 %

Dyplæringsarkitektur er veldig kraftig ettersom den hjelper til med å løse komplekse problemer som svindeloppdagelse. En visuell måte å analysere dyplæringsarkitektur på er nyttig for å forstå arkitekturen så vel som hvordan den løser problemet

Datakildehenvisning for syntetiske økonomiske datasett for svindeloppdagelse

De syntetiske økonomiske datasettene for svindeloppdagelse er data tilgjengelig her: https://www.kaggle.com/competitions/spaceship-titanic/overview

Som spesifisert i lisensdelen har den en lisens CC BY-SA 4.0.

  • Del — kopiere og redistribuere materialet i et hvilket som helst medium eller format
  • Tilpass – remiks, transformer og bygger på materialet til ethvert formål, også kommersielt.

Vær så snill bli med Medium med min henvisningslink.

Vær så snill abonnere å holde meg informert når jeg slipper en ny historie.

Du kan besøke nettstedet mitt for å lage analyser uten koding. https://experiencedatascience.com

På nettsiden kan du også delta på kommende AI-workshops for en interessant og innovativ datavitenskap og AI-opplevelse.

Her er en link til min YouTube-kanal
https://www.youtube.com/c/DataScienceDemonstrated

Deep Learning visuelt forklart Republisert fra kilde https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

->

Tidstempel:

Mer fra Blockchain-konsulenter