Visuaalselt seletatud sügav õppimine

Süvaõppe mõistmine visuaalsete näidete abil

Foto: Julien Tromeur on Unsplash

Süvaõpe on üks võimsamaid AI tehnikaid, kuid sellest võib olla raske aru saada. Selles blogis püüan selgitada süvaõpet visuaalide ja näidete abil.

Süvaõppe arhitektuur on inspireeritud sellest, kuidas meie aju töötab. See on neuronite ühendus. Süvaõppe mudelitel võib olla palju parameetreid. Parameetrite arv põhineb kihtide ja neuronite arvul, mis võivad keeruka arhitektuuri korral eksponentsiaalselt kasvada.

Selles ajaveebis käsitlen finantspettuste avastamise ärilise kasutamise juhtumit. Üks suurimaid väljakutseid pettuste tuvastamisel on klasside tasakaalustamatuse probleem, mis tähendab, et masinõppemudelite koolitamiseks kasutatavate andmete hulgas on väga vähe pettusjuhtumeid.

Süvaõppe arhitektuur (pilt autorilt)

See on nagu masinõppemudeli õpetamine heinakuhjast nõela leidmiseks. Pettuste avastamine on eriline probleem, mis õigustab keeruka lähenemisviisi, näiteks süvaõppe arhitektuuri kasutamist.

Näites võtan andmed pangatehingute süsteemist. Andmed näevad välja nagu siin näidatud. Andmed sisaldavad finantstehingu tüüp, summa, samuti päritolu ja sihtkoht vana saldo ja uus saldo. Samuti on lipp, mis näitab, kas tehing oli pettus või mitte.

Andmestiku tsitaat on saadaval ajaveebi lõpus.

Pettuste tuvastamise andmed (pilt autorilt)

Andmed on jagatud treening- ja testiandmeteks. Süvaõppe mudel töötatakse välja koolituskomplektil ja seejärel kinnitatakse see testiandmetel. Seejärel saab seda mudelit kasutada nähtamatute andmetega seotud pettuste ennustamiseks.

Treeni/testi jaotus (pilt autorilt)

Siin on näidatud pettuste ennustamise süvaõppemudel. Sisendneuronid vastavad tehinguandmetele. Iga neuron vastab veerule sisendandmetes, nagu tehingu tüüp, summa ja bilansi teave lähte- ja sihtkohas.

Seal on üks vahekiht ja seejärel viimane kiht, millel on kaks neuronit, millest üks ennustab mittepettust ja teine, mis ennustab pettuse vältimist.

Jooned on erinevate kihtide vahel edastatavad signaalid. Roheline joon näitab positiivset signaali ja punane joon negatiivset signaali

Süvaõppe mudel pettuste tuvastamiseks (autori pilt)

Näeme, et neuron 1_0 edastab positiivse signaali neuronile Fraud.

See tähendab, et ta on põhjalikult õppinud, kuidas petturlik tehing välja näeb! See on põnev!

Neuron 1_0 edastab positiivse signaali neuronile 2_1 (pettus) (autori pilt)

Piilume neuroni 1_0 sisse!

Neuronis 1_0 (pilt autorilt)

Radari diagramm kujutab endast seda, mida neuron on andmete kohta õppinud. Sinine joon näitab kõrget väärtust ja punane joon madalat väärtust. Radari diagramm näitab kõrget, kuid peaaegu sarnast vana ja uue tasakaalu alguspunktis. Sihtkoha vana ja uue saldo vahel on aga väga suur vahe.

Selline olukord viitab pettusele. Seda olukorda saab visuaalselt näidata allpool.

Näitab visuaalselt, kuidas petturlik tehing välja näeb (pilt autorilt)

Siin on näidatud süvaõppe mudeli täpsus segadusmaatriksi abil.

Segadusmaatriks (autori pilt)

Kokku on tehinguid ligikaudu 95000 62, millest petturlikke tehinguid on 52, mis on äärmiselt vähem tehingute koguarvust. Süvaõppe mudelil läheb aga hästi, kuna see suudab XNUMX õigesti tuvastada pettusena, mida nimetatakse ka tõeliseks positiivseks (tp)

Seal on 1 valepositiivne (fp), mis tähendab, et see ei ole pettus, kuid mudel märkis selle valesti pettuseks. Nii et täpsus, mis on tp / (tp + fp), võrdub 98%.

Samuti on 10 valenegatiivset (fn), mis tähendab, et tegemist on petturlike tehingutega, kuid meie mudel ei suuda neid ennustada. Seega tuletab mõõt meelde, mis on tp / (tp +fn), mis on 83%

Süvaõppe arhitektuur on väga võimas, kuna aitab lahendada keerulisi probleeme, nagu pettuste avastamine. Visuaalne viis süvaõppe arhitektuuri analüüsimiseks on kasulik nii arhitektuuri mõistmisel kui ka selle lahendamisel

Andmeallika tsitaat sünteetiliste finantsandmekogumite jaoks pettuste tuvastamiseks

Pettuste tuvastamise sünteetilised finantsandmed on saadaval siin: https://www.kaggle.com/competitions/spaceship-titanic/overview

Nagu jaotises Litsents on täpsustatud, on sellel litsents CC BY-SA 4.0.

  • Jaga — kopeerida ja levitada materjale mis tahes andmekandjal või vormingus
  • Kohandama — remiksige, muutke ja ehitage materjali mis tahes eesmärgil, isegi äriliselt.

Palun liitu Mediumiga minu suunamislingiga.

Palun tellima et olla kursis alati, kui avaldan uue loo.

Nullkodeeringuga analüütika tegemiseks võite külastada minu veebisaiti. https://experiencedatascience.com

Veebilehel saate osaleda ka tulevastel tehisintellekti töötubadel huvitava ja uuendusliku andmeteaduse ja AI kogemuse saamiseks.

Siin on link minu YouTube'i kanalile
https://www.youtube.com/c/DataScienceDemonstrated

Visuaalselt seletatud süvaõpe uuesti avaldatud allikast https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9-4 https://towardsdatascience.com/feed kaudu

<!–

->

Ajatempel:

Veel alates Blockchaini konsultandid