Mély tanulás vizuálisan megmagyarázva

A mélytanulás megértése vizuális példák segítségével

Fotó Julien Tromeur on Unsplash

A mélytanulás az egyik legerősebb AI-technika, azonban nehéz lehet megérteni. Ebben a blogban megpróbálom elmagyarázni a mély tanulást látványelemek és példák segítségével.

A mély tanulási architektúrát az agyunk működése ihlette. Ez a neuronok kapcsolata. A mély tanulási modelleknek számos paramétere lehet. A paraméterek száma a rétegek és a neuronok számán alapul, amelyek exponenciálisan növekedhetnek a kifinomult architektúra esetén.

Ebben a blogban a pénzügyi csalások felderítésének üzleti felhasználási esetét veszem figyelembe. A csalásfelderítés egyik legnagyobb kihívása az osztálykiegyensúlyozatlanság problémája, ami azt jelenti, hogy a gépi tanulási modellek betanításához használt adatokban nagyon kevés csalási eset fordul elő.

Mélytanulási architektúra (a szerző képe)

Ez olyan, mint egy gépi tanulási modell betanítása, hogy tűt találjon a szénakazalban. A csalások felderítése olyan speciális probléma, amely indokolja az olyan kifinomult megközelítést, mint például a mély tanulási architektúra.

A példában a banki tranzakciós rendszerből veszek adatokat. Az adatok az alábbiak szerint néznek ki. Az adatok tartalmazzák a pénzügyi tranzakció típusát, összegét, valamint a származási és célállomási régi egyenleget és az új egyenleget. Van egy zászló is, amely jelzi, hogy a tranzakció csaló volt-e vagy sem.

Az adatkészlet hivatkozása a blog végén található.

Csalásfelderítési adatok (a szerző képe)

Az adatok képzési és tesztadatokra vannak felosztva. A mély tanulási modellt a képzési halmazon fejlesztik, majd a tesztadatokon érvényesítik. Ezután ez a modell felhasználható a nem látott adatokkal kapcsolatos csalások előrejelzésére.

Vonat/teszt felosztás (a szerző képe)

Itt látható a csalás előrejelzésének mély tanulási modellje. A bemeneti neuronok megfelelnek a tranzakciós adatoknak. Minden idegsejt egy oszlopnak felel meg a bemeneti adatokban, mint például a tranzakció típusa, az összeg és az egyenleg információ a kiindulási és célállomáson.

Van egy közbülső réteg, majd az utolsó réteg, amelynek két neuronja van, az egyik a csalás hiányát, a másik pedig a csalást.

A vonalak a különböző rétegek között átadott jelek. A zöld vonal pozitív jelet, a piros vonal pedig a negatív jelet jelzi

A mély tanulási modell a csalások felderítéséhez (a szerző képe)

Látjuk, hogy az 1_0 neuron pozitív jelet ad át a Fraud neuronnak.

Ez azt jelenti, hogy alaposan megtanulta, hogyan néz ki egy csalárd tranzakció! Ez izgalmas !

Az 1_0 neuron pozitív jelet ad át a 2_1 neuronnak (csalás) (a szerző képe)

Nézzünk be az 1_0 neuronba!

Az 1_0 neuron belsejében (a szerző képe)

A radardiagram azt mutatja be, hogy a neuron mit tanult az adatokról. A kék vonal a magas, a piros vonal az alacsony értéket jelzi. A radardiagram magas, de szinte hasonló régi és új egyensúlyt jelez az origónál. A régi és az új egyenleg között azonban nagyon nagy különbség van a célállomáson.

Az ilyen helyzet csalásra utal. Ez a helyzet az alábbiakban vizuálisan bemutatható.

Vizuálisan bemutatja, hogyan néz ki a csalárd tranzakció (a szerző képe)

Itt látható a mély tanulási modell pontossága egy zavaros mátrix használatával.

Zavar mátrix (a szerző képe)

Összesen mintegy 95000 62 tranzakcióról van szó, amelyből 52 csalárd tranzakció van, ami rendkívül kevesebb, mint a teljes tranzakció. A mélytanulási modell azonban jól működik, mivel képes XNUMX-t helyesen csalásként azonosítani, amit igaz pozitívnak (tp) is neveznek.

1 hamis pozitív (fp) van, vagyis nem csalás, de a modell tévesen csalásnak jelölte meg. Tehát a pontosság, ami tp / (tp +fp), 98%.

Emellett van 10 hamis negatív (fn), ami azt jelenti, hogy csalárd tranzakciókról van szó, de modellünk nem képes előre jelezni őket. Tehát a mérték visszahívása, amely tp / (tp +fn), ami 83%

A mélytanulási architektúra nagyon hatékony, mivel segít megoldani az összetett problémákat, például a csalások felderítését. A mély tanulási architektúra elemzésének vizuális módja hasznos az architektúra és a probléma megoldásának megértésében

Adatforrás hivatkozás a csalások felderítésére szolgáló szintetikus pénzügyi adatkészletekhez

A csalások felderítésére szolgáló szintetikus pénzügyi adatkészletek itt érhetők el: https://www.kaggle.com/competitions/spaceship-titanic/overview

A Licenc szakaszban meghatározottak szerint licenccel rendelkezik CC BY-SA 4.0.

  • Megosztás — az anyagot bármilyen médiában vagy formátumban másolni és újra terjeszteni
  • alkalmazkodni – újrakeverni, átalakítani és az anyagot bármilyen célra, akár kereskedelmi célra is építeni.

További részletekért kérem lapozgasson a menüben; szülőknek szóló egyéni ajánlatokat pedig a csatlakozzon a Médiumhoz az ajánló linkjemmel.

További részletekért kérem lapozgasson a menüben; szülőknek szóló egyéni ajánlatokat pedig a Iratkozz fel hogy mindig értesüljek, amikor új történetet adok ki.

Látogassa meg webhelyemet, ahol nulla kódolású elemzéseket készíthet. https://experiencedatascience.com

A weboldalon részt vehet a közelgő mesterséges intelligencia workshopokon is, ahol érdekes és innovatív adattudományi és AI-tapasztalatokat szerezhet.

Itt van egy link a YouTube csatornámhoz
https://www.youtube.com/c/DataScienceDemonstrated

A Deep Learning Visually Explained újra közzétéve a következő forrásból: https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 a https://towardsdatascience.com/feed oldalon

<!–

->

Időbélyeg:

Még több Blockchain tanácsadók