Візуальне пояснення глибокого навчання

Перевидано Платоном

читають: 0

Розуміння глибинного навчання на візуальних прикладах

Глибоке навчання є одним із найпотужніших методів штучного інтелекту, однак його може бути важко зрозуміти. У цьому блозі я спробую пояснити глибинне навчання за допомогою візуальних матеріалів і прикладів.

Архітектура глибокого навчання заснована на тому, як працює наш мозок. Це зв'язок нейронів. Моделі глибокого навчання можуть мати багато параметрів. Кількість параметрів базується на кількості шарів і нейронів, яка може експоненціально зростати для складної архітектури.

У цьому блозі я розгляну бізнес-випадок виявлення фінансового шахрайства. Однією з найбільших проблем у виявленні шахрайства є проблема дисбалансу класів, що означає, що дані, які використовуються для навчання моделей машинного навчання, містять дуже мало випадків шахрайства.

Архітектура глибокого навчання (зображення автора)

Це як навчити модель машинного навчання знаходити голку в стозі сіна. Виявлення шахрайства є особливою проблемою, яка виправдовує наявність складного підходу, такого як архітектура глибокого навчання.

У прикладі я візьму дані з системи банківських операцій. Дані виглядають так, як показано тут. Дані містять тип фінансової операції, суму, а також джерело та призначення старого балансу та нового балансу. Існує також позначка, яка вказує, чи була транзакція шахрайською чи ні.

Цитата для набору даних доступна в кінці блогу.

Дані виявлення шахрайства (зображення автора)

Дані розділені на навчальні та тестові дані. Модель глибокого навчання розробляється на навчальному наборі, а потім перевіряється на тестових даних. Потім цю модель можна використовувати для прогнозування шахрайства з невидимими даними.

Поїзд / тестовий спліт (зображення автора)

Тут показано модель глибокого навчання для прогнозування шахрайства. Вхідні нейрони відповідають даним транзакції. Кожен нейрон відповідає стовпцю у вхідних даних, таких як тип транзакції, сума та інформація про баланс у джерелі та пункті призначення.

Існує один проміжний рівень, а потім останній, який містить два нейрони: один прогнозує відсутність шахрайства, а інший – відсутність шахрайства.

Лінії - це сигнали, що передаються між різними шарами. Зелена лінія вказує на позитивний сигнал, а червона – на негативний

Модель глибокого навчання для виявлення шахрайства (зображення автора)

Ми бачимо, що нейрон 1_0 передає позитивний сигнал нейрону Fraud.

Це означає, що він глибоко вивчив, як виглядає шахрайська транзакція! Це захоплююче!

Нейрон 1_0 передає позитивний сигнал нейрону 2_1 (шахрайство) (зображення автора)

Давайте заглянемо всередину нейрона 1_0!

Всередині нейрона 1_0 (зображення автора)

Радарна діаграма є відображенням того, що нейрон дізнався про дані. Синя лінія вказує на високе значення, а червона лінія вказує на низьке значення. Радарна діаграма вказує на високий, але майже подібний старий і новий баланс у початку. Однак існує дуже велика різниця між старим і новим балансом у пункті призначення.

Така ситуація є ознакою шахрайства. Цю ситуацію можна наочно показати нижче.

Візуально показано, як виглядає шахрайська транзакція (зображення автора)

Тут показано точність моделі глибокого навчання з використанням матриці плутанини.

Загалом є близько 95000 62 транзакцій, з яких 52 шахрайські, що значно менше, ніж загальна кількість транзакцій. Однак модель глибокого навчання працює добре, оскільки вона здатна правильно ідентифікувати XNUMX як шахрайство, що також називається справді позитивним (tp)

Є 1 помилковий результат (fp), тобто це не шахрайство, але модель неправильно позначила це як шахрайство. Отже, точність, яка становить tp / (tp +fp), дорівнює 98%.

Крім того, є 10 помилкових негативів (fn), які означають, що це шахрайські транзакції, але наша модель не може їх передбачити. Отже, міра відкликання, яка становить tp / (tp +fn), що становить 83%

Архітектура глибокого навчання є дуже потужною, оскільки допомагає вирішувати складні проблеми, такі як виявлення шахрайства. Візуальний спосіб аналізу архітектури глибокого навчання корисний для розуміння архітектури, а також того, як вона вирішує проблему

Посилання на джерело даних для синтетичних наборів фінансових даних для виявлення шахрайства

Синтетичні набори фінансових даних для виявлення шахрайства доступні тут: https://www.kaggle.com/competitions/spaceship-titanic/overview

Як зазначено в розділі Ліцензія, він має ліцензію CC BY-SA 4.0.

Поділитись — копіювати та поширювати матеріал у будь-якому носії чи форматі
адаптуватися — реміксувати, трансформувати та створювати матеріал для будь-яких цілей, навіть комерційних.

будь ласка приєднатися до Medium з моїм реферальним посиланням.

будь ласка підписуватися бути в курсі кожного разу, коли я випускаю нову історію.

Ви можете відвідати мій веб-сайт, щоб зробити аналітику без кодування. https://experiencedatascience.com

На веб-сайті ви також можете взяти участь у майбутніх семінарах зі штучного інтелекту, щоб отримати цікавий та інноваційний досвід у галузі науки про дані та штучного інтелекту.

Ось посилання на мій канал YouTube
https://www.youtube.com/c/DataScienceDemonstrated

Візуальне пояснення глибокого навчання Перепубліковано з джерела https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 через https://towardsdatascience.com/feed

<!–

Часова мітка: Листопад 7, 2022Листопад 7, 2022