Глубокое обучение, визуальное объяснение

Понимание глубокого обучения с помощью наглядных примеров

Фото Жюльен Тромер on Unsplash

Глубокое обучение — один из самых мощных методов искусственного интеллекта, однако его может быть сложно понять. В этом блоге я попытаюсь объяснить глубокое обучение, используя наглядные изображения и примеры.

Архитектура глубокого обучения основана на том, как работает наш мозг. Это соединение нейронов. Модели глубокого обучения могут иметь множество параметров. Количество параметров основано на количестве слоев и нейронов, которое может расти в геометрической прогрессии для сложной архитектуры.

В этом блоге я рассмотрю бизнес-пример обнаружения финансового мошенничества. Одной из самых больших проблем в обнаружении мошенничества является проблема дисбаланса классов, а это означает, что данные, используемые для обучения моделей машинного обучения, содержат очень мало случаев мошенничества.

Архитектура глубокого обучения (изображение автора)

Это похоже на обучение модели машинного обучения поиску иголки в стоге сена. Обнаружение мошенничества — это особая проблема, которая оправдывает применение сложного подхода, такого как архитектура глубокого обучения.

В примере я возьму данные из системы банковских транзакций. Данные выглядят так, как показано здесь. Данные содержат тип финансовой транзакции, сумму, а также место происхождения и назначения старого баланса и нового баланса. Также имеется флаг, указывающий, была ли транзакция мошеннической или нет.

Ссылка на набор данных доступна в конце блога.

Данные об обнаружении мошенничества (изображение автора)

Данные разделены на обучающие и тестовые данные. Модель глубокого обучения разрабатывается на обучающем наборе, а затем проверяется на тестовых данных. Затем эту модель можно использовать для прогнозирования мошенничества на основе невидимых данных.

Поезд/Тестовый сплит (изображение автора)

Здесь показана модель глубокого обучения для прогнозирования мошенничества. Входные нейроны соответствуют данным транзакции. Каждый нейрон соответствует столбцу входных данных, например типу транзакции, сумме и информации о балансе в источнике и пункте назначения.

Существует один промежуточный уровень, а затем последний уровень, который имеет два нейрона: один прогнозирует отсутствие мошенничества, а другой — отсутствие мошенничества.

Линии представляют собой сигналы, передаваемые между различными слоями. Зеленая линия указывает на положительный сигнал, а красная линия указывает на отрицательный сигнал.

Модель глубокого обучения для обнаружения мошенничества (изображение автора)

Мы видим, что нейрон 1_0 передает положительный сигнал нейрону Fraud.

Это означает, что он глубоко изучил, как выглядит мошенническая транзакция! Это впечатляет !

Нейрон 1_0 передает положительный сигнал нейрону 2_1 (мошенничество) (изображение автора)

Давайте заглянем внутрь нейрона 1_0!

Внутри нейрона 1_0 (изображение автора)

Радарная диаграмма представляет собой представление того, что нейрон узнал о данных. Синяя линия указывает на высокое значение, а красная линия — на низкое значение. Радарная диаграмма указывает на высокий, но почти одинаковый старый и новый баланс в начале координат. Однако существует очень большая разница между старым и новым балансом в пункте назначения.

Такая ситуация является признаком мошенничества. Эту ситуацию можно наглядно продемонстрировать ниже.

Наглядно демонстрируем, как выглядит мошенническая транзакция (изображение автора)

Здесь показана точность модели глубокого обучения с использованием матрицы путаницы.

Матрица путаницы (изображение автора)

Всего происходит около 95000 транзакций, из них 62 мошеннических, что крайне меньше общей суммы транзакции. Тем не менее, модель глубокого обучения работает хорошо, поскольку она способна правильно идентифицировать 52 мошенничества, что также называется истинно положительным (tp).

Имеется 1 ложное срабатывание (fp), то есть это не мошенничество, но модель неправильно пометила его как мошенничество. Таким образом, точность tp / (tp +fp) равна 98%.

Также имеется 10 ложноотрицательных результатов (fn), что означает, что это мошеннические транзакции, но наша модель не способна их предсказать. Таким образом, показатель отзыва равен tp / (tp +fn), что составляет 83%.

Архитектура глубокого обучения очень эффективна, поскольку помогает решать сложные проблемы, такие как обнаружение мошенничества. Визуальный способ анализа архитектуры глубокого обучения полезен для понимания архитектуры, а также того, как она решает проблему.

Ссылка на источник данных для синтетических наборов финансовых данных для обнаружения мошенничества

Синтетические наборы финансовых данных для обнаружения мошенничества доступны здесь: https://www.kaggle.com/competitions/spaceship-titanic/overview

Как указано в разделе Лицензия, имеет лицензию CC BY-SA 4.0.

  • Поделиться — копировать и распространять материал на любом носителе и в любом формате
  • Приспосабливать — микшировать, преобразовывать и использовать материал для любых целей, даже коммерческих.

Пожалуйста, присоединяйтесь к Medium по моей реферальной ссылке.

Пожалуйста, подписаться чтобы оставаться в курсе, когда я публикую новую историю.

Вы можете посетить мой сайт, чтобы провести аналитику без программирования. https://experiencedatascience.com

На веб-сайте вы также можете принять участие в предстоящих семинарах по искусственному интеллекту, чтобы получить интересный и инновационный опыт в области науки о данных и искусственного интеллекта.

Вот ссылка на мой канал на YouTube
https://www.youtube.com/c/DataScienceDemonstrated

Визуальное объяснение глубокого обучения. Опубликовано из источника https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 через https://towardsdatascience.com/feed

<!–

->

Отметка времени:

Больше от Блокчейн-консультанты