یادگیری عمیق به صورت تصویری توضیح داده شده است

درک یادگیری عمیق با استفاده از مثال های تصویری

عکس ژولین ترومور on می Unsplash

یادگیری عمیق یکی از قوی ترین تکنیک های هوش مصنوعی است، با این حال، درک آن می تواند دشوار باشد. در این وبلاگ سعی خواهم کرد یادگیری عمیق را با استفاده از تصاویر و مثال ها توضیح دهم.

معماری یادگیری عمیق از نحوه عملکرد مغز ما الهام گرفته شده است. این اتصال نورون ها است. مدل های یادگیری عمیق می توانند پارامترهای زیادی داشته باشند. تعداد پارامترها بر اساس تعداد لایه‌ها و نورون‌ها است که می‌توانند به صورت تصاعدی برای معماری پیچیده رشد کنند.

در این وبلاگ، یک مورد استفاده تجاری از کشف کلاهبرداری مالی را بررسی خواهم کرد. یکی از بزرگترین چالش‌ها در تشخیص تقلب، مشکل عدم تعادل طبقاتی است، به این معنی که داده‌های مورد استفاده برای آموزش مدل‌های یادگیری ماشینی موارد بسیار کمی از تقلب دارند.

معماری یادگیری عمیق (تصویر نویسنده)

مانند آموزش یک مدل یادگیری ماشینی برای یافتن سوزن در انبار کاه است. کشف تقلب مشکل خاصی است که داشتن یک رویکرد پیچیده مانند معماری یادگیری عمیق را توجیه می کند.

در مثال، داده هایی را از سیستم تراکنش های بانکی می گیرم. داده ها همانطور که در اینجا نشان داده شده به نظر می رسد. داده ها دارای نوع تراکنش مالی، مبلغ و همچنین مبدأ و مقصد موجودی قدیمی و موجودی جدید هستند. همچنین یک پرچم وجود دارد که نشان می دهد آیا معامله تقلبی بوده است یا خیر.

استناد برای مجموعه داده در انتهای وبلاگ موجود است.

داده های کشف تقلب (تصویر توسط نویسنده)

داده ها به داده های آموزشی و آزمایشی تقسیم می شوند. مدل یادگیری عمیق بر روی مجموعه آموزشی توسعه یافته و سپس بر روی داده های آزمون اعتبار سنجی می شود. سپس می توان از این مدل برای پیش بینی تقلب در داده های دیده نشده استفاده کرد.

تقسیم قطار / تست (تصویر توسط نویسنده)

مدل یادگیری عمیق برای پیش‌بینی تقلب در اینجا نشان داده شده است. نورون های ورودی با داده های تراکنش مطابقت دارند. هر نورون مربوط به یک ستون در داده های ورودی مانند نوع تراکنش، مقدار و اطلاعات موجودی در مبدا و مقصد است.

یک لایه میانی وجود دارد و سپس لایه نهایی که دارای دو نورون است که یکی غیر تقلب را پیش بینی می کند و دیگری بدون تقلب را پیش بینی می کند.

خطوط سیگنال هایی هستند که بین لایه های مختلف منتقل می شوند. یک خط سبز نشان دهنده سیگنال مثبت و یک خط قرمز نشان دهنده سیگنال منفی است

مدل یادگیری عمیق برای کشف تقلب (تصویر توسط نویسنده)

ما می بینیم که نورون 1_0 یک سیگنال مثبت به کلاهبرداری نورون می دهد.

این به این معنی است که عمیقاً یاد گرفته است که یک تراکنش تقلبی چگونه به نظر می رسد! این هیجان انگیز است!

Neuron 1_0 در حال ارسال یک سیگنال مثبت به نورون 2_1 (تقلب) (تصویر توسط نویسنده)

اجازه دهید به درون نورون 1_0 نگاه کنیم!

درون نورون 1_0 (تصویر توسط نویسنده)

نمودار رادار نمایشی از آنچه نورون در مورد داده ها آموخته است. یک خط آبی نشان دهنده مقدار زیاد و یک خط قرمز نشان دهنده مقدار کم است. نمودار رادار نشان دهنده تعادل بالا، اما تقریبا مشابه قدیمی و جدید در مبدا است. با این حال، تفاوت بسیار زیادی بین تعادل قدیمی و جدید در مقصد وجود دارد.

چنین وضعیتی نشانه تقلب است. این وضعیت را می توان به صورت بصری در زیر نشان داد.

به صورت بصری نشان می دهد که تراکنش تقلبی چگونه به نظر می رسد (تصویر توسط نویسنده)

در اینجا دقت مدل یادگیری عمیق با استفاده از ماتریس سردرگمی نشان داده شده است.

ماتریس سردرگمی (تصویر توسط نویسنده)

در مجموع حدود 95000 تراکنش وجود دارد که از این تعداد 62 تراکنش متقلبانه وجود دارد که بسیار کمتر از کل تراکنش است. با این حال، مدل یادگیری عمیق خوب عمل می کند زیرا می تواند 52 را به درستی به عنوان تقلب شناسایی کند که به آن مثبت واقعی (tp) نیز می گویند.

1 مثبت کاذب (fp) وجود دارد، به این معنی که تقلب نیست، اما مدل به اشتباه آن را به عنوان تقلب علامت گذاری کرده است. بنابراین دقت، که tp / (tp +fp) است، برابر 98٪ است.

همچنین 10 منفی کاذب (fn) وجود دارد که به این معنی است که آنها تراکنش های تقلبی هستند، اما مدل ما قادر به پیش بینی آنها نیست. بنابراین اندازه گیری به یاد آوردن که tp / (tp +fn) است که 83٪ است

معماری یادگیری عمیق بسیار قدرتمند است زیرا به حل مشکلات پیچیده مانند تشخیص تقلب کمک می کند. یک روش بصری برای تجزیه و تحلیل معماری یادگیری عمیق در درک معماری و همچنین نحوه حل مشکل مفید است

استناد منبع داده برای مجموعه داده های مالی مصنوعی برای کشف تقلب

مجموعه داده های مالی مصنوعی برای کشف تقلب در اینجا موجود است: https://www.kaggle.com/competitions/spaceship-titanic/overview

همانطور که در قسمت License مشخص شده است دارای مجوز می باشد CC BY-SA 4.0.

  • اشتراک گذاری - مطالب را در هر رسانه یا قالبی کپی و مجدداً توزیع کنید
  • انطباق - برای هر هدفی، حتی به صورت تجاری، مواد را مجدداً مخلوط کنید، تغییر دهید و بر اساس آن بسازید.

لطفا به Medium بپیوندید با لینک ارجاع من

لطفا مشترک تا هر زمان که داستان جدیدی منتشر می کنم در جریان باشم.

برای انجام تحلیل با کدنویسی صفر می توانید به وب سایت من مراجعه کنید. https://experiencedatascience.com

در وب‌سایت، می‌توانید در کارگاه‌های آینده هوش مصنوعی برای یک تجربه جالب و نوآورانه در علم داده و هوش مصنوعی شرکت کنید.

اینم لینک کانال یوتیوب من
https://www.youtube.com/c/DataScienceDemonstrated

Deep Learning Visually Explained بازنشر شده از منبع https://towardsdatascience.com/deep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 از طریق https://towardsdatascience.com/feed

<!–

->

تمبر زمان:

بیشتر از مشاوران بلاک چین