गहन शिक्षण की दृश्यात्मक व्याख्या

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

दृश्य उदाहरणों का उपयोग करके गहन शिक्षण को समझना

डीप लर्निंग सबसे शक्तिशाली एआई तकनीकों में से एक है, हालांकि, इसे समझना मुश्किल हो सकता है। इस ब्लॉग में, मैं दृश्यों और उदाहरणों का उपयोग करके गहन शिक्षण को समझाने का प्रयास करूंगा।

गहन शिक्षण वास्तुकला इस बात से प्रेरित है कि हमारा मस्तिष्क कैसे काम करता है। यह न्यूरॉन्स का एक कनेक्शन है. डीप लर्निंग मॉडल में कई पैरामीटर हो सकते हैं। मापदंडों की संख्या परतों और न्यूरॉन्स की संख्या पर आधारित है, जो परिष्कृत वास्तुकला के लिए तेजी से बढ़ सकती है।

इस ब्लॉग में, मैं वित्तीय धोखाधड़ी का पता लगाने का व्यावसायिक उपयोग का मामला लूंगा। धोखाधड़ी का पता लगाने में सबसे बड़ी चुनौतियों में से एक वर्ग असंतुलन की समस्या है, जिसका अर्थ है कि मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटा में धोखाधड़ी के बहुत कम मामले होते हैं।

यह भूसे के ढेर में सुई ढूंढने के लिए मशीन लर्निंग मॉडल को प्रशिक्षित करने जैसा है। धोखाधड़ी का पता लगाना एक विशेष समस्या है जो गहन शिक्षण वास्तुकला जैसे परिष्कृत दृष्टिकोण को उचित ठहराती है।

उदाहरण में, मैं बैंकिंग लेनदेन प्रणाली से डेटा लूंगा। डेटा वैसा ही दिखता है जैसा यहां दिखाया गया है। डेटा में वित्तीय लेनदेन का प्रकार, राशि, साथ ही मूल और गंतव्य पुराना शेष और नया शेष शामिल है। एक ध्वज भी है जो बताता है कि लेनदेन धोखाधड़ीपूर्ण था या नहीं।

डेटासेट का उद्धरण ब्लॉग के अंत में उपलब्ध है।

धोखाधड़ी का पता लगाने वाला डेटा (लेखक द्वारा छवि)

डेटा को प्रशिक्षण और परीक्षण डेटा में विभाजित किया गया है। गहन शिक्षण मॉडल को प्रशिक्षण सेट पर विकसित किया जाता है और फिर इसे परीक्षण डेटा पर मान्य किया जाता है। फिर इस मॉडल का उपयोग अनदेखे डेटा पर धोखाधड़ी की भविष्यवाणी करने के लिए किया जा सकता है।

धोखाधड़ी की भविष्यवाणी के लिए गहन शिक्षण मॉडल यहां दिखाया गया है। इनपुट न्यूरॉन्स लेनदेन डेटा के अनुरूप हैं। प्रत्येक न्यूरॉन इनपुट डेटा में एक कॉलम से मेल खाता है जैसे कि लेनदेन का प्रकार, राशि और मूल और गंतव्य पर शेष जानकारी।

एक मध्यवर्ती परत होती है और फिर अंतिम परत होती है जिसमें दो न्यूरॉन्स होते हैं, एक जो गैर-धोखाधड़ी की भविष्यवाणी करता है और दूसरा जो धोखाधड़ी न होने की भविष्यवाणी करता है।

लाइनें विभिन्न परतों के बीच पारित सिग्नल हैं। हरी रेखा सकारात्मक संकेत दर्शाती है और लाल रेखा नकारात्मक संकेत दर्शाती है

धोखाधड़ी का पता लगाने के लिए गहन शिक्षण मॉडल (लेखक द्वारा छवि)

हम देखते हैं कि न्यूरॉन 1_0 न्यूरॉन फ्रॉड को एक सकारात्मक संकेत भेज रहा है।

इसका मतलब यह है कि इसने गहराई से जान लिया है कि धोखाधड़ी वाला लेनदेन कैसा दिखता है! यह रोमांचक है !

न्यूरॉन 1_0 न्यूरॉन 2_1 को एक सकारात्मक संकेत भेज रहा है (धोखाधड़ी) (लेखक द्वारा छवि)

आइए न्यूरॉन 1_0 के अंदर देखें!

रडार चार्ट इस बात का प्रतिनिधित्व करता है कि न्यूरॉन ने डेटा के बारे में क्या सीखा है। एक नीली रेखा उच्च मान को इंगित करती है, और एक लाल रेखा कम मान को इंगित करती है। रडार चार्ट एक उच्च, लेकिन मूल पर लगभग समान पुराने और नए संतुलन को इंगित करता है। हालाँकि, गंतव्य पर पुराने और नए संतुलन के बीच बहुत बड़ा अंतर है।

ऐसी स्थिति धोखाधड़ी का संकेत है. इस स्थिति को नीचे स्पष्ट रूप से दिखाया जा सकता है।

दृश्य रूप से दिखा रहा है कि धोखाधड़ी वाला लेनदेन कैसा दिखता है (लेखक द्वारा छवि)

यहां कन्फ्यूजन मैट्रिक्स का उपयोग करके गहन शिक्षण मॉडल की सटीकता दिखाई गई है।

कुल मिलाकर, लगभग 95000 लेनदेन हैं, जिनमें से 62 धोखाधड़ी वाले लेनदेन हैं, जो कुल लेनदेन से बेहद कम है। हालाँकि, डीप-लर्निंग मॉडल अच्छा कर रहा है क्योंकि यह 52 को धोखाधड़ी के रूप में सही ढंग से पहचानने में सक्षम है, जिसे ट्रू पॉजिटिव (टीपी) भी कहा जाता है।

1 गलत सकारात्मक (एफपी) है, जिसका अर्थ है, यह धोखाधड़ी नहीं है, लेकिन मॉडल ने गलती से इसे धोखाधड़ी के रूप में चिह्नित किया है। तो परिशुद्धता, जो कि tp / (tp +fp) है, 98% के बराबर है।

इसके अलावा, 10 गलत नकारात्मक (एफएन) हैं, जिसका अर्थ है कि वे धोखाधड़ी वाले लेनदेन हैं, लेकिन हमारा मॉडल उनकी भविष्यवाणी करने में सक्षम नहीं है। तो माप रिकॉल जो कि tp / (tp +fn) है जो 83% है

डीप लर्निंग आर्किटेक्चर बहुत शक्तिशाली है क्योंकि यह धोखाधड़ी का पता लगाने जैसी जटिल समस्याओं को हल करने में मदद करता है। गहन शिक्षण वास्तुकला का विश्लेषण करने का एक दृश्य तरीका वास्तुकला को समझने के साथ-साथ समस्या को कैसे हल करता है, यह समझने में उपयोगी है

धोखाधड़ी का पता लगाने के लिए सिंथेटिक वित्तीय डेटासेट के लिए डेटास्रोत उद्धरण

धोखाधड़ी का पता लगाने के लिए सिंथेटिक वित्तीय डेटासेट का डेटा यहां उपलब्ध है: https://www.kaggle.com/competitions/spaceship-titanic/overview

जैसा कि लाइसेंस अनुभाग में निर्दिष्ट है, इसका लाइसेंस है सीसी द्वारा एसए 4.0.

Share — सामग्री को किसी भी माध्यम या प्रारूप में कॉपी और पुनर्वितरित करें
अनुकूल बनाना - व्यावसायिक रूप से भी, किसी भी उद्देश्य के लिए सामग्री पर रीमिक्स, ट्रांसफॉर्म और निर्माण।

कृपया माध्यम से जुड़ें मेरे रेफ़रल लिंक के साथ.

कृपया सदस्यता के जब भी मैं कोई नई कहानी जारी करूं तो सूचित रहूं।

शून्य कोडिंग के साथ विश्लेषण करने के लिए आप मेरी वेबसाइट पर जा सकते हैं। https://experiencedatascience.com

वेबसाइट पर, आप दिलचस्प और नवीन डेटा विज्ञान और एआई अनुभव के लिए आगामी एआई कार्यशालाओं में भी भाग ले सकते हैं।

यहां मेरे यूट्यूब चैनल का लिंक है
https://www.youtube.com/c/DataScienceDemonstrated

डीप लर्निंग विज़ुअली एक्सप्लेनड स्रोत से पुनर्प्रकाशित https://towardsdatascience.com/dep-learning-visually-explained-a9fff874d280?source=rss—-7f60cf5620c9—4 https://towardsdatascience.com/feed के माध्यम से

<!–

समय टिकट: नवम्बर 7/2022नवम्बर 7/2022