सुरक्षा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग का सुंदर झूठ। लंबवत खोज। ऐ.

सुरक्षा में मशीन लर्निंग का सुंदर झूठ

आपने जो पढ़ा होगा उसके विपरीत, यंत्र अधिगम (एमएल) जादू पिक्सी धूल नहीं है। सामान्य तौर पर, एमएल उपलब्ध विशाल डेटासेट के साथ संकीर्ण दायरे वाली समस्याओं के लिए अच्छा है, और जहां ब्याज के पैटर्न अत्यधिक दोहराने योग्य या अनुमानित हैं। अधिकांश सुरक्षा समस्याओं को एमएल से न तो आवश्यकता होती है और न ही लाभ। लोगों सहित कई विशेषज्ञ गूगल, सुझाव दें कि एक जटिल समस्या को हल करते समय आपको करना चाहिए अन्य सभी को समाप्त करें एमएल की कोशिश करने से पहले दृष्टिकोण।

एमएल सांख्यिकीय तकनीकों का एक व्यापक संग्रह है जो हमें किसी प्रश्न के उत्तर का अनुमान लगाने के लिए कंप्यूटर को प्रशिक्षित करने की अनुमति देता है, भले ही हमने स्पष्ट रूप से सही उत्तर को कोडित न किया हो। सही प्रकार की समस्या पर लागू एक अच्छी तरह से डिज़ाइन किया गया एमएल सिस्टम अंतर्दृष्टि को अनलॉक कर सकता है जो अन्यथा प्राप्य नहीं होता।

एक सफल एमएल उदाहरण है प्राकृतिक भाषा प्रसंस्करण
(एनएलपी)। एनएलपी कंप्यूटर को मुहावरों और रूपकों जैसी चीजों सहित मानव भाषा को "समझने" की अनुमति देता है। कई मायनों में, साइबर सुरक्षा को भाषा प्रसंस्करण जैसी ही चुनौतियों का सामना करना पड़ता है। हमलावर मुहावरों का उपयोग नहीं कर सकते हैं, लेकिन कई तकनीक समानार्थी शब्दों के समान हैं, ऐसे शब्द जिनकी वर्तनी या उच्चारण समान हैं लेकिन अलग-अलग अर्थ हैं। कुछ हमलावर तकनीकें पूरी तरह से सौम्य कारणों से एक सिस्टम व्यवस्थापक द्वारा की जाने वाली कार्रवाइयों से काफी मिलती-जुलती हैं।

आईटी वातावरण उद्देश्य, वास्तुकला, प्राथमिकता और जोखिम सहनशीलता में संगठनों में भिन्न होता है। एल्गोरिदम, एमएल या अन्यथा बनाना असंभव है, जो सभी परिदृश्यों में सुरक्षा उपयोग के मामलों को व्यापक रूप से संबोधित करता है। यही कारण है कि सुरक्षा में एमएल के सबसे सफल अनुप्रयोग एक बहुत ही विशिष्ट मुद्दे को हल करने के लिए कई तरीकों को जोड़ते हैं। अच्छे उदाहरणों में स्पैम फ़िल्टर, DDoS या bot शमन, और मैलवेयर का पता लगाना शामिल हैं।

कचरा अंदर कचरा बाहर

एमएल में सबसे बड़ी चुनौती आपकी समस्या को हल करने के लिए प्रासंगिक, प्रयोग करने योग्य डेटा की उपलब्धता है। पर्यवेक्षित एमएल के लिए, आपको एक बड़े, सही ढंग से लेबल किए गए डेटासेट की आवश्यकता होती है। एक मॉडल बनाने के लिए जो बिल्ली की तस्वीरों की पहचान करता है, उदाहरण के लिए, आप "बिल्ली" लेबल वाली बिल्लियों की कई तस्वीरों और "बिल्ली नहीं" लेबल वाली चीजों की कई तस्वीरों पर मॉडल को प्रशिक्षित करते हैं। यदि आपके पास पर्याप्त फ़ोटो नहीं हैं या उन पर खराब लेबल लगाया गया है, तो आपका मॉडल ठीक से काम नहीं करेगा।

सुरक्षा में, एक प्रसिद्ध पर्यवेक्षित एमएल उपयोग मामला हस्ताक्षर रहित मैलवेयर पहचान है। कई एंडपॉइंट प्रोटेक्शन प्लेटफॉर्म (ईपीपी) विक्रेता बड़ी मात्रा में दुर्भावनापूर्ण नमूनों और सौम्य नमूनों को लेबल करने के लिए एमएल का उपयोग करते हैं, "मैलवेयर कैसा दिखता है" पर एक मॉडल का प्रशिक्षण देता है। ये मॉडल उत्परिवर्तित उत्परिवर्तित मैलवेयर और अन्य चालबाजी की सही पहचान कर सकते हैं जहां एक फ़ाइल को हस्ताक्षर को चकमा देने के लिए पर्याप्त रूप से बदल दिया जाता है लेकिन दुर्भावनापूर्ण रहता है। एमएल हस्ताक्षर से मेल नहीं खाता। यह किसी अन्य फीचर सेट का उपयोग करके द्वेष की भविष्यवाणी करता है और अक्सर मैलवेयर को पकड़ सकता है जो हस्ताक्षर-आधारित विधियों से चूक जाते हैं।

हालाँकि, क्योंकि ML मॉडल संभाव्य हैं, एक ट्रेड-ऑफ है। एमएल मैलवेयर पकड़ सकता है जो हस्ताक्षर छूट जाता है, लेकिन यह मैलवेयर को भी याद कर सकता है जो हस्ताक्षर पकड़ते हैं। यही कारण है कि आधुनिक ईपीपी उपकरण हाइब्रिड विधियों का उपयोग करते हैं जो इष्टतम कवरेज के लिए एमएल और हस्ताक्षर-आधारित तकनीकों को जोड़ती हैं।

कुछ, कुछ, झूठी सकारात्मक

भले ही मॉडल अच्छी तरह से तैयार किया गया हो, जब आउटपुट की व्याख्या करने की बात आती है, तो एमएल कुछ अतिरिक्त चुनौतियां पेश करता है, जिनमें शामिल हैं:

  • परिणाम एक संभावना है।
    एमएल मॉडल किसी चीज की संभावना को आउटपुट करता है। यदि आपका मॉडल बिल्लियों की पहचान करने के लिए डिज़ाइन किया गया है, तो आपको "यह चीज़ 80% बिल्ली है" जैसे परिणाम प्राप्त होंगे। यह अनिश्चितता एमएल सिस्टम की एक अंतर्निहित विशेषता है और परिणाम की व्याख्या करना मुश्किल बना सकती है। क्या 80% बिल्ली पर्याप्त है?
  • मॉडल को ट्यून नहीं किया जा सकता, कम से कम अंतिम उपयोगकर्ता द्वारा नहीं। संभाव्य परिणामों को संभालने के लिए, एक उपकरण में विक्रेता-सेट थ्रेसहोल्ड हो सकते हैं जो उन्हें बाइनरी परिणामों में संक्षिप्त कर देते हैं। उदाहरण के लिए, बिल्ली-पहचान मॉडल रिपोर्ट कर सकता है कि कुछ भी> 90% "बिल्ली" एक बिल्ली है। कैट-नेस के लिए आपके व्यवसाय की सहिष्णुता विक्रेता द्वारा निर्धारित की तुलना में अधिक या कम हो सकती है।
  • झूठी नकारात्मक (एफएन), वास्तविक बुराई का पता लगाने में विफलता, एमएल मॉडल का एक दर्दनाक परिणाम है, विशेष रूप से खराब ट्यून वाले। हम झूठी सकारात्मकता (एफपी) को नापसंद करते हैं क्योंकि वे समय बर्बाद करते हैं। लेकिन एफपी और एफएन दरों के बीच एक अंतर्निहित व्यापार-बंद है। एमएल मॉडल को "सर्वश्रेष्ठ" एफपी-एफएन दर संतुलन को प्राथमिकता देते हुए, ट्रेड-ऑफ को अनुकूलित करने के लिए तैयार किया गया है। हालांकि, "सही" संतुलन संगठनों के बीच उनके व्यक्तिगत खतरे और जोखिम आकलन के आधार पर भिन्न होता है। एमएल-आधारित उत्पादों का उपयोग करते समय, आपको अपने लिए उपयुक्त सीमा का चयन करने के लिए विक्रेताओं पर भरोसा करना चाहिए।
  • अलर्ट ट्राइएज के लिए पर्याप्त संदर्भ नहीं है। एमएल जादू का एक हिस्सा डेटासेट से शक्तिशाली भविष्य कहनेवाला लेकिन मनमाना "फीचर्स" निकाल रहा है। कल्पना कीजिए कि एक बिल्ली की पहचान करना मौसम के साथ अत्यधिक सहसंबद्ध हुआ। कोई भी इंसान इस तरह तर्क नहीं करेगा। लेकिन यह एमएल की बात है - पैटर्न खोजने के लिए जो हम अन्यथा नहीं ढूंढ पाए और बड़े पैमाने पर ऐसा करने के लिए। फिर भी, भले ही भविष्यवाणी का कारण उपयोगकर्ता के सामने प्रकट हो सकता है, यह अक्सर अलर्ट ट्राइएज या घटना प्रतिक्रिया स्थिति में अनुपयोगी होता है। ऐसा इसलिए है क्योंकि "सुविधाएँ" जो अंततः एमएल सिस्टम के निर्णय को परिभाषित करती हैं, भविष्य कहनेवाला शक्ति के लिए अनुकूलित हैं, सुरक्षा विश्लेषकों के लिए व्यावहारिक प्रासंगिकता नहीं।

क्या किसी अन्य नाम से "सांख्यिकी" मीठी गंध होगी?

एमएल के पेशेवरों और विपक्षों से परे, एक और पकड़ है: सभी "एमएल" वास्तव में एमएल नहीं हैं। आंकड़े आपको अपने डेटा के बारे में कुछ निष्कर्ष देते हैं। एमएल आपके पास मौजूद डेटा के आधार पर आपके पास नहीं होने वाले डेटा के बारे में भविष्यवाणियां करता है। विपणक उत्साहपूर्वक "यंत्र अधिगम"और" कृत्रिम बुद्धि "किसी प्रकार के आधुनिक, अभिनव, उन्नत प्रौद्योगिकी उत्पाद को संकेत देने के लिए। हालाँकि, इस बात पर अक्सर बहुत कम ध्यान दिया जाता है कि क्या तकनीक भी ML का उपयोग करती है, कोई बात नहीं अगर ML सही दृष्टिकोण था।

तो, क्या एमएल ईविल का पता लगा सकता है या नहीं?

एमएल बुराई का पता लगा सकता है जब "बुराई" अच्छी तरह से परिभाषित और संकीर्ण रूप से सीमित हो। यह अत्यधिक अनुमानित प्रणालियों में अपेक्षित व्यवहार से विचलन का भी पता लगा सकता है। पर्यावरण जितना अधिक स्थिर होगा, एमएल के विसंगतियों की सही पहचान करने की संभावना उतनी ही अधिक होगी। लेकिन हर विसंगति दुर्भावनापूर्ण नहीं होती है, और ऑपरेटर हमेशा प्रतिक्रिया देने के लिए पर्याप्त संदर्भ से लैस नहीं होता है। एमएल की महाशक्ति प्रतिस्थापन में नहीं बल्कि मौजूदा तरीकों, प्रणालियों और टीमों की क्षमताओं को इष्टतम कवरेज और दक्षता के लिए विस्तारित करने में है।

समय टिकट:

से अधिक डार्क रीडिंग

(आईएससी)² कार्यबल अंतर को संबोधित करने के लिए नए कार्यक्रमों के पहले 55,000 दिनों में 30 से अधिक साइबर सुरक्षा उम्मीदवारों की भर्ती करता है

स्रोत नोड: 1705285
समय टिकट: सितम्बर 29, 2022