সিকিউরিটি প্ল্যাটোব্লকচেন ডেটা ইন্টেলিজেন্সে মেশিন লার্নিংয়ের সুন্দর মিথ্যা। উল্লম্ব অনুসন্ধান. আ.

নিরাপত্তার মধ্যে মেশিন লার্নিং এর সুন্দর মিথ্যা

আপনি যা পড়েছেন তার বিপরীতে, মেশিন লার্নিং (ML) ম্যাজিক পিক্সি ডাস্ট নয়। সাধারণভাবে, বিশাল ডেটাসেট উপলভ্য এবং যেখানে আগ্রহের ধরণগুলি অত্যন্ত পুনরাবৃত্তিযোগ্য বা অনুমানযোগ্য সেখানে ML সংকীর্ণ স্কোপের সমস্যাগুলির জন্য ভাল। বেশিরভাগ নিরাপত্তা সমস্যা ML এর থেকে প্রয়োজন বা সুবিধা পায় না। অনেকে সহ বিশেষজ্ঞরা গুগল, সুপারিশ করুন যে একটি জটিল সমস্যা সমাধান করার সময় আপনার উচিত অন্য সব নিষ্কাশন ML চেষ্টা করার আগে পন্থা.

ML হল পরিসংখ্যানগত কৌশলগুলির একটি বিস্তৃত সংগ্রহ যা আমাদের একটি কম্পিউটারকে একটি প্রশ্নের উত্তর অনুমান করতে প্রশিক্ষণ দিতে দেয় এমনকি যখন আমরা স্পষ্টভাবে সঠিক উত্তরটি কোড না করি। সঠিক ধরণের সমস্যায় প্রয়োগ করা একটি ভাল-পরিকল্পিত এমএল সিস্টেম অন্তর্দৃষ্টিগুলি আনলক করতে পারে যা অন্যথায় অর্জনযোগ্য হত না।

একটি সফল এমএল উদাহরণ স্বাভাবিক ভাষা প্রক্রিয়াকরণ
(এনএলপি)। এনএলপি কম্পিউটারকে মানুষের ভাষা "বুঝতে" অনুমতি দেয়, যার মধ্যে ইডিয়ম এবং রূপকের মতো জিনিস রয়েছে। বিভিন্ন উপায়ে, সাইবার নিরাপত্তা ভাষা প্রক্রিয়াকরণের মতো একই চ্যালেঞ্জের সম্মুখীন হয়। আক্রমণকারীরা বাগধারা ব্যবহার নাও করতে পারে, কিন্তু অনেক কৌশল সমজাতীয় শব্দের সাথে সাদৃশ্যপূর্ণ, যে শব্দের বানান বা উচ্চারণ একই কিন্তু ভিন্ন অর্থ। কিছু আক্রমণকারী কৌশল একইভাবে একটি সিস্টেম অ্যাডমিনিস্ট্রেটর নিখুঁতভাবে সৌম্য কারণে নিতে পারে এমন ক্রিয়াগুলির সাথে ঘনিষ্ঠভাবে সাদৃশ্যপূর্ণ।

উদ্দেশ্য, স্থাপত্য, অগ্রাধিকার, এবং ঝুঁকি সহনশীলতার ক্ষেত্রে আইটি পরিবেশগুলি বিভিন্ন সংস্থায় পরিবর্তিত হয়। অ্যালগরিদম তৈরি করা অসম্ভব, ML বা অন্যথায়, যা সমস্ত পরিস্থিতিতে নিরাপত্তা ব্যবহারের ক্ষেত্রে ব্যাপকভাবে সম্বোধন করে। এই কারণেই নিরাপত্তার ক্ষেত্রে ML-এর সর্বাধিক সফল অ্যাপ্লিকেশনগুলি একটি খুব নির্দিষ্ট সমস্যা সমাধানের জন্য একাধিক পদ্ধতিকে একত্রিত করে। ভাল উদাহরণগুলির মধ্যে স্প্যাম ফিল্টার, DDoS বা বট প্রশমন এবং ম্যালওয়্যার সনাক্তকরণ অন্তর্ভুক্ত।

আবর্জনা আবর্জনা

ML-এর সবচেয়ে বড় চ্যালেঞ্জ হল আপনার সমস্যা সমাধানের জন্য প্রাসঙ্গিক, ব্যবহারযোগ্য ডেটার উপলব্ধতা। তত্ত্বাবধানে থাকা ML-এর জন্য, আপনার একটি বড়, সঠিকভাবে লেবেলযুক্ত ডেটাসেট প্রয়োজন৷ একটি মডেল তৈরি করতে যা বিড়ালের ফটোগুলিকে শনাক্ত করে, উদাহরণস্বরূপ, আপনি মডেলটিকে "বিড়াল" লেবেলযুক্ত বিড়ালের অনেকগুলি ফটো এবং "বিড়াল নয়" লেবেলযুক্ত বিড়াল নয় এমন অনেকগুলি ফটোতে প্রশিক্ষণ দেন। আপনার যদি পর্যাপ্ত ফটো না থাকে বা সেগুলি খারাপভাবে লেবেলযুক্ত থাকে, আপনার মডেলটি ভাল কাজ করবে না৷

নিরাপত্তার ক্ষেত্রে, একটি সুপরিচিত তত্ত্বাবধানে এমএল ব্যবহারের ক্ষেত্রে স্বাক্ষরবিহীন ম্যালওয়্যার সনাক্তকরণ। অনেক এন্ডপয়েন্ট প্রোটেকশন প্ল্যাটফর্ম (EPP) বিক্রেতারা প্রচুর পরিমাণে ক্ষতিকারক নমুনা এবং সৌম্য নমুনা লেবেল করতে ML ব্যবহার করে, "ম্যালওয়্যার দেখতে কেমন" এর উপর একটি মডেলকে প্রশিক্ষণ দেয়। এই মডেলগুলি সঠিকভাবে ভুল পরিবর্তনকারী ম্যালওয়্যার এবং অন্যান্য কৌশল সনাক্ত করতে পারে যেখানে একটি ফাইল স্বাক্ষরকে ফাঁকি দেওয়ার জন্য যথেষ্ট পরিবর্তিত হয় কিন্তু দূষিত থেকে যায়। ML স্বাক্ষরের সাথে মেলে না। এটি অন্য বৈশিষ্ট্য সেট ব্যবহার করে বিদ্বেষের পূর্বাভাস দেয় এবং প্রায়শই ম্যালওয়্যার ধরতে পারে যা স্বাক্ষর-ভিত্তিক পদ্ধতিগুলি মিস করে।

যাইহোক, যেহেতু ML মডেলগুলি সম্ভাব্য, তাই একটি ট্রেড-অফ আছে। এমএল ম্যালওয়্যার ধরতে পারে যা স্বাক্ষর মিস হয়, তবে এটি স্বাক্ষর মিস করা ম্যালওয়্যারও মিস করতে পারে। এই কারণেই আধুনিক EPP সরঞ্জামগুলি হাইব্রিড পদ্ধতি ব্যবহার করে যা সর্বোত্তম কভারেজের জন্য এমএল এবং স্বাক্ষর-ভিত্তিক কৌশলগুলিকে একত্রিত করে।

কিছু, কিছু, মিথ্যা ইতিবাচক

এমনকি মডেলটি ভালভাবে তৈরি করা হলেও, আউটপুট ব্যাখ্যা করার ক্ষেত্রে এমএল কিছু অতিরিক্ত চ্যালেঞ্জ উপস্থাপন করে, যার মধ্যে রয়েছে:

  • ফলাফল একটি সম্ভাবনা.
    এমএল মডেল কিছু হওয়ার সম্ভাবনাকে আউটপুট করে। যদি আপনার মডেলটি বিড়াল সনাক্ত করার জন্য ডিজাইন করা হয়, তাহলে আপনি "এই জিনিসটি 80% বিড়াল" এর মত ফলাফল পাবেন। এই অনিশ্চয়তা ML সিস্টেমের একটি অন্তর্নিহিত বৈশিষ্ট্য এবং ফলাফলটিকে ব্যাখ্যা করা কঠিন করে তুলতে পারে। 80% বিড়াল যথেষ্ট?
  • মডেল টিউন করা যাবে না, অন্তত শেষ ব্যবহারকারী দ্বারা না. সম্ভাব্য ফলাফলগুলি পরিচালনা করার জন্য, একটি সরঞ্জামের বিক্রেতা-সেট থ্রেশহোল্ড থাকতে পারে যা সেগুলিকে বাইনারি ফলাফলে ভেঙে দেয়। উদাহরণস্বরূপ, বিড়াল-শনাক্তকরণ মডেল রিপোর্ট করতে পারে যে কিছু >90% "বিড়াল" একটি বিড়াল। বিড়াল-নেসের জন্য আপনার ব্যবসার সহনশীলতা বিক্রেতার সেটের চেয়ে বেশি বা কম হতে পারে।
  • মিথ্যা নেতিবাচক (FN), প্রকৃত মন্দ সনাক্ত করতে ব্যর্থতা, এমএল মডেলগুলির একটি বেদনাদায়ক পরিণতি, বিশেষ করে খারাপ টিউন করা। আমরা মিথ্যা ইতিবাচক (FP) অপছন্দ করি কারণ তারা সময় নষ্ট করে। কিন্তু FP এবং FN হারের মধ্যে একটি অন্তর্নিহিত ট্রেড-অফ রয়েছে। ML মডেলগুলিকে "সেরা" FP-FN রেট ব্যালেন্সকে অগ্রাধিকার দিয়ে ট্রেড-অফ অপ্টিমাইজ করার জন্য টিউন করা হয়েছে৷ যাইহোক, "সঠিক" ভারসাম্য তাদের ব্যক্তিগত হুমকি এবং ঝুঁকি মূল্যায়নের উপর নির্ভর করে সংস্থাগুলির মধ্যে পরিবর্তিত হয়। ML-ভিত্তিক পণ্য ব্যবহার করার সময়, আপনার জন্য উপযুক্ত থ্রেশহোল্ড নির্বাচন করতে আপনাকে অবশ্যই বিক্রেতাদের বিশ্বাস করতে হবে।
  • সতর্কতা ট্রাইজের জন্য যথেষ্ট প্রসঙ্গ নেই। এমএল ম্যাজিকের একটি অংশ ডেটাসেট থেকে শক্তিশালী ভবিষ্যদ্বাণীমূলক কিন্তু নির্বিচারে "বৈশিষ্ট্য" বের করছে। কল্পনা করুন যে একটি বিড়াল সনাক্তকরণ আবহাওয়ার সাথে অত্যন্ত সম্পর্কযুক্ত। কোন মানুষ এই ভাবে যুক্তি হবে না. কিন্তু এই হল ML-এর বিন্দু — প্যাটার্নগুলি খুঁজে বের করার জন্য যা আমরা অন্যথায় খুঁজে পাইনি এবং স্কেলে তা করতে পারি। তবুও, ভবিষ্যদ্বাণীর কারণ ব্যবহারকারীর কাছে প্রকাশ করা গেলেও, এটি প্রায়শই একটি সতর্কতা ট্রাইজে বা ঘটনা প্রতিক্রিয়া পরিস্থিতিতে অসহায়। এর কারণ হল "বৈশিষ্ট্যগুলি" যা শেষ পর্যন্ত ML সিস্টেমের সিদ্ধান্তকে সংজ্ঞায়িত করে সেগুলি ভবিষ্যদ্বাণী করার ক্ষমতার জন্য অপ্টিমাইজ করা হয়, নিরাপত্তা বিশ্লেষকদের কাছে ব্যবহারিক প্রাসঙ্গিকতা নয়।

অন্য কোন নামের দ্বারা "পরিসংখ্যান" মিষ্টি হিসাবে গন্ধ হবে?

ML-এর ভালো-মন্দের বাইরে, আরও একটি ধরা আছে: সমস্ত "ML" সত্যিই ML নয়। পরিসংখ্যান আপনাকে আপনার ডেটা সম্পর্কে কিছু সিদ্ধান্ত দেয়। ML আপনার কাছে থাকা ডেটার উপর ভিত্তি করে আপনার কাছে নেই এমন ডেটা সম্পর্কে ভবিষ্যদ্বাণী করে। বিপণনকারীরা উত্সাহের সাথে "মেশিন লার্নিং"এবং "কৃত্রিম বুদ্ধিমত্তা" একটি আধুনিক, উদ্ভাবনী, কোনো ধরনের উন্নত প্রযুক্তি পণ্যের সংকেত দিতে। যাইহোক, প্রযুক্তি এমনকি এমএল ব্যবহার করে কিনা সে সম্পর্কে প্রায়শই খুব কম বিবেচনা করা হয়, এমএল সঠিক পদ্ধতি ছিল কিনা তা মনে করবেন না।

সুতরাং, এমএল কি মন্দ সনাক্ত করতে পারে বা না?

ML মন্দ শনাক্ত করতে পারে যখন "মন্দ" ভালভাবে সংজ্ঞায়িত এবং সংকীর্ণভাবে ব্যাপ্ত হয়। এটি অত্যন্ত অনুমানযোগ্য সিস্টেমে প্রত্যাশিত আচরণ থেকে বিচ্যুতি সনাক্ত করতে পারে। পরিবেশ যত স্থিতিশীল হবে, এমএল সঠিকভাবে অসঙ্গতি সনাক্ত করার সম্ভাবনা তত বেশি। কিন্তু প্রতিটি অসঙ্গতি দূষিত নয়, এবং অপারেটর সবসময় প্রতিক্রিয়া জানাতে যথেষ্ট প্রসঙ্গ দিয়ে সজ্জিত হয় না। এমএল-এর পরাশক্তি প্রতিস্থাপন নয় বরং সর্বোত্তম কভারেজ এবং দক্ষতার জন্য বিদ্যমান পদ্ধতি, সিস্টেম এবং দলগুলির ক্ষমতা প্রসারিত করা।

সময় স্ট্যাম্প:

থেকে আরো অন্ধকার পড়া

(ISC)² কর্মশক্তির ব্যবধান পূরণের জন্য নতুন প্রোগ্রামের প্রথম 55,000 দিনের মধ্যে 30 টিরও বেশি সাইবার নিরাপত্তা প্রার্থীকে নিয়োগ করেছে

উত্স নোড: 1705285
সময় স্ট্যাম্প: সেপ্টেম্বর 29, 2022