Amazon Recognition PlatoBlockchain Data Intelligence کے ساتھ مالویئر کا پتہ لگانا اور درجہ بندی۔ عمودی تلاش۔ عی

ایمیزون ریکگنیشن کے ساتھ مالویئر کا پتہ لگانا اور درجہ بندی

ایک کے مطابق مضمون سائبرسیکیوریٹی وینچرز کی طرف سے، رینسم ویئر (ایک قسم کا مالویئر جو صارفین کو ان کے ڈیٹا تک رسائی سے روک سکتا ہے جب تک کہ وہ تاوان ادا نہ کریں) کی وجہ سے ہونے والے نقصان میں 57 کے مقابلے میں 2021 میں 2015 گنا اضافہ ہوا۔ مزید برآں، اس کے متاثرین کو $265 بلین لاگت آنے کی پیش گوئی کی گئی ہے۔ USD) سالانہ 2031 تک۔ لکھنے کے وقت، Ransomware حملوں سے مالی نقصان صرف 50 سے اوپر آتا ہے۔th ان کے حساب سے درجہ بندی کرنے والے ممالک کی فہرست میں پوزیشن جی ڈی پی.

میلویئر سے لاحق خطرے کو دیکھتے ہوئے، میلویئر حملوں کا پتہ لگانے اور ان پر قابو پانے کے لیے کئی تکنیکیں تیار کی گئی ہیں۔ آج استعمال ہونے والی دو سب سے عام تکنیک ہیں دستخط اور رویے پر مبنی پتہ لگانا۔

دستخط کی بنیاد پر پتہ لگانے سے معلوم نقصاندہ چیز کے بارے میں ایک منفرد شناخت کنندہ قائم ہوتا ہے تاکہ مستقبل میں اس چیز کی شناخت کی جا سکے۔ یہ کسی فائل کے ساتھ منسلک کوڈ کا انوکھا نمونہ ہو سکتا ہے، یا یہ کسی معروف میلویئر کوڈ کا ہیش ہو سکتا ہے۔ اگر نئی اشیاء کو اسکین کرتے وقت معلوم پیٹرن شناخت کنندہ (دستخط) دریافت ہوتا ہے، تو آبجیکٹ کو نقصان دہ کے طور پر نشان زد کیا جاتا ہے۔ دستخط کی بنیاد پر پتہ لگانا تیز ہے اور اس کے لیے کم کمپیوٹ پاور کی ضرورت ہوتی ہے۔ تاہم، یہ پولیمورفک میلویئر کی اقسام کے خلاف جدوجہد کرتا ہے، جو پتہ لگانے سے بچنے کے لیے اپنی شکل کو مسلسل بدلتی رہتی ہیں۔

رویے کی بنیاد پر پتہ لگانے سے مشکوک اشیاء کا ان کے رویے کی بنیاد پر فیصلہ کیا جاتا ہے۔ اینٹی میلویئر پروڈکٹس کے ذریعے جن نمونوں پر غور کیا جا سکتا ہے وہ ہیں پروسیس انٹریکشنز، ڈی این ایس کے سوالات، اور آبجیکٹ سے نیٹ ورک کنکشن۔ یہ تکنیک دستخط پر مبنی کے مقابلے میں پولیمورفک میلویئر کا پتہ لگانے میں بہتر کارکردگی کا مظاہرہ کرتی ہے، لیکن اس کے کچھ نشیب و فراز ہیں۔ اس بات کا اندازہ لگانے کے لیے کہ آیا کوئی چیز بدنیتی پر مبنی ہے، اسے میزبان پر چلنا چاہیے اور اس کا پتہ لگانے کے لیے اینٹی میلویئر پروڈکٹ کے لیے کافی نمونے تیار کرنا چاہیے۔ یہ نابینا جگہ میلویئر کو میزبان کو متاثر کرنے اور نیٹ ورک کے ذریعے پھیلنے دے سکتی ہے۔

موجودہ تکنیک کامل سے دور ہیں۔ نتیجے کے طور پر، نئی متبادل تکنیکوں کو تیار کرنے کے مقصد کے ساتھ تحقیق جاری ہے جو میلویئر کے خلاف لڑنے کے لیے ہماری صلاحیتوں کو بہتر بنائے گی۔ حالیہ برسوں میں ابھرنے والی ایک نئی تکنیک تصویر پر مبنی میلویئر کا پتہ لگانا ہے۔ یہ تکنیک گرے اسکیل امیجز میں تبدیل شدہ مالویئر بائنریز کے ساتھ گہرے سیکھنے والے نیٹ ورک کو تربیت دینے کی تجویز کرتی ہے۔ اس پوسٹ میں، ہم تصویر پر مبنی میلویئر کا پتہ لگانے کا طریقہ دکھاتے ہیں۔ ایمیزون پہچان۔ کسٹم لیبلز.

حل جائزہ

کثیر درجہ بندی کے ماڈل اور میلویئر کا پتہ لگانے والے ماڈل کو تربیت دینے کے لیے، ہم سب سے پہلے ٹریننگ اور ٹیسٹ ڈیٹا سیٹس تیار کرتے ہیں جس میں مالویئر کی مختلف اقسام جیسے فلڈر، ایڈویئر، اسپائی ویئر، وغیرہ کے ساتھ ساتھ بے نظیر اشیاء شامل ہیں۔ اس کے بعد ہم پورٹیبل ایگزیکیوٹیبل (PE) اشیاء کو گرے اسکیل امیجز میں تبدیل کرتے ہیں۔ اگلا، ہم Amazon Recognition کے ساتھ تصاویر کا استعمال کرتے ہوئے ایک ماڈل کو تربیت دیتے ہیں۔

Amazon Recognition ایک ایسی سروس ہے جو آپ کی ایپلی کیشنز پر مختلف قسم کے بصری تجزیہ کرنا آسان بناتی ہے۔ شناخت کی تصویر آپ کو لاکھوں تصاویر کو تلاش کرنے، تصدیق کرنے اور ترتیب دینے کے لیے طاقتور ایپلیکیشنز بنانے میں مدد کرتی ہے۔

Amazon Recognition Custom Labels Recognition کی موجودہ صلاحیتوں کو تیار کرتا ہے، جو پہلے ہی کئی زمروں میں دسیوں ملین تصاویر پر تربیت یافتہ ہیں۔

Amazon Recognition Custom Labels ایک مکمل طور پر منظم سروس ہے جو صارفین کو لاکھوں تصاویر کا تجزیہ کرنے اور مشین لرننگ (ML) کے بہت سے مختلف مسائل کو حل کرنے کے لیے استعمال کرنے دیتی ہے، بشمول تصویر کی درجہ بندی، چہرے کا پتہ لگانا، اور مواد میں اعتدال۔ پردے کے پیچھے، Amazon Recognition ایک گہری سیکھنے والی ٹیکنالوجی پر مبنی ہے۔ سروس ایک کنوولوشن نیورل نیٹ ورک (CNN) کو ملازمت دیتی ہے، جو ایک بڑے لیبل والے ڈیٹاسیٹ پر پہلے سے تربیت یافتہ ہے۔ اس طرح کے زمینی سچائی کے اعداد و شمار کے سامنے آنے سے، الگورتھم بہت سے مختلف ڈومینز سے تصاویر میں پیٹرن کو پہچاننا سیکھ سکتا ہے اور صنعت کے استعمال کے بہت سے معاملات میں استعمال کیا جا سکتا ہے۔ چونکہ AWS ماڈل آرکیٹیکچر کی تعمیر اور دیکھ بھال اور ہاتھ میں کام کے لیے مناسب تربیتی طریقہ منتخب کرنے کی ملکیت لیتا ہے، اس لیے صارفین کو تربیتی کاموں کے لیے درکار بنیادی ڈھانچے کا انتظام کرنے میں وقت گزارنے کی ضرورت نہیں ہے۔

حل فن تعمیر

مندرجہ ذیل فن تعمیر کا خاکہ حل کا ایک جائزہ فراہم کرتا ہے۔

حل کا استعمال کرتے ہوئے بنایا گیا ہے۔ AWS بیچ, اے ڈبلیو ایس فارگیٹ، اور ایمیزون پہچان۔. AWS بیچ آپ کو فارگیٹ پر سینکڑوں بیچ کمپیوٹنگ جابز چلانے دیتا ہے۔ Fargate دونوں کے ساتھ مطابقت رکھتا ہے۔ ایمیزون لچکدار کنٹینر سروس (ایمیزون ای سی ایس) اور ایمیزون لچکدار کبرنیٹس سروس (ایمیزون ای کے ایس). ایمیزون ریکگنیشن کسٹم لیبلز آپ کو کمپیوٹر ویژن کے لیے آٹو ایم ایل کا استعمال کرنے دیتے ہیں تاکہ میلویئر کا پتہ لگانے اور میلویئر کے مختلف زمروں کی درجہ بندی کرنے کے لیے حسب ضرورت ماڈلز کو تربیت دی جا سکے۔ AWS اسٹیپ فنکشنز کو ڈیٹا پری پروسیسنگ آرکیسٹریٹ کرنے کے لیے استعمال کیا جاتا ہے۔

اس حل کے لیے، ہم پری پروسیسنگ وسائل کے ذریعے تخلیق کرتے ہیں۔ AWS کلاؤڈ فارمیشن. CloudFormation اسٹیک ٹیمپلیٹ اور AWS بیچ، Fargate، اور Step فنکشنز کے لیے سورس کوڈ ایک میں دستیاب ہیں۔ GitHub ذخیرہ.

ڈیٹا بیس

اس مثال میں ماڈل کو تربیت دینے کے لیے، ہم نے نقصان دہ اور بے نظیر کو نکالنے کے لیے درج ذیل عوامی ڈیٹا سیٹس کا استعمال کیا۔ پورٹ ایبل ایگزیکیوٹیبل (PE):

ہم آپ کو ڈیٹاسیٹس کی دستاویزات کے ذریعے غور سے پڑھنے کی ترغیب دیتے ہیں (سوفوس/ریورسنگ لیبز README، PE میلویئر مشین لرننگ ڈیٹا سیٹ) میلویئر اشیاء کو محفوظ طریقے سے ہینڈل کرنے کے لیے۔ آپ کی ترجیح کی بنیاد پر، آپ دوسرے ڈیٹا سیٹس کو بھی استعمال کر سکتے ہیں جب تک کہ وہ بائنری فارمیٹ میں میلویئر اور سومی اشیاء فراہم کرتے ہیں۔

اگلا، ہم آپ کو حل کے درج ذیل مراحل سے گزریں گے:

  • اشیاء کو پری پروسیس کریں اور تصاویر میں تبدیل کریں۔
  • CloudFormation کے ساتھ پری پروسیسنگ وسائل کو تعینات کریں۔
  • ماڈل کا انتخاب کریں۔
  • ماڈل کو تربیت دیں۔
  • ماڈل کا اندازہ لگائیں۔
  • لاگت اور کارکردگی

اشیاء کو پری پروسیس کریں اور تصاویر میں تبدیل کریں۔

ہم اسٹیپ فنکشنز کا استعمال آبجیکٹ پری پروسیسنگ ورک فلو کو ترتیب دینے کے لیے کرتے ہیں جس میں درج ذیل اقدامات شامل ہیں:

  1. لے لو meta.db sqllite ڈیٹا بیس سے sorel-20m S3 بالٹی اور اسے .csv فائل میں تبدیل کریں۔ اس سے ہمیں .csv فائل کو Fargate کنٹینر میں لوڈ کرنے اور میلویئر اشیاء پر کارروائی کے دوران میٹا ڈیٹا کا حوالہ دینے میں مدد ملتی ہے۔
  2. sorel-20m S3 بالٹی سے اشیاء لیں اور csv فارمیٹ میں اشیاء کی فہرست بنائیں۔ اس قدم کو انجام دے کر، ہم .csv فائلوں کی ایک سیریز بنا رہے ہیں جن پر متوازی کارروائی کی جا سکتی ہے، اس طرح پری پروسیسنگ میں لگنے والے وقت کو کم کیا جا سکتا ہے۔
  3. sorel-20m S3 بالٹی سے اشیاء کو کام کی ایک صف کے ساتھ تصاویر میں تبدیل کریں۔ میلویئر اشیاء کو امیجز میں تبدیل کرنے کے لیے AWS Batch array جابز مشترکہ پیرامیٹرز کا اشتراک کرتی ہیں۔ وہ تصویری تبدیلی کی ملازمتوں کے مجموعے کے طور پر چلتے ہیں جو متعدد میزبانوں میں تقسیم ہوتے ہیں، اور ساتھ ساتھ چلتے ہیں۔
  4. میلویئر کے زمروں سے مطابقت رکھنے والی ملازمتوں کی ایک صف کے ساتھ ماڈل ٹریننگ کے لیے پہلے سے طے شدہ تعداد میں تصاویر منتخب کریں۔
  5. مرحلہ 2 کی طرح، ہم benign-160k S3 بالٹی سے سومی اشیاء لیتے ہیں اور csv فارمیٹ میں اشیاء کی فہرست بناتے ہیں۔
  6. مرحلہ 3 کی طرح، ہم benign-160k S3 بالٹی سے اشیاء کو ملازمتوں کی ایک صف کے ساتھ تصاویر میں تبدیل کرتے ہیں۔
  7. حسب ضرورت لیبلز کی تربیت (250K تصاویر) کے لیے Amazon Recognition ڈیفالٹ کوٹہ کی وجہ سے، ماڈل ٹریننگ کے لیے پہلے سے متعین تعداد میں بے نظیر تصاویر چنیں۔
  8. جیسا کہ مندرجہ ذیل تصویر میں دکھایا گیا ہے، تصاویر کو پہلے میلویئر اور بے نائن فولڈرز کے ذریعے تقسیم کردہ S3 بالٹی میں محفوظ کیا جاتا ہے، اور پھر اس کے بعد میلویئر کو میلویئر کی اقسام کے ذریعے تقسیم کیا جاتا ہے۔
    ٹریننگ S3 بالٹی
    ٹریننگ ڈیٹاسیٹ

CloudFormation کے ساتھ پری پروسیسنگ وسائل کو تعینات کریں۔

شرائط

جاری رکھنے سے پہلے درج ذیل شرائط درکار ہیں:

وسائل کی تعیناتی۔

CloudFormation اسٹیک مندرجہ ذیل وسائل پیدا کرے گا:

پیرامیٹر

  • STACK_NAME - کلاؤڈ فارمیشن اسٹیک کا نام
  • AWS_REGION - AWS خطہ جہاں حل تعینات کیا جائے گا۔
  • AWS_PROFILE - نامی پروفائل جو AWS CLI کمانڈ پر لاگو ہوگا۔
  • ARTEFACT_S3_BUCKET - S3 بالٹی جہاں انفراسٹرکچر کوڈ محفوظ کیا جائے گا۔ (بالٹی کو اسی خطے میں بنایا جانا چاہئے جہاں حل رہتا ہے)۔
  • AWS_ACCOUNT - AWS اکاؤنٹ ID۔

وسائل کی تعیناتی کے لیے درج ذیل کمانڈز کا استعمال کریں۔

یقینی بنائیں کہ ڈوکر ایجنٹ مشین پر چل رہا ہے۔ تعیناتیاں bash اسکرپٹس کا استعمال کرتے ہوئے کی جاتی ہیں، اور اس صورت میں ہم درج ذیل کمانڈ استعمال کرتے ہیں:

bash malware_detection_deployment_scripts/deploy.sh -s '' -b 'malware-
detection--artifacts' -p  -r "" -a

یہ مقامی نمونے بناتا اور تعینات کرتا ہے جن کا کلاؤڈ فارمیشن ٹیمپلیٹ (مثال کے طور پر، cloudformation.yaml) حوالہ دے رہا ہے۔

ماڈل کو تربیت دیں۔

چونکہ Amazon Recognition آپ کے لیے ماڈل ٹریننگ کا خیال رکھتا ہے، اس لیے کمپیوٹر ویژن یا انتہائی مہارت یافتہ ML علم کی ضرورت نہیں ہے۔ تاہم، آپ کو مناسب طور پر لیبل والی ان پٹ امیجز سے بھری ہوئی بالٹی کے ساتھ Amazon Recognition فراہم کرنے کی ضرورت ہوگی۔

اس پوسٹ میں، ہم حسب ضرورت لیبل خصوصیت کے ذریعے دو آزاد تصویری درجہ بندی کے ماڈلز کو تربیت دیں گے:

  1. مالویئر کا پتہ لگانے کا ماڈل (بائنری درجہ بندی) - شناخت کریں کہ آیا دی گئی چیز بدنیتی پر مبنی ہے یا سومی
  2. میلویئر کی درجہ بندی کا ماڈل (ملٹی کلاس درجہ بندی) - دی گئی نقصان دہ چیز کے لیے میلویئر فیملی کی شناخت کریں

ماڈل ٹریننگ واک تھرو

درج ذیل واک تھرو میں درج مراحل دونوں ماڈلز پر لاگو ہوتے ہیں۔ لہذا، دونوں ماڈلز کو تربیت دینے کے لیے آپ کو دو بار مراحل سے گزرنا پڑے گا۔

  1. میں سائن ان کریں AWS مینجمنٹ کنسول اور Amazon Recognition کھولیں۔ دلاسا.
  2. بائیں پین میں، منتخب کریں۔ حسب ضرورت لیبل استعمال کریں۔. Amazon Recognition Custom Labels کا لینڈنگ صفحہ دکھایا گیا ہے۔
  3. Amazon Recognition Custom Labels کے لینڈنگ پیج سے، منتخب کریں۔ شروع کریں.
  4. بائیں پین میں، منتخب کریں۔ منصوبوں کی تفصیل.
  5. میں سے انتخاب کریں پروجیکٹ بنائیں.
  6. In پروجیکٹ کا ناماپنے پروجیکٹ کے لیے ایک نام درج کریں۔
  7. میں سے انتخاب کریں منصوبے بنائیں اپنے منصوبے کو بنانے کے لیے۔
  8. میں منصوبوں کی تفصیل صفحہ، وہ پروجیکٹ منتخب کریں جس میں آپ ڈیٹاسیٹ شامل کرنا چاہتے ہیں۔ آپ کے پروجیکٹ کی تفصیلات کا صفحہ ظاہر ہوتا ہے۔
  9. میں سے انتخاب کریں ڈیٹاسیٹ بنائیں. ڈیٹاسیٹ بنائیں صفحہ دکھایا گیا ہے.
  10. In ترتیب شروع ہو رہی ہے۔منتخب کریں ایک ڈیٹا سیٹ کے ساتھ شروع کریں۔ ایمیزون ریکوگنیشن کو ڈیٹاسیٹ کو تربیت اور جانچ کے لیے تقسیم کرنے دیں۔ نوٹ کریں کہ آپ کو ہر ماڈل ٹریننگ تکرار میں مختلف ٹیسٹ کے نمونے مل سکتے ہیں، جس کے نتیجے میں نتائج اور تشخیصی میٹرکس قدرے مختلف ہوں گے۔
  11. میں سے انتخاب کریں ایمیزون S3 بالٹی سے تصاویر درآمد کریں۔.
  12. In S3 URIS3 بالٹی کا مقام اور فولڈر کا راستہ درج کریں۔ پری پروسیسنگ مرحلے سے فراہم کردہ وہی S3 بالٹی دونوں ڈیٹا سیٹ بنانے کے لیے استعمال ہوتی ہے: میلویئر کا پتہ لگانے اور مالویئر کی درجہ بندی۔ میلویئر کا پتہ لگانے والا ڈیٹا سیٹ جڑ کی طرف اشارہ کرتا ہے (یعنی، s3://malware-detection-training-{account-id}-{region}/S3 بالٹی کی، جبکہ میلویئر کی درجہ بندی ڈیٹاسیٹ میلویئر فولڈر کی طرف اشارہ کرتا ہے (یعنی، s3://malware-detection-training-{account-id}-{region}/malwareS3 بالٹی کی )۔ تربیت کا ڈیٹا
  13. میں سے انتخاب کریں فولڈر کی بنیاد پر تصاویر کے ساتھ خودکار طور پر لیبل منسلک کریں۔.
  14. میں سے انتخاب کریں ڈیٹاسیٹس بنائیں. آپ کے پروجیکٹ کے لیے ڈیٹا سیٹس کا صفحہ کھلتا ہے۔
  15. پر ٹرین ماڈل صفحہ، منتخب کریں ٹرین ماڈل. آپ کے پروجیکٹ کے لیے ایمیزون ریسورس کا نام (ARN) میں ہونا چاہیے۔ پروجیکٹ کا انتخاب کریں۔ ترمیم باکس. اگر نہیں، تو اپنے پروجیکٹ کے لیے ARN درج کریں۔
  16. میں کیا آپ اپنے ماڈل کو تربیت دینا چاہتے ہیں؟ ڈائیلاگ باکس، منتخب کریں ٹرین ماڈل.
  17. تربیت مکمل ہونے کے بعد، ماڈل کا نام منتخب کریں۔ ٹریننگ ختم ہو جاتی ہے جب ماڈل کا درجہ ہوتا ہے۔ TRAINING_COMPLETED.
  18. میں ماڈل سیکشن، منتخب کریں ماڈل استعمال کریں ماڈل کا استعمال شروع کرنے کے لیے ٹیب۔

مزید تفصیلات کے لیے، Amazon Recognition کے کسٹم لیبلز کو چیک کریں۔ شروع رہنما.

ماڈل کا اندازہ لگائیں۔

جب تربیتی ماڈل مکمل ہو جائیں، تو آپ انتخاب کر کے تشخیصی میٹرکس تک رسائی حاصل کر سکتے ہیں۔ میٹرکس چیک کریں۔ ماڈل کے صفحے پر. Amazon Recognition آپ کو درج ذیل میٹرکس فراہم کرتا ہے: F1 سکور، اوسط درستگی، اور مجموعی طور پر یاد، جو عام طور پر درجہ بندی کے ماڈلز کی کارکردگی کو جانچنے کے لیے استعمال ہوتے ہیں۔ مؤخر الذکر لیبلز کی تعداد پر اوسط میٹرکس ہیں۔

میں فی لیبل کارکردگی سیکشن، آپ فی لیبل ان میٹرکس کی قدریں تلاش کر سکتے ہیں۔ مزید برآں، صحیح مثبت، غلط مثبت، اور غلط منفی کی قدریں حاصل کرنے کے لیے، منتخب کریں ٹیسٹ کے نتائج دیکھیں.

میلویئر کا پتہ لگانے کے ماڈل میٹرکس

دو لیبلز کے ساتھ 199,750 امیجز کے متوازن ڈیٹاسیٹ پر (معمولی اور میلویئر)، ہمیں درج ذیل نتائج موصول ہوئے:

  • F1 سکور - 0.980
  • اوسط درستگی - 0.980
  • مجموعی طور پر یاد کرنا - 0.980

میلویئر کا پتہ لگانے کے ماڈل میٹرکس

میلویئر درجہ بندی ماڈل میٹرکس

130,609 لیبلز (11 میلویئر فیملیز) کے ساتھ 11 تصاویر کے متوازن ڈیٹاسیٹ پر، ہمیں درج ذیل نتائج موصول ہوئے:

  • F1 سکور - 0.921
  • اوسط درستگی - 0.938
  • مجموعی طور پر یاد کرنا - 0.906

میلویئر درجہ بندی ماڈل میٹرکس

اس بات کا اندازہ لگانے کے لیے کہ آیا ماڈل اچھی کارکردگی کا مظاہرہ کر رہا ہے، ہم اس کی کارکردگی کا دوسرے صنعتی معیارات سے موازنہ کرنے کی تجویز کرتے ہیں جنہیں اسی (یا کم از کم اسی طرح کے) ڈیٹا سیٹ پر تربیت دی گئی ہے۔ بدقسمتی سے، اس پوسٹ کو لکھنے کے وقت، تحقیق کے کوئی تقابلی ادارے موجود نہیں ہیں جو ایک ہی تکنیک اور ایک ہی ڈیٹا سیٹس کا استعمال کرتے ہوئے اس مسئلے کو حل کریں۔ تاہم، ڈیٹا سائنس کمیونٹی کے اندر، 1 سے اوپر F0.9 سکور والا ماڈل بہت اچھی کارکردگی کا مظاہرہ کرنے والا سمجھا جاتا ہے۔

لاگت اور کارکردگی

وسائل کی بے سرور نوعیت کی وجہ سے، مجموعی لاگت ہر سروس کے استعمال کے وقت کی مقدار سے متاثر ہوتی ہے۔ دوسری طرف، کارکردگی پر کارروائی ہونے والے ڈیٹا کی مقدار اور Amazon Recognition کو تربیتی ڈیٹا سیٹ سائز فیڈ سے متاثر ہوتا ہے۔ اپنی لاگت اور کارکردگی کے تخمینے کی مشق کے لیے، ہم درج ذیل منظر نامے پر غور کرتے ہیں:

  • سورل ڈیٹاسیٹ سے 20 ملین اشیاء کی کیٹلاگ اور پراسیس کی جاتی ہیں۔
  • PE Malware Machine Learning Dataset سے 160,000 اشیاء کی کیٹلاگ اور اس پر کارروائی کی جاتی ہے۔
  • ٹریننگ S240,000 بالٹی میں تقریباً 3 اشیاء لکھی گئی ہیں: 160,000 میلویئر آبجیکٹ اور 80,000 سومی اشیاء۔

اس منظر نامے کی بنیاد پر، ماڈلز کو پہلے سے پروسیس کرنے اور ان کی تعیناتی کی اوسط لاگت $510.99 USD ہے۔ آپ سے ہر گھنٹے کے لیے $4 USD/h اضافی چارج کیا جائے گا جو آپ ماڈل استعمال کرتے ہیں۔ آپ کو لاگت کی تفصیلی بریک ڈاؤن میں مل سکتی ہے۔ تخمینہ کے ذریعے پیدا کیا گیا ہے۔ AWS قیمتوں کا تعین کرنے والا کیلکولیٹر.

کارکردگی کے لحاظ سے، یہ ہماری پیمائش کے نتائج ہیں:

  • پری پروسیسنگ کے بہاؤ کو مکمل کرنے کے لیے ~2 گھنٹے
  • میلویئر کا پتہ لگانے والے ماڈل کی تربیت مکمل کرنے کے لیے ~40 گھنٹے
  • میلویئر کی درجہ بندی کے ماڈل کی تربیت مکمل ہونے کے لیے ~40 گھنٹے

صاف

مستقبل کے چارجز سے بچنے کے لیے، روک اور حذف ایمیزون ریکوگنیشن ماڈلز، اور پری پروسیسنگ وسائل کو حذف کریں۔ تباہ سکرپٹ. اسکرپٹ کو کامیابی سے چلانے کے لیے درج ذیل پیرامیٹرز کی ضرورت ہے۔

  • STACK_NAME - کلاؤڈ فارمیشن اسٹیک کا نام
  • AWS_REGION - وہ علاقہ جہاں حل تعینات کیا گیا ہے۔
  • AWS_PROFILE - نامزد پروفائل جو AWS CLI کمانڈ پر لاگو ہوتا ہے۔

کو چلانے کے لیے درج ذیل کمانڈز کا استعمال کریں۔ ./malware_detection_deployment_scripts/destroy.sh سکرپٹ:

bash malware_detection_deployment_scripts/destroy.sh -s  -p
 -r 

نتیجہ

اس پوسٹ میں، ہم نے دکھایا کہ ایمیزون ریکگنیشن کا استعمال کرتے ہوئے میلویئر کا پتہ لگانے اور درجہ بندی کرنے کا طریقہ۔ حل بغیر سرور کے پیٹرن کی پیروی کرتے ہیں، ڈیٹا پری پروسیسنگ، آرکیسٹریشن، اور ماڈل کی تعیناتی کے لیے منظم خدمات کا فائدہ اٹھاتے ہیں۔ ہم امید کرتے ہیں کہ یہ پوسٹ میلویئر سے لڑنے کے لیے جاری کوششوں میں آپ کی مدد کرے گی۔

مستقبل کی پوسٹ میں ہم اس پوسٹ میں لگائے گئے ماڈلز کو استعمال کرکے مالویئر کا پتہ لگانے کا عملی استعمال دکھائیں گے۔


مصنفین کے بارے میں

ایڈون ہالواکسیوایڈون ہالواکسیو AWS پروفیشنل سروسز کے ساتھ ایک سینئر گلوبل سیکیورٹی آرکیٹیکٹ ہیں اور سائبر سیکیورٹی اور آٹومیشن کے بارے میں پرجوش ہیں۔ وہ صارفین کو کلاؤڈ میں محفوظ اور موافق حل تیار کرنے میں مدد کرتا ہے۔ کام سے باہر، وہ سفر اور کھیل کو پسند کرتا ہے.

راہول شوریہراہول شوریہ AWS پروفیشنل سروسز کے ساتھ پرنسپل ڈیٹا آرکیٹیکٹ ہے۔ وہ AWS پر ڈیٹا پلیٹ فارمز اور تجزیاتی ایپلی کیشنز بنانے والے صارفین کے ساتھ مل کر مدد کرتا ہے اور کام کرتا ہے۔ کام سے باہر، راہول کو اپنے کتے بارنی کے ساتھ لمبی سیر کرنا پسند ہے۔

برونو ڈیفٹوبرونو ڈیفٹو AWS پروفیشنل سروسز کے ساتھ ایک عالمی سیکورٹی آرکیٹیکٹ ہے۔ اس کی توجہ AWS میں محفوظ اور قابل بھروسہ فن تعمیرات کی تعمیر میں صارفین کی مدد کرنے پر مرکوز ہے۔ کام سے باہر، وہ جدید ترین ٹیکنالوجی اپ ڈیٹس اور سفر میں دلچسپی رکھتا ہے۔

ندیم مجیدندیم مجید AWS پیشہ ورانہ خدمات میں ڈیٹا آرکیٹیکٹ ہے۔ وہ AWS پر اپنے ڈیٹا پلیٹ فارم بنانے والے صارفین کے ساتھ شانہ بشانہ کام کرتا ہے۔ کام سے باہر، ندیم ٹیبل ٹینس کھیلتا ہے، اور فٹ بال/ساکر دیکھنا پسند کرتا ہے۔

ٹائم اسٹیمپ:

سے زیادہ AWS مشین لرننگ