Amazon SageMaker JumpStart ব্যবহার করে ইমেজ ক্লাসিফিকেশন মডেল নির্বাচন

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

গবেষকরা সাধারণ মেশিন লার্নিং (এমএল) কাজের জন্য নতুন মডেলের আর্কিটেকচার তৈরি করে চলেছেন। এরকম একটি কাজ হল ইমেজ ক্লাসিফিকেশন, যেখানে ইমেজ ইনপুট হিসেবে গৃহীত হয় এবং মডেলটি অবজেক্ট লেবেল আউটপুট দিয়ে ইমেজটিকে সম্পূর্ণ শ্রেণীবদ্ধ করার চেষ্টা করে। এই ইমেজ শ্রেণীবিভাগের কাজটি সম্পাদন করে এমন অনেক মডেল আজ উপলব্ধ রয়েছে, একজন ML অনুশীলনকারী এই ধরনের প্রশ্ন জিজ্ঞাসা করতে পারেন: "আমার ডেটাসেটে সেরা পারফরম্যান্স অর্জনের জন্য আমার কোন মডেলটি ঠিক করা উচিত এবং তারপর স্থাপন করা উচিত?" এবং একজন ML গবেষক এই ধরনের প্রশ্ন জিজ্ঞাসা করতে পারেন: "কীভাবে আমি একটি নির্দিষ্ট ডেটাসেটের বিপরীতে একাধিক মডেল আর্কিটেকচারের নিজের ন্যায্য তুলনা তৈরি করতে পারি যখন প্রশিক্ষণের হাইপারপ্যারামিটার এবং কম্পিউটার স্পেসিফিকেশন, যেমন GPUs, CPUs এবং RAM নিয়ন্ত্রণ করতে পারি?" পূর্ববর্তী প্রশ্নটি মডেল আর্কিটেকচার জুড়ে মডেল নির্বাচনকে সম্বোধন করে, যখন পরবর্তী প্রশ্নটি একটি পরীক্ষার ডেটাসেটের বিরুদ্ধে প্রশিক্ষিত মডেলের বেঞ্চমার্কিং সম্পর্কিত।

এই পোস্টে, আপনি দেখতে পাবেন কিভাবে টেনসরফ্লো ছবির শ্রেণীবিভাগ এর অ্যালগরিদম আমাজন সেজমেকার জাম্পস্টার্ট এই প্রশ্নগুলি মোকাবেলা করার জন্য প্রয়োজনীয় বাস্তবায়নগুলিকে সহজ করতে পারে। একত্রে একটি সংশ্লিষ্ট বাস্তবায়ন বিবরণ সঙ্গে উদাহরণ জুপিটার নোটবুক, আপনার কাছে প্যারেটো সীমান্ত অন্বেষণ করে মডেল নির্বাচন সম্পাদন করার জন্য সরঞ্জাম উপলব্ধ থাকবে, যেখানে একটি কর্মক্ষমতা মেট্রিক উন্নত করা, যেমন নির্ভুলতা, থ্রুপুটের মতো অন্য মেট্রিককে খারাপ না করে সম্ভব নয়।

সমাধান ওভারভিউ

নিম্নলিখিত চিত্রটি চিত্র শ্রেণীবিভাগের মডেলগুলির একটি বড় সংখ্যার জন্য মডেল নির্বাচনের বাণিজ্য বন্ধের চিত্র তুলে ধরেছে ক্যালটেক-256 ডেটাসেট, যা 30,607টি অবজেক্ট শ্রেণীতে বিস্তৃত 256টি বাস্তব-বিশ্বের চিত্রের একটি চ্যালেঞ্জিং সেট। প্রতিটি বিন্দু একটি একক মডেলের প্রতিনিধিত্ব করে, বিন্দুর আকারগুলি মডেলের অন্তর্ভুক্ত পরামিতিগুলির সংখ্যার সাপেক্ষে স্কেল করা হয় এবং পয়েন্টগুলি তাদের মডেল আর্কিটেকচারের উপর ভিত্তি করে রঙ-কোড করা হয়। উদাহরণস্বরূপ, হালকা সবুজ বিন্দু EfficientNet আর্কিটেকচারের প্রতিনিধিত্ব করে; প্রতিটি হালকা সবুজ বিন্দু অনন্য সূক্ষ্ম-টিউনড মডেল কর্মক্ষমতা পরিমাপ সহ এই আর্কিটেকচারের একটি ভিন্ন কনফিগারেশন। চিত্রটি মডেল নির্বাচনের জন্য একটি প্যারেটো সীমান্তের অস্তিত্ব দেখায়, যেখানে নিম্ন থ্রুপুটের জন্য উচ্চ নির্ভুলতা বিনিময় করা হয়। শেষ পর্যন্ত, প্যারেটো সীমান্ত বরাবর একটি মডেলের নির্বাচন, বা প্যারেটো দক্ষ সমাধানগুলির সেট, আপনার মডেল স্থাপনার কার্যকারিতা প্রয়োজনীয়তার উপর নির্ভর করে।

Amazon SageMaker JumpStart PlatoBlockchain ডেটা ইন্টেলিজেন্স ব্যবহার করে ছবির শ্রেণীবিভাগ মডেল নির্বাচন। উল্লম্ব অনুসন্ধান. আ.

আপনি যদি পরীক্ষার নির্ভুলতা পর্যবেক্ষণ করেন এবং আগ্রহের থ্রুপুট সীমানা পরীক্ষা করেন, তাহলে পূর্ববর্তী চিত্রে প্যারেটো দক্ষ সমাধানের সেট নিম্নলিখিত টেবিলে বের করা হয়েছে। সারিগুলি এমনভাবে সাজানো হয়েছে যে পরীক্ষার থ্রুপুট বাড়ছে এবং পরীক্ষার নির্ভুলতা হ্রাস পাচ্ছে।

ণশড	প্যারামিটারের সংখ্যা	পরীক্ষা নির্ভুলতা	পরীক্ষা শীর্ষ 5 নির্ভুলতা	থ্রুপুট (ছবি/গুলি)	সময়কাল প্রতি যুগ(গুলি)
swin-large-patch4-window12-384	195.6M	96.4%	99.5%	0.3	2278.6
swin-large-patch4-window7-224	195.4M	96.1%	99.5%	1.1	698.0
efficientnet-v2-imagenet21k-ft1k-l	118.1M	95.1%	99.2%	4.5	1434.7
efficientnet-v2-imagenet21k-ft1k-m	53.5M	94.8%	99.1%	8.0	769.1
efficientnet-v2-imagenet21k-m	53.5M	93.1%	98.5%	8.0	765.1
efficientnet-b5	29.0M	90.8%	98.1%	9.1	668.6
efficientnet-v2-imagenet21k-ft1k-b1	7.3M	89.7%	97.3%	14.6	54.3
efficientnet-v2-imagenet21k-ft1k-b0	6.2M	89.0%	97.0%	20.5	38.3
efficientnet-v2-imagenet21k-b0	6.2M	87.0%	95.6%	21.5	38.2
mobilenet-v3-large-100-224	4.6M	84.9%	95.4%	27.4	28.8
mobilenet-v3-large-075-224	3.1M	83.3%	95.2%	30.3	26.6
mobilenet-v2-100-192	2.6M	80.8%	93.5%	33.5	23.9
mobilenet-v2-100-160	2.6M	80.2%	93.2%	40.0	19.6
mobilenet-v2-075-160	1.7M	78.2%	92.8%	41.8	19.3
mobilenet-v2-075-128	1.7M	76.1%	91.1%	44.3	18.3
mobilenet-v1-075-160	2.0M	75.7%	91.0%	44.5	18.2
mobilenet-v1-100-128	3.5M	75.1%	90.7%	47.4	17.4
mobilenet-v1-075-128	2.0M	73.2%	90.0%	48.9	16.8
mobilenet-v2-075-96	1.7M	71.9%	88.5%	49.4	16.6
mobilenet-v2-035-96	0.7M	63.7%	83.1%	50.4	16.3
mobilenet-v1-025-128	0.3M	59.0%	80.7%	50.8	16.2

এই পোস্টটি কীভাবে বড় আকারে বাস্তবায়ন করতে হয় তার বিশদ প্রদান করে আমাজন সেজমেকার বেঞ্চমার্কিং এবং মডেল নির্বাচনের কাজ। প্রথমে, আমরা জাম্পস্টার্ট এবং অন্তর্নির্মিত টেনসরফ্লো ইমেজ ক্লাসিফিকেশন অ্যালগরিদম প্রবর্তন করি। তারপরে আমরা উচ্চ-স্তরের বাস্তবায়ন বিবেচনাগুলি নিয়ে আলোচনা করি, যেমন জাম্পস্টার্ট হাইপারপ্যারামিটার কনফিগারেশন, মেট্রিক নিষ্কাশন অ্যামাজন ক্লাউডওয়াচ লগস, এবং অ্যাসিঙ্ক্রোনাস হাইপারপ্যারামিটার টিউনিং কাজগুলি চালু করা হচ্ছে। অবশেষে, আমরা বাস্তবায়নের পরিবেশ এবং প্যারামিটারাইজেশনকে কভার করি যা পূর্ববর্তী সারণী এবং চিত্রে প্যারেটো দক্ষ সমাধানের দিকে নিয়ে যায়।

জাম্পস্টার্ট টেনসরফ্লো ছবির শ্রেণীবিভাগের ভূমিকা

জাম্পস্টার্ট এক-ক্লিক ফাইন-টিউনিং এবং জনপ্রিয় ML টাস্ক জুড়ে বিভিন্ন ধরণের প্রাক-প্রশিক্ষিত মডেলের স্থাপনা প্রদান করে, সেইসাথে সাধারণ ব্যবসায়িক সমস্যাগুলি সমাধান করে এমন এন্ড-টু-এন্ড সমাধানগুলির একটি নির্বাচন। এই বৈশিষ্ট্যগুলি ML প্রক্রিয়ার প্রতিটি ধাপ থেকে ভারী উত্তোলনকে সরিয়ে দেয়, এটি উচ্চ-মানের মডেলগুলি বিকাশ করা সহজ করে এবং স্থাপনার সময় হ্রাস করে। দ্য জাম্পস্টার্ট API আপনাকে আপনার নিজস্ব ডেটাসেটে প্রাক-প্রশিক্ষিত মডেলগুলির একটি বিশাল নির্বাচন প্রোগ্রাম্যাটিকভাবে স্থাপন এবং সূক্ষ্ম-টিউন করার অনুমতি দেয়।

জাম্পস্টার্ট মডেল হাব বিপুল সংখ্যক অ্যাক্সেস প্রদান করে টেনসরফ্লো ইমেজ ক্লাসিফিকেশন মডেল যা কাস্টম ডেটাসেটে ট্রান্সফার লার্নিং এবং ফাইন-টিউনিং সক্ষম করে। এই লেখা পর্যন্ত, জাম্পস্টার্ট মডেল হাবে বিভিন্ন জনপ্রিয় মডেল আর্কিটেকচার জুড়ে 135টি টেনসরফ্লো ইমেজ ক্লাসিফিকেশন মডেল রয়েছে টেনসরফ্লো হাব, অবশিষ্ট নেটওয়ার্ক অন্তর্ভুক্ত করতে (রিসনেট), মোবাইলনেট, দক্ষ নেট, গোড়া, নিউরাল আর্কিটেকচার সার্চ নেটওয়ার্ক (NASNet), বড় স্থানান্তর (বিট), শিফটেড উইন্ডো (সুইন) ট্রান্সফরমার, ইমেজ ট্রান্সফরমারে ক্লাস-অ্যাটেনশন (CaiT), এবং ডেটা-দক্ষ ইমেজ ট্রান্সফরমার (DeiT).

প্রতিটি মডেল আর্কিটেকচারে ব্যাপকভাবে বিভিন্ন অভ্যন্তরীণ কাঠামো রয়েছে। উদাহরণস্বরূপ, ResNet মডেলগুলি যথেষ্ট গভীর নেটওয়ার্কগুলির জন্য অনুমতি দেওয়ার জন্য সংযোগগুলি এড়িয়ে যাওয়ার ব্যবহার করে, যেখানে ট্রান্সফরমার-ভিত্তিক মডেলগুলি স্ব-মনোযোগ ব্যবস্থা ব্যবহার করে যা আরও বিশ্বব্যাপী গ্রহণযোগ্য ক্ষেত্রগুলির পক্ষে কনভল্যুশন অপারেশনগুলির অন্তর্নিহিত স্থানকে দূর করে। এই বিভিন্ন কাঠামোর বিভিন্ন বৈশিষ্ট্যের সেটগুলি ছাড়াও, প্রতিটি মডেল আর্কিটেকচারের বেশ কয়েকটি কনফিগারেশন রয়েছে যা সেই আর্কিটেকচারের মধ্যে মডেলের আকার, আকৃতি এবং জটিলতাকে সামঞ্জস্য করে। এর ফলে জাম্পস্টার্ট মডেল হাবে শত শত অনন্য ইমেজ ক্লাসিফিকেশন মডেল পাওয়া যায়। বিল্ট-ইন ট্রান্সফার লার্নিং এবং ইনফারেন্স স্ক্রিপ্টগুলির সাথে মিলিত যা অনেক SageMaker বৈশিষ্ট্যগুলিকে অন্তর্ভুক্ত করে, জাম্পস্টার্ট এপিআই হল এমএল অনুশীলনকারীদের জন্য প্রশিক্ষণ এবং দ্রুত মডেল স্থাপন শুরু করার জন্য একটি দুর্দান্ত লঞ্চিং পয়েন্ট।

নির্দেশ করে Amazon SageMaker-এ টেনসরফ্লো ইমেজ ক্লাসিফিকেশন মডেলের জন্য ট্রান্সফার লার্নিং এবং নিম্নলিখিত উদাহরণ নোটবুক সেজমেকার টেনসরফ্লো ইমেজ শ্রেণীবিভাগ সম্পর্কে আরও গভীরতা সম্পর্কে জানতে, যেখানে একটি প্রাক-প্রশিক্ষিত মডেলে অনুমান চালানোর পাশাপাশি একটি কাস্টম ডেটাসেটে প্রাক-প্রশিক্ষিত মডেলকে সূক্ষ্ম-টিউন করা সহ।

বড় মাপের মডেল নির্বাচন বিবেচনা

মডেল নির্বাচন হল প্রার্থী মডেলের একটি সেট থেকে সেরা মডেল নির্বাচন করার প্রক্রিয়া। এই প্রক্রিয়াটি বিভিন্ন প্যারামিটার ওজন সহ একই ধরণের মডেল এবং বিভিন্ন ধরণের মডেল জুড়ে প্রয়োগ করা যেতে পারে। একই ধরণের মডেল জুড়ে মডেল নির্বাচনের উদাহরণগুলির মধ্যে রয়েছে বিভিন্ন হাইপারপ্যারামিটারের সাথে একই মডেল ফিট করা (উদাহরণস্বরূপ, শেখার হার) এবং ট্রেন ডেটাসেটে মডেল ওজনের অতিরিক্ত ফিটিং প্রতিরোধ করার জন্য তাড়াতাড়ি থামানো। বিভিন্ন ধরণের মডেল জুড়ে মডেল নির্বাচনের মধ্যে রয়েছে সেরা মডেল আর্কিটেকচার নির্বাচন করা (উদাহরণস্বরূপ, সুইন বনাম মোবাইলনেট) এবং একটি একক মডেল আর্কিটেকচারের মধ্যে সেরা মডেল কনফিগারেশন নির্বাচন করা (উদাহরণস্বরূপ, mobilenet-v1-025-128 বনাম mobilenet-v3-large-100-224).

এই বিভাগে বর্ণিত বিবেচনাগুলি এই সমস্ত মডেল নির্বাচন প্রক্রিয়াগুলিকে একটি বৈধতা ডেটাসেটে সক্ষম করে।

হাইপারপ্যারামিটার কনফিগারেশন নির্বাচন করুন

জাম্পস্টার্টে টেনসরফ্লো ছবির শ্রেণিবিন্যাস প্রচুর পরিমাণে উপলব্ধ রয়েছে হাইপারপ্যারামিটার যা সমস্ত মডেল আর্কিটেকচারের জন্য ট্রান্সফার লার্নিং স্ক্রিপ্ট আচরণকে সমানভাবে সামঞ্জস্য করতে পারে। এই হাইপারপ্যারামিটারগুলি ডেটা অগমেন্টেশন এবং প্রিপ্রসেসিং, অপ্টিমাইজার স্পেসিফিকেশন, ওভারফিটিং কন্ট্রোল এবং প্রশিক্ষিত লেয়ার সূচকগুলির সাথে সম্পর্কিত। আপনার আবেদনের জন্য প্রয়োজনীয় এই হাইপারপ্যারামিটারগুলির ডিফল্ট মানগুলিকে সামঞ্জস্য করতে আপনাকে উত্সাহিত করা হচ্ছে:

model_id: str
model_version: str = "*" hyperparameters = sagemaker.hyperparameters.retrieve_default( model_id=model_id, model_version=model_version
)

এই বিশ্লেষণ এবং সংশ্লিষ্ট নোটবুকের জন্য, শেখার হার, যুগের সংখ্যা, এবং তাড়াতাড়ি থামার স্পেসিফিকেশন ছাড়া সমস্ত হাইপারপ্যারামিটার ডিফল্ট মানগুলিতে সেট করা আছে। শেখার হার একটি হিসাবে সমন্বয় করা হয় শ্রেণীবদ্ধ পরামিতি দ্বারা সেজমেকার স্বয়ংক্রিয় মডেল টিউনিং চাকরি যেহেতু প্রতিটি মডেলের স্বতন্ত্র ডিফল্ট হাইপারপ্যারামিটার মান রয়েছে, তাই সম্ভাব্য শেখার হারের বিচ্ছিন্ন তালিকায় ডিফল্ট শেখার হারের পাশাপাশি এক-পঞ্চমাংশ ডিফল্ট শেখার হার অন্তর্ভুক্ত রয়েছে। এটি একটি একক হাইপারপ্যারামিটার টিউনিং কাজের জন্য দুটি প্রশিক্ষণ কাজ চালু করে এবং বৈধতা ডেটাসেটে সেরা রিপোর্ট করা কর্মক্ষমতা সহ প্রশিক্ষণের কাজটি নির্বাচন করা হয়। যেহেতু যুগের সংখ্যা 10 এ সেট করা হয়েছে, যা ডিফল্ট হাইপারপ্যারামিটার সেটিং থেকে বেশি, নির্বাচিত সেরা প্রশিক্ষণের কাজ সবসময় ডিফল্ট শেখার হারের সাথে সঙ্গতিপূর্ণ হয় না। অবশেষে, একটি প্রাথমিক থামার মাপকাঠি ধৈর্যের সাথে ব্যবহার করা হয়, বা তিন যুগের কোন উন্নতি ছাড়াই প্রশিক্ষণ চালিয়ে যাওয়ার জন্য যুগের সংখ্যা।

বিশেষ গুরুত্বের একটি ডিফল্ট হাইপারপ্যারামিটার সেটিং train_only_on_top_layer, কোথায়, যদি সেট করা হয় True, মডেলের বৈশিষ্ট্য নিষ্কাশন স্তরগুলি প্রদত্ত প্রশিক্ষণ ডেটাসেটে সূক্ষ্ম-সুরক্ষিত নয়৷ অপ্টিমাইজার শুধুমাত্র ডেটাসেটে ক্লাস লেবেলের সংখ্যার সমান আউটপুট ডাইমেনশ্যালিটি সহ উপরের সম্পূর্ণভাবে সংযুক্ত শ্রেণীবিভাগের স্তরে পরামিতিগুলিকে প্রশিক্ষণ দেবে। ডিফল্টরূপে, এই হাইপারপ্যারামিটার সেট করা হয় True, যা ছোট ডেটাসেটে স্থানান্তর শেখার জন্য লক্ষ্যযুক্ত একটি সেটিং। আপনার কাছে একটি কাস্টম ডেটাসেট থাকতে পারে যেখানে ImageNet ডেটাসেটে প্রাক-প্রশিক্ষণ থেকে বৈশিষ্ট্য নিষ্কাশন যথেষ্ট নয়। এই ক্ষেত্রে, আপনি সেট করা উচিত train_only_on_top_layer থেকে False. যদিও এই সেটিংটি প্রশিক্ষণের সময় বাড়াবে, আপনি আপনার আগ্রহের সমস্যার জন্য আরও অর্থপূর্ণ বৈশিষ্ট্য বের করবেন, যার ফলে নির্ভুলতা বৃদ্ধি পাবে।

CloudWatch লগ থেকে মেট্রিক্স বের করুন

জাম্পস্টার্ট টেনসরফ্লো ইমেজ ক্লাসিফিকেশন অ্যালগরিদম নির্ভরযোগ্যভাবে প্রশিক্ষণের সময় বিভিন্ন মেট্রিক্স লগ করে যা সেজমেকারের কাছে অ্যাক্সেসযোগ্য। Estimator এবং হাইপারপ্যারামিটার টিউনার অবজেক্ট। একটি SageMaker নির্মাণকারী Estimator আছে metric_definitions কীওয়ার্ড আর্গুমেন্ট, যা দুটি কী সহ অভিধানের একটি তালিকা প্রদান করে প্রশিক্ষণের কাজের মূল্যায়ন করতে ব্যবহার করা যেতে পারে: মেট্রিকের নামের জন্য নাম, এবং Regex লগ থেকে মেট্রিক বের করতে ব্যবহৃত রেগুলার এক্সপ্রেশনের জন্য। অনুষঙ্গী নোটবই বাস্তবায়নের বিবরণ দেখায়। নিম্নলিখিত সারণী সমস্ত জাম্পস্টার্ট টেনসরফ্লো ইমেজ ক্লাসিফিকেশন মডেলের জন্য উপলব্ধ মেট্রিক্স এবং সংশ্লিষ্ট নিয়মিত এক্সপ্রেশন তালিকাভুক্ত করে।

মেট্রিক নাম	রেগুলার এক্সপ্রেশন
পরামিতি সংখ্যা	"- প্যারামিটারের সংখ্যা: ([0-9\.]+)"
প্রশিক্ষণযোগ্য পরামিতির সংখ্যা	"- প্রশিক্ষণযোগ্য প্যারামিটারের সংখ্যা: ([0-9\.]+)"
অ-প্রশিক্ষণযোগ্য পরামিতির সংখ্যা	"- অ-প্রশিক্ষণযোগ্য প্যারামিটারের সংখ্যা: ([0-9\.]+)"
ট্রেন ডেটাসেট মেট্রিক	f”- {মেট্রিক}: ([0-9\.]+)”
বৈধতা ডেটাসেট মেট্রিক	f”- val_{metric}: ([0-9\.]+)”
টেস্ট ডেটাসেট মেট্রিক	f”- পরীক্ষা {মেট্রিক}: ([0-9\.]+)”
ট্রেনের সময়কাল	"- মোট প্রশিক্ষণের সময়কাল: ([0-9\.]+)"
প্রতি যুগে ট্রেনের সময়কাল	"- প্রতি যুগে গড় প্রশিক্ষণের সময়কাল: ([0-9\.]+)"
পরীক্ষার মূল্যায়ন বিলম্বিতা	"- পরীক্ষার মূল্যায়নের বিলম্বিতা: ([0-9\.]+)"
প্রতি নমুনা পরীক্ষা বিলম্বিতা	"- নমুনা প্রতি গড় পরীক্ষার বিলম্বিতা: ([0-9\.]+)"
টেস্ট থ্রুপুট	"- গড় পরীক্ষার থ্রুপুট: ([0-9\.]+)"

অন্তর্নির্মিত স্থানান্তর শেখার স্ক্রিপ্ট এই সংজ্ঞাগুলির মধ্যে বিভিন্ন ধরণের ট্রেন, বৈধতা এবং পরীক্ষার ডেটাসেট মেট্রিক্স প্রদান করে, যেমন f-স্ট্রিং প্রতিস্থাপন মান দ্বারা উপস্থাপিত হয়। সঠিক মেট্রিক্স উপলব্ধ শ্রেণীবিভাগের ধরণের উপর ভিত্তি করে পরিবর্তিত হয়। সমস্ত সংকলিত মডেল আছে একটি loss মেট্রিক, যা একটি বাইনারি বা শ্রেণীবদ্ধ শ্রেণিবিন্যাসের সমস্যার জন্য ক্রস-এনট্রপি ক্ষতি দ্বারা প্রতিনিধিত্ব করা হয়। পূর্বেরটি ব্যবহার করা হয় যখন একটি শ্রেণী লেবেল থাকে; পরেরটি ব্যবহার করা হয় যদি দুই বা ততোধিক শ্রেণীর লেবেল থাকে। যদি শুধুমাত্র একটি একক শ্রেণী লেবেল থাকে, তাহলে নিম্নোক্ত মেট্রিকগুলি গণনা করা হয়, লগ করা হয় এবং পূর্ববর্তী সারণীতে f-স্ট্রিং রেগুলার এক্সপ্রেশনের মাধ্যমে বের করা যায়: সত্যিকারের ইতিবাচক সংখ্যা (true_pos), মিথ্যা ইতিবাচক সংখ্যা (false_pos), সত্য নেতিবাচক সংখ্যা (true_neg), মিথ্যা নেতিবাচক সংখ্যা (false_neg), precision, recall, রিসিভার অপারেটিং চরিত্রগত (আরওসি) বক্ররেখার অধীনে এলাকা (auc), এবং যথার্থ-রিকল (PR) বক্ররেখার অধীনে এলাকা (prc) একইভাবে, যদি ছয় বা ততোধিক শ্রেণীর লেবেল থাকে, একটি শীর্ষ-৫ নির্ভুলতা মেট্রিক (top_5_accuracy) পূর্ববর্তী রেগুলার এক্সপ্রেশনের মাধ্যমেও গণনা করা, লগ করা এবং নিষ্কাশনযোগ্য।

প্রশিক্ষণের সময়, মেট্রিক্স একটি সেজমেকারকে নির্দিষ্ট করা হয়েছে Estimator CloudWatch লগে নির্গত হয়। প্রশিক্ষণ সম্পূর্ণ হলে, আপনি আহ্বান করতে পারেন SageMaker DescribeTrainingJob API এবং পরিদর্শন FinalMetricDataList JSON প্রতিক্রিয়াতে কী:

tuner: sagemaker.tuner.HyperparameterTuner
session: sagemaker.Session training_job_name = tuner.best_training_job()
description = session.describe_training_job(training_job_name)
metrics = description["FinalMetricDataList"]

এই API-এর প্রয়োজন শুধুমাত্র কাজের নামটি কোয়েরিতে প্রদান করতে হবে, তাই, একবার সম্পূর্ণ হলে, প্রশিক্ষণের চাকরির নাম যথাযথভাবে লগ করা এবং পুনরুদ্ধারযোগ্য হওয়া পর্যন্ত ভবিষ্যতের বিশ্লেষণে মেট্রিক্স পাওয়া যেতে পারে। এই মডেল নির্বাচন কাজের জন্য, হাইপারপ্যারামিটার টিউনিং কাজের নাম সংরক্ষণ করা হয় এবং পরবর্তী বিশ্লেষণগুলি পুনরায় সংযুক্ত করা হয় HyperparameterTuner টিউনিং কাজের নাম দেওয়া অবজেক্ট, সংযুক্ত হাইপারপ্যারামিটার টিউনার থেকে সেরা প্রশিক্ষণ কাজের নাম বের করুন এবং তারপরে আহ্বান করুন DescribeTrainingJob সেরা প্রশিক্ষণ কাজের সাথে যুক্ত মেট্রিক্স পেতে পূর্বে বর্ণিত API।

অ্যাসিঙ্ক্রোনাস হাইপারপ্যারামিটার টিউনিং কাজগুলি চালু করুন

সংশ্লিষ্ট পড়ুন নোটবই পাইথন স্ট্যান্ডার্ড লাইব্রেরি ব্যবহার করে হাইপারপ্যারামিটার টিউনিং কাজগুলি অ্যাসিঙ্ক্রোনাসভাবে চালু করার বিষয়ে বাস্তবায়নের বিশদ বিবরণের জন্য সমবর্তী ভবিষ্যৎ মডিউল, অ্যাসিঙ্ক্রোনাসভাবে চলা কলেবলের জন্য একটি উচ্চ-স্তরের ইন্টারফেস। বেশ কিছু সেজমেকার-সম্পর্কিত বিবেচনা এই সমাধানে প্রয়োগ করা হয়েছে:

প্রতিটি AWS অ্যাকাউন্টের সাথে অনুমোদিত সেজমেকার পরিষেবা কোটা. আপনার সংস্থানগুলি সম্পূর্ণরূপে ব্যবহার করতে আপনার বর্তমান সীমাগুলি দেখা উচিত এবং প্রয়োজন অনুসারে সম্পদ সীমা বাড়ানোর জন্য সম্ভাব্য অনুরোধ করা উচিত।
ঘন ঘন API কল অনেকগুলি যুগপত হাইপারপ্যারামিটার টিউনিং কাজ তৈরি করতে পারে পাইথন SDK হার অতিক্রম করুন এবং থ্রটলিং ব্যতিক্রমগুলি নিক্ষেপ করুন৷. এটির একটি রেজোলিউশন হল একটি কাস্টম পুনরায় চেষ্টা কনফিগারেশন সহ একটি SageMaker Boto3 ক্লায়েন্ট তৈরি করা।
যদি আপনার স্ক্রিপ্ট একটি ত্রুটি সম্মুখীন হয় বা স্ক্রিপ্ট সমাপ্তির আগে বন্ধ করা হয় কি হবে? এই ধরনের একটি বড় মডেল নির্বাচন বা বেঞ্চমার্কিং অধ্যয়নের জন্য, আপনি কাজের নামগুলি টিউনিং করতে পারেন এবং সুবিধার ফাংশন প্রদান করতে পারেন হাইপারপ্যারামিটার টিউনিং কাজগুলি পুনরায় সংযুক্ত করুন যা ইতিমধ্যে বিদ্যমান:

tuning_job_name: str
session: sagemaker.Session tuner = sagemaker.tuner.HyperparameterTuner.attach(tuning_job_name, session)

বিশ্লেষণ বিবরণ এবং আলোচনা

এই পোস্টের বিশ্লেষণের জন্য স্থানান্তর শেখার কাজ করে মডেল আইডি ক্যালটেক-256 ডেটাসেটে জাম্পস্টার্ট টেনসরফ্লো ইমেজ ক্লাসিফিকেশন অ্যালগরিদমে। সমস্ত প্রশিক্ষণের কাজ সেজমেকার প্রশিক্ষণ উদাহরণ ml.g4dn.xlarge-এ সম্পাদিত হয়েছিল, যার মধ্যে একটি একক NVIDIA T4 GPU রয়েছে।

প্রশিক্ষণের শেষে প্রশিক্ষণের উদাহরণে পরীক্ষার ডেটাসেট মূল্যায়ন করা হয়। মডেল নির্বাচন পরীক্ষা ডেটাসেট মূল্যায়নের আগে সঞ্চালিত হয় সেরা বৈধতা সেট কর্মক্ষমতা সহ যুগে মডেল ওজন সেট করতে। টেস্ট থ্রুপুট অপ্টিমাইজ করা হয় না: ডেটাসেট ব্যাচের আকার ডিফল্ট প্রশিক্ষণ হাইপারপ্যারামিটার ব্যাচ আকারে সেট করা হয়, যা GPU মেমরি ব্যবহার সর্বাধিক করার জন্য সামঞ্জস্য করা হয় না; রিপোর্ট করা টেস্ট থ্রুপুটে ডেটা লোডিং সময় অন্তর্ভুক্ত কারণ ডেটাসেটটি প্রি-ক্যাশেড নয়; এবং একাধিক GPU জুড়ে বিতরণ করা অনুমান ব্যবহার করা হয় না। এই কারণে, এই থ্রুপুটটি একটি ভাল আপেক্ষিক পরিমাপ, কিন্তু প্রকৃত থ্রুপুট প্রশিক্ষিত মডেলের জন্য আপনার অনুমানের শেষ পয়েন্ট স্থাপনার কনফিগারেশনের উপর ব্যাপকভাবে নির্ভর করবে।

যদিও জাম্পস্টার্ট মডেল হাবটিতে অনেকগুলি ইমেজ ক্লাসিফিকেশন আর্কিটেকচারের ধরন রয়েছে, এই প্যারেটো ফ্রন্টিয়ারে নির্বাচিত সুইন, এফিশিয়েন্টনেট এবং মোবাইলনেট মডেলের আধিপত্য রয়েছে। সুইন মডেলগুলি বড় এবং তুলনামূলকভাবে আরও সঠিক, যেখানে MobileNet মডেলগুলি ছোট, তুলনামূলকভাবে কম নির্ভুল এবং মোবাইল ডিভাইসের সংস্থান সীমাবদ্ধতার জন্য উপযুক্ত। এটি লক্ষ্য করা গুরুত্বপূর্ণ যে এই সীমান্তটি বিভিন্ন কারণের উপর শর্তযুক্ত, যার মধ্যে ব্যবহৃত সঠিক ডেটাসেট এবং সূক্ষ্ম-টিউনিং হাইপারপ্যারামিটারগুলি অন্তর্ভুক্ত রয়েছে। আপনি দেখতে পারেন যে আপনার কাস্টম ডেটাসেট প্যারেটো দক্ষ সমাধানগুলির একটি ভিন্ন সেট তৈরি করে, এবং আপনি বিভিন্ন হাইপারপ্যারামিটারের সাথে দীর্ঘ প্রশিক্ষণের সময় কামনা করতে পারেন, যেমন মডেলের শীর্ষ শ্রেণিবিন্যাস স্তরের চেয়ে আরও বেশি ডেটা বৃদ্ধি বা সূক্ষ্ম-টিউনিং।

উপসংহার

এই পোস্টে, আমরা দেখিয়েছি কিভাবে জাম্পস্টার্ট মডেল হাব ব্যবহার করে বড় আকারের মডেল নির্বাচন বা বেঞ্চমার্কিং কাজ চালানো যায়। এই সমাধান আপনাকে আপনার প্রয়োজনের জন্য সেরা মডেল চয়ন করতে সাহায্য করতে পারে। আমরা আপনাকে এটি চেষ্টা করার এবং অন্বেষণ করতে উত্সাহিত করি সমাধান আপনার নিজস্ব ডেটাসেটে।

তথ্যসূত্র

নিম্নলিখিত সংস্থানগুলিতে আরও তথ্য পাওয়া যায়:

লেখক সম্পর্কে

ডাঃ কাইল উলরিচ সঙ্গে একজন ফলিত বিজ্ঞানী Amazon SageMaker বিল্ট-ইন অ্যালগরিদম টীম. তার গবেষণার আগ্রহের মধ্যে রয়েছে স্কেলযোগ্য মেশিন লার্নিং অ্যালগরিদম, কম্পিউটার ভিশন, টাইম সিরিজ, বায়েসিয়ান নন-প্যারামেট্রিক্স এবং গাউসিয়ান প্রক্রিয়া। তার পিএইচডি ডিউক বিশ্ববিদ্যালয় থেকে এবং তিনি নিউরিআইপিএস, সেল এবং নিউরনে গবেষণাপত্র প্রকাশ করেছেন।

আশিস খেতান ড সঙ্গে একজন সিনিয়র ফলিত বিজ্ঞানী Amazon SageMaker বিল্ট-ইন অ্যালগরিদম এবং মেশিন লার্নিং অ্যালগরিদম বিকাশে সহায়তা করে। তিনি ইউনিভার্সিটি অফ ইলিনয় আরবানা চ্যাম্পেইন থেকে পিএইচডি লাভ করেন। তিনি মেশিন লার্নিং এবং পরিসংখ্যানগত অনুমানের একজন সক্রিয় গবেষক এবং NeurIPS, ICML, ICLR, JMLR, ACL, এবং EMNLP সম্মেলনে অনেক গবেষণাপত্র প্রকাশ করেছেন।