গবেষকরা সাধারণ মেশিন লার্নিং (এমএল) কাজের জন্য নতুন মডেলের আর্কিটেকচার তৈরি করে চলেছেন। এরকম একটি কাজ হল ইমেজ ক্লাসিফিকেশন, যেখানে ইমেজ ইনপুট হিসেবে গৃহীত হয় এবং মডেলটি অবজেক্ট লেবেল আউটপুট দিয়ে ইমেজটিকে সম্পূর্ণ শ্রেণীবদ্ধ করার চেষ্টা করে। এই ইমেজ শ্রেণীবিভাগের কাজটি সম্পাদন করে এমন অনেক মডেল আজ উপলব্ধ রয়েছে, একজন ML অনুশীলনকারী এই ধরনের প্রশ্ন জিজ্ঞাসা করতে পারেন: "আমার ডেটাসেটে সেরা পারফরম্যান্স অর্জনের জন্য আমার কোন মডেলটি ঠিক করা উচিত এবং তারপর স্থাপন করা উচিত?" এবং একজন ML গবেষক এই ধরনের প্রশ্ন জিজ্ঞাসা করতে পারেন: "কীভাবে আমি একটি নির্দিষ্ট ডেটাসেটের বিপরীতে একাধিক মডেল আর্কিটেকচারের নিজের ন্যায্য তুলনা তৈরি করতে পারি যখন প্রশিক্ষণের হাইপারপ্যারামিটার এবং কম্পিউটার স্পেসিফিকেশন, যেমন GPUs, CPUs এবং RAM নিয়ন্ত্রণ করতে পারি?" পূর্ববর্তী প্রশ্নটি মডেল আর্কিটেকচার জুড়ে মডেল নির্বাচনকে সম্বোধন করে, যখন পরবর্তী প্রশ্নটি একটি পরীক্ষার ডেটাসেটের বিরুদ্ধে প্রশিক্ষিত মডেলের বেঞ্চমার্কিং সম্পর্কিত।
এই পোস্টে, আপনি দেখতে পাবেন কিভাবে টেনসরফ্লো ছবির শ্রেণীবিভাগ এর অ্যালগরিদম আমাজন সেজমেকার জাম্পস্টার্ট এই প্রশ্নগুলি মোকাবেলা করার জন্য প্রয়োজনীয় বাস্তবায়নগুলিকে সহজ করতে পারে। একত্রে একটি সংশ্লিষ্ট বাস্তবায়ন বিবরণ সঙ্গে উদাহরণ জুপিটার নোটবুক, আপনার কাছে প্যারেটো সীমান্ত অন্বেষণ করে মডেল নির্বাচন সম্পাদন করার জন্য সরঞ্জাম উপলব্ধ থাকবে, যেখানে একটি কর্মক্ষমতা মেট্রিক উন্নত করা, যেমন নির্ভুলতা, থ্রুপুটের মতো অন্য মেট্রিককে খারাপ না করে সম্ভব নয়।
সমাধান ওভারভিউ
নিম্নলিখিত চিত্রটি চিত্র শ্রেণীবিভাগের মডেলগুলির একটি বড় সংখ্যার জন্য মডেল নির্বাচনের বাণিজ্য বন্ধের চিত্র তুলে ধরেছে ক্যালটেক-256 ডেটাসেট, যা 30,607টি অবজেক্ট শ্রেণীতে বিস্তৃত 256টি বাস্তব-বিশ্বের চিত্রের একটি চ্যালেঞ্জিং সেট। প্রতিটি বিন্দু একটি একক মডেলের প্রতিনিধিত্ব করে, বিন্দুর আকারগুলি মডেলের অন্তর্ভুক্ত পরামিতিগুলির সংখ্যার সাপেক্ষে স্কেল করা হয় এবং পয়েন্টগুলি তাদের মডেল আর্কিটেকচারের উপর ভিত্তি করে রঙ-কোড করা হয়। উদাহরণস্বরূপ, হালকা সবুজ বিন্দু EfficientNet আর্কিটেকচারের প্রতিনিধিত্ব করে; প্রতিটি হালকা সবুজ বিন্দু অনন্য সূক্ষ্ম-টিউনড মডেল কর্মক্ষমতা পরিমাপ সহ এই আর্কিটেকচারের একটি ভিন্ন কনফিগারেশন। চিত্রটি মডেল নির্বাচনের জন্য একটি প্যারেটো সীমান্তের অস্তিত্ব দেখায়, যেখানে নিম্ন থ্রুপুটের জন্য উচ্চ নির্ভুলতা বিনিময় করা হয়। শেষ পর্যন্ত, প্যারেটো সীমান্ত বরাবর একটি মডেলের নির্বাচন, বা প্যারেটো দক্ষ সমাধানগুলির সেট, আপনার মডেল স্থাপনার কার্যকারিতা প্রয়োজনীয়তার উপর নির্ভর করে।
আপনি যদি পরীক্ষার নির্ভুলতা পর্যবেক্ষণ করেন এবং আগ্রহের থ্রুপুট সীমানা পরীক্ষা করেন, তাহলে পূর্ববর্তী চিত্রে প্যারেটো দক্ষ সমাধানের সেট নিম্নলিখিত টেবিলে বের করা হয়েছে। সারিগুলি এমনভাবে সাজানো হয়েছে যে পরীক্ষার থ্রুপুট বাড়ছে এবং পরীক্ষার নির্ভুলতা হ্রাস পাচ্ছে।
ণশড | প্যারামিটারের সংখ্যা | পরীক্ষা নির্ভুলতা | পরীক্ষা শীর্ষ 5 নির্ভুলতা | থ্রুপুট (ছবি/গুলি) | সময়কাল প্রতি যুগ(গুলি) |
swin-large-patch4-window12-384 | 195.6M | 96.4% | 99.5% | 0.3 | 2278.6 |
swin-large-patch4-window7-224 | 195.4M | 96.1% | 99.5% | 1.1 | 698.0 |
efficientnet-v2-imagenet21k-ft1k-l | 118.1M | 95.1% | 99.2% | 4.5 | 1434.7 |
efficientnet-v2-imagenet21k-ft1k-m | 53.5M | 94.8% | 99.1% | 8.0 | 769.1 |
efficientnet-v2-imagenet21k-m | 53.5M | 93.1% | 98.5% | 8.0 | 765.1 |
efficientnet-b5 | 29.0M | 90.8% | 98.1% | 9.1 | 668.6 |
efficientnet-v2-imagenet21k-ft1k-b1 | 7.3M | 89.7% | 97.3% | 14.6 | 54.3 |
efficientnet-v2-imagenet21k-ft1k-b0 | 6.2M | 89.0% | 97.0% | 20.5 | 38.3 |
efficientnet-v2-imagenet21k-b0 | 6.2M | 87.0% | 95.6% | 21.5 | 38.2 |
mobilenet-v3-large-100-224 | 4.6M | 84.9% | 95.4% | 27.4 | 28.8 |
mobilenet-v3-large-075-224 | 3.1M | 83.3% | 95.2% | 30.3 | 26.6 |
mobilenet-v2-100-192 | 2.6M | 80.8% | 93.5% | 33.5 | 23.9 |
mobilenet-v2-100-160 | 2.6M | 80.2% | 93.2% | 40.0 | 19.6 |
mobilenet-v2-075-160 | 1.7M | 78.2% | 92.8% | 41.8 | 19.3 |
mobilenet-v2-075-128 | 1.7M | 76.1% | 91.1% | 44.3 | 18.3 |
mobilenet-v1-075-160 | 2.0M | 75.7% | 91.0% | 44.5 | 18.2 |
mobilenet-v1-100-128 | 3.5M | 75.1% | 90.7% | 47.4 | 17.4 |
mobilenet-v1-075-128 | 2.0M | 73.2% | 90.0% | 48.9 | 16.8 |
mobilenet-v2-075-96 | 1.7M | 71.9% | 88.5% | 49.4 | 16.6 |
mobilenet-v2-035-96 | 0.7M | 63.7% | 83.1% | 50.4 | 16.3 |
mobilenet-v1-025-128 | 0.3M | 59.0% | 80.7% | 50.8 | 16.2 |
এই পোস্টটি কীভাবে বড় আকারে বাস্তবায়ন করতে হয় তার বিশদ প্রদান করে আমাজন সেজমেকার বেঞ্চমার্কিং এবং মডেল নির্বাচনের কাজ। প্রথমে, আমরা জাম্পস্টার্ট এবং অন্তর্নির্মিত টেনসরফ্লো ইমেজ ক্লাসিফিকেশন অ্যালগরিদম প্রবর্তন করি। তারপরে আমরা উচ্চ-স্তরের বাস্তবায়ন বিবেচনাগুলি নিয়ে আলোচনা করি, যেমন জাম্পস্টার্ট হাইপারপ্যারামিটার কনফিগারেশন, মেট্রিক নিষ্কাশন অ্যামাজন ক্লাউডওয়াচ লগস, এবং অ্যাসিঙ্ক্রোনাস হাইপারপ্যারামিটার টিউনিং কাজগুলি চালু করা হচ্ছে। অবশেষে, আমরা বাস্তবায়নের পরিবেশ এবং প্যারামিটারাইজেশনকে কভার করি যা পূর্ববর্তী সারণী এবং চিত্রে প্যারেটো দক্ষ সমাধানের দিকে নিয়ে যায়।
জাম্পস্টার্ট টেনসরফ্লো ছবির শ্রেণীবিভাগের ভূমিকা
জাম্পস্টার্ট এক-ক্লিক ফাইন-টিউনিং এবং জনপ্রিয় ML টাস্ক জুড়ে বিভিন্ন ধরণের প্রাক-প্রশিক্ষিত মডেলের স্থাপনা প্রদান করে, সেইসাথে সাধারণ ব্যবসায়িক সমস্যাগুলি সমাধান করে এমন এন্ড-টু-এন্ড সমাধানগুলির একটি নির্বাচন। এই বৈশিষ্ট্যগুলি ML প্রক্রিয়ার প্রতিটি ধাপ থেকে ভারী উত্তোলনকে সরিয়ে দেয়, এটি উচ্চ-মানের মডেলগুলি বিকাশ করা সহজ করে এবং স্থাপনার সময় হ্রাস করে। দ্য জাম্পস্টার্ট API আপনাকে আপনার নিজস্ব ডেটাসেটে প্রাক-প্রশিক্ষিত মডেলগুলির একটি বিশাল নির্বাচন প্রোগ্রাম্যাটিকভাবে স্থাপন এবং সূক্ষ্ম-টিউন করার অনুমতি দেয়।
জাম্পস্টার্ট মডেল হাব বিপুল সংখ্যক অ্যাক্সেস প্রদান করে টেনসরফ্লো ইমেজ ক্লাসিফিকেশন মডেল যা কাস্টম ডেটাসেটে ট্রান্সফার লার্নিং এবং ফাইন-টিউনিং সক্ষম করে। এই লেখা পর্যন্ত, জাম্পস্টার্ট মডেল হাবে বিভিন্ন জনপ্রিয় মডেল আর্কিটেকচার জুড়ে 135টি টেনসরফ্লো ইমেজ ক্লাসিফিকেশন মডেল রয়েছে টেনসরফ্লো হাব, অবশিষ্ট নেটওয়ার্ক অন্তর্ভুক্ত করতে (রিসনেট), মোবাইলনেট, দক্ষ নেট, গোড়া, নিউরাল আর্কিটেকচার সার্চ নেটওয়ার্ক (NASNet), বড় স্থানান্তর (বিট), শিফটেড উইন্ডো (সুইন) ট্রান্সফরমার, ইমেজ ট্রান্সফরমারে ক্লাস-অ্যাটেনশন (CaiT), এবং ডেটা-দক্ষ ইমেজ ট্রান্সফরমার (DeiT).
প্রতিটি মডেল আর্কিটেকচারে ব্যাপকভাবে বিভিন্ন অভ্যন্তরীণ কাঠামো রয়েছে। উদাহরণস্বরূপ, ResNet মডেলগুলি যথেষ্ট গভীর নেটওয়ার্কগুলির জন্য অনুমতি দেওয়ার জন্য সংযোগগুলি এড়িয়ে যাওয়ার ব্যবহার করে, যেখানে ট্রান্সফরমার-ভিত্তিক মডেলগুলি স্ব-মনোযোগ ব্যবস্থা ব্যবহার করে যা আরও বিশ্বব্যাপী গ্রহণযোগ্য ক্ষেত্রগুলির পক্ষে কনভল্যুশন অপারেশনগুলির অন্তর্নিহিত স্থানকে দূর করে। এই বিভিন্ন কাঠামোর বিভিন্ন বৈশিষ্ট্যের সেটগুলি ছাড়াও, প্রতিটি মডেল আর্কিটেকচারের বেশ কয়েকটি কনফিগারেশন রয়েছে যা সেই আর্কিটেকচারের মধ্যে মডেলের আকার, আকৃতি এবং জটিলতাকে সামঞ্জস্য করে। এর ফলে জাম্পস্টার্ট মডেল হাবে শত শত অনন্য ইমেজ ক্লাসিফিকেশন মডেল পাওয়া যায়। বিল্ট-ইন ট্রান্সফার লার্নিং এবং ইনফারেন্স স্ক্রিপ্টগুলির সাথে মিলিত যা অনেক SageMaker বৈশিষ্ট্যগুলিকে অন্তর্ভুক্ত করে, জাম্পস্টার্ট এপিআই হল এমএল অনুশীলনকারীদের জন্য প্রশিক্ষণ এবং দ্রুত মডেল স্থাপন শুরু করার জন্য একটি দুর্দান্ত লঞ্চিং পয়েন্ট।
নির্দেশ করে Amazon SageMaker-এ টেনসরফ্লো ইমেজ ক্লাসিফিকেশন মডেলের জন্য ট্রান্সফার লার্নিং এবং নিম্নলিখিত উদাহরণ নোটবুক সেজমেকার টেনসরফ্লো ইমেজ শ্রেণীবিভাগ সম্পর্কে আরও গভীরতা সম্পর্কে জানতে, যেখানে একটি প্রাক-প্রশিক্ষিত মডেলে অনুমান চালানোর পাশাপাশি একটি কাস্টম ডেটাসেটে প্রাক-প্রশিক্ষিত মডেলকে সূক্ষ্ম-টিউন করা সহ।
বড় মাপের মডেল নির্বাচন বিবেচনা
মডেল নির্বাচন হল প্রার্থী মডেলের একটি সেট থেকে সেরা মডেল নির্বাচন করার প্রক্রিয়া। এই প্রক্রিয়াটি বিভিন্ন প্যারামিটার ওজন সহ একই ধরণের মডেল এবং বিভিন্ন ধরণের মডেল জুড়ে প্রয়োগ করা যেতে পারে। একই ধরণের মডেল জুড়ে মডেল নির্বাচনের উদাহরণগুলির মধ্যে রয়েছে বিভিন্ন হাইপারপ্যারামিটারের সাথে একই মডেল ফিট করা (উদাহরণস্বরূপ, শেখার হার) এবং ট্রেন ডেটাসেটে মডেল ওজনের অতিরিক্ত ফিটিং প্রতিরোধ করার জন্য তাড়াতাড়ি থামানো। বিভিন্ন ধরণের মডেল জুড়ে মডেল নির্বাচনের মধ্যে রয়েছে সেরা মডেল আর্কিটেকচার নির্বাচন করা (উদাহরণস্বরূপ, সুইন বনাম মোবাইলনেট) এবং একটি একক মডেল আর্কিটেকচারের মধ্যে সেরা মডেল কনফিগারেশন নির্বাচন করা (উদাহরণস্বরূপ, mobilenet-v1-025-128
বনাম mobilenet-v3-large-100-224
).
এই বিভাগে বর্ণিত বিবেচনাগুলি এই সমস্ত মডেল নির্বাচন প্রক্রিয়াগুলিকে একটি বৈধতা ডেটাসেটে সক্ষম করে।
হাইপারপ্যারামিটার কনফিগারেশন নির্বাচন করুন
জাম্পস্টার্টে টেনসরফ্লো ছবির শ্রেণিবিন্যাস প্রচুর পরিমাণে উপলব্ধ রয়েছে হাইপারপ্যারামিটার যা সমস্ত মডেল আর্কিটেকচারের জন্য ট্রান্সফার লার্নিং স্ক্রিপ্ট আচরণকে সমানভাবে সামঞ্জস্য করতে পারে। এই হাইপারপ্যারামিটারগুলি ডেটা অগমেন্টেশন এবং প্রিপ্রসেসিং, অপ্টিমাইজার স্পেসিফিকেশন, ওভারফিটিং কন্ট্রোল এবং প্রশিক্ষিত লেয়ার সূচকগুলির সাথে সম্পর্কিত। আপনার আবেদনের জন্য প্রয়োজনীয় এই হাইপারপ্যারামিটারগুলির ডিফল্ট মানগুলিকে সামঞ্জস্য করতে আপনাকে উত্সাহিত করা হচ্ছে:
এই বিশ্লেষণ এবং সংশ্লিষ্ট নোটবুকের জন্য, শেখার হার, যুগের সংখ্যা, এবং তাড়াতাড়ি থামার স্পেসিফিকেশন ছাড়া সমস্ত হাইপারপ্যারামিটার ডিফল্ট মানগুলিতে সেট করা আছে। শেখার হার একটি হিসাবে সমন্বয় করা হয় শ্রেণীবদ্ধ পরামিতি দ্বারা সেজমেকার স্বয়ংক্রিয় মডেল টিউনিং চাকরি যেহেতু প্রতিটি মডেলের স্বতন্ত্র ডিফল্ট হাইপারপ্যারামিটার মান রয়েছে, তাই সম্ভাব্য শেখার হারের বিচ্ছিন্ন তালিকায় ডিফল্ট শেখার হারের পাশাপাশি এক-পঞ্চমাংশ ডিফল্ট শেখার হার অন্তর্ভুক্ত রয়েছে। এটি একটি একক হাইপারপ্যারামিটার টিউনিং কাজের জন্য দুটি প্রশিক্ষণ কাজ চালু করে এবং বৈধতা ডেটাসেটে সেরা রিপোর্ট করা কর্মক্ষমতা সহ প্রশিক্ষণের কাজটি নির্বাচন করা হয়। যেহেতু যুগের সংখ্যা 10 এ সেট করা হয়েছে, যা ডিফল্ট হাইপারপ্যারামিটার সেটিং থেকে বেশি, নির্বাচিত সেরা প্রশিক্ষণের কাজ সবসময় ডিফল্ট শেখার হারের সাথে সঙ্গতিপূর্ণ হয় না। অবশেষে, একটি প্রাথমিক থামার মাপকাঠি ধৈর্যের সাথে ব্যবহার করা হয়, বা তিন যুগের কোন উন্নতি ছাড়াই প্রশিক্ষণ চালিয়ে যাওয়ার জন্য যুগের সংখ্যা।
বিশেষ গুরুত্বের একটি ডিফল্ট হাইপারপ্যারামিটার সেটিং train_only_on_top_layer
, কোথায়, যদি সেট করা হয় True
, মডেলের বৈশিষ্ট্য নিষ্কাশন স্তরগুলি প্রদত্ত প্রশিক্ষণ ডেটাসেটে সূক্ষ্ম-সুরক্ষিত নয়৷ অপ্টিমাইজার শুধুমাত্র ডেটাসেটে ক্লাস লেবেলের সংখ্যার সমান আউটপুট ডাইমেনশ্যালিটি সহ উপরের সম্পূর্ণভাবে সংযুক্ত শ্রেণীবিভাগের স্তরে পরামিতিগুলিকে প্রশিক্ষণ দেবে। ডিফল্টরূপে, এই হাইপারপ্যারামিটার সেট করা হয় True
, যা ছোট ডেটাসেটে স্থানান্তর শেখার জন্য লক্ষ্যযুক্ত একটি সেটিং। আপনার কাছে একটি কাস্টম ডেটাসেট থাকতে পারে যেখানে ImageNet ডেটাসেটে প্রাক-প্রশিক্ষণ থেকে বৈশিষ্ট্য নিষ্কাশন যথেষ্ট নয়। এই ক্ষেত্রে, আপনি সেট করা উচিত train_only_on_top_layer
থেকে False
. যদিও এই সেটিংটি প্রশিক্ষণের সময় বাড়াবে, আপনি আপনার আগ্রহের সমস্যার জন্য আরও অর্থপূর্ণ বৈশিষ্ট্য বের করবেন, যার ফলে নির্ভুলতা বৃদ্ধি পাবে।
CloudWatch লগ থেকে মেট্রিক্স বের করুন
জাম্পস্টার্ট টেনসরফ্লো ইমেজ ক্লাসিফিকেশন অ্যালগরিদম নির্ভরযোগ্যভাবে প্রশিক্ষণের সময় বিভিন্ন মেট্রিক্স লগ করে যা সেজমেকারের কাছে অ্যাক্সেসযোগ্য। Estimator
এবং হাইপারপ্যারামিটার টিউনার অবজেক্ট। একটি SageMaker নির্মাণকারী Estimator
আছে metric_definitions
কীওয়ার্ড আর্গুমেন্ট, যা দুটি কী সহ অভিধানের একটি তালিকা প্রদান করে প্রশিক্ষণের কাজের মূল্যায়ন করতে ব্যবহার করা যেতে পারে: মেট্রিকের নামের জন্য নাম, এবং Regex
লগ থেকে মেট্রিক বের করতে ব্যবহৃত রেগুলার এক্সপ্রেশনের জন্য। অনুষঙ্গী নোটবই বাস্তবায়নের বিবরণ দেখায়। নিম্নলিখিত সারণী সমস্ত জাম্পস্টার্ট টেনসরফ্লো ইমেজ ক্লাসিফিকেশন মডেলের জন্য উপলব্ধ মেট্রিক্স এবং সংশ্লিষ্ট নিয়মিত এক্সপ্রেশন তালিকাভুক্ত করে।
মেট্রিক নাম | রেগুলার এক্সপ্রেশন |
পরামিতি সংখ্যা | "- প্যারামিটারের সংখ্যা: ([0-9\.]+)" |
প্রশিক্ষণযোগ্য পরামিতির সংখ্যা | "- প্রশিক্ষণযোগ্য প্যারামিটারের সংখ্যা: ([0-9\.]+)" |
অ-প্রশিক্ষণযোগ্য পরামিতির সংখ্যা | "- অ-প্রশিক্ষণযোগ্য প্যারামিটারের সংখ্যা: ([0-9\.]+)" |
ট্রেন ডেটাসেট মেট্রিক | f”- {মেট্রিক}: ([0-9\.]+)” |
বৈধতা ডেটাসেট মেট্রিক | f”- val_{metric}: ([0-9\.]+)” |
টেস্ট ডেটাসেট মেট্রিক | f”- পরীক্ষা {মেট্রিক}: ([0-9\.]+)” |
ট্রেনের সময়কাল | "- মোট প্রশিক্ষণের সময়কাল: ([0-9\.]+)" |
প্রতি যুগে ট্রেনের সময়কাল | "- প্রতি যুগে গড় প্রশিক্ষণের সময়কাল: ([0-9\.]+)" |
পরীক্ষার মূল্যায়ন বিলম্বিতা | "- পরীক্ষার মূল্যায়নের বিলম্বিতা: ([0-9\.]+)" |
প্রতি নমুনা পরীক্ষা বিলম্বিতা | "- নমুনা প্রতি গড় পরীক্ষার বিলম্বিতা: ([0-9\.]+)" |
টেস্ট থ্রুপুট | "- গড় পরীক্ষার থ্রুপুট: ([0-9\.]+)" |
অন্তর্নির্মিত স্থানান্তর শেখার স্ক্রিপ্ট এই সংজ্ঞাগুলির মধ্যে বিভিন্ন ধরণের ট্রেন, বৈধতা এবং পরীক্ষার ডেটাসেট মেট্রিক্স প্রদান করে, যেমন f-স্ট্রিং প্রতিস্থাপন মান দ্বারা উপস্থাপিত হয়। সঠিক মেট্রিক্স উপলব্ধ শ্রেণীবিভাগের ধরণের উপর ভিত্তি করে পরিবর্তিত হয়। সমস্ত সংকলিত মডেল আছে একটি loss
মেট্রিক, যা একটি বাইনারি বা শ্রেণীবদ্ধ শ্রেণিবিন্যাসের সমস্যার জন্য ক্রস-এনট্রপি ক্ষতি দ্বারা প্রতিনিধিত্ব করা হয়। পূর্বেরটি ব্যবহার করা হয় যখন একটি শ্রেণী লেবেল থাকে; পরেরটি ব্যবহার করা হয় যদি দুই বা ততোধিক শ্রেণীর লেবেল থাকে। যদি শুধুমাত্র একটি একক শ্রেণী লেবেল থাকে, তাহলে নিম্নোক্ত মেট্রিকগুলি গণনা করা হয়, লগ করা হয় এবং পূর্ববর্তী সারণীতে f-স্ট্রিং রেগুলার এক্সপ্রেশনের মাধ্যমে বের করা যায়: সত্যিকারের ইতিবাচক সংখ্যা (true_pos
), মিথ্যা ইতিবাচক সংখ্যা (false_pos
), সত্য নেতিবাচক সংখ্যা (true_neg
), মিথ্যা নেতিবাচক সংখ্যা (false_neg
), precision
, recall
, রিসিভার অপারেটিং চরিত্রগত (আরওসি) বক্ররেখার অধীনে এলাকা (auc
), এবং যথার্থ-রিকল (PR) বক্ররেখার অধীনে এলাকা (prc
) একইভাবে, যদি ছয় বা ততোধিক শ্রেণীর লেবেল থাকে, একটি শীর্ষ-৫ নির্ভুলতা মেট্রিক (top_5_accuracy
) পূর্ববর্তী রেগুলার এক্সপ্রেশনের মাধ্যমেও গণনা করা, লগ করা এবং নিষ্কাশনযোগ্য।
প্রশিক্ষণের সময়, মেট্রিক্স একটি সেজমেকারকে নির্দিষ্ট করা হয়েছে Estimator
CloudWatch লগে নির্গত হয়। প্রশিক্ষণ সম্পূর্ণ হলে, আপনি আহ্বান করতে পারেন SageMaker DescribeTrainingJob API এবং পরিদর্শন FinalMetricDataList
JSON প্রতিক্রিয়াতে কী:
এই API-এর প্রয়োজন শুধুমাত্র কাজের নামটি কোয়েরিতে প্রদান করতে হবে, তাই, একবার সম্পূর্ণ হলে, প্রশিক্ষণের চাকরির নাম যথাযথভাবে লগ করা এবং পুনরুদ্ধারযোগ্য হওয়া পর্যন্ত ভবিষ্যতের বিশ্লেষণে মেট্রিক্স পাওয়া যেতে পারে। এই মডেল নির্বাচন কাজের জন্য, হাইপারপ্যারামিটার টিউনিং কাজের নাম সংরক্ষণ করা হয় এবং পরবর্তী বিশ্লেষণগুলি পুনরায় সংযুক্ত করা হয় HyperparameterTuner
টিউনিং কাজের নাম দেওয়া অবজেক্ট, সংযুক্ত হাইপারপ্যারামিটার টিউনার থেকে সেরা প্রশিক্ষণ কাজের নাম বের করুন এবং তারপরে আহ্বান করুন DescribeTrainingJob
সেরা প্রশিক্ষণ কাজের সাথে যুক্ত মেট্রিক্স পেতে পূর্বে বর্ণিত API।
অ্যাসিঙ্ক্রোনাস হাইপারপ্যারামিটার টিউনিং কাজগুলি চালু করুন
সংশ্লিষ্ট পড়ুন নোটবই পাইথন স্ট্যান্ডার্ড লাইব্রেরি ব্যবহার করে হাইপারপ্যারামিটার টিউনিং কাজগুলি অ্যাসিঙ্ক্রোনাসভাবে চালু করার বিষয়ে বাস্তবায়নের বিশদ বিবরণের জন্য সমবর্তী ভবিষ্যৎ মডিউল, অ্যাসিঙ্ক্রোনাসভাবে চলা কলেবলের জন্য একটি উচ্চ-স্তরের ইন্টারফেস। বেশ কিছু সেজমেকার-সম্পর্কিত বিবেচনা এই সমাধানে প্রয়োগ করা হয়েছে:
- প্রতিটি AWS অ্যাকাউন্টের সাথে অনুমোদিত সেজমেকার পরিষেবা কোটা. আপনার সংস্থানগুলি সম্পূর্ণরূপে ব্যবহার করতে আপনার বর্তমান সীমাগুলি দেখা উচিত এবং প্রয়োজন অনুসারে সম্পদ সীমা বাড়ানোর জন্য সম্ভাব্য অনুরোধ করা উচিত।
- ঘন ঘন API কল অনেকগুলি যুগপত হাইপারপ্যারামিটার টিউনিং কাজ তৈরি করতে পারে পাইথন SDK হার অতিক্রম করুন এবং থ্রটলিং ব্যতিক্রমগুলি নিক্ষেপ করুন৷. এটির একটি রেজোলিউশন হল একটি কাস্টম পুনরায় চেষ্টা কনফিগারেশন সহ একটি SageMaker Boto3 ক্লায়েন্ট তৈরি করা।
- যদি আপনার স্ক্রিপ্ট একটি ত্রুটি সম্মুখীন হয় বা স্ক্রিপ্ট সমাপ্তির আগে বন্ধ করা হয় কি হবে? এই ধরনের একটি বড় মডেল নির্বাচন বা বেঞ্চমার্কিং অধ্যয়নের জন্য, আপনি কাজের নামগুলি টিউনিং করতে পারেন এবং সুবিধার ফাংশন প্রদান করতে পারেন হাইপারপ্যারামিটার টিউনিং কাজগুলি পুনরায় সংযুক্ত করুন যা ইতিমধ্যে বিদ্যমান:
বিশ্লেষণ বিবরণ এবং আলোচনা
এই পোস্টের বিশ্লেষণের জন্য স্থানান্তর শেখার কাজ করে মডেল আইডি ক্যালটেক-256 ডেটাসেটে জাম্পস্টার্ট টেনসরফ্লো ইমেজ ক্লাসিফিকেশন অ্যালগরিদমে। সমস্ত প্রশিক্ষণের কাজ সেজমেকার প্রশিক্ষণ উদাহরণ ml.g4dn.xlarge-এ সম্পাদিত হয়েছিল, যার মধ্যে একটি একক NVIDIA T4 GPU রয়েছে।
প্রশিক্ষণের শেষে প্রশিক্ষণের উদাহরণে পরীক্ষার ডেটাসেট মূল্যায়ন করা হয়। মডেল নির্বাচন পরীক্ষা ডেটাসেট মূল্যায়নের আগে সঞ্চালিত হয় সেরা বৈধতা সেট কর্মক্ষমতা সহ যুগে মডেল ওজন সেট করতে। টেস্ট থ্রুপুট অপ্টিমাইজ করা হয় না: ডেটাসেট ব্যাচের আকার ডিফল্ট প্রশিক্ষণ হাইপারপ্যারামিটার ব্যাচ আকারে সেট করা হয়, যা GPU মেমরি ব্যবহার সর্বাধিক করার জন্য সামঞ্জস্য করা হয় না; রিপোর্ট করা টেস্ট থ্রুপুটে ডেটা লোডিং সময় অন্তর্ভুক্ত কারণ ডেটাসেটটি প্রি-ক্যাশেড নয়; এবং একাধিক GPU জুড়ে বিতরণ করা অনুমান ব্যবহার করা হয় না। এই কারণে, এই থ্রুপুটটি একটি ভাল আপেক্ষিক পরিমাপ, কিন্তু প্রকৃত থ্রুপুট প্রশিক্ষিত মডেলের জন্য আপনার অনুমানের শেষ পয়েন্ট স্থাপনার কনফিগারেশনের উপর ব্যাপকভাবে নির্ভর করবে।
যদিও জাম্পস্টার্ট মডেল হাবটিতে অনেকগুলি ইমেজ ক্লাসিফিকেশন আর্কিটেকচারের ধরন রয়েছে, এই প্যারেটো ফ্রন্টিয়ারে নির্বাচিত সুইন, এফিশিয়েন্টনেট এবং মোবাইলনেট মডেলের আধিপত্য রয়েছে। সুইন মডেলগুলি বড় এবং তুলনামূলকভাবে আরও সঠিক, যেখানে MobileNet মডেলগুলি ছোট, তুলনামূলকভাবে কম নির্ভুল এবং মোবাইল ডিভাইসের সংস্থান সীমাবদ্ধতার জন্য উপযুক্ত। এটি লক্ষ্য করা গুরুত্বপূর্ণ যে এই সীমান্তটি বিভিন্ন কারণের উপর শর্তযুক্ত, যার মধ্যে ব্যবহৃত সঠিক ডেটাসেট এবং সূক্ষ্ম-টিউনিং হাইপারপ্যারামিটারগুলি অন্তর্ভুক্ত রয়েছে। আপনি দেখতে পারেন যে আপনার কাস্টম ডেটাসেট প্যারেটো দক্ষ সমাধানগুলির একটি ভিন্ন সেট তৈরি করে, এবং আপনি বিভিন্ন হাইপারপ্যারামিটারের সাথে দীর্ঘ প্রশিক্ষণের সময় কামনা করতে পারেন, যেমন মডেলের শীর্ষ শ্রেণিবিন্যাস স্তরের চেয়ে আরও বেশি ডেটা বৃদ্ধি বা সূক্ষ্ম-টিউনিং।
উপসংহার
এই পোস্টে, আমরা দেখিয়েছি কিভাবে জাম্পস্টার্ট মডেল হাব ব্যবহার করে বড় আকারের মডেল নির্বাচন বা বেঞ্চমার্কিং কাজ চালানো যায়। এই সমাধান আপনাকে আপনার প্রয়োজনের জন্য সেরা মডেল চয়ন করতে সাহায্য করতে পারে। আমরা আপনাকে এটি চেষ্টা করার এবং অন্বেষণ করতে উত্সাহিত করি সমাধান আপনার নিজস্ব ডেটাসেটে।
তথ্যসূত্র
নিম্নলিখিত সংস্থানগুলিতে আরও তথ্য পাওয়া যায়:
লেখক সম্পর্কে
ডাঃ কাইল উলরিচ সঙ্গে একজন ফলিত বিজ্ঞানী Amazon SageMaker বিল্ট-ইন অ্যালগরিদম টীম. তার গবেষণার আগ্রহের মধ্যে রয়েছে স্কেলযোগ্য মেশিন লার্নিং অ্যালগরিদম, কম্পিউটার ভিশন, টাইম সিরিজ, বায়েসিয়ান নন-প্যারামেট্রিক্স এবং গাউসিয়ান প্রক্রিয়া। তার পিএইচডি ডিউক বিশ্ববিদ্যালয় থেকে এবং তিনি নিউরিআইপিএস, সেল এবং নিউরনে গবেষণাপত্র প্রকাশ করেছেন।
আশিস খেতান ড সঙ্গে একজন সিনিয়র ফলিত বিজ্ঞানী Amazon SageMaker বিল্ট-ইন অ্যালগরিদম এবং মেশিন লার্নিং অ্যালগরিদম বিকাশে সহায়তা করে। তিনি ইউনিভার্সিটি অফ ইলিনয় আরবানা চ্যাম্পেইন থেকে পিএইচডি লাভ করেন। তিনি মেশিন লার্নিং এবং পরিসংখ্যানগত অনুমানের একজন সক্রিয় গবেষক এবং NeurIPS, ICML, ICLR, JMLR, ACL, এবং EMNLP সম্মেলনে অনেক গবেষণাপত্র প্রকাশ করেছেন।
- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- প্লেটোব্লকচেন। Web3 মেটাভার্স ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- উত্স: https://aws.amazon.com/blogs/machine-learning/image-classification-model-selection-using-amazon-sagemaker-jumpstart/
- 10
- 100
- 7
- 9
- a
- সম্পর্কে
- প্রবেশ
- প্রবেশযোগ্য
- হিসাব
- সঠিকতা
- সঠিক
- অর্জন করা
- দিয়ে
- সক্রিয়
- যোগ
- ঠিকানা
- ঠিকানাগুলি
- স্থায়ী
- সম্বন্ধযুক্ত
- বিরুদ্ধে
- অ্যালগরিদম
- আলগোরিদিম
- সব
- ইতিমধ্যে
- যদিও
- সর্বদা
- মর্দানী স্ত্রীলোক
- আমাজন সেজমেকার
- আমাজন সেজমেকার জাম্পস্টার্ট
- বিশ্লেষণ
- বিশ্লেষণ
- এবং
- অন্য
- API
- আবেদন
- ফলিত
- উপযুক্তভাবে
- স্থাপত্য
- এলাকায়
- যুক্তি
- যুক্ত
- সংযুক্ত
- প্রচেষ্টা
- স্বয়ংক্রিয়
- সহজলভ্য
- গড়
- ডেস্কটপ AWS
- ভিত্তি
- বায়েসিয়ান
- কারণ
- আগে
- হচ্ছে
- মাপকাঠিতে
- সর্বোত্তম
- বিশাল
- বিল্ট-ইন
- ব্যবসায়
- কল
- প্রার্থী
- মামলা
- বিভাগ
- চ্যালেঞ্জিং
- চরিত্রগত
- বেছে নিন
- শ্রেণী
- শ্রেণীবিন্যাস
- শ্রেণীভুক্ত করা
- মক্কেল
- মিলিত
- সাধারণ
- তুলনা
- সম্পূর্ণ
- সম্পন্ন হয়েছে
- পরিপূরণ
- জটিলতা
- কম্পিউটার
- কম্পিউটার ভিশন
- উদ্বেগ
- সম্মেলন
- কনফিগারেশন
- সংযুক্ত
- সংযোগ
- বিবেচ্য বিষয়
- সীমাবদ্ধতার
- ধারণ
- অবিরত
- নিয়ামক
- নিয়ন্ত্রণগুলি
- সুবিধা
- অনুরূপ
- আবরণ
- সৃষ্টি
- বর্তমান
- বাঁক
- প্রথা
- উপাত্ত
- ডেটাসেট
- গভীর
- ডিফল্ট
- নির্ভর করে
- স্থাপন
- মোতায়েন
- বিস্তৃতি
- গভীরতা
- বর্ণিত
- বিবরণ
- বিস্তারিত
- বিকাশ
- ডিভাইস
- বিভিন্ন
- আলোচনা করা
- বণ্টিত
- বিচিত্র
- না
- সর্দার
- ডিউক বিশ্ববিদ্যালয়
- সময়
- প্রতি
- পূর্বে
- গোড়ার দিকে
- সহজ
- দক্ষ
- পারেন
- বাছা
- সক্ষম করা
- উত্সাহিত করা
- প্রণোদিত
- সর্বশেষ সীমা
- শেষপ্রান্ত
- পরিবেশ
- কাল
- পর্বগুলি
- ভুল
- মূল্যায়ন
- মূল্যায়ন
- মূল্যায়ন
- উদাহরণ
- উদাহরণ
- ছাড়া
- অন্বেষণ করুণ
- এক্সপ্লোরিং
- এক্সপ্রেশন
- নির্যাস
- কারণের
- ন্যায্য
- আনুকূল্য
- বৈশিষ্ট্য
- বৈশিষ্ট্য
- ক্ষেত্রসমূহ
- ব্যক্তিত্ব
- পরিশেষে
- আবিষ্কার
- প্রথম
- মানানসই
- অনুসরণ
- সাবেক
- থেকে
- সীমান্ত
- সীমানা
- সম্পূর্ণরূপে
- ক্রিয়াকলাপ
- ভবিষ্যৎ
- ফিউচার
- উত্পাদন করা
- পাওয়া
- প্রদত্ত
- বিশ্বব্যাপী
- ভাল
- জিপিইউ
- জিপিইউ
- মহান
- বৃহত্তর
- Green
- এরকম
- প্রচন্ডভাবে
- সাহায্য
- সাহায্য
- উচ্চস্তর
- উচ্চ গুনসম্পন্ন
- ঊর্ধ্বতন
- কিভাবে
- কিভাবে
- এইচটিএমএল
- HTTPS দ্বারা
- নাভি
- শত শত
- হাইপারপ্যারামিটার টিউনিং
- ইলিনয়
- ভাবমূর্তি
- ছবির শ্রেণীবিভাগ
- চিত্র
- বাস্তবায়ন
- বাস্তবায়ন
- বাস্তবায়িত
- গুরুত্ব
- গুরুত্বপূর্ণ
- উন্নতি
- উন্নতি
- in
- অন্তর্ভুক্ত করা
- অন্তর্ভুক্ত
- সুদ্ধ
- বৃদ্ধি
- বৃদ্ধি
- ক্রমবর্ধমান
- সূচক
- তথ্য
- ইনপুট
- উদাহরণ
- স্বার্থ
- মধ্যে রয়েছে
- ইন্টারফেস
- অভ্যন্তরীণ
- স্বকীয়
- প্রবর্তন করা
- IT
- কাজ
- জবস
- JSON
- চাবি
- কী
- লেবেল
- লেবেলগুলি
- বড়
- বড় আকারের
- বৃহত্তর
- অদৃশ্যতা
- লঞ্চ
- চালু করা
- স্তর
- স্তর
- নেতৃত্ব
- শিখতে
- শিক্ষা
- উদ্ধরণ
- আলো
- LIMIT টি
- সীমা
- তালিকা
- পাখি
- বোঝাই
- দীর্ঘ
- আর
- ক্ষতি
- মেশিন
- মেশিন লার্নিং
- মেকিং
- অনেক
- চরমে তোলা
- অর্থপূর্ণ
- পরিমাপ
- স্মৃতি
- ছন্দোময়
- ছন্দোবিজ্ঞান
- ML
- মোবাইল
- মোবাইল ডিভাইস
- মডেল
- মডেল
- মডিউল
- অধিক
- বহু
- নাম
- নাম
- প্রয়োজনীয়
- চাহিদা
- নেটওয়ার্ক
- নতুন
- নোটবই
- সংখ্যা
- এনভিডিয়া
- লক্ষ্য
- বস্তু
- মান্য করা
- প্রাপ্ত
- প্রাপ্ত
- ONE
- অপারেটিং
- অপারেশনস
- অপ্টিমাইজ
- রূপরেখা
- নিজের
- কাগজপত্র
- স্থিতিমাপ
- পরামিতি
- বিশেষ
- ধৈর্য
- পিডিএফ
- সম্পাদন করা
- কর্মক্ষমতা
- সঞ্চালিত
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- বিন্দু
- পয়েন্ট
- জনপ্রিয়
- সম্ভব
- পোস্ট
- সম্ভাব্য
- pr
- প্রতিরোধ
- পূর্বে
- সমস্যা
- সমস্যা
- প্রক্রিয়া
- প্রসেস
- প্রদান
- প্রদত্ত
- উপলব্ধ
- প্রদানের
- প্রকাশিত
- পাইথন
- প্রশ্ন
- প্রশ্ন
- দ্রুত
- র্যাম
- হার
- হার
- বাস্তব জগতে
- কারণে
- হ্রাস
- নিয়মিত
- অপেক্ষাকৃতভাবে
- অপসারণ
- রিপোর্ট
- চিত্রিত করা
- প্রতিনিধিত্ব
- প্রতিনিধিত্ব করে
- অনুরোধ
- প্রয়োজনীয়
- আবশ্যকতা
- প্রয়োজন
- গবেষণা
- গবেষক
- সমাধান
- সংস্থান
- Resources
- প্রতিক্রিয়া
- ফলাফল
- চালান
- দৌড়
- ঋষি নির্মাতা
- একই
- মাপযোগ্য
- বিজ্ঞানী
- স্ক্রিপ্ট
- SDK
- সার্চ
- অধ্যায়
- নির্বাচিত
- নির্বাচন
- নির্বাচন
- জ্যেষ্ঠ
- ক্রম
- সেবা
- সেশন
- সেট
- সেট
- বিন্যাস
- বিভিন্ন
- আকৃতি
- উচিত
- শো
- একভাবে
- সহজতর করা
- একক
- ছয়
- আয়তন
- মাপ
- ছোট
- ক্ষুদ্রতর
- So
- সমাধান
- সলিউশন
- সমাধান
- সবিস্তার বিবরণী
- স্পেসিফিকেশনের
- নিদিষ্ট
- মান
- শুরু
- পরিসংখ্যানসংক্রান্ত
- ধাপ
- বন্ধ
- বাঁধন
- সঞ্চিত
- অধ্যয়ন
- পরবর্তী
- এমন
- যথেষ্ট
- উপযুক্ত
- টেবিল
- লক্ষ্যবস্তু
- কার্য
- কাজ
- টীম
- tensorflow
- পরীক্ষা
- সার্জারির
- তাদের
- যার ফলে
- তিন
- থ্রুপুট
- সময়
- সময় সিরিজ
- বার
- থেকে
- আজ
- একসঙ্গে
- সরঞ্জাম
- শীর্ষ
- শীর্ষ 5
- মোট
- রেলগাড়ি
- প্রশিক্ষিত
- প্রশিক্ষণ
- হস্তান্তর
- ট্রান্সফরমার
- সত্য
- ধরনের
- পরিণামে
- অধীনে
- অনন্য
- বিশ্ববিদ্যালয়
- ব্যবহার
- ব্যবহার
- সদ্ব্যবহার করা
- ব্যবহার
- বৈধতা
- মানগুলি
- বৈচিত্র্য
- সুবিশাল
- মাধ্যমে
- চেক
- দৃষ্টি
- যে
- যখন
- সমগ্র
- ব্যাপক
- ইচ্ছা
- মধ্যে
- ছাড়া
- would
- লেখা
- আপনি
- আপনার
- zephyrnet