ইমেজ ক্লাসিফিকেশন হল একটি কম্পিউটার ভিশন-ভিত্তিক মেশিন লার্নিং (ML) কৌশল যা আপনাকে ছবি শ্রেণীবদ্ধ করতে দেয়। ইমেজ শ্রেণীবিভাগের কিছু সুপরিচিত উদাহরণের মধ্যে রয়েছে হস্তলিখিত অঙ্ক শ্রেণীবিন্যাস করা, মেডিকেল ইমেজ শ্রেণীবিভাগ, এবং মুখের স্বীকৃতি। ছবি শ্রেণীবিভাগ বেশ কিছু ব্যবসায়িক অ্যাপ্লিকেশন সহ একটি দরকারী কৌশল, কিন্তু একটি ভাল চিত্র শ্রেণীবিভাগ মডেল তৈরি করা তুচ্ছ নয়।
একটি ML মডেল মূল্যায়ন করার সময় বেশ কয়েকটি বিবেচনা একটি ভূমিকা পালন করতে পারে। মডেল নির্ভুলতার বাইরে, গুরুত্বের অন্যান্য সম্ভাব্য মেট্রিক্স হল মডেল প্রশিক্ষণের সময় এবং অনুমানের সময়। এমএল মডেল বিকাশের পুনরাবৃত্তিমূলক প্রকৃতির প্রেক্ষিতে, দ্রুত প্রশিক্ষণের সময় ডেটা বিজ্ঞানীদের দ্রুত বিভিন্ন অনুমান পরীক্ষা করার অনুমতি দেয়। দ্রুত অনুমান করা রিয়েল-টাইম অ্যাপ্লিকেশনগুলিতে গুরুত্বপূর্ণ হতে পারে।
আমাজন সেজমেকার জাম্পস্টার্ট জনপ্রিয় ML টাস্ক জুড়ে এক-ক্লিক ফাইন-টিউনিং এবং বিভিন্ন ধরণের প্রাক-প্রশিক্ষিত মডেলের স্থাপনা প্রদান করে, সেইসাথে সাধারণ ব্যবসায়িক সমস্যার সমাধান করে এমন এন্ড-টু-এন্ড সমাধানগুলির একটি নির্বাচন। এই বৈশিষ্ট্যগুলি ML প্রক্রিয়ার প্রতিটি ধাপ থেকে ভারী উত্তোলনকে সরিয়ে দেয়, এটি উচ্চ-মানের মডেলগুলি বিকাশ করা সহজ করে এবং স্থাপনার সময় হ্রাস করে। জাম্পস্টার্ট API আপনাকে আপনার নিজস্ব ডেটাসেটে জাম্পস্টার্ট-সমর্থিত প্রাক-প্রশিক্ষিত মডেলগুলির একটি বিশাল নির্বাচন প্রোগ্রাম্যাটিকভাবে স্থাপন এবং সূক্ষ্ম-টিউন করার অনুমতি দেয়।
আপনি মোতায়েন করার আগে জাম্পস্টার্টে দেওয়া এমএল মডেলগুলিকে ক্রমবর্ধমানভাবে প্রশিক্ষণ এবং টিউন করতে পারেন। লেখার সময়, জাম্পস্টার্টে 87টি গভীর-শিক্ষা ভিত্তিক চিত্র শ্রেণিবিন্যাস মডেল পাওয়া যায়।
কিন্তু কোন মডেল আপনাকে সেরা ফলাফল দেবে? এই পোস্টে, আমরা একাধিক মডেল সহজে চালানোর জন্য একটি পদ্ধতি উপস্থাপন করি এবং আগ্রহের তিনটি মাত্রার সাথে তাদের আউটপুট তুলনা করি: মডেলের নির্ভুলতা, প্রশিক্ষণের সময় এবং অনুমান সময়।
সমাধান ওভারভিউ
জাম্পস্টার্ট আপনাকে জাম্পস্টার্ট কনসোল থেকে এর UI ব্যবহার করে বা এর API দিয়ে মডেলগুলিকে প্রশিক্ষণ, টিউন এবং স্থাপন করার অনুমতি দেয়। এই পোস্টে, আমরা API রুট ব্যবহার করি এবং বিভিন্ন সহায়ক স্ক্রিপ্ট সহ একটি নোটবুক উপস্থাপন করি। আপনি এই নোটবুকটি চালাতে পারেন এবং একে অপরের সাথে এই মডেলগুলির সহজ তুলনা করার জন্য ফলাফল পেতে পারেন, এবং তারপর মডেলের নির্ভুলতা, প্রশিক্ষণের সময় এবং অনুমান সময়ের পরিপ্রেক্ষিতে আপনার ব্যবসার প্রয়োজনের জন্য সবচেয়ে উপযুক্ত একটি মডেল বেছে নিন।
সার্জারির পাবলিক ডেটাসেট এই পোস্টে ব্যবহৃত প্রায় 55,000টি রোগাক্রান্ত এবং সুস্থ গাছের পাতার ছবি রয়েছে যা নিয়ন্ত্রিত অবস্থায় সংগ্রহ করা হয়েছে, যার ক্লাস লেবেল 0-38 এর মধ্যে রয়েছে। এই ডেটাসেটটিকে ট্রেন এবং বৈধকরণ ডেটাসেটে ভাগ করা হয়েছে, প্রায় 44,000টি প্রশিক্ষণের অধীনে এবং 11,000টি ছবি বৈধকরণের অধীনে রয়েছে৷ নিচে কয়েকটি নমুনা ছবি দেওয়া হল।
এই অনুশীলনের জন্য, আমরা দুটি ফ্রেমওয়ার্ক থেকে মডেল নির্বাচন করেছি—PyTorch এবং TensorFlow—যেমন জাম্পস্টার্ট দেওয়া হয়েছে। নিম্নলিখিত 15টি মডেল অ্যালগরিদম এই ফ্রেমওয়ার্কগুলি থেকে জনপ্রিয় নিউরাল নেটওয়ার্ক আর্কিটেকচারের বিস্তৃত পরিসর কভার করে:
pytorch-ic-alexnet-FT
pytorch-ic-densenet121-FT
pytorch-ic-densenet201-FT
pytorch-ic-googlenet-FT
pytorch-ic-mobilenet-v2-FT
pytorch-ic-resnet152-FT
pytorch-ic-resnet34-FT
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
tensorflow-ic-imagenet-inception-v3-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT
আমরা মডেল ব্যবহার tensorflow-ic-imagenet-inception-v3-classification-4-FT
একটি ভিত্তি হিসাবে যার বিপরীতে অন্যান্য মডেলের ফলাফল তুলনা করা হয়। এই বেস মডেল নির্বিচারে বাছাই করা হয়েছে.
এই তুলনা চালানোর জন্য ব্যবহৃত কোড পাওয়া যায় AWS নমুনা GitHub রেপো.
ফলাফল
এই বিভাগে, আমরা এই 15 রানের ফলাফল উপস্থাপন করি। এই সমস্ত রানের জন্য, ব্যবহৃত হাইপারপ্যারামিটারগুলি ছিল epochs = 5, শেখার হার = 0.001, ব্যাচের আকার = 16।
মডেল নির্ভুলতা, প্রশিক্ষণ সময়, এবং মডেল থেকে অনুমান সময় tensorflow-ic-imagenet-inception-v3-classification-4-FT
বেস হিসাবে নেওয়া হয়েছিল, এবং অন্যান্য সমস্ত মডেলের ফলাফলগুলি এই বেস মডেলের সাথে সম্পর্কিত উপস্থাপন করা হয়েছে। এখানে আমাদের উদ্দেশ্য কোন মডেলটি সেরা তা দেখানো নয় বরং দেখান কিভাবে, JumpStart API-এর মাধ্যমে, আপনি বিভিন্ন মডেলের ফলাফলের তুলনা করতে পারেন এবং তারপরে আপনার ব্যবহারের ক্ষেত্রে সবচেয়ে উপযুক্ত একটি মডেল বেছে নিতে পারেন।
নিম্নলিখিত স্ক্রিনশটটি বেস মডেলটিকে হাইলাইট করে যার সাথে অন্যান্য সমস্ত মডেলের তুলনা করা হয়েছিল৷
নিম্নলিখিত প্লট আপেক্ষিক নির্ভুলতা বনাম আপেক্ষিক প্রশিক্ষণ সময় একটি বিশদ দৃশ্য দেখায়। PyTorch মডেলগুলি লাল রঙে কোড করা হয় এবং TensorFlow মডেলগুলি নীল রঙে।
পূর্ববর্তী প্লটে একটি সবুজ উপবৃত্তাকার সাথে হাইলাইট করা মডেলগুলিতে আপেক্ষিক নির্ভুলতা এবং কম আপেক্ষিক প্রশিক্ষণ সময়ের একটি ভাল সমন্বয় রয়েছে বলে মনে হচ্ছে। নিম্নলিখিত সারণী এই তিনটি মডেল সম্পর্কে আরও বিশদ প্রদান করে।
ণশড | আপেক্ষিক নির্ভুলতা | আপেক্ষিক প্রশিক্ষণ সময় |
tensorflow-ic-imagenet-mobilenet-v2-050-224-শ্রেণীবিভাগ-4-FT | 1.01 | 0.74 |
tensorflow-ic-imagenet-mobilenet-v2-140-224-শ্রেণীবিভাগ-4-FT | 1.02 | 0.74 |
tensorflow-ic-bit-s-r101x1-ilsvrc2012-শ্রেণীবিন্যাস-1-FT | 1.04 | 1.16 |
নিম্নলিখিত প্লট আপেক্ষিক নির্ভুলতা বনাম আপেক্ষিক অনুমান সময়ের তুলনা করে। PyTorch মডেলগুলি লাল রঙে কোড করা হয় এবং TensorFlow মডেলগুলি নীল রঙে।
নীচের টেবিলটি সবুজ উপবৃত্তে তিনটি মডেলের বিশদ প্রদান করে।
ণশড | আপেক্ষিক নির্ভুলতা | আপেক্ষিক অনুমান সময় |
tensorflow-ic-imagenet-mobilenet-v2-050-224-শ্রেণীবিভাগ-4-FT | 1.01 | 0.94 |
tensorflow-ic-imagenet-mobilenet-v2-140-224-শ্রেণীবিভাগ-4-FT | 1.02 | 0.90 |
tensorflow-ic-bit-s-r101x1-ilsvrc2012-শ্রেণীবিন্যাস-1-FT | 1.04 | 1.43 |
দুটি প্লট স্পষ্টভাবে প্রদর্শন করে যে নির্দিষ্ট মডেল অ্যালগরিদমগুলি নির্বাচিত তিনটি মাত্রায় অন্যদের তুলনায় ভাল পারফর্ম করেছে৷ এই অনুশীলনের মাধ্যমে দেওয়া নমনীয়তা আপনাকে সঠিক অ্যালগরিদম বাছাই করতে সাহায্য করতে পারে এবং প্রদত্ত নোটবুক ব্যবহার করে, আপনি সহজেই 87টি উপলব্ধ মডেলের মধ্যে এই ধরনের পরীক্ষা চালাতে পারেন।
উপসংহার
এই পোস্টে, আমরা দেখিয়েছি কিভাবে জাম্পস্টার্ট ব্যবহার করে উচ্চ পারফরমিং ইমেজ ক্লাসিফিকেশন মডেল তৈরি করতে আগ্রহের একাধিক মাত্রা যেমন মডেলের যথার্থতা, প্রশিক্ষণের সময় এবং অনুমান লেটেন্সি। আমরা আপনার নিজস্ব ডেটাসেটে এই অনুশীলন চালানোর জন্য কোড প্রদান করেছি; জাম্পস্টার্ট মডেল হাবে ইমেজ শ্রেণীবিভাগের জন্য বর্তমানে উপলব্ধ ৮৭টি মডেল থেকে আপনি পছন্দের যে কোনো মডেল বেছে নিতে পারেন। আমরা আপনাকে আজ এটি চেষ্টা করতে উত্সাহিত করি।
জাম্পস্টার্ট সম্পর্কে আরও বিস্তারিত জানার জন্য, পড়ুন সেজমেকার জাম্পস্টার্ট.
লেখক সম্পর্কে
রাজু পেনমচা ডা AWS-এ AI প্ল্যাটফর্মে একজন AI/ML বিশেষজ্ঞ সমাধান স্থপতি৷ তিনি স্ট্যানফোর্ড ইউনিভার্সিটি থেকে পিএইচডি লাভ করেন। তিনি SageMaker-এর পরিষেবাগুলির নিম্ন/কোড-কোড স্যুটে ঘনিষ্ঠভাবে কাজ করেন, যা গ্রাহকদের সহজেই মেশিন লার্নিং মডেল এবং সমাধানগুলি তৈরি এবং স্থাপন করতে সহায়তা করে৷ গ্রাহকদের সাহায্য না করার সময়, তিনি নতুন জায়গায় ভ্রমণ পছন্দ করেন।
আশিস খেতান ড অ্যামাজন সেজমেকার বিল্ট-ইন অ্যালগরিদম সহ একজন সিনিয়র ফলিত বিজ্ঞানী এবং মেশিন লার্নিং অ্যালগরিদম বিকাশে সহায়তা করে। তিনি ইউনিভার্সিটি অফ ইলিনয় আরবানা-চ্যাম্পেইন থেকে পিএইচডি লাভ করেন। তিনি মেশিন লার্নিং এবং পরিসংখ্যানগত অনুমানে একজন সক্রিয় গবেষক এবং নিউরিআইপিএস, আইসিএমএল, আইসিএলআর, জেএমএলআর, এসিএল এবং ইএমএনএলপি সম্মেলনে অনেক গবেষণাপত্র প্রকাশ করেছেন।
- AI
- ai শিল্প
- এআই আর্ট জেনারেটর
- আইআই রোবট
- আমাজন সেজমেকার
- আমাজন সেজমেকার জাম্পস্টার্ট
- কৃত্রিম বুদ্ধিমত্তা
- কৃত্রিম বুদ্ধিমত্তা সার্টিফিকেশন
- ব্যাংকিং এ কৃত্রিম বুদ্ধিমত্তা
- কৃত্রিম বুদ্ধিমত্তার রোবট
- কৃত্রিম বুদ্ধিমত্তার রোবট
- কৃত্রিম বুদ্ধিমত্তা সফ্টওয়্যার
- এডাব্লুএস মেশিন লার্নিং
- blockchain
- ব্লকচেইন সম্মেলন এআই
- coingenius
- কথোপকথন কৃত্রিম বুদ্ধিমত্তা
- ক্রিপ্টো সম্মেলন এআই
- ডাল-ই
- গভীর জ্ঞানার্জন
- গুগল আই
- মধ্যবর্তী (200)
- মেশিন লার্নিং
- Plato
- প্লেটো এআই
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটো গেম
- প্লেটোডাটা
- প্লেটোগেমিং
- স্কেল ai
- বাক্য গঠন
- zephyrnet