আপনার অ্যামাজন স্বীকৃতি কাস্টম লেবেল মডেল উন্নত করার টিপস

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

এই পোস্টে, আমরা ব্যবহার করে আপনার কম্পিউটার ভিশন মডেলগুলির কর্মক্ষমতা উন্নত করার সর্বোত্তম অনুশীলনগুলি নিয়ে আলোচনা করব অ্যামাজন স্বীকৃতি কাস্টম লেবেল. রিকগনিশন কাস্টম লেবেল হল ছবি শ্রেণীবিভাগ এবং অবজেক্ট সনাক্তকরণ ব্যবহারের ক্ষেত্রে কাস্টম কম্পিউটার ভিশন মডেল তৈরি করার জন্য একটি সম্পূর্ণরূপে পরিচালিত পরিষেবা। রিকগনিশন কাস্টম লেবেলগুলি প্রাক-প্রশিক্ষিত মডেলগুলির মধ্যে তৈরি করে৷ আমাজন রেকোনিশন, যা ইতিমধ্যেই বিভিন্ন বিভাগে লক্ষ লক্ষ ছবির উপর প্রশিক্ষিত। হাজার হাজার চিত্রের পরিবর্তে, আপনি প্রশিক্ষণের চিত্রগুলির একটি ছোট সেট (কয়েক শত বা তার কম) দিয়ে শুরু করতে পারেন যা আপনার ব্যবহারের ক্ষেত্রে নির্দিষ্ট। স্বীকৃতি কাস্টম লেবেলগুলি একটি কাস্টম মডেল তৈরিতে জড়িত জটিলতাকে বিমূর্ত করে। এটি স্বয়ংক্রিয়ভাবে প্রশিক্ষণের ডেটা পরিদর্শন করে, সঠিক ML অ্যালগরিদম নির্বাচন করে, উদাহরণের ধরন নির্বাচন করে, বিভিন্ন হাইপারপ্যারামিটার সেটিংস সহ একাধিক প্রার্থী মডেলকে প্রশিক্ষণ দেয় এবং সেরা প্রশিক্ষিত মডেল আউটপুট করে। স্বীকৃতি কাস্টম লেবেলগুলি থেকে একটি সহজে ব্যবহারযোগ্য ইন্টারফেস প্রদান করে৷ এডাব্লুএস ম্যানেজমেন্ট কনসোল লেবেল ইমেজ, মডেল প্রশিক্ষণ, মডেল স্থাপন, এবং পরীক্ষার ফলাফল ভিজ্যুয়ালাইজ সহ সমগ্র ML কর্মপ্রবাহ পরিচালনার জন্য।

এমন সময় আছে যখন একটি মডেলের নির্ভুলতা সর্বোত্তম নয় এবং মডেলের কনফিগারেশন পরামিতিগুলি সামঞ্জস্য করার জন্য আপনার কাছে অনেকগুলি বিকল্প নেই৷ পর্দার আড়ালে এমন একাধিক কারণ রয়েছে যা একটি উচ্চ-সম্পাদক মডেল তৈরিতে মূল ভূমিকা পালন করে, যেমন নিম্নলিখিতগুলি:

ছবির কোণ
চিত্র রেজল্যুশন
ছবির আকৃতির অনুপাত
হালকা এক্সপোজার
পটভূমির স্বচ্ছতা এবং প্রাণবন্ততা
রঙ বিপরীতে
নমুনা ডেটা আকার

একটি উত্পাদন-গ্রেড স্বীকৃতি কাস্টম লেবেল মডেল প্রশিক্ষণের জন্য নিম্নলিখিত সাধারণ পদক্ষেপগুলি অনুসরণ করতে হবে:

শ্রেণীবিন্যাস পর্যালোচনা করুন - এটি বৈশিষ্ট্য/আইটেমের তালিকা নির্ধারণ করে যা আপনি একটি ছবিতে সনাক্ত করতে চান।
প্রাসঙ্গিক তথ্য সংগ্রহ করুন - এটি হল সবচেয়ে গুরুত্বপূর্ণ পদক্ষেপ, যেখানে আপনাকে প্রাসঙ্গিক চিত্র সংগ্রহ করতে হবে যা আপনি একটি উত্পাদন পরিবেশে যা দেখতে পাবেন তার অনুরূপ হওয়া উচিত। এটি বিভিন্ন ব্যাকগ্রাউন্ড, আলো, বা ক্যামেরা কোণ সহ বস্তুর ছবি জড়িত হতে পারে। তারপরে আপনি সংগ্রহ করা চিত্রগুলিকে বিভক্ত করে একটি প্রশিক্ষণ এবং পরীক্ষার ডেটাসেট তৈরি করুন৷ টেস্টিং ডেটাসেটের অংশ হিসেবে আপনার শুধুমাত্র বাস্তব-বিশ্বের ছবি অন্তর্ভুক্ত করা উচিত এবং কোনো কৃত্রিমভাবে তৈরি করা ছবি অন্তর্ভুক্ত করা উচিত নয়। আপনার সংগ্রহ করা ডেটার টীকাগুলি মডেল পারফরম্যান্সের জন্য অত্যন্ত গুরুত্বপূর্ণ। নিশ্চিত করুন যে বাউন্ডিং বাক্সগুলি বস্তুর চারপাশে শক্ত আছে এবং লেবেলগুলি সঠিক। আমরা এই পোস্টে পরে একটি উপযুক্ত ডেটাসেট তৈরি করার সময় আপনি বিবেচনা করতে পারেন এমন কিছু টিপস নিয়ে আলোচনা করেছি।
প্রশিক্ষণের মেট্রিক্স পর্যালোচনা করুন - একটি মডেলকে প্রশিক্ষণ দিতে এবং F1 স্কোর, নির্ভুলতা, এবং স্মরণের জন্য প্রশিক্ষণের মেট্রিক্স পর্যালোচনা করতে পূর্ববর্তী ডেটাসেটগুলি ব্যবহার করুন। আমরা এই পোস্টে পরে প্রশিক্ষণের মেট্রিক্স কীভাবে বিশ্লেষণ করতে হয় সে সম্পর্কে বিস্তারিত আলোচনা করব।
প্রশিক্ষিত মডেল মূল্যায়ন - পূর্বাভাস মূল্যায়ন করতে পরিচিত লেবেল সহ অদেখা চিত্রগুলির একটি সেট (মডেল প্রশিক্ষণের জন্য ব্যবহৃত হয় না) ব্যবহার করুন। মডেলটি উৎপাদন পরিবেশে প্রত্যাশিতভাবে কাজ করে কিনা তা নিশ্চিত করার জন্য এই পদক্ষেপটি সর্বদা করা উচিত।
পুনরায় প্রশিক্ষণ (ঐচ্ছিক) - সাধারণভাবে, যে কোনো মেশিন লার্নিং মডেলকে প্রশিক্ষণ দেওয়া হল কাঙ্ক্ষিত ফলাফল অর্জনের জন্য একটি পুনরাবৃত্তিমূলক প্রক্রিয়া, একটি কম্পিউটার ভিশন মডেল আলাদা নয়। ধাপ 4-এ ফলাফল পর্যালোচনা করুন, প্রশিক্ষণের ডেটাতে আরও ছবি যোগ করতে হবে কিনা তা দেখতে এবং উপরের ধাপ 3 - 5 পুনরাবৃত্তি করুন।

এই পোস্টে, আমরা আপনার মডেলের কর্মক্ষমতা উন্নত করার জন্য প্রাসঙ্গিক ডেটা সংগ্রহ (ধাপ 2) এবং আপনার প্রশিক্ষিত মেট্রিক্স (ধাপ 3) মূল্যায়নের সর্বোত্তম অনুশীলনের উপর ফোকাস করি।

প্রাসঙ্গিক তথ্য সংগ্রহ করুন

এটি একটি উৎপাদন-গ্রেড স্বীকৃতি কাস্টম লেবেল মডেল প্রশিক্ষণের সবচেয়ে গুরুত্বপূর্ণ পর্যায়। বিশেষত, দুটি ডেটাসেট রয়েছে: প্রশিক্ষণ এবং পরীক্ষা। প্রশিক্ষণ ডেটা মডেল প্রশিক্ষণের জন্য ব্যবহার করা হয়, এবং আপনাকে একটি উপযুক্ত প্রশিক্ষণ সেট তৈরির প্রচেষ্টা ব্যয় করতে হবে। স্বীকৃতি কাস্টম লেবেল মডেলের জন্য অপ্টিমাইজ করা হয় F1 স্কোর আপনার প্রকল্পের জন্য সবচেয়ে সঠিক মডেল নির্বাচন করতে টেস্টিং ডেটাসেটে। অতএব, বাস্তব বিশ্বের অনুরূপ একটি টেস্টিং ডেটাসেট কিউরেট করা অপরিহার্য।

ছবির সংখ্যা

আমরা প্রতি লেবেলে ন্যূনতম 15-20টি ছবি রাখার পরামর্শ দিই। আপনার ব্যবহারের ক্ষেত্রে প্রতিফলিত করে এমন আরও বৈচিত্র সহ আরও চিত্র থাকা মডেলের কার্যকারিতা উন্নত করবে।

সুষম ডেটাসেট

আদর্শভাবে, ডেটাসেটের প্রতিটি লেবেলে একই সংখ্যক নমুনা থাকা উচিত। প্রতি লেবেল চিত্রের সংখ্যায় ব্যাপক বৈষম্য থাকা উচিত নয়। উদাহরণস্বরূপ, একটি ডেটাসেট যেখানে একটি লেবেলের জন্য সর্বাধিক সংখ্যক চিত্র 1,000 বনাম অন্য লেবেলের জন্য 50টি চিত্র একটি ভারসাম্যহীন ডেটাসেটের সাথে সাদৃশ্যপূর্ণ। আমরা সর্বনিম্ন সংখ্যক চিত্র সহ লেবেলের মধ্যে 1:50 এর একমুখী অনুপাত সহ পরিস্থিতিগুলি এড়ানোর পরামর্শ দিই বনাম সর্বাধিক সংখ্যক চিত্র সহ লেবেল৷

বিভিন্ন ধরনের ছবি

প্রশিক্ষণ এবং পরীক্ষার ডেটাসেটে চিত্রগুলি অন্তর্ভুক্ত করুন যা আপনি বাস্তব জগতে যা ব্যবহার করবেন তার সাথে সাদৃশ্যপূর্ণ। উদাহরণস্বরূপ, যদি আপনি লিভিং রুম বনাম শয়নকক্ষের চিত্রগুলিকে শ্রেণিবদ্ধ করতে চান তবে আপনার উভয় কক্ষের খালি এবং সজ্জিত চিত্রগুলি অন্তর্ভুক্ত করা উচিত।

নীচে একটি সজ্জিত বসার ঘরের একটি উদাহরণ চিত্র।

বিপরীতে, নিম্নোক্ত একটি অসজ্জিত বসার ঘরের উদাহরণ।

নীচে একটি সজ্জিত বেডরুমের একটি উদাহরণ চিত্র।

নিচে একটি অসজ্জিত বেডরুমের একটি উদাহরণ চিত্র।

ভিন্ন ভিন্ন পটভূমি

বিভিন্ন ব্যাকগ্রাউন্ড সহ ছবি অন্তর্ভুক্ত করুন। স্বাভাবিক প্রেক্ষাপট সহ চিত্রগুলি প্লেইন ব্যাকগ্রাউন্ডের চেয়ে ভাল ফলাফল দিতে পারে।

নীচে একটি বাড়ির সামনের উঠানের একটি উদাহরণ চিত্র।

নীচে একটি ভিন্ন পটভূমি সহ একটি ভিন্ন বাড়ির সামনের উঠানের একটি উদাহরণ চিত্র।

বিভিন্ন আলোর অবস্থা

বিভিন্ন আলোকসজ্জা সহ চিত্রগুলি অন্তর্ভুক্ত করুন যাতে এটি অনুমানের সময় ঘটে যাওয়া বিভিন্ন আলোর অবস্থাকে কভার করে (উদাহরণস্বরূপ, ফ্ল্যাশ সহ এবং ছাড়া)। আপনি বিভিন্ন স্যাচুরেশন, হিউ এবং উজ্জ্বলতার সাথে ছবিও অন্তর্ভুক্ত করতে পারেন।

নিম্নে সাধারণ আলোর অধীনে একটি ফুলের একটি উদাহরণ চিত্র।

বিপরীতে, নিম্নলিখিত চিত্রটি উজ্জ্বল আলোতে একই ফুলের।

বিভিন্ন কোণ

বস্তুর বিভিন্ন কোণ থেকে তোলা ছবি অন্তর্ভুক্ত করুন। এটি মডেলটিকে বস্তুর বিভিন্ন বৈশিষ্ট্য শিখতে সাহায্য করে।

নিচের ছবিগুলো বিভিন্ন কোণ থেকে একই বেডরুমের।

আপনার Amazon Recognition কাস্টম লেবেল মডেল PlatoBlockchain ডেটা ইন্টেলিজেন্স উন্নত করার টিপস। উল্লম্ব অনুসন্ধান. আ.

এমন কিছু অনুষ্ঠান হতে পারে যেখানে বিভিন্ন ধরনের ছবি অর্জন করা সম্ভব নয়। এই পরিস্থিতিতে, সিন্থেটিক চিত্রগুলি প্রশিক্ষণ ডেটাসেটের অংশ হিসাবে তৈরি করা যেতে পারে। সাধারণ চিত্র বৃদ্ধি কৌশল সম্পর্কে আরও তথ্যের জন্য, পড়ুন ডেটা অগমেন্টেশন.

নেতিবাচক লেবেল যোগ করুন

ছবির শ্রেণীবিভাগের জন্য, নেতিবাচক লেবেল যোগ করা মডেলের নির্ভুলতা বাড়াতে সাহায্য করতে পারে। উদাহরণস্বরূপ, আপনি একটি নেতিবাচক লেবেল যোগ করতে পারেন, যা প্রয়োজনীয় লেবেলের সাথে মেলে না। নিম্নলিখিত চিত্রটি সম্পূর্ণভাবে বেড়ে ওঠা ফুল শনাক্ত করতে ব্যবহৃত বিভিন্ন লেবেলগুলিকে উপস্থাপন করে।

নেতিবাচক লেবেল যোগ করা হচ্ছে not_fully_grown মডেলটিকে এমন বৈশিষ্ট্য শিখতে সাহায্য করে যা এর অংশ নয় fully_grown লেবেল।

লেবেল বিভ্রান্তি পরিচালনা করা

প্রশিক্ষণ বা টেস্টিং ডেটাসেটে মিস করা কোনো প্যাটার্ন সনাক্ত করতে পরীক্ষার ডেটাসেটের ফলাফলগুলি বিশ্লেষণ করুন। কখনও কখনও দৃশ্যত চিত্রগুলি পরীক্ষা করে এই ধরনের নিদর্শনগুলি সনাক্ত করা সহজ। নিম্নলিখিত ছবিতে, মডেলটি একটি বাড়ির উঠোন বনাম প্যাটিও লেবেলের মধ্যে সমাধান করতে লড়াই করছে৷

এই পরিস্থিতিতে, ডেটাসেটে এই লেবেলগুলিতে আরও ছবি যুক্ত করা এবং লেবেলগুলিকে পুনরায় সংজ্ঞায়িত করা যাতে প্রতিটি লেবেল আলাদা হয় মডেলের নির্ভুলতা বাড়াতে সাহায্য করতে পারে৷

তথ্য বৃদ্ধি

রিকগনিশন কাস্টম লেবেলের ভিতরে, আমরা মডেল প্রশিক্ষণের জন্য বিভিন্ন ডেটা বৃদ্ধি করি, যার মধ্যে চিত্রের র্যান্ডম ক্রপিং, রঙের ঝাঁকুনি, এলোমেলো গাউসিয়ান নয়েজ এবং আরও অনেক কিছু। আপনার নির্দিষ্ট ব্যবহারের ক্ষেত্রের উপর ভিত্তি করে, আপনার প্রশিক্ষণের ডেটাতে আরও সুস্পষ্ট ডেটা বৃদ্ধি যোগ করাও উপকারী হতে পারে। উদাহরণস্বরূপ, আপনি যদি রঙ এবং কালো এবং সাদা উভয় ছবিতে প্রাণী সনাক্ত করতে আগ্রহী হন, তাহলে প্রশিক্ষণ ডেটাতে একই চিত্রের কালো এবং সাদা এবং রঙিন সংস্করণ যোগ করে আপনি সম্ভাব্যভাবে আরও সঠিকতা পেতে পারেন।

আমরা পরীক্ষার ডেটাতে বৃদ্ধির সুপারিশ করি না যদি না পরিবর্ধনগুলি আপনার উত্পাদন ব্যবহারের ক্ষেত্রে প্রতিফলিত হয়।

প্রশিক্ষণের মেট্রিক্স পর্যালোচনা করুন

F1 স্কোর, নির্ভুলতা, প্রত্যাহার, এবং অনুমান থ্রেশহোল্ড হল ছন্দোবিজ্ঞান যেগুলো রেকগনিশন কাস্টম লেবেল ব্যবহার করে একটি মডেলকে প্রশিক্ষণের আউটপুট হিসেবে তৈরি করা হয়। প্রদত্ত টেস্টিং ডেটাসেটের উপর ভিত্তি করে মডেলগুলি সেরা F1 স্কোরের জন্য অপ্টিমাইজ করা হয়েছে৷ টেস্টিং ডেটাসেটের উপর ভিত্তি করে অনুমান থ্রেশহোল্ডও তৈরি করা হয়। আপনি নির্ভুলতা বা প্রত্যাহার পরিপ্রেক্ষিতে আপনার ব্যবসার প্রয়োজনের উপর ভিত্তি করে থ্রেশহোল্ড সামঞ্জস্য করতে পারেন।

যেহেতু অনুমান করা থ্রেশহোল্ডগুলি পরীক্ষার ডেটাসেটে সেট করা হয়েছে, একটি উপযুক্ত পরীক্ষার সেটটি বাস্তব-বিশ্বের উত্পাদন ব্যবহারের ক্ষেত্রে প্রতিফলিত হওয়া উচিত। পরীক্ষার ডেটাসেটটি ব্যবহারের ক্ষেত্রে প্রতিনিধি না হলে, আপনি আপনার বাস্তব-বিশ্বের চিত্রগুলিতে কৃত্রিমভাবে উচ্চ F1 স্কোর এবং খারাপ মডেলের কর্মক্ষমতা দেখতে পাবেন।

মডেলের প্রাথমিক মূল্যায়ন করার সময় এই মেট্রিকগুলি সহায়ক। একটি প্রোডাকশন-গ্রেড সিস্টেমের জন্য, আমরা একটি বাহ্যিক ডেটাসেটের (500-1,000 অদেখা ছবি) বাস্তব জগতের প্রতিনিধির বিপরীতে মডেলটিকে মূল্যায়ন করার সুপারিশ করি। এটি একটি উত্পাদন ব্যবস্থায় মডেলটি কীভাবে কার্য সম্পাদন করবে তা মূল্যায়ন করতে এবং অনুপস্থিত নিদর্শনগুলি সনাক্ত করতে এবং মডেলটিকে পুনরায় প্রশিক্ষণের মাধ্যমে সংশোধন করতে সহায়তা করে। আপনি যদি F1 স্কোর এবং বাহ্যিক মূল্যায়নের মধ্যে অমিল দেখতে পান, তাহলে আমরা আপনাকে পরীক্ষা করার পরামর্শ দিই যে আপনার পরীক্ষার ডেটা বাস্তব-বিশ্ব ব্যবহারের ক্ষেত্রে প্রতিফলিত হচ্ছে কিনা।

উপসংহার

এই পোস্টে, আমরা আপনাকে স্বীকৃতি কাস্টম লেবেল মডেলগুলি উন্নত করার জন্য সর্বোত্তম অনুশীলনের মাধ্যমে নিয়ে চলেছি। আমরা আপনাকে সম্পর্কে আরও জানতে উত্সাহিত করি কাস্টম লেবেল স্বীকৃতি এবং আপনার ব্যবসা-নির্দিষ্ট ডেটাসেটের জন্য এটি ব্যবহার করে দেখুন।

লেখক সম্পর্কে

অমিত গুপ্ত AWS-এর একজন সিনিয়র এআই সার্ভিসেস সলিউশন আর্কিটেক্ট। তিনি স্কেলে ভাল আর্কিটেক্টেড মেশিন লার্নিং সমাধানগুলির সাথে গ্রাহকদের সক্ষম করার বিষয়ে উত্সাহী।

যোগেশ চতুর্বেদী কম্পিউটার ভিশনে ফোকাস সহ AWS-এর একজন সলিউশন আর্কিটেক্ট। তিনি ক্লাউড প্রযুক্তি ব্যবহার করে গ্রাহকদের তাদের ব্যবসায়িক চ্যালেঞ্জ মোকাবেলার জন্য কাজ করেন। কাজের বাইরে, তিনি হাইকিং, ভ্রমণ এবং খেলাধুলা দেখতে উপভোগ করেন।

হাও ইয়াং আমাজন স্বীকৃতি কাস্টম লেবেল দলের একজন সিনিয়র ফলিত বিজ্ঞানী। তার প্রধান গবেষণার আগ্রহ হল বস্তু সনাক্তকরণ এবং সীমিত টীকা সহ শেখা। বাইরের কাজ, হাও ফিল্ম, ফটোগ্রাফি এবং বাইরের ক্রিয়াকলাপ দেখতে উপভোগ করে।

পশমীন মিস্ত্রী অ্যামাজন স্বীকৃতি কাস্টম লেবেলের জন্য সিনিয়র পণ্য ব্যবস্থাপক। কাজের বাইরে, পশমিন দুঃসাহসিক হাইকিং, ফটোগ্রাফি এবং তার পরিবারের সাথে সময় কাটাতে উপভোগ করে।

সময় স্ট্যাম্প: সেপ্টেম্বর 9, 2022সেপ্টেম্বর 10, 2022

থেকে আরো এডাব্লুএস মেশিন লার্নিং

মেন্ডিক্স কিভাবে জেনারেটিভ এআই এবং অ্যামাজন বেডরক এর সাথে গ্রাহকদের অভিজ্ঞতা পরিবর্তন করছে আমাজন ওয়েব সার্ভিসেস

এডাব্লুএস মেশিন লার্নিং

উত্স নোড: 1913698

সময় স্ট্যাম্প: নভেম্বর 15, 2023

অ্যামাজন EKS-তে PyTorch 2.0 FSDP সহ LLM স্কেল করুন – পার্ট 2 | আমাজন ওয়েব সার্ভিসেস

উত্স ক্লাস্টার:

এডাব্লুএস মেশিন লার্নিং

উত্স নোড: 1960833

সময় স্ট্যাম্প: এপ্রিল 1, 2024

আপনার Amazon Recognition কাস্টম লেবেল মডেল উন্নত করার টিপস

প্লেটো দ্বারা প্রকাশিত

প্রাসঙ্গিক তথ্য সংগ্রহ করুন

ছবির সংখ্যা

সুষম ডেটাসেট

বিভিন্ন ধরনের ছবি

ভিন্ন ভিন্ন পটভূমি

বিভিন্ন আলোর অবস্থা

বিভিন্ন কোণ

নেতিবাচক লেবেল যোগ করুন

লেবেল বিভ্রান্তি পরিচালনা করা

তথ্য বৃদ্ধি

প্রশিক্ষণের মেট্রিক্স পর্যালোচনা করুন

উপসংহার

লেখক সম্পর্কে

থেকে আরো এডাব্লুএস মেশিন লার্নিং

Amazon SageMaker-এ টেনসরফ্লো ইমেজ ক্লাসিফিকেশন মডেলের জন্য ট্রান্সফার লার্নিং

Renate দিয়ে নিউরাল নেটওয়ার্কগুলিকে স্বয়ংক্রিয়ভাবে পুনরায় প্রশিক্ষণ দিন

আমাজন পূর্বাভাসের সাথে খুচরা ব্যবসায় স্থায়িত্ব এবং আর্থিক ফলাফল উন্নত করতে খাদ্যের অপচয় হ্রাস করুন

Amazon SageMaker Data Wrangler ব্যবহার করে মেশিন লার্নিংয়ের জন্য Amazon EMR থেকে ডেটা প্রস্তুত করুন

Amazon SageMaker-এ ensemble ML মডেল চালান

আমাদের সম্পর্কে

উল্লম্ব অনুসন্ধান এবং আই

প্ল্যাটফর্ম

যোগাযোগ রেখো

হিসাব