আমাজন রেকোনিশন ইমেজ এবং ভিডিও থেকে তথ্য এবং অন্তর্দৃষ্টি আহরণ করার জন্য প্রাক-প্রশিক্ষিত এবং কাস্টমাইজযোগ্য কম্পিউটার দৃষ্টি ক্ষমতা অফার করে। এরকম একটি ক্ষমতা হল আমাজন স্বীকৃতি লেবেল, যা চিত্রগুলিতে বস্তু, দৃশ্য, ক্রিয়া এবং ধারণা সনাক্ত করে। গ্রাহকরা যেমন সিঙ্ক্রোনস, Shutterstock, এবং Nomad Media তাদের বিষয়বস্তু লাইব্রেরিতে স্বয়ংক্রিয়ভাবে মেটাডেটা যোগ করতে এবং বিষয়বস্তু-ভিত্তিক অনুসন্ধান ফলাফল সক্ষম করতে Amazon Recognition Labels ব্যবহার করে। TripleLift শ্রোতাদের দেখার অভিজ্ঞতার পরিপূরক বিজ্ঞাপনগুলি গতিশীলভাবে সন্নিবেশ করার জন্য সেরা মুহূর্তগুলি নির্ধারণ করতে Amazon Recognition Labels ব্যবহার করে৷ vidmob বিজ্ঞাপন কার্য সম্পাদনে সৃজনশীল সিদ্ধান্ত গ্রহণের অনন্য ভূমিকা বোঝার জন্য বিজ্ঞাপন ক্রিয়েটিভগুলি থেকে মেটাডেটা বের করতে Amazon Recognition Labels ব্যবহার করে, যাতে বিপণনকারীরা এমন বিজ্ঞাপন তৈরি করতে পারে যা তাদের সবচেয়ে বেশি যত্নশীল মূল উদ্দেশ্যগুলিকে প্রভাবিত করে৷ উপরন্তু, হাজার হাজার অন্যান্য গ্রাহকরা অ্যামাজন রিকগনিশন লেবেল ব্যবহার করে অনেক অন্যান্য ব্যবহারের ক্ষেত্রে সমর্থন করতে, যেমন ট্রেইল বা হাইকিং ফটো শ্রেণীবদ্ধ করা, নিরাপত্তা ক্যামেরা ফুটেজে মানুষ বা যানবাহন সনাক্ত করা এবং পরিচয় নথির ছবি শ্রেণীবদ্ধ করা।
চিত্রগুলির জন্য অ্যামাজন স্বীকৃতি লেবেলগুলি ল্যান্ডমার্ক এবং কার্যকলাপ সহ 600টি নতুন লেবেল সনাক্ত করে এবং 2,000টিরও বেশি বিদ্যমান লেবেলের জন্য সঠিকতা উন্নত করে৷ এছাড়াও, অ্যামাজন রেকগনিশন লেবেলগুলি এখন একটি চিত্রের প্রভাবশালী রঙ, এর অগ্রভাগ এবং পটভূমি, সেইসাথে বাউন্ডিং বাক্স সহ সনাক্ত করা বস্তুগুলি সনাক্ত করতে চিত্র বৈশিষ্ট্যগুলিকে সমর্থন করে। চিত্রের বৈশিষ্ট্যগুলি চিত্রের উজ্জ্বলতা, তীক্ষ্ণতা এবং বৈসাদৃশ্যও পরিমাপ করে। অবশেষে, অ্যামাজন স্বীকৃতি লেবেলগুলি এখন দুটি অতিরিক্ত ক্ষেত্র ব্যবহার করে লেবেল ফলাফলগুলি সংগঠিত করে, aliases
এবং categories
, এবং সেই ফলাফলগুলির ফিল্টারিং সমর্থন করে। নিম্নলিখিত বিভাগে, আমরা কিছু উদাহরণ সহ আরও বিস্তারিতভাবে নতুন ক্ষমতা এবং তাদের সুবিধাগুলি পর্যালোচনা করি।
নতুন লেবেল
অ্যামাজন রেকগনিশন লেবেলগুলি 600 টিরও বেশি নতুন লেবেল যুক্ত করেছে, সমর্থিত লেবেলের তালিকা প্রসারিত করেছে৷ নতুন লেবেলের কিছু উদাহরণ নিচে দেওয়া হল:
- জনপ্রিয় ল্যান্ডমার্ক - ব্রুকলিন ব্রিজ, কলোসিয়াম, আইফেল টাওয়ার, মাচু পিচু, তাজমহল ইত্যাদি।
- ক্রিয়াকলাপ - করতালি, সাইকেল চালানো, উদযাপন, জাম্পিং, হাঁটা কুকুর, ইত্যাদি।
- ক্ষতি সনাক্তকরণ - কার ডেন্ট, কার স্ক্র্যাচ, জারা, বাড়ির ক্ষতি, ছাদের ক্ষতি, টেরমাইট ড্যামেজ ইত্যাদি।
- পাঠ্য এবং নথি - বার চার্ট, বোর্ডিং পাস, ফ্লো চার্ট, নোটবুক, চালান, রসিদ, ইত্যাদি।
- বিজ্ঞাপন - বেসবল গেম, ক্রিকেট ব্যাট, ফিগার স্কেটিং, রাগবি, ওয়াটার পোলো ইত্যাদি।
- আরো অনেক - বোট রেসিং, মজা, সিটিস্কেপ, গ্রাম, বিয়ের প্রস্তাব, ভোজ ইত্যাদি।
এই লেবেলগুলির সাহায্যে, ইমেজ শেয়ারিং, স্টক ফটোগ্রাফি, বা সম্প্রচার মিডিয়ার গ্রাহকরা তাদের অনুসন্ধান ক্ষমতা উন্নত করতে স্বয়ংক্রিয়ভাবে তাদের সামগ্রী লাইব্রেরিতে নতুন মেটাডেটা যোগ করতে পারে।
আসুন ব্রুকলিন ব্রিজের জন্য একটি লেবেল সনাক্তকরণ উদাহরণ দেখি।
নিম্নলিখিত সারণীটি API প্রতিক্রিয়াতে ফিরে আসা লেবেল এবং আত্মবিশ্বাসের স্কোরগুলি দেখায়৷
লেবেলগুলি | আত্মবিশ্বাসের স্কোর |
ব্রুকলিন সেতু | 95.6 |
সেতু | 95.6 |
বৈশিষ্ট্য | 95.6 |
উন্নত লেবেল
অ্যামাজন রিকগনিশন লেবেলগুলি 2,000টিরও বেশি লেবেলের জন্য নির্ভুলতা উন্নত করেছে৷ নিম্নে উন্নত লেবেলের কিছু উদাহরণ দেওয়া হল:
- ক্রিয়াকলাপ - ডাইভিং, ড্রাইভিং, পড়া, বসা, দাঁড়ানো, ইত্যাদি
- পোশাক এবং আনুষাঙ্গিক - ব্যাকপ্যাক, বেল্ট, ব্লাউজ, হুডি, জ্যাকেট, জুতো ইত্যাদি।
- বাড়িতে এবং বাড়ির ভিতরে - সুইমিং পুল, পটেড প্ল্যান্ট, বালিশ, ফায়ারপ্লেস, কম্বল ইত্যাদি।
- প্রযুক্তি এবং কম্পিউটিং - হেডফোন, মোবাইল ফোন, ট্যাবলেট কম্পিউটার, রিডিং, ল্যাপটপ ইত্যাদি।
- যানবাহন এবং স্বয়ংচালিত - ট্রাক, চাকা, টায়ার, বাম্পার, গাড়ির আসন, গাড়ির আয়না ইত্যাদি।
- পাঠ্য এবং নথি - পাসপোর্ট, ড্রাইভিং লাইসেন্স, বিজনেস কার্ড, ডকুমেন্ট ইত্যাদি।
- আরো অনেক - কুকুর, ক্যাঙ্গারু, টাউন স্কোয়ার, উৎসব, হাসি, ইত্যাদি।
প্রভাবশালী রঙ সনাক্তকরণ এবং ছবির গুণমানের জন্য চিত্র বৈশিষ্ট্য
ইমেজ প্রোপার্টি হল আমাজন রিকোগনিশন লেবেলের ইমেজগুলির একটি নতুন ক্ষমতা, এবং লেবেল সনাক্তকরণ কার্যকারিতা সহ বা ছাড়া ব্যবহার করা যেতে পারে। দ্রষ্টব্য: চিত্র বৈশিষ্ট্য হল আলাদাভাবে দাম Amazon Recognition Labels থেকে, এবং শুধুমাত্র আপডেট করা SDK-এর সাথে উপলব্ধ।
প্রভাবশালী রঙ সনাক্তকরণ
ছবি বৈশিষ্ট্য পিক্সেল শতাংশের উপর ভিত্তি করে একটি ছবিতে প্রভাবশালী রং চিহ্নিত করে। এই প্রভাবশালী রং ম্যাপ করা হয় 140 CSS কালার প্যালেট, RGB, হেক্স কোড, এবং 12টি সরলীকৃত রং (সবুজ, গোলাপী, কালো, লাল, হলুদ, সায়ান, বাদামী, কমলা, সাদা, বেগুনি, নীল, ধূসর)। ডিফল্টরূপে, API 10টি প্রভাবশালী রং প্রদান করে যদি না আপনি ফেরত দেওয়ার জন্য রঙের সংখ্যা উল্লেখ করেন। এপিআই ফেরত দিতে পারে এমন প্রভাবশালী রঙের সর্বাধিক সংখ্যা হল 12টি।
যখন স্বতন্ত্র ব্যবহার করা হয়, তখন ইমেজ প্রোপার্টি একটি সম্পূর্ণ ছবির প্রভাবশালী রঙের পাশাপাশি এর অগ্রভাগ এবং পটভূমি সনাক্ত করে। লেবেল সনাক্তকরণ কার্যকারিতাগুলির সাথে একত্রে ব্যবহার করা হলে, চিত্র বৈশিষ্ট্যগুলি বাউন্ডিং বাক্সগুলির সাথে সনাক্ত করা বস্তুর প্রভাবশালী রঙগুলিকেও চিহ্নিত করে।
ইমেজ শেয়ারিং বা স্টক ফটোগ্রাফিতে গ্রাহকরা তাদের ইমেজ লাইব্রেরি মেটাডেটা সমৃদ্ধ করার জন্য প্রভাবশালী রঙ সনাক্তকরণ ব্যবহার করতে পারেন বিষয়বস্তু আবিষ্কারের উন্নতি করতে, তাদের শেষ-ব্যবহারকারীরা রঙের দ্বারা ফিল্টার করতে বা নির্দিষ্ট রং দিয়ে বস্তু অনুসন্ধান করতে দেয়, যেমন "নীল চেয়ার" বা "লাল জুতা"। " উপরন্তু, বিজ্ঞাপনের গ্রাহকরা তাদের সৃজনশীল সম্পদের রঙের উপর ভিত্তি করে বিজ্ঞাপনের কার্যকারিতা নির্ধারণ করতে পারেন।
ছবির মান
প্রভাবশালী রঙ সনাক্তকরণের পাশাপাশি, চিত্র বৈশিষ্ট্যগুলি উজ্জ্বলতা, তীক্ষ্ণতা এবং বৈসাদৃশ্য স্কোরের মাধ্যমে চিত্রের গুণাবলীও পরিমাপ করে। এই স্কোরগুলির প্রত্যেকটি 0-100 পর্যন্ত। উদাহরণস্বরূপ, একটি খুব গাঢ় ছবি কম উজ্জ্বলতার মান প্রদান করবে, যেখানে একটি উজ্জ্বল আলোকিত চিত্র উচ্চ মান প্রদান করবে।
এই স্কোরগুলির সাহায্যে, ইমেজ শেয়ারিং, বিজ্ঞাপন বা ইকমার্সের গ্রাহকরা মান পরিদর্শন করতে পারে এবং মিথ্যা লেবেল ভবিষ্যদ্বাণীগুলি কমাতে কম উজ্জ্বলতা এবং তীক্ষ্ণতা সহ ছবিগুলি ফিল্টার করতে পারে৷
নিম্নলিখিত চিত্রটি আইফেল টাওয়ারের সাথে একটি উদাহরণ দেখায়।
নিম্নলিখিত টেবিলটি API প্রতিক্রিয়াতে ফিরে আসা চিত্র বৈশিষ্ট্য ডেটার একটি উদাহরণ।
নিম্নলিখিত চিত্রটি একটি লাল চেয়ারের উদাহরণ।
API প্রতিক্রিয়ায় প্রত্যাবর্তিত চিত্র বৈশিষ্ট্য ডেটার একটি উদাহরণ নিম্নলিখিত।
নীচের চিত্রটি একটি হলুদ ব্যাকগ্রাউন্ড সহ একটি কুকুরের উদাহরণ।
API প্রতিক্রিয়ায় প্রত্যাবর্তিত চিত্র বৈশিষ্ট্য ডেটার একটি উদাহরণ নিম্নলিখিত।
নতুন উপনাম এবং বিভাগ ক্ষেত্র
অ্যামাজন স্বীকৃতি লেবেলগুলি এখন দুটি নতুন ক্ষেত্র ফেরত দেয়, aliases
এবং categories
, API প্রতিক্রিয়াতে। উপনামগুলি একই লেবেলের অন্যান্য নাম এবং 40টি সাধারণ থিমের উপর ভিত্তি করে পৃথক পৃথক লেবেলগুলিকে শ্রেণীবদ্ধ করে, যেমন Food and Beverage
এবং Animals and Pets
. লেবেল সনাক্তকরণ মডেল আপডেটের সাথে, উপনামগুলি আর লেবেল নামের প্রাথমিক তালিকায় ফেরত দেওয়া হয় না। পরিবর্তে, উপনামগুলি নতুনটিতে ফিরিয়ে দেওয়া হয় aliases
API প্রতিক্রিয়ার ক্ষেত্র। দ্রষ্টব্য: উপনাম এবং বিভাগগুলি শুধুমাত্র আপডেট করা SDKগুলির সাথে ফেরত দেওয়া হয়৷
ফটো শেয়ারিং, ইকমার্স বা বিজ্ঞাপনের গ্রাহকরা কন্টেন্ট অনুসন্ধান এবং ফিল্টারিং আরও উন্নত করতে তাদের সামগ্রী মেটাডেটা শ্রেণীবিন্যাস সংগঠিত করতে উপনাম এবং বিভাগ ব্যবহার করতে পারেন:
- উপনাম উদাহরণ - কারণ
Car
এবংAutomobile
উপনাম হয়, আপনি এর সাথে একটি ছবিতে মেটাডেটা যোগ করতে পারেনCar
এবংAutomobile
একই সময়ে - বিভাগ উদাহরণ - আপনি একটি বিভাগ ফিল্টার তৈরি করতে বিভাগগুলি ব্যবহার করতে পারেন বা একটি নির্দিষ্ট বিভাগের সাথে সম্পর্কিত সমস্ত চিত্র প্রদর্শন করতে পারেন, যেমন৷
Food and Beverage
, এর সাথে প্রতিটি ছবিতে স্পষ্টভাবে মেটাডেটা যোগ না করেFood and Beverage
নিচের চিত্রটি একটি ডুবুরির জন্য উপনাম এবং বিভাগ সহ একটি লেবেল সনাক্তকরণ উদাহরণ দেখায়৷
নিম্নলিখিত সারণী API প্রতিক্রিয়াতে ফিরে আসা লেবেল, আত্মবিশ্বাসের স্কোর, উপনাম এবং বিভাগগুলি দেখায়।
লেবেলগুলি | আত্মবিশ্বাসের স্কোর | ওরফে | বিভাগ |
প্রকৃতি | 99.9 | - | প্রকৃতি এবং বাইরে |
পানি | 99.9 | - | প্রকৃতি এবং বাইরে |
স্কুবা ডাইভিং | 99.9 | অ্যাকোয়া স্কুবা | ভ্রমণ এবং দু: সাহসিক কাজ |
ব্যক্তি | 99.9 | মানবীয় | ব্যক্তির বিবরণ |
অবসরের কাজ | 99.9 | চিত্তবিনোদন | ভ্রমণ এবং দু: সাহসিক কাজ |
খেলা | 99.9 | বিজ্ঞাপন | বিজ্ঞাপন |
নিম্নলিখিত চিত্রটি একটি সাইক্লিস্টের জন্য একটি উদাহরণ।
নিম্নলিখিত সারণীতে API প্রতিক্রিয়াতে ফিরে আসা লেবেল, আত্মবিশ্বাসের স্কোর, উপনাম এবং বিভাগ রয়েছে।
লেবেলগুলি | আত্মবিশ্বাসের স্কোর | ওরফে | বিভাগ |
আকাশ | 99.9 | - | প্রকৃতি এবং বাইরে |
বিদেশে | 99.9 | - | প্রকৃতি এবং বাইরে |
ব্যক্তি | 98.3 | মানবীয় | ব্যক্তির বিবরণ |
সূর্যাস্ত | 98.1 | সন্ধ্যা, ভোর | প্রকৃতি এবং বাইরে |
সাইকেল | 96.1 | সাইকেল | শখ ও আগ্রহ |
সাইকেলে চলা | 85.1 | সাইকেল চালক, বাইক সাইকেল চালক | কার্যপ্রণালী |
অন্তর্ভুক্তি এবং বর্জন ফিল্টার
অ্যামাজন রেকগনিশন লেবেলগুলি API ইনপুট প্যারামিটারগুলিতে নতুন অন্তর্ভুক্তি এবং বর্জন ফিল্টারিং বিকল্পগুলি প্রবর্তন করে যাতে API প্রতিক্রিয়াতে ফিরে আসা লেবেলের নির্দিষ্ট তালিকাকে সংকুচিত করা যায়। আপনি লেবেল বা বিভাগগুলির একটি সুস্পষ্ট তালিকা প্রদান করতে পারেন যা আপনি অন্তর্ভুক্ত করতে চান বা বাদ দিতে চান৷ দ্রষ্টব্য: এই ফিল্টারগুলি আপডেট করা SDK-এর সাথে উপলব্ধ।
গ্রাহকরা তাদের আবেদনে অতিরিক্ত যুক্তি তৈরি না করেই তাদের আগ্রহের নির্দিষ্ট লেবেল বা বিভাগগুলি পেতে অন্তর্ভুক্তি এবং বর্জন ফিল্টার ব্যবহার করতে পারেন। উদাহরণস্বরূপ, বীমা গ্রাহকরা ব্যবহার করতে পারেন LabelCategoriesInclusionFilter
শুধুমাত্র লেবেল ফলাফল অন্তর্ভুক্ত করতে Damage Detection
বিভাগ।
নিম্নলিখিত কোডটি অন্তর্ভুক্তি এবং বর্জন ফিল্টার সহ একটি API নমুনা অনুরোধ:
অন্তর্ভুক্তি এবং বর্জন ফিল্টার কীভাবে কাজ করে তার উদাহরণ নিচে দেওয়া হল:
- আপনি যদি শুধুমাত্র সনাক্ত করতে চান
Person
এবংCar
, এবং অন্যান্য লেবেল সম্পর্কে চিন্তা করবেন না, আপনি নির্দিষ্ট করতে পারেন [“Person”,”Car”
] মধ্যেLabelsInclusionFilter
. - আপনি ছাড়া সব লেবেল সনাক্ত করতে চান
Clothing
, আপনি উল্লেখ করতে পারেন [“Clothing”
] মধ্যেLabelsExclusionFilter
. - আপনি যদি এর মধ্যে শুধুমাত্র লেবেল সনাক্ত করতে চান
Animal and Pets
ব্যতীত বিভাগDog
এবংCat
, আপনি উল্লেখ করতে পারেন ["Animal and Pets"
] মধ্যেLabelCategoriesInclusionFilter
, সঙ্গে ["Dog", "Cat"
] মধ্যেLabelsExclusionFilter
. - যদি একটি লেবেল নির্দিষ্ট করা হয়
LabelsInclusionFilter
orLabelsExclusionFilter
, তাদের উপনামগুলি সেই অনুযায়ী অন্তর্ভুক্ত বা বাদ দেওয়া হবে কারণaliases
লেবেলের একটি উপ-শ্রেণীবিন্যাস। উদাহরণস্বরূপ, কারণAutomobile
এর একটি উপনামCar
, যদি আপনি নির্দিষ্ট করেনCar
inLabelsInclusionFilter
, API ফেরত দেবেCar
লেবেল দিয়েAutomobile
মধ্যেaliases
ক্ষেত্র।
উপসংহার
Amazon Recognition Labels 600 টি নতুন লেবেল সনাক্ত করে এবং 2,000 টিরও বেশি বিদ্যমান লেবেলের জন্য নির্ভুলতা উন্নত করে৷ এই আপডেটগুলির সাথে, অ্যামাজন রিকগনিশন লেবেলগুলি এখন ইমেজ প্রোপার্টি, উপনাম এবং বিভাগগুলির পাশাপাশি অন্তর্ভুক্তি এবং অন্তর্ভুক্তি ফিল্টারগুলিকে সমর্থন করে৷
নতুন বৈশিষ্ট্যগুলির সাথে নতুন লেবেল সনাক্তকরণ মডেলটি চেষ্টা করতে, আপনার AWS অ্যাকাউন্টে লগ ইন করুন এবং চেক আউট করুন৷ অ্যামাজন রিকগনিশন কনসোল লেবেল সনাক্তকরণ এবং চিত্র বৈশিষ্ট্যের জন্য। আরো জানতে, পরিদর্শন করুন লেবেল সনাক্ত করা হচ্ছে.
লেখক সম্পর্কে
মারিয়া হ্যান্ডোকো AWS-এর একজন সিনিয়র প্রোডাক্ট ম্যানেজার। তিনি মেশিন লার্নিং এবং কম্পিউটার ভিশনের মাধ্যমে গ্রাহকদের তাদের ব্যবসায়িক চ্যালেঞ্জগুলি সমাধান করতে সহায়তা করার দিকে মনোনিবেশ করেন। তার অবসর সময়ে, তিনি হাইকিং, পডকাস্ট শুনতে এবং বিভিন্ন রান্নার অন্বেষণ উপভোগ করেন।
শিপ্রা কানোরিয়া AWS-এর একজন প্রধান পণ্য ব্যবস্থাপক। তিনি মেশিন লার্নিং এবং কৃত্রিম বুদ্ধিমত্তার মাধ্যমে গ্রাহকদের তাদের সবচেয়ে জটিল সমস্যা সমাধানে সাহায্য করার জন্য উত্সাহী৷ AWS-এ যোগদানের আগে, শিপ্রা Amazon Alexa-এ 4 বছরেরও বেশি সময় কাটিয়েছেন, যেখানে তিনি Alexa ভয়েস সহকারীতে অনেক উত্পাদনশীলতা-সম্পর্কিত বৈশিষ্ট্য চালু করেছেন।
- AI
- ai শিল্প
- এআই আর্ট জেনারেটর
- আইআই রোবট
- আমাজন রেকোনিশন
- কৃত্রিম বুদ্ধিমত্তা
- কৃত্রিম বুদ্ধিমত্তা সার্টিফিকেশন
- ব্যাংকিং এ কৃত্রিম বুদ্ধিমত্তা
- কৃত্রিম বুদ্ধিমত্তার রোবট
- কৃত্রিম বুদ্ধিমত্তার রোবট
- কৃত্রিম বুদ্ধিমত্তা সফ্টওয়্যার
- এডাব্লুএস মেশিন লার্নিং
- blockchain
- ব্লকচেইন সম্মেলন এআই
- coingenius
- কথোপকথন কৃত্রিম বুদ্ধিমত্তা
- ক্রিপ্টো সম্মেলন এআই
- ডাল-ই
- গভীর জ্ঞানার্জন
- গুগল আই
- মেশিন লার্নিং
- Plato
- প্লেটো এআই
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটো গেম
- প্লেটোডাটা
- প্লেটোগেমিং
- স্কেল ai
- বাক্য গঠন
- zephyrnet