একটি পরিচয় যাচাইকরণ সমাধান মূল্যায়নের জন্য মেট্রিক্স

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

বিশ্বব্যাপী, ঘর্ষণহীন ডিজিটাল ব্যবহারকারীর অভিজ্ঞতার দিকে একটি ত্বরিত পরিবর্তন হয়েছে। এটি একটি ওয়েবসাইটে নিবন্ধন করা, অনলাইনে লেনদেন করা, বা আপনার ব্যাঙ্ক অ্যাকাউন্টে লগ ইন করা যাই হোক না কেন, সংস্থাগুলি সক্রিয়ভাবে তাদের গ্রাহকদের অভিজ্ঞতা কমানোর চেষ্টা করছে এবং একই সাথে তাদের নিরাপত্তা, সম্মতি এবং জালিয়াতি প্রতিরোধ ব্যবস্থাগুলিকে উন্নত করছে৷ ঘর্ষণহীন ব্যবহারকারীর অভিজ্ঞতার দিকে পরিবর্তন মুখ-ভিত্তিক বায়োমেট্রিক পরিচয় যাচাইকরণ সমাধানের জন্ম দিয়েছে যার লক্ষ্য "ডিজিটাল বিশ্বে একজন ব্যক্তিকে কীভাবে যাচাই করবেন?" প্রশ্নের উত্তর দেওয়া।

মুখের বায়োমেট্রিক্সের দুটি মূল সুবিধা রয়েছে যখন এটি সনাক্তকরণ এবং প্রমাণীকরণের প্রশ্ন আসে। প্রথমত, এটি ব্যবহারকারীদের জন্য একটি সুবিধাজনক প্রযুক্তি: পাসওয়ার্ড মনে রাখার, মাল্টি-ফ্যাক্টর চ্যালেঞ্জ মোকাবেলা করার, যাচাইকরণ লিঙ্কে ক্লিক করার বা ক্যাপচা ধাঁধা সমাধান করার দরকার নেই। দ্বিতীয়ত, একটি উচ্চ স্তরের নিরাপত্তা অর্জিত হয়: ফেসিয়াল-বায়োমেট্রিক্সের ভিত্তিতে সনাক্তকরণ এবং প্রমাণীকরণ নিরাপদ এবং জালিয়াতি এবং আক্রমণের জন্য কম সংবেদনশীল।

এই পোস্টে, আমরা পরিচয় যাচাইকরণের দুটি প্রাথমিক ব্যবহারের ক্ষেত্রে ডুব দিয়েছি: অনবোর্ডিং এবং প্রমাণীকরণ। তারপরে আমরা একটি বায়োমেট্রিক সিস্টেমের নির্ভুলতা মূল্যায়ন করার জন্য ব্যবহৃত দুটি মূল মেট্রিকের মধ্যে ডুব দিই: মিথ্যা ম্যাচ রেট (যা মিথ্যা স্বীকৃতি হার হিসাবেও পরিচিত) এবং মিথ্যা অ-ম্যাচ রেট (যা মিথ্যা প্রত্যাখ্যান হার হিসাবেও পরিচিত)। বায়োমেট্রিক সিস্টেমের নির্ভুলতা এবং ত্রুটির হার মূল্যায়ন করার জন্য এই দুটি ব্যবস্থা ব্যাপকভাবে সংস্থাগুলি দ্বারা ব্যবহৃত হয়। অবশেষে, আমরা একটি পরিচয় যাচাইকরণ পরিষেবার মূল্যায়ন করার জন্য একটি কাঠামো এবং সর্বোত্তম অনুশীলন নিয়ে আলোচনা করি।

সহগামী পড়ুন জুপিটার নোটবুক যেটি এই পোস্টে উল্লিখিত সমস্ত পদক্ষেপের মধ্য দিয়ে চলে।

ক্ষেত্রে ব্যবহার করুন: অনবোর্ডিং এবং প্রমাণীকরণ

বায়োমেট্রিক সমাধানগুলির জন্য দুটি প্রাথমিক ব্যবহারের ক্ষেত্রে রয়েছে: ব্যবহারকারীর অনবোর্ডিং (প্রায়শই যাচাইকরণ হিসাবে উল্লেখ করা হয়) এবং প্রমাণীকরণ (প্রায়শই সনাক্তকরণ হিসাবে উল্লেখ করা হয়)। অনবোর্ডিং-এর জন্য দুটি ছবির মধ্যে মুখের এক-একটি মিল অন্তর্ভুক্ত করা হয়, উদাহরণ স্বরূপ একটি সেলফিকে ড্রাইভিং লাইসেন্স বা পাসপোর্টের মতো বিশ্বস্ত শনাক্তকরণ নথির সাথে তুলনা করা। প্রমাণীকরণ, অন্যদিকে, মুখের সংরক্ষিত সংগ্রহের বিপরীতে একটি মুখের এক-থেকে-অনেক অনুসন্ধানকে অন্তর্ভুক্ত করে, উদাহরণস্বরূপ কর্মচারীদের মুখের সংগ্রহ অনুসন্ধান করা যে কোনও কর্মচারী একটি বিল্ডিংয়ের একটি নির্দিষ্ট ফ্লোরে অনুমোদিত কিনা তা দেখতে৷

অনবোর্ডিং এবং প্রমাণীকরণ ব্যবহারের ক্ষেত্রে নির্ভুলতা কার্যকারিতা মিথ্যা ইতিবাচক এবং মিথ্যা নেতিবাচক ত্রুটি দ্বারা পরিমাপ করা হয় যা বায়োমেট্রিক সমাধান করতে পারে। একটি মিলের স্কোর (0% যার মানে কোন মিল নেই থেকে 100% মানে একটি নিখুঁত ম্যাচ) একটি ম্যাচ বা অ-ম্যাচের সিদ্ধান্ত নির্ধারণ করতে ব্যবহৃত হয়। একটি মিথ্যা ইতিবাচক ঘটে যখন সমাধান দুটি ভিন্ন ব্যক্তির ছবিকে একই ব্যক্তি বলে বিবেচনা করে। একটি মিথ্যা নেতিবাচক, অন্যদিকে, মানে হল যে সমাধানটি একই ব্যক্তির দুটি চিত্রকে ভিন্ন বলে বিবেচনা করে।

অনবোর্ডিং: এক থেকে এক যাচাইকরণ

বায়োমেট্রিক-ভিত্তিক অনবোর্ডিং প্রক্রিয়াগুলি প্রক্রিয়াটিকে সহজ এবং সুরক্ষিত করে। সবচেয়ে গুরুত্বপূর্ণ, এটি সংস্থা এবং গ্রাহককে প্রায় ঘর্ষণহীন অনবোর্ডিং অভিজ্ঞতার জন্য সেট আপ করে। এটি করার জন্য, ব্যবহারকারীদের কেবল ব্যবহারকারীর মুখ (যেমন ড্রাইভারের লাইসেন্স বা পাসপোর্ট) সম্বলিত বিশ্বস্ত শনাক্তকরণ নথির একটি চিত্র উপস্থাপন করতে হবে এবং সেইসাথে অনবোর্ডিং প্রক্রিয়া চলাকালীন একটি সেলফি ছবি তুলতে হবে। সিস্টেমে এই দুটি চিত্র থাকার পরে, এটি কেবল দুটি চিত্রের মধ্যে মুখের তুলনা করে। যখন মিল একটি নির্দিষ্ট থ্রেশহোল্ডের চেয়ে বেশি হয়, তখন আপনার একটি মিল আছে; অন্যথায়, আপনি একটি অ-ম্যাচ আছে. নিম্নলিখিত চিত্রটি প্রক্রিয়াটির রূপরেখা দেয়।

জুলির উদাহরণ বিবেচনা করুন, একজন নতুন ব্যবহারকারী একটি ডিজিটাল ব্যাঙ্ক অ্যাকাউন্ট খুলছেন৷ সমাধানটি তাকে তার ড্রাইভিং লাইসেন্সের একটি ছবি (ধাপ 2) এবং একটি সেলফি (ধাপ 3) নিতে অনুরোধ করে। সিস্টেমটি ছবিগুলির গুণমান পরীক্ষা করার পরে (ধাপ 4), এটি সেলফিতে থাকা মুখটিকে ড্রাইভারের লাইসেন্সের মুখের সাথে তুলনা করে (এক থেকে এক ম্যাচিং) এবং একটি মিল স্কোর (ধাপ 5) তৈরি করা হয়। যদি মিলের স্কোর প্রয়োজনীয় মিল থ্রেশহোল্ডের চেয়ে কম হয়, তাহলে জুলির অনবোর্ডিং প্রচেষ্টা প্রত্যাখ্যান করা হয়। এটাকেই আমরা মিথ্যা নন-ম্যাচ বা মিথ্যা প্রত্যাখ্যান বলি: সমাধানটি একই ব্যক্তির দুটি চিত্রকে ভিন্ন বলে বিবেচনা করে। অন্যদিকে, যদি মিলের স্কোর প্রয়োজনীয় মিলের চেয়ে বেশি হয়, তাহলে সমাধানটি দুটি চিত্রকে একই ব্যক্তি বা একটি মিল বলে বিবেচনা করে।

প্রমাণীকরণ: এক থেকে বহু শনাক্তকরণ

একটি বিল্ডিংয়ে প্রবেশ করা থেকে শুরু করে একটি কিয়স্কে চেক ইন করা, ব্যবহারকারীকে তাদের পরিচয় যাচাই করার জন্য একটি সেলফির জন্য অনুরোধ করা পর্যন্ত, মুখের স্বীকৃতির মাধ্যমে এই ধরনের জিরো-টু-নিম্ন-ঘর্ষণ প্রমাণীকরণ অনেক প্রতিষ্ঠানের জন্য সাধারণ হয়ে উঠেছে। ইমেজ-টু-ইমেজ ম্যাচিং সম্পাদন করার পরিবর্তে, এই প্রমাণীকরণ ব্যবহারের ক্ষেত্রে একটি একক চিত্র নেয় এবং সম্ভাব্য মিলের জন্য চিত্রগুলির একটি অনুসন্ধানযোগ্য সংগ্রহের সাথে তুলনা করে। একটি সাধারণ প্রমাণীকরণ ব্যবহারের ক্ষেত্রে, ব্যবহারকারীকে একটি সেলফি তোলার জন্য অনুরোধ করা হয়, যা সংগ্রহে সংরক্ষিত মুখের সাথে তুলনা করা হয়। অনুসন্ধানের ফলাফল সংশ্লিষ্ট মিল স্কোর এবং বহিরাগত শনাক্তকারীর সাথে শূন্য, এক বা একাধিক সম্ভাব্য মিল দেয়। যদি কোনো মিল ফেরত না থাকে, তাহলে ব্যবহারকারীকে প্রমাণীকরণ করা হয় না; যাইহোক, অনুমান করে যে অনুসন্ধানটি এক বা একাধিক মিল দেয়, সিস্টেমটি সাদৃশ্য স্কোর এবং বহিরাগত শনাক্তকারীর উপর ভিত্তি করে প্রমাণীকরণের সিদ্ধান্ত নেয়। যদি সাদৃশ্য স্কোর প্রয়োজনীয় মিল থ্রেশহোল্ড অতিক্রম করে এবং বহিরাগত শনাক্তকারী প্রত্যাশিত শনাক্তকারীর সাথে মেলে, তাহলে ব্যবহারকারীকে প্রমাণীকরণ করা হয় (মিলিত)। নিম্নলিখিত চিত্রটি মুখ-ভিত্তিক বায়োমেট্রিক প্রমাণীকরণ প্রক্রিয়ার একটি উদাহরণের রূপরেখা দেয়।

প্রমাণীকরণ প্রক্রিয়া

জোসের উদাহরণ বিবেচনা করুন, একজন গিগ-ইকোনমি ডেলিভারি ড্রাইভার। ডেলিভারি সার্ভিস কোম্পানির মোবাইল অ্যাপ্লিকেশন ব্যবহার করে ডেলিভারি শুরু করার আগে ড্রাইভারকে সেলফি তোলার জন্য অনুরোধ করে ডেলিভারি ড্রাইভারদের প্রমাণীকরণ করে। গিগ-ইকোনমি সার্ভিস প্রোভাইডারদের একটি সমস্যা হল চাকরি ভাগাভাগি করা; সিস্টেম গেম করার জন্য মূলত দুই বা ততোধিক ব্যবহারকারী একই অ্যাকাউন্ট ভাগ করে। এটি মোকাবেলা করার জন্য, অনেক ডেলিভারি সার্ভিস একটি ডেলিভারির সময় এলোমেলো সময়ে ড্রাইভারের ছবি (ধাপ 2) স্ন্যাপ করার জন্য একটি ইন-কার ক্যামেরা ব্যবহার করে (ডেলিভারি ড্রাইভার অনুমোদিত ড্রাইভার কিনা তা নিশ্চিত করতে)। এই ক্ষেত্রে, জোস তার ডেলিভারির শুরুতে শুধুমাত্র একটি সেলফি তোলেন না, কিন্তু একটি গাড়ির ক্যামেরা ডেলিভারির সময় তার ছবি তোলে। সিস্টেমটি মান পরীক্ষা করে (ধাপ 3) এবং অনুসন্ধান করে (ধাপ 4) ড্রাইভারের পরিচয় যাচাই করতে নিবন্ধিত ড্রাইভারের সংগ্রহ। যদি একটি ভিন্ন ড্রাইভার সনাক্ত করা হয়, তাহলে গিগ-ইকোনমি ডেলিভারি পরিষেবা আরও তদন্ত করতে পারে।

একটি মিথ্যা ম্যাচ (ফলস ইতিবাচক) ঘটে যখন সমাধানটি একই ব্যক্তি হিসাবে বিভিন্ন ব্যক্তির দুই বা ততোধিক চিত্রকে বিবেচনা করে। আমাদের ব্যবহারের ক্ষেত্রে, ধরুন অনুমোদিত ড্রাইভারের পরিবর্তে, জোস তার ভাই মিগুয়েলকে তার জন্য তার একটি ডেলিভারি নিতে দেয়। যদি সমাধানটি ভুলভাবে মিগুয়েলের সেলফির সাথে জোসের ছবির সাথে মিলে যায়, তাহলে একটি মিথ্যা ম্যাচ (ফলস ইতিবাচক) ঘটে।

একটি মিথ্যা ম্যাচের সম্ভাব্যতা মোকাবেলা করার জন্য, আমরা সুপারিশ করি যে সংগ্রহগুলিতে প্রতিটি বিষয়ের বেশ কয়েকটি চিত্র রয়েছে৷ একটি মুখ, অনবোর্ডিং এর সময় একটি সেলফি এবং শেষ বেশ কয়েকটি শনাক্তকরণ চেক থেকে সেলফি সম্বলিত বিশ্বস্ত শনাক্তকরণ নথিগুলিকে সূচীকরণ করা সাধারণ অভ্যাস। একটি বিষয়ের বেশ কয়েকটি ছবিকে সূচীকরণ করা মুখ জুড়ে সাদৃশ্য স্কোরগুলিকে একত্রিত করার ক্ষমতা প্রদান করে, যার ফলে সনাক্তকরণের নির্ভুলতা উন্নত হয়। উপরন্তু, বহিরাগত শনাক্তকারী একটি মিথ্যা গ্রহণের ঝুঁকি সীমিত করতে ব্যবহার করা হয়। একটি উদাহরণ ব্যবসা নিয়ম এই মত কিছু দেখতে পারে:

যদি সামগ্রিক মিল স্কোর >= প্রয়োজনীয় মিল থ্রেশহোল্ড এবং বাহ্যিক শনাক্তকারী == প্রত্যাশিত শনাক্তকারী তারপর প্রমাণীকরণ করুন

মূল বায়োমেট্রিক নির্ভুলতা ব্যবস্থা

একটি বায়োমেট্রিক সিস্টেমে, আমরা মুখের তুলনা এবং অনুসন্ধানের সাদৃশ্য স্কোরের উপর ভিত্তি করে মিথ্যা ম্যাচ রেট (FMR) এবং মিথ্যা নন-ম্যাচ রেট (FNMR) এ আগ্রহী। এটি একটি অনবোর্ডিং বা প্রমাণীকরণ ব্যবহারের ক্ষেত্রেই হোক না কেন, বায়োমেট্রিক সিস্টেম দুটি বা ততোধিক চিত্রের মিলের স্কোরের ভিত্তিতে ব্যবহারকারীর মুখের মিল গ্রহণ বা প্রত্যাখ্যান করার সিদ্ধান্ত নেয়। যেকোনো সিদ্ধান্ত ব্যবস্থার মতো, সেখানে ত্রুটি থাকবে যেখানে সিস্টেম ভুলভাবে অনবোর্ডিং বা প্রমাণীকরণের প্রচেষ্টা গ্রহণ বা প্রত্যাখ্যান করে। আপনার পরিচয় যাচাইকরণ সমাধানের মূল্যায়নের অংশ হিসাবে, আপনাকে মিথ্যা ম্যাচ এবং মিথ্যা অ-ম্যাচ রেট কমানোর জন্য বিভিন্ন সাদৃশ্য থ্রেশহোল্ডে সিস্টেমটিকে মূল্যায়ন করতে হবে, সেইসাথে ভুল প্রত্যাখ্যান এবং গ্রহণযোগ্যতার খরচের বিপরীতে সেই ত্রুটিগুলিকে বৈসাদৃশ্য করতে হবে। আমরা মুখের বায়োমেট্রিক সিস্টেমের মূল্যায়ন করার জন্য আমাদের দুটি মূল মেট্রিক হিসাবে FMR এবং FNMR ব্যবহার করি।

মিথ্যা অ-ম্যাচ হার

যখন পরিচয় যাচাইকরণ ব্যবস্থা সঠিকভাবে একজন প্রকৃত ব্যবহারকারীকে শনাক্ত করতে বা অনুমোদন করতে ব্যর্থ হয়, তখন একটি মিথ্যা অ-মিল দেখা দেয়, যা মিথ্যা নেতিবাচক হিসাবেও পরিচিত। মিথ্যা নন-ম্যাচ রেট (FNMR) হল একটি পরিমাপ যে সিস্টেমটি একটি প্রকৃত ব্যবহারকারীকে ভুলভাবে সনাক্ত বা অনুমোদন করার জন্য কতটা প্রবণ।

এফএনএমআর এমন দৃষ্টান্তের শতাংশ হিসাবে প্রকাশ করা হয় যেখানে একটি অনবোর্ডিং বা প্রমাণীকরণের প্রচেষ্টা করা হয়, যেখানে ব্যবহারকারীর মুখ ভুলভাবে প্রত্যাখ্যান করা হয় (একটি মিথ্যা নেতিবাচক) কারণ সাদৃশ্য স্কোর নির্ধারিত থ্রেশহোল্ডের নীচে।

একটি সত্য ইতিবাচক (TP) হল যখন সমাধান একই ব্যক্তির দুই বা ততোধিক চিত্রকে একই বলে বিবেচনা করে। অর্থাৎ, তুলনা বা অনুসন্ধানের মিল প্রয়োজনীয় মিল থ্রেশহোল্ডের উপরে।

একটি মিথ্যা নেতিবাচক (FN) হল যখন সমাধান একই ব্যক্তির দুটি বা ততোধিক চিত্রকে আলাদা বলে বিবেচনা করে। অর্থাৎ, তুলনা বা অনুসন্ধানের মিল প্রয়োজনীয় মিল থ্রেশহোল্ডের নীচে।

FNMR এর সূত্র হল:

FNMR = মিথ্যা নেতিবাচক গণনা / (সত্য ইতিবাচক গণনা + মিথ্যা নেতিবাচক গণনা)

উদাহরণস্বরূপ, ধরুন আমাদের 10,000টি প্রকৃত প্রমাণীকরণের প্রচেষ্টা রয়েছে কিন্তু 100টি অস্বীকার করা হয়েছে কারণ রেফারেন্স চিত্র বা সংগ্রহের সাথে তাদের মিল নির্দিষ্ট মিল থ্রেশহোল্ডের নীচে পড়ে। এখানে আমাদের 9,900টি সত্য ইতিবাচক এবং 100টি মিথ্যা নেতিবাচক রয়েছে, তাই আমাদের FNMR হল 1.0%

FNMR = 100 / (9900 + 100) বা 1.0%

মিথ্যা ম্যাচ হার

যখন একটি পরিচয় যাচাইকরণ সিস্টেম ভুলভাবে একটি অননুমোদিত ব্যবহারকারীকে প্রকৃত হিসাবে শনাক্ত করে বা অনুমোদন করে, তখন একটি মিথ্যা মিল ঘটে, যা একটি মিথ্যা ইতিবাচক হিসাবেও পরিচিত। মিথ্যা ম্যাচ রেট (FMR) হল একটি পরিমাপ যে সিস্টেমটি একটি অননুমোদিত ব্যবহারকারীকে ভুলভাবে সনাক্ত বা অনুমোদন করার জন্য কতটা প্রবণ। এটি মিথ্যা ইতিবাচক স্বীকৃতি বা প্রমাণীকরণের সংখ্যা দ্বারা বিভক্ত শনাক্তকরণ প্রচেষ্টার মোট সংখ্যা দ্বারা পরিমাপ করা হয়।

একটি মিথ্যা ইতিবাচক ঘটে যখন সমাধানটি বিভিন্ন ব্যক্তির দুটি বা ততোধিক চিত্রকে একই ব্যক্তি হিসাবে বিবেচনা করে। অর্থাৎ, তুলনা বা অনুসন্ধানের মিল স্কোর প্রয়োজনীয় মিল থ্রেশহোল্ডের উপরে। মূলত, সিস্টেম ভুলভাবে সনাক্ত করে বা অনুমোদন করে যখন এটি তাদের সনাক্তকরণ বা প্রমাণীকরণ প্রচেষ্টা প্রত্যাখ্যান করা উচিত ছিল।

FMR এর সূত্র হল:

FMR = মিথ্যা ইতিবাচক গণনা / (মোট প্রচেষ্টা)

উদাহরণস্বরূপ, ধরুন আমাদের 100,000 প্রমাণীকরণের প্রচেষ্টা রয়েছে কিন্তু 100 জন জাল ব্যবহারকারী ভুলভাবে অনুমোদিত কারণ রেফারেন্স ইমেজ বা সংগ্রহের সাথে তাদের মিল নির্দিষ্ট মিল থ্রেশহোল্ডের উপরে পড়ে। এখানে আমাদের 100টি মিথ্যা ইতিবাচক রয়েছে, তাই আমাদের FMR হল 0.01%

FMR = 100 / (100,000) বা 0.01%

মিথ্যা ম্যাচ রেট বনাম মিথ্যা অ-ম্যাচ রেট

মিথ্যা ম্যাচ রেট এবং মিথ্যা নন-ম্যাচ রেট একে অপরের সাথে বিরোধপূর্ণ। সাদৃশ্য থ্রেশহোল্ড বাড়ার সাথে সাথে একটি মিথ্যা ম্যাচের সম্ভাবনা হ্রাস পায়, যখন একটি মিথ্যা অ-মিলের সম্ভাবনা বৃদ্ধি পায়। এই ট্রেড-অফ সম্পর্কে চিন্তা করার আরেকটি উপায় হল যে সাদৃশ্য থ্রেশহোল্ড বাড়লে, সমাধানটি আরও সীমাবদ্ধ হয়ে ওঠে, কম মিলের মিল তৈরি করে। উদাহরণ স্বরূপ, জননিরাপত্তা এবং নিরাপত্তার সাথে জড়িত ব্যবহারের ক্ষেত্রে মিলের মিলের থ্রেশহোল্ড বেশ উচ্চ (99 এবং তার উপরে) সেট করা সাধারণ। বিকল্পভাবে, একটি সংস্থা একটি কম সীমাবদ্ধ মিল থ্রেশহোল্ড (90 এবং তার উপরে) বেছে নিতে পারে, যেখানে ব্যবহারকারীর কাছে ঘর্ষণের প্রভাব বেশি গুরুত্বপূর্ণ। নিম্নলিখিত চিত্রটি এই ট্রেড-অফগুলিকে চিত্রিত করে৷ সংস্থাগুলির জন্য চ্যালেঞ্জ হল একটি থ্রেশহোল্ড খুঁজে পাওয়া যা আপনার সাংগঠনিক এবং আবেদনের প্রয়োজনীয়তার উপর ভিত্তি করে FMR এবং FNMR উভয়কেই কম করে।

এফএমআর বনাম এফএনএমআর ট্রেডঅফ

একটি মিল থ্রেশহোল্ড নির্বাচন করা ব্যবসায়িক আবেদনের উপর নির্ভর করে। উদাহরণস্বরূপ, ধরুন আপনি অনবোর্ডিংয়ের সময় গ্রাহকের ঘর্ষণকে সীমিত করতে চান (একটি কম সীমাবদ্ধ মিল থ্রেশহোল্ড, বাম দিকের নিম্নলিখিত চিত্রে দেখানো হয়েছে)। এখানে আপনার একটি কম প্রয়োজনীয় মিল থ্রেশহোল্ড থাকতে পারে এবং ব্যবহারকারীদের অনবোর্ডিং করার ঝুঁকি গ্রহণ করতে ইচ্ছুক যেখানে তাদের সেলফি এবং ড্রাইভিং লাইসেন্সের মধ্যে মিলের আস্থা কম। বিপরীতে, ধরুন আপনি নিশ্চিত করতে চান যে শুধুমাত্র অনুমোদিত ব্যবহারকারীরা একটি অ্যাপ্লিকেশনে প্রবেশ করুন৷ এখানে আপনি একটি বেশ সীমাবদ্ধ মিল থ্রেশহোল্ডে কাজ করতে পারেন (যেমন ডানদিকে চিত্রে দেখানো হয়েছে)।

মিথ্যা ম্যাচ এবং অ-ম্যাচ হার গণনা করার জন্য পদক্ষেপ

এই দুটি মেট্রিক্স গণনা করার বিভিন্ন উপায় আছে। প্রকৃত চিত্র জোড়া সংগ্রহের ধাপগুলিকে ভাগ করার একটি অপেক্ষাকৃত সহজ পদ্ধতি, একটি ইম্পোস্টার পেয়ারিং তৈরি করা (ছবিগুলি যেগুলি মেলে না) এবং অবশেষে একটি প্রোব ব্যবহার করে প্রত্যাশিত মিল এবং নন-মেল ইমেজ জোড়াগুলি লুপ করার জন্য, ক্যাপচার করা ফলে সাদৃশ্য। নিম্নরূপ পদক্ষেপ:

একটি প্রকৃত নমুনা ইমেজ সেট সংগ্রহ করুন. আমরা ইমেজ জোড়ার একটি সেট দিয়ে শুরু করার এবং একটি বাহ্যিক শনাক্তকারী বরাদ্দ করার সুপারিশ করি, যা একটি অফিসিয়াল মিল নির্ধারণ করতে ব্যবহৃত হয়। এই জুটি নিম্নলিখিত চিত্রগুলি নিয়ে গঠিত:
1. সোর্স ইমেজ – আপনার বিশ্বস্ত সোর্স ইমেজ, যেমন একটি ড্রাইভার লাইসেন্স।
2. টার্গেট ইমেজ - আপনার সেলফি বা ছবির সাথে আপনি তুলনা করতে যাচ্ছেন।
প্রতারক ম্যাচের একটি চিত্র সেট সংগ্রহ করুন। এই জোড়া ছবি যেখানে উৎস এবং লক্ষ্য মেলে না। এটি FMR (সম্ভাব্যতা যে সিস্টেমটি ভুলভাবে দুটি ভিন্ন ব্যবহারকারীর মুখের সাথে মিলবে) মূল্যায়ন করতে ব্যবহৃত হয়। আপনি চিত্রগুলির একটি কার্টেসিয়ান পণ্য তৈরি করে তারপর ফলাফলটি ফিল্টার এবং নমুনা করে চিত্র জোড়া ব্যবহার করে একটি ইম্পোস্টার ইমেজ সেট তৈরি করতে পারেন।
ইমেজ জোড়ার উপর লুপ করে, উৎস এবং ইপোস্টার টার্গেটের তুলনা করে এবং ফলস্বরূপ মিল ক্যাপচার করে জেনুইন এবং ইপোস্টার ম্যাচ সেটগুলি পরীক্ষা করুন।
বিভিন্ন ন্যূনতম মিল থ্রেশহোল্ডে মিথ্যা ইতিবাচক এবং মিথ্যা নেতিবাচক গণনা করে FMR এবং FNMR গণনা করুন।

আপনি আপনার আবেদনের প্রয়োজনের সাথে সম্পর্কিত বিভিন্ন মিল থ্রেশহোল্ডে FMR এবং FNMR-এর খরচ মূল্যায়ন করতে পারেন।

ধাপ 1: সত্যিকারের ছবি জোড়ার নমুনা সংগ্রহ করুন

একটি পরিচয় যাচাইকরণ পরিষেবার মূল্যায়ন করার সময় মূল্যায়নের জন্য চিত্র জোড়ার একটি প্রতিনিধি নমুনা নির্বাচন করা গুরুত্বপূর্ণ। প্রথম ধাপ হল ছবি জোড়ার একটি প্রকৃত সেট সনাক্ত করা। এগুলি একজন ব্যবহারকারীর পরিচিত উত্স এবং লক্ষ্য চিত্র। জেনুইন ইমেজ পেয়ারিং FNMR মূল্যায়ন করতে ব্যবহৃত হয়, মূলত এই সম্ভাবনা যে সিস্টেমটি একই ব্যক্তির দুটি মুখের সাথে মিলবে না। প্রায়শই জিজ্ঞাসা করা প্রথম প্রশ্নগুলির মধ্যে একটি হল "কতটি চিত্র জোড়া প্রয়োজন?" উত্তর হল এটি আপনার ব্যবহারের ক্ষেত্রে নির্ভর করে, তবে সাধারণ নির্দেশিকা নিম্নরূপ:

100-1,000 ছবি জোড়ার মধ্যে সম্ভাব্যতার একটি পরিমাপ প্রদান করে
10,000 পর্যন্ত ছবি জোড়া ইমেজের মধ্যে পরিবর্তনশীলতা পরিমাপ করার জন্য যথেষ্ট বড়
10,000 টিরও বেশি চিত্র জোড়া অপারেশনাল গুণমান এবং সাধারণীকরণের একটি পরিমাপ প্রদান করে

আরো তথ্য সবসময় ভাল; যাইহোক, একটি সূচনা বিন্দু হিসাবে, অন্তত 1,000 ছবি জোড়া ব্যবহার করুন। যাইহোক, প্রদত্ত ব্যবসায়িক সমস্যার জন্য গ্রহণযোগ্য এফএনএমআর বা এফএমআর-এ 10,000-এর বেশি ছবি জোড়া ব্যবহার করা অস্বাভাবিক নয়।

নিচের একটি নমুনা ইমেজ পেয়ার ম্যাপিং ফাইল। বাকি মূল্যায়ন প্রক্রিয়া চালাতে আমরা ইমেজ পেয়ার ম্যাপিং ফাইল ব্যবহার করি।

EXTERNAL_ID	উৎস	এ TARGET	পরীক্ষা
9055	9055_M0.jpeg	9055_M1.jpeg	অকৃত্রিম
19066	19066_M0.jpeg	19066_M1.jpeg	অকৃত্রিম
11396	11396_M0.jpeg	11396_M1.jpeg	অকৃত্রিম
12657	12657_M0.jpeg	12657_M1.jpeg	অকৃত্রিম
...	.	.	.

ধাপ 2: একটি ইম্পোস্টার ইমেজ পেয়ার তৈরি করুন সেট

এখন যেহেতু আপনার কাছে প্রকৃত চিত্র জোড়ার একটি ফাইল রয়েছে, আপনি লক্ষ্য এবং উত্স চিত্রগুলির একটি কার্টেসিয়ান পণ্য তৈরি করতে পারেন যেখানে বাহ্যিক শনাক্তকারীগুলি মিলিত হয় না৷ এটি উত্স থেকে লক্ষ্য জোড়া তৈরি করে যা মেলে না। এই পেয়ারিংটি FMR মূল্যায়ন করতে ব্যবহৃত হয়, মূলত সিস্টেমটি একজন ব্যবহারকারীর মুখের সাথে অন্য ব্যবহারকারীর মুখের সাথে মিলিত হওয়ার সম্ভাবনা।

বাহ্যিক_আইডি	উৎস	এ TARGET	পরীক্ষা
114192	114192_4M49.jpeg	307107_00M17.jpeg	ছদ্মবেশী
105300	105300_04F42.jpeg	035557_00M53.jpeg	ছদ্মবেশী
110771	110771_3M44.jpeg	120381_1M33.jpeg	ছদ্মবেশী
281333	281333_04F35.jpeg	314769_01M17.jpeg	ছদ্মবেশী
40081	040081_2F52.jpeg	326169_00F32.jpeg	ছদ্মবেশী
...	.	.	.

ধাপ 3: জেনুইন এবং ইপোস্টার ইমেজ পেয়ার সেটগুলি পরীক্ষা করুন

একটি ড্রাইভার প্রোগ্রাম ব্যবহার করে, আমরা প্রয়োগ করি আমাজন রেকোনিশন CompareFaces API ইমেজ জোড়া উপর এবং সাদৃশ্য ক্যাপচার. আপনি ভঙ্গি, গুণমান এবং তুলনার অন্যান্য ফলাফলের মতো অতিরিক্ত তথ্যও ক্যাপচার করতে পারেন। অনুরূপ স্কোরগুলি নিম্নলিখিত ধাপে মিথ্যা ম্যাচ এবং অ-ম্যাচ হার গণনা করতে ব্যবহৃত হয়।

নিম্নলিখিত কোড স্নিপেটে, আমরা সমস্ত চিত্র জোড়ায় CompareFaces API প্রয়োগ করি এবং একটি টেবিলে সমস্ত মিল স্কোর পূরণ করি:

obj = s3.get_object(Bucket= bucket_name , Key = csv_file)
 df = pd.read_csv(io.BytesIO(obj['Body'].read()), encoding='utf8')
def compare_faces(source_file, target_file, threshold = 0):
    response=rekognition.compare_faces(SimilarityThreshold=threshold,
                                        SourceImage={'S3Object': {
                                                    'Bucket': bucket_name,
                                                    'Name':source_file}},
                                        TargetImage={'S3Object': {
                                                    'Bucket': bucket_name,
                                                    'Name':target_file}}) df_similarity = df.copy() df_similarity["SIMILARITY"] = None
for index, row in df.iterrows():
    source_file = dataset_folder + row["SOURCE"]
    target_file = dataset_folder + row["TARGET"]
    response_score = compare_faces(source_file, target_file)
    df_similarity._set_value(index,"SIMILARITY", response_score)
    df_similarity.head()

কোড স্নিপেট নিম্নলিখিত আউটপুট দেয়।

EXTERNAL_ID	উৎস	এ TARGET	পরীক্ষা	সাদৃশ্য
9055	9055_M0.jpeg	9055_M1.jpeg	অকৃত্রিম	98.3
19066	19066_M0.jpeg	19066_M1.jpeg	অকৃত্রিম	94.3
11396	11396_M0.jpeg	11396_M1.jpeg	অকৃত্রিম	96.1
...	.	.	.	.
114192	114192_4M49.jpeg	307107_00M17.jpeg	ছদ্মবেশী	0.0
105300	105300_04F42.jpeg	035557_00M53.jpeg	ছদ্মবেশী	0.0
110771	110771_3M44.jpeg	120381_1M33.jpeg	ছদ্মবেশী	0.0

পরীক্ষার দ্বারা সাদৃশ্য স্কোর বিতরণ বিশ্লেষণ চিত্র জোড়া দ্বারা সাদৃশ্য স্কোর বোঝার জন্য একটি সূচনা বিন্দু। নিম্নলিখিত কোড স্নিপেট এবং আউটপুট চার্ট পরীক্ষার সেটের পাশাপাশি বর্ণনামূলক পরিসংখ্যানের মাধ্যমে সাদৃশ্য স্কোর বিতরণের একটি সহজ উদাহরণ দেখায়:

sns.boxplot(data=df_similarity,
            x=df_similarity["SIMILARITY"],
            y=df_similarity["TEST"]).set(xlabel='Similarity Score',
            ylabel=None,
            title = "Similarity Score Distribution")
plt.show()

সাদৃশ্য স্কোর বিতরণ

df_descriptive_stats = pd.DataFrame(columns=['test','count', 'min' , 'max', 'mean', 'median', 'std'])

tests = ["Genuine", "Imposter"]

for test in tests:
    count = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].count()
    mean = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].mean()
    max_ = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].max()
    min_ = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].min()
    median = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].median()
    std = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].std()

    new_row = {'test': test,
                'count': count,
                'min': min_,
                'max': max_,
                'mean': mean,
                'median':median,
                'std': std}
    df_descriptive_stats = df_descriptive_stats.append(new_row,
    ignore_index=True)

df_descriptive_stats

পরীক্ষা	গণনা	মিনিট	সর্বোচ্চ	গড়	মধ্যমা	এসটিডি
অকৃত্রিম	204	0.2778	99.9957	91.7357	99.0961	19.9097
ছদ্মবেশী	1020	0.0075	87.3893	2.8111	0.8330	7.3496

এই উদাহরণে, আমরা দেখতে পাচ্ছি যে আসল মুখ জোড়ার গড় এবং মধ্যম মিল ছিল 91.7 এবং 99.1, যেখানে প্রতারক জোড়াগুলির জন্য যথাক্রমে 2.8 এবং 0.8 ছিল৷ প্রত্যাশিত হিসাবে, এটি প্রকৃত চিত্র জোড়ার জন্য উচ্চ মিল স্কোর এবং প্রতারক চিত্র জোড়ার জন্য কম মিল স্কোর দেখায়৷

ধাপ 4: বিভিন্ন মিল থ্রেশহোল্ড স্তরে FMR এবং FNMR গণনা করুন

এই ধাপে, আমরা মিলের বিভিন্ন থ্রেশহোল্ডে মিথ্যা ম্যাচ এবং অ-ম্যাচ হার গণনা করি। এটি করার জন্য, আমরা কেবল সাদৃশ্য থ্রেশহোল্ডগুলির মাধ্যমে লুপ করি (উদাহরণস্বরূপ, 90-100)। প্রতিটি নির্বাচিত সাদৃশ্য থ্রেশহোল্ডে, আমরা সত্য ইতিবাচক, সত্য নেতিবাচক, মিথ্যা ইতিবাচক এবং মিথ্যা নেতিবাচক গণনা সহ আমাদের বিভ্রান্তি ম্যাট্রিক্স গণনা করি, যা প্রতিটি নির্বাচিত সাদৃশ্যে FMR এবং FNMR গণনা করতে ব্যবহৃত হয়।

		আসল
পূর্বঘোষিত
	.	ম্যাচ	মিল নেই
	>= নির্বাচিত সাদৃশ্য	TP	FP
	< নির্বাচিত সাদৃশ্য	FN	TN

এটি করার জন্য, আমরা একটি ফাংশন তৈরি করি যা মিথ্যা ধনাত্মক এবং নেতিবাচক গণনা প্রদান করে এবং বিভিন্ন সাদৃশ্য স্কোর (90-100) এর মাধ্যমে লুপ করে:

similarity_thresholds = [80,85,90,95,96,97,98,99]

# create output df
df_cols = ['Similarity Threshold', 'TN' , 'FN', 'TP', 'FP', 'FNMR (%)', 'FMR (%)']
comparison_df = pd.DataFrame(columns=df_cols)

# create columns for y_actual and y_pred
df_analysis = df_similarity.copy()
df_analysis["y_actual"] = None
df_analysis["y_pred"] = None

for threshold in similarity_thresholds:
    # Create y_pred and y_actual columns, 1 == match, 0 == no match
    for index, row in df_similarity.iterrows():
        # set y_pred
        if row["SIMILARITY"] >= threshold:
            df_analysis._set_value(index,"y_pred", 1)
        else:
            df_analysis._set_value(index,"y_pred", 0)

        # set y_actual
        if row["TEST"] == "Genuine":
            df_analysis._set_value(index,"y_actual", 1)
        else:
            df_analysis._set_value(index,"y_actual", 0)

    tn, fp, fn, tp = confusion_matrix(df_analysis['y_actual'].tolist(),
                                      df_analysis['y_pred'].tolist()).ravel()
    FNMR = fn / (tp + fn)
    FMR = fp / (tn+fp+fn+tp)

    new_row = {'Similarity Threshold': threshold,
                'TN': tn,
                'FN': fn,
                'TP': tp,
                'FP': fp,
                'FNMR (%)':FNMR,
                'FMR (%)': FMR}
    comparison_df = comparison_df.append(new_row,ignore_index=True)

comparison_df

নিম্নলিখিত সারণী প্রতিটি মিলের থ্রেশহোল্ডে গণনার ফলাফল দেখায়।

সাদৃশ্য থ্রেশহোল্ড	TN	FN	TP	FP	এফএনএমআর	এফএমআর
80	1019	22	182	1	0.1%	0.1%
85	1019	23	181	1	0.11%	0.1%
90	1020	35	169	0	0.12%	0.0%
95	1020	51	153	0	0.2%	0.0%
96	1020	53	151	0	0.25%	0.0%
97	1020	60	144	0	0.3%	0.0%
98	1020	75	129	0	0.4%	0.0%
99	1020	99	105	0	0.5%	0.0%

সাদৃশ্য থ্রেশহোল্ড মিথ্যা অ-ম্যাচ হারকে কীভাবে প্রভাবিত করে?

ধরুন আমাদের 1,000 প্রকৃত ব্যবহারকারী অনবোর্ডিং প্রচেষ্টা আছে, এবং আমরা এই প্রচেষ্টাগুলির মধ্যে 10টি প্রত্যাখ্যান করি একটি মিল হিসাবে বিবেচিত হওয়ার জন্য 95% এর একটি প্রয়োজনীয় ন্যূনতম মিলের ভিত্তিতে। এখানে আমরা 10টি প্রকৃত অনবোর্ডিং প্রচেষ্টা (মিথ্যা নেতিবাচক) প্রত্যাখ্যান করি কারণ তাদের মিল নির্দিষ্ট ন্যূনতম প্রয়োজনীয় মিল থ্রেশহোল্ডের নীচে পড়ে। এই ক্ষেত্রে, আমাদের FNMR হল 1.0%।

		আসল
পূর্বঘোষিত
	.	ম্যাচ	মিল নেই
	>= 95% মিল	990	0
	<95% মিল	10	0
.	মোট	1,000	.

FNMR = মিথ্যা নেতিবাচক গণনা / (সত্য ইতিবাচক গণনা + মিথ্যা নেতিবাচক গণনা)

FNMR = 10 / (990 + 10) বা 1.0%

বিপরীতে, ধরুন অনবোর্ডে 1,000 প্রকৃত ব্যবহারকারী থাকার পরিবর্তে, আমাদের 990 প্রকৃত ব্যবহারকারী এবং 10 জন প্রতারক ব্যবহারকারী (মিথ্যা ইতিবাচক) রয়েছে। 95% ন্যূনতম সাদৃশ্যে, ধরুন আমরা সকল 1,000 ব্যবহারকারীকে প্রকৃত হিসাবে গ্রহণ করি। এখানে আমাদের 1% FMR থাকবে।

		আসল
পূর্বঘোষিত
	.	ম্যাচ	মিল নেই	মোট
	>= 95% মিল	990	10	1,000
	<95% মিল	0	0	.

FMR = মিথ্যা ইতিবাচক গণনা / (মোট প্রচেষ্টা)

FMR = 10 / (1,000) বা 1.0%

অনবোর্ডিং এ FMR এবং FNMR-এর খরচ মূল্যায়ন করা

একটি অনবোর্ডিং ব্যবহারের ক্ষেত্রে, একটি মিথ্যা নন-ম্যাচ (একটি প্রত্যাখ্যান) খরচ সাধারণত অতিরিক্ত ব্যবহারকারীর ঘর্ষণ বা একটি নিবন্ধন হারানোর সাথে যুক্ত। উদাহরণস্বরূপ, আমাদের ব্যাঙ্কিং ব্যবহারের ক্ষেত্রে, ধরুন জুলি নিজের দুটি ছবি উপস্থাপন করেছেন কিন্তু অনবোর্ডিংয়ের সময় ভুলভাবে প্রত্যাখ্যান করা হয়েছে কারণ দুটি ছবির মধ্যে মিল নির্বাচিত সাদৃশ্যের নিচে পড়ে (একটি মিথ্যা অ-মিল)। আর্থিক প্রতিষ্ঠান জুলিকে একজন সম্ভাব্য গ্রাহক হিসাবে হারানোর ঝুঁকি নিতে পারে, অথবা এটি জুলিকে তার পরিচয় প্রমাণ করার জন্য পদক্ষেপগুলি সম্পাদন করতে বাধ্য করে অতিরিক্ত ঘর্ষণ সৃষ্টি করতে পারে।

বিপরীতভাবে, ধরুন জুলির দুটি ছবি ভিন্ন লোকের এবং জুলির অনবোর্ডিং প্রত্যাখ্যান করা উচিত ছিল। যে ক্ষেত্রে জুলি ভুলভাবে গৃহীত হয় (একটি মিথ্যা ম্যাচ), আর্থিক প্রতিষ্ঠানের জন্য খরচ এবং ঝুঁকি সম্পূর্ণ ভিন্ন। নিয়ন্ত্রক সমস্যা, জালিয়াতির ঝুঁকি এবং আর্থিক লেনদেনের সাথে সম্পর্কিত অন্যান্য ঝুঁকি থাকতে পারে।

দায়িত্বশীল ব্যবহার

মেশিন লার্নিং (ML) এর মাধ্যমে প্রয়োগ করা কৃত্রিম বুদ্ধিমত্তা (AI) হবে আমাদের প্রজন্মের অন্যতম রূপান্তরকারী প্রযুক্তি, যা মানবতার সবচেয়ে চ্যালেঞ্জিং কিছু সমস্যার মোকাবিলা করবে, মানুষের কর্মক্ষমতা বৃদ্ধি করবে এবং উৎপাদনশীলতাকে সর্বাধিক করবে। এই প্রযুক্তির দায়িত্বশীল ব্যবহার অবিরত উদ্ভাবনকে উৎসাহিত করার চাবিকাঠি। AWS ন্যায্য এবং নির্ভুল AI এবং ML পরিষেবাগুলি বিকাশ করতে এবং AI এবং ML অ্যাপ্লিকেশনগুলিকে দায়িত্বের সাথে তৈরি করার জন্য প্রয়োজনীয় সরঞ্জাম এবং নির্দেশিকা প্রদান করতে প্রতিশ্রুতিবদ্ধ।

আপনি AI এবং ML-এর ব্যবহার গ্রহণ এবং বৃদ্ধি করার সাথে সাথে, AI এবং ML-এর দায়িত্বশীল বিকাশ এবং ব্যবহারে আপনাকে সহায়তা করার জন্য AWS আমাদের অভিজ্ঞতার উপর ভিত্তি করে বেশ কয়েকটি সংস্থান সরবরাহ করে:

সর্বোত্তম অনুশীলন এবং সাধারণ ভুলগুলি এড়াতে হবে৷

এই বিভাগে, আমরা নিম্নলিখিত সেরা অনুশীলনগুলি নিয়ে আলোচনা করব:

ইমেজ একটি বড় যথেষ্ট নমুনা ব্যবহার করুন
ওপেন সোর্স এবং সিন্থেটিক ফেস ডেটাসেট এড়িয়ে চলুন
ম্যানুয়াল এবং সিন্থেটিক ইমেজ ম্যানিপুলেশন এড়িয়ে চলুন
মূল্যায়নের সময় এবং সময়ের সাথে সাথে ছবির গুণমান পরীক্ষা করুন
সময়ের সাথে সাথে FMR এবং FNMR মনিটর করুন
লুপ পর্যালোচনাতে একজন মানুষ ব্যবহার করুন
অ্যামাজন স্বীকৃতির সাথে আপ টু ডেট থাকুন

ইমেজ একটি বড় যথেষ্ট নমুনা ব্যবহার করুন

ইমেজের যথেষ্ট বড় কিন্তু যুক্তিসঙ্গত নমুনা ব্যবহার করুন। একটি যুক্তিসঙ্গত নমুনা আকার কি? এটি ব্যবসায়িক সমস্যার উপর নির্ভর করে। আপনি যদি একজন নিয়োগকর্তা হন এবং আপনার 10,000 কর্মচারী থাকে যা আপনি প্রমাণীকরণ করতে চান, তাহলে 10,000টি ছবি ব্যবহার করা সম্ভবত যুক্তিসঙ্গত। যাইহোক, ধরুন আপনি এমন একটি প্রতিষ্ঠান যার লক্ষ লক্ষ গ্রাহক আপনি জাহাজে যেতে চান। এই ক্ষেত্রে, 5,000-20,000 এর মতো গ্রাহকদের একটি প্রতিনিধি নমুনা নেওয়া সম্ভবত যথেষ্ট। এখানে নমুনা আকারের কিছু নির্দেশিকা রয়েছে:

100 এর একটি নমুনা আকার - 1,000 ছবি জোড়া সম্ভাব্যতা প্রমাণ করে
1,000 এর একটি নমুনা আকার - 10,000 ছবি জোড়া ছবিগুলির মধ্যে পরিবর্তনশীলতা পরিমাপ করতে দরকারী
10,000 এর একটি নমুনা আকার - 1 মিলিয়ন ছবি জোড়া কর্মক্ষম গুণমান এবং সাধারণীকরণের একটি পরিমাপ প্রদান করে

স্যাম্পলিং ইমেজ জোড়ার চাবিকাঠি হল যে নমুনা আপনার অ্যাপ্লিকেশনে মুখের জনসংখ্যা জুড়ে যথেষ্ট পরিবর্তনশীলতা প্রদান করে তা নিশ্চিত করা। ত্বকের টোন, লিঙ্গ এবং বয়সের মতো জনসংখ্যা সংক্রান্ত তথ্য অন্তর্ভুক্ত করতে আপনি আপনার নমুনা এবং পরীক্ষা আরও প্রসারিত করতে পারেন।

ওপেন সোর্স এবং সিন্থেটিক ফেস ডেটাসেট এড়িয়ে চলুন

কয়েক ডজন কিউরেটেড ওপেন সোর্স ফেসিয়াল ইমেজ ডেটাসেটের পাশাপাশি আশ্চর্যজনকভাবে বাস্তবসম্মত সিন্থেটিক ফেস সেট রয়েছে যা প্রায়শই গবেষণায় এবং সম্ভাব্যতা অধ্যয়নের জন্য ব্যবহৃত হয়। চ্যালেঞ্জ হল যে এই ডেটাসেটগুলি সাধারণত বাস্তব-বিশ্বের 99% ব্যবহারের ক্ষেত্রে উপযোগী নয় কারণ তারা ক্যামেরা, মুখ এবং চিত্রগুলির মানের প্রতিনিধি নয় যেগুলি আপনার অ্যাপ্লিকেশন বন্যের মুখোমুখি হতে পারে৷ যদিও এগুলি অ্যাপ্লিকেশন ডেভেলপমেন্টের জন্য উপযোগী, তবে এই ইমেজ সেটগুলির নির্ভুলতা পরিমাপগুলি আপনার নিজের অ্যাপ্লিকেশনে আপনি কী সম্মুখীন হবেন তা সাধারণীকরণ করে না। পরিবর্তে, আমরা আপনার সমাধান থেকে বাস্তব চিত্রগুলির একটি প্রতিনিধি নমুনা দিয়ে শুরু করার পরামর্শ দিই, এমনকি যদি নমুনা চিত্র জোড়া ছোট হয় (1,000-এর কম)।

ম্যানুয়াল এবং সিন্থেটিক ইমেজ ম্যানিপুলেশন এড়িয়ে চলুন

মানুষ বুঝতে আগ্রহী যে প্রায়ই প্রান্ত কেস আছে. ইমেজ ক্যাপচারের গুণমান বা মুখের নির্দিষ্ট বৈশিষ্ট্যের অস্পষ্টতার মতো জিনিস সবসময়ই আগ্রহের বিষয়। উদাহরণস্বরূপ, আমরা প্রায়ই মুখের স্বীকৃতিতে বয়স এবং ছবির গুণমানের প্রভাব সম্পর্কে জিজ্ঞাসা করি। আপনি কেবল একটি মুখকে কৃত্রিমভাবে বয়সী করতে পারেন বা বিষয়টিকে পুরোনো দেখানোর জন্য চিত্রটিকে ম্যানিপুলেট করতে পারেন, বা চিত্রের গুণমানকে ম্যানিপুলেট করতে পারেন, তবে এটি চিত্রের বাস্তব-জগতের বার্ধক্যের সাথে ভালভাবে অনুবাদ করে না। পরিবর্তে, আপনি পরীক্ষা করতে আগ্রহী এমন বাস্তব-বিশ্ব প্রান্তের ক্ষেত্রের একটি প্রতিনিধি নমুনা সংগ্রহ করার জন্য আমাদের সুপারিশ।

মূল্যায়নের সময় এবং সময়ের সাথে সাথে ছবির গুণমান পরীক্ষা করুন

ক্যামেরা এবং অ্যাপ্লিকেশন প্রযুক্তি সময়ের সাথে সাথে বেশ দ্রুত পরিবর্তন হয়। সর্বোত্তম অনুশীলন হিসাবে, আমরা সময়ের সাথে সাথে ছবির গুণমান পর্যবেক্ষণ করার পরামর্শ দিই। ক্যাপচার করা মুখের আকার থেকে (বাউন্ডিং বক্স ব্যবহার করে), একটি ছবির উজ্জ্বলতা এবং তীক্ষ্ণতা, একটি মুখের ভঙ্গি, সেইসাথে সম্ভাব্য অস্পষ্টতা (টুপি, সানগ্লাস, দাড়ি এবং আরও অনেক কিছু), এই সমস্ত ছবি এবং মুখের বৈশিষ্ট্য সময়ের সাথে পরিবর্তিত হয়।

সময়ের সাথে সাথে FNMR এবং FMR মনিটর করুন

পরিবর্তনগুলি ঘটতে পারে, তা ইমেজ, অ্যাপ্লিকেশন, বা অ্যাপ্লিকেশনে ব্যবহৃত সাদৃশ্য থ্রেশহোল্ডগুলিই হোক না কেন৷ সময়ের সাথে সাথে মিথ্যা ম্যাচ এবং অ-ম্যাচ রেটগুলি পর্যায়ক্রমে নিরীক্ষণ করা গুরুত্বপূর্ণ। হারের পরিবর্তনগুলি (এমনকি সূক্ষ্ম পরিবর্তনগুলি) প্রায়শই অ্যাপ্লিকেশনটির সাথে আপস্ট্রিম চ্যালেঞ্জ বা অ্যাপ্লিকেশনটি কীভাবে ব্যবহার করা হচ্ছে তা নির্দেশ করতে পারে। সিদ্ধান্ত গ্রহণ বা প্রত্যাখ্যান করার জন্য ব্যবহৃত সাদৃশ্য থ্রেশহোল্ড এবং ব্যবসায়িক নিয়মের পরিবর্তনগুলি অনবোর্ডিং এবং প্রমাণীকরণ ব্যবহারকারীর অভিজ্ঞতার উপর বড় প্রভাব ফেলতে পারে।

লুপ পর্যালোচনাতে একজন মানুষ ব্যবহার করুন

আইডেন্টিটি ভেরিফিকেশন সিস্টেম সাদৃশ্য থ্রেশহোল্ড এবং ব্যবসায়িক নিয়মের উপর ভিত্তি করে মিল এবং অ-মিলের স্বয়ংক্রিয় সিদ্ধান্ত নেয়। নিয়ন্ত্রক এবং অভ্যন্তরীণ সম্মতির প্রয়োজনীয়তা ছাড়াও, যেকোনো স্বয়ংক্রিয় সিদ্ধান্ত ব্যবস্থায় একটি গুরুত্বপূর্ণ প্রক্রিয়া হল সিদ্ধান্ত প্রক্রিয়ার চলমান পর্যবেক্ষণের অংশ হিসাবে মানব পর্যালোচকদের ব্যবহার করা। এই স্বয়ংক্রিয় সিদ্ধান্ত নেওয়ার সিস্টেমগুলির মানব তদারকি স্বয়ংক্রিয় সিদ্ধান্ত গ্রহণের প্রক্রিয়ায় বৈধতা এবং ক্রমাগত উন্নতির পাশাপাশি স্বচ্ছতা প্রদান করে।

অ্যামাজন স্বীকৃতির সাথে আপ টু ডেট থাকুন

Amazon Recognition faces মডেলটি পর্যায়ক্রমে আপডেট করা হয় (সাধারণত বার্ষিক), এবং বর্তমানে সংস্করণ 6 এ রয়েছে। এই আপডেট হওয়া সংস্করণটি সঠিকতা এবং সূচীকরণে গুরুত্বপূর্ণ উন্নতি করেছে। নতুন মডেল সংস্করণগুলির সাথে আপ টু ডেট থাকা এবং আপনার পরিচয় যাচাইকরণ অ্যাপ্লিকেশনে এই নতুন সংস্করণগুলি কীভাবে ব্যবহার করবেন তা বোঝা গুরুত্বপূর্ণ৷ যখন অ্যামাজন রিকগনিশন ফেস মডেলের নতুন সংস্করণগুলি চালু করা হয়, তখন আপনার পরিচয় যাচাইকরণের মূল্যায়ন প্রক্রিয়া পুনরায় চালানো এবং আপনার মিথ্যা ম্যাচ এবং অ-ম্যাচ রেটগুলিতে যে কোনও সম্ভাব্য প্রভাব (ইতিবাচক এবং নেতিবাচক) নির্ধারণ করা ভাল অনুশীলন।

উপসংহার

এই পোস্টটি বিভিন্ন নির্ভুলতা মেট্রিক্সের পরিপ্রেক্ষিতে আপনার পরিচয় যাচাইকরণ সমাধানের কার্যক্ষমতার দিকটি মূল্যায়ন করার জন্য প্রয়োজনীয় মূল উপাদানগুলি নিয়ে আলোচনা করে। যাইহোক, নির্ভুলতা শুধুমাত্র একটি নির্দিষ্ট বিষয়বস্তু সংযম পরিষেবা নির্বাচন করার সময় আপনাকে মূল্যায়ন করতে হবে এমন অনেকগুলি মাত্রার মধ্যে একটি। এটি গুরুত্বপূর্ণ যে আপনি অন্যান্য পরামিতিগুলি অন্তর্ভুক্ত করুন, যেমন পরিষেবার মোট বৈশিষ্ট্য সেট, ব্যবহারের সহজতা, বিদ্যমান একীকরণ, গোপনীয়তা এবং সুরক্ষা, কাস্টমাইজেশন বিকল্প, স্কেলেবিলিটি প্রভাব, গ্রাহক পরিষেবা এবং মূল্য নির্ধারণ।

Amazon Recognition-এ পরিচয় যাচাইকরণ সম্পর্কে আরও জানতে, দেখুন অ্যামাজন স্বীকৃতি ব্যবহার করে পরিচয় যাচাইকরণ.

লেখক সম্পর্কে

মাইক আমেস একজন ডেটা সায়েন্টিস্ট হয়ে পরিচিতি যাচাইকরণ সমাধানের বিশেষজ্ঞ হয়ে উঠেছেন, যার ব্যাপক অভিজ্ঞতা রয়েছে মেশিন লার্নিং এবং এআই সমাধান তৈরি করার জন্য প্রতিষ্ঠানগুলিকে জালিয়াতি, অপচয় এবং অপব্যবহার থেকে রক্ষা করার জন্য। তার অবসর সময়ে, আপনি তাকে হাইকিং, মাউন্টেন বাইকিং বা তার কুকুর ম্যাক্সের সাথে ফ্রিবি খেলা দেখতে পাবেন।

অমিত গুপ্ত AWS-এর একজন সিনিয়র এআই সার্ভিসেস সলিউশন আর্কিটেক্ট। তিনি স্কেলে ভাল আর্কিটেক্টেড মেশিন লার্নিং সমাধানগুলির সাথে গ্রাহকদের সক্ষম করার বিষয়ে উত্সাহী।

জুহায়ের রাগীব AWS-এর একজন এআই সার্ভিসেস সলিউশন আর্কিটেক্ট। প্রয়োগকৃত AI/ML-এ বিশেষজ্ঞ, তিনি গ্রাহকদের দ্রুত উদ্ভাবন করতে এবং তাদের ব্যবসায় রূপান্তর করতে ক্লাউড ব্যবহার করতে সক্ষম করার বিষয়ে আগ্রহী।

মার্সেল পিভিডাল ওয়ার্ল্ড ওয়াইড স্পেশালিস্ট অর্গানাইজেশনের একজন সিনিয়র এআই সার্ভিসেস সলিউশন আর্কিটেক্ট। ফিনটেক, পেমেন্ট প্রদানকারী, ফার্মা এবং সরকারী সংস্থাগুলির জন্য প্রযুক্তির মাধ্যমে ব্যবসায়িক সমস্যা সমাধানের 20 বছরেরও বেশি অভিজ্ঞতা রয়েছে মার্সেলের। তার বর্তমান মনোযোগের ক্ষেত্রগুলি হল ঝুঁকি ব্যবস্থাপনা, জালিয়াতি প্রতিরোধ এবং পরিচয় যাচাইকরণ।

সময় স্ট্যাম্প: ডিসেম্বর 5, 2022ডিসেম্বর 5, 2022

সময় স্ট্যাম্প: সেপ্টেম্বর 27, 2022