একটি পরিচয় যাচাইকরণ সমাধান PlatoBlockchain ডেটা ইন্টেলিজেন্স মূল্যায়নের জন্য মেট্রিক্স। উল্লম্ব অনুসন্ধান. আ.

একটি পরিচয় যাচাইকরণ সমাধান মূল্যায়নের জন্য মেট্রিক্স

বিশ্বব্যাপী, ঘর্ষণহীন ডিজিটাল ব্যবহারকারীর অভিজ্ঞতার দিকে একটি ত্বরিত পরিবর্তন হয়েছে। এটি একটি ওয়েবসাইটে নিবন্ধন করা, অনলাইনে লেনদেন করা, বা আপনার ব্যাঙ্ক অ্যাকাউন্টে লগ ইন করা যাই হোক না কেন, সংস্থাগুলি সক্রিয়ভাবে তাদের গ্রাহকদের অভিজ্ঞতা কমানোর চেষ্টা করছে এবং একই সাথে তাদের নিরাপত্তা, সম্মতি এবং জালিয়াতি প্রতিরোধ ব্যবস্থাগুলিকে উন্নত করছে৷ ঘর্ষণহীন ব্যবহারকারীর অভিজ্ঞতার দিকে পরিবর্তন মুখ-ভিত্তিক বায়োমেট্রিক পরিচয় যাচাইকরণ সমাধানের জন্ম দিয়েছে যার লক্ষ্য "ডিজিটাল বিশ্বে একজন ব্যক্তিকে কীভাবে যাচাই করবেন?" প্রশ্নের উত্তর দেওয়া।

মুখের বায়োমেট্রিক্সের দুটি মূল সুবিধা রয়েছে যখন এটি সনাক্তকরণ এবং প্রমাণীকরণের প্রশ্ন আসে। প্রথমত, এটি ব্যবহারকারীদের জন্য একটি সুবিধাজনক প্রযুক্তি: পাসওয়ার্ড মনে রাখার, মাল্টি-ফ্যাক্টর চ্যালেঞ্জ মোকাবেলা করার, যাচাইকরণ লিঙ্কে ক্লিক করার বা ক্যাপচা ধাঁধা সমাধান করার দরকার নেই। দ্বিতীয়ত, একটি উচ্চ স্তরের নিরাপত্তা অর্জিত হয়: ফেসিয়াল-বায়োমেট্রিক্সের ভিত্তিতে সনাক্তকরণ এবং প্রমাণীকরণ নিরাপদ এবং জালিয়াতি এবং আক্রমণের জন্য কম সংবেদনশীল।

এই পোস্টে, আমরা পরিচয় যাচাইকরণের দুটি প্রাথমিক ব্যবহারের ক্ষেত্রে ডুব দিয়েছি: অনবোর্ডিং এবং প্রমাণীকরণ। তারপরে আমরা একটি বায়োমেট্রিক সিস্টেমের নির্ভুলতা মূল্যায়ন করার জন্য ব্যবহৃত দুটি মূল মেট্রিকের মধ্যে ডুব দিই: মিথ্যা ম্যাচ রেট (যা মিথ্যা স্বীকৃতি হার হিসাবেও পরিচিত) এবং মিথ্যা অ-ম্যাচ রেট (যা মিথ্যা প্রত্যাখ্যান হার হিসাবেও পরিচিত)। বায়োমেট্রিক সিস্টেমের নির্ভুলতা এবং ত্রুটির হার মূল্যায়ন করার জন্য এই দুটি ব্যবস্থা ব্যাপকভাবে সংস্থাগুলি দ্বারা ব্যবহৃত হয়। অবশেষে, আমরা একটি পরিচয় যাচাইকরণ পরিষেবার মূল্যায়ন করার জন্য একটি কাঠামো এবং সর্বোত্তম অনুশীলন নিয়ে আলোচনা করি।

সহগামী পড়ুন জুপিটার নোটবুক যেটি এই পোস্টে উল্লিখিত সমস্ত পদক্ষেপের মধ্য দিয়ে চলে।

ক্ষেত্রে ব্যবহার করুন: অনবোর্ডিং এবং প্রমাণীকরণ

বায়োমেট্রিক সমাধানগুলির জন্য দুটি প্রাথমিক ব্যবহারের ক্ষেত্রে রয়েছে: ব্যবহারকারীর অনবোর্ডিং (প্রায়শই যাচাইকরণ হিসাবে উল্লেখ করা হয়) এবং প্রমাণীকরণ (প্রায়শই সনাক্তকরণ হিসাবে উল্লেখ করা হয়)। অনবোর্ডিং-এর জন্য দুটি ছবির মধ্যে মুখের এক-একটি মিল অন্তর্ভুক্ত করা হয়, উদাহরণ স্বরূপ একটি সেলফিকে ড্রাইভিং লাইসেন্স বা পাসপোর্টের মতো বিশ্বস্ত শনাক্তকরণ নথির সাথে তুলনা করা। প্রমাণীকরণ, অন্যদিকে, মুখের সংরক্ষিত সংগ্রহের বিপরীতে একটি মুখের এক-থেকে-অনেক অনুসন্ধানকে অন্তর্ভুক্ত করে, উদাহরণস্বরূপ কর্মচারীদের মুখের সংগ্রহ অনুসন্ধান করা যে কোনও কর্মচারী একটি বিল্ডিংয়ের একটি নির্দিষ্ট ফ্লোরে অনুমোদিত কিনা তা দেখতে৷

অনবোর্ডিং এবং প্রমাণীকরণ ব্যবহারের ক্ষেত্রে নির্ভুলতা কার্যকারিতা মিথ্যা ইতিবাচক এবং মিথ্যা নেতিবাচক ত্রুটি দ্বারা পরিমাপ করা হয় যা বায়োমেট্রিক সমাধান করতে পারে। একটি মিলের স্কোর (0% যার মানে কোন মিল নেই থেকে 100% মানে একটি নিখুঁত ম্যাচ) একটি ম্যাচ বা অ-ম্যাচের সিদ্ধান্ত নির্ধারণ করতে ব্যবহৃত হয়। একটি মিথ্যা ইতিবাচক ঘটে যখন সমাধান দুটি ভিন্ন ব্যক্তির ছবিকে একই ব্যক্তি বলে বিবেচনা করে। একটি মিথ্যা নেতিবাচক, অন্যদিকে, মানে হল যে সমাধানটি একই ব্যক্তির দুটি চিত্রকে ভিন্ন বলে বিবেচনা করে।

অনবোর্ডিং: এক থেকে এক যাচাইকরণ

বায়োমেট্রিক-ভিত্তিক অনবোর্ডিং প্রক্রিয়াগুলি প্রক্রিয়াটিকে সহজ এবং সুরক্ষিত করে। সবচেয়ে গুরুত্বপূর্ণ, এটি সংস্থা এবং গ্রাহককে প্রায় ঘর্ষণহীন অনবোর্ডিং অভিজ্ঞতার জন্য সেট আপ করে। এটি করার জন্য, ব্যবহারকারীদের কেবল ব্যবহারকারীর মুখ (যেমন ড্রাইভারের লাইসেন্স বা পাসপোর্ট) সম্বলিত বিশ্বস্ত শনাক্তকরণ নথির একটি চিত্র উপস্থাপন করতে হবে এবং সেইসাথে অনবোর্ডিং প্রক্রিয়া চলাকালীন একটি সেলফি ছবি তুলতে হবে। সিস্টেমে এই দুটি চিত্র থাকার পরে, এটি কেবল দুটি চিত্রের মধ্যে মুখের তুলনা করে। যখন মিল একটি নির্দিষ্ট থ্রেশহোল্ডের চেয়ে বেশি হয়, তখন আপনার একটি মিল আছে; অন্যথায়, আপনি একটি অ-ম্যাচ আছে. নিম্নলিখিত চিত্রটি প্রক্রিয়াটির রূপরেখা দেয়।

জুলির উদাহরণ বিবেচনা করুন, একজন নতুন ব্যবহারকারী একটি ডিজিটাল ব্যাঙ্ক অ্যাকাউন্ট খুলছেন৷ সমাধানটি তাকে তার ড্রাইভিং লাইসেন্সের একটি ছবি (ধাপ 2) এবং একটি সেলফি (ধাপ 3) নিতে অনুরোধ করে। সিস্টেমটি ছবিগুলির গুণমান পরীক্ষা করার পরে (ধাপ 4), এটি সেলফিতে থাকা মুখটিকে ড্রাইভারের লাইসেন্সের মুখের সাথে তুলনা করে (এক থেকে এক ম্যাচিং) এবং একটি মিল স্কোর (ধাপ 5) তৈরি করা হয়। যদি মিলের স্কোর প্রয়োজনীয় মিল থ্রেশহোল্ডের চেয়ে কম হয়, তাহলে জুলির অনবোর্ডিং প্রচেষ্টা প্রত্যাখ্যান করা হয়। এটাকেই আমরা মিথ্যা নন-ম্যাচ বা মিথ্যা প্রত্যাখ্যান বলি: সমাধানটি একই ব্যক্তির দুটি চিত্রকে ভিন্ন বলে বিবেচনা করে। অন্যদিকে, যদি মিলের স্কোর প্রয়োজনীয় মিলের চেয়ে বেশি হয়, তাহলে সমাধানটি দুটি চিত্রকে একই ব্যক্তি বা একটি মিল বলে বিবেচনা করে।

প্রমাণীকরণ: এক থেকে বহু শনাক্তকরণ

একটি বিল্ডিংয়ে প্রবেশ করা থেকে শুরু করে একটি কিয়স্কে চেক ইন করা, ব্যবহারকারীকে তাদের পরিচয় যাচাই করার জন্য একটি সেলফির জন্য অনুরোধ করা পর্যন্ত, মুখের স্বীকৃতির মাধ্যমে এই ধরনের জিরো-টু-নিম্ন-ঘর্ষণ প্রমাণীকরণ অনেক প্রতিষ্ঠানের জন্য সাধারণ হয়ে উঠেছে। ইমেজ-টু-ইমেজ ম্যাচিং সম্পাদন করার পরিবর্তে, এই প্রমাণীকরণ ব্যবহারের ক্ষেত্রে একটি একক চিত্র নেয় এবং সম্ভাব্য মিলের জন্য চিত্রগুলির একটি অনুসন্ধানযোগ্য সংগ্রহের সাথে তুলনা করে। একটি সাধারণ প্রমাণীকরণ ব্যবহারের ক্ষেত্রে, ব্যবহারকারীকে একটি সেলফি তোলার জন্য অনুরোধ করা হয়, যা সংগ্রহে সংরক্ষিত মুখের সাথে তুলনা করা হয়। অনুসন্ধানের ফলাফল সংশ্লিষ্ট মিল স্কোর এবং বহিরাগত শনাক্তকারীর সাথে শূন্য, এক বা একাধিক সম্ভাব্য মিল দেয়। যদি কোনো মিল ফেরত না থাকে, তাহলে ব্যবহারকারীকে প্রমাণীকরণ করা হয় না; যাইহোক, অনুমান করে যে অনুসন্ধানটি এক বা একাধিক মিল দেয়, সিস্টেমটি সাদৃশ্য স্কোর এবং বহিরাগত শনাক্তকারীর উপর ভিত্তি করে প্রমাণীকরণের সিদ্ধান্ত নেয়। যদি সাদৃশ্য স্কোর প্রয়োজনীয় মিল থ্রেশহোল্ড অতিক্রম করে এবং বহিরাগত শনাক্তকারী প্রত্যাশিত শনাক্তকারীর সাথে মেলে, তাহলে ব্যবহারকারীকে প্রমাণীকরণ করা হয় (মিলিত)। নিম্নলিখিত চিত্রটি মুখ-ভিত্তিক বায়োমেট্রিক প্রমাণীকরণ প্রক্রিয়ার একটি উদাহরণের রূপরেখা দেয়।

প্রমাণীকরণ প্রক্রিয়া

জোসের উদাহরণ বিবেচনা করুন, একজন গিগ-ইকোনমি ডেলিভারি ড্রাইভার। ডেলিভারি সার্ভিস কোম্পানির মোবাইল অ্যাপ্লিকেশন ব্যবহার করে ডেলিভারি শুরু করার আগে ড্রাইভারকে সেলফি তোলার জন্য অনুরোধ করে ডেলিভারি ড্রাইভারদের প্রমাণীকরণ করে। গিগ-ইকোনমি সার্ভিস প্রোভাইডারদের একটি সমস্যা হল চাকরি ভাগাভাগি করা; সিস্টেম গেম করার জন্য মূলত দুই বা ততোধিক ব্যবহারকারী একই অ্যাকাউন্ট ভাগ করে। এটি মোকাবেলা করার জন্য, অনেক ডেলিভারি সার্ভিস একটি ডেলিভারির সময় এলোমেলো সময়ে ড্রাইভারের ছবি (ধাপ 2) স্ন্যাপ করার জন্য একটি ইন-কার ক্যামেরা ব্যবহার করে (ডেলিভারি ড্রাইভার অনুমোদিত ড্রাইভার কিনা তা নিশ্চিত করতে)। এই ক্ষেত্রে, জোস তার ডেলিভারির শুরুতে শুধুমাত্র একটি সেলফি তোলেন না, কিন্তু একটি গাড়ির ক্যামেরা ডেলিভারির সময় তার ছবি তোলে। সিস্টেমটি মান পরীক্ষা করে (ধাপ 3) এবং অনুসন্ধান করে (ধাপ 4) ড্রাইভারের পরিচয় যাচাই করতে নিবন্ধিত ড্রাইভারের সংগ্রহ। যদি একটি ভিন্ন ড্রাইভার সনাক্ত করা হয়, তাহলে গিগ-ইকোনমি ডেলিভারি পরিষেবা আরও তদন্ত করতে পারে।

একটি মিথ্যা ম্যাচ (ফলস ইতিবাচক) ঘটে যখন সমাধানটি একই ব্যক্তি হিসাবে বিভিন্ন ব্যক্তির দুই বা ততোধিক চিত্রকে বিবেচনা করে। আমাদের ব্যবহারের ক্ষেত্রে, ধরুন অনুমোদিত ড্রাইভারের পরিবর্তে, জোস তার ভাই মিগুয়েলকে তার জন্য তার একটি ডেলিভারি নিতে দেয়। যদি সমাধানটি ভুলভাবে মিগুয়েলের সেলফির সাথে জোসের ছবির সাথে মিলে যায়, তাহলে একটি মিথ্যা ম্যাচ (ফলস ইতিবাচক) ঘটে।

একটি মিথ্যা ম্যাচের সম্ভাব্যতা মোকাবেলা করার জন্য, আমরা সুপারিশ করি যে সংগ্রহগুলিতে প্রতিটি বিষয়ের বেশ কয়েকটি চিত্র রয়েছে৷ একটি মুখ, অনবোর্ডিং এর সময় একটি সেলফি এবং শেষ বেশ কয়েকটি শনাক্তকরণ চেক থেকে সেলফি সম্বলিত বিশ্বস্ত শনাক্তকরণ নথিগুলিকে সূচীকরণ করা সাধারণ অভ্যাস। একটি বিষয়ের বেশ কয়েকটি ছবিকে সূচীকরণ করা মুখ জুড়ে সাদৃশ্য স্কোরগুলিকে একত্রিত করার ক্ষমতা প্রদান করে, যার ফলে সনাক্তকরণের নির্ভুলতা উন্নত হয়। উপরন্তু, বহিরাগত শনাক্তকারী একটি মিথ্যা গ্রহণের ঝুঁকি সীমিত করতে ব্যবহার করা হয়। একটি উদাহরণ ব্যবসা নিয়ম এই মত কিছু দেখতে পারে:

যদি সামগ্রিক মিল স্কোর >= প্রয়োজনীয় মিল থ্রেশহোল্ড এবং বাহ্যিক শনাক্তকারী == প্রত্যাশিত শনাক্তকারী তারপর প্রমাণীকরণ করুন

মূল বায়োমেট্রিক নির্ভুলতা ব্যবস্থা

একটি বায়োমেট্রিক সিস্টেমে, আমরা মুখের তুলনা এবং অনুসন্ধানের সাদৃশ্য স্কোরের উপর ভিত্তি করে মিথ্যা ম্যাচ রেট (FMR) এবং মিথ্যা নন-ম্যাচ রেট (FNMR) এ আগ্রহী। এটি একটি অনবোর্ডিং বা প্রমাণীকরণ ব্যবহারের ক্ষেত্রেই হোক না কেন, বায়োমেট্রিক সিস্টেম দুটি বা ততোধিক চিত্রের মিলের স্কোরের ভিত্তিতে ব্যবহারকারীর মুখের মিল গ্রহণ বা প্রত্যাখ্যান করার সিদ্ধান্ত নেয়। যেকোনো সিদ্ধান্ত ব্যবস্থার মতো, সেখানে ত্রুটি থাকবে যেখানে সিস্টেম ভুলভাবে অনবোর্ডিং বা প্রমাণীকরণের প্রচেষ্টা গ্রহণ বা প্রত্যাখ্যান করে। আপনার পরিচয় যাচাইকরণ সমাধানের মূল্যায়নের অংশ হিসাবে, আপনাকে মিথ্যা ম্যাচ এবং মিথ্যা অ-ম্যাচ রেট কমানোর জন্য বিভিন্ন সাদৃশ্য থ্রেশহোল্ডে সিস্টেমটিকে মূল্যায়ন করতে হবে, সেইসাথে ভুল প্রত্যাখ্যান এবং গ্রহণযোগ্যতার খরচের বিপরীতে সেই ত্রুটিগুলিকে বৈসাদৃশ্য করতে হবে। আমরা মুখের বায়োমেট্রিক সিস্টেমের মূল্যায়ন করার জন্য আমাদের দুটি মূল মেট্রিক হিসাবে FMR এবং FNMR ব্যবহার করি।

মিথ্যা অ-ম্যাচ হার

যখন পরিচয় যাচাইকরণ ব্যবস্থা সঠিকভাবে একজন প্রকৃত ব্যবহারকারীকে শনাক্ত করতে বা অনুমোদন করতে ব্যর্থ হয়, তখন একটি মিথ্যা অ-মিল দেখা দেয়, যা মিথ্যা নেতিবাচক হিসাবেও পরিচিত। মিথ্যা নন-ম্যাচ রেট (FNMR) হল একটি পরিমাপ যে সিস্টেমটি একটি প্রকৃত ব্যবহারকারীকে ভুলভাবে সনাক্ত বা অনুমোদন করার জন্য কতটা প্রবণ।

এফএনএমআর এমন দৃষ্টান্তের শতাংশ হিসাবে প্রকাশ করা হয় যেখানে একটি অনবোর্ডিং বা প্রমাণীকরণের প্রচেষ্টা করা হয়, যেখানে ব্যবহারকারীর মুখ ভুলভাবে প্রত্যাখ্যান করা হয় (একটি মিথ্যা নেতিবাচক) কারণ সাদৃশ্য স্কোর নির্ধারিত থ্রেশহোল্ডের নীচে।

একটি সত্য ইতিবাচক (TP) হল যখন সমাধান একই ব্যক্তির দুই বা ততোধিক চিত্রকে একই বলে বিবেচনা করে। অর্থাৎ, তুলনা বা অনুসন্ধানের মিল প্রয়োজনীয় মিল থ্রেশহোল্ডের উপরে।

একটি মিথ্যা নেতিবাচক (FN) হল যখন সমাধান একই ব্যক্তির দুটি বা ততোধিক চিত্রকে আলাদা বলে বিবেচনা করে। অর্থাৎ, তুলনা বা অনুসন্ধানের মিল প্রয়োজনীয় মিল থ্রেশহোল্ডের নীচে।

FNMR এর সূত্র হল:

FNMR = মিথ্যা নেতিবাচক গণনা / (সত্য ইতিবাচক গণনা + মিথ্যা নেতিবাচক গণনা)

উদাহরণস্বরূপ, ধরুন আমাদের 10,000টি প্রকৃত প্রমাণীকরণের প্রচেষ্টা রয়েছে কিন্তু 100টি অস্বীকার করা হয়েছে কারণ রেফারেন্স চিত্র বা সংগ্রহের সাথে তাদের মিল নির্দিষ্ট মিল থ্রেশহোল্ডের নীচে পড়ে। এখানে আমাদের 9,900টি সত্য ইতিবাচক এবং 100টি মিথ্যা নেতিবাচক রয়েছে, তাই আমাদের FNMR হল 1.0%

FNMR = 100 / (9900 + 100) বা 1.0%

মিথ্যা ম্যাচ হার

যখন একটি পরিচয় যাচাইকরণ সিস্টেম ভুলভাবে একটি অননুমোদিত ব্যবহারকারীকে প্রকৃত হিসাবে শনাক্ত করে বা অনুমোদন করে, তখন একটি মিথ্যা মিল ঘটে, যা একটি মিথ্যা ইতিবাচক হিসাবেও পরিচিত। মিথ্যা ম্যাচ রেট (FMR) হল একটি পরিমাপ যে সিস্টেমটি একটি অননুমোদিত ব্যবহারকারীকে ভুলভাবে সনাক্ত বা অনুমোদন করার জন্য কতটা প্রবণ। এটি মিথ্যা ইতিবাচক স্বীকৃতি বা প্রমাণীকরণের সংখ্যা দ্বারা বিভক্ত শনাক্তকরণ প্রচেষ্টার মোট সংখ্যা দ্বারা পরিমাপ করা হয়।

একটি মিথ্যা ইতিবাচক ঘটে যখন সমাধানটি বিভিন্ন ব্যক্তির দুটি বা ততোধিক চিত্রকে একই ব্যক্তি হিসাবে বিবেচনা করে। অর্থাৎ, তুলনা বা অনুসন্ধানের মিল স্কোর প্রয়োজনীয় মিল থ্রেশহোল্ডের উপরে। মূলত, সিস্টেম ভুলভাবে সনাক্ত করে বা অনুমোদন করে যখন এটি তাদের সনাক্তকরণ বা প্রমাণীকরণ প্রচেষ্টা প্রত্যাখ্যান করা উচিত ছিল।

FMR এর সূত্র হল:

FMR = মিথ্যা ইতিবাচক গণনা / (মোট প্রচেষ্টা)

উদাহরণস্বরূপ, ধরুন আমাদের 100,000 প্রমাণীকরণের প্রচেষ্টা রয়েছে কিন্তু 100 জন জাল ব্যবহারকারী ভুলভাবে অনুমোদিত কারণ রেফারেন্স ইমেজ বা সংগ্রহের সাথে তাদের মিল নির্দিষ্ট মিল থ্রেশহোল্ডের উপরে পড়ে। এখানে আমাদের 100টি মিথ্যা ইতিবাচক রয়েছে, তাই আমাদের FMR হল 0.01%

FMR = 100 / (100,000) বা 0.01%

মিথ্যা ম্যাচ রেট বনাম মিথ্যা অ-ম্যাচ রেট

মিথ্যা ম্যাচ রেট এবং মিথ্যা নন-ম্যাচ রেট একে অপরের সাথে বিরোধপূর্ণ। সাদৃশ্য থ্রেশহোল্ড বাড়ার সাথে সাথে একটি মিথ্যা ম্যাচের সম্ভাবনা হ্রাস পায়, যখন একটি মিথ্যা অ-মিলের সম্ভাবনা বৃদ্ধি পায়। এই ট্রেড-অফ সম্পর্কে চিন্তা করার আরেকটি উপায় হল যে সাদৃশ্য থ্রেশহোল্ড বাড়লে, সমাধানটি আরও সীমাবদ্ধ হয়ে ওঠে, কম মিলের মিল তৈরি করে। উদাহরণ স্বরূপ, জননিরাপত্তা এবং নিরাপত্তার সাথে জড়িত ব্যবহারের ক্ষেত্রে মিলের মিলের থ্রেশহোল্ড বেশ উচ্চ (99 এবং তার উপরে) সেট করা সাধারণ। বিকল্পভাবে, একটি সংস্থা একটি কম সীমাবদ্ধ মিল থ্রেশহোল্ড (90 এবং তার উপরে) বেছে নিতে পারে, যেখানে ব্যবহারকারীর কাছে ঘর্ষণের প্রভাব বেশি গুরুত্বপূর্ণ। নিম্নলিখিত চিত্রটি এই ট্রেড-অফগুলিকে চিত্রিত করে৷ সংস্থাগুলির জন্য চ্যালেঞ্জ হল একটি থ্রেশহোল্ড খুঁজে পাওয়া যা আপনার সাংগঠনিক এবং আবেদনের প্রয়োজনীয়তার উপর ভিত্তি করে FMR এবং FNMR উভয়কেই কম করে।

এফএমআর বনাম এফএনএমআর ট্রেডঅফ

একটি মিল থ্রেশহোল্ড নির্বাচন করা ব্যবসায়িক আবেদনের উপর নির্ভর করে। উদাহরণস্বরূপ, ধরুন আপনি অনবোর্ডিংয়ের সময় গ্রাহকের ঘর্ষণকে সীমিত করতে চান (একটি কম সীমাবদ্ধ মিল থ্রেশহোল্ড, বাম দিকের নিম্নলিখিত চিত্রে দেখানো হয়েছে)। এখানে আপনার একটি কম প্রয়োজনীয় মিল থ্রেশহোল্ড থাকতে পারে এবং ব্যবহারকারীদের অনবোর্ডিং করার ঝুঁকি গ্রহণ করতে ইচ্ছুক যেখানে তাদের সেলফি এবং ড্রাইভিং লাইসেন্সের মধ্যে মিলের আস্থা কম। বিপরীতে, ধরুন আপনি নিশ্চিত করতে চান যে শুধুমাত্র অনুমোদিত ব্যবহারকারীরা একটি অ্যাপ্লিকেশনে প্রবেশ করুন৷ এখানে আপনি একটি বেশ সীমাবদ্ধ মিল থ্রেশহোল্ডে কাজ করতে পারেন (যেমন ডানদিকে চিত্রে দেখানো হয়েছে)।

নিম্ন সাদৃশ্য থ্রেশহোল্ড উচ্চ মিল থ্রেশহোল্ড

মিথ্যা ম্যাচ এবং অ-ম্যাচ হার গণনা করার জন্য পদক্ষেপ

এই দুটি মেট্রিক্স গণনা করার বিভিন্ন উপায় আছে। প্রকৃত চিত্র জোড়া সংগ্রহের ধাপগুলিকে ভাগ করার একটি অপেক্ষাকৃত সহজ পদ্ধতি, একটি ইম্পোস্টার পেয়ারিং তৈরি করা (ছবিগুলি যেগুলি মেলে না) এবং অবশেষে একটি প্রোব ব্যবহার করে প্রত্যাশিত মিল এবং নন-মেল ইমেজ জোড়াগুলি লুপ করার জন্য, ক্যাপচার করা ফলে সাদৃশ্য। নিম্নরূপ পদক্ষেপ:

  1. একটি প্রকৃত নমুনা ইমেজ সেট সংগ্রহ করুন. আমরা ইমেজ জোড়ার একটি সেট দিয়ে শুরু করার এবং একটি বাহ্যিক শনাক্তকারী বরাদ্দ করার সুপারিশ করি, যা একটি অফিসিয়াল মিল নির্ধারণ করতে ব্যবহৃত হয়। এই জুটি নিম্নলিখিত চিত্রগুলি নিয়ে গঠিত:
    1. সোর্স ইমেজ – আপনার বিশ্বস্ত সোর্স ইমেজ, যেমন একটি ড্রাইভার লাইসেন্স।
    2. টার্গেট ইমেজ - আপনার সেলফি বা ছবির সাথে আপনি তুলনা করতে যাচ্ছেন।
  2. প্রতারক ম্যাচের একটি চিত্র সেট সংগ্রহ করুন। এই জোড়া ছবি যেখানে উৎস এবং লক্ষ্য মেলে না। এটি FMR (সম্ভাব্যতা যে সিস্টেমটি ভুলভাবে দুটি ভিন্ন ব্যবহারকারীর মুখের সাথে মিলবে) মূল্যায়ন করতে ব্যবহৃত হয়। আপনি চিত্রগুলির একটি কার্টেসিয়ান পণ্য তৈরি করে তারপর ফলাফলটি ফিল্টার এবং নমুনা করে চিত্র জোড়া ব্যবহার করে একটি ইম্পোস্টার ইমেজ সেট তৈরি করতে পারেন।
  3. ইমেজ জোড়ার উপর লুপ করে, উৎস এবং ইপোস্টার টার্গেটের তুলনা করে এবং ফলস্বরূপ মিল ক্যাপচার করে জেনুইন এবং ইপোস্টার ম্যাচ সেটগুলি পরীক্ষা করুন।
  4. বিভিন্ন ন্যূনতম মিল থ্রেশহোল্ডে মিথ্যা ইতিবাচক এবং মিথ্যা নেতিবাচক গণনা করে FMR এবং FNMR গণনা করুন।

আপনি আপনার আবেদনের প্রয়োজনের সাথে সম্পর্কিত বিভিন্ন মিল থ্রেশহোল্ডে FMR এবং FNMR-এর খরচ মূল্যায়ন করতে পারেন।

ধাপ 1: সত্যিকারের ছবি জোড়ার নমুনা সংগ্রহ করুন

একটি পরিচয় যাচাইকরণ পরিষেবার মূল্যায়ন করার সময় মূল্যায়নের জন্য চিত্র জোড়ার একটি প্রতিনিধি নমুনা নির্বাচন করা গুরুত্বপূর্ণ। প্রথম ধাপ হল ছবি জোড়ার একটি প্রকৃত সেট সনাক্ত করা। এগুলি একজন ব্যবহারকারীর পরিচিত উত্স এবং লক্ষ্য চিত্র। জেনুইন ইমেজ পেয়ারিং FNMR মূল্যায়ন করতে ব্যবহৃত হয়, মূলত এই সম্ভাবনা যে সিস্টেমটি একই ব্যক্তির দুটি মুখের সাথে মিলবে না। প্রায়শই জিজ্ঞাসা করা প্রথম প্রশ্নগুলির মধ্যে একটি হল "কতটি চিত্র জোড়া প্রয়োজন?" উত্তর হল এটি আপনার ব্যবহারের ক্ষেত্রে নির্ভর করে, তবে সাধারণ নির্দেশিকা নিম্নরূপ:

  • 100-1,000 ছবি জোড়ার মধ্যে সম্ভাব্যতার একটি পরিমাপ প্রদান করে
  • 10,000 পর্যন্ত ছবি জোড়া ইমেজের মধ্যে পরিবর্তনশীলতা পরিমাপ করার জন্য যথেষ্ট বড়
  • 10,000 টিরও বেশি চিত্র জোড়া অপারেশনাল গুণমান এবং সাধারণীকরণের একটি পরিমাপ প্রদান করে

আরো তথ্য সবসময় ভাল; যাইহোক, একটি সূচনা বিন্দু হিসাবে, অন্তত 1,000 ছবি জোড়া ব্যবহার করুন। যাইহোক, প্রদত্ত ব্যবসায়িক সমস্যার জন্য গ্রহণযোগ্য এফএনএমআর বা এফএমআর-এ 10,000-এর বেশি ছবি জোড়া ব্যবহার করা অস্বাভাবিক নয়।

নিচের একটি নমুনা ইমেজ পেয়ার ম্যাপিং ফাইল। বাকি মূল্যায়ন প্রক্রিয়া চালাতে আমরা ইমেজ পেয়ার ম্যাপিং ফাইল ব্যবহার করি।

EXTERNAL_ID উৎস এ TARGET পরীক্ষা
9055 9055_M0.jpeg 9055_M1.jpeg অকৃত্রিম
19066 19066_M0.jpeg 19066_M1.jpeg অকৃত্রিম
11396 11396_M0.jpeg 11396_M1.jpeg অকৃত্রিম
12657 12657_M0.jpeg 12657_M1.jpeg অকৃত্রিম
... . . .

ধাপ 2: একটি ইম্পোস্টার ইমেজ পেয়ার তৈরি করুন সেট

এখন যেহেতু আপনার কাছে প্রকৃত চিত্র জোড়ার একটি ফাইল রয়েছে, আপনি লক্ষ্য এবং উত্স চিত্রগুলির একটি কার্টেসিয়ান পণ্য তৈরি করতে পারেন যেখানে বাহ্যিক শনাক্তকারীগুলি মিলিত হয় না৷ এটি উত্স থেকে লক্ষ্য জোড়া তৈরি করে যা মেলে না। এই পেয়ারিংটি FMR মূল্যায়ন করতে ব্যবহৃত হয়, মূলত সিস্টেমটি একজন ব্যবহারকারীর মুখের সাথে অন্য ব্যবহারকারীর মুখের সাথে মিলিত হওয়ার সম্ভাবনা।

বাহ্যিক_আইডি উৎস এ TARGET পরীক্ষা
114192 114192_4M49.jpeg 307107_00M17.jpeg ছদ্মবেশী
105300 105300_04F42.jpeg 035557_00M53.jpeg ছদ্মবেশী
110771 110771_3M44.jpeg 120381_1M33.jpeg ছদ্মবেশী
281333 281333_04F35.jpeg 314769_01M17.jpeg ছদ্মবেশী
40081 040081_2F52.jpeg 326169_00F32.jpeg ছদ্মবেশী
... . . .

ধাপ 3: জেনুইন এবং ইপোস্টার ইমেজ পেয়ার সেটগুলি পরীক্ষা করুন

একটি ড্রাইভার প্রোগ্রাম ব্যবহার করে, আমরা প্রয়োগ করি আমাজন রেকোনিশন CompareFaces API ইমেজ জোড়া উপর এবং সাদৃশ্য ক্যাপচার. আপনি ভঙ্গি, গুণমান এবং তুলনার অন্যান্য ফলাফলের মতো অতিরিক্ত তথ্যও ক্যাপচার করতে পারেন। অনুরূপ স্কোরগুলি নিম্নলিখিত ধাপে মিথ্যা ম্যাচ এবং অ-ম্যাচ হার গণনা করতে ব্যবহৃত হয়।

নিম্নলিখিত কোড স্নিপেটে, আমরা সমস্ত চিত্র জোড়ায় CompareFaces API প্রয়োগ করি এবং একটি টেবিলে সমস্ত মিল স্কোর পূরণ করি:

obj = s3.get_object(Bucket= bucket_name , Key = csv_file)

df = pd.read_csv(io.BytesIO(obj['Body'].read()), encoding='utf8')
def compare_faces(source_file, target_file, threshold = 0):
    response=rekognition.compare_faces(SimilarityThreshold=threshold,
                                        SourceImage={'S3Object': {
                                                    'Bucket': bucket_name,
                                                    'Name':source_file}},
                                        TargetImage={'S3Object': {
                                                    'Bucket': bucket_name,
                                                    'Name':target_file}})
df_similarity = df.copy()
df_similarity["SIMILARITY"] = None
for index, row in df.iterrows():
    source_file = dataset_folder + row["SOURCE"]
    target_file = dataset_folder + row["TARGET"]
    response_score = compare_faces(source_file, target_file)
    df_similarity._set_value(index,"SIMILARITY", response_score)
    df_similarity.head()

কোড স্নিপেট নিম্নলিখিত আউটপুট দেয়।

EXTERNAL_ID উৎস এ TARGET পরীক্ষা সাদৃশ্য
9055 9055_M0.jpeg 9055_M1.jpeg অকৃত্রিম 98.3
19066 19066_M0.jpeg 19066_M1.jpeg অকৃত্রিম 94.3
11396 11396_M0.jpeg 11396_M1.jpeg অকৃত্রিম 96.1
... . . . .
114192 114192_4M49.jpeg 307107_00M17.jpeg ছদ্মবেশী 0.0
105300 105300_04F42.jpeg 035557_00M53.jpeg ছদ্মবেশী 0.0
110771 110771_3M44.jpeg 120381_1M33.jpeg ছদ্মবেশী 0.0

পরীক্ষার দ্বারা সাদৃশ্য স্কোর বিতরণ বিশ্লেষণ চিত্র জোড়া দ্বারা সাদৃশ্য স্কোর বোঝার জন্য একটি সূচনা বিন্দু। নিম্নলিখিত কোড স্নিপেট এবং আউটপুট চার্ট পরীক্ষার সেটের পাশাপাশি বর্ণনামূলক পরিসংখ্যানের মাধ্যমে সাদৃশ্য স্কোর বিতরণের একটি সহজ উদাহরণ দেখায়:

sns.boxplot(data=df_similarity,
            x=df_similarity["SIMILARITY"],
            y=df_similarity["TEST"]).set(xlabel='Similarity Score',
            ylabel=None,
            title = "Similarity Score Distribution")
plt.show()

সাদৃশ্য স্কোর বিতরণ

df_descriptive_stats = pd.DataFrame(columns=['test','count', 'min' , 'max', 'mean', 'median', 'std'])

tests = ["Genuine", "Imposter"]

for test in tests:
    count = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].count()
    mean = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].mean()
    max_ = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].max()
    min_ = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].min()
    median = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].median()
    std = df_similarity['SIMILARITY'].loc[df_similarity['TEST'] == test].std()

    new_row = {'test': test,
                'count': count,
                'min': min_,
                'max': max_,
                'mean': mean,
                'median':median,
                'std': std}
    df_descriptive_stats = df_descriptive_stats.append(new_row,
    ignore_index=True)

df_descriptive_stats

পরীক্ষা গণনা মিনিট সর্বোচ্চ গড় মধ্যমা এসটিডি
অকৃত্রিম 204 0.2778 99.9957 91.7357 99.0961 19.9097
ছদ্মবেশী 1020 0.0075 87.3893 2.8111 0.8330 7.3496

এই উদাহরণে, আমরা দেখতে পাচ্ছি যে আসল মুখ জোড়ার গড় এবং মধ্যম মিল ছিল 91.7 এবং 99.1, যেখানে প্রতারক জোড়াগুলির জন্য যথাক্রমে 2.8 এবং 0.8 ছিল৷ প্রত্যাশিত হিসাবে, এটি প্রকৃত চিত্র জোড়ার জন্য উচ্চ মিল স্কোর এবং প্রতারক চিত্র জোড়ার জন্য কম মিল স্কোর দেখায়৷

ধাপ 4: বিভিন্ন মিল থ্রেশহোল্ড স্তরে FMR এবং FNMR গণনা করুন

এই ধাপে, আমরা মিলের বিভিন্ন থ্রেশহোল্ডে মিথ্যা ম্যাচ এবং অ-ম্যাচ হার গণনা করি। এটি করার জন্য, আমরা কেবল সাদৃশ্য থ্রেশহোল্ডগুলির মাধ্যমে লুপ করি (উদাহরণস্বরূপ, 90-100)। প্রতিটি নির্বাচিত সাদৃশ্য থ্রেশহোল্ডে, আমরা সত্য ইতিবাচক, সত্য নেতিবাচক, মিথ্যা ইতিবাচক এবং মিথ্যা নেতিবাচক গণনা সহ আমাদের বিভ্রান্তি ম্যাট্রিক্স গণনা করি, যা প্রতিটি নির্বাচিত সাদৃশ্যে FMR এবং FNMR গণনা করতে ব্যবহৃত হয়।

আসল
পূর্বঘোষিত
. ম্যাচ মিল নেই
>= নির্বাচিত সাদৃশ্য TP FP
< নির্বাচিত সাদৃশ্য FN TN

এটি করার জন্য, আমরা একটি ফাংশন তৈরি করি যা মিথ্যা ধনাত্মক এবং নেতিবাচক গণনা প্রদান করে এবং বিভিন্ন সাদৃশ্য স্কোর (90-100) এর মাধ্যমে লুপ করে:

similarity_thresholds = [80,85,90,95,96,97,98,99]

# create output df
df_cols = ['Similarity Threshold', 'TN' , 'FN', 'TP', 'FP', 'FNMR (%)', 'FMR (%)']
comparison_df = pd.DataFrame(columns=df_cols)

# create columns for y_actual and y_pred
df_analysis = df_similarity.copy()
df_analysis["y_actual"] = None
df_analysis["y_pred"] = None

for threshold in similarity_thresholds:
    # Create y_pred and y_actual columns, 1 == match, 0 == no match
    for index, row in df_similarity.iterrows():
        # set y_pred
        if row["SIMILARITY"] >= threshold:
            df_analysis._set_value(index,"y_pred", 1)
        else:
            df_analysis._set_value(index,"y_pred", 0)

        # set y_actual
        if row["TEST"] == "Genuine":
            df_analysis._set_value(index,"y_actual", 1)
        else:
            df_analysis._set_value(index,"y_actual", 0)

    tn, fp, fn, tp = confusion_matrix(df_analysis['y_actual'].tolist(),
                                      df_analysis['y_pred'].tolist()).ravel()
    FNMR = fn / (tp + fn)
    FMR = fp / (tn+fp+fn+tp)

    new_row = {'Similarity Threshold': threshold,
                'TN': tn,
                'FN': fn,
                'TP': tp,
                'FP': fp,
                'FNMR (%)':FNMR,
                'FMR (%)': FMR}
    comparison_df = comparison_df.append(new_row,ignore_index=True)

comparison_df

নিম্নলিখিত সারণী প্রতিটি মিলের থ্রেশহোল্ডে গণনার ফলাফল দেখায়।

সাদৃশ্য থ্রেশহোল্ড TN FN TP FP এফএনএমআর এফএমআর
80 1019 22 182 1 0.1% 0.1%
85 1019 23 181 1 0.11% 0.1%
90 1020 35 169 0 0.12% 0.0%
95 1020 51 153 0 0.2% 0.0%
96 1020 53 151 0 0.25% 0.0%
97 1020 60 144 0 0.3% 0.0%
98 1020 75 129 0 0.4% 0.0%
99 1020 99 105 0 0.5% 0.0%

সাদৃশ্য থ্রেশহোল্ড মিথ্যা অ-ম্যাচ হারকে কীভাবে প্রভাবিত করে?

ধরুন আমাদের 1,000 প্রকৃত ব্যবহারকারী অনবোর্ডিং প্রচেষ্টা আছে, এবং আমরা এই প্রচেষ্টাগুলির মধ্যে 10টি প্রত্যাখ্যান করি একটি মিল হিসাবে বিবেচিত হওয়ার জন্য 95% এর একটি প্রয়োজনীয় ন্যূনতম মিলের ভিত্তিতে। এখানে আমরা 10টি প্রকৃত অনবোর্ডিং প্রচেষ্টা (মিথ্যা নেতিবাচক) প্রত্যাখ্যান করি কারণ তাদের মিল নির্দিষ্ট ন্যূনতম প্রয়োজনীয় মিল থ্রেশহোল্ডের নীচে পড়ে। এই ক্ষেত্রে, আমাদের FNMR হল 1.0%।

আসল
পূর্বঘোষিত
. ম্যাচ মিল নেই
>= 95% মিল 990 0
<95% মিল 10 0
. মোট 1,000 .

FNMR = মিথ্যা নেতিবাচক গণনা / (সত্য ইতিবাচক গণনা + মিথ্যা নেতিবাচক গণনা)

FNMR = 10 / (990 + 10) বা 1.0%

বিপরীতে, ধরুন অনবোর্ডে 1,000 প্রকৃত ব্যবহারকারী থাকার পরিবর্তে, আমাদের 990 প্রকৃত ব্যবহারকারী এবং 10 জন প্রতারক ব্যবহারকারী (মিথ্যা ইতিবাচক) রয়েছে। 95% ন্যূনতম সাদৃশ্যে, ধরুন আমরা সকল 1,000 ব্যবহারকারীকে প্রকৃত হিসাবে গ্রহণ করি। এখানে আমাদের 1% FMR থাকবে।

আসল
পূর্বঘোষিত
. ম্যাচ মিল নেই মোট
>= 95% মিল 990 10 1,000
<95% মিল 0 0 .

FMR = মিথ্যা ইতিবাচক গণনা / (মোট প্রচেষ্টা)

FMR = 10 / (1,000) বা 1.0%

অনবোর্ডিং এ FMR এবং FNMR-এর খরচ মূল্যায়ন করা

একটি অনবোর্ডিং ব্যবহারের ক্ষেত্রে, একটি মিথ্যা নন-ম্যাচ (একটি প্রত্যাখ্যান) খরচ সাধারণত অতিরিক্ত ব্যবহারকারীর ঘর্ষণ বা একটি নিবন্ধন হারানোর সাথে যুক্ত। উদাহরণস্বরূপ, আমাদের ব্যাঙ্কিং ব্যবহারের ক্ষেত্রে, ধরুন জুলি নিজের দুটি ছবি উপস্থাপন করেছেন কিন্তু অনবোর্ডিংয়ের সময় ভুলভাবে প্রত্যাখ্যান করা হয়েছে কারণ দুটি ছবির মধ্যে মিল নির্বাচিত সাদৃশ্যের নিচে পড়ে (একটি মিথ্যা অ-মিল)। আর্থিক প্রতিষ্ঠান জুলিকে একজন সম্ভাব্য গ্রাহক হিসাবে হারানোর ঝুঁকি নিতে পারে, অথবা এটি জুলিকে তার পরিচয় প্রমাণ করার জন্য পদক্ষেপগুলি সম্পাদন করতে বাধ্য করে অতিরিক্ত ঘর্ষণ সৃষ্টি করতে পারে।

বিপরীতভাবে, ধরুন জুলির দুটি ছবি ভিন্ন লোকের এবং জুলির অনবোর্ডিং প্রত্যাখ্যান করা উচিত ছিল। যে ক্ষেত্রে জুলি ভুলভাবে গৃহীত হয় (একটি মিথ্যা ম্যাচ), আর্থিক প্রতিষ্ঠানের জন্য খরচ এবং ঝুঁকি সম্পূর্ণ ভিন্ন। নিয়ন্ত্রক সমস্যা, জালিয়াতির ঝুঁকি এবং আর্থিক লেনদেনের সাথে সম্পর্কিত অন্যান্য ঝুঁকি থাকতে পারে।

দায়িত্বশীল ব্যবহার

মেশিন লার্নিং (ML) এর মাধ্যমে প্রয়োগ করা কৃত্রিম বুদ্ধিমত্তা (AI) হবে আমাদের প্রজন্মের অন্যতম রূপান্তরকারী প্রযুক্তি, যা মানবতার সবচেয়ে চ্যালেঞ্জিং কিছু সমস্যার মোকাবিলা করবে, মানুষের কর্মক্ষমতা বৃদ্ধি করবে এবং উৎপাদনশীলতাকে সর্বাধিক করবে। এই প্রযুক্তির দায়িত্বশীল ব্যবহার অবিরত উদ্ভাবনকে উৎসাহিত করার চাবিকাঠি। AWS ন্যায্য এবং নির্ভুল AI এবং ML পরিষেবাগুলি বিকাশ করতে এবং AI এবং ML অ্যাপ্লিকেশনগুলিকে দায়িত্বের সাথে তৈরি করার জন্য প্রয়োজনীয় সরঞ্জাম এবং নির্দেশিকা প্রদান করতে প্রতিশ্রুতিবদ্ধ।

আপনি AI এবং ML-এর ব্যবহার গ্রহণ এবং বৃদ্ধি করার সাথে সাথে, AI এবং ML-এর দায়িত্বশীল বিকাশ এবং ব্যবহারে আপনাকে সহায়তা করার জন্য AWS আমাদের অভিজ্ঞতার উপর ভিত্তি করে বেশ কয়েকটি সংস্থান সরবরাহ করে:

সর্বোত্তম অনুশীলন এবং সাধারণ ভুলগুলি এড়াতে হবে৷

এই বিভাগে, আমরা নিম্নলিখিত সেরা অনুশীলনগুলি নিয়ে আলোচনা করব:

  • ইমেজ একটি বড় যথেষ্ট নমুনা ব্যবহার করুন
  • ওপেন সোর্স এবং সিন্থেটিক ফেস ডেটাসেট এড়িয়ে চলুন
  • ম্যানুয়াল এবং সিন্থেটিক ইমেজ ম্যানিপুলেশন এড়িয়ে চলুন
  • মূল্যায়নের সময় এবং সময়ের সাথে সাথে ছবির গুণমান পরীক্ষা করুন
  • সময়ের সাথে সাথে FMR এবং FNMR মনিটর করুন
  • লুপ পর্যালোচনাতে একজন মানুষ ব্যবহার করুন
  • অ্যামাজন স্বীকৃতির সাথে আপ টু ডেট থাকুন

ইমেজ একটি বড় যথেষ্ট নমুনা ব্যবহার করুন

ইমেজের যথেষ্ট বড় কিন্তু যুক্তিসঙ্গত নমুনা ব্যবহার করুন। একটি যুক্তিসঙ্গত নমুনা আকার কি? এটি ব্যবসায়িক সমস্যার উপর নির্ভর করে। আপনি যদি একজন নিয়োগকর্তা হন এবং আপনার 10,000 কর্মচারী থাকে যা আপনি প্রমাণীকরণ করতে চান, তাহলে 10,000টি ছবি ব্যবহার করা সম্ভবত যুক্তিসঙ্গত। যাইহোক, ধরুন আপনি এমন একটি প্রতিষ্ঠান যার লক্ষ লক্ষ গ্রাহক আপনি জাহাজে যেতে চান। এই ক্ষেত্রে, 5,000-20,000 এর মতো গ্রাহকদের একটি প্রতিনিধি নমুনা নেওয়া সম্ভবত যথেষ্ট। এখানে নমুনা আকারের কিছু নির্দেশিকা রয়েছে:

  • 100 এর একটি নমুনা আকার - 1,000 ছবি জোড়া সম্ভাব্যতা প্রমাণ করে
  • 1,000 এর একটি নমুনা আকার - 10,000 ছবি জোড়া ছবিগুলির মধ্যে পরিবর্তনশীলতা পরিমাপ করতে দরকারী
  • 10,000 এর একটি নমুনা আকার - 1 মিলিয়ন ছবি জোড়া কর্মক্ষম গুণমান এবং সাধারণীকরণের একটি পরিমাপ প্রদান করে

স্যাম্পলিং ইমেজ জোড়ার চাবিকাঠি হল যে নমুনা আপনার অ্যাপ্লিকেশনে মুখের জনসংখ্যা জুড়ে যথেষ্ট পরিবর্তনশীলতা প্রদান করে তা নিশ্চিত করা। ত্বকের টোন, লিঙ্গ এবং বয়সের মতো জনসংখ্যা সংক্রান্ত তথ্য অন্তর্ভুক্ত করতে আপনি আপনার নমুনা এবং পরীক্ষা আরও প্রসারিত করতে পারেন।

ওপেন সোর্স এবং সিন্থেটিক ফেস ডেটাসেট এড়িয়ে চলুন

কয়েক ডজন কিউরেটেড ওপেন সোর্স ফেসিয়াল ইমেজ ডেটাসেটের পাশাপাশি আশ্চর্যজনকভাবে বাস্তবসম্মত সিন্থেটিক ফেস সেট রয়েছে যা প্রায়শই গবেষণায় এবং সম্ভাব্যতা অধ্যয়নের জন্য ব্যবহৃত হয়। চ্যালেঞ্জ হল যে এই ডেটাসেটগুলি সাধারণত বাস্তব-বিশ্বের 99% ব্যবহারের ক্ষেত্রে উপযোগী নয় কারণ তারা ক্যামেরা, মুখ এবং চিত্রগুলির মানের প্রতিনিধি নয় যেগুলি আপনার অ্যাপ্লিকেশন বন্যের মুখোমুখি হতে পারে৷ যদিও এগুলি অ্যাপ্লিকেশন ডেভেলপমেন্টের জন্য উপযোগী, তবে এই ইমেজ সেটগুলির নির্ভুলতা পরিমাপগুলি আপনার নিজের অ্যাপ্লিকেশনে আপনি কী সম্মুখীন হবেন তা সাধারণীকরণ করে না। পরিবর্তে, আমরা আপনার সমাধান থেকে বাস্তব চিত্রগুলির একটি প্রতিনিধি নমুনা দিয়ে শুরু করার পরামর্শ দিই, এমনকি যদি নমুনা চিত্র জোড়া ছোট হয় (1,000-এর কম)।

ম্যানুয়াল এবং সিন্থেটিক ইমেজ ম্যানিপুলেশন এড়িয়ে চলুন

মানুষ বুঝতে আগ্রহী যে প্রায়ই প্রান্ত কেস আছে. ইমেজ ক্যাপচারের গুণমান বা মুখের নির্দিষ্ট বৈশিষ্ট্যের অস্পষ্টতার মতো জিনিস সবসময়ই আগ্রহের বিষয়। উদাহরণস্বরূপ, আমরা প্রায়ই মুখের স্বীকৃতিতে বয়স এবং ছবির গুণমানের প্রভাব সম্পর্কে জিজ্ঞাসা করি। আপনি কেবল একটি মুখকে কৃত্রিমভাবে বয়সী করতে পারেন বা বিষয়টিকে পুরোনো দেখানোর জন্য চিত্রটিকে ম্যানিপুলেট করতে পারেন, বা চিত্রের গুণমানকে ম্যানিপুলেট করতে পারেন, তবে এটি চিত্রের বাস্তব-জগতের বার্ধক্যের সাথে ভালভাবে অনুবাদ করে না। পরিবর্তে, আপনি পরীক্ষা করতে আগ্রহী এমন বাস্তব-বিশ্ব প্রান্তের ক্ষেত্রের একটি প্রতিনিধি নমুনা সংগ্রহ করার জন্য আমাদের সুপারিশ।

মূল্যায়নের সময় এবং সময়ের সাথে সাথে ছবির গুণমান পরীক্ষা করুন

ক্যামেরা এবং অ্যাপ্লিকেশন প্রযুক্তি সময়ের সাথে সাথে বেশ দ্রুত পরিবর্তন হয়। সর্বোত্তম অনুশীলন হিসাবে, আমরা সময়ের সাথে সাথে ছবির গুণমান পর্যবেক্ষণ করার পরামর্শ দিই। ক্যাপচার করা মুখের আকার থেকে (বাউন্ডিং বক্স ব্যবহার করে), একটি ছবির উজ্জ্বলতা এবং তীক্ষ্ণতা, একটি মুখের ভঙ্গি, সেইসাথে সম্ভাব্য অস্পষ্টতা (টুপি, সানগ্লাস, দাড়ি এবং আরও অনেক কিছু), এই সমস্ত ছবি এবং মুখের বৈশিষ্ট্য সময়ের সাথে পরিবর্তিত হয়।

সময়ের সাথে সাথে FNMR এবং FMR মনিটর করুন

পরিবর্তনগুলি ঘটতে পারে, তা ইমেজ, অ্যাপ্লিকেশন, বা অ্যাপ্লিকেশনে ব্যবহৃত সাদৃশ্য থ্রেশহোল্ডগুলিই হোক না কেন৷ সময়ের সাথে সাথে মিথ্যা ম্যাচ এবং অ-ম্যাচ রেটগুলি পর্যায়ক্রমে নিরীক্ষণ করা গুরুত্বপূর্ণ। হারের পরিবর্তনগুলি (এমনকি সূক্ষ্ম পরিবর্তনগুলি) প্রায়শই অ্যাপ্লিকেশনটির সাথে আপস্ট্রিম চ্যালেঞ্জ বা অ্যাপ্লিকেশনটি কীভাবে ব্যবহার করা হচ্ছে তা নির্দেশ করতে পারে। সিদ্ধান্ত গ্রহণ বা প্রত্যাখ্যান করার জন্য ব্যবহৃত সাদৃশ্য থ্রেশহোল্ড এবং ব্যবসায়িক নিয়মের পরিবর্তনগুলি অনবোর্ডিং এবং প্রমাণীকরণ ব্যবহারকারীর অভিজ্ঞতার উপর বড় প্রভাব ফেলতে পারে।

লুপ পর্যালোচনাতে একজন মানুষ ব্যবহার করুন

আইডেন্টিটি ভেরিফিকেশন সিস্টেম সাদৃশ্য থ্রেশহোল্ড এবং ব্যবসায়িক নিয়মের উপর ভিত্তি করে মিল এবং অ-মিলের স্বয়ংক্রিয় সিদ্ধান্ত নেয়। নিয়ন্ত্রক এবং অভ্যন্তরীণ সম্মতির প্রয়োজনীয়তা ছাড়াও, যেকোনো স্বয়ংক্রিয় সিদ্ধান্ত ব্যবস্থায় একটি গুরুত্বপূর্ণ প্রক্রিয়া হল সিদ্ধান্ত প্রক্রিয়ার চলমান পর্যবেক্ষণের অংশ হিসাবে মানব পর্যালোচকদের ব্যবহার করা। এই স্বয়ংক্রিয় সিদ্ধান্ত নেওয়ার সিস্টেমগুলির মানব তদারকি স্বয়ংক্রিয় সিদ্ধান্ত গ্রহণের প্রক্রিয়ায় বৈধতা এবং ক্রমাগত উন্নতির পাশাপাশি স্বচ্ছতা প্রদান করে।

অ্যামাজন স্বীকৃতির সাথে আপ টু ডেট থাকুন

Amazon Recognition faces মডেলটি পর্যায়ক্রমে আপডেট করা হয় (সাধারণত বার্ষিক), এবং বর্তমানে সংস্করণ 6 এ রয়েছে। এই আপডেট হওয়া সংস্করণটি সঠিকতা এবং সূচীকরণে গুরুত্বপূর্ণ উন্নতি করেছে। নতুন মডেল সংস্করণগুলির সাথে আপ টু ডেট থাকা এবং আপনার পরিচয় যাচাইকরণ অ্যাপ্লিকেশনে এই নতুন সংস্করণগুলি কীভাবে ব্যবহার করবেন তা বোঝা গুরুত্বপূর্ণ৷ যখন অ্যামাজন রিকগনিশন ফেস মডেলের নতুন সংস্করণগুলি চালু করা হয়, তখন আপনার পরিচয় যাচাইকরণের মূল্যায়ন প্রক্রিয়া পুনরায় চালানো এবং আপনার মিথ্যা ম্যাচ এবং অ-ম্যাচ রেটগুলিতে যে কোনও সম্ভাব্য প্রভাব (ইতিবাচক এবং নেতিবাচক) নির্ধারণ করা ভাল অনুশীলন।

উপসংহার

এই পোস্টটি বিভিন্ন নির্ভুলতা মেট্রিক্সের পরিপ্রেক্ষিতে আপনার পরিচয় যাচাইকরণ সমাধানের কার্যক্ষমতার দিকটি মূল্যায়ন করার জন্য প্রয়োজনীয় মূল উপাদানগুলি নিয়ে আলোচনা করে। যাইহোক, নির্ভুলতা শুধুমাত্র একটি নির্দিষ্ট বিষয়বস্তু সংযম পরিষেবা নির্বাচন করার সময় আপনাকে মূল্যায়ন করতে হবে এমন অনেকগুলি মাত্রার মধ্যে একটি। এটি গুরুত্বপূর্ণ যে আপনি অন্যান্য পরামিতিগুলি অন্তর্ভুক্ত করুন, যেমন পরিষেবার মোট বৈশিষ্ট্য সেট, ব্যবহারের সহজতা, বিদ্যমান একীকরণ, গোপনীয়তা এবং সুরক্ষা, কাস্টমাইজেশন বিকল্প, স্কেলেবিলিটি প্রভাব, গ্রাহক পরিষেবা এবং মূল্য নির্ধারণ।

Amazon Recognition-এ পরিচয় যাচাইকরণ সম্পর্কে আরও জানতে, দেখুন অ্যামাজন স্বীকৃতি ব্যবহার করে পরিচয় যাচাইকরণ.


লেখক সম্পর্কে

একটি পরিচয় যাচাইকরণ সমাধান PlatoBlockchain ডেটা ইন্টেলিজেন্স মূল্যায়নের জন্য মেট্রিক্স। উল্লম্ব অনুসন্ধান. আ.মাইক আমেস একজন ডেটা সায়েন্টিস্ট হয়ে পরিচিতি যাচাইকরণ সমাধানের বিশেষজ্ঞ হয়ে উঠেছেন, যার ব্যাপক অভিজ্ঞতা রয়েছে মেশিন লার্নিং এবং এআই সমাধান তৈরি করার জন্য প্রতিষ্ঠানগুলিকে জালিয়াতি, অপচয় এবং অপব্যবহার থেকে রক্ষা করার জন্য। তার অবসর সময়ে, আপনি তাকে হাইকিং, মাউন্টেন বাইকিং বা তার কুকুর ম্যাক্সের সাথে ফ্রিবি খেলা দেখতে পাবেন।

একটি পরিচয় যাচাইকরণ সমাধান PlatoBlockchain ডেটা ইন্টেলিজেন্স মূল্যায়নের জন্য মেট্রিক্স। উল্লম্ব অনুসন্ধান. আ.অমিত গুপ্ত AWS-এর একজন সিনিয়র এআই সার্ভিসেস সলিউশন আর্কিটেক্ট। তিনি স্কেলে ভাল আর্কিটেক্টেড মেশিন লার্নিং সমাধানগুলির সাথে গ্রাহকদের সক্ষম করার বিষয়ে উত্সাহী।

একটি পরিচয় যাচাইকরণ সমাধান PlatoBlockchain ডেটা ইন্টেলিজেন্স মূল্যায়নের জন্য মেট্রিক্স। উল্লম্ব অনুসন্ধান. আ.জুহায়ের রাগীব AWS-এর একজন এআই সার্ভিসেস সলিউশন আর্কিটেক্ট। প্রয়োগকৃত AI/ML-এ বিশেষজ্ঞ, তিনি গ্রাহকদের দ্রুত উদ্ভাবন করতে এবং তাদের ব্যবসায় রূপান্তর করতে ক্লাউড ব্যবহার করতে সক্ষম করার বিষয়ে আগ্রহী।

একটি পরিচয় যাচাইকরণ সমাধান PlatoBlockchain ডেটা ইন্টেলিজেন্স মূল্যায়নের জন্য মেট্রিক্স। উল্লম্ব অনুসন্ধান. আ.মার্সেল পিভিডাল ওয়ার্ল্ড ওয়াইড স্পেশালিস্ট অর্গানাইজেশনের একজন সিনিয়র এআই সার্ভিসেস সলিউশন আর্কিটেক্ট। ফিনটেক, পেমেন্ট প্রদানকারী, ফার্মা এবং সরকারী সংস্থাগুলির জন্য প্রযুক্তির মাধ্যমে ব্যবসায়িক সমস্যা সমাধানের 20 বছরেরও বেশি অভিজ্ঞতা রয়েছে মার্সেলের। তার বর্তমান মনোযোগের ক্ষেত্রগুলি হল ঝুঁকি ব্যবস্থাপনা, জালিয়াতি প্রতিরোধ এবং পরিচয় যাচাইকরণ।

সময় স্ট্যাম্প:

থেকে আরো এডাব্লুএস মেশিন লার্নিং