विश्व स्तर पर, घर्षण रहित डिजिटल उपयोगकर्ता अनुभव की ओर तेजी से बदलाव आया है। चाहे वह किसी वेबसाइट पर पंजीकरण करना हो, ऑनलाइन लेन-देन करना हो, या केवल आपके बैंक खाते में लॉग इन करना हो, संगठन सक्रिय रूप से अपने ग्राहकों के अनुभव को कम करने की कोशिश कर रहे हैं, साथ ही साथ उनकी सुरक्षा, अनुपालन और धोखाधड़ी रोकथाम उपायों को भी बढ़ा रहे हैं। घर्षण रहित उपयोगकर्ता अनुभवों की ओर बदलाव ने चेहरे पर आधारित बायोमेट्रिक पहचान सत्यापन समाधानों को जन्म दिया है, जिसका उद्देश्य "आप डिजिटल दुनिया में किसी व्यक्ति को कैसे सत्यापित करते हैं?"
जब पहचान और प्रमाणीकरण के प्रश्नों की बात आती है तो चेहरे के बायोमेट्रिक्स के दो प्रमुख लाभ होते हैं। सबसे पहले, यह उपयोगकर्ताओं के लिए एक सुविधाजनक तकनीक है: पासवर्ड याद रखने, बहु-कारक चुनौतियों से निपटने, सत्यापन लिंक पर क्लिक करने या कैप्चा पहेलियों को हल करने की कोई आवश्यकता नहीं है। दूसरे, उच्च स्तर की सुरक्षा हासिल की जाती है: फेशियल-बायोमेट्रिक्स के आधार पर पहचान और प्रमाणीकरण सुरक्षित है और धोखाधड़ी और हमलों के लिए कम संवेदनशील है।
इस पोस्ट में, हम पहचान सत्यापन के दो प्राथमिक उपयोग मामलों में गोता लगाते हैं: ऑनबोर्डिंग और प्रमाणीकरण। फिर हम बायोमेट्रिक सिस्टम की सटीकता का मूल्यांकन करने के लिए उपयोग की जाने वाली दो प्रमुख मीट्रिक में गोता लगाते हैं: झूठी मिलान दर (जिसे झूठी स्वीकृति दर भी कहा जाता है) और झूठी गैर-मिलान दर (जिसे झूठी अस्वीकृति दर भी कहा जाता है)। बायोमेट्रिक सिस्टम की सटीकता और त्रुटि दर का मूल्यांकन करने के लिए संगठनों द्वारा इन दो उपायों का व्यापक रूप से उपयोग किया जाता है। अंत में, हम एक पहचान सत्यापन सेवा का मूल्यांकन करने के लिए एक रूपरेखा और सर्वोत्तम प्रथाओं पर चर्चा करते हैं।
साथ का संदर्भ लें ज्यूपिटर नोटबुक जो इस पोस्ट में उल्लिखित सभी चरणों से चलता है।
मामलों का उपयोग करें: ऑनबोर्डिंग और प्रमाणीकरण
बायोमेट्रिक समाधान के लिए दो प्राथमिक उपयोग मामले हैं: उपयोगकर्ता ऑनबोर्डिंग (अक्सर सत्यापन के रूप में संदर्भित) और प्रमाणीकरण (अक्सर पहचान के रूप में संदर्भित)। ऑनबोर्डिंग में दो छवियों के बीच चेहरों का एक-से-एक मिलान होता है, उदाहरण के लिए एक सेल्फी की तुलना ड्राइविंग लाइसेंस या पासपोर्ट जैसे विश्वसनीय पहचान दस्तावेज से करना। दूसरी ओर, प्रमाणीकरण में चेहरों के संग्रहीत संग्रह के विरुद्ध चेहरे की एक-से-कई खोज होती है, उदाहरण के लिए कर्मचारियों के संग्रह को खोजने के लिए यह देखने के लिए कि क्या कोई कर्मचारी किसी भवन में किसी विशेष मंजिल तक अधिकृत है या नहीं।
ऑनबोर्डिंग और प्रमाणीकरण उपयोग के मामलों की सटीकता का प्रदर्शन झूठी सकारात्मक और झूठी नकारात्मक त्रुटियों से मापा जाता है जो बायोमेट्रिक समाधान कर सकते हैं। एक मैच या एक गैर-मैच निर्णय के निर्धारण के लिए एक समानता स्कोर (0% से लेकर 100% का मतलब कोई मैच नहीं है) का उपयोग किया जाता है। एक झूठी सकारात्मक तब होती है जब समाधान दो अलग-अलग व्यक्तियों की छवियों को एक ही व्यक्ति मानता है। दूसरी ओर, एक झूठी नकारात्मक का अर्थ है कि समाधान एक ही व्यक्ति की दो छवियों को अलग-अलग मानता है।
ऑनबोर्डिंग: एक-से-एक सत्यापन
बॉयोमीट्रिक-आधारित ऑनबोर्डिंग प्रक्रियाएं प्रक्रिया को सरल और सुरक्षित करती हैं। सबसे महत्वपूर्ण बात यह है कि यह संगठन और ग्राहक को लगभग घर्षण रहित ऑनबोर्डिंग अनुभव के लिए तैयार करता है। ऐसा करने के लिए, उपयोगकर्ताओं को ऑनबोर्डिंग प्रक्रिया के दौरान उपयोगकर्ता के चेहरे (जैसे ड्राइवर का लाइसेंस या पासपोर्ट) के साथ-साथ एक सेल्फी छवि लेने के साथ-साथ किसी विश्वसनीय पहचान दस्तावेज़ की छवि प्रस्तुत करने की आवश्यकता होती है। सिस्टम के पास ये दो छवियां होने के बाद, यह केवल दो छवियों के भीतर चेहरों की तुलना करता है। जब समानता एक निर्दिष्ट सीमा से अधिक होती है, तो आपके पास एक मेल होता है; अन्यथा, आपके पास एक मेल नहीं है। निम्नलिखित आरेख प्रक्रिया को रेखांकित करता है।
डिजिटल बैंक खाता खोलने वाले एक नए उपयोगकर्ता जूली के उदाहरण पर विचार करें। समाधान उसे अपने ड्राइवर के लाइसेंस (चरण 2) की एक तस्वीर लेने और एक सेल्फी (चरण 3) लेने के लिए प्रेरित करता है। सिस्टम छवियों की गुणवत्ता (चरण 4) की जांच करने के बाद, यह ड्राइवर के लाइसेंस (एक-से-एक मिलान) पर सेल्फी में चेहरे की तुलना करता है और एक समानता स्कोर (चरण 5) का उत्पादन करता है। यदि समानता स्कोर आवश्यक समानता सीमा से कम है, तो जूली द्वारा ऑनबोर्डिंग प्रयास को अस्वीकार कर दिया जाता है। इसे हम एक गलत गैर-मिलान या झूठी अस्वीकृति कहते हैं: समाधान एक ही व्यक्ति की दो छवियों को भिन्न मानता है। दूसरी ओर, यदि समानता स्कोर आवश्यक समानता से अधिक था, तो समाधान दो छवियों को एक ही व्यक्ति या मैच मानता है।
प्रमाणीकरण: एक से कई पहचान
एक इमारत में प्रवेश करने से लेकर कियोस्क पर चेक इन करने तक, उपयोगकर्ता को उनकी पहचान सत्यापित करने के लिए सेल्फी लेने के लिए प्रेरित करने तक, चेहरे की पहचान के माध्यम से इस प्रकार का शून्य-से-कम-घर्षण प्रमाणीकरण कई संगठनों के लिए आम हो गया है। छवि-से-छवि मिलान करने के बजाय, यह प्रमाणीकरण उपयोग मामला एक छवि लेता है और इसकी तुलना संभावित मिलान के लिए छवियों के खोज योग्य संग्रह से करता है। एक विशिष्ट प्रमाणीकरण उपयोग के मामले में, उपयोगकर्ता को एक सेल्फी लेने के लिए कहा जाता है, जिसकी तुलना संग्रह में संग्रहीत चेहरों से की जाती है। खोज का परिणाम शून्य, एक या अधिक संभावित समानता स्कोर और बाहरी पहचानकर्ताओं के साथ मेल खाता है। यदि कोई मिलान नहीं लौटाया जाता है, तो उपयोगकर्ता प्रमाणित नहीं होता है; हालाँकि, यह मानते हुए कि खोज एक या अधिक मैच लौटाती है, सिस्टम समानता स्कोर और बाहरी पहचानकर्ताओं के आधार पर प्रमाणीकरण निर्णय लेता है। यदि समानता स्कोर आवश्यक समानता सीमा से अधिक है और बाहरी पहचानकर्ता अपेक्षित पहचानकर्ता से मेल खाता है, तो उपयोगकर्ता को प्रमाणित (मिलान) किया जाता है। निम्नलिखित आरेख चेहरे पर आधारित बायोमेट्रिक प्रमाणीकरण प्रक्रिया का उदाहरण देता है।
गिग-इकोनॉमी डिलीवरी ड्राइवर जोस के उदाहरण पर विचार करें। डिलीवरी सेवा कंपनी के मोबाइल एप्लिकेशन का उपयोग करके डिलीवरी शुरू करने से पहले ड्राइवर को एक सेल्फी लेने के लिए प्रेरित करके डिलीवरी ड्राइवरों को प्रमाणित करती है। एक समस्या गिग-इकोनॉमी सर्विस प्रोवाइडर्स का सामना जॉब-शेयरिंग से है; सिस्टम को गेम करने के लिए अनिवार्य रूप से दो या दो से अधिक उपयोगकर्ता एक ही खाते को साझा करते हैं। इससे निपटने के लिए, कई डिलीवरी सेवाएं डिलीवरी के दौरान यादृच्छिक समय पर ड्राइवर की छवियों (चरण 2) को स्नैप करने के लिए एक इन-कार कैमरे का उपयोग करती हैं (यह सुनिश्चित करने के लिए कि डिलीवरी ड्राइवर अधिकृत ड्राइवर है)। इस मामले में, जोस न केवल अपनी डिलीवरी की शुरुआत में एक सेल्फी लेता है, बल्कि एक कार में कैमरा डिलीवरी के दौरान उसकी तस्वीरें लेता है। सिस्टम गुणवत्ता जांच करता है (चरण 3) और ड्राइवर की पहचान सत्यापित करने के लिए पंजीकृत ड्राइवरों का संग्रह खोजता है (चरण 4)। अगर किसी दूसरे ड्राइवर का पता चलता है, तो गिग-इकोनॉमी डिलीवरी सर्विस आगे की जांच कर सकती है।
एक झूठा मिलान (गलत सकारात्मक) तब होता है जब समाधान अलग-अलग लोगों की दो या दो से अधिक छवियों को एक ही व्यक्ति मानता है। हमारे उपयोग के मामले में, मान लीजिए कि अधिकृत ड्राइवर, जोस के बजाय वह अपने भाई मिगुएल को उसके लिए अपनी एक डिलीवरी लेने देता है। यदि समाधान गलत तरीके से मिगुएल की सेल्फी से जोस की छवियों से मेल खाता है, तो एक गलत मिलान (गलत सकारात्मक) होता है।
झूठे मिलान की संभावना का मुकाबला करने के लिए, हम अनुशंसा करते हैं कि संग्रह में प्रत्येक विषय की कई छवियां हों। भरोसेमंद पहचान दस्तावेजों को अनुक्रमित करना आम बात है, जिसमें एक चेहरा, ऑनबोर्डिंग के समय एक सेल्फी, और पिछली कई पहचान जांचों से सेल्फी शामिल हैं। किसी विषय की कई छवियों को अनुक्रमित करने से लौटाए गए चेहरों में समानता स्कोर एकत्र करने की क्षमता मिलती है, जिससे पहचान की सटीकता में सुधार होता है। इसके अतिरिक्त, झूठी स्वीकृति के जोखिम को सीमित करने के लिए बाहरी पहचानकर्ताओं का उपयोग किया जाता है। एक उदाहरण व्यापार नियम कुछ ऐसा दिखाई दे सकता है:
यदि समग्र समानता स्कोर> = आवश्यक समानता सीमा और बाहरी पहचानकर्ता == अपेक्षित पहचानकर्ता तब प्रमाणित करें
प्रमुख बायोमेट्रिक सटीकता उपाय
बायोमेट्रिक प्रणाली में, हम चेहरे की तुलना और खोजों से समानता स्कोर के आधार पर झूठी मिलान दर (एफएमआर) और झूठी गैर-मिलान दर (एफएनएमआर) में रूचि रखते हैं। चाहे वह ऑनबोर्डिंग या प्रमाणीकरण उपयोग का मामला हो, बायोमेट्रिक सिस्टम दो या दो से अधिक छवियों के समानता स्कोर के आधार पर उपयोगकर्ता के चेहरे के मिलान को स्वीकार या अस्वीकार करने का निर्णय लेते हैं। किसी भी निर्णय प्रणाली की तरह, ऐसी त्रुटियाँ होंगी जहाँ सिस्टम ऑनबोर्डिंग या प्रमाणीकरण के प्रयास को गलत तरीके से स्वीकार या अस्वीकार करता है। अपने पहचान सत्यापन समाधान के मूल्यांकन के भाग के रूप में, आपको झूठे मिलान और गलत गैर-मिलान दरों को कम करने के साथ-साथ गलत अस्वीकृति और स्वीकृति की लागत के विरुद्ध उन त्रुटियों की तुलना करने के लिए विभिन्न समानता थ्रेसहोल्ड पर सिस्टम का मूल्यांकन करने की आवश्यकता है। हम फेशियल बायोमेट्रिक सिस्टम का मूल्यांकन करने के लिए FMR और FNMR को अपने दो प्रमुख मेट्रिक्स के रूप में उपयोग करते हैं।
फाल्स नॉन-मैच रेट
जब पहचान सत्यापन प्रणाली एक वास्तविक उपयोगकर्ता की सही पहचान करने या अधिकृत करने में विफल रहती है, तो एक गलत गैर-मिलान होता है, जिसे गलत नकारात्मक भी कहा जाता है। गलत गैर-मिलान दर (एफएनएमआर) एक माप है कि सिस्टम वास्तविक उपयोगकर्ता को गलत तरीके से पहचानने या अधिकृत करने के लिए कितना प्रवण है।
FNMR को उन उदाहरणों के प्रतिशत के रूप में व्यक्त किया जाता है जहां ऑनबोर्डिंग या प्रमाणीकरण का प्रयास किया जाता है, जहां उपयोगकर्ता के चेहरे को गलत तरीके से अस्वीकार कर दिया जाता है (गलत नकारात्मक) क्योंकि समानता स्कोर निर्धारित सीमा से नीचे है।
एक सच्चा सकारात्मक (टीपी) तब होता है जब समाधान एक ही व्यक्ति की दो या दो से अधिक छवियों को समान मानता है। अर्थात, तुलना या खोज की समानता आवश्यक समानता सीमा से ऊपर है।
एक गलत नकारात्मक (FN) तब होता है जब समाधान एक ही व्यक्ति की दो या दो से अधिक छवियों को अलग-अलग मानता है। अर्थात, तुलना या खोज की समानता आवश्यक समानता सीमा से कम है।
FNMR का सूत्र है:
FNMR = गलत नकारात्मक गणना / (सही सकारात्मक गणना + गलत नकारात्मक गणना)
उदाहरण के लिए, मान लें कि हमारे पास 10,000 वास्तविक प्रमाणीकरण प्रयास हैं, लेकिन 100 अस्वीकार कर दिए गए हैं क्योंकि संदर्भ छवि या संग्रह के साथ उनकी समानता निर्दिष्ट समानता सीमा से नीचे आती है। यहां हमारे पास 9,900 सच्चे सकारात्मक और 100 गलत नकारात्मक हैं, इसलिए हमारा FNMR 1.0% है
FNMR = 100 / (9900 + 100) या 1.0%
गलत मिलान दर
जब एक पहचान सत्यापन प्रणाली गलत तरीके से एक अनधिकृत उपयोगकर्ता को वास्तविक के रूप में पहचानती है या अधिकृत करती है, तो एक झूठा मिलान होता है, जिसे झूठी सकारात्मक भी कहा जाता है। गलत मिलान दर (FMR) एक माप है कि अनधिकृत उपयोगकर्ता को गलत तरीके से पहचानने या अधिकृत करने के लिए सिस्टम कितना प्रवण है। इसे पहचान प्रयासों की कुल संख्या से विभाजित झूठी सकारात्मक पहचान या प्रमाणीकरण की संख्या से मापा जाता है।
एक झूठी सकारात्मक तब होती है जब समाधान अलग-अलग लोगों की दो या दो से अधिक छवियों को एक ही व्यक्ति मानता है। अर्थात्, तुलना या खोज का समानता स्कोर आवश्यक समानता सीमा से ऊपर है। अनिवार्य रूप से, सिस्टम गलत तरीके से किसी उपयोगकर्ता की पहचान या अधिकृत करता है जब उसे उनकी पहचान या प्रमाणीकरण के प्रयास को अस्वीकार कर देना चाहिए था।
FMR का सूत्र है:
FMR = फाल्स पॉजिटिव काउंट / (कुल प्रयास)
उदाहरण के लिए, मान लें कि हमारे पास 100,000 प्रमाणीकरण प्रयास हैं लेकिन 100 फर्जी उपयोगकर्ता गलत तरीके से अधिकृत हैं क्योंकि संदर्भ छवि या संग्रह के साथ उनकी समानता निर्दिष्ट समानता सीमा से ऊपर है। यहां हमारे पास 100 झूठे सकारात्मक हैं, इसलिए हमारा एफएमआर 0.01% है
एफएमआर = 100 / (100,000) या 0.01%
फाल्स मैच रेट बनाम फाल्स नॉन मैच रेट
फाल्स मैच रेट और फाल्स नॉन मैच रेट एक दूसरे के विपरीत हैं। जैसे-जैसे समानता की दहलीज बढ़ती है, एक झूठे मैच की संभावना कम हो जाती है, जबकि एक गलत गैर-मिलान की संभावना बढ़ जाती है। इस ट्रेड-ऑफ के बारे में सोचने का एक और तरीका यह है कि जैसे-जैसे समानता की सीमा बढ़ती है, समाधान अधिक प्रतिबंधात्मक हो जाता है, जिससे कम समानता वाले मैच बनते हैं। उदाहरण के लिए, सार्वजनिक सुरक्षा और सुरक्षा से जुड़े उपयोग मामलों के लिए मैच समानता सीमा को काफी अधिक (99 और ऊपर) सेट करना आम बात है। वैकल्पिक रूप से, एक संगठन कम प्रतिबंधात्मक समानता सीमा (90 और ऊपर) चुन सकता है, जहां उपयोगकर्ता के लिए घर्षण का प्रभाव अधिक महत्वपूर्ण होता है। निम्नलिखित आरेख इन व्यापार-बंदों को दिखाता है। संगठनों के लिए चुनौती एक सीमा का पता लगाना है जो आपके संगठनात्मक और आवेदन आवश्यकताओं के आधार पर एफएमआर और एफएनएमआर दोनों को कम करता है।
समानता सीमा का चयन करना व्यावसायिक अनुप्रयोग पर निर्भर करता है। उदाहरण के लिए, मान लें कि आप ऑनबोर्डिंग के दौरान ग्राहक के घर्षण को सीमित करना चाहते हैं (एक कम प्रतिबंधात्मक समानता सीमा, जैसा कि बाईं ओर निम्नलिखित चित्र में दिखाया गया है)। यहां आपके पास कम आवश्यक समानता सीमा हो सकती है, और ऑनबोर्डिंग उपयोगकर्ताओं के जोखिम को स्वीकार करने के लिए तैयार हैं जहां उनकी सेल्फी और ड्राइविंग लाइसेंस के बीच मैच में विश्वास कम है। इसके विपरीत, मान लीजिए कि आप यह सुनिश्चित करना चाहते हैं कि किसी एप्लिकेशन में केवल अधिकृत उपयोगकर्ता ही आएं। यहां आप काफी प्रतिबंधात्मक समानता सीमा पर काम कर सकते हैं (जैसा कि दाईं ओर की आकृति में दिखाया गया है)।
फाल्स मैच और नॉन मैच दरों की गणना के लिए कदम
इन दो मीट्रिक की गणना करने के कई तरीके हैं। निम्नलिखित वास्तविक छवि जोड़े को इकट्ठा करने में चरणों को विभाजित करने का एक अपेक्षाकृत सरल तरीका है, एक इम्पोस्टर जोड़ी बनाना (ऐसी छवियां जो मेल नहीं खानी चाहिए), और अंत में अपेक्षित मिलान और गैर-मिलान छवि जोड़े पर लूप करने के लिए एक जांच का उपयोग करके, कैप्चर करना परिणामी समानता। कदम इस प्रकार हैं:
- एक वास्तविक नमूना छवि सेट इकट्ठा करें। हम छवि जोड़े के एक सेट के साथ शुरू करने और एक बाहरी पहचानकर्ता निर्दिष्ट करने की सलाह देते हैं, जिसका उपयोग आधिकारिक मैच निर्धारण करने के लिए किया जाता है। जोड़ी में निम्नलिखित चित्र शामिल हैं:
- स्रोत छवि - आपकी विश्वसनीय स्रोत छवि, उदाहरण के लिए ड्राइविंग लाइसेंस।
- लक्ष्य छवि - आपकी सेल्फी या छवि जिसकी आप तुलना करने जा रहे हैं।
- इम्पोस्टर मैचों का एक इमेज सेट इकट्ठा करें। ये छवियों के जोड़े हैं जहां स्रोत और लक्ष्य मेल नहीं खाते। इसका उपयोग FMR का आकलन करने के लिए किया जाता है (संभावना है कि सिस्टम गलत तरीके से दो अलग-अलग उपयोगकर्ताओं के चेहरों से मेल खाएगा)। आप छवियों के कार्टेशियन उत्पाद बनाकर फिर परिणाम को फ़िल्टर और नमूना बनाकर छवि जोड़े का उपयोग करके एक इम्पोस्टर छवि सेट बना सकते हैं।
- छवि जोड़े पर लूपिंग करके, स्रोत और नकली लक्ष्य की तुलना करके और परिणामी समानता को कैप्चर करके वास्तविक और नकली मैच सेट की जांच करें।
- विभिन्न न्यूनतम समानता थ्रेसहोल्ड पर झूठे सकारात्मक और झूठे नकारात्मक की गणना करके एफएमआर और एफएनएमआर की गणना करें।
आप अपने आवेदन की आवश्यकता के सापेक्ष विभिन्न समानता थ्रेसहोल्ड पर FMR और FNMR की लागत का आकलन कर सकते हैं।
चरण 1: वास्तविक छवि युग्म नमूने एकत्र करें
पहचान सत्यापन सेवा का मूल्यांकन करते समय मूल्यांकन करने के लिए छवि जोड़े का एक प्रतिनिधि नमूना चुनना महत्वपूर्ण है। छवि जोड़े के वास्तविक सेट की पहचान करने के लिए पहला कदम है। ये उपयोगकर्ता के ज्ञात स्रोत और लक्ष्य चित्र हैं। वास्तविक इमेज पेयरिंग का उपयोग FNMR का आकलन करने के लिए किया जाता है, अनिवार्य रूप से संभावना है कि सिस्टम एक ही व्यक्ति के दो चेहरों से मेल नहीं खाएगा। अक्सर पूछे जाने वाले पहले प्रश्नों में से एक है "कितने चित्र जोड़े आवश्यक हैं?" उत्तर यह है कि यह आपके उपयोग के मामले पर निर्भर करता है, लेकिन सामान्य मार्गदर्शन निम्नलिखित है:
- 100-1,000 छवि जोड़े के बीच व्यवहार्यता का एक उपाय प्रदान करता है
- छवियों के बीच परिवर्तनशीलता को मापने के लिए 10,000 छवियों के जोड़े काफी बड़े हैं
- 10,000 से अधिक छवि जोड़े परिचालन गुणवत्ता और सामान्यता का माप प्रदान करते हैं
अधिक डेटा हमेशा बेहतर होता है; हालाँकि, एक शुरुआती बिंदु के रूप में, कम से कम 1,000 छवि जोड़े का उपयोग करें। हालांकि, किसी व्यावसायिक समस्या के लिए स्वीकार्य FNMR या FMR पर 10,000 से अधिक छवि जोड़े का शून्य में उपयोग करना असामान्य नहीं है।
निम्नलिखित एक नमूना छवि जोड़ी मानचित्रण फ़ाइल है। हम बाकी मूल्यांकन प्रक्रिया को चलाने के लिए छवि जोड़ी मैपिंग फ़ाइल का उपयोग करते हैं।
बाहरी_आईडी | स्रोत | TARGET में | टेस्ट |
9055 | 9055_M0.jpeg | 9055_M1.jpeg | वास्तविक |
19066 | 19066_M0.jpeg | 19066_M1.jpeg | वास्तविक |
11396 | 11396_M0.jpeg | 11396_M1.jpeg | वास्तविक |
12657 | 12657_M0.jpeg | 12657_M1.jpeg | वास्तविक |
... | . | . | . |
चरण 2: एक इम्पोस्टर छवि जोड़ी उत्पन्न करें सेट
अब जब आपके पास वास्तविक छवि जोड़े की एक फ़ाइल है, तो आप लक्ष्य और स्रोत छवियों का एक कार्टेशियन उत्पाद बना सकते हैं जहाँ बाहरी पहचानकर्ता मेल नहीं खाते हैं। यह स्रोत-से-लक्षित जोड़े बनाता है जो मेल नहीं खाना चाहिए। इस जोड़ी का उपयोग FMR का आकलन करने के लिए किया जाता है, अनिवार्य रूप से संभावना है कि सिस्टम एक उपयोगकर्ता के चेहरे को एक अलग उपयोगकर्ता के चेहरे से मिलाएगा।
बाहरी_आईडी | स्रोत | TARGET में | टेस्ट |
114192 | 114192_4एम49.जेपीईजी | 307107_00एम17.जेपीईजी | ढोंगी |
105300 | 105300_04F42.jpeg | 035557_00एम53.जेपीईजी | ढोंगी |
110771 | 110771_3एम44.जेपीईजी | 120381_1एम33.जेपीईजी | ढोंगी |
281333 | 281333_04F35.jpeg | 314769_01एम17.जेपीईजी | ढोंगी |
40081 | 040081_2F52.jpeg | 326169_00F32.jpeg | ढोंगी |
... | . | . | . |
चरण 3: वास्तविक और नकली इमेज पेयर सेट की जांच करें
ड्राइवर प्रोग्राम का उपयोग करके, हम इसे लागू करते हैं अमेज़ॅन रेकग्निशन तुलनाफेस एपीआई छवि जोड़े पर और समानता पर कब्जा करें। आप मुद्रा, गुणवत्ता और तुलना के अन्य परिणामों जैसी अतिरिक्त जानकारी भी प्राप्त कर सकते हैं। निम्नलिखित चरण में नकली मिलान और गैर-मिलान दरों की गणना करने के लिए समानता स्कोर का उपयोग किया जाता है।
निम्नलिखित कोड स्निपेट में, हम सभी छवि जोड़े के लिए तुलनाफेस एपीआई लागू करते हैं और एक तालिका में सभी समानता स्कोर को भरते हैं:
कोड स्निपेट निम्न आउटपुट देता है।
बाहरी_आईडी | स्रोत | TARGET में | टेस्ट | समानता |
9055 | 9055_M0.jpeg | 9055_M1.jpeg | वास्तविक | 98.3 |
19066 | 19066_M0.jpeg | 19066_M1.jpeg | वास्तविक | 94.3 |
11396 | 11396_M0.jpeg | 11396_M1.jpeg | वास्तविक | 96.1 |
... | . | . | . | . |
114192 | 114192_4एम49.जेपीईजी | 307107_00एम17.जेपीईजी | ढोंगी | 0.0 |
105300 | 105300_04F42.jpeg | 035557_00एम53.जेपीईजी | ढोंगी | 0.0 |
110771 | 110771_3एम44.जेपीईजी | 120381_1एम33.जेपीईजी | ढोंगी | 0.0 |
परीक्षण द्वारा समानता स्कोर का वितरण विश्लेषण छवि जोड़े द्वारा समानता स्कोर को समझने का एक प्रारंभिक बिंदु है। निम्नलिखित कोड स्निपेट और आउटपुट चार्ट परीक्षण सेट के साथ-साथ परिणामी वर्णनात्मक आंकड़ों द्वारा समानता स्कोर के वितरण का एक सरल उदाहरण दिखाता है:
परीक्षण | गणना | मिनट | मैक्स | मतलब | मंझला | एसटीडी |
असली | 204 | 0.2778 | 99.9957 | 91.7357 | 99.0961 | 19.9097 |
ढोंगी | 1020 | 0.0075 | 87.3893 | 2.8111 | 0.8330 | 7.3496 |
इस उदाहरण में, हम देख सकते हैं कि वास्तविक चेहरे जोड़े के लिए औसत और औसत समानता 91.7 और 99.1 थी, जबकि नकली जोड़े के लिए क्रमशः 2.8 और 0.8 थी। जैसा कि अपेक्षित था, यह वास्तविक छवि जोड़े के लिए उच्च समानता स्कोर और नकली छवि जोड़े के लिए कम समानता स्कोर दिखाता है।
चरण 4: विभिन्न समानता सीमा स्तरों पर FMR और FNMR की गणना करें
इस चरण में, हम समानता के विभिन्न थ्रेसहोल्ड पर झूठी मिलान और गैर-मिलान दरों की गणना करते हैं। ऐसा करने के लिए, हम केवल समानता थ्रेसहोल्ड (उदाहरण के लिए, 90-100) के माध्यम से लूप करते हैं। प्रत्येक चयनित समानता सीमा पर, हम अपने भ्रम मैट्रिक्स की गणना करते हैं जिसमें सही सकारात्मक, वास्तविक नकारात्मक, गलत सकारात्मक और गलत नकारात्मक गणनाएँ होती हैं, जिनका उपयोग प्रत्येक चयनित समानता पर FMR और FNMR की गणना करने के लिए किया जाता है।
वास्तविक | |||
भविष्यवाणी की | |||
. | मैच | कोई मुकाबला नहीं | |
> = चयनित समानता | TP | FP | |
<चयनित समानता | FN | TN |
ऐसा करने के लिए, हम एक ऐसा फ़ंक्शन बनाते हैं जो झूठी सकारात्मक और नकारात्मक गणना देता है, और समानता स्कोर (90-100) की एक श्रृंखला के माध्यम से लूप करता है:
निम्न तालिका प्रत्येक समानता सीमा पर गणना के परिणाम दिखाती है।
समानता दहलीज | TN | FN | TP | FP | एफएनएमआर | FMR |
80 | 1019 | 22 | 182 | 1 | 0.1% तक | 0.1% तक |
85 | 1019 | 23 | 181 | 1 | 0.11% तक | 0.1% तक |
90 | 1020 | 35 | 169 | 0 | 0.12% तक | 0.0% तक |
95 | 1020 | 51 | 153 | 0 | 0.2% तक | 0.0% तक |
96 | 1020 | 53 | 151 | 0 | 0.25% तक | 0.0% तक |
97 | 1020 | 60 | 144 | 0 | 0.3% तक | 0.0% तक |
98 | 1020 | 75 | 129 | 0 | 0.4% तक | 0.0% तक |
99 | 1020 | 99 | 105 | 0 | 0.5% तक | 0.0% तक |
समानता सीमा झूठी गैर-मिलान दर को कैसे प्रभावित करती है?
मान लीजिए कि हमारे पास 1,000 वास्तविक उपयोगकर्ता ऑनबोर्डिंग प्रयास हैं, और हम इनमें से 10 प्रयासों को 95% की आवश्यक न्यूनतम समानता के आधार पर अस्वीकार कर देते हैं, जिसे एक मैच माना जाता है। यहां हम 10 वास्तविक ऑनबोर्डिंग प्रयासों (गलत नकारात्मक) को अस्वीकार करते हैं क्योंकि उनकी समानता निर्दिष्ट न्यूनतम आवश्यक समानता सीमा से नीचे आती है। ऐसे में हमारा FNMR 1.0% है।
वास्तविक | |||
भविष्यवाणी की | |||
. | मैच | कोई मुकाबला नहीं | |
>= 95% समानता | 990 | 0 | |
<95% समानता | 10 | 0 | |
. | कुल | 1,000 | . |
FNMR = गलत नकारात्मक गणना / (सही सकारात्मक गणना + गलत नकारात्मक गणना)
FNMR = 10 / (990 + 10) या 1.0%
इसके विपरीत, मान लीजिए कि जहाज पर 1,000 वास्तविक उपयोगकर्ता होने के बजाय, हमारे पास 990 वास्तविक उपयोगकर्ता और 10 नकली उपयोगकर्ता (गलत सकारात्मक) हैं। 95% न्यूनतम समानता पर, मान लीजिए कि हम सभी 1,000 उपयोगकर्ताओं को वास्तविक के रूप में स्वीकार करते हैं। यहां हमारे पास 1% FMR होगा।
वास्तविक | ||||
भविष्यवाणी की | ||||
. | मैच | कोई मुकाबला नहीं | कुल | |
>= 95% समानता | 990 | 10 | 1,000 | |
<95% समानता | 0 | 0 | . |
FMR = फाल्स पॉजिटिव काउंट / (कुल प्रयास)
एफएमआर = 10 / (1,000) या 1.0%
ऑनबोर्डिंग पर FMR और FNMR की लागत का आकलन करना
ऑनबोर्डिंग उपयोग के मामले में, झूठे गैर-मिलान (अस्वीकृति) की लागत आम तौर पर अतिरिक्त उपयोगकर्ता घर्षण या पंजीकरण के नुकसान से जुड़ी होती है। उदाहरण के लिए, हमारे बैंकिंग उपयोग के मामले में, मान लीजिए कि जूली खुद की दो छवियां प्रस्तुत करती है, लेकिन ऑनबोर्डिंग के समय गलत तरीके से खारिज कर दी जाती है क्योंकि दो छवियों के बीच समानता चयनित समानता (एक झूठी गैर-मिलान) से कम हो जाती है। वित्तीय संस्थान जूली को एक संभावित ग्राहक के रूप में खोने का जोखिम उठा सकता है, या जूली को अपनी पहचान साबित करने के लिए कदम उठाने की आवश्यकता के कारण अतिरिक्त घर्षण पैदा कर सकता है।
इसके विपरीत, मान लीजिए कि जूली की दो छवियां अलग-अलग लोगों की हैं और जूली की ऑनबोर्डिंग को अस्वीकार कर दिया जाना चाहिए था। ऐसे मामले में जहां जूली को गलत तरीके से स्वीकार किया जाता है (झूठा मिलान), वित्तीय संस्थान के लिए लागत और जोखिम काफी भिन्न होता है। विनियामक मुद्दे, धोखाधड़ी का जोखिम और वित्तीय लेनदेन से जुड़े अन्य जोखिम हो सकते हैं।
जिम्मेदार उपयोग
मशीन लर्निंग (एमएल) के माध्यम से लागू आर्टिफिशियल इंटेलिजेंस (एआई) हमारी पीढ़ी की सबसे परिवर्तनकारी तकनीकों में से एक होगी, जो मानवता की कुछ सबसे चुनौतीपूर्ण समस्याओं से निपटेगी, मानव प्रदर्शन को बढ़ाएगी, और उत्पादकता को अधिकतम करेगी। निरंतर नवाचार को बढ़ावा देने के लिए इन तकनीकों का जिम्मेदार उपयोग महत्वपूर्ण है। AWS निष्पक्ष और सटीक AI और ML सेवाओं को विकसित करने और आपको AI और ML अनुप्रयोगों को जिम्मेदारी से बनाने के लिए आवश्यक उपकरण और मार्गदर्शन प्रदान करने के लिए प्रतिबद्ध है।
जैसा कि आप एआई और एमएल के अपने उपयोग को अपनाते हैं और बढ़ाते हैं, एआई और एमएल के जिम्मेदार विकास और उपयोग में आपकी सहायता करने के लिए एडब्ल्यूएस हमारे अनुभव के आधार पर कई संसाधन प्रदान करता है:
बचने के लिए सर्वोत्तम अभ्यास और सामान्य गलतियाँ
इस खंड में, हम निम्नलिखित सर्वोत्तम प्रथाओं पर चर्चा करते हैं:
- छवियों के पर्याप्त बड़े नमूने का उपयोग करें
- ओपन-सोर्स और सिंथेटिक फेस डेटासेट से बचें
- मैनुअल और सिंथेटिक छवि हेरफेर से बचें
- मूल्यांकन के समय और समय के साथ छवि गुणवत्ता की जाँच करें
- समय के साथ FMR और FNMR की निगरानी करें
- लूप समीक्षा में मानव का उपयोग करें
- Amazon Recognition के साथ अप टू डेट रहें
छवियों के पर्याप्त बड़े नमूने का उपयोग करें
छवियों के पर्याप्त बड़े लेकिन उचित नमूने का उपयोग करें। उचित नमूना आकार क्या है? यह व्यावसायिक समस्या पर निर्भर करता है। यदि आप एक नियोक्ता हैं और आपके पास 10,000 कर्मचारी हैं जिन्हें आप प्रमाणित करना चाहते हैं, तो सभी 10,000 छवियों का उपयोग करना शायद उचित होगा। हालाँकि, मान लीजिए कि आप लाखों ग्राहकों वाला एक संगठन हैं जिसे आप ऑनबोर्ड करना चाहते हैं। इस मामले में, 5,000-20,000 जैसे ग्राहकों का प्रतिनिधि नमूना लेना शायद पर्याप्त है। यहाँ नमूना आकार पर कुछ मार्गदर्शन दिया गया है:
- 100 का एक नमूना आकार - 1,000 छवि जोड़े व्यवहार्यता साबित करते हैं
- 1,000 का एक नमूना आकार - छवियों के बीच परिवर्तनशीलता को मापने के लिए 10,000 छवि जोड़े उपयोगी हैं
- 10,000 का एक नमूना आकार - 1 मिलियन छवि जोड़े परिचालन गुणवत्ता और सामान्यता का माप प्रदान करते हैं
नमूना छवि जोड़े के साथ कुंजी यह सुनिश्चित करना है कि नमूना आपके आवेदन में चेहरों की आबादी में पर्याप्त परिवर्तनशीलता प्रदान करता है। आप त्वचा के रंग, लिंग और आयु जैसी जनसांख्यिकीय जानकारी को शामिल करने के लिए अपने नमूने और परीक्षण को और बढ़ा सकते हैं।
ओपन-सोर्स और सिंथेटिक फेस डेटासेट से बचें
दर्जनों क्यूरेटेड ओपन-सोर्स फेशियल इमेज डेटासेट के साथ-साथ आश्चर्यजनक रूप से यथार्थवादी सिंथेटिक फेस सेट हैं जो अक्सर शोध में और व्यवहार्यता का अध्ययन करने के लिए उपयोग किए जाते हैं। चुनौती यह है कि ये डेटासेट आम तौर पर 99% वास्तविक दुनिया के उपयोग के मामलों के लिए उपयोगी नहीं होते हैं, क्योंकि वे कैमरे, चेहरे और छवियों की गुणवत्ता का प्रतिनिधित्व नहीं करते हैं, जो आपके आवेदन को जंगल में मिलने की संभावना है। हालांकि वे अनुप्रयोग विकास के लिए उपयोगी हैं, इन छवि सेटों की सटीकता के उपाय आपके स्वयं के अनुप्रयोग में आपके सामने आने वाली चीज़ों के लिए सामान्यीकृत नहीं होते हैं। इसके बजाय, हम आपके समाधान से वास्तविक छवियों के प्रतिनिधि नमूने के साथ शुरू करने की अनुशंसा करते हैं, भले ही नमूना छवि जोड़े छोटे हों (1,000 से कम)।
मैनुअल और सिंथेटिक छवि हेरफेर से बचें
अक्सर ऐसे किनारे मामले होते हैं जिन्हें लोग समझने में रुचि रखते हैं। छवि कैप्चर गुणवत्ता या विशिष्ट चेहरे की विशेषताओं के अवरोधन जैसी चीजें हमेशा रुचिकर होती हैं। उदाहरण के लिए, हमसे अक्सर चेहरे की पहचान पर आयु और छवि गुणवत्ता के प्रभाव के बारे में पूछा जाता है। आप आसानी से किसी चेहरे को कृत्रिम रूप से उम्र दे सकते हैं या विषय को पुराना दिखाने के लिए छवि में हेरफेर कर सकते हैं, या छवि गुणवत्ता में हेरफेर कर सकते हैं, लेकिन यह छवियों की वास्तविक दुनिया की उम्र बढ़ने के लिए अच्छी तरह से अनुवाद नहीं करता है। इसके बजाय, हमारी सिफारिश है कि आप वास्तविक दुनिया के बढ़त मामलों का एक प्रतिनिधि नमूना इकट्ठा करें, जिसकी आप जांच में रुचि रखते हैं।
मूल्यांकन के समय और समय के साथ छवि गुणवत्ता की जाँच करें
कैमरा और एप्लिकेशन तकनीक समय के साथ काफी तेजी से बदलती है। सर्वोत्तम अभ्यास के रूप में, हम समय के साथ छवि गुणवत्ता की निगरानी करने की सलाह देते हैं। कैप्चर किए गए चेहरों के आकार से लेकर (बाउंडिंग बॉक्स का उपयोग करके), छवि की चमक और तीक्ष्णता तक, चेहरे की मुद्रा तक, साथ ही संभावित अस्पष्टता (टोपी, धूप का चश्मा, दाढ़ी, और इसी तरह), ये सभी छवि और चेहरे की विशेषताएं समय के साथ बदलती हैं।
समय के साथ FNMR और FMR की निगरानी करें
परिवर्तन होते हैं, चाहे वह चित्र हों, अनुप्रयोग, या अनुप्रयोग में उपयोग की जाने वाली समानता सीमाएँ हों। समय-समय पर झूठी मिलान और गैर-मिलान दरों की निगरानी करना महत्वपूर्ण है। दरों में परिवर्तन (यहां तक कि सूक्ष्म परिवर्तन) अक्सर एप्लिकेशन के साथ अपस्ट्रीम चुनौतियों या एप्लिकेशन का उपयोग कैसे किया जा रहा है, इसकी ओर इशारा कर सकते हैं। निर्णय लेने या अस्वीकार करने के लिए उपयोग किए जाने वाले समानता थ्रेसहोल्ड और व्यावसायिक नियमों में परिवर्तन ऑनबोर्डिंग और प्रमाणीकरण उपयोगकर्ता अनुभव पर बड़ा प्रभाव डाल सकते हैं।
लूप समीक्षा में मानव का उपयोग करें
पहचान सत्यापन प्रणालियाँ समानता सीमा और व्यावसायिक नियमों के आधार पर मिलान और गैर-मिलान के लिए स्वचालित निर्णय लेती हैं। विनियामक और आंतरिक अनुपालन आवश्यकताओं के अलावा, किसी भी स्वचालित निर्णय प्रणाली में एक महत्वपूर्ण प्रक्रिया मानव समीक्षकों को निर्णय प्रक्रिया की चल रही निगरानी के हिस्से के रूप में उपयोग करना है। इन स्वचालित निर्णय प्रणाली का मानव निरीक्षण स्वचालित निर्णय लेने की प्रक्रिया में सत्यापन और निरंतर सुधार के साथ-साथ पारदर्शिता प्रदान करता है।
Amazon Recognition के साथ अप टू डेट रहें
Amazon Recognition फेस मॉडल समय-समय पर (आमतौर पर सालाना) अपडेट किया जाता है, और वर्तमान में संस्करण 6 पर है। इस अपडेट किए गए संस्करण ने सटीकता और अनुक्रमण में महत्वपूर्ण सुधार किए हैं। नए मॉडल संस्करणों के साथ अद्यतित रहना और यह समझना महत्वपूर्ण है कि अपने पहचान सत्यापन आवेदन में इन नए संस्करणों का उपयोग कैसे करें। जब Amazon रिकॉग्निशन फेस मॉडल के नए संस्करण लॉन्च किए जाते हैं, तो अपनी पहचान सत्यापन मूल्यांकन प्रक्रिया को फिर से चलाना और आपके झूठे मिलान और गैर-मिलान दरों पर किसी भी संभावित प्रभाव (सकारात्मक और नकारात्मक) का निर्धारण करना अच्छा अभ्यास है।
निष्कर्ष
यह पोस्ट विभिन्न सटीकता मेट्रिक्स के संदर्भ में आपके पहचान सत्यापन समाधान के प्रदर्शन पहलू का मूल्यांकन करने के लिए आवश्यक प्रमुख तत्वों पर चर्चा करती है। हालाँकि, सटीकता केवल उन कई आयामों में से एक है जिनका आपको किसी विशेष सामग्री मॉडरेशन सेवा का चयन करते समय मूल्यांकन करने की आवश्यकता होती है। यह महत्वपूर्ण है कि आप अन्य मापदंडों को शामिल करें, जैसे सेवा का कुल फीचर सेट, उपयोग में आसानी, मौजूदा एकीकरण, गोपनीयता और सुरक्षा, अनुकूलन विकल्प, स्केलेबिलिटी निहितार्थ, ग्राहक सेवा और मूल्य निर्धारण।
Amazon रिकॉग्निशन में आइडेंटिटी वेरिफिकेशन के बारे में अधिक जानने के लिए, विजिट करें Amazon Rekognition का उपयोग करके पहचान सत्यापन.
लेखक के बारे में
माइक एम्स एक डेटा वैज्ञानिक से पहचान सत्यापन समाधान विशेषज्ञ बन गया है, जिसके पास संगठनों को धोखाधड़ी, बर्बादी और दुरुपयोग से बचाने के लिए मशीन लर्निंग और एआई समाधान विकसित करने का व्यापक अनुभव है। अपने खाली समय में, आप उसे हाइकिंग, माउंटेन बाइकिंग, या अपने कुत्ते मैक्स के साथ फ्रीबी खेलते हुए पा सकते हैं।
अमित गुप्ता एडब्ल्यूएस में वरिष्ठ एआई सर्विसेज सॉल्यूशंस आर्किटेक्ट हैं। वह बड़े पैमाने पर अच्छी तरह से आर्किटेक्टेड मशीन लर्निंग सॉल्यूशंस के साथ ग्राहकों को सक्षम बनाने के बारे में भावुक हैं।
ज़ुहैर रागिब AWS में AI सर्विसेज सॉल्यूशंस आर्किटेक्ट हैं। एप्लाइड एआई/एमएल में विशेषज्ञता के साथ, वह ग्राहकों को तेजी से नवाचार करने और अपने व्यवसायों को बदलने के लिए क्लाउड का उपयोग करने में सक्षम बनाने के बारे में भावुक हैं।
मार्सेल पिविडाल वर्ल्ड-वाइड स्पेशलिस्ट ऑर्गनाइजेशन में सीनियर एआई सर्विसेज सॉल्यूशंस आर्किटेक्ट हैं। मार्सेल के पास फिनटेक, भुगतान प्रदाताओं, फार्मा और सरकारी एजेंसियों के लिए प्रौद्योगिकी के माध्यम से व्यावसायिक समस्याओं को हल करने का 20 से अधिक वर्षों का अनुभव है। उनके फोकस के वर्तमान क्षेत्र जोखिम प्रबंधन, धोखाधड़ी की रोकथाम और पहचान सत्यापन हैं।
- AI
- ai कला
- ऐ कला जनरेटर
- ऐ रोबोट
- अमेज़ॅन रेकग्निशन
- कृत्रिम बुद्धिमत्ता
- कृत्रिम बुद्धिमत्ता प्रमाणन
- बैंकिंग में आर्टिफिशियल इंटेलिजेंस
- आर्टिफिशियल इंटेलिजेंस रोबोट
- आर्टिफिशियल इंटेलिजेंस रोबोट
- कृत्रिम बुद्धि सॉफ्टवेयर
- AWS मशीन लर्निंग
- सर्वोत्तम प्रथाओं
- blockchain
- ब्लॉकचेन सम्मेलन एआई
- कॉइनजीनियस
- संवादी कृत्रिम बुद्धिमत्ता
- क्रिप्टो सम्मेलन एआई
- दल-ए
- ध्यान लगा के पढ़ना या सीखना
- इसे गूगल करें
- यंत्र अधिगम
- प्लेटो
- प्लेटो एआई
- प्लेटो डेटा इंटेलिजेंस
- प्लेटो गेम
- प्लेटोडाटा
- प्लेटोगेमिंग
- स्केल एआई
- वाक्यविन्यास
- जेफिरनेट