डिजिटल प्रकाशक अपने मीडिया वर्कफ़्लो को व्यवस्थित और स्वचालित करने के तरीकों की लगातार तलाश कर रहे हैं ताकि वे जितनी जल्दी हो सके नई सामग्री को उत्पन्न और प्रकाशित कर सकें।
कई प्रकाशकों के पास स्टॉक छवियों का एक बड़ा पुस्तकालय होता है जिसका उपयोग वे अपने लेखों के लिए करते हैं। अलग-अलग कहानियों के लिए इन छवियों का कई बार पुन: उपयोग किया जा सकता है, खासकर जब प्रकाशक के पास मशहूर हस्तियों की छवियां हों। बहुत बार, एक पत्रकार को अपनी आगामी कहानी के लिए उपयोग करने के लिए एक छवि से एक वांछित सेलिब्रिटी को क्रॉप करने की आवश्यकता हो सकती है। यह एक मैनुअल, दोहराव वाला कार्य है जिसे स्वचालित किया जाना चाहिए। कभी-कभी, एक लेखक किसी सेलिब्रिटी की छवि का उपयोग करना चाहता है, लेकिन इसमें दो लोग शामिल होते हैं और छवि से प्राथमिक सेलिब्रिटी को क्रॉप करने की आवश्यकता होती है। दूसरी बार, मोबाइल, सोशल मीडिया, या डिजिटल समाचार जैसे विभिन्न प्लेटफार्मों पर प्रकाशित करने के लिए सेलिब्रिटी छवियों को सुधारने की आवश्यकता हो सकती है। इसके अतिरिक्त, एक लेखक को छवि पहलू अनुपात को बदलने या सेलिब्रिटी को स्पष्ट फोकस में रखने की आवश्यकता हो सकती है।
इस पोस्ट में, हम प्रदर्शित करते हैं कि कैसे उपयोग करें अमेज़ॅन रेकग्निशन छवि विश्लेषण करने के लिए। Amazon Recognition बिना किसी मशीन लर्निंग (ML) विशेषज्ञता के आपके एप्लिकेशन में इस क्षमता को जोड़ना आसान बनाता है और ऑब्जेक्ट डिटेक्शन, कंटेंट मॉडरेशन, फेस डिटेक्शन और एनालिसिस, और टेक्स्ट और सेलिब्रिटी रिकॉग्निशन जैसे उपयोग के मामलों को पूरा करने के लिए विभिन्न API के साथ आता है, जिसे हम इस उदाहरण में उपयोग करें।
RSI सेलिब्रिटी पहचान सुविधा in अमेज़ॅन रेकग्निशन ML का उपयोग करके स्वचालित रूप से छवियों और वीडियो में हजारों प्रसिद्ध व्यक्तित्वों को पहचानता है। सेलिब्रिटी पहचान न केवल दिए गए सेलिब्रिटी की उपस्थिति बल्कि छवि के भीतर स्थान का भी पता लगा सकती है।
समाधान का अवलोकन
इस पोस्ट में, हम प्रदर्शित करते हैं कि कैसे हम एक तस्वीर, एक सेलिब्रिटी का नाम और आउटपुट छवि के लिए एक पहलू अनुपात पास कर सकते हैं ताकि केंद्र में उनके चेहरे को कैप्चर करने वाले दिए गए सेलिब्रिटी की एक क्रॉप की गई छवि उत्पन्न हो सके।
के साथ काम करते समय Amazon रिकॉग्निशन सेलिब्रिटी डिटेक्शन एपीआई, प्रतिक्रिया में कई तत्व लौटाए जाते हैं। निम्नलिखित कुछ प्रमुख प्रतिक्रिया तत्व हैं:
- मैच कॉन्फिडेंस - एक मैच कॉन्फिडेंस स्कोर जिसका उपयोग एपीआई व्यवहार को नियंत्रित करने के लिए किया जा सकता है। हम आपके पसंदीदा ऑपरेटिंग पॉइंट को चुनने के लिए आपके आवेदन में इस स्कोर के लिए एक उपयुक्त सीमा लागू करने की सलाह देते हैं। उदाहरण के लिए, 99% की सीमा निर्धारित करके, आप झूठी सकारात्मकताओं को समाप्त कर सकते हैं लेकिन कुछ संभावित मिलानों को छोड़ सकते हैं।
- नाम, आईडी और यूआरएल - अधिक जानकारी के लिए सेलिब्रिटी का नाम, एक अद्वितीय अमेज़ॅन रिकॉग्निशन आईडी, और सेलिब्रिटी के आईएमडीबी या विकिपीडिया लिंक जैसे यूआरएल की सूची।
- आकार निर्धारक बॉक्स - प्रत्येक मान्यता प्राप्त सेलिब्रिटी चेहरे के लिए आयताकार बाउंडिंग बॉक्स स्थान के निर्देशांक।
- ज्ञातलिंग - प्रत्येक मान्यता प्राप्त हस्ती के लिए ज्ञात लिंग पहचान।
- भावनाएँ - सेलिब्रिटी के चेहरे पर व्यक्त भाव, उदाहरण के लिए, खुश, उदास या क्रोधित।
- ढोंग - रोल, पिच और यॉ के तीन अक्षों का उपयोग करते हुए सेलिब्रिटी चेहरे की मुद्रा।
- मुस्कुराओ - सेलिब्रिटी मुस्कुरा रहा है या नहीं।
अमेज़ॅन रिकॉग्निशन से एपीआई प्रतिक्रिया के हिस्से में निम्नलिखित कोड शामिल हैं:
इस अभ्यास में, हम प्रदर्शित करते हैं कि चेहरे के स्थान की पहचान करने के लिए बाउंडिंग बॉक्स तत्व का उपयोग कैसे करें, जैसा कि निम्न उदाहरण छवि में दिखाया गया है। सभी आयामों को समग्र छवि आकार के अनुपात के रूप में दर्शाया गया है, इसलिए प्रतिक्रिया में संख्याएँ 0-1 के बीच हैं। उदाहरण के लिए, नमूना एपीआई प्रतिक्रिया में, बाउंडिंग बॉक्स की चौड़ाई 0.1 है, जिसका अर्थ है कि चेहरे की चौड़ाई छवि की कुल चौड़ाई का 10% है।
इस बाउंडिंग बॉक्स के साथ, अब हम यह सुनिश्चित करने के लिए तर्क का उपयोग करने में सक्षम हैं कि चेहरा हमारे द्वारा बनाई गई नई छवि के किनारों के भीतर बना रहे। चेहरे को केंद्र में रखने के लिए हम इस बाउंडिंग बॉक्स के चारों ओर कुछ पैडिंग लगा सकते हैं।
निम्नलिखित अनुभागों में, हम दिखाते हैं कि क्रिस्प फोकस में वर्नर वोगल्स के साथ निम्नलिखित क्रॉप्ड इमेज आउटपुट कैसे बनाएं।
हम एक लॉन्च करते हैं अमेज़न SageMaker नोटबुक, जो एक पायथन वातावरण प्रदान करता है जहां आप अमेज़ॅन रिकॉग्निशन को एक छवि पास करने के लिए कोड चला सकते हैं और फिर फोकस में सेलिब्रिटी के साथ छवि को स्वचालित रूप से संशोधित कर सकते हैं।
कोड निम्न उच्च-स्तरीय चरण निष्पादित करता है:
- से अनुरोध करें
recognize_celebrities
एपीआई दी गई छवि और सेलिब्रिटी नाम के साथ। - बाउंडिंग बॉक्स जानकारी के लिए प्रतिक्रिया फ़िल्टर करें।
- बाउंडिंग बॉक्स में कुछ पैडिंग जोड़ें जैसे कि हम कुछ बैकग्राउंड कैप्चर करते हैं।
.. पूर्वापेक्षाएँ
इस पूर्वाभ्यास के लिए, आपके पास निम्नलिखित शर्तें होनी चाहिए:
नमूना छवि अपलोड करें
अपनी नमूना सेलिब्रिटी छवि को अपने S3 बकेट में अपलोड करें।
कोड चलाएँ
कोड चलाने के लिए, हम एक SageMaker नोटबुक का उपयोग करते हैं, हालाँकि कोई भी IDE Python, Pillow, और Boto3 को स्थापित करने के बाद भी काम करेगा। हम एक SageMaker नोटबुक भी बनाते हैं AWS पहचान और अभिगम प्रबंधन (IAM) आवश्यक अनुमतियों के साथ भूमिका। निम्नलिखित चरणों को पूरा करें:
- नोटबुक बनाएँ और इसे नाम दें
automatic-cropping-celebrity
.
डिफ़ॉल्ट निष्पादन नीति, जिसे सैजमेकर नोटबुक बनाते समय बनाया गया था, की एक सरल नीति है जो भूमिका को Amazon S3 के साथ सहभागिता करने की अनुमति देती है।
- अपडेट करें
Resource
S3 बाल्टी नाम के साथ बाधा:
- कॉल करने में सक्षम होने के लिए SageMaker नोटबुक IAM भूमिका में जोड़ने के लिए एक और नीति बनाएँ हस्तियाँ पहचानो एपीआई:
- SageMaker कंसोल पर, चुनें नोटबंदी के उदाहरण नेविगेशन फलक में
- पता लगाएँ
automatic-cropping-celebrity
नोटबुक और चुनें ज्यूपिटर खोलें. - चुनें नया और conda_python3 आपकी नोटबुक के कर्नेल के रूप में।
निम्नलिखित चरणों के लिए, कोड ब्लॉक को अपने ज्यूपिटर नोटबुक में कॉपी करें और उन्हें चुनकर चलाएं रन.
- सबसे पहले, हम सहायक कार्यों और पुस्तकालयों को आयात करते हैं:
- चर सेट करें
- एक सेवा ग्राहक बनाएँ
- मशहूर हस्तियों को पहचानने का कार्य
- दिए गए सेलिब्रिटी का बाउंडिंग बॉक्स प्राप्त करने का कार्य:
- बाउंडिंग बॉक्स में कुछ पैडिंग जोड़ने का कार्य, इसलिए हम चेहरे के चारों ओर कुछ पृष्ठभूमि कैप्चर करते हैं
- छवि को नोटबुक स्टोरेज और अमेज़न S3 में सहेजने का कार्य
- पायथन का प्रयोग करें
main()
हमारे सेलिब्रिटी की एक नई क्रॉप की गई छवि को सहेजने के कार्यप्रवाह को पूरा करने के लिए पूर्ववर्ती कार्यों को संयोजित करने का कार्य:
जब आप इस कोड ब्लॉक को चलाते हैं, तो आप देख सकते हैं कि हमें वर्नर वोगल्स मिले और केंद्र में उनके चेहरे के साथ एक नई छवि बनाई।
छवि को नोटबुक में सहेजा जाएगा और S3 बकेट में भी अपलोड किया जाएगा।
आप इस समाधान को एक में शामिल कर सकते हैं बड़ा वर्कफ़्लो; उदाहरण के लिए, एक प्रकाशन कंपनी इस क्षमता को कई प्लेटफार्मों पर मशहूर हस्तियों के लेख प्रकाशित करते समय छवियों को पुन: स्वरूपित करने और उनका आकार बदलने के समापन बिंदु के रूप में प्रकाशित करना चाह सकती है।
सफाई करना
भविष्य के शुल्कों से बचने के लिए, संसाधनों को हटा दें:
- SageMaker कंसोल पर, अपनी नोटबुक चुनें और पर क्रियाएँ मेनू, चुनें रुकें.
- नोटबुक बंद होने के बाद, पर क्रियाएँ मेनू, चुनें मिटाना.
- IAM कंसोल पर, आपके द्वारा बनाई गई SageMaker निष्पादन भूमिका को हटा दें।
- Amazon S3 कंसोल पर, अपने S3 बकेट से इनपुट छवि और किसी भी आउटपुट फ़ाइल को हटा दें।
निष्कर्ष
इस पोस्ट में, हमने दिखाया कि कैसे हम मीडिया वर्कफ़्लोज़ का समर्थन करने के लिए छवियों को संशोधित करने के अन्यथा मैन्युअल कार्य को स्वचालित करने के लिए Amazon Rekognition का उपयोग कर सकते हैं। यह प्रकाशन उद्योग के भीतर विशेष रूप से महत्वपूर्ण है जहां नई सामग्री को जल्दी से और कई प्लेटफार्मों पर लाने में गति मायने रखती है।
मीडिया संपत्तियों के साथ काम करने के बारे में अधिक जानकारी के लिए देखें Media2Cloud 3.0 के साथ मीडिया इंटेलिजेंस अभी और स्मार्ट हो गया है
लेखक के बारे में
मार्क वॉटकिंस मीडिया और मनोरंजन टीम के भीतर समाधान वास्तुकार हैं। वह एआई/एमएल समाधान बनाने में ग्राहकों की मदद करता है जो एडब्ल्यूएस का उपयोग करके उनकी व्यावसायिक चुनौतियों का समाधान करता है। वह कंप्यूटर दृष्टि, प्राकृतिक भाषा प्रसंस्करण, निजीकरण, किनारे पर एमएल, और अधिक से संबंधित कई एआई/एमएल परियोजनाओं पर काम कर रहे हैं। पेशेवर जीवन से दूर, वह अपने परिवार के साथ समय बिताना और अपने दो छोटे बच्चों को बड़े होते देखना पसंद करते हैं।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोब्लॉकचैन। Web3 मेटावर्स इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- स्रोत: https://aws.amazon.com/blogs/machine-learning/automatic-image-cropping-with-amazon-rekognition/
- :है
- $यूपी
- 1
- 10
- 100
- 11
- 7
- 8
- 9
- a
- योग्य
- About
- पहुँच
- कार्य
- इसके अतिरिक्त
- बाद
- ऐ / एमएल
- सब
- वीरांगना
- अमेज़ॅन रेकग्निशन
- विश्लेषण
- और
- अन्य
- एपीआई
- एपीआई
- आवेदन
- अनुप्रयोगों
- लागू करें
- लागू
- हैं
- चारों ओर
- लेख
- AS
- पहलू
- संपत्ति
- At
- लेखक
- को स्वचालित रूप से
- स्वचालित
- स्वचालित
- स्वतः
- एडब्ल्यूएस
- कुल्हाड़ियों
- पृष्ठभूमि
- BE
- के बीच
- खंड
- ब्लॉक
- मुक्केबाज़ी
- बक्से
- व्यापार
- by
- कॉल
- कर सकते हैं
- कब्जा
- कैप्चरिंग
- मामलों
- हस्ती
- हस्तियों
- सेलिब्रिटी
- केंद्र
- चुनौतियों
- परिवर्तन
- प्रभार
- चुनें
- चुनने
- कोड
- गठबंधन
- कंपनी
- पूरा
- कंप्यूटर
- Computer Vision
- आत्मविश्वास
- कंसोल
- शामिल हैं
- सामग्री
- लगातार
- नियंत्रण
- सका
- बनाना
- बनाया
- बनाना
- फ़सल
- ग्राहक
- चूक
- दिखाना
- वांछित
- पता चला
- खोज
- विभिन्न
- डिजिटल
- आयाम
- डिस्प्ले
- डाउनलोड
- e
- से प्रत्येक
- Edge
- प्रभाव
- तत्व
- तत्व
- को खत्म करने
- endpoint
- मनोरंजन
- वातावरण
- विशेष रूप से
- उदाहरण
- निष्पादन
- व्यायाम
- विशेषज्ञता
- व्यक्त
- चेहरा
- चेहरे के
- परिवार
- प्रसिद्ध
- पट्टिका
- फ़ाइलें
- फोकस
- निम्नलिखित
- के लिए
- प्रारूप
- पाया
- ताजा
- से
- समारोह
- कार्यों
- आगे
- भविष्य
- लिंग
- उत्पन्न
- मिल
- मिल रहा
- दी
- देता है
- बढ़ रहा है
- खुश
- है
- ऊंचाई
- मदद करता है
- उच्च स्तर
- कैसे
- How To
- तथापि
- एचटीएमएल
- http
- HTTPS
- ID
- पहचान करना
- पहचान
- की छवि
- छवियों
- आयात
- महत्वपूर्ण
- in
- शामिल
- शामिल
- उद्योग
- करें-
- निवेश
- स्थापित कर रहा है
- बुद्धि
- बातचीत
- IT
- पत्रकार
- जेपीजी
- रखना
- कुंजी
- जानने वाला
- भाषा
- बड़ा
- लांच
- सीख रहा हूँ
- पुस्तकालयों
- पुस्तकालय
- जीवन
- पसंद
- LINK
- सूची
- थोड़ा
- स्थानीय
- स्थान
- देख
- मशीन
- यंत्र अधिगम
- बनाना
- बनाता है
- गाइड
- बहुत
- मैच
- मैटर्स
- मीडिया
- मेन्यू
- हो सकता है
- ML
- मोबाइल
- संयम
- संशोधित
- अधिक
- विभिन्न
- नाम
- प्राकृतिक
- प्राकृतिक भाषा संसाधन
- पथ प्रदर्शन
- आवश्यकता
- की जरूरत है
- नया
- समाचार
- नोटबुक
- संख्या
- वस्तु
- ऑब्जेक्ट डिटेक्शन
- of
- on
- परिचालन
- आदेश
- अन्य
- अन्यथा
- उत्पादन
- कुल
- फलक
- विशेष रूप से
- पथ
- स्टाफ़
- निष्पादन
- प्रदर्शन
- अनुमतियाँ
- व्यक्तित्व
- निजीकरण
- पिच
- प्लेटफार्म
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- बिन्दु
- नीति
- पद
- संभावित
- वरीय
- आवश्यक शर्तें
- उपस्थिति
- प्राथमिक
- प्रसंस्करण
- पेशेवर
- परियोजनाओं
- प्रदान करता है
- प्रकाशित करना
- प्रकाशक
- प्रकाशकों
- प्रकाशन
- रखना
- अजगर
- जल्दी से
- उठाना
- तेजी
- अनुपात
- मान्यता
- पहचान
- मान्यता प्राप्त
- पहचानता
- की सिफारिश
- सम्बंधित
- बाकी है
- बार - बार आने वाला
- प्रतिनिधित्व
- का अनुरोध
- अपेक्षित
- संसाधन
- उपयुक्त संसाधन चुनें
- प्रतिक्रिया
- परिणाम
- परिणाम
- वापसी
- आरओआई
- भूमिका
- रोल
- रन
- sagemaker
- सहेजें
- बचत
- स्कोर
- वर्गों
- सेवा
- की स्थापना
- कई
- चाहिए
- दिखाना
- दिखाया
- सरल
- आकार
- होशियार
- So
- सोशल मीडिया
- सोशल मीडिया
- समाधान
- समाधान ढूंढे
- हल
- कुछ
- गति
- खर्च
- चौकोर
- कथन
- कदम
- स्टॉक
- रोक
- भंडारण
- कहानियों
- कहानी
- सुवीही
- ऐसा
- उपयुक्त
- समर्थन
- कार्य
- टीम
- कि
- RSI
- लेकिन हाल ही
- उन
- इन
- हजारों
- तीन
- द्वार
- पहर
- बार
- सेवा मेरे
- ऊपर का
- कुल
- अद्वितीय
- आगामी
- अपलोड की गई
- उपयोग
- विविधता
- विभिन्न
- संस्करण
- वीडियो
- दृष्टि
- walkthrough
- देख
- तरीके
- कुंआ
- प्रसिद्ध
- या
- कौन कौन से
- चौडाई
- विकिपीडिया
- मर्जी
- साथ में
- अंदर
- बिना
- काम
- workflows
- काम कर रहे
- होगा
- आप
- आपका
- जेफिरनेट