एआई इमेज जनरेशन खगोलीय गति से आगे बढ़ रहा है। क्या हम अभी भी बता सकते हैं कि कोई तस्वीर नकली है या नहीं? प्लेटोब्लॉकचैन डेटा इंटेलिजेंस। लंबवत खोज। ऐ.

एआई इमेज जनरेशन खगोलीय गति से आगे बढ़ रहा है। क्या हम अभी भी बता सकते हैं कि कोई तस्वीर नकली है या नहीं?

फेक फोटोग्राफी कोई नई बात नहीं है। 1910 के दशक में, ब्रिटिश लेखक आर्थर कॉनन डॉयल को दो स्कूली उम्र की बहनों ने धोखा दिया था, जिन्होंने अपने बगीचे में सुंदर परियों की तस्वीरें खींची थीं।

1917 में एल्सी राइट द्वारा ली गई पांच 'कोटिंगली फेयरीज़' तस्वीरों में से पहली। इमेज क्रेडिट: विकिपीडिया

आज यह विश्वास करना कठिन है कि इन तस्वीरों ने किसी को भी मूर्ख बनाया होगा, लेकिन 1980 के दशक तक जेफ्री क्रॉली नामक एक विशेषज्ञ के पास फिल्म फोटोग्राफी के अपने ज्ञान को सीधे लागू करने और स्पष्ट रूप से कटौती करने की हिम्मत नहीं थी।

तस्वीरें नकली थीं, जैसा कि बाद में खुद बहनों में से एक ने स्वीकार किया।

एक पुराने स्कूल का फोटोग्राफी कैमरा पकड़े हुए मुस्कुराते हुए व्यक्ति की थोड़ी अलौकिक छवि
1982 में जेफ्री क्रॉली ने निष्कर्ष निकाला कि परी तस्वीरें नकली थीं। तो यह एक है। छवि क्रेडिट: ब्रेंडन मर्फी / लेखक प्रदान किया गया

कलाकृतियों और सामान्य ज्ञान के लिए शिकार

डिजिटल फोटोग्राफी ने नकली और जासूसों के लिए समान रूप से तकनीकों का खजाना खोल दिया है।

आजकल संदिग्ध छवियों की फोरेंसिक जांच में डिजिटल फोटोग्राफी में निहित गुणों की तलाश करना शामिल है, जैसे कि जांच करना तस्वीरों में एम्बेडेड मेटाडेटा, छवियों में विकृतियों को ठीक करने के लिए Adobe Photoshop जैसे सॉफ़्टवेयर का उपयोग करना, और हेरफेर के गप्पी संकेतों की खोज, जैसे मूल विशेषताओं को अस्पष्ट करने के लिए क्षेत्रों की नकल की जा रही है।

कभी-कभी डिजिटल संपादन का पता लगाना बहुत सूक्ष्म होता है, लेकिन जब हम प्रकाश और गहरे रंग के पिक्सेल वितरित करने के तरीके को समायोजित करते हैं, तो यह ध्यान में आता है। उदाहरण के लिए, 2010 में NASA ने a . जारी किया शनि के चंद्रमाओं डायोन और टाइटन की तस्वीर. यह किसी भी तरह से नकली नहीं था, लेकिन आवारा कलाकृतियों को हटाने के लिए इसे साफ किया गया था - जो मिल गया साजिश सिद्धांतकारों का ध्यान.

उत्सुक, मैंने छवि को फ़ोटोशॉप में डाल दिया। नीचे दिया गया चित्रण मोटे तौर पर यह बताता है कि यह कैसा दिखता था।

अंधेरे और हल्के समायोजन के लिए चार्ट के साथ छवि संपादन स्क्रीन का स्क्रीनशॉट
एक अनुकरण यह दर्शाता है कि प्रकाश और अंधेरे के स्तरों को समायोजित किए जाने पर संपादन का पता कैसे लगाया जा सकता है। छवि क्रेडिट: ब्रेंडन मर्फी / लेखक प्रदान किया गया

अधिकांश डिजिटल तस्वीरें जेपीईजी जैसे संकुचित स्वरूपों में होती हैं, जो कैमरे द्वारा कैप्चर की गई अधिकांश जानकारी को हटाकर स्लिम हो जाती हैं। मानकीकृत एल्गोरिदम यह सुनिश्चित करते हैं कि हटाई गई जानकारी का न्यूनतम दृश्य प्रभाव हो-लेकिन यह निशान छोड़ देता है।

छवि के किसी भी क्षेत्र का संपीड़न इस बात पर निर्भर करेगा कि छवि और वर्तमान कैमरा सेटिंग्स में क्या चल रहा है; जब एक नकली छवि कई स्रोतों को जोड़ती है, तो अक्सर इसका पता लगाना संभव होता है संपीड़न कलाकृतियों का सावधानीपूर्वक विश्लेषण.

कुछ फोरेंसिक पद्धति का छवि के प्रारूप से बहुत कम लेना-देना है, लेकिन यह अनिवार्य रूप से है दृश्य जासूसी कार्य. क्या तस्वीर में हर कोई एक ही तरह से जल रहा है? क्या छाया और प्रतिबिंब समझ में आते हैं? क्या कान और हाथ सही जगहों पर रोशनी और छाया दिखा रहे हैं? लोगों की आंखों में क्या झलकता है? यदि हम दृश्य को 3D में मॉडल करते हैं तो क्या कमरे की सभी रेखाएँ और कोण जुड़ जाएंगे?

आर्थर कॉनन डॉयल को भले ही परियों की तस्वीरों से मूर्ख बनाया गया हो, लेकिन मुझे लगता है कि उनकी रचना शर्लक होम्स फोरेंसिक फोटो विश्लेषण की दुनिया में घर पर ही सही होगी।

आर्टिफिशियल इंटेलिजेंस का एक नया युग

RSI छवियों का वर्तमान विस्फोट टेक्स्ट-टू-इमेज द्वारा बनाया गया कृत्रिम बुद्धिमत्ता उपकरण कई मायनों में फिल्म से डिजिटल फोटोग्राफी में बदलाव की तुलना में अधिक क्रांतिकारी हैं।

अब हम केवल टाइप करके, अपनी इच्छानुसार कोई भी चित्र बना सकते हैं। ये छवियां फ्रेंकेन-फ़ोटो नहीं हैं जो पिक्सेल के पहले से मौजूद गुच्छों को एक साथ जोड़कर बनाई गई हैं। वे निर्दिष्ट सामग्री, गुणवत्ता और शैली के साथ पूरी तरह से नई छवियां हैं।

कुछ समय पहले तक, इन छवियों को उत्पन्न करने के लिए उपयोग किए जाने वाले जटिल तंत्रिका नेटवर्क की जनता के लिए सीमित उपलब्धता थी। यह 23 अगस्त, 2022 को जनता के लिए रिलीज के साथ बदल गया खुला स्रोत स्थिर प्रसार. अब कोई भी व्यक्ति जिसके पास अपने कंप्यूटर में गेमिंग-स्तरीय एनवीडिया ग्राफिक्स कार्ड है, वह बिना किसी रिसर्च लैब या बिजनेस गेटकीपिंग के अपनी गतिविधियों के लिए एआई इमेज कंटेंट बना सकता है।

इसने कई लोगों को यह पूछने के लिए प्रेरित किया है, "क्या हम कभी उस पर विश्वास कर सकते हैं जो हम फिर से ऑनलाइन देखते हैं?" कि निर्भर करता है।

टेक्स्ट-टू-इमेज एआई प्रशिक्षण से अपने स्मार्ट प्राप्त करता है-बड़ी संख्या में छवि/कैप्शन जोड़े का विश्लेषण। प्रत्येक प्रणाली की ताकत और कमजोरियां आंशिक रूप से उन छवियों से प्राप्त होती हैं जिन पर इसे प्रशिक्षित किया गया है। यहां एक उदाहरण दिया गया है: इस तरह से स्थिर प्रसार जॉर्ज क्लूनी को इस्त्री करते हुए देखता है।

एक सफेद तौलिये को पकड़े हुए विकृत विशेषताओं वाले व्यक्ति की थोड़ी अलौकिक छवि
यह जॉर्ज क्लूनी अपनी इस्त्री कर रहा है … या है ना? छवि क्रेडिट: ब्रेंडन मर्फी / लेखक प्रदान किया गया

यह यथार्थवादी से बहुत दूर है। सभी स्थिर प्रसार को आगे बढ़ना है, यह वह जानकारी है जिसे उसने सीखा है, और यह स्पष्ट है कि उसने जॉर्ज क्लूनी को देखा है और अक्षरों की उस स्ट्रिंग को अभिनेता की विशेषताओं से जोड़ सकता है, यह क्लूनी विशेषज्ञ नहीं है।

हालाँकि, इसने सामान्य रूप से मध्यम आयु वर्ग के पुरुषों की कई और तस्वीरें देखी और पचा ली होंगी, तो देखते हैं कि जब हम उसी परिदृश्य में एक सामान्य मध्यम आयु वर्ग के व्यक्ति के लिए पूछते हैं तो क्या होता है।

कैमरे को देखते हुए और शर्ट पकड़े हुए गोल विशेषताओं वाले एक मध्यम आयु वर्ग के व्यक्ति की थोड़ी अलौकिक छवि
नॉट-जॉर्ज-क्लूनी अपनी इस्त्री कर रहा है। छवि क्रेडिट: ब्रेंडन मर्फी / लेखक प्रदान किया गया

यह एक स्पष्ट सुधार है, लेकिन अभी भी काफी यथार्थवादी नहीं है। हमेशा की तरह, हाथों और कानों की जटिल ज्यामिति नकली के संकेतों को देखने के लिए अच्छी जगह है - हालांकि इस माध्यम में हम असंभव प्रकाश के बारे में बताने के बजाय स्थानिक ज्यामिति को देख रहे हैं।

अन्य सुराग हो सकते हैं। अगर हम ध्यान से कमरे का पुनर्निर्माण करें, तो क्या कोने चौकोर होंगे? क्या अलमारियां समझ में आएंगी? डिजिटल तस्वीरों की जांच करने वाला एक फोरेंसिक विशेषज्ञ शायद उस पर कॉल कर सकता है।

हम अब अपनी आँखों पर विश्वास नहीं कर सकते

यदि हम टेक्स्ट-टू-इमेज सिस्टम के ज्ञान का विस्तार करते हैं, तो यह और भी बेहतर कर सकता है। आप मौजूदा प्रशिक्षण के पूरक के लिए अपनी खुद की वर्णित तस्वीरें जोड़ सकते हैं। इस प्रक्रिया को के रूप में जाना जाता है शाब्दिक उलटा.

हाल ही में, Google ने जारी किया है ड्रीम बूथ, टेक्स्ट-टू-इमेज एआई सिस्टम में विशिष्ट लोगों, वस्तुओं, या यहां तक ​​कि कला शैलियों को इंजेक्ट करने के लिए एक वैकल्पिक, अधिक परिष्कृत विधि।

इस प्रक्रिया के लिए भारी-भरकम हार्डवेयर की आवश्यकता होती है, लेकिन परिणाम चौंका देने वाले होते हैं। रेडिट पर कुछ बेहतरीन काम शेयर होने लगे हैं। तस्वीरों की तरफ देखो नीचे पोस्ट में जो ड्रीमबूथ में डाली गई छवियों को दिखाता है और स्थिर प्रसार से यथार्थवादी नकली छवियां दिखाता है।



हम अब अपनी आंखों पर विश्वास नहीं कर सकते हैं, लेकिन हम अभी भी फोरेंसिक विशेषज्ञों पर भरोसा करने में सक्षम हो सकते हैं, कम से कम अभी के लिए। यह पूरी तरह से संभव है कि भविष्य की प्रणालियों को उन्हें भी मूर्ख बनाने के लिए जानबूझकर प्रशिक्षित किया जा सकता है।

हम तेजी से एक ऐसे युग में प्रवेश कर रहे हैं जहां संपूर्ण फोटोग्राफिक और यहां तक ​​कि वीडियो भी आम हो जाएगा। समय बताएगा कि यह कितना महत्वपूर्ण होगा, लेकिन इस बीच यह कोटिंगले फेयरी तस्वीरों के पाठ को याद रखने योग्य है-कभी-कभी लोग केवल विश्वास करना चाहते हैं, यहां तक ​​​​कि स्पष्ट नकली में भी।वार्तालाप

इस लेख से पुन: प्रकाशित किया गया है वार्तालाप क्रिएटिव कॉमन्स लाइसेंस के तहत। को पढ़िए मूल लेख.

छवि क्रेडिट: ब्रेंडन मर्फी / एuthor प्रदान किया गया

समय टिकट:

से अधिक विलक्षणता हब