प्लेटोब्लॉकचैन डेटा इंटेलिजेंस इमेजिंग के भविष्य पर एआई आर्ट जनरेटर मिडजॉर्नी के संस्थापक डेविड होल्ज़। लंबवत खोज। ऐ.

इमेजिंग के भविष्य पर एआई आर्ट जनरेटर मिडजॉर्नी के संस्थापक डेविड होल्ज़

साक्षात्कार 2008 में, डेविड होल्ज़ ने लीप मोशन नामक एक हार्डवेयर परिधीय फर्म की सह-स्थापना की। उन्होंने इसे पिछले साल तक चलाया जब उन्होंने मिडजौरी बनाना छोड़ दिया।

मध्य यात्रा अपने वर्तमान स्वरूप में टेक्स्ट प्रॉम्प्ट से एआई-जेनरेटेड आर्ट बनाने के लिए एक सोशल नेटवर्क है - इनपुट प्रॉम्प्ट पर एक शब्द या वाक्यांश टाइप करें और लगभग एक मिनट की गणना के बाद आपको स्क्रीन पर एक दिलचस्प या शायद अद्भुत छवि प्राप्त होगी। यह कुछ मामलों में OpenAI के समान है दाल-ई 2.

आकाश और बादलों की मध्य यात्रा छवि, पाठ का उपयोग करते हुए "यह सब बेकार सुंदरता।" स्रोत: द्वारा उत्पन्न मध्य यात्रा

दोनों बड़ी संख्या में छवियों पर प्रशिक्षित बड़े एआई मॉडल का परिणाम हैं। लेकिन मध्य यात्रा की अपनी विशिष्ट शैली है, जैसा कि देखा जा सकता है यह ट्विटर धागा. हाल के दिनों में दोनों ने सार्वजनिक बीटा परीक्षण में प्रवेश किया है (हालांकि DALL-E 2 एक्सेस को धीरे-धीरे बढ़ाया जा रहा है)।

टेक्स्ट इनपुट का उपयोग करके एआई मॉडल से उच्च गुणवत्ता वाली छवियां बनाने की क्षमता पिछले साल ओपनएआई की रिलीज के बाद एक लोकप्रिय गतिविधि बन गई। क्लिप (विपरीत भाषा-छवि पूर्व-प्रशिक्षण), जिसे यह मूल्यांकन करने के लिए डिज़ाइन किया गया था कि पाठ विवरण के साथ कितनी अच्छी तरह से बनाई गई छवियां संरेखित होती हैं। इसके जारी होने के बाद, कलाकार रयान मर्डोक (ट्विटर पर @advadnoun) ने पाया कि इस प्रक्रिया को उलटा किया जा सकता है - टेक्स्ट इनपुट प्रदान करके, आप अन्य AI मॉडल की मदद से इमेज आउटपुट प्राप्त कर सकते हैं।

उसके बाद, रचनात्मक कला समुदाय ने विभिन्न प्रकार के मॉडल और तकनीकों का उपयोग करके चित्र बनाने के लिए पायथन कोड प्रकाशित करते हुए, ज्वर की खोज की अवधि शुरू की।

"पिछले साल कुछ समय, हमने देखा कि एआई के कुछ क्षेत्र वास्तव में दिलचस्प तरीके से प्रगति कर रहे थे," होल्ज़ ने एक साक्षात्कार में समझाया रजिस्टर. "उनमें से एक एआई की भाषा समझने की क्षमता थी।"

होल्ज़ ने ट्रांसफॉर्मर जैसे विकास की ओर इशारा किया, एक गहन शिक्षण मॉडल जो CLIP को सूचित करता है, और प्रसार मॉडल, GAN का एक विकल्प है। कैथरीन क्रॉसन (ट्विटर पर @RiversHaveWings के रूप में जाना जाता है) द्वारा विकसित, उन्होंने कहा, "जिसने वास्तव में मेरी आंख को व्यक्तिगत रूप से मारा, वह क्लिप-निर्देशित प्रसार था।"

स्टीरियोटाइप्ड फ्लोरिडा का आदमी नहीं

होल्ज़ फ्लोरिडा में पले-बढ़े और हाई स्कूल में उनका डिज़ाइन व्यवसाय था जहाँ उन्होंने गणित और भौतिकी का अध्ययन किया। वह एक अनुप्रयुक्त गणित पीएचडी पर काम कर रहे थे और 2008 में लीप मोशन शुरू करने के लिए अनुपस्थिति की छुट्टी ले ली। अगले वर्ष, उन्होंने मैक्स प्लैंक संस्थान में एक छात्र शोधकर्ता के रूप में एक वर्ष बिताया, इसके बाद दो साल नासा लैंगली रिसर्च सेंटर में एक स्नातक छात्र शोधकर्ता के रूप में LiDAR, मंगल मिशन और वायुमंडलीय विज्ञान पर काम किया।

"मैं ऐसा था, मैं इस सब सामान पर काम क्यों कर रहा हूँ?" उन्होंने समझाया। "मैं सिर्फ एक अच्छी चीज पर काम करना चाहता हूं जिसकी मुझे परवाह है।"

इसलिए उन्होंने लीप मोशन पर ध्यान केंद्रित किया, जिसने हाथ की गति को ट्रैक करने और डिवाइस इनपुट के लिए इसका उपयोग करने के लिए एक हार्डवेयर डिवाइस विकसित किया। उन्होंने कंपनी को बारह साल तक चलाया, और जब उन्होंने इसे छोड़ा तो लगभग 100 लोगों को रोजगार मिला।

मध्य यात्रा, उन्होंने कहा, अभी बहुत छोटा है। "हम लगभग 10 लोगों की तरह हैं," उन्होंने समझाया। "हम स्व-वित्त पोषित हैं। हमारे पास कोई निवेशक नहीं है। हम वास्तव में आर्थिक रूप से प्रेरित नहीं हैं। हम यहां सिर्फ उन चीजों पर काम करने के लिए हैं जिनके बारे में हम भावुक हैं और मज़े करते हैं। और हम कई अलग-अलग परियोजनाओं पर काम कर रहे थे।"

होल्ज़ ने कहा कि एआई के तकनीकी पहलू और इसमें किस हद तक सुधार होगा, इसका अनुमान लगाना काफी आसान है। "लेकिन उस के मानवीय प्रभाव की कल्पना करना बहुत कठिन है," उन्होंने कहा। "यहां कुछ ऐसा है जो मानवता और प्रौद्योगिकी के चौराहे पर है। वास्तव में यह पता लगाने के लिए कि यह क्या है और यह क्या होना चाहिए, हमें वास्तव में बहुत सारे प्रयोग करने की आवश्यकता है।"

आगे का रास्ता

एआई इमेज टेक्नोलॉजी की अस्थिर प्रकृति मिडजॉर्नी जैसे टूल और ब्लेंडर जैसे डाउनलोड करने योग्य ओपन सोर्स ग्राफिक्स एप्लिकेशन, या एडोब फोटोशॉप जैसे स्थानीय रूप से स्थापित व्यावसायिक एप्लिकेशन (क्लाउड सेवा बनने से पहले) के बीच अंतर में स्पष्ट है।

मध्य यात्रा एक सामाजिक संदर्भ में मौजूद है। इसका फ्रंट-एंड चैट सर्विस डिस्कॉर्ड है। नए उपयोगकर्ता डिस्कॉर्ड के मिडजॉर्नी सर्वर में लॉग इन करते हैं और फिर विभिन्न नौसिखिया चैनलों में से किसी भी अन्य उपयोगकर्ताओं के साथ छवियों को उत्पन्न करने के लिए टेक्स्ट प्रॉम्प्ट सबमिट कर सकते हैं।

उस चैनल के सभी उपयोगकर्ताओं के लिए परिणामी छवियां लगभग एक मिनट में सामने आती हैं, जो समुदाय की धारणा को सुदृढ़ करने में मदद करती हैं। जो लोग $10/माह या $30/माह की सदस्यता में अपग्रेड करने का निर्णय लेते हैं, वे एक निजी प्रत्यक्ष संदेश के रूप में Discord ऐप में Midjourney bot को टेक्स्ट सबमिट कर सकते हैं और सार्वजनिक रूप से अन्य उपयोगकर्ताओं से बातचीत के स्क्रीन-स्क्रॉलिंग वॉटरफॉल के बिना प्रतिक्रिया में चित्र प्राप्त कर सकते हैं। चैनल। हालांकि जेनरेट की गई छवियां डिफ़ॉल्ट रूप से सार्वजनिक रूप से देखने योग्य रहती हैं।

एक सामाजिक ऐप के रूप में, मिडजर्नी स्वीकार्य सामग्री के नियमों के अधीन है - ब्लेंडर या अन्य स्थानीय रूप से इंस्टॉल किए गए ऐप्स के कुछ उपयोगकर्ताओं को चिंता करने की ज़रूरत नहीं है। Midjourney की सेवा की शर्तें बताती हैं: "कोई वयस्क सामग्री या गोर नहीं। कृपया चौंकाने वाली या परेशान करने वाली सामग्री बनाने से बचें। हम कुछ टेक्स्ट इनपुट को अपने आप ब्लॉक कर देंगे।"

DALL-E 2 समान हालांकि अधिक व्यापक सीमाओं के अधीन है, जैसा कि इसके में वर्णित है सामग्री नीति.

"मुझे लगता है कि अगर हम ऐसी दुनिया में रहते जहां सोशल मीडिया नहीं था, तो हमें किसी भी प्रतिबंध की आवश्यकता नहीं होगी," होल्ज़ ने कहा। "... जब फ़ोटोशॉप का आविष्कार किया गया था, तो वास्तव में इसके बारे में प्रेस था, जहां यह पसंद है, 'ओह, आप कुछ भी नकली कर सकते हैं और यह थोड़ा डरावना है।' [लेकिन अब], सनसनीखेज होना पहले की तुलना में बहुत अधिक आकर्षक है। ”

"आजकल, कोई भी सनसनीखेज हो सकता है, और मूल रूप से इससे लाभ होता है, आप जानते हैं," होल्ज़ ने कहा। "और इसलिए यह क्या करता है यह नाटक और सनसनीखेज के लिए एक बाजार बनाता है। इसलिए मुझे लगता है कि हमें थोड़ा और सावधान रहना होगा, क्योंकि किसी बिंदु पर, लोग क्या करेंगे, वे कहेंगे, 'ठीक है, मैं इसकी तस्वीरें बना सकता हूं, सबसे नाटकीय और आक्रामक और भयावह चीजें क्या हैं जो मैं बना सकते हैं?'"

कोई आसान जवाब नहीं

होल्ज़ अनुमति देता है कि इन समस्याओं को कम करने के लिए सोशल प्लेटफॉर्म कुछ चीजें कर सकते हैं लेकिन कहते हैं कि कोई आसान जवाब नहीं है। "दुर्भाग्य से, इसे संबोधित करने का कोई स्पष्ट तरीका नहीं है, सिवाय एक समाज के, सनसनीखेज को कम पुरस्कृत करने के लिए," उन्होंने कहा। "हालांकि, मेरी धारणा यह है कि कोई भी वास्तव में सनसनीखेजता को कम करने के लिए सामाजिक प्लेटफार्मों को बदलने की कोशिश नहीं कर रहा है, क्योंकि इससे उन्हें अभी पैसा मिलता है।"

इसके अलावा, उन्होंने कहा, क्योंकि मिडजर्नी का लक्ष्य 13 वर्ष से अधिक उम्र के किसी भी व्यक्ति के लिए एक सामाजिक स्थान बनना है, चरम या ग्राफिक सामग्री के खिलाफ नियम होना आवश्यक है।

"हम वास्तव में उन लोगों के लिए खंडित स्थान नहीं चाहते हैं जो लाशों को बनाना पसंद करते हैं या नग्न तस्वीरें पसंद करते हैं," होल्ज़ ने समझाया। "हम बस इससे निपटना नहीं चाहते हैं। हमें नहीं लगता कि इस स्तर पर ऐसा करना हमारा नैतिक दायित्व है। हम चाहते हैं कि लोगों के लिए एक सुंदर सामाजिक स्थान एक साथ सामान बनाएं और नाराज न हों, मूल रूप से, और सुरक्षित महसूस करें। ”

उस ओर, कंपनी के पास लगभग 40 मॉडरेटर हैं जो उपयोगकर्ताओं द्वारा बनाई गई छवियों पर नज़र रखते हैं।

मिडजर्नी के सामाजिक पहलू ने हाल ही में छवि गुणवत्ता को बढ़ाना शुरू किया। होल्ज ने कहा कि कंपनी के इंजीनियरों ने हाल ही में इसके सॉफ्टवेयर का तीन संस्करण पेश किया है, जिसमें पहली बार उपयोगकर्ता गतिविधि और प्रतिक्रिया के आधार पर फीडबैक लूप शामिल किया गया है।

"यदि आप v3 सामान को देखते हैं, तो यह बहुत बड़ा सुधार है," उन्होंने कहा। "यह दिमागी रूप से बेहतर है और हमने वास्तव में इसमें कोई और कला नहीं डाली है। हमने अभी डेटा लिया है कि उपयोगकर्ताओं को कौन सी छवियां पसंद हैं, और वे इसका उपयोग कैसे कर रहे हैं। और इसने वास्तव में इसे बेहतर बना दिया। ”

मिडजॉर्नी टेक स्टैक के बारे में पूछे जाने पर, होल्ज़ ने टाल दिया। "किसी बिंदु पर, हम शायद विशेष रूप से एक प्रेस विज्ञप्ति जारी करने जा रहे हैं जिसके आसपास हम उपयोग कर रहे हैं," उन्होंने कहा। "मैं क्या कह सकता हूं कि हमारे पास अरबों मापदंडों के साथ ये बड़े एआई मॉडल हैं। वे अरबों छवियों को प्रशिक्षित करते हैं।"

होल्ज़ का कहना है कि उपयोगकर्ता हर दिन लाखों और लाखों छवियां बना रहे हैं, और ऐसा हरित ऊर्जा गणना प्रदाताओं का उपयोग कर रहे हैं - जो वास्तव में प्रमुख क्लाउड कंप्यूटिंग प्रदाताओं के क्षेत्र को कम नहीं करता है क्योंकि वे सभी कम से कम कार्बन तटस्थ होने का दावा करते हैं।

"हर छवि पेटाओप्स ले रही है," उन्होंने कहा, एक शब्द जिसका अर्थ है प्रति सेकंड 10 ^ 15 ऑपरेशन। "तो हजारों खरबों ऑपरेशन। मैं ठीक-ठीक नहीं जानता कि यह पाँच है या 1000 या 10। लेकिन यह एक छवि बनाने के लिए हजारों खरबों ऑपरेशन हैं। यह शायद सबसे महंगा है ... यदि आप मिडजॉर्नी कहते हैं, तो एक सेवा - जैसे कि आप इसे एक सेवा या उत्पाद कहते हैं - इसमें कोई संदेह नहीं है, ऐसी कोई सेवा पहले कभी नहीं रही है जहां एक नियमित व्यक्ति इतनी गणना का उपयोग कर रहा हो।"

हमें भोजन और वस्त्र में रखते हुए

फिर भी Midjourney भुगतान किए गए स्तरों के लिए एक मुफ्त सेवा द्वारा लाए गए ग्राहकों को ऊपर उठाने और सार्वजनिक होने या अधिग्रहण करने से पहले अच्छी तरह से भुगतान करने वाले उद्यम ग्राहकों को आकर्षित करने की राह पर नहीं है।

"हम एक स्टार्टअप की तरह नहीं हैं जो बहुत सारा पैसा जुटाता है और फिर यह सुनिश्चित नहीं करता है कि उनका व्यवसाय या उत्पाद क्या है और लंबे समय तक पैसा खो देता है," होल्ज़ ने कहा। "हम एक स्व-वित्त पोषित अनुसंधान प्रयोगशाला की तरह हैं। हम कुछ राशि खो सकते हैं। हमारे पास खोने के लिए किसी और के पैसे के 100 मिलियन डॉलर नहीं हैं। सच कहूं तो, हम पहले से ही लाभदायक हैं, और हम ठीक हैं।"

"यह एक बहुत ही सरल व्यवसाय मॉडल है, जो है, क्या लोग इसका उपयोग करने का आनंद लेते हैं? फिर यदि वे करते हैं, तो उन्हें इसका उपयोग करने की लागत का भुगतान करना होगा क्योंकि कच्ची लागत वास्तव में काफी महंगी है। और फिर हम उसके ऊपर एक प्रतिशत जोड़ते हैं, जो उम्मीद है कि हमें खिलाने और घर देने के लिए पर्याप्त है। और इसलिए हम यही कर रहे हैं।"

भविष्य के लिए, स्केलिंग एक समस्या हो सकती है। होल्ज़ ने कहा कि मिडजॉर्नी में वर्तमान में सेवा का उपयोग करने वाले सैकड़ों हजारों लोग हैं, जिसके लिए 10,000 सर्वरों की आवश्यकता होती है।

"अगर 10 मिलियन लोग इस तरह की तकनीक का उपयोग करने की कोशिश कर रहे थे," उन्होंने कहा, "वास्तव में पर्याप्त कंप्यूटर नहीं हैं। दुनिया में AI करने के लिए एक लाख मुफ्त सर्वर नहीं हैं। मुझे लगता है कि तकनीक वास्तव में हर उस व्यक्ति तक पहुंचती है जो इसका उपयोग करना चाहता है, इससे पहले कि दुनिया कंप्यूटर से बाहर हो जाएगी। ”

लोग इसका उपयोग किस लिए कर रहे हैं? ठीक है, अगर आप मिडजर्नी खाते में साइन इन हैं तो आप देख सकते हैं कि लोग क्या बना रहे हैं सामुदायिक फ़ीड पृष्ठ। यह दिलचस्प, अक्सर चौंकाने वाली अच्छी, छवियों का एक निरंतर प्रवाह है।

"ज्यादातर लोग बस मज़े कर रहे हैं," होल्ज़ ने कहा। "मुझे लगता है कि यह सबसे बड़ी बात है क्योंकि यह वास्तव में कला के बारे में नहीं है, यह कल्पना के बारे में है।"

पेशेवर होना

लेकिन लगभग 30 प्रतिशत उपयोगकर्ताओं के लिए, यह पेशेवर है। होल्ज़ ने कहा कि बहुत से ग्राफिक कलाकार अपनी अवधारणा विकास वर्कफ़्लो के हिस्से के रूप में मिडजर्नी का उपयोग करते हैं। वे एक विचार पर कुछ बदलाव उत्पन्न करते हैं और इसे ग्राहकों के सामने पेश करते हैं कि उन्हें किस दिशा में आगे बढ़ना चाहिए।

"पेशेवर इसका उपयोग अपनी रचनात्मक या संचार प्रक्रिया को सुपरचार्ज करने के लिए कर रहे हैं," होल्ज़ ने समझाया। "और फिर बहुत सारे लोग इसके साथ खेल रहे थे।"

होल्ज़ ने कला चिकित्सा के रूप में जो वर्णन किया है, उसके लिए शायद 20 प्रतिशत लोग मिडजर्नी का उपयोग करते हैं। उदाहरण के लिए, अपने कुत्ते की मृत्यु के बाद कुत्ते की छवियां बनाना। "वे इसे एक भावनात्मक और बौद्धिक चिंतनशील उपकरण के रूप में उपयोग कर रहे हैं," उन्होंने कहा। "और यह वास्तव में अच्छा है।"

होल्ज़ नकली तस्वीरें बनाने के लिए मिडजर्नी का उपयोग करने के विचार को नापसंद करता है। "नकली तस्वीरें बनाने के लिए संपादकीय रूप से इसका उपयोग करना बेहद खतरनाक है," उन्होंने कहा। "किसी को भी ऐसा नहीं करना चाहिए।" लेकिन वह वाणिज्यिक चित्रण के स्रोत के रूप में मिडजर्नी के लिए अधिक खुला है, यह देखते हुए कि द इकोनॉमिस्ट ने मिडजर्नी ग्राफ़िक चलाया जून में इसके कवर पर।

"हमने हाल ही में लोगों को इसे व्यावसायिक रूप से उपयोग करने की अनुमति दी है," होल्ज़ ने कहा। "लंबे समय तक, यह केवल गैर-व्यावसायिक था। और इसलिए हम जो काम कर रहे हैं उनमें से एक यह है कि हम इसे देख रहे हैं, लोग क्या कर रहे हैं, और हम यह तय कर सकते हैं कि हम इनमें से कुछ के साथ सहज नहीं हैं और फिर हम आपको यह कहते हुए एक नियम बनाने जा रहे हैं अब इसे केवल उन चीजों के लिए उपयोग नहीं कर सकता।"

होल्ज़ ने कहा कि वह देखता है कि मिडजॉर्नी जैसे एआई उपकरण सभी को एक पेशेवर कलाकार बनाने के बजाय कलाकारों को बेहतर बनाते हैं। "इन उपकरणों का उपयोग करने वाला एक कलाकार इन उपकरणों का उपयोग करने वाले नियमित व्यक्ति से हमेशा बेहतर होता है। किसी बिंदु पर, क्या इन उपकरणों का उपयोग करने का दबाव हो सकता है क्योंकि आप ऐसी चीजें बना सकते हैं जो इतनी बढ़िया हैं? हाँ मुझे लगता है। लेकिन अभी, मुझे नहीं लगता कि यह अभी काफी है। लेकिन यह अगले दो वर्षों में आश्चर्यजनक रूप से बेहतर होगा।"

मिडजर्नी और डीएएल-ई 2 ने लंबे समय से चली आ रही चिंताओं की ओर अधिक ध्यान आकर्षित किया है कि क्या कॉपीराइट या विशिष्ट लाइसेंस के तहत काम से बनाए गए बड़े एआई मॉडल को कॉपीराइट कानून के साथ और सामग्री निर्माताओं की अपनी समझ के साथ समेटा जा सकता है कि उनके काम को कैसे माना जाना चाहिए।

अमेरिका, मुकदमे की भूमि

मिडजर्नी आउटपुट के संदर्भ में, वर्तमान अमेरिकी न्यायशास्त्र एआई-जनित छवियों को कॉपीराइट देने की संभावना से इनकार करता है। फरवरी में, यूएस कॉपीराइट ऑफिस रिव्यू बोर्ड अस्वीकृत [पीडीएफ] कंप्यूटर-जनित परिदृश्य को कॉपीराइट प्रदान करने का दूसरा अनुरोध जिसका शीर्षक "ए रीसेंट एंट्रेंस टू पैराडाइज" है क्योंकि यह मानव लेखकत्व के बिना बनाया गया था।

एक फोन साक्षात्कार में, सांता क्लारा विश्वविद्यालय में कानून विभाग के प्रोफेसर टायलर ओचोआ ने बताया रजिस्टर, "अमेरिकी कॉपीराइट कार्यालय ने कहा है कि यह [स्वीकार्य] है यदि कोई कलाकार एआई का उपयोग किसी कार्य को बनाने में उनकी सहायता करने के लिए करता है, जब तक कि इसमें कुछ मानवीय रचनात्मकता शामिल है। यदि यह केवल आप टेक्स्ट टाइप कर रहे हैं, और एआई एक काम उत्पन्न करता है, तो यह स्पष्ट रूप से वर्तमान कानून के तहत कॉपीराइट सुरक्षा के अधीन नहीं है।"

Midjourney की सेवा की शर्तें बताती हैं कि "आप सेवाओं के साथ बनाई गई सभी संपत्तियों के मालिक हैं," लेकिन कंपनी को सेवा के साथ बनाई गई सामग्री को पुन: पेश करने के लिए उपयोगकर्ताओं से कॉपीराइट लाइसेंस की आवश्यकता होती है - उपयोगकर्ताओं की छवियों को होस्ट करने के लिए एक आवश्यक सावधानी, भले ही यह संदिग्ध लगे कि वे केवल पाठ इनपुट के माध्यम से मिडजर्नी छवियों को बनाने या लागू करने के लिए कोई कॉपीराइट है।

ऐसा हमेशा नहीं हो सकता है। ओचोआ ने कहा कि उनका मानना ​​​​है कि स्टीवन थेलर, जिन्होंने "ए रीसेंट एंट्रेंस टू पैराडाइज़" बनाया है, वे कॉपीराइट कार्यालय द्वारा एआई-आधारित लेखकत्व की अस्वीकृति को अदालत में चुनौती देना चाह सकते हैं, हालांकि ऐसा अभी तक नहीं हुआ है।

कॉपीराइट सामग्री पर प्रशिक्षित एआई मॉडल से उत्पन्न होने वाली संभावित कॉपीराइट चिंताएं भी हैं। "सवाल यह है कि प्रशिक्षण और एआई के लिए उन छवियों का उपयोग करना उचित होगा या नहीं," ओचोआ ने कहा। "और मुझे लगता है कि उस संदर्भ में उचित उपयोग का मामला काफी मजबूत है।"

इसके अतिरिक्त, उन लोगों के लिए संभावित दायित्व है जो मौजूदा कॉपीराइट सामग्री के समान छवियों को उत्पन्न करते हैं। ओचोआ ने समझाया, "यदि आपका प्रशिक्षण सेट काफी बड़ा नहीं है, तो एआई जो थूकता है वह बहुत ही भयानक लग सकता है जैसे कि यह निगला गया है," यह देखते हुए कि मुद्दा यह है कि क्या यह कॉपीराइट उल्लंघन है। "अप्रत्यक्ष रूप से, मुझे लगता है कि यह बहुत संभव हो सकता है।"

मिडजॉर्नी-जनित संपत्ति का उपयोग करने वाले ग्राहकों के लिए संभावित कानूनी जोखिम के लिए, ओचोआ ने कहा कि उन्हें लगता है कि यह काफी कम है। यदि एआई मॉडल का प्रशिक्षण कॉपीराइट का उल्लंघन करता है, जो क्लाइंट के शामिल होने से पहले किया गया था, तो उन्होंने समझाया। "इसलिए जब तक क्लाइंट ने किसी तरह से AI के निर्माण को प्रायोजित नहीं किया, मुझे नहीं लगता कि [क्लाइंट] प्रशिक्षण सेट के किसी भी उल्लंघन के लिए उत्तरदायी होगा," उन्होंने कहा। "और यह यहां सबसे मजबूत दावा है। इसलिए मुझे लगता है कि ग्राहक इन छवियों का उपयोग करने में काफी ठोस आधार पर हैं, यह मानते हुए कि यह अच्छी तरह से किया गया था।

होल्ज़ ने स्वीकार किया कि कानूनी स्थिति में स्पष्टता का अभाव है।

"फिलहाल, कानून के पास वास्तव में इस तरह की चीज़ के बारे में कुछ भी नहीं है," उन्होंने कहा। "मेरी जानकारी के लिए, हर एक बड़े एआई मॉडल को मूल रूप से इंटरनेट पर मौजूद सामग्री पर प्रशिक्षित किया जाता है। और यह ठीक है, अभी। इसके बारे में विशेष रूप से कोई कानून नहीं हैं। शायद भविष्य में होगा। लेकिन यह एक उपन्यास क्षेत्र की तरह है, जैसे जीपीएल प्रोग्रामिंग कोड के आसपास एक उपन्यास कानूनी चीज थी। और इसे वास्तव में कुछ ऐसा बनने में 20 या 30 साल लग गए, जिसका पता लगाने के लिए कानूनी व्यवस्था शुरू हो रही है। ”

होल्ज़ ने कहा कि उनका मानना ​​है कि इस समय यह समझना अधिक महत्वपूर्ण है कि संबंधित पक्ष इस तकनीक के बारे में कैसा महसूस करते हैं। "हमारे पास बहुत सारे कलाकार हैं जो हमारे सामान का उपयोग करते हैं, और हम उनके साथ लगातार जांच कर रहे हैं, जैसे 'क्या आप इसके बारे में ठीक महसूस करते हैं?'" उन्होंने कहा।

होल्ज़ ने कहा कि यदि यथास्थिति के साथ पर्याप्त असंतोष है, तो भविष्य में उन कलाकारों के लिए किसी प्रकार की भुगतान संरचना के बारे में सोचने लायक हो सकता है जिनका काम प्रशिक्षण मॉडल में जाता है। लेकिन उन्होंने देखा कि योगदान की सीमा का आकलन करना वर्तमान में कठिन है। "अभी इस तरह की किसी भी चीज़ के लिए चुनौती यह है कि यह वास्तव में स्पष्ट नहीं है कि एआई मॉडल अच्छी तरह से काम कर रहा है," उन्होंने कहा। "अगर मैं वहां एक कुत्ते की तस्वीर डालता हूं, तो यह वास्तव में [एआई मॉडल] कुत्ते के चित्र बनाने में कितना मदद करता है। यह वास्तव में स्पष्ट नहीं है कि डेटा के कौन से हिस्से वास्तव में [मॉडल] क्या क्षमताएं दे रहे हैं।"

यह पूछे जाने पर कि मिडजर्नी को इसकी विशिष्ट सुंदरता क्या देती है, होल्ज़ ने कहा कि वह वास्तव में तुलना नहीं कर सकता कि मिडजॉर्नी DALL-E 2 से क्या कर रहा है, लेकिन सामान्य तौर पर AI शोधकर्ताओं को वह मिलता है जिसके लिए वे अनुकूलित करते हैं। यदि वे "कुत्ता" शब्द डालते हैं तो वे शायद कुत्ते की तस्वीर चाहते हैं।

"हमारे लिए, हम तब थे जब हम इसे अनुकूलित कर रहे थे, हम चाहते थे कि यह सुंदर दिखे, और सुंदर का मतलब यथार्थवादी नहीं है। ... अगर कुछ भी, वास्तव में हम इसे तस्वीरों से थोड़ा दूर पूर्वाग्रह करते हैं। ... मुझे पता है कि इस तकनीक का इस्तेमाल एक गहरी नकली सुपर मशीन के रूप में किया जा सकता है। और मुझे नहीं लगता कि दुनिया को और नकली तस्वीरों की जरूरत है। मैं वास्तव में दुनिया में नकली तस्वीरों का स्रोत नहीं बनना चाहता।"

"मैं वास्तव में असहज महसूस करता हूं अगर हमारा सामान कुछ ऐसा बनाता है जो एक तस्वीर जैसा दिखता है। और इसका मतलब यह नहीं है कि हम लोगों को ऐसी चीजें कभी नहीं बनाने देंगे जो अधिक यथार्थवादी हों। चीजों को अधिक यथार्थवादी बनाने की कोशिश करने के लिए वैध उपयोग के मामले हैं। हालांकि, मैं दृढ़ता से महसूस करता हूं कि, डिफ़ॉल्ट रूप से, जब कोई हमारे सिस्टम का उपयोग करता है, तो उसे नकली फोटो नहीं बनानी चाहिए।"

"लेकिन मुझे लगता है कि दुनिया को और सुंदरता की जरूरत है। मूल रूप से, अगर मैं कुछ ऐसा बनाता हूं जो लोगों को सुंदर चीजें बनाने की अनुमति देता है, और दुनिया में और भी सुंदर चीजें हैं, तो मैं डिफ़ॉल्ट रूप से यही चाहता हूं। ” ®

समय टिकट:

से अधिक रजिस्टर