ڈیوڈ ہولز، AI آرٹ جنریٹر Midjourney کے بانی، PlatoBlockchain Data Intelligence کی امیجنگ کے مستقبل پر۔ عمودی تلاش۔ عی

ڈیوڈ ہولز، AI آرٹ جنریٹر مڈجرنی کے بانی، امیجنگ کے مستقبل پر

انٹرویو 2008 میں، ڈیوڈ ہولز نے لیپ موشن نامی ایک ہارڈویئر پیریفرل فرم کی مشترکہ بنیاد رکھی۔ اس نے اسے پچھلے سال تک چلایا جب وہ مڈجوری بنانے کے لیے چلا گیا۔

درمیانی سفر اپنی موجودہ شکل میں ٹیکسٹ پرامپٹ سے AI سے تیار کردہ آرٹ بنانے کا ایک سوشل نیٹ ورک ہے - ان پٹ پرامپٹ پر ایک لفظ یا جملہ ٹائپ کریں اور تقریباً ایک منٹ کی گنتی کے بعد آپ کو اسکرین پر ایک دلچسپ یا شاید شاندار تصویر ملے گی۔ یہ کچھ معاملات میں OpenAI کی طرح ہے۔ DALL-E2.

"یہ تمام بیکار خوبصورتی" ٹیکسٹ پرامپٹ کا استعمال کرتے ہوئے آسمان اور بادلوں کی درمیانی سفر کی تصویر۔ ماخذ: کی طرف سے پیدا درمیانی سفر

دونوں بڑی تعداد میں تصاویر پر تربیت یافتہ بڑے AI ماڈلز کا نتیجہ ہیں۔ لیکن مڈجرنی کا اپنا ایک مخصوص انداز ہے، جیسا کہ دیکھا جا سکتا ہے۔ یہ ٹویٹر تھریڈ. دونوں حالیہ دنوں میں عوامی بیٹا ٹیسٹنگ میں داخل ہوئے ہیں (حالانکہ DALL-E 2 تک رسائی کو آہستہ آہستہ بڑھایا جا رہا ہے)۔

ٹیکسٹ ان پٹ کا استعمال کرتے ہوئے AI ماڈلز سے اعلیٰ معیار کی تصاویر بنانے کی صلاحیت گزشتہ سال OpenAI کی ریلیز کے بعد ایک مقبول سرگرمی بن گئی۔ کلپ (متضاد زبان – امیج پری ٹریننگ)، جس کو اس بات کا اندازہ کرنے کے لیے ڈیزائن کیا گیا تھا کہ تخلیق کردہ تصاویر متن کی تفصیل کے ساتھ کتنی اچھی طرح سے ہم آہنگ ہیں۔ اس کی رہائی کے بعد، آرٹسٹ ریان مرڈاک (@advadnoun on Twitter) نے پایا کہ اس عمل کو تبدیل کیا جا سکتا ہے - ٹیکسٹ ان پٹ فراہم کر کے، آپ دوسرے AI ماڈلز کی مدد سے امیج آؤٹ پٹ حاصل کر سکتے ہیں۔

اس کے بعد، جنریٹیو آرٹ کمیونٹی نے بہت سے ماڈلز اور تکنیکوں کا استعمال کرتے ہوئے تصاویر بنانے کے لیے Python کوڈ شائع کرتے ہوئے ایک تیز ریسرچ کا آغاز کیا۔

"پچھلے سال کے کچھ عرصے میں، ہم نے دیکھا کہ AI کے کچھ ایسے شعبے تھے جو واقعی دلچسپ طریقوں سے ترقی کر رہے تھے،" ہولز نے ایک انٹرویو میں وضاحت کی۔ رجسٹر. "ان میں سے ایک AI کی زبان کو سمجھنے کی صلاحیت تھی۔"

ہولز نے ٹرانسفارمرز جیسی ترقیوں کی طرف اشارہ کیا، ایک گہرا سیکھنے والا ماڈل جو CLIP کو مطلع کرتا ہے، اور ڈفیوژن ماڈل، GANs کا متبادل۔ "جس نے واقعی میری آنکھ کو ذاتی طور پر ٹکرایا وہ CLIP- گائیڈڈ ڈفیوژن تھا،" اس نے کہا، کیتھرین کراسن نے تیار کیا (ٹویٹر پر @RiversHaveWings کے نام سے جانا جاتا ہے)۔

فلوریڈا کا دقیانوسی آدمی نہیں۔

ہولز فلوریڈا میں پلا بڑھا اور ہائی اسکول میں ڈیزائن کا کاروبار کیا جہاں اس نے ریاضی اور طبیعیات کی تعلیم حاصل کی۔ وہ اپلائیڈ میتھمیٹکس پی ایچ ڈی پر کام کر رہا تھا اور لیپ موشن شروع کرنے کے لیے 2008 میں غیر حاضری کی چھٹی لی۔ اگلے سال، اس نے میکس پلانک انسٹی ٹیوٹ میں ایک طالب علم محقق کے طور پر ایک سال گزارا، اس کے بعد دو سال ناسا لینگلی ریسرچ سینٹر میں ایک گریجویٹ طالب علم محقق کے طور پر LiDAR، مریخ کے مشنز، اور ماحولیاتی سائنس پر کام کیا۔

"میں ایسا ہی تھا، میں ان سب چیزوں پر کیوں کام کر رہا ہوں؟" اس نے وضاحت کی. "میں صرف ایک اچھی چیز پر کام کرنا چاہتا ہوں جس کی مجھے پرواہ ہے۔"

لہذا اس نے لیپ موشن پر توجہ مرکوز کی، جس نے ہاتھ کی حرکت کو ٹریک کرنے اور اسے ڈیوائس ان پٹ کے لیے استعمال کرنے کے لیے ایک ہارڈویئر ڈیوائس تیار کی۔ اس نے کمپنی کو بارہ سال تک چلایا، اور جب اس نے چھوڑا تو اس میں تقریباً 100 لوگ ملازم تھے۔

انہوں نے کہا کہ مڈجرنی ابھی بہت چھوٹا ہے۔ "ہم تقریباً 10 لوگوں کی طرح ہیں،" اس نے وضاحت کی۔ "ہم خود فنڈ کر رہے ہیں۔ ہمارے پاس کوئی سرمایہ کار نہیں ہے۔ ہم واقعی مالی طور پر حوصلہ افزائی نہیں کر رہے ہیں. ہم یہاں صرف ان چیزوں پر کام کرنے کے لیے آئے ہیں جن کے بارے میں ہمیں پرجوش اور مزہ آتا ہے۔ اور ہم بہت سے مختلف منصوبوں پر کام کر رہے تھے۔

ہولز نے کہا کہ AI کا تکنیکی پہلو اور اس میں کس حد تک بہتری آئے گی اس کا اندازہ لگانا کافی آسان ہے۔ "لیکن اس کے انسانی اثرات کا تصور کرنا بہت مشکل ہے،" انہوں نے کہا۔ "یہاں کچھ ہے جو انسانیت اور ٹیکنالوجی کے سنگم پر ہے۔ واقعی یہ جاننے کے لیے کہ یہ کیا ہے اور اسے کیا ہونا چاہیے، ہمیں واقعی بہت سارے تجربات کرنے کی ضرورت ہے۔

آگے سڑک

AI امیج ٹکنالوجی کی غیر متزلزل نوعیت مڈجرنی جیسے ٹولز اور بلینڈر جیسی ڈاؤن لوڈ کے قابل اوپن سورس گرافکس ایپلی کیشن یا ایڈوب فوٹوشاپ جیسی مقامی طور پر انسٹال کردہ کمرشل ایپلی کیشن (اس سے پہلے کہ یہ کلاؤڈ سروس بن جائے) کے درمیان فرق واضح ہے۔

وسط سفر سماجی تناظر میں موجود ہے۔ اس کا فرنٹ اینڈ چیٹ سروس ڈسکارڈ ہے۔ نئے صارفین Discord کے Midjourney سرور میں لاگ ان ہوتے ہیں اور پھر مختلف نئے چینلز میں متعدد دوسرے صارفین کے ساتھ تصاویر بنانے کے لیے ٹیکسٹ پرامپٹس جمع کر سکتے ہیں۔

اس چینل کے تمام صارفین کے لیے نتیجے میں آنے والی تصاویر تقریباً ایک منٹ میں سامنے آتی ہیں، جو کمیونٹی کے تصور کو تقویت دینے میں مدد کرتی ہیں۔ وہ لوگ جو $10/ماہ یا $30/ماہ کی سبسکرپشن میں اپ گریڈ کرنے کا فیصلہ کرتے ہیں وہ Discord ایپ میں Midjourney bot کو ایک پرائیویٹ ڈائریکٹ میسج کے طور پر ٹیکسٹ جمع کرا سکتے ہیں اور عوامی سطح پر دوسرے صارفین سے بات چیت کے اسکرین سکرولنگ آبشار کے بغیر جواب میں تصاویر وصول کر سکتے ہیں۔ چینل تخلیق کردہ تصاویر تاہم پہلے سے طے شدہ طور پر عوامی طور پر دیکھنے کے قابل رہتی ہیں۔

ایک سماجی ایپ کے طور پر، مڈجرنی قابل اجازت مواد کے بارے میں قواعد کے تابع ہے – ایسی چیز جو بلینڈر یا مقامی طور پر انسٹال کردہ دیگر ایپس کے صارفین کو پریشان ہونے کی ضرورت نہیں ہے۔ Midjourney کی سروس کی شرائط بیان کرتی ہیں: "کوئی بالغ مواد یا گور نہیں ہے۔ براہ کرم بصری طور پر چونکا دینے والا یا پریشان کن مواد بنانے سے گریز کریں۔ ہم کچھ ٹیکسٹ ان پٹس کو خود بخود بلاک کر دیں گے۔

DALL-E 2 اسی طرح کے تابع ہے اگرچہ زیادہ وسیع حدود، جیسا کہ اس میں بیان کیا گیا ہے۔ مواد کی پالیسی.

"میرے خیال میں اگر ہم ایسی دنیا میں رہتے جس میں سوشل میڈیا نہیں ہوتا، تو ہمیں کسی پابندی کی ضرورت نہیں ہوتی،" ہولز نے کہا۔ "...جب فوٹوشاپ ایجاد ہوا، تو حقیقت میں اس کے بارے میں پریس تھا، جہاں یہ اس طرح ہے، 'اوہ، آپ کچھ بھی جعلی بنا سکتے ہیں اور یہ تھوڑا خوفناک ہے۔' [لیکن اب]، سنسنی خیز ہونا پہلے کی نسبت بہت زیادہ منافع بخش ہے۔

"آج کل، کوئی بھی سنسنی خیز ہو سکتا ہے، اور بنیادی طور پر اس سے فائدہ اٹھا سکتا ہے، آپ جانتے ہیں،" ہولز نے کہا۔ "اور اس طرح یہ کیا کرتا ہے یہ ڈرامہ اور سنسنی خیزی کا بازار پیدا کرتا ہے۔ اس لیے مجھے لگتا ہے کہ ہمیں تھوڑا زیادہ محتاط رہنا ہوگا، کیونکہ کسی وقت، لوگ جو کچھ کریں گے وہ یہ کہیں گے، 'ٹھیک ہے، میں اس کی تصاویر بنا سکتا ہوں، سب سے زیادہ ڈرامائی اور جارحانہ اور خوفناک چیز کیا ہے جو میں بنا سکتا ہے؟'"

کوئی آسان جواب نہیں۔

ہولز اجازت دیتا ہے کہ سماجی پلیٹ فارمز ان مسائل کو کم کرنے کے لیے کچھ کر سکتے ہیں لیکن کہتے ہیں کہ کوئی آسان جواب نہیں ہے۔ "بدقسمتی سے، اس سے نمٹنے کا کوئی واضح طریقہ نہیں ہے، سوائے ایک معاشرے کے، سنسنی خیزی کو کم انعام دینے کے لیے،" انہوں نے کہا۔ "تاہم، میرا تاثر یہ ہے کہ کوئی بھی واقعی سنسنی خیزی کو کم کرنے کے لیے سماجی پلیٹ فارمز کو تبدیل کرنے کی کوشش نہیں کر رہا ہے، کیونکہ اس سے انہیں ابھی پیسے ملتے ہیں۔"

مزید کیا ہے، انہوں نے کہا، کیونکہ مڈجرنی کا مقصد 13 سال سے زیادہ عمر کے ہر فرد کے لیے ایک سماجی جگہ بننا ہے، اس لیے انتہائی یا گرافک مواد کے خلاف قوانین کا ہونا ضروری ہے۔

ہولز نے وضاحت کرتے ہوئے کہا کہ "ہم واقعی ان لوگوں کے لیے الگ الگ جگہیں نہیں رکھنا چاہتے جو لاشیں بنانا پسند کرتے ہیں یا عریاں تصاویر پسند کرتے ہیں۔" "ہم صرف اس سے نمٹنا نہیں چاہتے ہیں۔ ہم نہیں سمجھتے کہ اس مرحلے پر ایسا کرنے کی ہماری اخلاقی ذمہ داری ہے۔ ہم ایک خوبصورت سماجی جگہ چاہتے ہیں کہ لوگ مل کر چیزیں بنائیں اور ناراض نہ ہوں، بنیادی طور پر، اور خود کو محفوظ محسوس کریں۔"

اس مقصد کے لیے، کمپنی کے پاس تقریباً 40 ماڈریٹرز ہیں جو صارفین کی تخلیق کردہ تصاویر پر نظر رکھتے ہیں۔

Midjourney کے سماجی پہلو نے حال ہی میں تصویر کے معیار کو بڑھانا شروع کیا۔ ہولز نے کہا کہ کمپنی کے انجینئرز نے حال ہی میں اس کے سافٹ ویئر کا تین ورژن متعارف کرایا، جس میں پہلی بار صارف کی سرگرمی اور ردعمل پر مبنی فیڈ بیک لوپ کو شامل کیا گیا۔

"اگر آپ v3 چیزوں کو دیکھیں تو یہ بہت بڑی بہتری ہے،" انہوں نے کہا۔ "یہ دماغی طور پر بہتر ہے اور ہم نے حقیقت میں اس میں مزید کوئی فن نہیں ڈالا۔ ہم نے صرف اس بارے میں ڈیٹا لیا کہ صارفین کو کون سی تصاویر پسند ہیں، اور وہ اسے کیسے استعمال کر رہے ہیں۔ اور اس نے حقیقت میں اسے بہتر بنایا۔"

مڈجرنی ٹیک اسٹیک کے بارے میں پوچھے جانے پر، ہولز نے ڈٹ کر کہا۔ "کسی وقت، ہم شاید ایک پریس ریلیز کرنے جا رہے ہیں خاص طور پر جس کے ارد گرد ہم استعمال کر رہے ہیں،" انہوں نے کہا. "میں کیا کہہ سکتا ہوں کہ ہمارے پاس یہ بڑے اے آئی ماڈلز ہیں جن میں اربوں پیرامیٹرز ہیں۔ وہ اربوں تصاویر سے زیادہ تربیت یافتہ ہیں۔

ہولز کا کہنا ہے کہ صارفین ہر روز لاکھوں اور لاکھوں تصاویر بنا رہے ہیں، اور ایسا گرین انرجی کمپیوٹنگ فراہم کنندگان کا استعمال کرتے ہوئے کر رہے ہیں - جو واقعی بڑے کلاؤڈ کمپیوٹنگ فراہم کنندگان کے میدان کو تنگ نہیں کرتا کیونکہ وہ سب کم از کم کاربن نیوٹرل ہونے کا دعویٰ کرتے ہیں۔

"ہر تصویر پیٹاپس لے رہی ہے،" انہوں نے کہا، ایک اصطلاح جس کا مطلب ہے 10^15 آپریشن فی سیکنڈ۔ "لہذا 1000 ٹریلین آپریشنز۔ میں بالکل نہیں جانتا کہ یہ پانچ ہے یا 10 یا 50۔ لیکن یہ ایک تصویر بنانے کے لیے 1000 کھربوں آپریشنز ہیں۔ یہ شاید سب سے مہنگا ہے … اگر آپ مڈجرنی کو کہتے ہیں، ایک سروس – جیسا کہ آپ اسے سروس یا پروڈکٹ کہیں گے – بلا شبہ، اس سے پہلے کبھی ایسی سروس نہیں آئی ہے جہاں کوئی باقاعدہ شخص اس قدر کمپیوٹ استعمال کر رہا ہو۔

ہمیں کھانے اور کپڑوں میں رکھنا

اس کے باوجود مڈجرنی ادائیگی والے درجات میں مفت سروس کے ذریعے لائے گئے صارفین کو فروخت کرنے اور پھر عوامی جانے یا حاصل کرنے سے پہلے اچھی ادائیگی کرنے والے انٹرپرائز کلائنٹس کو اپنی طرف متوجہ کرنے کی راہ پر نہیں ہے۔

ہولز نے کہا، "ہم ایک ایسے اسٹارٹ اپ کی طرح نہیں ہیں جو بہت زیادہ پیسہ اکٹھا کرتا ہے اور پھر اس بات کا یقین نہیں ہے کہ ان کا کاروبار یا پروڈکٹ کیا ہے اور طویل عرصے تک پیسہ کھو دیتا ہے۔" "ہم ایک سیلف فنڈڈ ریسرچ لیب کی طرح ہیں۔ ہم کچھ رقم کھو سکتے ہیں۔ ہمارے پاس کسی اور کے 100 ملین ڈالر کی رقم کھونے کے لیے نہیں ہے۔ سچ پوچھیں تو، ہم پہلے ہی منافع بخش ہیں، اور ہم ٹھیک ہیں۔"

"یہ ایک بہت ہی آسان کاروباری ماڈل ہے، جو کہ کیا لوگ اس کے استعمال سے لطف اندوز ہوتے ہیں؟ پھر اگر وہ ایسا کرتے ہیں تو انہیں اس کے استعمال کی قیمت ادا کرنی پڑتی ہے کیونکہ خام قیمت دراصل کافی مہنگی ہوتی ہے۔ اور پھر ہم اس کے اوپر ایک فیصد شامل کرتے ہیں، جو امید ہے کہ ہمیں کھانا کھلانے اور گھر بنانے کے لیے کافی ہے۔ اور اسی طرح ہم کر رہے ہیں۔"

جہاں تک مستقبل کا تعلق ہے، اسکیلنگ ایک مسئلہ ہو سکتی ہے۔ ہولز نے کہا کہ مڈجرنی کے پاس اس وقت سروس استعمال کرنے والے لاکھوں لوگ ہیں، جن کے لیے 10,000 سرورز کی ضرورت ہوتی ہے۔

"اگر وہاں 10 ملین لوگ اس طرح کی ٹیکنالوجی کو استعمال کرنے کی کوشش کر رہے ہوں،" انہوں نے کہا، "حقیقت میں کافی کمپیوٹرز نہیں ہیں۔ دنیا میں AI کرنے کے لیے ایک ملین مفت سرورز نہیں ہیں۔ مجھے لگتا ہے کہ دنیا میں کمپیوٹرز ختم ہو جائیں گے اس سے پہلے کہ ٹیکنالوجی درحقیقت ہر اس شخص تک پہنچ جائے جو اسے استعمال کرنا چاہتا ہے۔

لوگ اسے کس لیے استعمال کر رہے ہیں؟ ٹھیک ہے، اگر آپ Midjourney اکاؤنٹ میں سائن ان ہیں تو آپ دیکھ سکتے ہیں کہ لوگ اس کے ذریعے کیا تخلیق کر رہے ہیں۔ کمیونٹی فیڈ صفحہ یہ دلچسپ، اکثر چونکا دینے والی اچھی، تصاویر کا مسلسل بہاؤ ہے۔

"لوگوں کی اکثریت صرف مزے کر رہی ہے،" ہولز نے کہا۔ "میرے خیال میں یہ سب سے بڑی چیز ہے کیونکہ یہ اصل میں آرٹ کے بارے میں نہیں ہے، یہ تخیل کے بارے میں ہے۔"

پیشہ ور ہونا

لیکن تقریباً 30 فیصد صارفین کے لیے یہ پیشہ ور ہے۔ ہولز نے کہا کہ بہت سارے گرافک فنکار مڈجرنی کو اپنے تصوراتی ترقیاتی ورک فلو کے حصے کے طور پر استعمال کرتے ہیں۔ وہ کسی آئیڈیا پر کچھ تغیرات پیدا کرتے ہیں اور اسے کلائنٹس کے سامنے پیش کرتے ہیں تاکہ یہ دیکھیں کہ انہیں کس سمت کا تعاقب کرنا چاہیے۔

"پیشہ ور افراد اسے اپنے تخلیقی یا مواصلاتی عمل کو سپرچارج کرنے کے لیے استعمال کر رہے ہیں،" ہولز نے وضاحت کی۔ "اور پھر بہت سارے لوگ صرف اس کے ساتھ کھیل رہے تھے۔"

ہوسکتا ہے کہ 20 فیصد لوگ مڈجرنی کو اس کے لیے استعمال کریں جسے ہولز آرٹ تھراپی کے طور پر بیان کرتا ہے۔ مثال کے طور پر، کتے کے مرنے کے بعد کتے کی تصاویر بنانا۔ "وہ اسے ایک جذباتی اور فکری عکاس ٹول کے طور پر استعمال کر رہے ہیں،" انہوں نے کہا۔ "اور یہ واقعی بہت اچھا ہے۔"

ہولز جعلی تصاویر بنانے کے لیے مڈجرنی کو استعمال کرنے کے خیال کو ناپسند کرتا ہے۔ "جعلی تصاویر بنانے کے لیے ادارتی طور پر استعمال کرنا انتہائی خطرناک ہے،" انہوں نے کہا۔ ’’ایسا کسی کو نہیں کرنا چاہیے۔‘‘ لیکن وہ تجارتی مثال کے ذریعہ مڈجرنی کے لیے زیادہ کھلا ہے، اس بات کو نوٹ کرتے ہوئے۔ دی اکانومسٹ نے مڈجرنی گرافک چلایا جون میں اس کے سرورق پر۔

"ہم نے حال ہی میں لوگوں کو اسے تجارتی طور پر استعمال کرنے کی اجازت دی ہے،" ہولز نے کہا۔ "ایک طویل عرصے سے، یہ صرف غیر تجارتی تھا۔ اور اس طرح ہم جو کچھ کر رہے ہیں ان میں سے ایک یہ ہے کہ ہم صرف اسے دیکھ رہے ہیں، لوگ کیا کر رہے ہیں، اور ہم یہ فیصلہ کر سکتے ہیں کہ ہم اس میں سے کچھ کے ساتھ آرام دہ نہیں ہیں اور پھر ہم یہ کہتے ہوئے ایک اصول بنانے جا رہے ہیں کہ آپ اب اسے صرف ان چیزوں کے لیے استعمال نہیں کر سکتے۔

ہولز نے کہا کہ وہ دیکھتے ہیں کہ مڈجرنی جیسے AI ٹولز فنکاروں کو ہر ایک کو پیشہ ور آرٹسٹ بنانے کے بجائے اپنے کاموں میں بہتر بناتے ہیں۔ "ان ٹولز کا استعمال کرنے والا فنکار ان ٹولز کو استعمال کرنے والے ایک عام شخص سے ہمیشہ بہتر ہوتا ہے۔ کسی وقت، کیا ان ٹولز کو استعمال کرنے کا دباؤ ہو سکتا ہے کیونکہ آپ ایسی چیزیں بنا سکتے ہیں جو بہت اچھی ہیں؟ مجھے لگتا ہے کہ ہاں. لیکن ابھی، مجھے نہیں لگتا کہ یہ ابھی تک موجود ہے۔ لیکن اگلے دو سالوں میں یہ حیران کن حد تک بہتر ہو جائے گا۔

Midjourney اور DALL-E 2 نے اس بارے میں دیرینہ خدشات کی طرف زیادہ توجہ مبذول کرائی ہے کہ آیا کاپی رائٹ یا مخصوص لائسنس کے تحت کام سے بنائے گئے بڑے AI ماڈلز کو کاپی رائٹ قانون اور مواد کے تخلیق کاروں کے اپنے احساس کے ساتھ ملایا جا سکتا ہے کہ ان کے کام کے ساتھ کیسا سلوک کیا جانا چاہیے۔

امریکہ، مقدمہ کی سرزمین

مڈجرنی آؤٹ پٹ کے لحاظ سے، موجودہ امریکی فقہ AI سے تیار کردہ تصاویر کو کاپی رائٹ دینے کے امکان سے انکار کرتی ہے۔ فروری میں، یو ایس کاپی رائٹ آفس ریویو بورڈ کو مسترد کر دیا [PDF] کمپیوٹر سے تیار کردہ لینڈ اسکیپ کو کاپی رائٹ دینے کی دوسری درخواست جس کا عنوان ہے "جنت کا ایک حالیہ داخلہ" کیونکہ یہ انسانی تصنیف کے بغیر تخلیق کیا گیا تھا۔

ایک فون انٹرویو میں، سانتا کلارا یونیورسٹی کے شعبہ قانون کے پروفیسر ٹائلر اوچوا نے بتایا۔ رجسٹر, "امریکی کاپی رائٹ آفس نے کہا ہے کہ یہ [قابل قبول] ہے اگر کوئی فنکار کسی کام کو تخلیق کرنے میں ان کی مدد کے لیے AI کا استعمال کرتا ہے جب تک کہ اس میں کچھ انسانی تخلیقی صلاحیتیں شامل ہوں۔ اگر یہ صرف آپ متن ٹائپ کرتے ہیں، اور AI ایک کام تیار کرتا ہے، تو یہ واضح طور پر موجودہ قانون کے تحت کاپی رائٹ کے تحفظ سے مشروط نہیں ہے۔"

Midjourney کی سروس کی شرائط بیان کرتی ہیں کہ "آپ ان تمام اثاثوں کے مالک ہیں جو آپ سروسز کے ساتھ تخلیق کرتے ہیں،" لیکن کمپنی کو سروس کے ساتھ تخلیق کردہ مواد کو دوبارہ پیش کرنے کے لیے صارفین سے کاپی رائٹ لائسنس کی ضرورت ہوتی ہے - صارفین کی تصاویر کی میزبانی کے لیے ایک ضروری احتیاط، چاہے یہ مشکوک نظر آئے Midjourney تصاویر کو صرف ٹیکسٹ ان پٹ کے ذریعے بنانے میں پہنچانے یا نافذ کرنے کے لیے کاپی رائٹ ہیں۔

ہو سکتا ہے کہ ہمیشہ ایسا نہ ہو۔ اوچوا نے کہا کہ ان کا خیال ہے کہ اسٹیون تھیلر، جس نے "جنت کا ایک حالیہ داخلہ" تخلیق کیا، شاید کاپی رائٹ آفس کی جانب سے AI پر مبنی تصنیف کو مسترد کیے جانے کو عدالت میں چیلنج کرنا چاہیں، حالانکہ ابھی تک ایسا نہیں ہوا ہے۔

کاپی رائٹ مواد پر تربیت یافتہ AI ماڈلز سے ممکنہ کاپی رائٹ خدشات بھی ہیں۔ "سوال یہ ہے کہ آیا ان تصاویر کو تربیت اور AI کے لیے استعمال کرنا مناسب ہوگا یا نہیں،" اوچوا نے کہا۔ "اور مجھے لگتا ہے کہ اس تناظر میں منصفانہ استعمال کا معاملہ کافی مضبوط ہے۔"

مزید برآں، ان لوگوں کے لیے ممکنہ ذمہ داری ہے جو ایسی تصاویر تیار کرتے ہیں جو کافی حد تک موجودہ کاپی رائٹ مواد سے ملتی جلتی ہیں۔ "اگر آپ کا تربیتی سیٹ کافی بڑا نہیں ہے تو، AI جو کچھ باہر پھینکتا ہے وہ بہت ہی خوفناک نظر آسکتا ہے جیسا کہ اس نے کھایا،" Ochoa نے وضاحت کرتے ہوئے کہا کہ مسئلہ یہ ہے کہ آیا یہ کاپی رائٹ کی خلاف ورزی ہے۔ "بالواسطہ طور پر، مجھے لگتا ہے کہ یہ بہت امکان ہے."

جہاں تک مڈجرنی سے تیار کردہ اثاثے استعمال کرنے والے کلائنٹس کے لیے ممکنہ قانونی خطرے کا تعلق ہے، اوچوا نے کہا کہ ان کے خیال میں یہ کافی کم ہے۔ اگر AI ماڈل کی تربیت کاپی رائٹ کی خلاف ورزی کرتی ہے، تو یہ کلائنٹ کے ملوث ہونے سے پہلے کیا گیا تھا، اس نے وضاحت کی۔ "لہذا جب تک کلائنٹ کسی طرح سے AI کی تخلیق کو سپانسر نہیں کرتا، مجھے نہیں لگتا کہ [کلائنٹ] تربیتی سیٹ کی کسی بھی خلاف ورزی کا ذمہ دار ہوگا،" انہوں نے کہا۔ "اور یہ یہاں سب سے مضبوط دعویٰ ہے۔ لہذا مجھے لگتا ہے کہ کلائنٹ ان تصاویر کو استعمال کرنے میں کافی ٹھوس بنیاد پر ہیں، یہ فرض کرتے ہوئے کہ یہ اچھی طرح سے کیا گیا ہے۔

ہولز تسلیم کرتے ہیں کہ قانونی صورت حال میں وضاحت کا فقدان ہے۔

"اس وقت، قانون میں اس قسم کی چیز کے بارے میں واقعی کچھ نہیں ہے،" انہوں نے کہا۔ "میرے علم کے مطابق، ہر ایک بڑے AI ماڈل کو بنیادی طور پر انٹرنیٹ پر موجود چیزوں پر تربیت دی جاتی ہے۔ اور یہ ٹھیک ہے، ابھی۔ اس کے بارے میں کوئی خاص قانون نہیں ہے۔ شاید مستقبل میں، وہاں ہو جائے گا. لیکن یہ ایک ناول کے علاقے کی طرح ہے، جیسے GPL پروگرامنگ کوڈ کے ارد گرد ایک نئی قانونی چیز تھی۔ اور اسے واقعی کچھ بننے میں 20 یا 30 سال لگ گئے جس کا قانونی نظام معلوم کرنا شروع کر رہا ہے۔

ہولز نے کہا کہ ان کا خیال ہے کہ اس وقت یہ سمجھنا زیادہ اہم ہے کہ متعلقہ فریق اس ٹیکنالوجی کے بارے میں کیسا محسوس کرتے ہیں۔ "ہمارے پاس بہت سارے فنکار ہیں جو ہماری چیزیں استعمال کرتے ہیں، اور ہم ان کے ساتھ مسلسل جانچ کر رہے ہیں جیسے، 'کیا آپ اس کے بارے میں ٹھیک محسوس کرتے ہیں؟'" انہوں نے کہا۔

ہولز نے کہا کہ اگر جمود کے بارے میں کافی عدم اطمینان ہے تو، یہ مستقبل میں ان فنکاروں کے لئے ادائیگی کے کسی قسم کے ڈھانچے کے بارے میں سوچنے کے قابل ہو سکتا ہے جن کا کام تربیتی ماڈلز میں جاتا ہے۔ لیکن انہوں نے مشاہدہ کیا کہ شراکت کی حد کا اندازہ لگانا فی الحال مشکل ہے۔ "ابھی اس طرح کی کسی بھی چیز کے لئے چیلنج یہ ہے کہ یہ حقیقت میں واضح نہیں ہے کہ AI ماڈلز کو اچھی طرح سے کام کرنے کی وجہ کیا ہے،" انہوں نے کہا۔ "اگر میں وہاں ایک کتے کی تصویر لگاتا ہوں، تو یہ کتے کی تصویریں بنانے میں [AI ماڈل] کی کتنی مدد کرتا ہے۔ یہ حقیقت میں واضح نہیں ہے کہ ڈیٹا کے کون سے حصے دراصل [ماڈل] کو کیا صلاحیتیں دے رہے ہیں۔

یہ پوچھے جانے پر کہ مڈجرنی کو اس کی مخصوص جمالیاتی چیز کیا دیتی ہے، ہولز نے کہا کہ وہ واقعی اس کا موازنہ نہیں کر سکتے کہ مڈجرنی DALL-E 2 سے کیا کر رہا ہے، لیکن یہ کہ عام طور پر AI محققین اس چیز کو حاصل کرنے کا رجحان رکھتے ہیں جس کے لیے وہ بہتر بناتے ہیں۔ اگر وہ لفظ "کتے" میں ڈالتے ہیں تو وہ شاید کتے کی تصویر چاہتے ہیں۔

"ہمارے لئے، ہم اس وقت تھے جب ہم اسے بہتر بنا رہے تھے، ہم چاہتے تھے کہ یہ خوبصورت نظر آئے، اور خوبصورت کا مطلب حقیقت پسندانہ ہونا ضروری نہیں ہے۔ … اگر کچھ بھی ہے تو، اصل میں ہم تصاویر سے تھوڑا سا دور تعصب کرتے ہیں۔ … میں جانتا ہوں کہ اس ٹیکنالوجی کو ایک گہری جعلی سپر مشین کے طور پر استعمال کیا جا سکتا ہے۔ اور مجھے نہیں لگتا کہ دنیا کو مزید جعلی تصاویر کی ضرورت ہے۔ میں واقعی میں دنیا میں جعلی تصاویر کا ذریعہ نہیں بننا چاہتا۔"

"میں اصل میں ایک قسم کی بے چینی محسوس کرتا ہوں اگر ہماری چیزیں کچھ ایسی بناتی ہیں جو تصویر کی طرح نظر آتی ہے۔ اور یہ کہنے کا مطلب یہ نہیں ہے کہ ہم لوگوں کو ایسی چیزیں بنانے نہیں دیں گے جو زیادہ حقیقت پسند ہوں۔ ایسی چیزوں کو زیادہ حقیقت پسندانہ بنانے کی کوشش کرنے کے لیے استعمال کے جائز معاملات ہیں۔ تاہم، میں سختی سے محسوس کرتا ہوں کہ، ڈیفالٹ کے طور پر، جب کوئی ہمارا سسٹم استعمال کرتا ہے، تو اسے جعلی تصویر نہیں بنانا چاہیے۔"

لیکن مجھے لگتا ہے کہ دنیا کو مزید خوبصورتی کی ضرورت ہے۔ بنیادی طور پر، اگر میں کوئی ایسی چیز تخلیق کرتا ہوں جو لوگوں کو خوبصورت چیزیں بنانے کی اجازت دیتا ہے، اور دنیا میں اور بھی خوبصورت چیزیں ہیں، تو میں ڈیفالٹ کے طور پر یہی چاہتا ہوں۔" ®

ٹائم اسٹیمپ:

سے زیادہ رجسٹر