ایل ایل ایم کاپی رائٹ کے قوانین پر ٹیک جنات نے سوالات پوچھے۔

ایل ایل ایم کاپی رائٹ کے قوانین پر ٹیک جنات نے سوالات پوچھے۔

ایل ایل ایم کاپی رائٹ رولز پلیٹو بلاکچین ڈیٹا انٹیلی جنس پر ٹیک جنات نے سوالات پوچھے۔ عمودی تلاش۔ عی

اس ہفتے برطانیہ کی پارلیمنٹ میں، مائیکروسافٹ اور میٹا نے یہ سوال اٹھایا کہ کیا تخلیق کاروں کو اس وقت ادائیگی کی جانی چاہیے جب ان کے کاپی رائٹ والے مواد کو بڑی زبان کے ماڈلز کی تربیت کے لیے استعمال کیا جائے۔

200 بلین ڈالر سے زیادہ کی مجموعی آمدنی کے ساتھ، ٹیک ٹائٹنز ہو رہے تھے۔ گری ہوئی ہاؤس آف لارڈز کمیونیکیشنز اور ڈیجیٹل کمیٹی کی طرف سے جب کاپی رائٹ کا سوال توجہ میں آیا۔

ستمبر میں، مصنفین کی تنظیم، شائع شدہ مصنفین کے لیے ایک تجارتی انجمن، اور 17 مصنفین کلاس ایکشن مقدمہ دائر کیا US میں OpenAI کی طرف سے LLM پر مبنی خدمات بنانے کے لیے ان کے مواد کے استعمال پر۔

OpenAI کے سی ای او سیم آلٹمین نے تب سے کہا ہے کہ کمپنی اپنے تربیتی سیٹوں سے مواد کو ہٹانے کے بجائے کاپی رائٹ کی خلاف ورزی کے سوٹ کے لیے اپنے کلائنٹس کے قانونی اخراجات کو پورا کرے گی۔

مائیکروسافٹ ہے سرمایہ کاری کی اوپن اے آئی میں $13 بلین۔ اس کی مشین لرننگ ڈویلپر کے ساتھ ایک توسیعی شراکت داری ہے، جو Azure کلاؤڈ پلیٹ فارم پر اپنے کام کے بوجھ کو طاقت دیتا ہے اور Copilot آٹومیٹڈ اسسٹنٹ کو چلانے کے لیے اس کے ماڈلز کا استعمال کرتا ہے۔

کل لارڈز سے بات کرتے ہوئے، مائیکروسافٹ کے آفس آف ریسپانسبل اے آئی میں پبلک پالیسی کے ڈائریکٹر اوون لارٹر نے کہا: "اس بات کی تعریف کرنا ضروری ہے کہ زبان کا ایک بڑا ماڈل کیا ہے۔ یہ متنی اعداد و شمار پر تربیت یافتہ ایک بڑا ماڈل ہے، جو مختلف خیالات کے درمیان تعلق کو سیکھتا ہے۔ یہ ضروری نہیں کہ نیچے سے کچھ بھی چوس رہا ہو۔‘‘

انہوں نے کہا کہ کاپی رائٹ والے مواد کے لیے کچھ تحفظ فراہم کرنے کے لیے ایک "فریم ورک" ہونا چاہیے اور مائیکروسافٹ اپنے LLM پر مبنی سسٹمز کے ذریعے کسی بھی خلاف ورزی کی ذمہ داری قبول کرے گا۔ لیکن انہوں نے یہ بھی کہا کہ مائیکروسافٹ حالیہ کی حمایت کرتا ہے۔ ویلنس رپورٹ UK میں "پرو انوویشن" AI قانون میں شامل ہے جو تربیتی ماڈلز میں متن اور ڈیٹا کی استثنیٰ کی وکالت کرتا ہے۔

لیکن ڈونلڈ مائیکل، لارڈ فوسٹر آف باتھ نے لارٹر پر دباؤ ڈالا کہ آیا وہ یہ قبول کریں گے کہ اگر کوئی کمپنی منافع کے لیے ایل ایل ایم بنانے کے لیے کاپی رائٹ شدہ مواد استعمال کرتی ہے، تو کاپی رائٹ کے مالک کو معاوضہ ادا کرنا چاہیے۔

مائیکروسافٹ کے ڈائریکٹر نے کہا: "یہ سمجھنا واقعی اہم ہے کہ آپ کو ان بڑے لینگویج ماڈلز کو بڑے ڈیٹا سیٹس پر تربیت دینے کی ضرورت ہے اگر آپ ان کو مؤثر طریقے سے انجام دینے کے لیے جا رہے ہیں، اگر آپ انہیں محفوظ اور محفوظ رہنے کی اجازت دینے جا رہے ہیں … مقابلے کے کچھ مسائل بھی ہیں [یقینی بنانے میں] کہ بڑے ماڈلز کی تربیت ہر ایک کے لیے دستیاب ہے۔ اگر آپ کسی ایسے راستے سے بہت نیچے چلے جاتے ہیں جہاں ماڈلز کو تربیت دینے کے لیے ڈیٹا حاصل کرنا بہت مشکل ہے، تو اچانک، ایسا کرنے کی صلاحیت صرف بہت بڑی کمپنیوں کے پاس ہوگی۔"

قانونی چارہ جوئی پہلے ہی جاری ہے۔ تربیتی ڈیٹا سیٹ کرنے کے طریقے کو حل کرنے کے لیے کتابیں 1, Books2، اور Books3، جو کاپی رائٹ والے مواد کو مؤثر طریقے سے پائریٹ کرتے ہیں، مقبول LLMs بنانے میں مدد کے لیے استعمال کیے گئے ہیں۔

میٹا کے پیچھے ہے۔ لاما 2 ایل ایل ایم، جو 70 بلین پیرامیٹرز تک پیمانہ ہے۔ سوشل میڈیا دیو نے ماڈل کو اوپن سورس کے طور پر فروغ دیا ہے، حالانکہ FOSS پیوریسٹ اس کے نقطہ نظر میں کچھ انتباہات کی طرف اشارہ کرتے ہیں۔

لارڈز سے بات کرتے ہوئے، میٹا میں پالیسی کے نائب صدر اور ڈپٹی چیف پرائیویسی آفیسر روب شرمین نے کہا کہ کمپنی قانون کی تعمیل کرے گی۔

لیکن انہوں نے مزید کہا کہ "انٹرنیٹ پر معلومات تک وسیع رسائی کو برقرار رکھنا اور اس طرح کی جدت طرازی میں استعمال سمیت معلومات بہت اہم ہے۔ میں حقوق کے حاملین کو یہ انتظام کرنے کی اہلیت دینے کی حمایت کرتا ہوں کہ ان کی معلومات کو کس طرح استعمال کیا جاتا ہے۔

"میں ان کمپنیوں کو مجبور کرنے کے خیال کے بارے میں تھوڑا سا محتاط ہوں جو AI بنا رہی ہیں انفرادی حقوق کے حاملین کے ساتھ پہلے سے طے شدہ معاہدے کرنے کے لئے یا کسی ایسے مواد کی ادائیگی کے آرڈر کے بارے میں جو ان کے لئے معاشی اہمیت نہیں رکھتی ہے۔"

پچھلے ہفتے، برطانیہ کی پبلشرز ایسوسی ایشن کے سی ای او، ڈین کونوے نے کمیٹی کو بتایا کہ بڑے زبان کے ماڈلز کاپی رائٹ والے مواد کی خلاف ورزی کر رہے ہیں "بالکل بڑے پیمانے پر۔"

انہوں نے کہا کہ "ہمیں اشاعتی صنعت میں یہ Books3 ڈیٹابیس کی وجہ سے معلوم ہے جس میں 120,000 پائریٹڈ کتابوں کے عنوانات درج ہیں، جنہیں ہم جانتے ہیں کہ بڑے زبان کے ماڈلز کے ذریعے استعمال کیے گئے ہیں۔" "ہم جانتے ہیں کہ بڑے زبان کے ماڈلز کے ذریعہ مواد کو بالکل بڑے پیمانے پر کھایا جا رہا ہے۔ LLMs عمل کے متعدد حصوں میں کاپی رائٹ کی خلاف ورزی کرتے ہیں اس لحاظ سے کہ وہ اس معلومات کو کب جمع کرتے ہیں، وہ اس معلومات کو کیسے ذخیرہ کرتے ہیں، اور وہ اسے کیسے ہینڈل کرتے ہیں۔ کاپی رائٹ قانون کو بڑے پیمانے پر توڑا جا رہا ہے۔

اسی سماعت میں، برونیل یونیورسٹی لندن میں دانشورانہ املاک کے قانون کی ریڈر ڈاکٹر ہیلی بوشر نے کہا کہ وہ ٹیک فرموں یا مواد تخلیق کاروں کی نمائندگی نہیں کرتی ہیں اور غیر جانبدارانہ نقطہ نظر پیش کرتی ہیں۔

"آپ کو کب لائسنس کی ضرورت ہے اور کب آپ کو نہیں ہے اس کا اصول واضح ہے،" انہوں نے کہا، "اور کاپی رائٹ سے محفوظ کام کی اجازت کے بغیر دوبارہ تخلیق کرنے کے لیے لائسنس کی ضرورت ہوگی یا دوسری صورت میں خلاف ورزی ہوگی۔ AI عمل کے مختلف مراحل پر یہی کرتا ہے: ادخال، پروگرام کو چلانا، اور ممکنہ طور پر آؤٹ پٹ بھی۔

"کچھ AI اور ٹیک ڈویلپرز قانون کی مختلف تشریح پر بحث کر رہے ہیں۔ میں ان دونوں فریقوں کی نمائندگی نہیں کرتا۔ میں کاپی رائٹ کا ماہر ہوں، اور میری حیثیت سے، یہ سمجھنے کے لیے کہ کاپی رائٹ کو کیا حاصل کرنا ہے اور یہ اسے کیسے حاصل کرتا ہے، آپ کو اس سرگرمی کے لیے لائسنس کی ضرورت ہوگی۔" ®

ٹائم اسٹیمپ:

سے زیادہ رجسٹر