میڈیم کو امید ہے کہ وہ AI بوٹ کرالر کو مواد کو سکریپ کرنے سے روکے گا۔

میڈیم کو امید ہے کہ وہ AI بوٹ کرالر کو مواد کو سکریپ کرنے سے روکے گا۔

میڈیم کو امید ہے کہ وہ AI بوٹ کرالر کو پلیٹو بلاکچین ڈیٹا انٹیلیجنس مواد کو سکریپ کرنے سے روکے گا۔ عمودی تلاش۔ عی

بلاگنگ پلیٹ فارم میڈیم چاہے گا کہ تنظیمیں AI ماڈلز کو تربیت دینے کی اجازت کے بغیر اپنے مضامین کو ختم نہ کریں، اور خبردار کیا کہ اس پالیسی کو نافذ کرنا مشکل ہو سکتا ہے۔

سی ای او ٹونی اسٹبل بائن نے جمعرات کو وضاحت کی کہ میڈیم کس طرح نیورل نیٹ ورکس کے لیے تربیتی ڈیٹا سیٹ بنانے کے خواہاں ڈویلپرز کے ذریعے لوگوں کے تحریری کام کی کٹائی کو روکنے کا ارادہ رکھتا ہے۔ انہوں نے کہا، سب سے بڑھ کر، devs کو لوگوں کے نثر پر بڑے زبان کے ماڈلز کی تربیت کے لیے رضامندی طلب کرنی چاہیے – اور ادیبوں کو کریڈٹ اور معاوضے کی پیشکش کرنی چاہیے۔

وہ AI ماڈل ان لکھاریوں کو ختم کر سکتے ہیں جن پر انہیں تربیت دی گئی تھی، جو کچھ لوگوں کے لیے ایک دہری ناانصافی کی طرح محسوس ہوتی ہے: پہلے لکھنے والوں کو معاوضہ نہیں دیا جاتا تھا، اور اب ماڈلز ان کی جگہ لینے کے ساتھ ساتھ ان سے حاصل ہونے والی آمدنی کی دھمکی دے رہے ہیں۔ کام.

"اسٹیٹس کو کا ایک دو ٹوک خلاصہ دینے کے لئے: AI کمپنیوں نے انٹرنیٹ کے قارئین کو سپیم کرنے کے لئے مصنفین سے قیمت چھین لی ہے۔" لکھا ہے ایک بلاگ پوسٹ میں. "میڈیم اے آئی کی تربیت سے متعلق ہماری پالیسی کو تبدیل کر رہا ہے۔ پہلے سے طے شدہ جواب اب ہے: نہیں۔

میڈیم نے اس طرح اپنی ویب سائٹس کو اپ ڈیٹ کیا ہے' کی robots.txt OpenAI کے ویب کرالر بوٹ سے پوچھنے کے لیے فائل جی پی ٹی بوٹ اس کے صفحات سے مواد کاپی نہ کرنا۔ دیگر پبلشرز - جیسے CNN، رائٹرز، شکاگو ٹریبیون، اور نیویارک ٹائمز - پہلے ہی یہ کام کر چکے ہیں۔

Stubblebine نے اسے AI پر ایک "سافٹ بلاک" کہا: یہ GPTBot پر انحصار کرتا ہے کہ وہ robots.txt میں میڈیم کے صفحات تک رسائی حاصل نہ کرے اور مواد کو اٹھائے۔ لیکن دوسرے کرالر اسے نظر انداز کر سکتے ہیں اور کر سکتے ہیں۔ میڈیم ان کرالروں کو robots.txt کے ذریعے بلاک کرنے کا راستہ فراہم کرنے کا انتظار کر سکتا ہے، اور اس کے مطابق اس کی فائل کو اپ ڈیٹ کر سکتا ہے، لیکن یہ ایسی صورتحال کی ضمانت نہیں ہے۔

اس کی قیمت کیا ہے، تاہم، نہ صرف OpenAI کرتا ہے۔ حمایت robots.txt کے ذریعے بلاک کرنا، اسی طرح گوگل بھی کرتا ہے، جو جمعرات کو بھی تفصیلی بارڈ اور ورٹیکس جنریٹیو API سروسز کے لیے اس کے AI ٹریننگ کرالر کو دوبارہ کیسے بلاک کیا جائے۔ robots.txt کے ذریعے. میڈیم نے ابھی تک اپنی robots.txt کو اپ ڈیٹ کرنا ہے تاکہ گوگل کے AI ٹریننگ مکڑیوں کو خارج کیا جا سکے۔

ویب کرالر کو robots.txt سے کم سطح پر مسدود کرنا، جیسے کہ IP ایڈریس یا صارف ایجنٹ سٹرنگ، بھی کام کرے گا – جب تک کہ بوٹس نئے IP پتے حاصل نہ کر لیں یا اپنے صارف ایجنٹ کے تاروں کو تبدیل نہ کریں۔ یہ ویک-اے-مول کا کھیل ہے جسے کھیلنا بہت مشکل ہو سکتا ہے۔

"بدقسمتی سے، robots.txt بلاک بڑے طریقوں سے محدود ہے،" Stubblebine نے کہا۔ "جہاں تک ہم بتا سکتے ہیں، OpenAI واحد کمپنی ہے جو مکڑی کو روکنے کا طریقہ فراہم کرتی ہے جو وہ تربیت کے لیے مواد تلاش کرنے کے لیے استعمال کرتی ہے۔ ہمیں نہیں لگتا کہ ہم OpenAI کے علاوہ دیگر کمپنیوں کو بالکل بلاک کر سکتے ہیں۔

اس کا مطلب ہے کہ کم از کم OpenAI، اور اب گوگل نے robots.txt کا مشاہدہ کرنے کا وعدہ کیا ہے۔ مشین لرننگ ٹریننگ کے لیے ڈیٹا اکٹھا کرنے والے دوسرے ادارے شاید اسے نظر انداز کر دیں۔

یہ سب کچھ کہتا ہے، قطع نظر robots.txt تحفظات سے، میڈیم نے ماڈلز کو تربیت دینے کے لیے مضامین کی اجازت کے بغیر اپنے صفحات کو رینگنے والوں کو بند اور باز رہنے والے خطوط بھیجنے کا وعدہ کیا ہے۔

لہذا، مؤثر طریقے سے: میڈیم نے OpenAI کے کرالر سے کہا ہے کہ وہ اسے اکیلا چھوڑ دے، کم از کم، اور ویب سائٹ دوسرے ڈیٹا سیٹ کرالر کو قانونی دھمکیوں کے ذریعے کام پر لے جائے گی اگر وہ پیچھے نہیں ہٹتے ہیں۔ ویب سائٹ کی سروس کی شرائط ہمیں بتایا گیا ہے کہ میڈیم کی رضامندی کے بغیر مضامین کو کھرچنے کے لیے مکڑیوں اور دوسرے کرالرز کے استعمال کو منع کرنے کے لیے اپ ڈیٹ کیا گیا تھا۔

اسٹبل بائن نے پلیٹ فارم پر لکھنے والوں کو یہ بھی خبردار کیا کہ یہ واضح نہیں ہے کہ آیا کاپی رائٹ کا قانون ان کمپنیوں کو ان کے کام پر ماڈلز کی تربیت دینے اور ان ماڈلز کو ایک جیسا یا تقریباً ایک جیسا مواد تیار کرنے کے لیے استعمال کرنے سے بچا سکتا ہے، اس پوری چیز میں متعدد جاری مقدمات کے درمیان۔ 

سی ای او نے میڈیم صارفین کو یہ بھی یاد دلایا کہ کوئی بھی اجازت کے بغیر سائٹ پر اپنے کام کی کاپیاں دوبارہ فروخت نہیں کر سکتا۔ اسٹبل بائن نے لکھا، "میڈیم کہانیوں کے پہلے سے طے شدہ لائسنس میں، آپ کو اپنا کام بیچنے کا خصوصی حق حاصل ہے۔

انہوں نے مزید کہا کہ کچھ AI ڈویلپرز نے شاید ایسا ہی کیا ہو گا: مضامین اور دیگر کاموں کی کاپیاں خریدیں یا حاصل کیں جنہیں میڈیم اور انٹرنیٹ کے دوسرے حصوں کو تھرڈ پارٹی ری سیلرز نے ختم کیا، تاکہ اس مواد پر نیٹ ورکس کو تربیت دیں۔ اس نے لوگوں کے کاپی رائٹ والے مواد کی لانڈرنگ کو "ناقابل یقین دلیری کا ایک عمل" قرار دیا۔

Stubblebine نے میڈیم سے ویب ڈیٹا کرال کرنے کے خواہاں کمپنیوں کو مشورہ دیا کہ وہ دیگر اسٹیکنگ پوائنٹس کے درمیان کریڈٹ اور معاوضے پر بات کرنے کے لیے سائٹ سے رابطہ کریں۔ "میں یہ کہہ رہا ہوں کیونکہ ہمارا آخری مقصد AI کی ترقی کو روکنا نہیں ہے۔ ہم فی الحال AI ٹریننگ سیٹس میں سے تمام میڈیم کا انتخاب کر رہے ہیں۔ لیکن ہم مکمل طور پر توقع کرتے ہیں کہ جب یہ پروٹوکول قائم ہو جائیں گے تو واپس آپٹ ان کریں گے،‘‘ انہوں نے مزید کہا۔

میڈیم نے تجویز پیش کی کہ اگر کوئی AI بنانے والا سکریپ شدہ متن کے لیے معاوضہ پیش کرے تو بلاگنگ بِز اس کا 100 فیصد اپنے مصنفین کو دے گا۔

جولائی میں، اس نے یہ بھی تصدیق کی کہ اگرچہ AI سے تیار کردہ پوسٹس پر مکمل پابندی نہیں ہے، لیکن یہ مشینوں کے ذریعے مکمل طور پر لکھے گئے کسی متن کی سفارش نہیں کرے گی۔

"میڈیم مکمل طور پر AI سے تیار کردہ کہانیوں کے لیے جگہ نہیں ہے، اور 100 فیصد AI سے تیار کردہ کہانیاں مصنف کے ذاتی نیٹ ورک سے باہر تقسیم کے لیے اہل نہیں ہوں گی۔" نے کہا. ۔

ٹائم اسٹیمپ:

سے زیادہ رجسٹر