میٹا ویکیپیڈیا کو فیکٹ چیک کرنے کے لیے ایک AI بنا رہا ہے—تمام 6.5 ملین آرٹیکلز PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

میٹا فیکٹ چیک ویکیپیڈیا کے لیے ایک AI بنا رہا ہے—تمام 6.5 ملین مضامین

تصویر

30 سال سے زیادہ عمر کے زیادہ تر لوگوں کو پرانے زمانے کے اچھے انسائیکلوپیڈیا کے ساتھ تحقیق کرنا شاید یاد ہے۔ آپ شیلف سے بھاری حجم نکالیں گے، اپنی دلچسپی کے موضوع کے لیے اشاریہ چیک کریں، پھر مناسب صفحہ پر پلٹیں اور پڑھنا شروع کریں۔ یہ اتنا آسان نہیں تھا جتنا کہ گوگل سرچ بار میں چند الفاظ ٹائپ کرنا، لیکن پلس سائیڈ پر، آپ کو معلوم تھا کہ جو معلومات آپ کو گوگل سرچ بار میں ملتی ہیں۔ برٹینیکا یا ورلڈ بک درست اور درست تھا.

آج انٹرنیٹ کی تحقیق کے ساتھ ایسا نہیں ہے۔ ذرائع کا بہت بڑا ہجوم کافی الجھا ہوا تھا، لیکن غلط معلومات کے پھیلاؤ کو شامل کریں اور یہ حیرت کی بات ہے کہ ہم میں سے کوئی بھی اس لفظ پر یقین کرتا ہے جسے ہم آن لائن پڑھتے ہیں۔

ویکیپیڈیا ایک معاملہ ہے۔ 2020 کے اوائل تک، سائٹ کا انگریزی ورژن تقریباً اوسط تھا۔ ملین 255 فی دن صفحہ کے ملاحظات، یہ انٹرنیٹ پر آٹھویں سب سے زیادہ دیکھی جانے والی ویب سائٹ ہے۔ پچھلے مہینے تک، یہ جگہ پر چلا گیا تھا۔ نمبر سات، اور انگریزی ورژن فی الحال ختم ہوچکا ہے۔ ملین 6.5 مضامین.

لیکن معلومات کا یہ ذریعہ جتنا زیادہ ٹریفک ہو، اس کی درستگی مطلوبہ چیز کو چھوڑ دیتی ہے۔ دی صفحہ سائٹ کی خود اعتمادی کے بارے میں کہا گیا ہے، "آن لائن انسائیکلوپیڈیا خود کو بطور ذریعہ قابل اعتماد نہیں سمجھتا اور قارئین کو اسے علمی یا تحقیقی ترتیبات میں استعمال کرنے کی حوصلہ شکنی کرتا ہے۔"

سابقہ ​​فیس بک کا میٹا اسے تبدیل کرنا چاہتا ہے۔ ایک ___ میں بلاگ پوسٹ پچھلے مہینے شائع ہوا، کمپنی کے ملازمین بیان کرتے ہیں کہ کس طرح AI ویکیپیڈیا کو مزید درست بنانے میں مدد کر سکتا ہے۔

اگرچہ دسیوں ہزار لوگ سائٹ کی تدوین میں حصہ لیتے ہیں، لیکن وہ جو حقائق شامل کرتے ہیں وہ ضروری نہیں کہ درست ہوں۔ یہاں تک کہ جب اقتباسات موجود ہوں، وہ ہمیشہ درست نہیں ہوتے اور نہ ہی متعلقہ۔

میٹا ایک مشین لرننگ ماڈل تیار کر رہا ہے جو ان اقتباسات کو اسکین کرتا ہے اور ان کے مواد کو ویکیپیڈیا کے مضامین میں کراس ریفرنس دیتا ہے تاکہ اس بات کی تصدیق کی جا سکے کہ نہ صرف عنوانات ہیں بلکہ مخصوص اعداد و شمار بھی درست ہیں۔

یہ صرف نمبروں کو چننے اور یہ یقینی بنانے کا معاملہ نہیں ہے کہ وہ مماثل ہیں۔ Meta's AI کو حوالہ کردہ ذرائع کے مواد کو "سمجھنے" کی ضرورت ہوگی (حالانکہ "سمجھنا" ایک غلط نام ہے، جیسا کہ پیچیدگی تھیوری کی محقق میلانی مچل آپ کو بتائے گاکیونکہ AI ابھی بھی "تنگ" مرحلے میں ہے، یعنی یہ انتہائی نفیس پیٹرن کی شناخت کے لیے ایک ٹول ہے، جبکہ "سمجھنا" ایک ایسا لفظ ہے جو انسانی ادراک کے لیے استعمال ہوتا ہے، جو کہ اب بھی ایک بہت مختلف چیز ہے)۔

میٹا کا ماڈل متن کے تاروں کا موازنہ کرکے اور اس بات کو یقینی بنا کر نہیں کہ ان میں ایک جیسے الفاظ ہوں، بلکہ متن کے بلاکس کی ریاضیاتی نمائندگیوں کا موازنہ کرکے مواد کو "سمجھ" جائے گا، جو کہ قدرتی زبان کی سمجھ (NLU) تکنیک کا استعمال کرتے ہوئے پہنچتا ہے۔

"ہم نے جو کچھ کیا ہے وہ یہ ہے کہ ان تمام ویب پیجز کو حصّوں میں جوڑ کر اور ہر حوالے کے لیے ایک درست نمائندگی فراہم کر کے ان کا ایک اشاریہ تیار کیا جائے،" Fabio Petroni، Meta's Fundamental AI Research ٹیک کے لیڈ مینیجر، بتایا ڈیجیٹل رجحانات. "یہ لفظ بہ لفظ گزرنے کی نمائندگی نہیں کر رہا ہے، بلکہ گزرنے کے معنی کو ظاہر کرتا ہے۔ اس کا مطلب یہ ہے کہ متن کے دو ٹکڑوں کو ملتے جلتے معنی کے ساتھ ایک بہت ہی قریبی پوزیشن میں نتیجے میں n-dimensional اسپیس میں دکھایا جائے گا جہاں یہ تمام حصئوں کو محفوظ کیا جاتا ہے۔

AI کو چالیس لاکھ ویکیپیڈیا حوالوں کے سیٹ پر تربیت دی جا رہی ہے، اور سائٹ پر ناقص اقتباسات کو چننے کے علاوہ، اس کے تخلیق کار یہ چاہیں گے کہ آخر کار یہ ڈیٹا کے ایک بڑے انڈیکس سے نکال کر ان کی جگہ لینے کے لیے درست ذرائع تجویز کر سکے۔ مسلسل اپ ڈیٹ.

ایک بڑا مسئلہ جس پر کام کرنا باقی ہے وہ ذرائع کی وشوسنییتا کے لیے درجہ بندی کے نظام میں کام کرنا ہے۔ مثال کے طور پر، سائنسی جریدے کا ایک مقالہ بلاگ پوسٹ کے مقابلے میں اعلیٰ درجہ حاصل کرے گا۔ آن لائن مواد کی مقدار اتنی وسیع اور متنوع ہے کہ آپ کسی بھی دعوے کی حمایت کرنے کے لیے "ذرائع" تلاش کر سکتے ہیں، لیکن غلط معلومات کو غلط معلومات سے پارس کرنا (پہلے کا مطلب غلط ہے، جبکہ مؤخر الذکر کا مطلب جان بوجھ کر دھوکہ دینا)، اور ہم مرتبہ جائزہ لیا گیا نان پیئر ریویو سے، عجلت میں تھپڑ مار کر حقائق کی جانچ پڑتال، کوئی چھوٹا کام نہیں ہے- لیکن جب اعتماد کی بات آتی ہے تو یہ بہت اہم ہے۔

میٹا نے اپنے ماڈل کو اوپن سورس کیا ہے، اور جو لوگ شوقین ہیں وہ دیکھ سکتے ہیں۔ ڈیمو تصدیقی ٹول کا۔ میٹا کی بلاگ پوسٹ نے نوٹ کیا کہ کمپنی اس پروجیکٹ پر Wikimedia کے ساتھ شراکت نہیں کر رہی ہے، اور یہ کہ یہ ابھی تحقیق کے مرحلے میں ہے اور فی الحال ویکیپیڈیا پر مواد کو اپ ڈیٹ کرنے کے لیے استعمال نہیں کیا جا رہا ہے۔

اگر آپ ایسے مستقبل کا تصور کرتے ہیں جہاں آپ ویکیپیڈیا پر جو کچھ بھی پڑھتے ہیں وہ درست اور قابل اعتماد ہے، تو کیا یہ کسی بھی قسم کی تحقیق کو قدرے آسان نہیں بنا دے گا؟ خود مختلف ذرائع کو چیک کرنے اور ان کا موازنہ کرنے کے بارے میں کوئی قیمتی چیز ہے، کیا ایسا نہیں ہے؟ بھاری کتابوں کے صفحہ بندی سے لے کر سرچ انجن میں چند الفاظ ٹائپ کرنا اور "Enter" کو مارنا ایک بڑی چھلانگ تھی۔ کیا ہم واقعی چاہتے ہیں کہ ویکیپیڈیا ریسرچ جمپنگ آف پوائنٹ سے آخری لفظ کے ماخذ کی طرف جائے؟

کسی بھی صورت میں، Meta کی AI ریسرچ ٹیم آن لائن انسائیکلوپیڈیا کو بہتر بنانے کے لیے ایک ٹول کی طرف کام جاری رکھے گی۔ "مجھے لگتا ہے کہ ہم دن کے اختتام پر تجسس سے متاثر تھے،" پیٹرونی نے کہا. "ہم یہ دیکھنا چاہتے تھے کہ اس ٹیکنالوجی کی حد کیا ہے۔ ہمیں قطعی طور پر یقین نہیں تھا کہ آیا [یہ AI] اس تناظر میں کوئی معنی خیز کام کر سکتا ہے۔ کسی نے بھی ایسا کرنے کی کوشش نہیں کی تھی۔‘‘

تصویری کریڈٹ: Gerd Altmann سے Pixabay

ٹائم اسٹیمپ:

سے زیادہ یکسانیت مرکز