تقوم Meta ببناء ذكاء اصطناعي للتحقق من صحة ويكيبيديا - جميع المقالات البالغ عددها 6.5 مليون مقال ، ذكاء بيانات PlatoBlockchain. البحث العمودي. عاي.

تقوم Meta ببناء ذكاء اصطناعي للتحقق من صحة ويكيبيديا - جميع المقالات البالغ عددها 6.5 مليون مقال

صورة

ربما يتذكر معظم الأشخاص الذين تزيد أعمارهم عن 30 عامًا إجراء أبحاث باستخدام موسوعات جيدة من الطراز القديم. ستسحب حجمًا كبيرًا من الرف ، وتحقق من الفهرس بحثًا عن موضوع اهتمامك ، ثم اقلب إلى الصفحة المناسبة وابدأ القراءة. لم يكن الأمر سهلاً مثل كتابة بضع كلمات في شريط بحث Google ، ولكن على الجانب الإيجابي ، كنت تعلم أن المعلومات التي عثرت عليها في صفحات الموسوعة البريطانية "بريتانيكا" أو ال كتاب العالم كانت دقيقة وصحيحة.

ليس الأمر كذلك مع البحث على الإنترنت اليوم. كان العدد الهائل من المصادر مربكًا بدرجة كافية ، لكن أضف انتشار المعلومات المضللة ومن المدهش أن أي منا يصدق كلمة نقرأها على الإنترنت.

ويكيبيديا مثال على ذلك. اعتبارًا من أوائل عام 2020 ، كان متوسط ​​إصدار الموقع باللغة الإنجليزية 255 مليون عدد مرات مشاهدة الصفحة يوميًا ، مما يجعله الموقع الثامن الأكثر زيارة على الإنترنت. اعتبارًا من الشهر الماضي ، انتقلت إلى الموقع الرقم سبعة، والنسخة الإنجليزية بها أكثر من 6.5 مليون المقالات.

ولكن بقدر ما قد يكون مصدر معلومات الانتقال هذا عالي الحركة ، فإن دقته تترك شيئًا مطلوبًا ؛ ال صفحة حول مصداقية الموقع ، "لا تعتبر الموسوعة عبر الإنترنت نفسها موثوقة كمصدر ولا تشجع القراء على استخدامها في الأوساط الأكاديمية أو البحثية."

تريد Meta - من Facebook السابق - تغيير هذا. في بلوق وظيفة نشر الشهر الماضي ، يصف موظفو الشركة كيف يمكن للذكاء الاصطناعي أن يساعد في جعل ويكيبيديا أكثر دقة.

على الرغم من مشاركة عشرات الآلاف من الأشخاص في تحرير الموقع ، إلا أن الحقائق التي يضيفونها ليست صحيحة بالضرورة ؛ حتى في حالة وجود الاستشهادات ، فهي ليست دقيقة دائمًا ولا حتى ذات صلة.

تقوم Meta بتطوير نموذج للتعلم الآلي يقوم بمسح هذه الاقتباسات وإحالة محتواها إلى مقالات Wikipedia للتحقق من أن الموضوعات ليست فقط في نصابها ، ولكن الأرقام المحددة التي تم الاستشهاد بها دقيقة.

هذه ليست مجرد مسألة انتقاء الأرقام والتأكد من تطابقها ؛ سيحتاج الذكاء الاصطناعي في Meta إلى "فهم" محتوى المصادر التي تم الاستشهاد بها (على الرغم من أن "فهم" تسمية خاطئة ، مثل باحثة نظرية التعقيد ميلاني ميتشل سوف أخبرك، لأن الذكاء الاصطناعي لا يزال في المرحلة "الضيقة" ، مما يعني أنه أداة للتعرف على الأنماط المعقدة للغاية ، بينما "الفهم" هي كلمة تستخدم للإدراك البشري ، والتي لا تزال شيئًا مختلفًا تمامًا).

سوف "يفهم" نموذج Meta المحتوى ليس من خلال مقارنة سلاسل النص والتأكد من احتوائها على نفس الكلمات ، ولكن عن طريق مقارنة التمثيلات الرياضية لمجموعات النص ، والتي تصل إلى استخدام تقنيات فهم اللغة الطبيعية (NLU).

"ما فعلناه هو إنشاء فهرس لجميع صفحات الويب هذه عن طريق تقسيمها إلى مقاطع وتقديم تمثيل دقيق لكل مقطع" ، هذا ما قاله فابيو بتروني ، المدير الرئيسي لتقنية أبحاث الذكاء الاصطناعي في Meta ، قال اتجاهات الرقمية. "هذا لا يمثل المقطع كلمة بكلمة ، ولكن معنى المقطع. وهذا يعني أنه سيتم تمثيل جزأين من النص لهما معاني متشابهة في موضع قريب جدًا في الفضاء الناتج عن البعد n حيث يتم تخزين كل هذه المقاطع ".

يتم تدريب الذكاء الاصطناعي على مجموعة من أربعة ملايين اقتباس من ويكيبيديا ، وإلى جانب انتقاء الاستشهادات الخاطئة على الموقع ، يرغب منشئوها في أن يتمكنوا في النهاية من اقتراح مصادر دقيقة لتحل محلهم ، وذلك بالانسحاب من فهرس ضخم للبيانات تحديث مستمر.

هناك مشكلة كبيرة يجب حلها وهي العمل في نظام الدرجات لموثوقية المصادر. ورقة من مجلة علمية ، على سبيل المثال ، ستحصل على درجة أعلى من منشور مدونة. إن حجم المحتوى عبر الإنترنت كبير جدًا ومتنوع بحيث يمكنك العثور على "مصادر" لدعم أي مطالبة تقريبًا ، ولكن تحليل المعلومات الخاطئة من المعلومات المضللة (الأولى تعني غير صحيحة ، بينما تعني الأخيرة الخداع المتعمد) ، والمراجعة من قبل الزملاء من غير الخاضع للمراجعة من قبل الزملاء ، والتحقق من الحقائق من الصفعات المتعجلة ، ليست مهمة صغيرة - ولكنها مهمة للغاية عندما يتعلق الأمر بالثقة.

قامت Meta بفتح نموذجها المصدر ، ويمكن لمن لديهم فضول رؤية ملف عرض من أداة التحقق. أشارت مدونة Meta إلى أن الشركة لا تشارك مع Wikimedia في هذا المشروع ، وأنها لا تزال في مرحلة البحث ولا يتم استخدامها حاليًا لتحديث المحتوى على Wikipedia.

إذا كنت تتخيل مستقبلًا غير بعيد جدًا حيث يكون كل ما تقرأه على ويكيبيديا دقيقًا وموثوقًا به ، ألن يجعل ذلك إجراء أي نوع من البحث أمرًا سهلاً بعض الشيء؟ هناك شيء مفيد في التحقق من المصادر المختلفة ومقارنتها بأنفسنا ، أليس كذلك؟ لقد كانت قفزة كبيرة للانتقال من تصفح الكتب الثقيلة إلى كتابة بضع كلمات في محرك بحث والضغط على مفتاح "Enter". هل نريد حقًا أن تنتقل ويكيبيديا من نقطة انطلاق للبحث إلى مصدر آخر كلمة؟

على أي حال ، سيواصل فريق أبحاث الذكاء الاصطناعي في Meta العمل نحو أداة لتحسين الموسوعة عبر الإنترنت. "أعتقد أننا كنا مدفوعين بالفضول في نهاية اليوم ،" بتروني محمد. "أردنا أن نرى ما هو الحد الأقصى لهذه التكنولوجيا. لم نكن متأكدين تمامًا مما إذا كان [هذا الذكاء الاصطناعي] يمكنه فعل أي شيء مفيد في هذا السياق. لم يحاول أي شخص القيام بشيء مماثل ".

الصورة الائتمان: جيرد التمان تبدأ من Pixabay

الطابع الزمني:

اكثر من التفرد المحور