মেটা উইকিপিডিয়ার ফ্যাক্ট-চেক করার জন্য একটি AI তৈরি করছে—সমস্ত 6.5 মিলিয়ন প্রবন্ধ PlatoBlockchain ডেটা ইন্টেলিজেন্স। উল্লম্ব অনুসন্ধান. আ.

মেটা উইকিপিডিয়ার ফ্যাক্ট-চেক করার জন্য একটি AI তৈরি করছে—সমস্ত 6.5 মিলিয়ন নিবন্ধ

ভাবমূর্তি

30 বছরের বেশি বয়সী বেশিরভাগ লোকই সম্ভবত ভাল পুরানো ধাঁচের এনসাইক্লোপিডিয়া নিয়ে গবেষণা করার কথা মনে রাখে। আপনি শেল্ফ থেকে একটি ভারী ভলিউম টানবেন, আপনার আগ্রহের বিষয়ের জন্য সূচকটি পরীক্ষা করুন, তারপর উপযুক্ত পৃষ্ঠায় ফ্লিপ করুন এবং পড়া শুরু করুন৷ গুগল সার্চ বারে কয়েকটি শব্দ টাইপ করা ততটা সহজ ছিল না, কিন্তু প্লাস সাইডে, আপনি জানতেন যে তথ্য আপনি পৃষ্ঠাগুলিতে খুঁজে পেয়েছেন ব্রিটানিকা অথবা ওয়ার্ল্ড বুক সঠিক এবং সত্য ছিল।

আজ ইন্টারনেট গবেষণার সাথে তাই নয়। উৎসের অপ্রতিরোধ্য ভিড় যথেষ্ট বিভ্রান্তিকর ছিল, কিন্তু ভুল তথ্যের বিস্তার যোগ করুন এবং এটি একটি আশ্চর্যের বিষয় যে আমরা যে কেউ অনলাইনে পড়া একটি শব্দ বিশ্বাস করি।

উইকিপিডিয়া বিন্দুতে একটি কেস. 2020 সালের প্রথম দিকে, সাইটের ইংরেজি সংস্করণের গড় ছিল 255 মিলিয়ন প্রতিদিন পেজ ভিউ, এটি ইন্টারনেটে অষ্টম-সবচেয়ে বেশি পরিদর্শন করা ওয়েবসাইট তৈরি করে। গত মাসের হিসাবে, এটি স্পট পর্যন্ত সরানো হয়েছে সাত নম্বর, এবং ইংরেজি সংস্করণ বর্তমানে শেষ হয়েছে 6.5 মিলিয়ন নিবন্ধ।

কিন্তু এই তথ্যের উৎস যতই উচ্চ ট্রাফিক হতে পারে, এর নির্ভুলতা কাঙ্খিত কিছু ছেড়ে দেয়; দ্য পৃষ্ঠা সাইটের নিজস্ব নির্ভরযোগ্যতা সম্পর্কে বলা হয়েছে, "অনলাইন এনসাইক্লোপিডিয়া একটি উত্স হিসাবে নিজেকে নির্ভরযোগ্য বলে মনে করে না এবং পাঠকদের এটিকে একাডেমিক বা গবেষণা সেটিংসে ব্যবহার করতে নিরুৎসাহিত করে।"

প্রাক্তন Facebook-এর মেটা-এটি পরিবর্তন করতে চায়। ক ব্লগ পোস্ট গত মাসে প্রকাশিত, কোম্পানির কর্মীরা বর্ণনা করেছেন কিভাবে AI উইকিপিডিয়াকে আরও সঠিক করতে সাহায্য করতে পারে।

যদিও হাজার হাজার মানুষ সাইটটির সম্পাদনায় অংশগ্রহণ করে, তারা যে তথ্য যোগ করে তা অগত্যা সঠিক নয়; এমনকি যখন উদ্ধৃতি উপস্থিত থাকে, তারা সবসময় সঠিক বা এমনকি প্রাসঙ্গিকও হয় না।

মেটা একটি মেশিন লার্নিং মডেল তৈরি করছে যা এই উদ্ধৃতিগুলিকে স্ক্যান করে এবং তাদের বিষয়বস্তুগুলিকে উইকিপিডিয়া নিবন্ধগুলিতে ক্রস-রেফারেন্স করে তা যাচাই করার জন্য যে শুধুমাত্র বিষয়গুলি লাইন আপ নয়, উদ্ধৃত নির্দিষ্ট পরিসংখ্যানগুলি সঠিক।

এটি শুধুমাত্র সংখ্যা বাছাই এবং তারা মিলেছে তা নিশ্চিত করার বিষয় নয়; Meta's AI-কে উদ্ধৃত উত্সগুলির বিষয়বস্তু "বুঝতে" প্রয়োজন (যদিও "বুঝতে" একটি ভুল নাম, কারণ জটিলতা তত্ত্ব গবেষক মেলানি মিচেল তোমাকে বলব, কারণ AI এখনও "সংকীর্ণ" পর্যায়ে রয়েছে, যার অর্থ এটি অত্যন্ত পরিশীলিত প্যাটার্ন সনাক্তকরণের একটি হাতিয়ার, যখন "বোঝাবুঝি" একটি শব্দ যা মানুষের জ্ঞানের জন্য ব্যবহৃত হয়, যা এখনও একটি খুব ভিন্ন জিনিস)।

মেটার মডেল টেক্সট স্ট্রিংগুলির তুলনা করে এবং একই শব্দগুলি রয়েছে তা নিশ্চিত করে বিষয়বস্তু "বুঝবে" নয়, বরং পাঠ্যের ব্লকগুলির গাণিতিক উপস্থাপনা তুলনা করে, যা এটি প্রাকৃতিক ভাষা বোঝার (NLU) কৌশল ব্যবহার করে পৌঁছেছে।

মেটার ফান্ডামেন্টাল এআই রিসার্চ টেক লিড ম্যানেজার ফ্যাবিও পেট্রোনি, "আমরা যা করেছি তা হল এই সমস্ত ওয়েব পৃষ্ঠাগুলির একটি সূচী তৈরি করা এবং প্রতিটি প্যাসেজের জন্য একটি সঠিক উপস্থাপনা প্রদান করা।" বলা ডিজিটাল প্রবণতা. "এটি শব্দে-শব্দে উত্তরণকে প্রতিনিধিত্ব করছে না, তবে উত্তরণের অর্থ। এর মানে হল যে অনুরূপ অর্থ সহ পাঠ্যের দুটি খণ্ড ফলস্বরূপ এন-ডাইমেনশনাল স্পেসে খুব কাছাকাছি অবস্থানে উপস্থাপন করা হবে যেখানে এই সমস্ত প্যাসেজগুলি সংরক্ষণ করা হয়।"

AI-কে চার মিলিয়ন উইকিপিডিয়া উদ্ধৃতিগুলির একটি সেটে প্রশিক্ষিত করা হচ্ছে, এবং সাইটে ত্রুটিপূর্ণ উদ্ধৃতিগুলি বাছাই করার পাশাপাশি, এর নির্মাতারা চান যে এটি অবশেষে তাদের জায়গা নেওয়ার জন্য সঠিক উত্সের পরামর্শ দিতে সক্ষম হবে, ডেটার একটি বিশাল সূচক থেকে টানতে ক্রমাগত আপডেট করা হচ্ছে।

একটি বড় সমস্যা কাজ করা বাকি আছে উৎসের নির্ভরযোগ্যতার জন্য একটি গ্রেডিং সিস্টেমে কাজ করা। একটি বৈজ্ঞানিক জার্নাল থেকে একটি কাগজ, উদাহরণস্বরূপ, একটি ব্লগ পোস্টের চেয়ে একটি উচ্চ গ্রেড পাবে। অনলাইনে বিষয়বস্তুর পরিমাণ এতই বিস্তৃত এবং বৈচিত্র্যময় যে আপনি যেকোন দাবিকে সমর্থন করার জন্য "উৎস" খুঁজে পেতে পারেন, কিন্তু বিভ্রান্তি থেকে ভুল তথ্যকে পার্স করা (পূর্বের অর্থ ভুল, যখন পরবর্তীটির অর্থ ইচ্ছাকৃতভাবে প্রতারণা করা) এবং পিয়ার-পর্যালোচিত নন-পিয়ার-পর্যালোচনা থেকে, তাড়াহুড়ো করে-থাপ্পড়-একসাথে সত্য-পরীক্ষা করা কোনও ছোট কাজ নয় - তবে বিশ্বাসের ক্ষেত্রে এটি খুব গুরুত্বপূর্ণ।

মেটা তার মডেলটি ওপেন সোর্স করেছে এবং যারা আগ্রহী তারা দেখতে পারেন একটি ডেমো যাচাইকরণ টুলের। মেটার ব্লগ পোস্টে উল্লেখ করা হয়েছে যে কোম্পানিটি এই প্রকল্পে উইকিমিডিয়ার সাথে অংশীদারিত্ব করছে না এবং এটি এখনও গবেষণার পর্যায়ে রয়েছে এবং বর্তমানে উইকিপিডিয়াতে বিষয়বস্তু আপডেট করার জন্য ব্যবহার করা হচ্ছে না।

আপনি যদি এমন একটি দূরবর্তী ভবিষ্যতের কথা কল্পনা করেন যেখানে আপনি উইকিপিডিয়ায় যা কিছু পড়েন তা সঠিক এবং নির্ভরযোগ্য, তবে এটি কি কোনও ধরণের গবেষণা করাকে কিছুটা সহজ করে তুলবে না? আমাদের বিভিন্ন উত্স পরীক্ষা এবং তুলনা করার বিষয়ে মূল্যবান কিছু আছে, তাই না? ভারী বইয়ের পেজিং থেকে সার্চ ইঞ্জিনে কয়েকটি শব্দ টাইপ করা এবং "এন্টার" আঘাত করা একটি বড় লাফ ছিল; আমরা কি সত্যিই উইকিপিডিয়াকে একটি গবেষণা জাম্পিং-অফ পয়েন্ট থেকে শেষ-শব্দের উৎসে যেতে চাই?

যাই হোক না কেন, মেটার এআই গবেষণা দল অনলাইন এনসাইক্লোপিডিয়া উন্নত করার জন্য একটি টুলের দিকে কাজ চালিয়ে যাবে। "আমি মনে করি দিনের শেষে আমরা কৌতূহল দ্বারা চালিত ছিলাম," পেট্রোনি বলেছেন. “আমরা দেখতে চেয়েছিলাম এই প্রযুক্তির সীমা কী ছিল। [এই AI] এই প্রসঙ্গে অর্থপূর্ণ কিছু করতে পারে কিনা আমরা নিশ্চিত ছিলাম না। কেউ কখনও অনুরূপ কিছু করার চেষ্টা করেনি।”

চিত্র ক্রেডিট: Gerd Altmann থেকে pixabay

সময় স্ট্যাম্প:

থেকে আরো এককতা হাব