মেটা উইকিপিডিয়ার ফ্যাক্ট-চেক করার জন্য একটি এআই তৈরি করছে

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

30 বছরের বেশি বয়সী বেশিরভাগ লোকই সম্ভবত ভাল পুরানো ধাঁচের এনসাইক্লোপিডিয়া নিয়ে গবেষণা করার কথা মনে রাখে। আপনি শেল্ফ থেকে একটি ভারী ভলিউম টানবেন, আপনার আগ্রহের বিষয়ের জন্য সূচকটি পরীক্ষা করুন, তারপর উপযুক্ত পৃষ্ঠায় ফ্লিপ করুন এবং পড়া শুরু করুন৷ গুগল সার্চ বারে কয়েকটি শব্দ টাইপ করা ততটা সহজ ছিল না, কিন্তু প্লাস সাইডে, আপনি জানতেন যে তথ্য আপনি পৃষ্ঠাগুলিতে খুঁজে পেয়েছেন ব্রিটানিকা অথবা ওয়ার্ল্ড বুক সঠিক এবং সত্য ছিল।

আজ ইন্টারনেট গবেষণার সাথে তাই নয়। উৎসের অপ্রতিরোধ্য ভিড় যথেষ্ট বিভ্রান্তিকর ছিল, কিন্তু ভুল তথ্যের বিস্তার যোগ করুন এবং এটি একটি আশ্চর্যের বিষয় যে আমরা যে কেউ অনলাইনে পড়া একটি শব্দ বিশ্বাস করি।

উইকিপিডিয়া বিন্দুতে একটি কেস. 2020 সালের প্রথম দিকে, সাইটের ইংরেজি সংস্করণের গড় ছিল 255 মিলিয়ন প্রতিদিন পেজ ভিউ, এটি ইন্টারনেটে অষ্টম-সবচেয়ে বেশি পরিদর্শন করা ওয়েবসাইট তৈরি করে। গত মাসের হিসাবে, এটি স্পট পর্যন্ত সরানো হয়েছে সাত নম্বর, এবং ইংরেজি সংস্করণ বর্তমানে শেষ হয়েছে 6.5 মিলিয়ন নিবন্ধ।

কিন্তু এই তথ্যের উৎস যতই উচ্চ ট্রাফিক হতে পারে, এর নির্ভুলতা কাঙ্খিত কিছু ছেড়ে দেয়; দ্য পৃষ্ঠা সাইটের নিজস্ব নির্ভরযোগ্যতা সম্পর্কে বলা হয়েছে, "অনলাইন এনসাইক্লোপিডিয়া একটি উত্স হিসাবে নিজেকে নির্ভরযোগ্য বলে মনে করে না এবং পাঠকদের এটিকে একাডেমিক বা গবেষণা সেটিংসে ব্যবহার করতে নিরুৎসাহিত করে।"

প্রাক্তন Facebook-এর মেটা-এটি পরিবর্তন করতে চায়। ক ব্লগ পোস্ট গত মাসে প্রকাশিত, কোম্পানির কর্মীরা বর্ণনা করেছেন কিভাবে AI উইকিপিডিয়াকে আরও সঠিক করতে সাহায্য করতে পারে।

যদিও হাজার হাজার মানুষ সাইটটির সম্পাদনায় অংশগ্রহণ করে, তারা যে তথ্য যোগ করে তা অগত্যা সঠিক নয়; এমনকি যখন উদ্ধৃতি উপস্থিত থাকে, তারা সবসময় সঠিক বা এমনকি প্রাসঙ্গিকও হয় না।

মেটা একটি মেশিন লার্নিং মডেল তৈরি করছে যা এই উদ্ধৃতিগুলিকে স্ক্যান করে এবং তাদের বিষয়বস্তুগুলিকে উইকিপিডিয়া নিবন্ধগুলিতে ক্রস-রেফারেন্স করে তা যাচাই করার জন্য যে শুধুমাত্র বিষয়গুলি লাইন আপ নয়, উদ্ধৃত নির্দিষ্ট পরিসংখ্যানগুলি সঠিক।

এটি শুধুমাত্র সংখ্যা বাছাই এবং তারা মিলেছে তা নিশ্চিত করার বিষয় নয়; Meta's AI-কে উদ্ধৃত উত্সগুলির বিষয়বস্তু "বুঝতে" প্রয়োজন (যদিও "বুঝতে" একটি ভুল নাম, কারণ জটিলতা তত্ত্ব গবেষক মেলানি মিচেল তোমাকে বলব, কারণ AI এখনও "সংকীর্ণ" পর্যায়ে রয়েছে, যার অর্থ এটি অত্যন্ত পরিশীলিত প্যাটার্ন সনাক্তকরণের একটি হাতিয়ার, যখন "বোঝাবুঝি" একটি শব্দ যা মানুষের জ্ঞানের জন্য ব্যবহৃত হয়, যা এখনও একটি খুব ভিন্ন জিনিস)।

মেটার মডেল টেক্সট স্ট্রিংগুলির তুলনা করে এবং একই শব্দগুলি রয়েছে তা নিশ্চিত করে বিষয়বস্তু "বুঝবে" নয়, বরং পাঠ্যের ব্লকগুলির গাণিতিক উপস্থাপনা তুলনা করে, যা এটি প্রাকৃতিক ভাষা বোঝার (NLU) কৌশল ব্যবহার করে পৌঁছেছে।

মেটার ফান্ডামেন্টাল এআই রিসার্চ টেক লিড ম্যানেজার ফ্যাবিও পেট্রোনি, "আমরা যা করেছি তা হল এই সমস্ত ওয়েব পৃষ্ঠাগুলির একটি সূচী তৈরি করা এবং প্রতিটি প্যাসেজের জন্য একটি সঠিক উপস্থাপনা প্রদান করা।" বলা ডিজিটাল প্রবণতা. "এটি শব্দে-শব্দে উত্তরণকে প্রতিনিধিত্ব করছে না, তবে উত্তরণের অর্থ। এর মানে হল যে অনুরূপ অর্থ সহ পাঠ্যের দুটি খণ্ড ফলস্বরূপ এন-ডাইমেনশনাল স্পেসে খুব কাছাকাছি অবস্থানে উপস্থাপন করা হবে যেখানে এই সমস্ত প্যাসেজগুলি সংরক্ষণ করা হয়।"

AI-কে চার মিলিয়ন উইকিপিডিয়া উদ্ধৃতিগুলির একটি সেটে প্রশিক্ষিত করা হচ্ছে, এবং সাইটে ত্রুটিপূর্ণ উদ্ধৃতিগুলি বাছাই করার পাশাপাশি, এর নির্মাতারা চান যে এটি অবশেষে তাদের জায়গা নেওয়ার জন্য সঠিক উত্সের পরামর্শ দিতে সক্ষম হবে, ডেটার একটি বিশাল সূচক থেকে টানতে ক্রমাগত আপডেট করা হচ্ছে।

একটি বড় সমস্যা কাজ করা বাকি আছে উৎসের নির্ভরযোগ্যতার জন্য একটি গ্রেডিং সিস্টেমে কাজ করা। একটি বৈজ্ঞানিক জার্নাল থেকে একটি কাগজ, উদাহরণস্বরূপ, একটি ব্লগ পোস্টের চেয়ে একটি উচ্চ গ্রেড পাবে। অনলাইনে বিষয়বস্তুর পরিমাণ এতই বিস্তৃত এবং বৈচিত্র্যময় যে আপনি যেকোন দাবিকে সমর্থন করার জন্য "উৎস" খুঁজে পেতে পারেন, কিন্তু বিভ্রান্তি থেকে ভুল তথ্যকে পার্স করা (পূর্বের অর্থ ভুল, যখন পরবর্তীটির অর্থ ইচ্ছাকৃতভাবে প্রতারণা করা) এবং পিয়ার-পর্যালোচিত নন-পিয়ার-পর্যালোচনা থেকে, তাড়াহুড়ো করে-থাপ্পড়-একসাথে সত্য-পরীক্ষা করা কোনও ছোট কাজ নয় - তবে বিশ্বাসের ক্ষেত্রে এটি খুব গুরুত্বপূর্ণ।

মেটা তার মডেলটি ওপেন সোর্স করেছে এবং যারা আগ্রহী তারা দেখতে পারেন একটি ডেমো যাচাইকরণ টুলের। মেটার ব্লগ পোস্টে উল্লেখ করা হয়েছে যে কোম্পানিটি এই প্রকল্পে উইকিমিডিয়ার সাথে অংশীদারিত্ব করছে না এবং এটি এখনও গবেষণার পর্যায়ে রয়েছে এবং বর্তমানে উইকিপিডিয়াতে বিষয়বস্তু আপডেট করার জন্য ব্যবহার করা হচ্ছে না।

আপনি যদি এমন একটি দূরবর্তী ভবিষ্যতের কথা কল্পনা করেন যেখানে আপনি উইকিপিডিয়ায় যা কিছু পড়েন তা সঠিক এবং নির্ভরযোগ্য, তবে এটি কি কোনও ধরণের গবেষণা করাকে কিছুটা সহজ করে তুলবে না? আমাদের বিভিন্ন উত্স পরীক্ষা এবং তুলনা করার বিষয়ে মূল্যবান কিছু আছে, তাই না? ভারী বইয়ের পেজিং থেকে সার্চ ইঞ্জিনে কয়েকটি শব্দ টাইপ করা এবং "এন্টার" আঘাত করা একটি বড় লাফ ছিল; আমরা কি সত্যিই উইকিপিডিয়াকে একটি গবেষণা জাম্পিং-অফ পয়েন্ট থেকে শেষ-শব্দের উৎসে যেতে চাই?

যাই হোক না কেন, মেটার এআই গবেষণা দল অনলাইন এনসাইক্লোপিডিয়া উন্নত করার জন্য একটি টুলের দিকে কাজ চালিয়ে যাবে। "আমি মনে করি দিনের শেষে আমরা কৌতূহল দ্বারা চালিত ছিলাম," পেট্রোনি বলেছেন. “আমরা দেখতে চেয়েছিলাম এই প্রযুক্তির সীমা কী ছিল। [এই AI] এই প্রসঙ্গে অর্থপূর্ণ কিছু করতে পারে কিনা আমরা নিশ্চিত ছিলাম না। কেউ কখনও অনুরূপ কিছু করার চেষ্টা করেনি।”

চিত্র ক্রেডিট: Gerd Altmann থেকে pixabay

সময় স্ট্যাম্প: আগস্ট 26, 2022আগস্ট 26, 2022

মেটা উইকিপিডিয়ার ফ্যাক্ট-চেক করার জন্য একটি AI তৈরি করছে—সমস্ত 6.5 মিলিয়ন নিবন্ধ

প্লেটো দ্বারা প্রকাশিত

থেকে আরো এককতা হাব

চ্যাটজিপিটি ভাবতে পারে না—সচেতনতা আজকের এআই থেকে সম্পূর্ণ আলাদা কিছু

একটি এলিয়েন সভ্যতা আমাদের মোবাইল ফোন সিগন্যাল থেকে পৃথিবী সম্পর্কে কী শিখতে পারে

অ্যামাজন ডেলিভারি ড্রোন: কীভাবে আকাশ বাজারের আধিপত্যের সীমা হতে পারে

ওয়েব জুড়ে থেকে এই সপ্তাহের দুর্দান্ত কৌশলগুলি (মার্চ 9 এর মাধ্যমে)

গুগল ডিপমাইন্ডের জেমিনি অ্যালগরিদম কেন নেক্সট-লেভেল এআই হতে পারে তা এখানে

সিন্থেটিক কোষগুলি তাদের প্রায় সমস্ত জিন থেকে ছিনিয়ে নিয়ে এখনও বিবর্তনের অধীনে উন্নতি লাভ করে

একটি এআই রোবট ডগ রক একটি অ্যাজিলিটি কোর্স দেখুন যা আগে কখনও দেখা যায়নি৷

যান্ত্রিক নিউরাল নেটওয়ার্কের তৈরি উপাদানগুলি তাদের শারীরিক বৈশিষ্ট্যগুলিকে মানিয়ে নিতে শিখতে পারে

সারা ওয়েব থেকে এই সপ্তাহের অসাধারণ টেক স্টোরিজ (আগস্ট 20 এর মধ্যে)

বন্য থেকে অদ্ভুত পর্যন্ত: 5 সালের শীর্ষ 2022টি বায়োটেক ট্রেন্ড

ChatGPT এর পিছনে AI কেমিস্ট্রি করতে প্রস্তুত

আমাদের সম্পর্কে

উল্লম্ব অনুসন্ধান এবং আই

প্ল্যাটফর্ম

যোগাযোগ রেখো

হিসাব