আজকের AI হল কৃত্রিম কৃত্রিম কৃত্রিম বুদ্ধিমত্তা

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

আজকের AI হল কৃত্রিম কৃত্রিম কৃত্রিম বুদ্ধিমত্তা PlatoBlockchain Data Intelligence. উল্লম্ব অনুসন্ধান. আ.

অ্যামাজন মেকানিক্যাল তুর্কের মতো ক্রাউডসোর্স পরিষেবার মাধ্যমে নিয়োগ করা কর্মীরা তাদের কাজগুলি সম্পূর্ণ করার জন্য বড় ভাষা মডেল ব্যবহার করছেন – যা ভবিষ্যতে AI মডেলগুলিতে নেতিবাচক নক-অন প্রভাব ফেলতে পারে।

AI এর জন্য ডেটা গুরুত্বপূর্ণ। নির্ভুল এবং নির্ভরযোগ্য মেশিন লার্নিং সিস্টেম তৈরি করতে ডেভেলপারদের পরিষ্কার, উচ্চ-মানের ডেটাসেট প্রয়োজন। মূল্যবান, শীর্ষস্থানীয় ডেটা কম্পাইল করা, তবে, ক্লান্তিকর হতে পারে। কোম্পানিগুলি প্রায়শই তৃতীয় পক্ষের প্ল্যাটফর্মগুলিতে ফিরে আসে যেমন Amazon Mechanical Turk সস্তা কর্মীদের পুলকে পুনরাবৃত্তিমূলক কাজগুলি করার জন্য নির্দেশ দেয় - যেমন অবজেক্ট লেবেল করা, পরিস্থিতি বর্ণনা করা, প্যাসেজগুলি প্রতিলিপি করা এবং পাঠ্য টীকা করা।

অনেক বড়, স্বয়ংক্রিয় স্কেলে সেই কাজটি পুনরুত্পাদন করতে প্রশিক্ষণ দেওয়ার জন্য তাদের আউটপুট পরিষ্কার করে একটি মডেলে খাওয়ানো যেতে পারে।

AI মডেলগুলি এইভাবে মানুষের শ্রমের উপর ভিত্তি করে তৈরি করা হয়: লোকেরা পরিশ্রম করে, AI সিস্টেমের জন্য প্রশিক্ষণের উদাহরণ প্রদান করে যা কর্পোরেশনগুলি বিলিয়ন ডলার উপার্জন করতে ব্যবহার করতে পারে।

কিন্তু সুইজারল্যান্ডের École polytechnique fédérale de Lausanne (EPFL)-এর গবেষকদের দ্বারা পরিচালিত একটি পরীক্ষা এই উপসংহারে পৌঁছেছে যে এই ক্রাউডসোর্সড কর্মীরা AI সিস্টেম ব্যবহার করছেন - যেমন OpenAI-এর চ্যাটবট ChatGPT - অনলাইনে অদ্ভুত কাজগুলি করতে৷

একটি মডেলকে তার নিজস্ব আউটপুটে প্রশিক্ষণ দেওয়া বাঞ্ছনীয় নয়। আমরা দেখতে পাচ্ছি যে AI মডেলগুলি মানুষের দ্বারা নয়, অন্যান্য AI মডেলগুলির দ্বারা তৈরি ডেটার উপর প্রশিক্ষিত হচ্ছে - সম্ভবত একই মডেলগুলিও। এটি বিপর্যয়কর আউটপুট গুণমান, আরও পক্ষপাত এবং অন্যান্য অবাঞ্ছিত প্রভাবের দিকে নিয়ে যেতে পারে।

পরীক্ষাটি

শিক্ষাবিদরা 44টি চিকিৎসা গবেষণাপত্রের বিমূর্ত সংক্ষিপ্তসারের জন্য 16 জন যান্ত্রিক তুর্কি সার্ফ নিয়োগ করেছেন এবং অনুমান করেছেন যে কর্মীদের দ্বারা জমা দেওয়া পাঠ্যের 33 থেকে 46 শতাংশ প্যাসেজ বড় ভাষা মডেল ব্যবহার করে তৈরি করা হয়েছে। ভিড় কর্মীদের প্রায়ই কম মজুরি দেওয়া হয় - স্বয়ংক্রিয়ভাবে প্রতিক্রিয়া তৈরি করতে AI ব্যবহার করে তাদের দ্রুত কাজ করতে এবং বেতন বাড়ানোর জন্য আরও কাজ নিতে দেয়।

সুইস দল তুর্কারদের কাছ থেকে জমা দেওয়া মানব- নাকি এআই-উত্পন্ন ছিল তা অনুমান করার জন্য একটি শ্রেণিবিন্যাসকারীকে প্রশিক্ষণ দিয়েছে। সারফরা প্ল্যাটফর্মে পাঠ্য অনুলিপি এবং পেস্ট করেছে কিনা বা তাদের এন্ট্রিগুলি নিজেই টাইপ করেছে কিনা তা সনাক্ত করতে শিক্ষাবিদরা তাদের কর্মীদের কীস্ট্রোকগুলিও লগ করেছেন। সবসময় সুযোগ থাকে যে কেউ একটি চ্যাটবট ব্যবহার করে এবং তারপরে আউটপুটে ম্যানুয়ালি টাইপ করে - তবে এটি অসম্ভাব্য, আমরা মনে করি।

"আমরা একটি খুব নির্দিষ্ট পদ্ধতি তৈরি করেছি যা আমাদের দৃশ্যে সিন্থেটিক পাঠ্য সনাক্ত করার জন্য খুব ভাল কাজ করেছে," ম্যানোয়েল রিবেইরো, সহ-লেখক পড়াশোনা এবং ইপিএফএল-এর একজন পিএইচডি ছাত্র বলেছে নিবন্ধনকর্মী এই সপ্তাহ.

"যদিও ঐতিহ্যগত পদ্ধতিগুলি 'যেকোনো প্রসঙ্গে' সিন্থেটিক পাঠ্য সনাক্ত করার চেষ্টা করে, আমাদের পদ্ধতি আমাদের নির্দিষ্ট পরিস্থিতিতে সিন্থেটিক পাঠ্য সনাক্তকরণের উপর দৃষ্টি নিবদ্ধ করে।"

কেউ একটি AI সিস্টেম ব্যবহার করেছে বা তাদের নিজস্ব কাজ তৈরি করেছে কিনা তা সনাক্ত করতে শ্রেণীবদ্ধকারী নিখুঁত নয়। শিক্ষাবিদরা তাদের ক্লাসিফায়ারের আউটপুটকে কীস্ট্রোক ডেটার সাথে একত্রিত করে যখন কেউ বট থেকে কপি-পেস্ট করে বা তাদের নিজস্ব উপাদান তৈরি করে তখন আরও নিশ্চিত হয়।

হিউম্যান ডাটা হল গোল্ড স্ট্যান্ডার্ড, কারণ এটি মানুষের জন্যই আমরা যত্নশীল

“আমরা এমটার্ক থেকে সংগ্রহ করা কীস্ট্রোক ডেটা ব্যবহার করে আমাদের ফলাফল যাচাই করতে পেরেছি,” রিবেইরো আমাদের বলেছেন। "উদাহরণস্বরূপ, আমরা দেখেছি যে সমস্ত পাঠ্য যেগুলি কপি-পেস্ট করা হয়নি তা আমাদের দ্বারা 'বাস্তব' হিসাবে শ্রেণীবদ্ধ করা হয়েছে, যা পরামর্শ দেয় যে কয়েকটি মিথ্যা ইতিবাচক রয়েছে।"

পরীক্ষা চালানোর জন্য ব্যবহৃত কোড এবং ডেটা এখানে পাওয়া যাবে, গিটহাবে।

আরও একটি কারণ রয়েছে যে পরীক্ষাটি সম্পূর্ণরূপে ন্যায্য উপস্থাপনা হওয়ার সম্ভাবনা নেই যে কতজন কর্মী আসলেই ক্রাউডসোর্স কাজগুলি স্বয়ংক্রিয় করতে AI ব্যবহার করছেন। লেখকরা নোট করেছেন যে টেক্সট সংক্ষিপ্তকরণের কাজটি অন্যান্য ধরণের কাজের তুলনায় বড় ভাষার মডেলের জন্য উপযুক্ত - যার অর্থ তাদের ফলাফলগুলি ChatGPT-এর মতো সরঞ্জামগুলি ব্যবহার করে উচ্চ সংখ্যক কর্মীদের দিকে আরও বেশি তির্যক হতে পারে।

46 জন কর্মী থেকে তাদের 44টি প্রতিক্রিয়ার ডেটাসেটও ছোট। কর্মীদের প্রতিটি টেক্সট সারাংশের জন্য $1 প্রদান করা হয়েছিল, যা আবার শুধুমাত্র AI ব্যবহারকে উৎসাহিত করতে পারে।

বৃহৎ ভাষার মডেলগুলি আরও খারাপ হবে যদি তারা ক্রাউডসোর্স প্ল্যাটফর্ম থেকে সংগৃহীত এআই দ্বারা তৈরি জাল বিষয়বস্তুর উপর ক্রমবর্ধমান প্রশিক্ষিত হয়, গবেষকরা যুক্তি দেন। ওপেনএআই-এর মতো পোশাকগুলি তাদের সর্বশেষ মডেলগুলিকে কীভাবে প্রশিক্ষণ দেয় তা একটি গোপনীয়তা রাখে এবং মেকানিক্যাল তুর্কের মতো জিনিসগুলির উপর খুব বেশি নির্ভর করতে পারে না, যদি তা হয়। এটি বলেছে, প্রচুর অন্যান্য মডেল মানব কর্মীদের উপর নির্ভর করতে পারে, যা প্রশিক্ষণের ডেটা তৈরি করতে বট ব্যবহার করতে পারে, যা একটি সমস্যা।

মেকানিক্যাল তুর্ক, একজনের জন্য, "পাওয়ার মেশিন লার্নিং মডেলের ডেটা লেবেলিং সমাধান" প্রদানকারী হিসাবে বিপণন করা হয়।

রিবেরিও বলেন, "মানুষের ডেটা হল সোনার মান, কারণ এটি মানুষের জন্যই আমরা যত্নশীল, বড় ভাষা মডেল নয়।" "আমি এমন একটি ওষুধ নেব না যা শুধুমাত্র একটি ড্রোসোফিলা জৈবিক মডেলে পরীক্ষা করা হয়েছিল," তিনি উদাহরণ হিসাবে বলেছিলেন।

আজকের এআই মডেলগুলির দ্বারা উত্পন্ন প্রতিক্রিয়াগুলি সাধারণত বেশ তুচ্ছ বা তুচ্ছ এবং মানুষের সৃজনশীলতার জটিলতা এবং বৈচিত্র্যকে ক্যাপচার করে না, গবেষকরা যুক্তি দিয়েছিলেন।

"কখনও কখনও আমরা ক্রাউডসোর্সড ডেটার সাথে যা অধ্যয়ন করতে চাই তা হল সঠিকভাবে যে উপায়ে মানুষ অসম্পূর্ণ," রবার্ট ওয়েস্ট, কাগজের সহ-লেখক এবং ইপিএফএল এর কম্পিউটার এবং যোগাযোগ বিজ্ঞানের স্কুলের একজন সহকারী অধ্যাপক, আমাদের বলেছেন৷

AI-এর উন্নতি অব্যাহত থাকায়, ক্রাউডসোর্স করা কাজের পরিবর্তন হতে পারে। রিবেরিও অনুমান করেছিলেন যে বড় ভাষার মডেলগুলি নির্দিষ্ট কাজে কিছু কর্মীকে প্রতিস্থাপন করতে পারে। "তবে, বিপরীতভাবে, মানুষের ডেটা আগের চেয়ে বেশি মূল্যবান হতে পারে এবং এইভাবে এটি হতে পারে যে এই প্ল্যাটফর্মগুলি বৃহৎ ভাষা মডেলের ব্যবহার প্রতিরোধ করার উপায়গুলি বাস্তবায়ন করতে সক্ষম হবে এবং এটি মানুষের ডেটার একটি উত্স হিসাবে রয়ে গেছে তা নিশ্চিত করতে সক্ষম হবে।"

কে জানে - হয়তো মানুষও প্রতিক্রিয়া তৈরি করতে বড় ভাষার মডেলের সাথে সহযোগিতা করতে পারে, তিনি যোগ করেছেন। ®

এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
ইভিএম ফাইন্যান্স। বিকেন্দ্রীভূত অর্থের জন্য ইউনিফাইড ইন্টারফেস। এখানে প্রবেশ করুন.
কোয়ান্টাম মিডিয়া গ্রুপ। IR/PR প্রশস্ত। এখানে প্রবেশ করুন.
প্লেটোএআইস্ট্রিম। Web3 ডেটা ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
উত্স: https://go.theregister.com/feed/www.theregister.com/2023/06/16/crowd_workers_bots_ai_training/

সময় স্ট্যাম্প: জুন 16, 2023

সময় স্ট্যাম্প: মার্চ 15, 2023

আজকের AI হল কৃত্রিম কৃত্রিম কৃত্রিম বুদ্ধিমত্তা

প্লেটো দ্বারা প্রকাশিত

পরীক্ষাটি

থেকে আরো নিবন্ধনকর্মী

Darth Vader ভয়েস অভিনেতা জেমস আর্ল জোনস এআইকে ভূমিকা নেওয়ার অনুমতি দেন

GenAI-এর জন্য একটি উপযোগী পদ্ধতি

নুহ-উহ, মেটা, আমরা টেক্সট-টু-ভিডিও এআইও করতে পারি, গুগল বলে

ঐতিহাসিক ইউএস মেফ্লাওয়ার সমুদ্রযাত্রার স্মরণে আইবিএম এআই বোট অবশেষে কানাডায় অবতরণ করেছে...

আইনপ্রণেতারা আবার খোলা ব্ল্যাক বক্স অ্যালগরিদম ভাঙার চেষ্টা করে

Bing AI মনে হচ্ছে ChatGPT একটি স্যুটে ঠাসা - ভবিষ্যতে নয়

আমাদের সম্পর্কে

উল্লম্ব অনুসন্ধান এবং আই

প্ল্যাটফর্ম

যোগাযোগ রেখো

হিসাব