অ্যামাজন মেকানিক্যাল তুর্কের মতো ক্রাউডসোর্স পরিষেবার মাধ্যমে নিয়োগ করা কর্মীরা তাদের কাজগুলি সম্পূর্ণ করার জন্য বড় ভাষা মডেল ব্যবহার করছেন – যা ভবিষ্যতে AI মডেলগুলিতে নেতিবাচক নক-অন প্রভাব ফেলতে পারে।
AI এর জন্য ডেটা গুরুত্বপূর্ণ। নির্ভুল এবং নির্ভরযোগ্য মেশিন লার্নিং সিস্টেম তৈরি করতে ডেভেলপারদের পরিষ্কার, উচ্চ-মানের ডেটাসেট প্রয়োজন। মূল্যবান, শীর্ষস্থানীয় ডেটা কম্পাইল করা, তবে, ক্লান্তিকর হতে পারে। কোম্পানিগুলি প্রায়শই তৃতীয় পক্ষের প্ল্যাটফর্মগুলিতে ফিরে আসে যেমন Amazon Mechanical Turk সস্তা কর্মীদের পুলকে পুনরাবৃত্তিমূলক কাজগুলি করার জন্য নির্দেশ দেয় - যেমন অবজেক্ট লেবেল করা, পরিস্থিতি বর্ণনা করা, প্যাসেজগুলি প্রতিলিপি করা এবং পাঠ্য টীকা করা।
অনেক বড়, স্বয়ংক্রিয় স্কেলে সেই কাজটি পুনরুত্পাদন করতে প্রশিক্ষণ দেওয়ার জন্য তাদের আউটপুট পরিষ্কার করে একটি মডেলে খাওয়ানো যেতে পারে।
AI মডেলগুলি এইভাবে মানুষের শ্রমের উপর ভিত্তি করে তৈরি করা হয়: লোকেরা পরিশ্রম করে, AI সিস্টেমের জন্য প্রশিক্ষণের উদাহরণ প্রদান করে যা কর্পোরেশনগুলি বিলিয়ন ডলার উপার্জন করতে ব্যবহার করতে পারে।
কিন্তু সুইজারল্যান্ডের École polytechnique fédérale de Lausanne (EPFL)-এর গবেষকদের দ্বারা পরিচালিত একটি পরীক্ষা এই উপসংহারে পৌঁছেছে যে এই ক্রাউডসোর্সড কর্মীরা AI সিস্টেম ব্যবহার করছেন - যেমন OpenAI-এর চ্যাটবট ChatGPT - অনলাইনে অদ্ভুত কাজগুলি করতে৷
একটি মডেলকে তার নিজস্ব আউটপুটে প্রশিক্ষণ দেওয়া বাঞ্ছনীয় নয়। আমরা দেখতে পাচ্ছি যে AI মডেলগুলি মানুষের দ্বারা নয়, অন্যান্য AI মডেলগুলির দ্বারা তৈরি ডেটার উপর প্রশিক্ষিত হচ্ছে - সম্ভবত একই মডেলগুলিও। এটি বিপর্যয়কর আউটপুট গুণমান, আরও পক্ষপাত এবং অন্যান্য অবাঞ্ছিত প্রভাবের দিকে নিয়ে যেতে পারে।
পরীক্ষাটি
শিক্ষাবিদরা 44টি চিকিৎসা গবেষণাপত্রের বিমূর্ত সংক্ষিপ্তসারের জন্য 16 জন যান্ত্রিক তুর্কি সার্ফ নিয়োগ করেছেন এবং অনুমান করেছেন যে কর্মীদের দ্বারা জমা দেওয়া পাঠ্যের 33 থেকে 46 শতাংশ প্যাসেজ বড় ভাষা মডেল ব্যবহার করে তৈরি করা হয়েছে। ভিড় কর্মীদের প্রায়ই কম মজুরি দেওয়া হয় - স্বয়ংক্রিয়ভাবে প্রতিক্রিয়া তৈরি করতে AI ব্যবহার করে তাদের দ্রুত কাজ করতে এবং বেতন বাড়ানোর জন্য আরও কাজ নিতে দেয়।
সুইস দল তুর্কারদের কাছ থেকে জমা দেওয়া মানব- নাকি এআই-উত্পন্ন ছিল তা অনুমান করার জন্য একটি শ্রেণিবিন্যাসকারীকে প্রশিক্ষণ দিয়েছে। সারফরা প্ল্যাটফর্মে পাঠ্য অনুলিপি এবং পেস্ট করেছে কিনা বা তাদের এন্ট্রিগুলি নিজেই টাইপ করেছে কিনা তা সনাক্ত করতে শিক্ষাবিদরা তাদের কর্মীদের কীস্ট্রোকগুলিও লগ করেছেন। সবসময় সুযোগ থাকে যে কেউ একটি চ্যাটবট ব্যবহার করে এবং তারপরে আউটপুটে ম্যানুয়ালি টাইপ করে - তবে এটি অসম্ভাব্য, আমরা মনে করি।
"আমরা একটি খুব নির্দিষ্ট পদ্ধতি তৈরি করেছি যা আমাদের দৃশ্যে সিন্থেটিক পাঠ্য সনাক্ত করার জন্য খুব ভাল কাজ করেছে," ম্যানোয়েল রিবেইরো, সহ-লেখক পড়াশোনা এবং ইপিএফএল-এর একজন পিএইচডি ছাত্র বলেছে নিবন্ধনকর্মী এই সপ্তাহ.
"যদিও ঐতিহ্যগত পদ্ধতিগুলি 'যেকোনো প্রসঙ্গে' সিন্থেটিক পাঠ্য সনাক্ত করার চেষ্টা করে, আমাদের পদ্ধতি আমাদের নির্দিষ্ট পরিস্থিতিতে সিন্থেটিক পাঠ্য সনাক্তকরণের উপর দৃষ্টি নিবদ্ধ করে।"
কেউ একটি AI সিস্টেম ব্যবহার করেছে বা তাদের নিজস্ব কাজ তৈরি করেছে কিনা তা সনাক্ত করতে শ্রেণীবদ্ধকারী নিখুঁত নয়। শিক্ষাবিদরা তাদের ক্লাসিফায়ারের আউটপুটকে কীস্ট্রোক ডেটার সাথে একত্রিত করে যখন কেউ বট থেকে কপি-পেস্ট করে বা তাদের নিজস্ব উপাদান তৈরি করে তখন আরও নিশ্চিত হয়।
হিউম্যান ডাটা হল গোল্ড স্ট্যান্ডার্ড, কারণ এটি মানুষের জন্যই আমরা যত্নশীল
“আমরা এমটার্ক থেকে সংগ্রহ করা কীস্ট্রোক ডেটা ব্যবহার করে আমাদের ফলাফল যাচাই করতে পেরেছি,” রিবেইরো আমাদের বলেছেন। "উদাহরণস্বরূপ, আমরা দেখেছি যে সমস্ত পাঠ্য যেগুলি কপি-পেস্ট করা হয়নি তা আমাদের দ্বারা 'বাস্তব' হিসাবে শ্রেণীবদ্ধ করা হয়েছে, যা পরামর্শ দেয় যে কয়েকটি মিথ্যা ইতিবাচক রয়েছে।"
পরীক্ষা চালানোর জন্য ব্যবহৃত কোড এবং ডেটা এখানে পাওয়া যাবে, গিটহাবে।
আরও একটি কারণ রয়েছে যে পরীক্ষাটি সম্পূর্ণরূপে ন্যায্য উপস্থাপনা হওয়ার সম্ভাবনা নেই যে কতজন কর্মী আসলেই ক্রাউডসোর্স কাজগুলি স্বয়ংক্রিয় করতে AI ব্যবহার করছেন। লেখকরা নোট করেছেন যে টেক্সট সংক্ষিপ্তকরণের কাজটি অন্যান্য ধরণের কাজের তুলনায় বড় ভাষার মডেলের জন্য উপযুক্ত - যার অর্থ তাদের ফলাফলগুলি ChatGPT-এর মতো সরঞ্জামগুলি ব্যবহার করে উচ্চ সংখ্যক কর্মীদের দিকে আরও বেশি তির্যক হতে পারে।
46 জন কর্মী থেকে তাদের 44টি প্রতিক্রিয়ার ডেটাসেটও ছোট। কর্মীদের প্রতিটি টেক্সট সারাংশের জন্য $1 প্রদান করা হয়েছিল, যা আবার শুধুমাত্র AI ব্যবহারকে উৎসাহিত করতে পারে।
বৃহৎ ভাষার মডেলগুলি আরও খারাপ হবে যদি তারা ক্রাউডসোর্স প্ল্যাটফর্ম থেকে সংগৃহীত এআই দ্বারা তৈরি জাল বিষয়বস্তুর উপর ক্রমবর্ধমান প্রশিক্ষিত হয়, গবেষকরা যুক্তি দেন। ওপেনএআই-এর মতো পোশাকগুলি তাদের সর্বশেষ মডেলগুলিকে কীভাবে প্রশিক্ষণ দেয় তা একটি গোপনীয়তা রাখে এবং মেকানিক্যাল তুর্কের মতো জিনিসগুলির উপর খুব বেশি নির্ভর করতে পারে না, যদি তা হয়। এটি বলেছে, প্রচুর অন্যান্য মডেল মানব কর্মীদের উপর নির্ভর করতে পারে, যা প্রশিক্ষণের ডেটা তৈরি করতে বট ব্যবহার করতে পারে, যা একটি সমস্যা।
মেকানিক্যাল তুর্ক, একজনের জন্য, "পাওয়ার মেশিন লার্নিং মডেলের ডেটা লেবেলিং সমাধান" প্রদানকারী হিসাবে বিপণন করা হয়।
রিবেরিও বলেন, "মানুষের ডেটা হল সোনার মান, কারণ এটি মানুষের জন্যই আমরা যত্নশীল, বড় ভাষা মডেল নয়।" "আমি এমন একটি ওষুধ নেব না যা শুধুমাত্র একটি ড্রোসোফিলা জৈবিক মডেলে পরীক্ষা করা হয়েছিল," তিনি উদাহরণ হিসাবে বলেছিলেন।
আজকের এআই মডেলগুলির দ্বারা উত্পন্ন প্রতিক্রিয়াগুলি সাধারণত বেশ তুচ্ছ বা তুচ্ছ এবং মানুষের সৃজনশীলতার জটিলতা এবং বৈচিত্র্যকে ক্যাপচার করে না, গবেষকরা যুক্তি দিয়েছিলেন।
"কখনও কখনও আমরা ক্রাউডসোর্সড ডেটার সাথে যা অধ্যয়ন করতে চাই তা হল সঠিকভাবে যে উপায়ে মানুষ অসম্পূর্ণ," রবার্ট ওয়েস্ট, কাগজের সহ-লেখক এবং ইপিএফএল এর কম্পিউটার এবং যোগাযোগ বিজ্ঞানের স্কুলের একজন সহকারী অধ্যাপক, আমাদের বলেছেন৷
AI-এর উন্নতি অব্যাহত থাকায়, ক্রাউডসোর্স করা কাজের পরিবর্তন হতে পারে। রিবেরিও অনুমান করেছিলেন যে বড় ভাষার মডেলগুলি নির্দিষ্ট কাজে কিছু কর্মীকে প্রতিস্থাপন করতে পারে। "তবে, বিপরীতভাবে, মানুষের ডেটা আগের চেয়ে বেশি মূল্যবান হতে পারে এবং এইভাবে এটি হতে পারে যে এই প্ল্যাটফর্মগুলি বৃহৎ ভাষা মডেলের ব্যবহার প্রতিরোধ করার উপায়গুলি বাস্তবায়ন করতে সক্ষম হবে এবং এটি মানুষের ডেটার একটি উত্স হিসাবে রয়ে গেছে তা নিশ্চিত করতে সক্ষম হবে।"
কে জানে - হয়তো মানুষও প্রতিক্রিয়া তৈরি করতে বড় ভাষার মডেলের সাথে সহযোগিতা করতে পারে, তিনি যোগ করেছেন। ®
- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- ইভিএম ফাইন্যান্স। বিকেন্দ্রীভূত অর্থের জন্য ইউনিফাইড ইন্টারফেস। এখানে প্রবেশ করুন.
- কোয়ান্টাম মিডিয়া গ্রুপ। IR/PR প্রশস্ত। এখানে প্রবেশ করুন.
- প্লেটোএআইস্ট্রিম। Web3 ডেটা ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- উত্স: https://go.theregister.com/feed/www.theregister.com/2023/06/16/crowd_workers_bots_ai_training/
- : আছে
- : হয়
- :না
- $ ইউপি
- 16
- 7
- a
- সক্ষম
- সম্পর্কে
- বিমূর্ত
- শিক্ষাবিদ
- সঠিক
- যোগ
- আবার
- AI
- সব
- অনুমতি
- এছাড়াও
- সর্বদা
- মর্দানী স্ত্রীলোক
- an
- এবং
- অন্য
- কোন
- অভিগমন
- রয়েছি
- বিতর্কিত
- কৃত্রিম
- কৃত্রিম বুদ্ধিমত্তা
- AS
- সহায়ক
- At
- লেখক
- স্বয়ংক্রিয় পদ্ধতি প্রয়োগ করা
- অটোমেটেড
- স্বয়ংক্রিয়ভাবে
- দূরে
- BE
- কারণ
- হচ্ছে
- পক্ষপাত
- কোটি কোটি
- স্নিগ্ধ
- বট
- বট
- নির্মাণ করা
- নির্মিত
- কিন্তু
- by
- CAN
- গ্রেপ্তার
- যত্ন
- কিছু
- সুযোগ
- পরিবর্তন
- chatbot
- চ্যাটজিপিটি
- সস্তা
- শ্রেণীবদ্ধ
- ঘনিষ্ঠ
- CO
- সহ-লেখক
- কোড
- সহযোগী
- মিলিত
- যোগাযোগ
- কোম্পানি
- তুলনা
- সম্পূর্ণ
- সম্পূর্ণরূপে
- জটিলতা
- কম্পিউটার
- পর্যবসিত
- পরিচালিত
- বিষয়বস্তু
- প্রসঙ্গ
- চলতে
- করপোরেশনের
- পারা
- সৃজনশীলতা
- সংকটপূর্ণ
- ভিড়
- উপাত্ত
- ডেটাসেট
- উন্নত
- ডেভেলপারদের
- সর্বনাশা
- বৈচিত্র্য
- do
- ডলার
- প্রতি
- প্রভাব
- উত্সাহিত করা
- শেষ
- নিশ্চিত করা
- আনুমানিক
- এমন কি
- কখনো
- ঠিক
- উদাহরণ
- উদাহরণ
- পরীক্ষা
- ন্যায্য
- নকল
- মিথ্যা
- দ্রুত
- প্রতিপালিত
- কয়েক
- দৃষ্টি নিবদ্ধ করা
- জন্য
- পাওয়া
- থেকে
- ভবিষ্যৎ
- উত্পাদন করা
- উত্পন্ন
- পাওয়া
- GitHub
- স্বর্ণ
- স্বর্ণমান
- আছে
- he
- প্রচন্ডভাবে
- উচ্চ গুনসম্পন্ন
- ঊর্ধ্বতন
- কিভাবে
- যাহোক
- HTTPS দ্বারা
- মানবীয়
- মানুষেরা
- i
- চিহ্নিতকরণের
- if
- বাস্তবায়ন
- উন্নত করা
- in
- বৃদ্ধি
- ক্রমবর্ধমানভাবে
- বুদ্ধিমত্তা
- মধ্যে
- আইএসএন
- IT
- এর
- জবস
- JPG
- রাখা
- লেবেল
- শ্রম
- ভাষা
- বড়
- বৃহত্তর
- সর্বশেষ
- নেতৃত্ব
- শিক্ষা
- মত
- সম্ভবত
- লগ
- কম
- মেশিন
- মেশিন লার্নিং
- করা
- পরিচালিত
- ম্যানুয়ালি
- অনেক
- উপাদান
- মে..
- অর্থ
- যান্ত্রিক
- চিকিৎসা
- মেডিকেল গবেষণা
- ঔষধ
- প্রণালী বিজ্ঞান
- পদ্ধতি
- হতে পারে
- মডেল
- মডেল
- অধিক
- অনেক
- প্রয়োজন
- নেতিবাচক
- সংখ্যা
- বস্তু
- of
- প্রায়ই
- on
- ONE
- অনলাইন
- কেবল
- OpenAI
- or
- অন্যান্য
- আমাদের
- আউটপুট
- নিজের
- দেওয়া
- কাগজ
- কাগজপত্র
- পার্টি
- বেতন
- সম্প্রদায়
- শতাংশ
- নির্ভুল
- সম্পাদন করা
- সম্ভবত
- মাচা
- প্ল্যাটফর্ম
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- প্রচুর
- পুল
- ক্ষমতা
- বহুমূল্য
- অবিকল
- ভবিষ্যদ্বাণী করা
- প্রতিরোধ
- সমস্যা
- প্রযোজনা
- অধ্যাপক
- প্রদানকারী
- প্রদানের
- গুণ
- বাস্তব
- সত্যিই
- কারণ
- সুপারিশ করা
- বিশ্বাসযোগ্য
- নির্ভর করা
- দেহাবশেষ
- পুনরাবৃত্তিমূলক
- প্রতিস্থাপন করা
- প্রতিনিধিত্ব
- গবেষণা
- গবেষকরা
- প্রতিক্রিয়া
- ফলাফল
- রবার্ট
- চালান
- s
- বলেছেন
- একই
- স্কেল
- দৃশ্যকল্প
- স্কুল
- বিজ্ঞান
- গোপন
- দেখ
- সেবা
- পরিস্থিতিতে
- ছোট
- সলিউশন
- কিছু
- কেউ
- উৎস
- নির্দিষ্ট
- মান
- ছাত্র
- অধ্যয়ন
- জমা
- পেশ
- এমন
- প্রস্তাব
- সংক্ষিপ্ত করা
- সংক্ষিপ্তসার
- সুইস
- সুইজারল্যান্ড
- কৃত্রিম
- পদ্ধতি
- সিস্টেম
- গ্রহণ করা
- কার্য
- কাজ
- টীম
- পরীক্ষা
- প্রমাণিত
- চেয়ে
- যে
- সার্জারির
- ভবিষ্যৎ
- তাদের
- তাহাদিগকে
- নিজেদের
- তারপর
- সেখানে।
- এইগুলো
- তারা
- কিছু
- তৃতীয়
- এই
- এই সপ্তাহ
- থেকে
- আজ
- অত্যধিক
- সরঞ্জাম
- প্রতি
- ঐতিহ্যগত
- রেলগাড়ি
- প্রশিক্ষিত
- প্রশিক্ষণ
- চেষ্টা
- চালু
- ধরনের
- অসম্ভাব্য
- অনাবশ্যক
- us
- ব্যবহার
- ব্যবহার
- ব্যবহৃত
- ব্যবহারসমূহ
- ব্যবহার
- সাধারণত
- যাচাই করুন
- দামি
- খুব
- মাধ্যমে
- মজুরি
- প্রয়োজন
- ছিল
- উপায়
- we
- সপ্তাহান্তিক কাল
- আমরা একটি
- ছিল
- পশ্চিম
- কি
- কখন
- কিনা
- যে
- যখন
- ইচ্ছা
- সঙ্গে
- হয়া যাই ?
- কাজ করছে
- শ্রমিকদের
- খারাপ
- zephyrnet