ওয়েব সিভার 4chan থেকে পোস্টে প্রশিক্ষিত AI চ্যাটবট খারাপ আচরণ করেছে – ঠিক যেমন মানব সদস্যদের PlatoBlockchain ডেটা ইন্টেলিজেন্স। উল্লম্ব অনুসন্ধান. আ.

ওয়েব নর্দমা 4chan থেকে পোস্টে প্রশিক্ষিত AI চ্যাটবট খারাপ আচরণ করেছে – ঠিক মানুষের সদস্যদের মতো

একজন প্র্যাঙ্কস্টার গবেষক 134 মিলিয়নেরও বেশি পোস্টে একটি AI চ্যাটবটকে প্রশিক্ষণ দিয়েছেন কুখ্যাতভাবে ফ্রিহুইলিং ইন্টারনেট ফোরাম 4chan এর জন্য, তারপর এটিকে দ্রুত নিষিদ্ধ করার আগে সাইটে লাইভ সেট করেছেন।

ইয়ানিক কিলচার, একটি এআই গবেষক যিনি তার কিছু কাজ ইউটিউবে পোস্ট করেন, তার সৃষ্টিকে "GPT-4chan" বলে এবং বর্ণিত এটি "এখন পর্যন্ত সবচেয়ে খারাপ এআই" হিসাবে। তিনি একটি ওপেন সোর্স ভাষার মডেল, GPT-J 6B প্রশিক্ষণ দেন ডেটা সেটটি 3.5chan এর ইমেজবোর্ড থেকে স্ক্র্যাপ করা 4 বছরের মূল্যের পোস্ট রয়েছে। কিলচার তারপরে একটি চ্যাটবট তৈরি করে যা 4chan পোস্টগুলিকে ইনপুট হিসাবে প্রক্রিয়া করে এবং টেক্সট আউটপুট তৈরি করে, স্বয়ংক্রিয়ভাবে অসংখ্য থ্রেডে মন্তব্য করে।

নেটিজেনরা দ্রুত লক্ষ্য করেছেন একটি 4chan অ্যাকাউন্ট সন্দেহজনকভাবে ঘন ঘন পোস্ট করছে, এবং এটি একটি বট কিনা তা অনুমান করতে শুরু করেছে।

4chan হল ইন্টারনেটের একটি অদ্ভুত, অন্ধকার কোণ, যেখানে যে কেউ কথা বলতে এবং শেয়ার করতে পারে যতক্ষণ না তা বেআইনি না হয়। সাইটের অনেক বার্তা বোর্ডে কথোপকথন প্রায়শই সত্যিই খুব অদ্ভুত হয় - কীবোর্ডের পিছনে কোনও বুদ্ধিমত্তা, প্রাকৃতিক বা কৃত্রিম আছে কিনা তা বলা কঠিন হতে পারে।

GPT-4chan 4chan ব্যবহারকারীদের মতো আচরণ করেছিল, এটিকে নিষিদ্ধ করার আগে অপমান এবং ষড়যন্ত্রের তত্ত্বগুলি ছড়িয়েছিল।

রেজি কিছু নমুনা প্রম্পটে মডেলটি পরীক্ষা করেছে, এবং মূর্খ এবং রাজনৈতিক থেকে আক্রমণাত্মক এবং ইহুদি-বিরোধী প্রতিক্রিয়া পেয়েছে।

এটি সম্ভবত ইতিমধ্যে একটি খুব প্রতিকূল পরিবেশে পোস্ট করা কোনও ক্ষতি করেনি, তবে অনেকেই কিলচারকে তার মডেল আপলোড করার জন্য সমালোচনা করেছেন। “আমি এর সাথে একমত নই বিবৃতি যে আমি 4chan-এ যা করেছি, আমার বট পোস্টকে সংক্ষিপ্ত সময়ের জন্য রেখেছি, তা গভীরভাবে ভয়ঙ্কর ছিল (বট এবং খুব খারাপ ভাষা উভয়ই সেই ওয়েবসাইটে সম্পূর্ণরূপে প্রত্যাশিত) বা এটি একটি প্রাতিষ্ঠানিক নীতিশাস্ত্র পর্যালোচনা বোর্ডের সাথে পরামর্শ না করা গভীর দায়িত্বজ্ঞানহীন ছিল, "তিনি বলা নিবন্ধনকর্মী.

"আমি একমত নই যে মানব বিষয়গুলির উপর গবেষণাকে হালকাভাবে নেওয়া উচিত নয়, তবে এটি এমন একটি ফোরামে একটি ছোট প্র্যাঙ্ক ছিল যা ইতিমধ্যেই বিষাক্ত বক্তব্য এবং বিতর্কিত মতামতে ভরা, এবং সেখানে প্রত্যেকে এটি সম্পূর্ণরূপে প্রত্যাশা করে, এবং এটি আমার মতো করে সমস্ত নৈতিক মানকে সম্পূর্ণরূপে উপেক্ষা করা এমন কিছু যা আমার দিকে ঝাঁপিয়ে পড়তে পারে এবং এমন কিছু যেখানে লোকেরা দাঁড়িয়ে থাকতে পারে।"

কিলচার মডেলটিকে একটি বটে পরিণত করার জন্য কোডটি প্রকাশ করেননি, এবং বলেছিলেন যে টুইটারের মতো অন্য প্ল্যাটফর্মে একটি স্প্যাম অ্যাকাউন্ট তৈরি করতে তার কোডটি পুনরায় ব্যবহার করা কঠিন হবে, যেখানে এটি ঝুঁকিপূর্ণ এবং সম্ভাব্য আরও ক্ষতিকারক হবে। সেখানে বেশ কিছু সুরক্ষা ব্যবস্থা রয়েছে যা টুইটারের API এর সাথে সংযোগ করা এবং স্বয়ংক্রিয়ভাবে সামগ্রী পোস্ট করা কঠিন করে তোলে, তিনি বলেছিলেন। মডেলটি হোস্ট করতে এবং এটি ইন্টারনেটে চালু রাখতে কয়েকশ ডলার খরচ হয় এবং সম্ভবত দুর্বৃত্তদের পক্ষে এতটা উপযোগী নয়, তিনি মনে করেন।

“উদ্দেশ্যে কিছু করার জন্য এটি আসলে খুব কঠিন। … আমি যদি অনলাইনে অন্য লোকেদের অসন্তুষ্ট করতে চাই, আমার মডেলের দরকার নেই। লোকেরা নিজেরাই এটি ঠিকঠাক করতে পারে। তাই 'ইকি' [একটি] ভাষা মডেল যা একটি বোতামে ক্লিক করলে অপমান প্রকাশ করে বলে মনে হতে পারে, এটি আসলে খারাপ অভিনেতাদের জন্য বিশেষভাবে উপযোগী নয়,” তিনি আমাদের বলেছিলেন।

Hugging Face নামে একটি ওয়েবসাইট খোলামেলাভাবে GPT-4chan হোস্ট করেছে, যেখানে এটি ছিল কল্পনানুসারে এটি নিষ্ক্রিয় হওয়ার আগে 1,000 বারের বেশি ডাউনলোড করা হয়েছে৷

"আমরা এই মডেলের সাথে লেখকের দ্বারা করা প্রশিক্ষণ এবং পরীক্ষাগুলিকে সমর্থন করি না বা সমর্থন করি না," ক্লেমেন্ট ডেলাঙ্গু, সহ-প্রতিষ্ঠাতা এবং CEO Hugging Face, বলেছেন. "আসলে, 4chan-এ মডেল পোস্ট বার্তাগুলি রাখার পরীক্ষাটি আইএমও বেশ খারাপ এবং অনুপযুক্ত ছিল এবং লেখক যদি আমাদের জিজ্ঞাসা করতেন তবে আমরা সম্ভবত তাদের এটি করা থেকে নিরুৎসাহিত করার চেষ্টা করতাম।"

হাগিং ফেস মডেলটি সম্পূর্ণরূপে মুছে ফেলার বিরুদ্ধে সিদ্ধান্ত নিয়েছে এবং বলেছে যে কিলচার ব্যবহারকারীদের এর সীমাবদ্ধতা এবং সমস্যাযুক্ত প্রকৃতি সম্পর্কে স্পষ্টভাবে সতর্ক করেছিল। GPT-4chan-এরও সম্ভাব্য স্বয়ংক্রিয় বিষয়বস্তু পরিমার্জন সরঞ্জাম তৈরি বা বিদ্যমান বেঞ্চমার্কগুলি পরীক্ষা করার জন্য কিছু মূল্য রয়েছে।

মজার বিষয় হল, মডেলটি ট্রুথফুলকিউএ বেঞ্চমার্কে OpenAI-এর GPT-3-কে ছাড়িয়ে গেছে বলে মনে হচ্ছে - একটি কাজ যা মডেলের মিথ্যা বলার প্রবণতা পরীক্ষা করা। ফলাফলের মানে এই নয় যে GPT-4chan আরও সৎ, এবং পরিবর্তে বেঞ্চমার্কটি কতটা দরকারী তা নিয়ে প্রশ্ন উত্থাপন করে।

“TruthfulQA যেকোন উত্তরকে বিবেচনা করে যেটি স্পষ্টভাবে 'ভুল' উত্তরটি সত্য নয়। তাই যদি আপনার মডেল প্রতিটি প্রশ্নে 'স্প্যাগেটি' শব্দটি আউটপুট করে তবে এটি সর্বদা সত্য হবে,” কিলচার ব্যাখ্যা করেছেন।

"এটি হতে পারে যে GPT-4chan GPT-3 এর চেয়ে খারাপ ভাষা মডেল (আসলে, এটি অবশ্যই খারাপ)। কিন্তু এছাড়াও, TruthfulQA এমনভাবে তৈরি করা হয়েছে যে এটি ভুল উত্তর বের করার চেষ্টা করে, যার মানে একটি মডেল যত বেশি সম্মত, তার ভাড়া তত খারাপ। GPT-4chan, প্রকৃতিগতভাবে সবচেয়ে প্রতিকূল জায়গায় প্রশিক্ষিত হওয়ার কারণে, আপনি যা বলবেন তার সাথে প্রায়শই একমত হবে না, যা এই বেঞ্চমার্কে প্রায়শই সঠিক কাজ হতে পারে।"

তিনি পাবলিক ডাউনলোডের জন্য মডেলটিকে অক্ষম করার জন্য Hugging Face এর সিদ্ধান্তের সাথে একমত নন। "আমি মনে করি মডেলটি মূল্যায়নের আরও গবেষণা এবং পুনরুত্পাদনযোগ্যতার জন্য উপলব্ধ হওয়া উচিত। আমি স্পষ্টভাবে এর ত্রুটিগুলি বর্ণনা করি এবং এর ব্যবহারের জন্য নির্দেশিকা প্রদান করি," তিনি উপসংহারে বলেছিলেন। ®

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী