زخم روانی: کارگران کنیایی به ChatGPT یاد دادند که متن توهین‌آمیز را تشخیص دهد

زخم روانی: کارگران کنیایی به ChatGPT یاد دادند که متن توهین‌آمیز را تشخیص دهد

زخم روانی: کارگران کنیایی به ChatGPT آموزش دادند تا متن توهین‌آمیز را تشخیص دهد. جستجوی عمودی Ai.

گزارش شده است که OpenAI کارگرانی را در کنیا استخدام کرده است - ده‌ها هزار نمونه متن را برای محتوای جنسی، نژادپرستانه، خشونت‌آمیز و هرزه‌نگاری غربال می‌کنند تا به کاهش سمیت مدل ChatGPT کمک کنند.

ChatGPT که نوامبر گذشته منتشر شد، طوفان اینترنت را به خود اختصاص داده است. توانایی آن برای تولید متن به طور خودکار با یک اعلان ورودی باعث شده است که میلیون ها کاربر به آن دستور دهند تا انواع کارهای مختلف را انجام دهد - جوک گفتن، نوشتن کد، پاسخ دادن به سؤالات و موارد دیگر.

همه آن دستورالعمل‌ها کاملاً بی‌خطر نبوده‌اند - ما فقط انسان هستیم. با این حال، ChatGPT به گونه ای طراحی شده است که نسبت به GPT-3 قبلی خود مکالمه تر و ایمن تر باشد - می تواند خطاها را بپذیرد و از انجام درخواست های نامناسب خودداری کند.

برای یادگیری ویژگی‌های زبان توهین‌آمیز و توهین‌آمیز، ChatGPT باید بر روی مقادیر عظیمی از داده‌های تمیز و برچسب‌گذاری شده که تفاوت بین محتوای ایمن و مضر را نشان می‌دهد، آموزش ببیند.

برچسب گذاری داده ها خسته کننده و زمان بر است. این کار معمولاً به پیمانکارانی واگذار می شود که کارمندانی را از کشورهایی که نیروی کار ارزان تر است استخدام می کنند. گزارش شده است که در سال 2021، OpenAI سه قرارداد به ارزش حدود 200,000 دلار با آنها امضا کرد سما - یک استارتاپ ارائه دهنده خدمات حاشیه نویسی داده مستقر در سانفرانسیسکو و فعال در کشورهای در حال توسعه - برای برچسب گذاری متن برای آموزش ChatGPT، طبق یک گزارش in زمان این هفته است.

سما سپس سه دوجین کارگر را در کنیا استخدام کرد که به سه گروه تقسیم شدند و هر کدام وظیفه داشتند هزاران نمونه متن حاوی سوء استفاده جنسی، سخنان نفرت انگیز و خشونت را بررسی کنند.

این متن که از اینترنت حذف شده است، انواع اعمال خطرناک، غیرقانونی و وحشیانه از جمله قتل، خودکشی، شکنجه و زنای با محارم را توصیف می کند. برخی از کارمندان گزارش دادند که از پردازش محتوای وحشتناک بسیار آسیب دیده اند. یک مرد گفت که پس از خواندن قسمتی که در آن مردی را در حال رابطه جنسی با یک سگ در جمع یک کودک خردسال توصیف می کند، از بینایی های مکرر رنج می برد.

او گفت: «این شکنجه بود. «شما در طول هفته تعدادی از این قبیل بیانیه ها را خواهید خواند. زمانی که به جمعه می رسد، از فکر کردن به آن تصویر ناراحت می شوید.»

کارگران شیفت های 163 ساعته را تحمل کردند و بین 248 تا 1.32 شیلینگ کنیا در ساعت تولید کردند. این حدود 2 تا 200 دلار است - مبالغ واقعاً ناچیز برای OpenAI که پیش‌بینی می‌شود در سال 2023 گردش مالی XNUMX میلیون دلاری داشته باشد.

یکی دیگر از قراردادهای برچسب‌گذاری داده‌ها که به ChatGPT مربوط نمی‌شود، شامل این بود که سما از کارمندان می‌خواست تصاویر تند و زننده، مستهجن و خشونت‌آمیز را پیدا کنند که مواردی مانند مرگ، تجاوز جنسی و حیوانات را به تصویر می‌کشد. این محتوا - که برخی از آنها در ایالات متحده غیرقانونی است - ظاهراً باعث شد سما قراردادهای خود را با OpenAI تا فوریه 2022 پایان دهد، هشت ماه قبل از برنامه ریزی اولیه. بنا بر گزارش ها، به کارمندان استخدام شده توسط سما گفته شد که کار آنها با OpenAI پس از اینکه استارتاپ با انتقاد شدید به دلیل همکاری با فیس بوک متا در پروژه دیگری برای تعدیل محتوا مواجه شد، متوقف شد.

ساما به قرارداد OpenAI پایان داد زیرا تیم در شرق آفریقا با کار درخواستی راحت نبود. پایان قرارداد متا جدا، اما مرتبط است. پس از مشورت با تیم جهانی خود، سما تصمیم گرفت از تمام کارهای تعدیل محتوا خارج شود زیرا با چشم انداز و ماموریت شرکت همخوانی نداشت.» یکی از سخنگویان شرکت به ما گفت.

به ما گفته می‌شود که راه‌اندازی به تمام پروژه‌های برچسب‌گذاری داده‌ها برای تعدیل محتوا در مارس ۲۰۲۳ پایان می‌دهد و یک «انجمن اخلاق» راه‌اندازی کرده است - گروهی از کارمندان که درخواست‌های کاری را بررسی می‌کنند.

در اظهارات به اشتراک گذاشته شده با زمانOpenAI تأیید کرد که با Sama برای برچسب‌گذاری داده‌های مورد استفاده برای آموزش ChatGPT کار کرده است و گفت که در مورد انواع تصاویری که آنها می‌خواستند جمع‌آوری کنند، ارتباط نادرستی وجود دارد. گزارش شده است که تصاویر غیرقانونی نمی خواست و آنها را مشاهده نمی کرد.

ارزش یک دلار

یکی از سخنگویان سما گفت: «برای روشن شدن، سما بین 26,600 تا 40,000 شیلینگ کنیا (209 تا 322 دلار) در ماه پرداخت می کند که بیش از دو برابر حداقل دستمزد در کنیا و همچنین بسیار بالاتر از دستمزد زندگی است. ثبت نام.

«مقایسه آن با دستمزدهای ایالات متحده معادل نادرستی است که وضعیت را نادرست توصیف می کند. دستمزد نسبی غربی بین 30 تا 45 دلار در ساعت خواهد بود. سما تقریباً دوبرابر مبلغی را پرداخت می کند که سایر مدیران محتوا در منطقه می پردازند و یک بسته کامل مزایا و مستمری ارائه می دهد.

ماموریت ما این است که اطمینان حاصل کنیم که هوش مصنوعی به نفع تمام بشریت است و ما سخت کار می کنیم تا سیستم های هوش مصنوعی ایمن و مفیدی بسازیم که سوگیری و محتوای مضر را محدود می کند. طبقه‌بندی و فیلتر کردن [متن و تصاویر] مضر گامی ضروری برای به حداقل رساندن میزان محتوای خشونت‌آمیز و جنسی موجود در داده‌های آموزشی و ایجاد ابزارهایی است که می‌تواند محتوای مضر را شناسایی کند.»

کسب‌وکارهای برچسب‌گذاری داده‌ها مانند سما می‌گویند که به رهایی مردم از فقر در کشورهای فقیرتر کمک می‌کنند، اما زمانبررسی‌ها یادآور این نکته است که توانایی‌های به ظاهر جادویی مدل‌های هوش مصنوعی بر پایه نیروی کار کم‌هزینه ساخته شده‌اند.

ماموریت سما این است که با دادن کار به افراد با استعدادی که در غیر این صورت از فرصت های شغلی برابری برخوردار نباشند، موانع موجود برای اشتغال رسمی را از بین ببرد. سما افرادی را استخدام می کند که در غیر این صورت شرایط لازم برای مشاغل فنی سطح پایه را ندارند، سپس آنها را - نه فقط برای یک شغل، بلکه یک مسیر شغلی - با ارائه کلاس های آموزش مداوم، کلاس های نوشتن رزومه، کلاس های آموزش مالی و فرصت هایی برای پیشرفت در داخل آموزش می دهد. یک سخنگوی در بیانیه ای به ما گفت.

سما بیش از 60,000 نفر را تحت تاثیر قرار داده است، 20 نفر را از طریق برنامه های بورسیه تحصیلی ما به دانشگاه فرستاده و 160,000 دلار بودجه برای مشاغل کارمند و استارت آپ ها فراهم کرده است."

در همین حال، هیاهوی هوش مصنوعی عمومی همچنان در حال افزایش است. حتی بهترین شرکت‌های هوش مصنوعی هنوز راز ساخت مدل‌های پیشرفته را کشف نکرده‌اند تا الگوها را از داده‌ها به‌طور مؤثر و بدون نظارت انسانی یاد بگیرند.

این فناوری ممکن است پیشرفت کرده باشد، اما همچنان به کارگرانی از کشورهای در حال توسعه متکی است که در تمام روز جلوی نمایشگرهای رایانه می نشینند و کارهای تکراری و یکنواخت را انجام می دهند تا مدل های غول پیکر هوش مصنوعی را برای شرکت های فناوری که میلیون ها دلار درآمد دارند، آموزش دهند.

ثبت نام از OpenAI نظر خواسته است. ®

تمبر زمان:

بیشتر از ثبت نام