צלקת נפשית: עובדים קנייתים לימדו את ChatGPT לזהות טקסט פוגעני

צלקת נפשית: עובדים קנייתים לימדו את ChatGPT לזהות טקסט פוגעני

מצולק נפשית: עובדים קנייתים לימדו את ChatGPT לזהות טקסט פוגעני PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

לפי הדיווחים, OpenAI שכרה עובדים בקניה - הקרנת עשרות אלפי דוגמאות טקסט לתוכן סקסיסטי, גזעני, אלים ופורנוגרפי - כדי לעזור להפוך את מודל ה-ChatGPT שלה לפחות רעיל.

פורסם בנובמבר האחרון, ChatGPT כבש את האינטרנט בסערה. היכולת שלו ליצור טקסט אוטומטית בהינתן הנחיה קלט הובילה למיליוני משתמשים שהורו לו לבצע את כל סוגי המשימות השונות - לספר בדיחות, לכתוב קוד, לענות על שאלות ועוד.

לא כל ההוראות האלה היו שפירות לחלוטין - אחרי הכל אנחנו רק בני אדם. עם זאת, ChatGPT נועד להיות יותר שיחתי ובטוח יותר מקודמו GPT-3 - הוא יכול להודות בטעויות ולסרב לבצע בקשות בלתי הולמות.

על מנת ללמוד את המאפיינים של שפה פוגענית ופוגענית, היה צורך להכשיר את ChatGPT על כמויות ענקיות של נתונים נקיים מתויגים המראים את ההבדל בין תוכן בטוח למזיק.

תיוג נתונים מייגע וגוזל זמן. העבודה מועברת בדרך כלל לקבלנים שמגייסים עובדים ממדינות שבהן כוח העבודה זול יותר. בשנת 2021, על פי הדיווחים, OpenAI חתמה על שלושה חוזים בשווי של כ-200,000 דולר עם sama - סטארט-אפ המספק שירותי הערות נתונים המבוסס בסן פרנסיסקו ופועל במדינות מתפתחות - כדי לתייג טקסט לאימון ChatGPT, על פי לדווח in זְמַן השבוע.

סאמה גייס אז שלושה תריסר עובדים בקניה שחולקו לשלוש קבוצות, שכל אחת מהן הופקדה לסרוק אלפי דוגמאות טקסט המכילות התעללות מינית, דברי שטנה ואלימות.

הטקסט, שנגרד מהאינטרנט, תיאר כל מיני מעשים מסוכנים, בלתי חוקיים וזימה, כולל רצח, התאבדות, עינויים וגילוי עריות. חלק מהעובדים דיווחו על טראומה מהצורך לעבד כל כך הרבה תוכן מחריד. גבר אחד אמר שהוא סבל מחזיונות חוזרים לאחר שקרא קטע המתאר גבר שמקיים יחסי מין עם כלב בחברת ילד צעיר.

"זה היה עינוי," אמר. "תקרא מספר אמירות כאלה לאורך כל השבוע. עד שמגיע ליום שישי, מפריע לך לחשוב על התמונה הזו".

העובדים עברו משמרות של תשע שעות, והרוויחו בין 163 ל-248 שילינג קנייתי לשעה. זה בערך $1.32 עד $2 - סכומים ממש לא משמעותיים עבור OpenAI, שצפויה להסתכם ב-200 מיליון דולר ב-2023.

חוזה נוסף לתיוג נתונים שאינו קשור ל-ChatGPT כלל את סאמה בבקשה לעובדים למצוא תמונות מגעילות, פורנוגרפיות ואלימות המתארות דברים כמו מוות, אונס וחיות. התוכן - שחלקו יהיה בלתי חוקי בארה"ב - גרם לכאורה לסאמה לסיים את החוזים שלה עם OpenAI עד פברואר 2022, שמונה חודשים לפני שתוכנן במקור. על פי הדיווחים, עובדים שגויסו על ידי Sama נאמרו כי עבודתם עם OpenAI הייתה משומרת לאחר שהסטארט-אפ התמודד עם ביקורת קשה על כך שעבד עם פייסבוק של Meta בפרויקט אחר של ניהול תוכן.

"סאמה סיים את חוזה OpenAI כי הצוות במזרח אפריקה לא היה נוח עם העבודה המבוקשת. סוף חוזה Meta נפרד, אך קשור. לאחר התייעצות עם הצוות הגלובלי שלה, סמה קיבלה את ההחלטה לעזוב את כל עבודת ניהול התוכן מכיוון שהיא לא תואמת את החזון והייעוד של החברה", אמר לנו דובר החברה.

הבוגר יסיים את כל פרויקטי תיוג הנתונים לניהול תוכן במרץ 2023 והקים "גילדת אתיקה" - קבוצת עובדים שתבדוק בקשות עבודה, כך נאמר לנו.

בהצהרות ששותפו עם זְמַן, OpenAI אישרה שהיא עבדה עם Sama כדי לתייג נתונים ששימשו לאימון ChatGPT ואמרה שיש תקשורת שגויה לגבי סוגי התמונות שהם רוצים לאסוף. לפי הדיווחים, היא לא רצתה תמונות לא חוקיות ולא צפה בהן.

ערכו של דולר

"להבהיר, סאמא משלמת בין 26,600 ל-40,000 שילינג קנייתי (209 עד 322 דולר) לחודש, שזה יותר מכפול משכר המינימום בקניה וגם הרבה מעל שכר המחיה", אמר דובר מטעם סמה. הקופה.

"להשוות את זה לשכר בארה"ב זו שוויון שווא שמאפיין לא נכון את המצב. שכר מערבי השוואתי יהיה בין 30 ל-45 דולר לשעה. Sama משלם כמעט כפול ממה שמנחי תוכן אחרים באזור משלמים, ומציע הטבות מלאות וחבילת פנסיה.

"המשימה שלנו היא להבטיח שבינה כללית מלאכותית תועיל לאנושות כולה, ואנחנו עובדים קשה כדי לבנות מערכות בינה מלאכותית בטוחות ושימושיות המגבילות הטיות ותכנים מזיקים. סיווג וסינון מזיקים [טקסט ותמונות] הם צעד הכרחי במזעור כמות התוכן האלים והמיני הנכלל בנתוני ההדרכה ויצירת כלים שיכולים לזהות תוכן מזיק".

עסקי תיוג נתונים כמו סאמה אומרים שהם עוזרים להוציא אנשים מעוני במדינות עניות יותר, אבל זְמַןהחקירה של זה היא תזכורת ברורה לכך שהיכולות הקסומות לכאורה של דגמי AI בנויות על גב של עבודה בעלות נמוכה.

"המשימה של סאמה היא לשבור מחסומים לתעסוקה פורמלית על ידי מתן עבודה לאנשים מוכשרים שאולי לא יהיו להם הזדמנויות קריירה שוות. סאמה מעסיקה אנשים שאחרת לא היו מקבלים את הכישורים למשרות טכנולוגיות ברמת הכניסה, ואז מכשירה אותם - לא רק לעבודה, אלא למסלול קריירה - על ידי מתן שיעורי המשך, שיעורי כתיבת קורות חיים, שיעורי חינוך פיננסי והזדמנויות להתקדם בפנים או מחוץ לארגון", אמר לנו דובר בהצהרה.

"סאמה השפיע על למעלה מ-60,000 אנשים, שלח 20 אנשים לאוניברסיטה באמצעות תוכניות המלגות שלנו, וסיפקה 160,000 דולר במימון לעסקים וסטארט-אפים של עובדים".

בינתיים, ההייפ של בינה כללית מלאכותית ממשיך להתפתח. אפילו חברות הבינה המלאכותית הטובות ביותר עדיין לא פיצחו את סוד בניית המודלים המתקדמים מספיק כדי ללמוד דפוסים מנתונים ביעילות ללא פיקוח אנושי.

הטכנולוגיה אולי התקדמה, אבל היא עדיין מסתמכת על עובדים ממדינות מתפתחות שיושבים מול מסכי מחשב ומבצעים משימות חוזרות ומונוטוניות כל היום כדי להכשיר דגמי AI ענקיים עבור חברות טכנולוגיה שמרוויחות מיליוני דולרים.

הקופה ביקשה מ-OpenAI תגובה. ®

בול זמן:

עוד מ הקופה