צ'טבוט AI שאומן על פוסטים מ-web sewer 4chan התנהג בצורה גרועה - בדיוק כמו חברים אנושיים PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

צ'טבוט AI שאומן על פוסטים מ-web sewer 4chan התנהג בצורה לא טובה - בדיוק כמו חברים אנושיים

חוקר קונדס אימן צ'טבוט של AI על יותר מ-134 מיליון פוסטים בפורום האינטרנט הידוע לשמצה 4chan, ולאחר מכן העלה אותו לפעיל באתר לפני שהוא נחסם במהירות.

יאניק קילצ'ר, אן חוקר בינה מלאכותית שמפרסם חלק מיצירותיו ליוטיוב, קרא ליצירתו "GPT-4chan" ו מְתוּאָר זה בתור "ה-AI הגרוע ביותר אי פעם". הוא אימן את GPT-J 6B, מודל שפת קוד פתוח, על א מערך נתונים מכיל פוסטים של 3.5 שנים שנגרדו מלוח התמונות של 4chan. לאחר מכן קילצ'ר פיתחה צ'אט בוט שעיבד פוסטים של 4chan כקלט ויצר פלטי טקסט, והגיב אוטומטית בשרשורים רבים.

משתמשים ברשת הבחינו במהירות שחשבון 4chan מפרסם באופן חשוד בתדירות גבוהה, והחלו לשער אם זה בוט.

4chan היא פינה מוזרה ואפלה של האינטרנט, שבה כל אחד יכול לדבר ולשתף כל מה שהוא רוצה כל עוד זה לא חוקי. שיחות על לוחות ההודעות הרבים של האתר הם לעתים קרובות מאוד מוזרים - זה יכול להיות מסובך לדעת אם יש אינטליגנציה כלשהי, טבעית או מלאכותית, מאחורי המקלדת.

GPT-4chan התנהג בדיוק כמו משתמשי 4chan, פלט עלבונות ותיאוריות קונספירציה לפני שהוא נאסר.

ה- Reg בדק את המודל לפי כמה הנחיות לדוגמה, וקיבל תגובות שנעו בין טיפשיים ופוליטיים לפוגעניים ואנטישמיות.

זה כנראה לא הזיק לפרסום במה שהוא כבר סביבה מאוד עוינת, אבל רבים מתחו ביקורת על קילצ'ר על שהעלה את הדגם שלו. "אני לא מסכים עם הצהרה שמה שעשיתי ב-4chan, ונתתי לבוט שלי לפרסם לזמן קצר, היה נורא מאוד (גם בוטים וגם שפה רעה מאוד צפויים באתר הזה) או שזה היה חוסר אחריות עמוקות לא להתייעץ עם ועדת ביקורת אתיקה מוסדית. סיפר הקופה.

"אני לא חולק על כך שאסור להקל ראש במחקר על נושאים אנושיים, אבל זו הייתה מתיחה קטנה בפורום שמלא בדיבור כבר רעיל ודעות שנויות במחלוקת, וכולם שם מצפים לזה לחלוטין, ומנסחים את זה כמוני. התעלמות מוחלטת מכל אמות המידה האתית היא רק משהו שאפשר להפיל בי ומשהו שבו אנשים יכולים להתייצב".

קילצ'ר לא פרסם את הקוד כדי להפוך את המודל לבוט, ואמר שיהיה קשה ליישם מחדש את הקוד שלו ליצירת חשבון ספאם בפלטפורמה אחרת כמו טוויטר, שם זה יהיה מסוכן יותר ועלול להזיק יותר. ישנם מספר אמצעי הגנה המקשים על חיבור עם ה-API של טוויטר ולפרסם תוכן באופן אוטומטי, אמר. זה גם עולה מאות דולרים לארח את הדגם ולהשאיר אותו פועל באינטרנט, וכנראה שהוא לא כל כך שימושי לטוענים, הוא חשב.

"למעשה קשה מאוד לגרום לזה לעשות משהו בכוונה. ... אם אני רוצה להעליב אנשים אחרים באינטרנט, אני לא צריך דוגמנית. אנשים יכולים לעשות את זה בסדר בעצמם. אז כפי שמודל השפה [שמוציא עלבונות בלחיצת כפתור עשוי להיראות "מגעיל", הוא למעשה לא שימושי במיוחד לשחקנים גרועים", הוא אמר לנו.

אתר אינטרנט בשם Hugging Face אירח את GPT-4chan בגלוי, היכן שהיה לכאורה הורדה יותר מ-1,000 פעמים לפני שהוא הושבת.

"אנחנו לא דוגלים או תומכים בהכשרה ובניסויים שנעשו על ידי המחבר עם המודל הזה", קלמנט דלאנג, מייסד שותף ומנכ"ל בחברת Hugging Face, אמר. "למעשה, הניסוי של המודל לפרסם הודעות ב-4chan היה IMO די גרוע ולא הולם, ואם המחבר היה שואל אותנו, כנראה שהיינו מנסים להרתיע אותם מלעשות זאת."

חיבוק פנים החליט שלא למחוק את הדגם לחלוטין, ואמר כי קילצ'ר הזהיר בבירור את המשתמשים על מגבלותיו ועל אופיו הבעייתי. ל-GPT-4chan יש גם ערך מסוים לבניית כלים פוטנציאליים לניהול תוכן או בדיקה של מדדים קיימים.

מעניין, נראה היה שהמודל עלה על ה-GPT-3 של OpenAI ב-TruthfulQA Benchmark – משימה שמטרתה לבחון את הנטייה של מודל לשקר. התוצאה לא בהכרח אומרת ש-GPT-4chan כנה יותר, ובמקום זאת מעלה שאלות לגבי מידת היעילות של ה-benchmark.

"TruthfulQA מחשיב כל תשובה שאינה במפורש התשובה ה'שגויה' כאמיתית. אז אם הדגם שלך יוציא את המילה 'ספגטי' לכל שאלה, זה תמיד יהיה אמת", הסביר קילצ'ר.

"יכול להיות ש-GPT-4chan הוא פשוט מודל שפה גרוע יותר מ-GPT-3 (למעשה, הוא בוודאי גרוע יותר). אבל גם, TruthfulQA בנוי כך שהוא מנסה להעלות תשובות שגויות, כלומר ככל שהמודל נוח יותר, כך הוא משתפר. GPT-4chan, מטבעו של הכשרה במקום הכי יריב אי פעם, כמעט תמיד לא יסכים עם כל מה שאתה אומר, מה שבמקרה זה במקרה זה, לעתים קרובות יותר הדבר הנכון לעשות."

הוא לא מסכים עם ההחלטה של ​​Hugging Face להשבית את המודל להורדות ציבוריות. "אני חושב שהמודל צריך להיות זמין למחקר נוסף ולשחזור של ההערכות. אני מתאר בבירור את החסרונות שלו ונותן הנחיות לשימוש בו", סיכם. ®

בול זמן:

עוד מ הקופה