צוות חוקרים מ-Humboldt-Universitat zu Berlin פיתח מודל גדול של בינה מלאכותית של שפה, עם ההבחנה של כוונון מכוון ליצירת פלטים עם הטיה מפורשת.
הדגם של הצוות, המכונה OpinionGPT, הוא גרסה מכווננת של Llama 2 של Meta, מערכת בינה מלאכותית הדומה ביכולתה ל-ChatGPT של OpenAI או לקלוד 2 של Anthropic.
באמצעות תהליך שנקרא כוונון עדין מבוסס הוראה, OpinionGPT יכול לכאורה להגיב להנחיות כאילו היה נציג של אחת מ-11 קבוצות הטיה: אמריקאי, גרמני, אמריקה הלטינית, מזרח תיכוני, נער, מישהו מעל גיל 30, אדם מבוגר , גבר, אישה, ליברל או שמרן.
מכריזה על "OpinionGPT: מודל GPT מוטה מאוד"! נסה את זה כאן: https://t.co/5YJjHlcV4n
כדי לחקור את ההשפעה של הטיה על תשובות המודל, שאלנו שאלה פשוטה: מה אם נכוון את א #GPT לדגמן רק עם טקסטים שנכתבו על ידי אנשים בעלי נטייה ימנית פוליטית?[1 / 3]
- אלן אקביק (@alan_akbik) ספטמבר 8, 2023
OpinionGPT שוכלל על קורפוס של נתונים שמקורם בקהילות "AskX", הנקראות subreddits, ב-Reddit. דוגמאות ל-subreddits אלה יכללו "שאל אישה" ו"שאל אמריקאי".
הצוות התחיל במציאת subreddits הקשורים ל-11 ההטיות הספציפיות ומשיכת 25 אלף הפוסטים הפופולריים ביותר מכל אחד מהם. לאחר מכן הם שמרו רק על הפוסטים שעמדו בסף המינימלי להצבעות בעד, לא הכילו ציטוט משובץ והיו מתחת ל-80 מילים.
עם מה שנשאר, נראה כאילו השתמשו ב- גישה דומה ל-Anthropic Constitutional AI. במקום ליצור דגמים חדשים לגמרי כדי לייצג כל תווית הטיה, הם בעצם כוונו עדין את הדגם הבודד של 7 מיליארד פרמטרים של Llama2 עם ערכות הוראות נפרדות לכל הטיה צפויה.
מידע נוסף: לשימוש ב-AI במדיה חברתית יש פוטנציאל להשפיע על סנטימנט ההצבעה
התוצאה, המבוססת על המתודולוגיה, הארכיטקטורה והנתונים מְתוּאָר במאמר המחקר של הצוות הגרמני, נראה כי היא מערכת בינה מלאכותית שמתפקדת יותר כמחולל סטריאוטיפים מאשר כלי לחקר הטיה בעולם האמיתי.
בשל אופי הנתונים שהמודל שוכלל, והקשר המפוקפק של הנתונים הללו לתוויות המגדירות אותו, OpinionGPT לא בהכרח מפיקה טקסט שמתיישר עם כל הטיה ניתנת למדידה בעולם האמיתי. זה פשוט מוציא טקסט המשקף את ההטיה של הנתונים שלו.
החוקרים עצמם מכירים בחלק מהמגבלות שהדבר מציב על המחקר שלהם, וכותבים:
"לדוגמה, יש להבין טוב יותר את התגובות של "אמריקאים" בתור 'אמריקאים שמפרסמים ב-Reddit', או אפילו 'אמריקאים שמפרסמים ב-subreddit המסוים הזה'. באופן דומה, יש להבין את 'גרמנים' כ'גרמנים שמפרסמים ב-subreddit הספציפי הזה' וכו'."
אפשר לחדד עוד יותר את האזהרות האלה כדי לומר שהפוסטים מגיעים מ"אנשים הטוענים שהם אמריקאים שמפרסמים ב-subreddit הספציפי הזה", מכיוון שאין שום אזכור בעיתון של בדיקה אם הפוסטרים שמאחורי פוסט נתון הם למעשה מייצגים של הקבוצה הדמוגרפית או ההטיה שהם טוענים שהם.
המחברים ממשיכים ומצהירים שהם מתכוונים לחקור מודלים שמתארים עוד יותר את הדמוגרפיה (כלומר: גרמנית ליברלית, גרמנית שמרנית).
נראה כי התפוקות שניתנו על ידי OpinionGPT משתנות בין ייצוג הטיה הניתנת להוכחה לבין שונות מאוד מהנורמה שנקבעה, מה שמקשה להבחין בכדאיותה ככלי למדידה או גילוי הטיה ממשית.
לפי OpinionGPT, כפי שמוצג בתמונה לעיל, למשל, אמריקה הלטינית מוטה כלפי כדורסל להיות הספורט האהוב עליהם.
מחקר אמפירי, לעומת זאת, ברור מצביע על שכדורגל (שנקרא גם כדורגל במדינות מסוימות) ובייסבול הם ענפי הספורט הפופולריים ביותר לפי צפייה והשתתפות ברחבי אמריקה הלטינית.
אותה טבלה גם מראה ש-OpinionGPT מציגה "כדור מים" כספורט המועדף עליה כאשר מקבלים הוראה לתת "תגובה של נער", תשובה שנראית סטטיסטית לא סביר להיות נציג של רוב בני 13-19 ברחבי העולם.
אותו דבר לגבי הרעיון שהאוכל האהוב על אמריקאי ממוצע הוא "גבינה". מצאנו עשרות סקרים באינטרנט שטוענים שפיצה והמבורגרים הם המאכלים האהובים על אמריקה, אבל לא מצאנו אף סקר או מחקר אחד שטען שהמנה מספר אחת של האמריקאים היא פשוט גבינה.
בעוד ש-OpinionGPT עשוי להיות לא מתאים לחקר הטיה אנושית ממשית, זה יכול להיות שימושי ככלי לחקר הסטריאוטיפים הטבועים במאגרי מסמכים גדולים, כגון סומדיטים בודדים או ערכות אימון בינה מלאכותית.
למי שסקרן, החוקרים עשו את OpinionGPT זמין מקוון לבדיקה ציבורית. עם זאת, על פי האתר, משתמשים עתידיים צריכים להיות מודעים לכך ש"תוכן שנוצר יכול להיות שקרי, לא מדויק או אפילו מגונה".
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. רכב / רכבים חשמליים, פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
- ChartPrime. הרם את משחק המסחר שלך עם ChartPrime. גישה כאן.
- BlockOffsets. מודרניזציה של בעלות על קיזוז סביבתי. גישה כאן.
- מקור: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test
- :יש ל
- :הוא
- :לֹא
- $ למעלה
- 11
- 30
- 7
- 8
- 80
- a
- מֵעַל
- פי
- ממשי
- AI
- אימון AI
- AL
- אלן
- מיישר
- גם
- אמריקה
- אֲמֶרִיקָאִי
- אמריקאים
- an
- ו
- לענות
- תשובות
- כל
- לְהוֹפִיעַ
- מופיע
- ארכיטקטורה
- ARE
- סביב
- מלאכותי
- בינה מלאכותית
- AS
- מחברים
- מְמוּצָע
- מודע
- בייסבול
- מבוסס
- כדורסל
- BE
- היה
- מאחור
- להיות
- ברלין
- מוטב
- בֵּין
- הטיה
- מְשׁוּחָד
- הטיות
- אבל
- by
- נקרא
- CAN
- יכולת
- ChatGPT
- לטעון
- נתבע
- תביעה
- בבירור
- Cointelegraph
- איך
- הקהילות
- שמרני
- להכיל
- תוכן
- יכול
- מדינות
- נוצר
- סקרן
- נתונים
- הגדרה
- דמוגרפי
- דמוגרפיה
- נגזר
- מפותח
- DID
- נבדלים זה מזה
- קשה
- מגלה
- צלחת
- הבחנה
- מסמך
- לא
- עשרות
- E&T
- כל אחד
- מזרחי
- מוטבע
- לַחֲלוּטִין
- למעשה
- נוסד
- וכו '
- אֲפִילוּ
- דוגמה
- דוגמאות
- צפוי
- לחקור
- היכרות
- ביטא
- עובדה
- שקר
- חביב
- מציאת
- מזון
- מזונות
- כדורגל
- בעד
- מצא
- החל מ-
- פונקציות
- נוסף
- ליצור
- גנרטור
- גרמנית
- לתת
- נתן
- Go
- Goes
- קְבוּצָה
- קבוצה
- יש
- יש
- כאן
- אולם
- HTTPS
- בן אנוש
- רעיון
- ie
- if
- תמונה
- פְּגִיעָה
- in
- לֹא מְדוּיָק
- לכלול
- בנפרד
- הטמון
- למשל
- מוֹדִיעִין
- בכוונת
- בכוונה
- לחקור
- IT
- שֶׁלָה
- jpg
- תווית
- תוויות
- שפה
- גָדוֹל
- הלטינית
- אמריקה הלטינית
- אמריקה הלטינית
- עזבו
- מגבלות
- לאמה
- עשוי
- עשייה
- איש
- מדידת
- מדיה
- נפגש
- מֵתוֹדוֹלוֹגִיָה
- אמצע
- יכול
- מינימום
- מודל
- מודלים
- יותר
- רוב
- הכי פופולארי
- טבע
- בהכרח
- חדש
- לא
- מספר
- of
- on
- ONE
- באינטרנט
- רק
- or
- הַחוּצָה
- תפוקה
- יותר
- מאמר
- השתתפות
- מסוים
- אדם
- אנשים
- פיצה
- מקומות
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- מבחינה פוליטית
- פופולרי
- הודעה
- הודעות
- פוטנציאל
- תהליך
- ציבורי
- מושך
- שאלה
- לצטט
- במקום
- ממשי
- עולם אמיתי
- להכיר
- מעודן
- משקף
- קָשׁוּר
- יחס
- לייצג
- נציג
- המייצג
- מחקר
- חוקרים
- להגיב
- תגובות
- תוצאה
- אותו
- לומר
- מדענים
- נראה
- נפרד
- סטים
- צריך
- הראה
- הופעות
- דומה
- באופן דומה
- פָּשׁוּט
- בפשטות
- יחיד
- כדורגל
- חֶברָתִי
- מדיה חברתית
- כמה
- מישהו
- ספציפי
- לְסוֹבֵב
- ספורט
- ספורט
- החל
- מדינה
- לימוד
- לומד
- כזה
- סֶקֶר
- מערכת
- שולחן
- נבחרת
- מִתבַּגֵר
- מבחן
- בדיקות
- טֶקסט
- מֵאֲשֶׁר
- זֶה
- השמיים
- העולם
- שֶׁלָהֶם
- עצמם
- אז
- אלה
- הֵם
- זֶה
- אלה
- אם כי?
- סף
- בכל
- ל
- כלי
- לקראת
- הדרכה
- לנסות
- תחת
- הבין
- על
- נוֹהָג
- מְשׁוּמָשׁ
- משתמשים
- גִרְסָה אַחֶרֶת
- מאוד
- יכולת חיוניות הקיום
- הצבעה
- היה
- we
- אתר
- היו
- מה
- מתי
- אם
- מי
- עם
- אשה
- מילים
- עוֹלָם
- היה
- כתיבה
- כתוב
- שנה
- אתה
- עצמך
- זפירנט