גילדת המחברים תובעת את OpenAI על שימוש בספרים לאימון ChatGPT

גילדת המחברים תובעת את OpenAI על שימוש בספרים לאימון ChatGPT

גילדת המחברים תובעת את OpenAI על שימוש בספרים לאימון ChatGPT PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

The Authors Guild, איגוד סחר של סופרים שפורסמו, ו-17 סופרים שחררו את הדרקונים ב-OpenAI בגלל השימוש לכאורה ביצירות שלהם כדי לאמן את הצ'אטבוטים שלה.

תובעים הנקובים בתביעה הייצוגית של הפרת זכויות יוצרים - שהוגשה במחוז הדרומי של ניו יורק בגין זכויות יוצרים - כוללים את דיוויד באלדאצ'י, מרי בליי, מייקל קונלי, סילביה דיי, ג'ונתן פראנזן, ג'ון גרישם, אלין הילדברנד, כריסטינה בייקר קלין, מאיה שנבהאג לאנג. , ויקטור לאוואל, ג'ורג' RR מרטין, ג'ודי פיקולט, דאגלס פרסטון, רוקסנה רובינסון, ג'ורג' סונדרס, סקוט טורו ורייצ'ל וייל.

השמיים תלונה [PDF] טוען שהשירותים של OpenAI "מסכנים את יכולתם של כותבי ספרות להתפרנס, בכך שמודלי השפה הגדולים מאפשרים לכל אחד ליצור - באופן אוטומטי וחופשי (או בזול מאוד) - טקסטים שהם היו משלמים לכותבים כדי ליצור."

הכותבים אינם מרוצים מכך שלא רק ש-OpenAI אימנה את המודלים שלה על עבודתם ללא רשות, אלא שמערכות הבינה המלאכותית מעתיקות באופן לא הוגן את הכתיבה שלהן כשהן מגיבות לבקשות של אנשים, או כך לפחות נטען.

התלונה מציינת ש-ChatGPT הונחה בהצלחה ליצור "מתווה מפורט לספר קדם ל משחקי הכס ... באמצעות אותן דמויות מספריו הקיימים של מרטין בסדרה שיר של אש וקרח." תוצאות דומות היו אפשריות עבור המחברים האחרים שהצטרפו לתביעה.

היכולת של ChatGPT לעשות זאת היא בעייתית, לאור המחברים אמרו שהם לא אישרו ל-OpenAI לגשת לעבודות שלהם כפי שנראה שעשה זאת. הכותבים מאמינים שכאשר מעבדת הבינה המלאכותית הזינה את עבודתם למודל במהלך ההכשרה, הדבר הסתכם בהעתקה לא מורשית וכי דגמי ה-GPT מפיקים נגזרות בלתי חוקיות של עבודה המוגנת בזכויות יוצרים.

"הליבה של האלגוריתמים הללו היא גניבה שיטתית בקנה מידה המוני", נטען בניירת התביעה.

התלונה מציינת ש-OpenAI הודתה בשימוש במערכי נתונים בשם "Books1" ו-"Books2" כדי להכשיר את דגמי השפה הגדולים שלה, אך לא חשפה את תוכנם. התובעים חושדים שספרי פיראטים עשו את דרכם לנתוני ההדרכה של OpenAI.

"הגידול בעוצמה ובתחכום מ-GPT-3 ל-GPT-4 מעיד על גידול מתאם בגודל של מערכי הנתונים של 'אימון', מה שמעלה את המסקנה שאחד או יותר ממקורות גדולים מאוד של ספרים אלקטרוניים פיראטיים שנדונו לעיל שימשו כדי " הרכבת' GPT-4", טוענת התלונה, והוסיפה "אין דרך אחרת ש-OpenAI הייתה יכולה להשיג את נפח הספרים הנדרש כדי 'לאמן' LLM רב עוצמה כמו GPT-4."

למעשה, התלונה מזכירה דרך נוספת: תשלום עבור התוכן המשמש לאימון ChatGPT. אך התביעה טוענת ש-OpenAI מעולם לא חשבה לעשות זאת, ומצטטת את עדותו של המנכ"ל סם אלטמן לקונגרס כי הוא מאמין בזכויות יוצרים ושילם עבור כמה נתוני הכשרה.

"עבור כותבי ספרות, השימוש הבלתי מורשה של OpenAI בעבודתם הוא גניבת זהות בקנה מידה גדול", אמרה מנכ"לית גילדת המחברים, מרי רסנברגר.

"סופרי ספרות יוצרים עולמות חדשים לגמרי מדמיונם - הם יוצרים את המקומות, האנשים והאירועים בסיפורים שלהם", הוסיפה, לפני שהתבוננה: "אנשים כבר מפיצים תוכן שנוצר על ידי גרסאות של GPT המחקות או משתמשות בסופרים מקוריים דמויות וסיפורים. חברות מוכרות בקשות המאפשרות לך 'להיכנס לעולם' של ספרי סופר. מדובר בהפרות ברורות של זכויות הקניין הרוחני של היוצרים המקוריים".

התובעים רוצים "נזקים בגין ההזדמנות האבודה להעניק רישיון ליצירותיהם, ובגין הגזילה בשוק שאפשרו הנתבעים [OpenAI] בכך שהפכו את התובעים לשותפים בלתי רצוניים בהחלפתם שלהם; וצו קבוע למניעת הישנות נזקים אלו".

הקופה ביקש מ-OpenAI תגובה ויעדכן את הסיפור הזה אם נקבל תשובה משמעותית. ®

בול זמן:

עוד מ הקופה