ענקיות הטכנולוגיה עולות שאלות על חוקי זכויות היוצרים של LLM

ענקיות הטכנולוגיה עולות שאלות על חוקי זכויות היוצרים של LLM

ענקיות הטכנולוגיה עולות שאלות על חוקי זכויות היוצרים של LLM PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

בפרלמנט של בריטניה השבוע, מיקרוסופט ומטה התנערו מהשאלה האם יש לשלם ליוצרים כאשר החומרים שלהם מוגנים בזכויות יוצרים משמשים לאימון מודלים של שפות גדולות.

הטיטאנים הטכנולוגיים, עם הכנסות משולבות הרבה יותר מ-200 מיליארד דולר, היו בהישג יד גריל על ידי ועדת התקשורת והדיגיטל של בית הלורדים כאשר שאלת זכויות היוצרים הגיעה למוקד.

בספטמבר, גילדת המחברים, איגוד מקצועי לסופרים שפורסמו, ו-17 סופרים הגיש תביעה ייצוגית בארה"ב בגלל השימוש של OpenAI בחומר שלהם ליצירת שירותי ה-LLM שלה.

מנכ"ל OpenAI, סם אלטמן, אמר מאז שהחברה תכסה את העלויות המשפטיות של לקוחותיה עבור תביעות הפרת זכויות יוצרים במקום להסיר את החומר ממערכות ההדרכה שלה.

מיקרוסופט מוּשׁקָע 13 מיליארד דולר ב-OpenAI. יש לה שותפות מורחבת עם מפתח למידת המכונה, מפעילה את עומסי העבודה שלה בפלטפורמת הענן של Azure ומשתמשת במודלים שלה להפעלת העוזר האוטומטי Copilot.

בשיחה עם הלורדים אתמול, אוון לארטר, מנהל מדיניות ציבורית במשרד של מיקרוסופט ל-Responsible AI, אמר: "חשוב להעריך מהו מודל שפה גדול. זה מודל גדול שמאומן על נתוני טקסט, לומד את הקשרים בין רעיונות שונים. זה לא בהכרח לינוק משהו מלמטה".

הוא אמר שצריכה להיות "מסגרת" שתספק הגנה מסוימת לחומר המוגן בזכויות יוצרים ומיקרוסופט תיקח אחריות על כל הפרה של המערכות המבוססות על LLM שלה. אבל הוא גם אמר שמיקרוסופט תומכת לאחרונה דוח Valance לחוק "פרו-חדשנות" בינה מלאכותית בבריטניה, הדוגל בחריגות טקסט ונתונים במודלים של אימון.

אבל דונלד מייקל, לורד פוסטר מבאת', לחץ על לאטרר אם הוא יקבל שאם חברה משתמשת בחומר המוגן בזכויות יוצרים כדי לבנות LLM למטרות רווח, יש להחזיר לבעל זכויות היוצרים.

מנהל מיקרוסופט אמר: "חשוב מאוד להבין שאתה צריך לאמן את מודלי השפה הגדולים האלה על מערכי נתונים גדולים אם אתה מתכוון לגרום להם לפעול ביעילות, אם אתה מתכוון לאפשר להם להיות בטוחים ומאובטחים... יש גם כמה בעיות בתחרות [לוודא] שההדרכה של דגמים גדולים זמינה לכולם. אם אתה הולך רחוק מדי בנתיב שבו קשה מאוד להשיג נתונים כדי להכשיר דגמים, אז פתאום, היכולת לעשות זאת תהיה נחלתם של חברות גדולות מאוד".

התדיינות משפטית כבר מתנהלת כדי להתייחס לאופן שבו מערכי נתונים של אימון ספרים 1, Books2 ו-Books3, שלמעשה פיראטים חומר המוגן בזכויות יוצרים, שימשו כדי לעזור לבנות LLMs פופולריים.

מטה עומדת מאחורי ה Llama 2 LLM, שמרחיב עד 70 מיליארד פרמטרים. ענקית המדיה החברתית קידמה את המודל כקוד פתוח, אם כי טהרני FOSS מצביעים על כמה סייגים בגישתו.

בשיחה עם הלורדים, רוב שרמן, סגן נשיא וסגן קצין הפרטיות הראשי למדיניות ב-Meta, אמר שהחברה תציית לחוק.

אבל הוא הוסיף כי "שמירה על גישה רחבה למידע באינטרנט ולמידע כולל לשימוש בחדשנות כזו היא די חשובה. אני כן תומך במתן היכולת לבעלי זכויות לנהל את אופן השימוש במידע שלהם.

"אני קצת זהיר מהרעיון של לאלץ חברות שבונות בינה מלאכותית להיכנס להסכמים מותאמים אישית עם בעלי זכויות בודדים או צו לשלם עבור תוכן שאין לו ערך כלכלי עבורם".

בשבוע שעבר, דן קונווי, מנכ"ל איגוד המוציאים לאור בבריטניה, אמר לוועדה שדגמי שפות גדולים מפרים תוכן המוגן בזכויות יוצרים ב"קנה מידה מסיבי לחלוטין.

"אנחנו יודעים את זה בתעשיית ההוצאה לאור בגלל מסד הנתונים של Books3 שמפרט 120,000 כותרי ספרים פיראטיים, שאנחנו יודעים שנבלעו על ידי מודלים שפות גדולים", אמר. "אנחנו יודעים שהתוכן נבלע בקנה מידה עצום לחלוטין על ידי מודלים של שפות גדולות. LLMs אכן מפרים זכויות יוצרים בחלקים מרובים של התהליך מבחינת מתי הם אוספים מידע זה, האופן שבו הם מאחסנים מידע זה וכיצד הם מטפלים בו. חוק זכויות היוצרים מופר בקנה מידה עצום".

באותו דיון, ד"ר היילי בושר, קוראת בדיני קניין רוחני באוניברסיטת ברונל בלונדון, אמרה שהיא לא מייצגת חברות טכנולוגיה או יוצרי תוכן והציעה נקודת מבט נייטרלית.

"העיקרון של מתי אתה צריך רישיון ומתי אתה לא ברור", היא אמרה, "וכדי לעשות שכפול של יצירה המוגנת בזכויות יוצרים ללא רשות יהיה צורך ברישיון או שאחרת תהיה הפרה. זה מה ש-AI עושה בשלבים שונים של התהליך: הקליטה, הפעלת התוכנית, ואולי אפילו הפלט.

"כמה מפתחי בינה מלאכותית וטכנולוגיה טוענים לפרשנות אחרת של החוק. אני לא מייצג אף אחד מהצדדים האלה. אני מומחה לזכויות יוצרים, ומתוך עמדתי, מתוך הבנה של מה זכויות יוצרים אמורות להשיג וכיצד הן משיגות אותן, תידרש רישיון עבור הפעילות הזו". ®

בול זמן:

עוד מ הקופה