בפרלמנט של בריטניה השבוע, מיקרוסופט ומטה התנערו מהשאלה האם יש לשלם ליוצרים כאשר החומרים שלהם מוגנים בזכויות יוצרים משמשים לאימון מודלים של שפות גדולות.
הטיטאנים הטכנולוגיים, עם הכנסות משולבות הרבה יותר מ-200 מיליארד דולר, היו בהישג יד גריל על ידי ועדת התקשורת והדיגיטל של בית הלורדים כאשר שאלת זכויות היוצרים הגיעה למוקד.
בספטמבר, גילדת המחברים, איגוד מקצועי לסופרים שפורסמו, ו-17 סופרים הגיש תביעה ייצוגית בארה"ב בגלל השימוש של OpenAI בחומר שלהם ליצירת שירותי ה-LLM שלה.
מנכ"ל OpenAI, סם אלטמן, אמר מאז שהחברה תכסה את העלויות המשפטיות של לקוחותיה עבור תביעות הפרת זכויות יוצרים במקום להסיר את החומר ממערכות ההדרכה שלה.
מיקרוסופט מוּשׁקָע 13 מיליארד דולר ב-OpenAI. יש לה שותפות מורחבת עם מפתח למידת המכונה, מפעילה את עומסי העבודה שלה בפלטפורמת הענן של Azure ומשתמשת במודלים שלה להפעלת העוזר האוטומטי Copilot.
בשיחה עם הלורדים אתמול, אוון לארטר, מנהל מדיניות ציבורית במשרד של מיקרוסופט ל-Responsible AI, אמר: "חשוב להעריך מהו מודל שפה גדול. זה מודל גדול שמאומן על נתוני טקסט, לומד את הקשרים בין רעיונות שונים. זה לא בהכרח לינוק משהו מלמטה".
הוא אמר שצריכה להיות "מסגרת" שתספק הגנה מסוימת לחומר המוגן בזכויות יוצרים ומיקרוסופט תיקח אחריות על כל הפרה של המערכות המבוססות על LLM שלה. אבל הוא גם אמר שמיקרוסופט תומכת לאחרונה דוח Valance לחוק "פרו-חדשנות" בינה מלאכותית בבריטניה, הדוגל בחריגות טקסט ונתונים במודלים של אימון.
אבל דונלד מייקל, לורד פוסטר מבאת', לחץ על לאטרר אם הוא יקבל שאם חברה משתמשת בחומר המוגן בזכויות יוצרים כדי לבנות LLM למטרות רווח, יש להחזיר לבעל זכויות היוצרים.
מנהל מיקרוסופט אמר: "חשוב מאוד להבין שאתה צריך לאמן את מודלי השפה הגדולים האלה על מערכי נתונים גדולים אם אתה מתכוון לגרום להם לפעול ביעילות, אם אתה מתכוון לאפשר להם להיות בטוחים ומאובטחים... יש גם כמה בעיות בתחרות [לוודא] שההדרכה של דגמים גדולים זמינה לכולם. אם אתה הולך רחוק מדי בנתיב שבו קשה מאוד להשיג נתונים כדי להכשיר דגמים, אז פתאום, היכולת לעשות זאת תהיה נחלתם של חברות גדולות מאוד".
התדיינות משפטית כבר מתנהלת כדי להתייחס לאופן שבו מערכי נתונים של אימון ספרים 1, Books2 ו-Books3, שלמעשה פיראטים חומר המוגן בזכויות יוצרים, שימשו כדי לעזור לבנות LLMs פופולריים.
מטה עומדת מאחורי ה Llama 2 LLM, שמרחיב עד 70 מיליארד פרמטרים. ענקית המדיה החברתית קידמה את המודל כקוד פתוח, אם כי טהרני FOSS מצביעים על כמה סייגים בגישתו.
בשיחה עם הלורדים, רוב שרמן, סגן נשיא וסגן קצין הפרטיות הראשי למדיניות ב-Meta, אמר שהחברה תציית לחוק.
אבל הוא הוסיף כי "שמירה על גישה רחבה למידע באינטרנט ולמידע כולל לשימוש בחדשנות כזו היא די חשובה. אני כן תומך במתן היכולת לבעלי זכויות לנהל את אופן השימוש במידע שלהם.
"אני קצת זהיר מהרעיון של לאלץ חברות שבונות בינה מלאכותית להיכנס להסכמים מותאמים אישית עם בעלי זכויות בודדים או צו לשלם עבור תוכן שאין לו ערך כלכלי עבורם".
בשבוע שעבר, דן קונווי, מנכ"ל איגוד המוציאים לאור בבריטניה, אמר לוועדה שדגמי שפות גדולים מפרים תוכן המוגן בזכויות יוצרים ב"קנה מידה מסיבי לחלוטין.
"אנחנו יודעים את זה בתעשיית ההוצאה לאור בגלל מסד הנתונים של Books3 שמפרט 120,000 כותרי ספרים פיראטיים, שאנחנו יודעים שנבלעו על ידי מודלים שפות גדולים", אמר. "אנחנו יודעים שהתוכן נבלע בקנה מידה עצום לחלוטין על ידי מודלים של שפות גדולות. LLMs אכן מפרים זכויות יוצרים בחלקים מרובים של התהליך מבחינת מתי הם אוספים מידע זה, האופן שבו הם מאחסנים מידע זה וכיצד הם מטפלים בו. חוק זכויות היוצרים מופר בקנה מידה עצום".
באותו דיון, ד"ר היילי בושר, קוראת בדיני קניין רוחני באוניברסיטת ברונל בלונדון, אמרה שהיא לא מייצגת חברות טכנולוגיה או יוצרי תוכן והציעה נקודת מבט נייטרלית.
"העיקרון של מתי אתה צריך רישיון ומתי אתה לא ברור", היא אמרה, "וכדי לעשות שכפול של יצירה המוגנת בזכויות יוצרים ללא רשות יהיה צורך ברישיון או שאחרת תהיה הפרה. זה מה ש-AI עושה בשלבים שונים של התהליך: הקליטה, הפעלת התוכנית, ואולי אפילו הפלט.
"כמה מפתחי בינה מלאכותית וטכנולוגיה טוענים לפרשנות אחרת של החוק. אני לא מייצג אף אחד מהצדדים האלה. אני מומחה לזכויות יוצרים, ומתוך עמדתי, מתוך הבנה של מה זכויות יוצרים אמורות להשיג וכיצד הן משיגות אותן, תידרש רישיון עבור הפעילות הזו". ®
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
- מקור: https://go.theregister.com/feed/www.theregister.com/2023/11/15/house_of_lords_ai_copyright/
- :יש ל
- :הוא
- :לֹא
- :איפה
- $ למעלה
- 000
- 120
- 17
- 7
- 70
- a
- יכולת
- אודות
- בהחלט
- לְקַבֵּל
- גישה
- להשיג
- משיגה
- פעילות
- הוסיף
- כתובת
- עורכי דין
- הסכמים
- AI
- תעשיות
- להתיר
- כְּבָר
- גם
- למרות
- an
- ו
- כל
- דבר
- להעריך
- גישה
- ARE
- AS
- עוזר
- עמותה
- עמותות
- לְהַנִיחַ
- At
- מחברים
- אוטומטי
- זמין
- תכלת
- ענן תכלת
- BE
- כי
- היה
- מאחור
- להיות
- בהתאמה אישית
- בֵּין
- B
- קצת
- ספר
- רחב
- שבור
- לִבנוֹת
- בִּניָן
- אבל
- by
- הגיע
- זהיר
- מנכ"ל
- רֹאשׁ
- ברור
- לקוחות
- ענן
- פלטפורמת ענן
- CO
- לגבות
- משולב
- הוועדה
- תקשורת
- חברות
- חברה
- תחרות
- להיענות
- תוכן
- יוצרי תוכן
- זכויות יוצרים
- הפרת זכויות יוצרים
- עלויות
- לכסות
- לִיצוֹר
- יוצרים
- נתונים
- ערכות נתונים
- מסד נתונים
- סגן
- מפתח
- מפתחים
- DID
- אחר
- דיגיטלי
- מְנַהֵל
- do
- עושה
- לא איכפת
- דון
- דונלד
- מטה
- dr
- כַּלְכָּלִי
- שווי כלכלי
- יעילות
- או
- זן
- אֲפִילוּ
- כולם
- עודף
- מומחה
- רחוק
- חברות
- להתמקד
- בעד
- מכריח
- לטפח
- מסגרת
- החל מ-
- לקבל
- ענק
- ענקים
- נתינה
- Go
- הולך
- Guild
- לטפל
- קשה
- יש
- he
- שמיעה
- לעזור
- מחזיקים
- בית
- בית הלורדים
- איך
- HTTPS
- i
- רעיון
- רעיונות
- if
- חשוב
- in
- כולל
- בנפרד
- תעשייה
- מידע
- הפרה
- חדשנות
- אִינטֶלֶקְטוּאַלִי
- קניין רוחני
- אינטרנט
- פענוח
- אל תוך
- בעיות
- IT
- שֶׁלָה
- jpg
- לדעת
- שפה
- גָדוֹל
- חוק
- למידה
- משפטי
- רישיון
- כמו
- רשימות
- קְצָת
- LLM
- לונדון
- לורדים
- מכונה
- למידת מכונה
- שמירה
- לעשות
- עשייה
- לנהל
- מסיבי
- חוֹמֶר
- מדיה
- meta
- מיכאל
- מיקרוסופט
- מודל
- מודלים
- מספר
- my
- בהכרח
- צורך
- נטרל
- להשיג
- of
- מוצע
- Office
- קָצִין
- on
- רק
- לפתוח
- קוד פתוח
- OpenAI
- or
- להזמין
- אַחֶרֶת
- תפוקה
- יותר
- בעלים
- נפרע
- פרמטרים
- פרלמנט
- שותפות
- חלקים
- נתיב
- תשלום
- לְבַצֵעַ
- רשות
- פרספקטיבה
- שודד ים
- פלטפורמה
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- נקודה
- מדיניות
- פופולרי
- עמדה
- פוטנציאל
- כוח
- נשיא
- עקרון
- פְּרָטִיוּת
- תהליך
- להרוויח
- תָכְנִית
- מקודם
- רכוש
- .
- לספק
- ציבורי
- לאור
- המו"לים
- הוצאה לאור
- שאלה
- שאלות
- דַי
- במקום
- RE
- קורא
- בֶּאֱמֶת
- לאחרונה
- להסיר
- לייצג
- שעתוק
- לדרוש
- אחריות
- אחראי
- הכנסות
- זכויות
- לשדוד
- כללי
- הפעלה
- ריצה
- s
- בטוח
- אמר
- סם
- סם אלטמן
- אותו
- סולם
- מאזניים
- לבטח
- סֶפּטֶמבֶּר
- שירותים
- סטים
- היא
- שרמן
- צריך
- צדדים
- since
- So
- חֶברָתִי
- מדיה חברתית
- כמה
- מָקוֹר
- צעדים
- חנות
- פתאומי
- תמיכה
- תומך
- אמור
- בטוח
- מערכות
- טק
- ענקיות טק
- מונחים
- טֶקסט
- מֵאֲשֶׁר
- זֶה
- השמיים
- החוק
- בריטניה
- שֶׁלָהֶם
- אותם
- אז
- שם.
- אלה
- הֵם
- זֶה
- השבוע
- אלה
- הטיטאנים
- כותרות
- ל
- אמר לי
- גַם
- סחר
- רכבת
- מְאוּמָן
- הדרכה
- Uk
- תחת
- מתחת
- להבין
- הבנה
- אוניברסיטה
- us
- להשתמש
- מְשׁוּמָשׁ
- שימושים
- באמצעות
- ערך
- מאוד
- סְגָן
- סגן הנשיא
- we
- שבוע
- טוֹב
- היו
- מה
- מתי
- אם
- אשר
- יצטרך
- עם
- לְלֹא
- תיק עבודות
- היה
- סופרים
- אתמול
- אתה
- זפירנט