На этой неделе в парламенте Великобритании Microsoft и Meta уклонились от вопроса о том, должны ли авторы платить за использование их материалов, защищенных авторским правом, для обучения больших языковых моделей.
Технологические гиганты, чей совокупный доход значительно превышает 200 миллиардов долларов, были гриль Комитетом Палаты лордов по коммуникациям и цифровым технологиям, когда в центре внимания оказался вопрос об авторском праве.
В сентябре Гильдия авторов, профессиональная ассоциация публикующихся писателей, и 17 авторов. подал коллективный иск в США по поводу использования OpenAI их материалов для создания своих услуг на основе LLM.
Генеральный директор OpenAI Сэм Альтман с тех пор заявил, что компания покроет судебные издержки своих клиентов по искам о нарушении авторских прав, а не удалит материал из своих обучающих наборов.
Microsoft имеет инвестиций 13 миллиардов долларов в OpenAI. Компания поддерживает расширенное партнерство с разработчиком машинного обучения, обеспечивая поддержку своих рабочих нагрузок на облачной платформе Azure и использование ее моделей для запуска автоматизированного помощника Copilot.
Выступая вчера перед палатой лордов, Оуэн Лартер, директор по государственной политике Управления ответственного ИИ Microsoft, сказал: «Важно понимать, что такое большая языковая модель. Это большая модель, обученная на текстовых данных и изучающая связи между различными идеями. Он не обязательно всасывает что-то снизу».
Он сказал, что должна быть «структура», обеспечивающая некоторую защиту материалов, защищенных авторским правом, и Microsoft возьмет на себя ответственность за любое нарушение прав со стороны ее систем, основанных на LLM. Но он также сказал, что Microsoft поддерживает недавнее Отчет Вэланса в «проинновационный» закон об искусственном интеллекте в Великобритании, который выступает за исключения текста и данных в моделях обучения.
Но Дональд Майкл, лорд Фостер из Бата, настаивал на том, согласится ли он с тем, что, если компания использует материалы, защищенные авторским правом, для создания LLM с целью получения прибыли, владелец авторских прав должен получить возмещение.
Директор Microsoft сказал: «Очень важно понимать, что вам необходимо обучать эти большие языковые модели на больших наборах данных, если вы хотите, чтобы они работали эффективно, если вы хотите, чтобы они были безопасными и надежными… Есть также некоторые проблемы с конкуренцией, [чтобы обеспечить] доступность обучения крупных моделей всем. Если вы зайдете слишком далеко по пути, на котором очень сложно получить данные для обучения моделей, то внезапно возможность сделать это станет прерогативой только очень крупных компаний».
Судебные разбирательства уже идут чтобы решить, как наборы обучающих данных Книги1, Books2 и Books3, которые фактически являются пиратскими материалами, защищенными авторским правом, использовались для создания популярных программ LLM.
Мета стоит за Лама 2 LLM, который масштабируется до 70 миллиардов параметров. Гигант социальных сетей продвигает эту модель как с открытым исходным кодом, хотя приверженцы FOSS указывают на некоторые оговорки в ее подходе.
Выступая перед лордами, Роб Шерман, вице-президент и заместитель директора по политике конфиденциальности Meta, заявил, что компания будет соблюдать закон.
Но он добавил, что «поддержание широкого доступа к информации в Интернете и информации, в том числе для использования в подобных инновациях, весьма важно. Я поддерживаю предоставление правообладателям возможности управлять использованием их информации.
«Я немного осторожно отношусь к идее принуждения компаний, создающих ИИ, заключать индивидуальные соглашения с отдельными правообладателями или требовать платить за контент, который не имеет для них экономической ценности».
На прошлой неделе Дэн Конвей, генеральный директор Ассоциации издателей Великобритании, сообщил комитету, что большие языковые модели нарушают контент, защищенный авторским правом, в «абсолютно массовом масштабе».
«Мы знаем об этом в издательской индустрии благодаря базе данных Books3, в которой перечислено 120,000 XNUMX пиратских наименований книг, которые, как мы знаем, были использованы большими языковыми моделями», — сказал он. «Мы знаем, что контент поглощается в огромных масштабах большими языковыми моделями. LLM действительно нарушают авторские права на многих этапах процесса с точки зрения того, когда они собирают эту информацию, как они ее хранят и как они с ней обращаются. Закон об авторском праве нарушается в огромных масштабах».
На том же слушании доктор Хейли Бошер, преподаватель права интеллектуальной собственности в Лондонском университете Брунеля, заявила, что не представляет технологические фирмы или создателей контента, и предложила нейтральную точку зрения.
«Принцип того, когда вам нужна лицензия, а когда нет, ясен, — сказала она, — и воспроизведение произведения, защищенного авторским правом, без разрешения потребует лицензии или иным образом будет нарушением прав. Это то, что ИИ делает на разных этапах процесса: прием, запуск программы и, возможно, даже вывод.
«Некоторые разработчики искусственного интеллекта и технологий выступают за другую интерпретацию закона. Я не представляю ни одну из этих сторон. Я эксперт по авторскому праву, и с моей позиции, понимания того, чего должно достичь авторское право и как оно этого достигает, вам потребуется лицензия на эту деятельность». ®
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://go.theregister.com/feed/www.theregister.com/2023/11/15/house_of_lords_ai_copyright/
- :имеет
- :является
- :нет
- :куда
- $UP
- 000
- 120
- 17
- 7
- 70
- a
- способность
- О нас
- абсолютно
- Принять
- доступ
- Достигать
- Достигает
- деятельность
- добавленный
- адрес
- адвокаты
- соглашения
- AI
- Все
- позволять
- уже
- причислены
- Несмотря на то, что
- an
- и
- любой
- все
- ценить
- подхода
- МЫ
- AS
- помощник
- Объединение
- ассоциации
- предполагать
- At
- Авторы
- Автоматизированный
- доступен
- Лазурный
- Лазурное облако
- BE
- , так как:
- было
- за
- не являетесь
- сделанный на заказ
- между
- миллиард
- Немного
- книга
- широкий
- Сломанный
- строить
- Строительство
- но
- by
- пришел
- осторожный
- Генеральный директор
- главный
- Очистить
- клиентов
- облако
- Облачная платформа
- CO
- собирать
- сочетании
- комитет
- Связь
- Компании
- Компания
- конкурс
- соблюдать
- содержание
- создатели контента
- авторское право
- нарушение авторского права
- Расходы
- чехол для варгана
- Создайте
- Создатели
- данным
- наборы данных
- База данных
- заместитель
- Застройщик
- застройщиков
- DID
- различный
- Интернет
- директор
- do
- приносит
- Безразлично
- Дон
- Дональд
- вниз
- dr
- Экономические
- экономическая ценность
- фактически
- или
- Enter
- Даже
- все члены
- избыток
- эксперту
- далеко
- Компаний
- Фокус
- Что касается
- принуждение
- Способствовать
- Рамки
- от
- получить
- гигант
- гигантов
- Отдаете
- Go
- будет
- гильдия
- обрабатывать
- Жесткий
- Есть
- he
- слух
- помощь
- держатели
- Вилла / Бунгало
- ПАЛАТА ЛОРДОВ
- Как
- HTTPS
- i
- идея
- идеи
- if
- важную
- in
- В том числе
- individual
- промышленность
- информация
- нарушение
- Инновации
- интеллектуальный
- интеллектуальная собственность
- Интернет
- интерпретация
- в
- вопросы
- IT
- ЕГО
- JPG
- Знать
- язык
- большой
- закон
- изучение
- Юр. Информация
- Лицензия
- такое как
- Списки
- мало
- LLM
- Лондон
- Лорды
- машина
- обучение с помощью машины
- Сохранение
- сделать
- Создание
- управлять
- массивный
- материала
- Медиа
- Мета
- Майкл
- Microsoft
- модель
- Модели
- с разными
- my
- обязательно
- Необходимость
- Нейтральные
- получать
- of
- предложенный
- Офис
- сотрудник
- on
- только
- открытый
- с открытым исходным кодом
- OpenAI
- or
- заказ
- в противном случае
- выходной
- за
- владелец
- выплачен
- параметры
- парламент
- Партнерство
- части
- путь
- ОПЛАТИТЬ
- Выполнять
- разрешение
- перспектива
- пиратский
- Платформа
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- Точка
- политика
- Популярное
- должность
- потенциально
- Включение питания
- президент
- принцип
- политикой конфиденциальности.
- процесс
- Прибыль
- FitPartner™
- Повышен
- собственность
- защиту
- обеспечивать
- что такое варган?
- опубликованный
- Издатели
- Издательство
- вопрос
- Вопросы
- вполне
- скорее
- RE
- читатель
- на самом деле
- последний
- удаление
- представлять
- воспроизводство
- требовать
- ответственность
- ответственный
- поступления
- правые
- грабить
- условиями,
- Run
- Бег
- s
- безопасный
- Сказал
- Сэм
- Сэм Альтман
- то же
- Шкала
- Весы
- безопасный
- сентябрь
- Услуги
- Наборы
- она
- Sherman
- должен
- Стороны
- с
- So
- Соцсети
- социальные сети
- некоторые
- Источник
- Шаги
- магазин
- внезапный
- поддержка
- Поддержка
- предполагаемый
- Убедитесь
- системы
- технологии
- технические гиганты
- terms
- текст
- чем
- который
- Ассоциация
- закон
- Великобритании
- их
- Их
- тогда
- Там.
- Эти
- они
- этой
- На этой неделе
- те
- титанов
- позиций
- в
- заявил
- слишком
- торговать
- Train
- специалистов
- Обучение
- Uk
- под
- под
- понимать
- понимание
- Университет
- us
- использование
- используемый
- использования
- через
- ценностное
- очень
- вице
- вице-президент
- we
- неделя
- ЧТО Ж
- были
- Что
- когда
- будь то
- , которые
- будете
- без
- Работа
- бы
- писатели
- вчера
- Ты
- зефирнет