科技巨头回避对法学硕士版权规则的质疑

由柏拉图重新发布

关注： 0

科技巨头回避了关于 LLM 版权规则 PlatoBlockchain 数据智能的质疑。垂直搜索。人工智能。

本周在英国议会上，微软和 Meta 回避了当创作者的受版权保护的材料用于训练大型语言模型时是否应该向创作者付费的问题。

这些科技巨头的总收入远超 200 亿美元，烤当版权问题成为焦点时，上议院通信和数字委员会提出了这一建议。

17 月，作家协会（出版作家行业协会）和 XNUMX 名作者提起集体诉讼在美国，OpenAI 使用他们的材料来创建基于 LLM 的服务。

OpenAI 首席执行官 Sam Altman 此后表示，该公司将承担客户因版权侵权诉讼而支付的法律费用，而不是从其培训集中删除这些材料。

微软有投资 OpenAI 价值 13 亿美元。它与机器学习开发商建立了广泛的合作伙伴关系，在 Azure 云平台上为其工作负载提供支持，并使用其模型来运行 Copilot 自动助手。

微软负责任人工智能办公室公共政策总监欧文·拉特 (Owen Larter) 昨天在上议院发表讲话时表示：“了解什么是大型语言模型非常重要。它是一个基于文本数据训练的大型模型，学习不同想法之间的关联。它不一定会从下面吸走任何东西。”

他表示应该有一个“框架”来为受版权保护的材料提供一些保护，微软将对其基于法学硕士的系统的任何侵权行为承担责任。但他也表示微软支持最近的价报告英国的“支持创新”人工智能法提倡训练模型中的文本和数据例外。

这位微软总监表示：“了解这一点非常重要，如果你想让这些大型语言模型有效地执行，如果你想让它们安全可靠，你需要在大型数据集上训练这些大型语言模型……” [确保]每个人都可以训练大型模型，还存在一些竞争问题。如果你在一条很难获得数据来训练模型的道路上走得太远，那么突然之间，这样做的能力将只有非常大的公司才能拥有。”

诉讼已经在进行中解决如何训练数据集书籍1、Books2 和 Books3 有效地盗版了受版权保护的材料，已被用来帮助建立流行的法学硕士。

元在后面骆驼 2 法学硕士，可扩展至 70 亿个参数。尽管自由和开源软件纯粹主义者指出了其方法中的一些警告，但这家社交媒体巨头已将该模型推广为开源。

Meta 副总裁兼负责政策的副首席隐私官 Rob Sherman 在上议院发表讲话时表示，该公司将遵守法律。

但他补充说，“保持对互联网信息和信息（包括用于此类创新的信息）的广泛访问非常重要。我确实支持让权利持有者能够管理其信息的使用方式。

“我对强迫正在构建人工智能的公司与个人权利持有者签订定制协议或下令支付对他们来说没有经济价值的内容的想法有点谨慎。”

上周，英国出版商协会首席执行官丹·康威 (Dan Conway) 告诉委员会，大型语言模型正在“大规模”侵犯版权内容。

“我们在出版业知道这一点，因为 Books3 数据库列出了 120,000 种盗版书名，我们知道这些书名已被大型语言模型吸收，”他说。 “我们知道大型语言模型正在大规模地吸收内容。法学硕士确实在该过程的多个部分侵犯了版权，包括何时收集这些信息、如何存储这些信息以及如何处理这些信息。版权法正在被大规模破坏。”

在同一次听证会上，伦敦布鲁内尔大学知识产权法讲师海莉·博舍尔博士表示，她不代表科技公司或内容创作者，并提供了中立的观点。

“什么时候需要许可、什么时候不需要许可的原则很明确，”她说，“未经许可复制受版权保护的作品就需要许可，否则将构成侵权。这就是人工智能在该过程的不同步骤中所做的事情：摄取、程序运行，甚至可能是输出。

“一些人工智能和技术开发人员正在争论对法律的不同解释。我不代表任何一方。我是一名版权专家，从我的立场来看，了解版权应该实现什么以及如何实现它，你需要获得该活动的许可证。” ®