法案将要求人工智能披露受版权保护的训练数据

法案将要求人工智能披露受版权保护的训练数据

法案将要求人工智能披露受版权保护的训练数据柏拉图区块链数据智能。垂直搜索。人工智能。

美国众议院提出的一项法案将要求那些训练人工智能模型的人披露所使用的所有受版权保护的作品,并且该法案将具有追溯力。

国会议员 Adam Schiff (D-CA) 昨天提出了《生成人工智能版权披露法案》[PDF对于使用受版权保护的作品来训练大型语言模型和其他形式的机器学习系统的人工智能公司来说,这可能是一个巨大的难题。

该法案将要求“创建训练数据集的人……用于构建生成人工智能系统”向版权登记处提交通知,其中包含训练数据集中任何受版权保护作品的“足够详细的摘要”。对数据集的更改也需要提交,并且在这两种情况下都必须提供训练数据集的 URL 并将其放入公共数据库中。 

通知也必须及时提交——在公开此类数据集训练的人工智能系统后的 30 天内,版权局必须获得一份作品清单。在该法案通过之前,受过版权作品训练的人工智能系统也将有 30 天的时间来获取列表。 

该法案包括对未向版权登记处发送列表的至少 5,000 美元的违规处罚,这有些模糊。

“人工智能具有改变我们的经济、政治体系和日​​常生活的颠覆性潜力,”希夫 说过 在罐头声明中。 “我们必须平衡人工智能的巨大潜力与道德准则和保护的迫切需求。” 

今年竞选加州参议员席位的希夫表示,该法案“旨在尊重人工智能时代的创造力,并将技术进步与公平结合起来。” 

许多创意贸易团体都支持了这项立法,包括美国唱片工业协会、美国演员工会以及美国作家协会的东西部。

WGA-West 主席梅雷迪思·斯蒂姆 (Meredith Stiehm) 表示:“这项法案是解决前所未有且未经授权使用受版权保护材料来训练生成人工智能系统的问题的重要第一步。” “为了保护作家和其他创作者,必须提高人工智能的透明度和护栏。”

经过流行作家、艺术家和音乐家训练的人工智能可以 反流 部分模仿他们的作品——这一事实最近引起了数百名音乐家的愤怒。

一个名为“艺术家权利联盟”的组织发起了一项 请愿 本月早些时候,停止使用受版权保护的音乐来训练人工智能,称其为“一场逐底竞争,将降低我们工作的价值并阻止我们获得公平的补偿”,同时也是对创造力的攻击。 

其他创意类型, 作家艺术家 其中,反对使用他们的作品来训练人工智能并提起诉讼,尽管 不成功,阻止人工智能接受其内容的训练。 

目前尚不清楚人工智能公司将如何对该法案做出反应——我们已经询问过,如果我们收到回复,我们将更新这个故事——但我们注意到 OpenAI 表示目前正在 不可能训练出好的人工智能 模型不依赖受版权保护的内容。

那些依赖受版权保护的材料的人最终可能会因为必须披露他们训练模型的内容而感到不满。但该法案并未禁止使用受版权保护的作品来训练人工智能——立法只是要求将其纳入公共记录。 ®

时间戳记:

更多来自 注册