普利策奖得主等人起诉 OpenAI

普利策奖得主等人起诉 OpenAI

普利策奖得主美国小说家 Michael Chabon 和其他几位作家已提出一项集体诉讼,指控 OpenAI 侵犯版权,因为据称将他们的作品纳入用于训练 ChatGPT 背后模型的数据集中。

该诉讼称,OpenAI“在互联网上撒下了广泛的网络”,以捕获最全面的内容集,以更好地训练其 GPT 模型,据称“必然”导致其“捕获、下载和复制受版权保护的书面作品、戏剧和作品”。文章”。

该诉讼中更有趣的部分之一是关于作者如何相信人工智能业务获得了“两个基于互联网的图书语料库”的指控,它指出 OpenAI 简单地将其称为“Books1”和“Books2”。 该文件称,在 2020 年 3 月介绍 GPT-16 的论文中,“语言模型是少样本学习者”,OpenAI 披露,除了“Common Crawl”和“WebText”网页数据集之外,“GPT3 训练数据集的 1%来自……“Books2”和“BooksXNUMX”。”

作者的诉讼继续声称,公共互联网上只有少数几个地方包含这么多材料,声称 OpenAI 的 Books1 数据集“基于标准化项目古腾堡语料库或古腾堡项目本身”,并指责人工智能业务书籍 2 来源:

臭名昭著的“影子图书馆”网站,例如 Library Genesis (“LibGen”)、Z-Library、Sci-Hub 和 Bibliotik,这些网站收藏了大量盗版书籍、研究论文和其他基于文本的材料。 这些网站聚合的材料也可通过 torrent 系统批量提供。

诉讼中还包括托尼奖和格莱美奖得主黄大卫 (David Henry Hwang),他是幕后剧作家和编剧。 蝴蝶君, 中式英语, 黄脸舞蹈与铁路; 皮博迪获胜者和 爱情和其他不可能的追求 作者阿耶莱特·瓦尔德曼; 我们埋葬的女人 作家雷切尔·路易斯·斯奈德; 和 谁是里奇? 抄写员马修·克拉姆。

作者声称,因为“当提示 ChatGPT 时,它不仅会生成摘要,还会对原告受版权保护的作品中存在的主题进行深入分析”,因此作者相信“底层 GPT 模型是使用原告的作品进行训练的” ”。

作家的律师还声称,当被要求以以下风格写一个段落时 Kavalier & Clay 的奇妙冒险在美国小说家查邦 (Chabon) 获得普利策奖的书《ChatGPT》中,ChatGPT 生成了一段模仿他写作风格的段落,其中提到了处理“战争中世界的重量”的人物。

投诉截图,附件 A

投诉截图,附件 A(点击放大)

诉讼 [PDF] 于上周晚些时候向加州联邦法院提交,并于昨天分配给旧金山地方法官 Peter H. Kang。

OpenAI 正面临多起有关版权的诉讼,其中包括小说家 Paul Tremblay 和 Mona Awad 在旧金山提起的两起诉讼,以及喜剧演员 Sarah Silverman 和小说家 Christopher Golden 和 Richard Kadrey 分别提起的诉讼。 其律师在这些案件中辩称,人工智能业务并未违反版权法,并声称 ChatGPT 的法学硕士受到美国“合理使用”原则的保护。 他们的论点是企业使用文本的方式符合美国 版权法,它允许对所谓的作品“变革性用途”进行合理使用例外——即服务于不同目的或受众的原始作品的混音。

美国版权局是 目前 寻求对人工智能系统提出的版权法和政策问题的研究发表评论。

Defence for OpenAI 尚未对 Chabon 投诉做出回应。 我们已要求 OpenAI 发表评论。

该案指控包括直接和间接侵犯版权、非法删除版权管理信息、不正当竞争和不当得利。 他们正在寻求针对侵犯其版权的禁令以及未具体说明的损害赔偿。

OpenAI 老板萨姆·奥尔特曼 (Sam Altman) 上周获得了印度尼西亚有史以来的第一名 黄金签证 – 这意味着他现在可以在这个群岛国家居住长达 10 年 – 以表彰他“产生入境投资”的潜力。 ®

时间戳记:

更多来自 注册