ChatGPTのトレーニングに書籍を使用したとしてAuthors GuildがOpenAIを訴訟

ChatGPTのトレーニングに書籍を使用したとしてAuthors GuildがOpenAIを訴訟

Authors Guildは、ChatGPT PlatoBlockchain Data Intelligenceのトレーニングに書籍を使用したとしてOpenAIを訴訟した。垂直検索。あい。

出版作家の業界団体であるAuthors Guildと17人の作家は、OpenAIがチャットボットのトレーニングに自分たちの作品を使用した疑いを巡り、OpenAIを非難した。

著作権をめぐりニューヨーク南部地区に起こされた著作権侵害集団訴訟の原告として指名されたのは、デヴィッド・バルダッチ、メアリー・ブライ、マイケル・コネリー、シルヴィア・デイ、ジョナサン・フランゼン、ジョン・グリシャム、エリン・ヒルダーブランド、クリスティーナ・ベイカー・クライン、マヤ・シャンバーグ・ラングらである。 、ビクター・ラヴァル、ジョージ・R・R・マーティン、ジョディ・ピクルト、ダグラス・プレストン、ロクサナ・ロビンソン、ジョージ・サンダース、スコット・トゥロウ、レイチェル・ベイル。

  苦情 [PDF] は、OpenAI のサービスは「大規模な言語モデルにより、通常であれば作家にお金を払って作成するようなテキストを誰でも自動的かつ自由に (または非常に安価に) 生成できるため、小説作家の生計を立てる能力を危険にさらしている」と主張しています。

筆記者らは、OpenAIが許可なく自分たちの作品に基づいてモデルをトレーニングしただけでなく、AIシステムが人々のリクエストに応える際に筆記者たちの文章を不当にコピーしたことにも不満を抱いている、あるいはそのように主張されている。

告訴状では、ChatGPT が「続編の前日譚の詳細な概要」を作成するよう促されたと指摘しています。 王座のゲーム …シリーズのマーティンの既存の本の同じキャラクターを使用 氷と炎の歌」 訴訟に参加した他の著者たちにも同様の結果が生じる可能性があった。

著者らは、OpenAI が自分たちの著作物にアクセスすることを許可していないと述べていることを考えると、ChatGPT がそうする能力には問題がある。著者らは、AI ラボがトレーニング中に自分たちの成果をモデルに入力した場合、これは不正コピーに相当し、GPT モデルは著作権で保護された著作物の違法な派生物を出力したと考えています。

「これらのアルゴリズムの中心には、大規模な組織的窃盗がある」と訴訟書類には記載されている。

訴状には、OpenAIが大規模な言語モデルをトレーニングするために「Books1」と「Books2」という名前のデータセットを使用したことを認めたが、その内容は開示していないと述べられている。 原告らは、海賊版の書籍が OpenAI のトレーニング データに侵入したのではないかと疑っている。

「GPT-3 から GPT-4 への能力と洗練度の増大は、『トレーニング』データセットのサイズが相関的に増大していることを示唆しており、上で議論した 4 つまたは複数の非常に大規模な海賊版電子書籍のソースが、 「GPT-4 をトレーニングする」と訴状は主張し、「OpenAI が GPT-XNUMX のような強力な LLM を『トレーニング』するために必要な書籍の量を入手できた他の方法はありません。」と付け加えています。

実際、訴状にはもう 1 つの方法、つまり ChatGPT のトレーニングに使用されるコンテンツに対する支払いについて言及されています。しかし訴訟では、OpenAIはそんなことを考えていなかった、と主張し、著作権を信じており、トレーニングデータの一部に費用を支払ったというCEOのサム・アルトマン氏の議会証言を引用している。

「フィクション作家にとって、OpenAI による作品の不正使用は大規模な個人情報の盗難です」と Authors Guild CEO の Mary Rasenberger 氏は述べています。

「小説の作者は、自分の想像力から全く新しい世界を創造します。彼らは物語の中で場所、人物、出来事を創造します」と彼女は付け加え、その後次のように嘆いた。 』のキャラクターとストーリー。企業は、著者の本の「世界に入る」ことを可能にするプロンプトを販売しています。これらはオリジナルの作成者の知的財産権に対する明らかな侵害です。」

原告らは、「作品のライセンスを取得する機会の損失と、被告[OpenAI]が原告たちを自らの代わりに不本意な共犯者にすることで可能にした市場の簒奪に対する損害賠償を求めている。 そしてこうした危害の再発を防ぐための永久差し止め命令だ。」

登録 OpenAI はコメントを求めており、実質的な返答が得られればこの記事を更新します。 ®

タイムスタンプ:

より多くの 登録