著者らがNvidiaのNeMoを脅迫して著作権訴訟を起こす

著者らがNvidiaのNeMoを脅迫して著作権訴訟を起こす

著者らはNvidiaのNeMo PlatoBlockchain Data Intelligenceを脅迫した著作権訴訟を起こした。垂直検索。あい。

Nvidia は、著者の許可を得ることなく AI モデルのトレーニングに著作権で保護された作品を使用したという疑惑に直面している最新のテクノロジー大手です。

提案された集団訴訟 訴訟 8 月 XNUMX 日金曜日にサンフランシスコで GPU supremo に対して提出された [PDF] は、同社が Megatron ライブラリで大規模な言語モデルをトレーニングするために著作権で保護された素材を使用したと主張しています。 NeMo 生成 AI フレームワーク.

訴状はアブディ・ナゼミアン、ブライアン・キーン、スチュワート・オーナンの3人の著者によって提出され、彼らが書いた本がメガトロンLLMの訓練に使用された資料の1つであると主張している。

裁判所への提出文書によると、Nvidia は作者自身の作品を公然とコピーしたことで告発されているわけではなく、多数の無許可の著作物が含まれていることが知られていたデータセットを使用して Megatron モデルをトレーニングしたと思われます。

この訴訟は、特に Nvidia が 2022 年 1.3 月にリリースしたモデル、つまり NeMo Megatron-GPT 5B、NeMo Megatron-GPT 20B、NeMo Megatron-GPT 5B、NeMo Megatron-T3 XNUMXB に言及しています。

これらは AI アウトフィットが運営する Web サイトでホストされています ハグ顔、トレーニング データセットを含む各モデルに関する情報も含まれます。この場合、情報には、モデルが EleutherAI によって準備された「The Pile」データセットでトレーニングされたことが記載されています。

このパイルは「言語モデリングのための多様なテキストの 800 GB のデータセット」と説明されており、その構成部分の 3 つは Books196,640 と呼ばれる書籍のコレクションであり、これには XNUMX 人の著者が作成した書籍を含む約 XNUMX 冊の書籍の内容が含まれています。

裁判所への提出文書によると、Books3 データセットは 2023 年 XNUMX 月まで Hugging Face で個別に利用可能でしたが、「著作権侵害の報告により廃止され、アクセスできなくなった」ため削除されました。

著者らはこの訴訟を集団訴訟として進め、自らが集団代表を務めることを望んでおり、著作権侵害の疑いで陪審裁判と損害賠償を求めている。

送られた声明で 登録、NVIDIAの広報担当者は「当社はすべてのコンテンツ作成者の権利を尊重しており、著作権法を完全に遵守してNeMoを作成したと信じている」と述べた。

AIモデルのトレーニングに使用されたデータに関する著作権侵害の告発でAI企業が訴えられたのは、これが初めてのケースではない。昨年12月、ニューヨーク・タイムズ紙は Microsoft と OpenAI に対する訴訟 両氏がChatGPTや同様のモデルを構築するために許可なく記事を使用したとの主張をめぐっては。

この事件は、おそらく、OpenAIが1月に次のように主張したことで、さらに興味深いものとなった。 最上位のニューラルネットワークを構築することは「不可能」 人の著作物を使用せずに今日のニーズを満たすもの。

一方、Nvidia は、開発者がこの分野で技術的な信頼性を確立できるよう、生成 AI における新しい専門認定資格の発表により、依然として AI ポンプを刺激しています。

サンタクララに本拠を置く巨人の GTC イベントに合わせて、今月末に利用可能になる予定です。 プロフェッショナル認定プログラム は、大規模な言語モデルとマルチモーダル ワークフロー スキルの熟練度に焦点を当てた、2 つのアソシエイト レベルの生成 AI 認定を提供します。 ®

タイムスタンプ:

より多くの 登録