Penulis mengajukan gugatan hak cipta ke torpedo NeMo milik Nvidia

Penulis mengajukan gugatan hak cipta ke torpedo NeMo milik Nvidia

Penulis mengajukan gugatan hak cipta ke torpedo NeMo PlatoBlockchain Data Intelligence milik Nvidia. Pencarian Vertikal. Ai.

Nvidia adalah raksasa teknologi terbaru yang menghadapi tuduhan menggunakan karya berhak cipta untuk melatih model AI tanpa mendapatkan izin dari penulisnya.

Tindakan kelas yang diusulkan perkara hukum [PDF] yang diajukan terhadap supremo GPU di San Francisco pada hari Jumat tanggal 8 Maret mengklaim bahwa perusahaan tersebut menggunakan materi berhak cipta untuk melatih model bahasa besar di perpustakaan Megatron untuknya Kerangka kerja AI generatif NeMo.

Keluhan tersebut diajukan oleh tiga penulis, Abdi Nazemian, Brian Keene, dan Stewart O'Nan, yang menyatakan bahwa buku yang mereka tulis termasuk di antara materi yang digunakan untuk melatih LLM Megatron.

Dari pengajuan pengadilan, tampaknya Nvidia tidak dituduh terang-terangan menyalin karya penulisnya sendiri, melainkan menggunakan dataset untuk melatih model Megatron yang diketahui berisi sejumlah karya berhak cipta tanpa izin.

Gugatan tersebut khusus merujuk pada model yang dirilis Nvidia pada September 2022, yakni NeMo Megatron-GPT 1.3B, NeMo Megatron-GPT 5B, NeMo Megatron-GPT 20B, dan NeMo Megatron-T5 3B.

Ini dihosting di situs web yang dioperasikan oleh AI Wajah Memeluk, beserta informasi tentang setiap model, termasuk set data pelatihannya. Dalam hal ini, informasi menyatakan bahwa model dilatih pada kumpulan data “The Pile” yang disiapkan oleh EleutherAI.

Tumpukan digambarkan sebagai “Kumpulan Data 800 GB Beragam Teks untuk Pemodelan Bahasa,” dan salah satu bagian penyusunnya adalah kumpulan buku yang disebut Books3, yang berisi konten sekitar 196,640 buku, termasuk yang dibuat oleh tiga penulis.

Menurut pengajuan pengadilan, kumpulan data Books3 tersedia secara terpisah di Hugging Face hingga Oktober 2023, ketika kumpulan data tersebut dihapus karena “tidak berfungsi dan tidak lagi dapat diakses karena laporan pelanggaran hak cipta”.

Para penulis ingin kasus ini dilanjutkan sebagai gugatan kelompok (class action), dengan mereka sendiri bertindak sebagai perwakilan kelompok, dan meminta pengadilan juri serta ganti rugi atas dugaan pelanggaran hak cipta mereka.

Dalam pernyataan yang dikirim ke Pendaftaran, juru bicara Nvidia berkata: “Kami menghormati hak semua pembuat konten dan yakin kami membuat NeMo sepenuhnya mematuhi undang-undang hak cipta.”

Ini bukan kasus pertama perusahaan AI digugat atas tuduhan pelanggaran hak cipta terkait data yang digunakan untuk melatih model AI. Pada bulan Desember tahun lalu, The New York Times meluncurkan a kasus melawan Microsoft dan OpenAI atas klaim bahwa pasangan tersebut telah menggunakan artikelnya tanpa izin untuk membuat ChatGPT dan model serupa.

Kasus ini mungkin menjadi lebih menarik dengan pernyataan OpenAI pada bulan Januari bahwa hal tersebut akan terjadi “tidak mungkin” untuk membangun jaringan saraf tingkat atas yang memenuhi kebutuhan masa kini tanpa menggunakan karya cipta orang.

Sementara itu, Nvidia masih terus mengembangkan AI dengan mengumumkan sertifikasi profesional baru dalam AI generatif untuk membantu pengembang membangun kredibilitas teknis di bidang ini.

Akan tersedia bertepatan dengan acara GTC raksasa yang berbasis di Santa Clara akhir bulan ini, the program sertifikasi profesional akan menawarkan dua akreditasi AI generatif tingkat asosiasi, dengan fokus pada kemahiran dalam model bahasa besar dan keterampilan alur kerja multimodal. ®

Stempel Waktu:

Lebih dari Pendaftaran