Raksasa teknologi menghindari pertanyaan tentang aturan hak cipta LLM

Raksasa teknologi menghindari pertanyaan tentang aturan hak cipta LLM

Raksasa teknologi menghindari pertanyaan tentang aturan hak cipta LLM PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Di Parlemen Inggris minggu ini, Microsoft dan Meta menghindari pertanyaan apakah pencipta harus dibayar ketika materi berhak cipta mereka digunakan untuk melatih model bahasa besar.

Para raksasa teknologi, dengan pendapatan gabungan lebih dari $200 miliar, sedang berada dalam kondisi yang buruk panggang oleh Komite Komunikasi dan Digital House of Lords ketika masalah hak cipta menjadi fokus.

Pada bulan September, Persatuan Penulis, sebuah asosiasi perdagangan untuk penulis terbitan, dan 17 penulis mengajukan gugatan class action di AS atas penggunaan materi mereka oleh OpenAI untuk membuat layanan berbasis LLM.

CEO OpenAI Sam Altman sejak itu mengatakan bahwa perusahaannya akan menanggung biaya hukum kliennya atas tuntutan pelanggaran hak cipta daripada menghapus materi tersebut dari set pelatihannya.

Microsoft telah diinvestasikan $13 miliar di OpenAI. Perusahaan ini memiliki kemitraan yang diperluas dengan pengembang pembelajaran mesin, mendukung beban kerjanya di platform cloud Azure dan menggunakan modelnya untuk menjalankan asisten otomatis Copilot.

Berbicara kepada Lords kemarin, Owen Larter, direktur kebijakan publik di Office of Responsible AI Microsoft, mengatakan: โ€œPenting untuk menghargai betapa besarnya model bahasa. Ini adalah model besar yang dilatih berdasarkan data teks, mempelajari hubungan antara berbagai ide. Itu belum tentu menyedot apa pun dari bawah.โ€

Dia mengatakan harus ada โ€œkerangka kerjaโ€ untuk memberikan perlindungan terhadap materi berhak cipta dan Microsoft akan bertanggung jawab atas segala pelanggaran yang dilakukan oleh sistem berbasis LLM miliknya. Namun dia juga mengatakan Microsoft mendukung yang terbaru Laporan kelambu ke dalam undang-undang AI yang โ€œpro-inovasiโ€ di Inggris yang menganjurkan pengecualian teks dan data dalam model pelatihan.

Namun Donald Michael, Lord Foster of Bath, mendesak Larter apakah dia akan menerima bahwa jika sebuah perusahaan menggunakan materi berhak cipta untuk membangun LLM demi keuntungan, pemilik hak cipta harus mendapat penggantian.

Direktur Microsoft berkata: โ€œSangat penting untuk memahami bahwa Anda perlu melatih model bahasa besar ini pada kumpulan data yang besar jika Anda ingin membuatnya bekerja secara efektif, jika Anda ingin membuatnya aman dan terjaminโ€ฆ Ada juga beberapa masalah persaingan [dalam memastikan] bahwa pelatihan model besar tersedia untuk semua orang. Jika Anda melangkah terlalu jauh ke jalur yang sangat sulit memperoleh data untuk melatih model, maka tiba-tiba, kemampuan untuk melakukan hal tersebut hanya akan dimiliki oleh perusahaan yang sangat besar.โ€

Proses litigasi sudah berlangsung untuk mengatasi cara melatih kumpulan data Buku1, Books2, dan Books3, yang secara efektif membajak materi berhak cipta, telah digunakan untuk membantu membangun LLM populer.

Meta ada di belakang Lama 2 LLM, yang menskalakan hingga 70 miliar parameter. Raksasa media sosial ini telah mempromosikan model tersebut sebagai open source, meskipun para penganut FOSS menunjukkan beberapa peringatan dalam pendekatannya.

Berbicara kepada Lords, Rob Sherman, wakil presiden dan wakil kepala kebijakan privasi di Meta, mengatakan perusahaan akan mematuhi hukum.

Namun ia menambahkan bahwa โ€œmenjaga akses luas terhadap informasi di internet dan informasi termasuk untuk digunakan dalam inovasi seperti ini adalah hal yang cukup penting. Saya mendukung pemberian hak kepada pemegang hak untuk mengelola bagaimana informasi mereka digunakan.

โ€œSaya sedikit berhati-hati mengenai gagasan memaksa perusahaan yang membangun AI untuk membuat perjanjian khusus dengan pemegang hak individu atau perintah untuk membayar konten yang tidak memiliki nilai ekonomi bagi mereka.โ€

Pekan lalu, Dan Conway, CEO Asosiasi Penerbit Inggris, mengatakan kepada komite bahwa model bahasa besar melanggar konten berhak cipta dalam โ€œskala yang sangat besar.โ€

โ€œKami mengetahui hal ini di industri penerbitan karena database Books3 yang mencantumkan 120,000 judul buku bajakan, yang kami tahu telah diserap oleh model bahasa besar,โ€ ujarnya. โ€œKami tahu bahwa konten tersebut diserap dalam skala besar oleh model bahasa besar. LLM memang melanggar hak cipta di berbagai bagian proses dalam hal kapan mereka mengumpulkan informasi ini, bagaimana mereka menyimpan informasi ini, dan bagaimana mereka menanganinya. Undang-undang hak cipta dilanggar secara besar-besaran.โ€

Pada sidang yang sama, Dr Hayleigh Bosher, pembaca hukum kekayaan intelektual di Brunel University London, mengatakan dia tidak mewakili perusahaan teknologi atau pembuat konten dan menawarkan perspektif netral.

โ€œPrinsip kapan Anda memerlukan lisensi dan kapan tidak diperlukan sudah jelas,โ€ katanya, โ€œdan membuat reproduksi karya yang dilindungi hak cipta tanpa izin berarti memerlukan lisensi atau sebaliknya merupakan pelanggaran. Itulah yang dilakukan AI pada berbagai langkah proses: penyerapan, jalannya program, dan bahkan kemungkinan keluarannya.

โ€œBeberapa AI dan pengembang teknologi memperdebatkan penafsiran hukum yang berbeda. Saya tidak mewakili kedua belah pihak. Saya seorang pakar hak cipta, dan dari posisi saya, pemahaman tentang apa yang seharusnya dicapai oleh hak cipta dan bagaimana hak cipta mencapainya, Anda memerlukan lisensi untuk aktivitas tersebut.โ€ ยฎ

Stempel Waktu:

Lebih dari Pendaftaran