GitHub dituduh memvariasikan keluaran Copilot untuk menghindari hak cipta

GitHub dituduh memvariasikan keluaran Copilot untuk menghindari hak cipta

GitHub dituduh memvariasikan keluaran Copilot untuk menghindari hak cipta PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

GitHub diduga telah menyetel asisten pemrograman Copilot untuk menghasilkan sedikit variasi kode pelatihan yang diserap untuk mencegah keluaran ditandai sebagai salinan langsung dari perangkat lunak berlisensi.

Penegasan ini muncul pada hari Kamis di keluhan yang diubah [PDF] melawan Microsoft, GitHub, dan OpenAI melalui Copilot didokumentasikan kegemaran untuk mereproduksi kode berlisensi open source yang diposting oleh pengembang.

Gugatan, awalnya diajukan November lalu atas nama empat penggugat yang tidak dikenal (โ€œJ.Doeโ€), mengklaim bahwa Copilot โ€“ alat saran kode yang dibuat dari model Codex OpenAI dan dikomersialkan oleh GitHub Microsoft โ€“ dilatih tentang kode yang diposting secara publik dengan cara yang melanggar undang-undang hak cipta dan persyaratan lisensi perangkat lunak dan itu menyajikan kode orang lain sebagai miliknya.

Microsoft, GitHub, dan OpenAI mencoba untuk memiliki kasus diberhentikan, tapi berhasil hanya untuk singkirkan beberapa klaim. Hakim membiarkan masalah hak cipta dan lisensi utama tetap utuh, dan mengizinkan penggugat untuk mengajukan kembali beberapa klaim lain dengan lebih detail.

Keluhan yang diubah โ€“ sekarang mencakup delapan hitungan, bukan dua belas โ€“ mempertahankan tuduhan melanggar Undang-Undang Hak Cipta Milenium Digital, pelanggaran kontrak (pelanggaran lisensi sumber terbuka), pengayaan yang tidak adil, dan klaim persaingan tidak sehat.

Itu menambahkan beberapa tuduhan lain sebagai pengganti yang dikirim kembali untuk direvisi: pelanggaran kontrak (menjual materi berlisensi yang melanggar kebijakan GitHub), campur tangan yang disengaja dengan hubungan ekonomi prospektif dan campur tangan lalai dengan hubungan ekonomi prospektif.

Keluhan yang direvisi menambahkan satu tambahan โ€œJ. Penggugat Doeโ€ yang kodenya diduga telah direproduksi oleh Copilot. Dan itu termasuk kode sampel yang ditulis oleh penggugat yang seharusnya direproduksi oleh Copilot secara verbatim, meskipun hanya untuk pengadilan โ€“ sampel kode telah disunting untuk mencegah penggugat diidentifikasi.

Hakim yang mengawasi kasus tersebut telah mengizinkan penggugat untuk tetap anonim dalam pengajuan pengadilan karena ancaman kekerasan yang dapat dipercaya [PDF] diarahkan pada pengacara mereka. Pendaftaran memahami bahwa penggugat dikenal oleh para tergugat.

Sebuah rencana licik?

Pengajuan hukum hari Kamis mengatakan bahwa pada Juli 2022, sebagai tanggapan atas kritik publik terhadap Copilot, GitHub memperkenalkan filter Copilot yang dapat disesuaikan pengguna yang disebut "Suggestions matching public code" untuk menghindari melihat saran perangkat lunak yang menduplikasi pekerjaan orang lain.

โ€œSaat filter diaktifkan, GitHub Copilot memeriksa saran kode dengan kode sekitar 150 karakter di sekitarnya terhadap kode publik di GitHub,โ€ dokumentasi GitHub menjelaskan. โ€œJika ada kecocokan atau hampir kecocokan, saran tersebut tidak akan ditampilkan kepada Anda.โ€

Namun, keluhan berpendapat bahwa filter pada dasarnya tidak berguna karena hanya memeriksa kecocokan yang tepat dan tidak melakukan apa pun untuk mendeteksi keluaran yang telah sedikit dimodifikasi. Nyatanya, penggugat menyatakan bahwa GitHub mencoba lolos dari pelanggaran hak cipta dan lisensi dengan memvariasikan keluaran Copilot sehingga tampaknya tidak disalin dengan tepat.

โ€œDi tangan GitHub, kecenderungan untuk variasi kosmetik kecil di Copilot's Output adalah sebuah fitur, bukan bug,โ€ kata keluhan yang diubah. โ€œVariasi kosmetik kecil ini berarti bahwa GitHub dapat mengirimkan salinan Bahan Berlisensi yang dimodifikasi tanpa batas kepada pelanggan Copilot tanpa pernah memicu filter kode verbatim Copilot.โ€

Pengajuan pengadilan menunjukkan bahwa model pembelajaran mesin seperti Copilot memiliki parameter yang mengontrol sejauh mana output bervariasi.

โ€œBerdasarkan informasi dan keyakinan, GitHub telah mengoptimalkan pengaturan suhu Copilot untuk menghasilkan variasi kosmetik kecil dari Bahan Berlisensi sesering mungkin, sehingga GitHub dapat mengirimkan kode kepada pengguna Copilot yang bekerja dengan cara yang sama seperti kode verbatim, sambil mengklaim bahwa Copilot hanya menghasilkan kode verbatim satu persen dari waktu, โ€kata keluhan yang diubah. โ€œKopilot adalah metode pembajakan perangkat lunak yang cerdik.โ€

GitHub Microsoft dalam email bersikeras sebaliknya.

โ€œKami sangat yakin AI akan mengubah cara dunia membangun perangkat lunak, yang mengarah pada peningkatan produktivitas dan yang paling penting, pengembang yang lebih bahagia,โ€ kata juru bicara perusahaan. Pendaftaran. โ€œKami yakin Copilot mematuhi undang-undang yang berlaku dan kami telah berkomitmen untuk berinovasi dengan Copilot secara bertanggung jawab sejak awal. Kami akan terus berinvestasi dan mengadvokasi pengalaman pengembang yang didukung AI di masa depan.โ€

OpenAI tidak menanggapi permintaan komentar. ยฎ

Stempel Waktu:

Lebih dari Pendaftaran