GitHub anklaget for at variere Copilot-output for at undgå ophavsret

GitHub anklaget for at variere Copilot-output for at undgå ophavsret

GitHub anklaget for at variere Copilot-output for at undgå copyright PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

GitHub siges at have indstillet sin Copilot-programmeringsassistent til at generere små variationer af indtaget træningskode for at forhindre, at output bliver markeret som en direkte kopi af licenseret software.

Denne påstand dukkede op torsdag i ændret klage [PDF] mod Microsoft, GitHub og OpenAI over Copilot's dokumenteret forkærlighed for at gengive udvikleres offentligt udsendte, open source-licenserede kode.

Retssagen, oprindeligt indgivet i november sidste år på vegne af fire uidentificerede ("J. Doe") sagsøgere hævder, at Copilot – et kodeforslagsværktøj bygget ud fra OpenAIs Codex-model og kommercialiseret af Microsofts GitHub – blev trænet i offentligt udsendt kode på en måde, der overtræder loven om ophavsret og softwarelicenskrav. og at den præsenterer andres kode som sin egen.

Microsoft, GitHub og OpenAI forsøgte at få sagen afvist, men nåede kun at ryste nogle af påstandene af sig. Dommeren efterlod de store ophavsrets- og licensspørgsmål intakte og tillod sagsøgerne at indgive flere andre krav med flere detaljer.

Den ændrede klage – nu dækker otte forhold i stedet for tolv – fastholder beskyldninger om overtrædelse af Digital Millennium Copyright Act, kontraktbrud (overtrædelse af open source-licenser), unfair berigelse og unfair konkurrencekrav.

Den tilføjer flere andre påstande i stedet for dem, der er sendt tilbage til revision: kontraktbrud (salg af licenseret materiale i strid med GitHubs politikker), forsætlig indblanding i potentielle økonomiske relationer og uagtsom indblanding i potentielle økonomiske relationer.

Den reviderede klage tilføjer en yderligere "J. Doe” sagsøger, hvis kode Copilot angiveligt har gengivet. Og det inkluderer eksempelkode skrevet af sagsøgerne, som Copilot angiveligt har gengivet ordret, dog kun for retten - kodeeksemplerne er blevet redigeret for at forhindre sagsøgerne i at blive identificeret.

Dommeren, der fører tilsyn med sagen, har tilladt sagsøgerne at forblive anonyme i retssager på grund af troværdige trusler om vold [PDF] rettet mod deres advokat. Registret forstår, at sagsøgerne er kendt af de sagsøgte.

En snedig plan?

Torsdagens juridiske arkivering siger, at GitHub i juli 2022, som svar på offentlig kritik af Copilot, introducerede et brugerjusterbart Copilot-filter kaldet "Suggestions matching public code" for at undgå at se softwareforslag, der duplikerer andres arbejde.

"Når filteret er aktiveret, tjekker GitHub Copilot kodeforslag med deres omgivende kode på omkring 150 tegn mod offentlig kode på GitHub," GitHubs dokumentation forklarer. "Hvis der er et match eller næsten match, vil forslaget ikke blive vist til dig."

Imidlertid hævder klagen, at filteret i det væsentlige er værdiløst, fordi det kun kontrollerer for nøjagtige match og ikke gør noget for at opdage output, der er blevet lidt ændret. Faktisk antyder sagsøgerne, at GitHub forsøger at slippe af sted med copyright- og licenskrænkelser ved at variere Copilots output, så det ikke ser ud til at være blevet kopieret nøjagtigt.

"I GitHubs hænder er tilbøjeligheden til små kosmetiske variationer i Copilots output en funktion, ikke en fejl," siger den ændrede klage. "Disse små kosmetiske variationer betyder, at GitHub kan levere til Copilot-kunder ubegrænsede modificerede kopier af Licenseret Materiale uden nogensinde at udløse Copilots ordrette kodefilter."

Rettens arkivering påpeger, at maskinlæringsmodeller som Copilot har en parameter, der styrer, i hvilket omfang output varierer.

"På information og overbevisning har GitHub optimeret temperaturindstillingen af ​​Copilot for at producere små kosmetiske variationer af de licenserede materialer så ofte som muligt, så GitHub kan levere kode til Copilot-brugere, der fungerer på samme måde som ordret kode, mens han hævder, at Copilot producerer kun ordret kode én procent af tiden,” står der i den ændrede klage. "Copilot er en genial metode til piratkopiering af software."

Microsofts GitHub i en e-mail insisterede på andet.

"Vi er overbevist om, at kunstig intelligens vil transformere den måde, verden bygger software på, hvilket vil føre til øget produktivitet og vigtigst af alt, gladere udviklere," sagde en talsmand for virksomheden. Registret. "Vi er overbeviste om, at Copilot overholder gældende love, og vi har været forpligtet til at innovere ansvarligt med Copilot fra starten. Vi vil fortsætte med at investere i og gå ind for fremtidens AI-drevne udvikleroplevelse."

OpenAI reagerede ikke på en anmodning om kommentar. ®

Tidsstempel:

Mere fra Registret