Hvem sin linje er det egentlig, GitHub? Noen tips til utviklere

Hvem sin linje er det egentlig, GitHub? Noen tips til utviklere

Hvem sin linje er det egentlig, GitHub? Noen tips for utviklere PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Mening Åpen kilde. Det er åpent. Du kan se. For det meste kan du bruke. Det er en anelse i navnet. Ikke så fort, hevder et gruppesøksmål anlagt mot Microsoft, OpenAI og GitHub. Copilot, en in-IDE AI-drevet og åpen kildekode-trent forslagsrobot, fungerer ved å tilby kodelinjer til programmerere – og det, hevder klassesøksmålet, bryter reglene og prøver å skjule det. En dommer har slått fast at noen av påstandene fortjener dagen i retten. Kjære herre, ikke en annen opphavsrettskamp.

Teknologi kan se veldig merkelig ut for dommere. Si at du lovlig kjøper en e-bok. Hvordan får du det? Rutere og caching-servere lager kopier av boken etter hvert som den leveres, men de har ikke betalt en krone. Bryter eierne av internettinfrastruktur opphavsretten milliarder av ganger om dagen? Du synes kanskje det er et dumt spørsmål, men det plaget Storbritannias høyesterett nok til å reise til Europa for å spørre «Er dette Internett faktisk lovlig?” Ikke vær så forbanna dum, kom svaret. Vi savner Europa.

Hvor mange av påstandene mot Microsoft, Copilot og OpenAIs kodeprompter som vil falle inn i den blodige duftboksen gjenstår å se. Ingen forutså at AI skulle innta globale databaser med åpen kildekode da reglene ble skrevet. Så igjen, ingen forutså søkemotorer som gjorde engrosinntak, analyse og presentasjon av alt innholdet. Det har absolutt sine problemer, men konsensus er at det er for nyttig og ikke skadelig nok til å forby lov. Copilot og andre maskinlæringssystemer som mater på Internett-innhold er mye det samme i så måte som søkemotorer. Så spørsmålet er, er resultatet ikke nyttig nok eller for skadelig til å akseptere? Hvor er interessebalansen?

Det er nyttige måter å nærme seg problemene på, og de involverer – bedriftsledelsen ser bort nå – etikk. Ja, egentlig, den kortfattede fasjonable praten om etisk AI tilbyr en konkret vei videre som vil fungere mye bedre enn søksmål.

Bøyd ut av form som det er av særinteresser, er hjertet av immaterialrett at skaperens rimelige ønsker skal respekteres. Hvis programvaren er åpen kildekode, vil skaperen med rimelighet ønske at folk skal kunne lese den og ta dem i bruk. Noe som oppmuntrer til dette virker ikke som den verste synden i verden.

Kanskje det er måten det gjør det på, og presenterer kodeforslagene utenfor kontekst. Det finnes tross alt mange åpen kildekode-lisenser, og noen kan inneholde forhold som vår glade Copilot-klipp og paster bør vite om. Vel, forutsatt at Copilot kan gjenkjenne når den foreslår noen andres kode, er det ikke urimelig at den kan rapportere lisensbetingelsene den tilbys under. Det pålegger koderen å etterleve, noe som er mer etisk enn å tilby fristelser mens konsekvensene skjules. Kan til og med forbedre trefffrekvensen for å følge åpen kildekoderegler.

Hva om den originale koderen virkelig ikke vil ha tingene deres presset gjennom innvollene til Copilot? Søkemotorverdenen taklet det ved oppfinnelsen av robots.txt. Plasser en fil med det navnet i rotkatalogen din, og du setter opp et "Ingen oppføring"-skilt for webcrawlere. Ting er litt mer avansert i disse dager, så det ville vært fint å sette den slags funksjon inn i GitHub-stoffet med den slags finjustering som best uttrykker skaperens intensjoner. I alle fall si til innholdsleverandører: «Du vil ikke ha tingene dine i søkeresultatene våre? Fint." har hatt en tendens til å fokusere sinnene på måter å leve med det på. Gi folk valg samtidig som du forklarer konsekvensene? Hyggelig.

Selv om det å gi folk rett til å fjerne koden fra Copilot og lignende resulterer i at massevis av gode ting forsvinner, er det ikke verdens undergang. Det er "cleanroom-prinsippet", som knuste IBMs dominerende posisjon på 1980-tallet samtidig som det akselererte markedet som en gal. Dette er noe maskinlæring kan lære mye av.

Den originale IBM-PCen var nesten utelukkende åpen kildekode. IBM publiserte en teknisk manual med fullstendige kretsdiagrammer, som alle brukte standardbrikker koblet sammen på standardmåter som brikkeprodusentene ga bort gratis. Å designe en funksjonelt ekvivalent (men ikke opphavsrett) IBM PC-klone var noe tusenvis av elektroniske ingeniører kunne gjøre, og hundrevis gjorde.

Den lovlige landminen i den beige boksen var BIOS, Basic INput-OUTput System, en relativt liten del av permanent programvare som ga et standard sett med maskinvaretjenester til operativsystemer og applikasjoner gjennom avbrudd – det som vil bli kalt en API i dag. Hvis du bare kopierte den koden for klonen din, ville IBM få deg til rettigheter. Du kan skrive om koden, men IBM kan deretter binde deg opp i søksmål og bevise at du ikke kopierte noe av den. Selv om du vant, ville forsinkelsen og utgiftene senke deg.

Kikk på renrommet. Klonere leide inn kodere som aldri hadde lest en linje av IBMs BIOS, og forbød dem å gjøre det. Disse programmererne fikk API-en, som ikke var opphavsrettslig, og ble bedt om å skrive til den spesifikasjonen. Med juridiske attester som klonerne gjerne sverget til i retten, holdt prinsippet om at du ikke kan kopiere det du ikke har sett – og den siste biten av puslespillet i den originale Clone Wars var på plass. At API-er gir en så kraftig motgift mot opphavsrett har fått mange til å prøve å endre sin juridiske status, sist Google mot Oracle. Det endte opp i USAs høyesterett hvor det, som alle andre, mislyktes.

Så ta to automatiserte systemer, ett dedikert til å finne og isolere grensesnitt innenfor kode, og ett dedikert til å bruke regler for å generere kode som gir disse grensesnittene. Det er ingen overføring av kodelinjer over det virtuelle luftgapet. Automatisert testing av original versus AI-kode vil øke kvaliteten. En passant, ville et veldig fint sett med verktøy for refactoring bli født, til fordel for alle. Høres etisk ut, ikke sant?

Der har vi det. Hvis det er genuine problemer med det Copilot gjør, så er det flere måter å unngå dem på, samtidig som du bevarer nytten og skaper nye fordeler. Spiller du etter reglene mens du gjør ting bedre? Det er en god linje å ta. ®

Tidstempel:

Mer fra Registeret