Hvis linje er det alligevel, GitHub? Nogle tips til udviklere

Hvis linje er det alligevel, GitHub? Nogle tips til udviklere

Whose line is it anyway, GitHub? Some tips for devs PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Udtalelse Open source. Det er åbent. Du kan se. For det meste kan du bruge. Der er et fingerpeg i navnet. Ikke så hurtigt, hævder et gruppesøgsmål anlagt mod Microsoft, OpenAI og GitHub. Copilot, en in-IDE AI-drevet og open source-trænet forslagsbot, fungerer ved at tilbyde kodelinjer til programmører - og det hævder klassesøgsmålet, bryder reglerne og er lusket i forsøget på at skjule det. En dommer har afgjort, at nogle af påstandene fortjener deres dag i retten. Kære herre, ikke endnu en kamp om ophavsret.

Teknologi kan se meget mærkelig ud for dommere. Lad os sige, at du lovligt køber en e-bog. Hvordan får du det? Routere og caching-servere laver hver især kopier af bogen, efterhånden som den bliver leveret, men de har ikke betalt en krone. Bryder ejerne af internetinfrastrukturen copyright milliarder af gange om dagen? Du synes måske, det er et tåbeligt spørgsmål, men det generede Storbritanniens højesteret nok til at tage til Europa for at spørge "Er dette internet faktisk lovligt?” Vær ikke så fandenivoldsk, lød svaret. Vi savner Europa.

Hvor mange af påstandene mod Microsoft, Copilot og OpenAI's kodeprompter, der vil falde i den blodige dåseboks, er endnu uvist. Ingen forudså, at AI indtog globale databaser med åben kildekode, da reglerne blev skrevet. Så igen, ingen forudså søgemaskiner foretage engros indtagelse, analyse og præsentation af alt indhold. Det har bestemt sine problemer, men konsensus er, at det er for nyttigt og ikke skadeligt nok til at forbyde det. Copilot og andre maskinlæringssystemer, der lever af internetindhold, er meget de samme i den henseende som søgemaskiner. Så spørgsmålet er, er resultatet ikke brugbart nok eller for skadeligt til at acceptere? Hvor er interessebalancen?

Der er nyttige måder at gribe problemerne an på, og de involverer – virksomhedsledelsen ser væk nu – etik. Ja, virkelig, den kort fashionable snak om etisk AI tilbyder en konkret vej frem, der vil fungere meget bedre end retssager.

Bøjet ud af form som det er af særlige interesser, er hjertet af intellektuel ejendomsret, at skaberens rimelige ønsker skal respekteres. Hvis software er open source, så ønsker skaberen med rimelighed, at folk kan læse den og tage dem i brug. Noget, der opmuntrer til dette, synes ikke at være den værste synd i verden.

Måske er det den måde, den gør det på, og præsenterer kodeforslagene ude af kontekst. Der er trods alt masser af open source-licenser, og nogle kan indeholde betingelser, som vores glade Copilot klip og paster burde kende til. Tja, forudsat at Copilot kan genkende, når den foreslår en andens kode, er det ikke urimeligt, at den kan rapportere de licensbetingelser, den tilbydes under. Det pålægger koderen at overholde, hvilket er mere etisk end at tilbyde fristelser, mens konsekvenserne skjules. Kan endda forbedre hitraten for at følge open source-regler.

Hvad hvis den originale koder virkelig ikke vil have deres ting presset gennem tarmene på Copilot? Søgemaskineverdenen tacklede det ved opfindelsen af ​​robots.txt. Indsæt en fil med det navn i din webrodmappe, og du sætter et "Ingen adgang"-skilt op for webcrawlere. Tingene er lidt mere avancerede i disse dage, så det ville være rart at sætte den slags funktion ind i GitHubs struktur med den slags finjustering, der bedst udtrykker skaberens hensigt. Under alle omstændigheder fortælle indholdsudbydere: "Du vil ikke have dine ting i vores søgeresultater? Bøde." har haft en tendens til at fokusere sind på måder at leve med det på. At give folk valg og samtidig forklare konsekvenserne? Pæn.

Selvom det at give folk ret til at fjerne deres kode fra Copilot og lignende resulterer i, at en masse gode ting forsvinder, er det ikke verdens undergang. Der er "cleanroom-princippet", som smadrede IBMs dominerende position i 1980'erne, mens det accelererede markedet som en gal. Dette er noget, maskinlæring kunne lære meget af.

Den originale IBM PC var næsten udelukkende open source. IBM udgav en teknisk manual med komplette kredsløbsdiagrammer, alle ved hjælp af standardchips forbundet på standardmåder, som chipproducenterne gav væk gratis. At designe en funktionelt ækvivalent (men ikke ophavsretligt beskyttet) IBM PC-klon var noget tusindvis af elektroniske ingeniører kunne gøre, og hundreder gjorde.

Den lovlige landmine i den beige boks var BIOS, Basic INput-OUTput System, en relativt lille del af permanent software, der leverede et standardsæt af hardwaretjenester til operativsystemer og applikationer gennem interrupts – det, der ville blive kaldt en API i dag. Hvis du bare kopierede den kode til din klon, ville IBM få dig til at få rettighederne. Du kunne omskrive koden, men IBM kunne derefter binde dig i retssager, så du beviser, at du ikke kopierede noget af det. Selv hvis du vandt, ville forsinkelsen og udgifterne synke dig.

Hold øje med renrummet. Klonere hyrede kodere, som aldrig havde læst en linje af IBM's BIOS, og forbød dem at gøre det. Disse programmører fik API'et, som ikke var copyright, og fik besked på at skrive til den spec. Med juridiske attester var klonerne glade for at sværge til i retten, princippet om, at man ikke kan kopiere det, man ikke har set, holdt – og den sidste bid af puslespillet i den originale Clone Wars var på plads. At API'er giver en så stærk modgift til copyright, har fået mange til at prøve at ændre deres juridiske status, senest Google mod Oracle. Det endte i den amerikanske højesteret, hvor det som alle andre mislykkedes.

Så tag to automatiserede systemer, et dedikeret til at finde og isolere grænseflader i kode, og et dedikeret til at anvende regler til at generere kode, der leverer disse grænseflader. Der er ingen overførsel af kodelinjer på tværs af det virtuelle luftgab. Automatiseret test af original versus AI-kode ville øge kvaliteten. En passant ville et meget fint sæt værktøjer til refactoring blive født, til gavn for alle. Det lyder etisk, ikke?

Der har vi det. Hvis der er ægte problemer med, hvad Copilot laver, så er der flere måder at undgå dem på, mens du bevarer nytten og skaber nye fordele. Spiller du efter reglerne, mens du gør tingene bedre? Det er en god linje at tage. ®

Tidsstempel:

Mere fra Registret