Vems linje är det egentligen, GitHub? Några tips för utvecklare

Vems linje är det egentligen, GitHub? Några tips för utvecklare

Vems linje är det egentligen, GitHub? Några tips för utvecklare PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Yttrande Öppen källa. Det är öppet. Du kan titta. För det mesta kan du använda. Det finns en ledtråd i namnet. Inte så snabbt, hävdar en grupptalan väckt mot Microsoft, OpenAI och GitHub. Copilot, en in-IDE AI-driven och öppen källkodsutbildad förslagsbot, fungerar genom att erbjuda kodrader till programmerare – och det, enligt grupptalan, bryter mot reglerna och försöker dölja det. En domare har slagit fast att några av anspråken förtjänar sin dag i domstol. Käre herre, inte ännu en upphovsrättsstrid.

Teknik kan se väldigt udda ut för domare. Säg att du lagligt köper en e-bok. Hur får man det? Routrar och cachningsservrar gör var och en kopior av boken när den levereras, men de har inte betalat ett öre. Bryter ägarna av internetinfrastruktur upphovsrätten miljarder gånger om dagen? Du kanske tycker att det är en dum fråga, men det störde Storbritanniens högsta domstol tillräckligt för att gå till Europa för att fråga "Är detta internet faktiskt lagligt?” Var inte så jävla dum, kom svaret. Vi saknar Europa.

Hur många av anspråken mot Microsoft, Copilot och OpenAI:s kodprompter som kommer att hamna i den blodiga dumma lådan återstår att se. Ingen förutsåg att AI fick in globala databaser med öppen källkod när reglerna skrevs. Återigen, ingen förutsåg att sökmotorer gjorde intag, analys och presentation av allt innehåll i grossistledet. Det har förvisso sina problem, men konsensus är att det är för användbart och inte tillräckligt skadligt för att förbjuda. Copilot och andra maskininlärningssystem som matar på internetinnehåll är i det avseendet ungefär samma sak som sökmotorer. Så frågan är, är resultatet inte tillräckligt användbart eller för skadligt att acceptera? Var är intresseavvägningen?

Det finns användbara sätt att närma sig frågorna, och de involverar – företagsledningen tittar bort nu – etik. Ja, verkligen, det där korta fashionabla pratstunden om etisk AI erbjuder en konkret väg framåt som kommer att fungera mycket bättre än stämningar.

Urformad som den är av speciella intressen, är hjärtat av immaterialrätt att skaparens rimliga önskemål ska respekteras. Om programvaran är öppen källkod, så önskar skaparen rimligen att folk ska kunna läsa den och använda dem. Något som uppmuntrar detta verkar inte vara den värsta synden i världen.

Kanske är det så det gör det, att presentera kodförslagen ur sitt sammanhang. Det finns trots allt massor av licenser för öppen källkod, och vissa kan innehålla villkor som vår glada Copilot-klipp och paster borde känna till. Tja, förutsatt att Copilot kan känna igen när den föreslår någon annans kod, är det inte orimligt att den kan rapportera licensvillkoren den erbjuds under. Det lägger skyldigheten på kodaren att följa, vilket är mer etiskt än att bjuda på frestelser och samtidigt dölja konsekvenserna. Kan till och med förbättra träfffrekvensen för att följa regler för öppen källkod.

Tänk om den ursprungliga kodaren verkligen inte vill att sina saker pressas genom Copilots tarmar? Sökmotorvärlden tacklade det genom uppfinningen av robots.txt. Sätt in en fil med det namnet i din webbrotkatalog och du sätter upp en "Ingen inträde"-skylt för sökrobotar. Saker och ting är lite mer avancerade nu för tiden, så att lägga in den typen av funktion i GitHub-tyget med vilken sorts finjustering som helst som bäst uttrycker skaparens avsikt vore trevligt. Hur som helst, säga till innehållsleverantörer: "Du vill inte ha dina saker i våra sökresultat? Bra." har tenderat att fokusera sinnen på sätt att leva med det. Att ge människor val och samtidigt förklara konsekvenserna? Trevlig.

Även om att ge människor rätten att ta bort sin kod från Copilot och liknande resulterar i att massor av bra grejer försvinner, så är det inte världens undergång. Det finns "cleanroom-principen", som krossade IBM:s dominerande ställning på 1980-talet samtidigt som marknaden accelererade som en galning. Detta är något maskininlärning kan lära sig mycket av.

Den ursprungliga IBM PC:n var nästan helt öppen källkod. IBM publicerade en teknisk manual med fullständiga kretsscheman, alla med standardchips kopplade ihop på standardsätt som chiptillverkarna gav bort gratis. Att designa en funktionellt likvärdig (men utan upphovsrätt) IBM PC-klon var något tusentals elektroniska ingenjörer kunde göra, och hundratals gjorde.

Den lagliga landminan i den beige lådan var BIOS, Basic INput-OUTput System, en relativt liten del av permanent programvara som tillhandahöll en standarduppsättning hårdvarutjänster till operativsystem och applikationer genom avbrott – vad som skulle kallas ett API idag. Om du bara kopierade den koden för din klon skulle IBM be dig om rättigheterna. Du kan skriva om koden, men IBM kan sedan binda dig i rättegångar som gör att du bevisar att du inte kopierade något av den. Även om du vann, skulle förseningen och kostnaden sänka dig.

Cue renrummet. Cloners anställde kodare som aldrig hade läst en rad av IBM:s BIOS och förbjöd dem att göra det. Dessa programmerare fick API:et, som inte var upphovsrättsskyddat, och blev tillsagda att skriva till den specifikationen. Med juridiska intyg som klonerna gärna svära till i domstol, höll principen att du inte kan kopiera det du inte har sett – och den sista biten av pusselbiten i det ursprungliga Clone Wars var på plats. Att API:er ger ett så kraftfullt motgift mot upphovsrätt har fått många att försöka ändra sin juridiska status, senast Google mot Oracle. Det hamnade i USA:s högsta domstol där det, precis som alla andra, misslyckades.

Så ta två automatiserade system, ett dedikerat till att hitta och isolera gränssnitt inom kod, och ett dedikerat till att tillämpa regler för att generera kod som tillhandahåller dessa gränssnitt. Det finns ingen överföring av kodrader över det virtuella luftgapet. Automatiserad testning av original- kontra AI-kod skulle öka kvaliteten. En passant skulle en mycket fin uppsättning verktyg för omfaktorisering födas, till fördel för alla. Låter etiskt, eller hur?

Där har vi det. Om det finns genuina problem med vad Copilot gör, så finns det flera sätt att undvika dem samtidigt som man bevarar nyttan och skapar nya fördelar. Spelar du efter reglerna samtidigt som du gör saker bättre? Det är en bra linje att ta. ®

Tidsstämpel:

Mer från Registret