Wiens lijn is het eigenlijk, GitHub? Enkele tips voor ontwikkelaars

Wiens lijn is het eigenlijk, GitHub? Enkele tips voor ontwikkelaars

Wiens zin is het eigenlijk, GitHub? Enkele tips voor ontwikkelaars PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Advies Open source. Het is open. Je kan kijken. Meestal kun je gebruiken. Er zit een aanwijzing in de naam. Niet zo snel, stelt een class action tegen Microsoft, OpenAI en GitHub. Copilot, een in-IDE AI-aangedreven en open source getrainde suggestiebot, werkt door coderegels aan programmeurs aan te bieden - en dat, zo beweert de class action-rechtszaak, overtreedt de regels en probeert het stiekem te verbergen. Een rechter heeft bepaald dat sommige claims hun dag in de rechtbank verdienen. Geachte heer, niet weer een copyright-strijd.

Technologie kan er voor rechters heel vreemd uitzien. Stel dat u legaal een e-boek koopt. Hoe krijg je dat? Routers en cachingservers maken elk een kopie van het boek terwijl het wordt afgeleverd, maar ze hebben er geen cent voor betaald. Schenden de eigenaren van internetinfrastructuur miljarden keren per dag auteursrechten? Je zou kunnen denken dat dat een stomme vraag is, maar het zat het Britse Hooggerechtshof genoeg dwars om naar Europa te gaan om te vragen "Is dit internet eigenlijk legaal??" Doe niet zo stom, was het antwoord. We missen Europa.

Hoeveel van de claims tegen Microsoft, Copilot en de codeprompter van OpenAI in de verdomde dwaze doos zullen vallen, valt nog te bezien. Toen de regels werden geschreven, voorzag niemand dat AI wereldwijde databases met open source-code zou opnemen. Maar nogmaals, niemand voorzag dat zoekmachines alle inhoud op grote schaal zouden opnemen, analyseren en presenteren. Dat heeft zeker zijn problemen, maar de consensus is dat het te nuttig en niet schadelijk genoeg is om te verbieden. Copilot en andere machine learning-systemen die zich voeden met internetinhoud zijn in dat opzicht vrijwel hetzelfde als zoekmachines. De vraag is dus: is het resultaat niet nuttig genoeg of te schadelijk om te accepteren? Waar is de belangenafweging?

Er zijn handige manieren om de kwesties te benaderen, en ze omvatten โ€“ bedrijfsmanagement kijk nu weg โ€“ ethiek. Ja, echt, dat kort modieuze geklets over ethische AI โ€‹โ€‹biedt een concrete weg vooruit die een stuk beter werkt dan rechtszaken.

Hoe krom het ook is door speciale belangen, de kern van het intellectueel eigendomsrecht is dat de redelijke wensen van de maker moeten worden gerespecteerd. Als software open source is, dan wil de maker redelijkerwijs dat mensen het kunnen lezen en gebruiken. Iets dat dit aanmoedigt, lijkt niet de ergste zonde ter wereld.

Misschien is het de manier waarop het het doet, waarbij de codesuggesties buiten hun context worden gepresenteerd. Er zijn tenslotte veel open source-licenties, en sommige kunnen voorwaarden bevatten waarvan onze gelukkige Copilot-knikker op de hoogte zou moeten zijn. Welnu, ervan uitgaande dat Copilot kan herkennen wanneer het de code van iemand anders suggereert, is het niet onredelijk dat het de licentievoorwaarden kan rapporteren waaronder het wordt aangeboden. Dat legt de verantwoordelijkheid bij de codeur om hieraan te voldoen, wat ethischer is dan verleiding bieden terwijl je de gevolgen verbergt. Zou zelfs de hit rate kunnen verbeteren voor het volgen van open source-regels.

Wat als de originele programmeur echt niet wil dat hun spullen door de ingewanden van Copilot worden geperst? De zoekmachinewereld pakte dat aan door de uitvinding van robots.txt. Plaats een bestand met die naam in uw webroot-directory en u plaatst een "Geen toegang"-bord voor webcrawlers. Dingen zijn tegenwoordig een beetje geavanceerder, dus het zou mooi zijn om dat soort functies in de structuur van GitHub te stoppen met welke vorm van fijnafstemming dan ook die het beste de bedoeling van de maker uitdrukt. In ieder geval tegen content providers zeggen: โ€œU wilt uw spullen niet in onze zoekresultaten? Prima." heeft de neiging om de geest te concentreren op manieren om ermee te leven. Mensen keuzes geven en de gevolgen uitleggen? Leuk.

Zelfs als mensen het recht geven om hun code van Copilot en dergelijke te verwijderen, resulteert dit in het verdwijnen van een heleboel goede dingen, dat is niet het einde van de wereld. Er is het 'cleanroom-principe', dat de dominante positie van IBM in de jaren '1980 vernietigde en tegelijkertijd de markt als een gek versnelde. Dit is iets waar machine learning veel van kan leren.

De oorspronkelijke IBM-pc was bijna volledig open source. IBM publiceerde een technische handleiding met volledige schakelschema's, allemaal met behulp van standaardchips die op standaardmanieren met elkaar zijn verbonden en die de chipmakers gratis weggaven. Het ontwerpen van een functioneel equivalente (maar niet auteursrechtelijk beschermde) IBM PC-kloon was iets wat duizenden elektronische ingenieurs konden doen, en honderden deden het.

De legale landmijn in de beige doos was het BIOS, Basic INput-OUTput System, een relatief klein stukje permanente software dat een standaardset hardwareservices leverde aan besturingssystemen en applicaties door middel van interrupts โ€“ wat tegenwoordig een API zou worden genoemd. Als je die code gewoon voor je kloon zou kopiรซren, zou IBM je rechten geven. Je zou de code kunnen herschrijven, maar IBM zou je dan kunnen verwikkelen in rechtszaken waarbij je moet bewijzen dat je er niets van hebt gekopieerd. Zelfs als u zou winnen, zouden de vertraging en de kosten u doen zinken.

Richt de cleanroom in. Cloners huurden programmeurs in die nog nooit een regel van IBM's BIOS hadden gelezen, en verbood hen dit te doen. Deze programmeurs kregen de API, waarop geen copyright rust, en kregen te horen dat ze naar die specificatie moesten schrijven. Met wettelijke verklaringen waar de kloners graag voor zweerden in de rechtbank, werd het principe dat je niet kunt kopiรซren wat je niet hebt gezien, gehandhaafd โ€“ en het laatste stukje van de legpuzzel in de originele Clone Wars was op zijn plaats. Dat API's zo'n krachtig tegengif bieden tegen auteursrecht heeft ertoe geleid dat velen recentelijk probeerden hun juridische status te wijzigen Google tegen Oracle. Dat eindigde in het Amerikaanse Hooggerechtshof waar het, net als alle andere, faalde.

Neem dus twee geautomatiseerde systemen, een speciaal voor het vinden en isoleren van interfaces binnen code, en een speciaal voor het toepassen van regels om code te genereren die deze interfaces biedt. Er is geen overdracht van coderegels over de virtuele luchtspleet. Geautomatiseerd testen van originele versus AI-code zou de kwaliteit verhogen. En passant zou een zeer fijne set tools voor refactoring worden geboren, waar iedereen baat bij heeft. Klinkt ethisch, toch?

Daar hebben we het. Als er echte problemen zijn met wat Copilot aan het doen is, dan zijn er meerdere manieren om ze te vermijden terwijl het nut behouden blijft en nieuwe voordelen worden gecreรซerd. Volgens de regels spelen en tegelijkertijd dingen beter maken? Dat is een goede lijn om te nemen. ยฎ

Tijdstempel:

Meer van Het register