Oricum, a cui linie este, GitHub? Câteva sfaturi pentru dezvoltatori

Oricum, a cui linie este, GitHub? Câteva sfaturi pentru dezvoltatori

Whose line is it anyway, GitHub? Some tips for devs PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Opinie Sursa deschisa. E deschis. Te poti uita. În mare parte, puteți folosi. Există un indiciu în nume. Nu atât de repede, susține o acțiune colectivă introdusă împotriva Microsoft, OpenAI și GitHub. Copilot, un bot de sugestii alimentat de AI și antrenat cu sursă deschisă în IDE, funcționează oferind linii de cod programatorilor – și asta, susține acțiunea de clasă, încalcă regulile și încearcă să-l ascundă. Un judecător a decis că unele dintre revendicări merită ziua lor în instanță. Dragă doamne, nu o altă luptă pentru drepturile de autor.

Tehnologia poate părea foarte ciudată pentru judecători. Să presupunem că cumpărați în mod legal o carte electronică. Cum îl obții? Routerele și serverele de cache fac fiecare copii ale cărții pe măsură ce este livrată, dar nu au plătit niciun ban. Proprietarii infrastructurii de internet încalcă drepturile de autor de miliarde de ori pe zi? Ai putea crede că este o întrebare nebună, dar a deranjat Curtea Supremă a Marii Britanii suficient de mult încât să meargă în Europa să întrebe „Este acest internet într-adevăr legal??” Nu fi atât de prost, a venit răspunsul. Ne este dor de Europa.

Câte dintre pretențiile împotriva Microsoft, Copilot și prompter-ul de cod al OpenAI vor cădea în nenorocita cutie rămâne de văzut. Nimeni nu a prevăzut ca AI să ingereze baze de date globale de cod sursă deschisă atunci când au fost scrise regulile. Din nou, nimeni nu a prevăzut motoarele de căutare care făceau ingerare, analiză și prezentare angro a întregului conținut. Asta cu siguranță are problemele sale, dar consensul este că este prea util și nu este suficient de dăunător pentru a scoate în afara legii. Copilot și alte sisteme de învățare automată care se hrănesc cu conținut de internet sunt aproape la fel ca și motoarele de căutare. Deci întrebarea este, rezultatul nu este suficient de util sau prea dăunător pentru a fi acceptat? Unde este echilibrul intereselor?

Există modalități utile de abordare a problemelor și ele implică – managementul corporativ să privească acum – etica. Da, într-adevăr, acea discuție scurtă la modă despre IA etică oferă o cale concretă de urmat care va funcționa mult mai bine decât procesele.

Deformat, așa cum este de interese speciale, inima legii proprietății intelectuale este ca dorințele rezonabile ale creatorului să fie respectate. Dacă software-ul este open source, atunci creatorul dorește în mod rezonabil ca oamenii să-l poată citi și să le folosească. Ceva care încurajează acest lucru nu pare cel mai mare păcat din lume.

Poate că acesta este modul în care o face, prezentând sugestiile de cod în afara contextului. La urma urmei, există o mulțime de licențe open source, iar unele pot conține condiții despre care fericitul nostru Copilot ar trebui să le cunoască. Ei bine, presupunând că Copilot poate recunoaște când sugerează codul altcuiva, nu este nerezonabil să raporteze condițiile de licență în care este oferit. Asta pune sarcina codificatorului de a se conforma, ceea ce este mai etic decât a oferi tentației în timp ce ascunde consecințele. S-ar putea chiar să îmbunătățească rata de accesare pentru respectarea regulilor open source.

Ce se întâmplă dacă codificatorul original chiar nu vrea ca lucrurile lor să fie strecurate prin măruntaiele lui Copilot? Lumea motoarelor de căutare a abordat acest lucru prin inventarea robots.txt. Puneți un fișier cu acest nume în directorul rădăcină web și veți pune un semn „Fără intrare” pentru crawlerele web. Lucrurile sunt puțin mai avansate în zilele noastre, așa că ar fi bine să introduceți acest tip de funcție în structura GitHub cu orice tip de reglare fină care exprimă cel mai bine intenția creatorului. În orice caz, spunând furnizorilor de conținut: „Nu vrei lucrurile tale în rezultatele căutării noastre? Amenda." a avut tendința să concentreze mințile asupra modalităților de a trăi cu ea. Oferiți oamenilor alegeri în timp ce le explicați consecințele? Grozav.

Chiar dacă acordarea oamenilor dreptul de a-și elimina codul din Copilot și altele asemenea duce la o mulțime de lucruri bune care dispar, acesta nu este sfârșitul lumii. Există „principiul camerei curate”, care a distrus poziția dominantă a IBM în anii 1980, în timp ce a accelerat piața ca un nebun. Acesta este ceva din care învățarea automată ar putea învăța multe.

PC-ul IBM original a fost aproape în întregime open source. IBM a publicat un manual tehnic cu diagrame complete de circuit, toate folosind cipuri standard conectate între ele în moduri standard pe care producătorii de cipuri le-au oferit gratuit. Proiectarea unei clone de PC IBM echivalente din punct de vedere funcțional (dar fără drepturi de autor) a fost ceva ce puteau face mii de ingineri electronici și sute au făcut-o.

Mina legală din cutia bej a fost BIOS-ul, Basic Input-Otput System, o bucată relativ mică de software permanent care a furnizat un set standard de servicii hardware sistemelor de operare și aplicațiilor prin întreruperi – ceea ce s-ar numi astăzi un API. Dacă tocmai ați copia acel cod pentru clona dvs., IBM v-ar face să vă dați dreptate. Ai putea rescrie codul, dar IBM te-ar putea lega apoi în procese, făcându-te să demonstrezi că nu ai copiat nimic din el. Chiar dacă ai câștiga, întârzierea și cheltuiala te-ar scufunda.

Cue camera curată. Clonerii au angajat codificatori care nu au citit niciodată o linie din BIOS-ul IBM și le-au interzis să facă acest lucru. Acești programatori au primit API-ul, care nu era drepturi de autor, și li s-a spus să scrie la specificațiile respective. Cu atestări legale, clonerii au fost bucuroși să jure în instanță, principiul că nu puteți copia ceea ce nu ați văzut deținut – și ultimul fragment al puzzle-ului din Războiul clonelor original era în vigoare. Faptul că API-urile oferă un antidot atât de puternic împotriva drepturilor de autor i-a determinat pe mulți să încerce să-și schimbe statutul legal, cel mai recent Google v Oracle. Aceasta a ajuns la Curtea Supremă a SUA unde, la fel ca toate celelalte, a eșuat.

Deci, luați două sisteme automate, unul dedicat găsirii și izolării interfețelor în cod și unul dedicat aplicării regulilor pentru a genera codul care furnizează acele interfețe. Nu există nici un transfer de linii de cod prin spațiul de aer virtual. Testarea automată a codului original versus codul AI ar crește calitatea. En passant, s-ar fi născut un set foarte fin de instrumente pentru refactorizare, în beneficiul tuturor. Sună etic, nu?

Iată-l avem. Dacă există probleme reale cu ceea ce face Copilot, atunci există mai multe modalități de a le evita, păstrând în același timp utilitatea și creând noi beneficii. Să joci după reguli în timp ce faci lucrurile mai bine? Este o linie bună de urmat. ®

Timestamp-ul:

Mai mult de la Registrul