Giganții tehnologici se îndepărtează de întrebări cu privire la regulile privind drepturile de autor LLM

Giganții tehnologici se îndepărtează de întrebări cu privire la regulile privind drepturile de autor LLM

Tech giants duck questions on LLM copyright rules PlatoBlockchain Data Intelligence. Vertical Search. Ai.

În Parlamentul Marii Britanii săptămâna aceasta, Microsoft și Meta au renunțat la întrebarea dacă creatorii ar trebui să fie plătiți atunci când materialul lor protejat prin drepturi de autor este folosit pentru a antrena modele lingvistice mari.

Titanii tehnologiei, cu venituri combinate de peste 200 de miliarde de dolari, erau gratar de către Comitetul de Comunicații și Digital al Camerei Lorzilor, atunci când problema drepturilor de autor a intrat în atenție.

În septembrie, Authors' Guild, o asociație comercială pentru scriitori publicati, și 17 autori a intentat un proces colectiv în SUA din cauza utilizării de către OpenAI a materialului lor pentru a-și crea serviciile bazate pe LLM.

CEO-ul OpenAI, Sam Altman, a declarat de atunci că compania va acoperi costurile legale ale clienților săi pentru procesele de încălcare a drepturilor de autor, mai degrabă decât să elimine materialul din seturile de instruire.

Microsoft are investit 13 miliarde de dolari în OpenAI. Are un parteneriat extins cu dezvoltatorul de învățare automată, alimentându-și sarcinile de lucru pe platforma cloud Azure și folosind modelele sale pentru a rula asistentul automat Copilot.

Vorbind ieri către Lords, Owen Larter, director de politici publice la Office of Responsible AI al Microsoft, a declarat: „Este important să apreciem ce este un model lingvistic mare. Este un model mare antrenat pe date text, care învață asocierile dintre diferite idei. Nu aspiră neapărat nimic de dedesubt.”

El a spus că ar trebui să existe un „cadru” care să ofere o anumită protecție pentru materialele protejate prin drepturi de autor și Microsoft își va asuma responsabilitatea pentru orice încălcare a sistemelor sale bazate pe LLM. Dar el a mai spus că Microsoft sprijină cele recente Raport valance în legea AI „pro-inovare” din Marea Britanie, care pledează pentru excepții de text și date în modelele de formare.

Dar Donald Michael, Lord Foster din Bath, l-a insistat pe Larter dacă va accepta că dacă o companie folosește materiale protejate prin drepturi de autor pentru a construi un LLM pentru profit, proprietarul drepturilor de autor ar trebui să fie rambursat.

Directorul Microsoft a spus: „Este foarte important să înțelegeți că trebuie să instruiți aceste modele mari de limbi pe seturi mari de date, dacă le veți face să funcționeze eficient, dacă le veți permite să fie în siguranță și în siguranță... Există, de asemenea, unele probleme legate de concurență [pentru a se asigura] că pregătirea modelelor mari este disponibilă pentru toată lumea. Dacă mergi prea departe pe o cale în care este foarte greu să obții date pentru a antrena modele, atunci dintr-o dată, capacitatea de a face acest lucru va fi doar rezerva companiilor foarte mari.”

Litigiile sunt deja în curs pentru a aborda modul în care setul de date de antrenament Cărți 1, Books2 și Books3, care piratează efectiv materiale protejate prin drepturi de autor, au fost folosite pentru a ajuta la construirea de LLM-uri populare.

Meta este în spatele Lama 2 LLM, care scalează până la 70 de miliarde de parametri. Gigantul rețelelor sociale a promovat modelul ca sursă deschisă, deși puriștii FOSS subliniază unele avertismente în abordarea sa.

Vorbind cu Lords, Rob Sherman, vicepreședinte și ofițer adjunct de confidențialitate la Meta, a spus că compania va respecta legea.

Dar el a adăugat că „menținerea accesului larg la informații de pe internet și informații, inclusiv pentru utilizarea în inovații ca aceasta, este destul de importantă. Susțin acordarea deținătorilor de drepturi de abilitatea de a gestiona modul în care sunt utilizate informațiile lor.

„Sunt puțin precaut cu privire la ideea de a forța companiile care construiesc IA să încheie acorduri personalizate cu deținătorii de drepturi individuali sau un ordin de plată pentru conținut care nu are valoare economică pentru ei.”

Săptămâna trecută, Dan Conway, CEO al Asociației Editorilor din Marea Britanie, a declarat comitetului că modelele mari de limbi încalcă conținutul protejat prin drepturi de autor la „o scară absolut masivă”.

„Știm acest lucru în industria editorială datorită bazei de date Books3, care listează 120,000 de titluri de cărți piratate, despre care știm că au fost ingerate de modele de limbă mari”, a spus el. „Știm că conținutul este ingerat la o scară absolut masivă de modele lingvistice mari. LLM-urile încalcă drepturile de autor în mai multe părți ale procesului în ceea ce privește momentul în care colectează aceste informații, cum stochează aceste informații și cum le gestionează. Legea drepturilor de autor este încălcată la scară masivă.”

La aceeași audiere, dr. Hayleigh Bosher, cititor în dreptul proprietății intelectuale la Universitatea Brunel din Londra, a spus că nu reprezintă firme de tehnologie sau creatori de conținut și a oferit o perspectivă neutră.

„Principiul când ai nevoie de o licență și când nu ai este clar”, a spus ea, „și a face o reproducere a unei opere protejate prin drepturi de autor fără permisiune ar necesita o licență sau, altfel, ar fi o încălcare. Asta face AI la diferiți pași ai procesului: asimilarea, rularea programului și, potențial, chiar rezultatul.

„Unii dezvoltatori de IA și tehnologie susțin o interpretare diferită a legii. Eu nu reprezint niciuna dintre aceste părți. Sunt un expert în drepturi de autor și, din poziția mea, înțelegând ce ar trebui să realizeze drepturile de autor și cum îl realizează, ai avea nevoie de o licență pentru acea activitate.” ®

Timestamp-ul:

Mai mult de la Registrul