A technológiai óriások kérdéseket tesznek fel az LLM szerzői jogi szabályairól

A technológiai óriások kérdéseket tesznek fel az LLM szerzői jogi szabályairól

Tech giants duck questions on LLM copyright rules PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A héten az Egyesült Királyság parlamentjében a Microsoft és a Meta elvetette azt a kérdést, hogy kell-e fizetni az alkotóknak, ha szerzői joggal védett anyagaikat nagy nyelvi modellek betanítására használják.

A technológiai titánok, amelyek együttes bevétele jóval meghaladta a 200 milliárd dollárt grillezett a Lordok Háza Kommunikációs és Digitális Bizottsága, amikor a szerzői jogi kérdés került a középpontba.

Szeptemberben a Szerzők Céhe, a megjelent írók szakmai egyesülete és 17 szerző csoportos pert indított az Egyesült Államokban amiatt, hogy az OpenAI felhasználta anyagaikat LLM-alapú szolgáltatásai létrehozásához.

Az OpenAI vezérigazgatója, Sam Altman azóta azt mondta, hogy a vállalat inkább fedezi ügyfelei jogi költségeit a szerzői jogok megsértése miatt, ahelyett, hogy eltávolítaná az anyagot a képzési készleteiből.

A Microsoft befektetett 13 milliárd dollár az OpenAI-ban. Kibővített partneri kapcsolatban áll a gépi tanulási fejlesztővel, amely az Azure felhőplatformon hajtja végre a munkaterheléseit, és modelljeit használja a Copilot automatizált asszisztens futtatásához.

Owen Larter, a Microsoft Office of Responsible AI közpolitikai igazgatója tegnap a Lordoknak nyilatkozva a következőket mondta: „Fontos megérteni, milyen egy nagy nyelvi modell. Ez egy szöveges adatokra kiképzett nagy modell, amely a különböző ötletek közötti asszociációkat tanulja meg. Nem feltétlenül szív fel semmit alulról.”

Azt mondta, hogy léteznie kell egy „keretnek”, amely bizonyos védelmet biztosít a szerzői joggal védett anyagok számára, és a Microsoft vállalja a felelősséget az LLM-alapú rendszerei által elkövetett bármilyen jogsértésért. De azt is mondta, a Microsoft támogatja a közelmúltban Valance jelentés az „innovációt támogató” mesterséges intelligenciatörvénybe az Egyesült Királyságban, amely a szöveg- és adatkivételek mellett szól a képzési modellekben.

Donald Michael, Lord Foster a Bath-ból azonban megkérdőjelezte Lartert, hogy elfogadná-e, hogy ha egy vállalat szerzői jog által védett anyagokat használ fel egy LLM létrehozására profitszerzés céljából, a szerzői jog tulajdonosának vissza kell fizetnie a költségeket.

A Microsoft igazgatója így nyilatkozott: „Nagyon fontos megérteni, hogy ezeket a nagy nyelvi modelleket nagy adathalmazokon kell betanítanunk, ha azt akarjuk, hogy hatékonyan működjenek, ha lehetővé akarjuk tenni, hogy biztonságosak legyenek… Van néhány versenyprobléma is annak biztosítása érdekében, hogy a nagy modellek képzése mindenki számára elérhető legyen. Ha túl messzire megy azon az úton, ahol nagyon nehéz adatokat szerezni a modellek betanításához, akkor ennek lehetősége hirtelen csak a nagyon nagy cégek kezében lesz.”

A peres eljárás már folyamatban van hogy foglalkozzon az edzési adatkészletekkel Könyvek 1, a Books2 és a Books3, amelyek gyakorlatilag szerzői joggal védett anyagokat kalóznak, a népszerű LLM-ek felépítésére szolgáltak.

Meta mögött a Llama 2 LLM, amely 70 milliárd paraméterig skáláz. A közösségi média óriása a modellt nyílt forráskódúként népszerűsítette, bár a FOSS puristái rámutatnak néhány figyelmeztetésre a megközelítésében.

A Lordoknak nyilatkozva Rob Sherman, a Meta alelnöke és adatvédelmi vezérigazgató-helyettese azt mondta, hogy a cég betartja a törvényt.

Hozzátette azonban, hogy „nagyon fontos az interneten található információkhoz és információkhoz való széles körű hozzáférés fenntartása, beleértve az ehhez hasonló innovációban való felhasználást is. Támogatom, hogy a jogtulajdonosok kezelhessék információik felhasználási módját.

"Kicsit óvatos vagyok azzal kapcsolatban, hogy az AI-t építő cégeket arra kényszerítsék, hogy egyedi jogtulajdonosokkal kössenek egyedi megállapodásokat, vagy olyan tartalomért fizessenek meg, amely nem bír számukra gazdasági értékkel."

A múlt héten Dan Conway, az Egyesült Királyság Kiadók Szövetségének vezérigazgatója azt mondta a bizottságnak, hogy a nagy nyelvi modellek „abszolút tömegesen” sértik a szerzői jog által védett tartalmakat.

"A kiadói ágazatban ezt a Books3 adatbázisból ismerjük, amely 120,000 XNUMX kalózkönyvcímet tartalmaz, amelyekről tudjuk, hogy nagy nyelvi modellek nyelték el őket" - mondta. „Tudjuk, hogy a tartalmat a nagy nyelvi modellek abszolút tömegesen fogyasztják. Az LLM-ek a folyamat több részében megsértik a szerzői jogokat, tekintettel arra, hogy mikor gyűjtik ezeket az információkat, hogyan tárolják ezeket az információkat, és hogyan kezelik azokat. A szerzői jogi törvényt tömegesen sértik meg.”

Ugyanezen a meghallgatáson Dr. Hayleigh Bosher, a londoni Brunel Egyetem szellemi tulajdonjogának olvasója azt mondta, hogy nem képviseli a technológiai cégeket vagy a tartalomkészítőket, és semleges álláspontot képviselt.

„Az az elv, hogy mikor kell licenc, és mikor nem, egyértelmű – mondta –, és egy szerzői joggal védett mű engedély nélküli sokszorosítása engedélyköteles, vagy egyébként jogsértést jelent. A mesterséges intelligencia ezt teszi a folyamat különböző lépéseiben: a bevitel, a program futtatása és esetleg a kimenet is.

„Néhány mesterséges intelligencia- és technológiafejlesztő a törvény eltérő értelmezésével érvel. Nem képviselem egyik oldalt sem. Szerzői jogi szakértő vagyok, és az én pozíciómból adódóan, ha tisztában vagyok azzal, hogy a szerzői jognak mit kell elérnie és hogyan éri el, ehhez a tevékenységhez engedélyre lenne szüksége.” ®

Időbélyeg:

Még több A regisztráció