Techgiganten ontwijken vragen over LLM-auteursrechtregels

Techgiganten ontwijken vragen over LLM-auteursrechtregels

Tech-giganten ontwijken vragen over LLM-auteursrechtregels PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

In het Britse parlement ontweken Microsoft en Meta deze week de vraag of makers betaald moeten worden als hun auteursrechtelijk beschermde materiaal wordt gebruikt om grote taalmodellen te trainen.

De tech-titanen, met een gezamenlijke omzet van ruim boven de 200 miljard dollar, waren dat wel gegrild door het House of Lords Communications and Digital Committee toen de kwestie van het auteursrecht in beeld kwam.

In september heeft de Authors' Guild, een branchevereniging voor gepubliceerde schrijvers, 17 auteurs opgericht een class-action rechtszaak aangespannen in de VS over het gebruik door OpenAI van hun materiaal om zijn op LLM gebaseerde diensten te creรซren.

OpenAI CEO Sam Altman heeft sindsdien gezegd dat het bedrijf de juridische kosten van zijn klanten voor rechtszaken wegens inbreuk op het auteursrecht zou dekken in plaats van het materiaal uit zijn trainingssets te verwijderen.

Microsoft heeft investeerde $13 miljard aan OpenAI. Het heeft een uitgebreide samenwerking met de machine learning-ontwikkelaar, waarbij de workloads op het Azure-cloudplatform worden aangestuurd en de modellen worden gebruikt om de geautomatiseerde assistent Copilot uit te voeren.

Owen Larter, directeur openbaar beleid bij Microsoft's Office of Responsible AI, zei gisteren in een toespraak tot de Lords: โ€œHet is belangrijk om te beseffen wat een groot taalmodel is. Het is een groot model dat is getraind op tekstgegevens en de associaties tussen verschillende ideeรซn leert. Het hoeft niet noodzakelijkerwijs iets van onderaf op te zuigen.โ€

Hij zei dat er een โ€˜frameworkโ€™ moet zijn om enige bescherming te bieden voor auteursrechtelijk beschermd materiaal en dat Microsoft de verantwoordelijkheid op zich zou nemen voor elke inbreuk door zijn op LLM gebaseerde systemen. Maar hij zei ook dat Microsoft het recente ondersteunt Valance-rapport naar de โ€œpro-innovatieโ€ AI-wetgeving in Groot-Brittanniรซ, die pleit voor tekst- en data-uitzonderingen in trainingsmodellen.

Maar Donald Michael, Lord Foster uit Bath, drong er bij Larter op aan of hij zou accepteren dat als een bedrijf auteursrechtelijk beschermd materiaal gebruikt om een โ€‹โ€‹LLM op te bouwen met winstoogmerk, de eigenaar van het auteursrecht moet worden vergoed.

De Microsoft-directeur zei: โ€œHet is heel belangrijk om te begrijpen dat je deze grote taalmodellen moet trainen op grote datasets als je ze effectief wilt laten presteren, als je ze veilig wilt laten zijn โ€ฆ Er zijn ook enkele concurrentieproblemen [om ervoor te zorgen] dat het trainen van grote modellen voor iedereen beschikbaar is. Als je te ver gaat op een pad waar het heel moeilijk is om gegevens te verkrijgen om modellen te trainen, dan zal de mogelijkheid daartoe ineens alleen het domein zijn van zeer grote bedrijven.โ€

Er loopt al een rechtszaak om aan te pakken hoe trainingsgegevens worden verzameld Boeken1, Books2 en Books3, die feitelijk auteursrechtelijk beschermd materiaal illegaal kopiรซren, zijn gebruikt om populaire LLM's te helpen opbouwen.

Meta zit achter de Lama 2 LLM, dat kan worden opgeschaald naar 70 miljard parameters. De socialemediagigant heeft het model gepromoot als open source, hoewel FOSS-puristen enkele kanttekeningen plaatsen bij zijn aanpak.

In een gesprek met de Lords zei Rob Sherman, vice-president en plaatsvervangend hoofd privacyfunctionaris voor beleid bij Meta, dat het bedrijf de wet zou naleven.

Maar hij voegde eraan toe dat โ€œhet behouden van brede toegang tot informatie op internet en informatie, ook voor gebruik bij dit soort innovatie, heel belangrijk is. Ik ben er voorstander van om rechthebbenden de mogelijkheid te geven te beheren hoe hun informatie wordt gebruikt.

โ€œIk ben een beetje voorzichtig met het idee om bedrijven die AI bouwen te dwingen om op maat gemaakte overeenkomsten te sluiten met individuele rechthebbenden of om te betalen voor inhoud die voor hen geen economische waarde heeft.โ€

Vorige week vertelde Dan Conway, CEO van de Britse Publishers Association, de commissie dat grote taalmodellen op โ€œabsoluut enorme schaalโ€ inbreuk maakten op auteursrechtelijk beschermde inhoud.

โ€œWe weten dit in de uitgeverijsector dankzij de Books3-database die 120,000 illegale boektitels bevat, waarvan we weten dat ze zijn opgenomen door grote taalmodellen,โ€ zei hij. โ€œWe weten dat de inhoud op absoluut enorme schaal wordt opgenomen door grote taalmodellen. LLM's maken inbreuk op het auteursrecht op meerdere onderdelen van het proces, bijvoorbeeld wanneer ze deze informatie verzamelen, hoe ze deze informatie opslaan en hoe ze ermee omgaan. De auteursrechtwet wordt op grote schaal overtreden.โ€

Tijdens dezelfde hoorzitting zei dr. Hayleigh Bosher, lector intellectueel eigendomsrecht aan de Brunel University London, dat ze geen technologiebedrijven of makers van inhoud vertegenwoordigde en een neutraal perspectief naar voren bracht.

โ€œHet principe wanneer je een licentie nodig hebt en wanneer niet is duidelijk,โ€ zei ze, โ€œen voor het maken van een reproductie van een auteursrechtelijk beschermd werk zonder toestemming zou een licentie nodig zijn of anderszins een inbreuk zijn. Dat is wat AI doet in verschillende stappen van het proces: de opname, het uitvoeren van het programma en mogelijk zelfs de uitvoer.

โ€œSommige AI- en technologie-ontwikkelaars pleiten voor een andere interpretatie van de wet. Ik vertegenwoordig geen van beide partijen. Ik ben een expert op het gebied van auteursrechten, en vanuit mijn standpunt, omdat ik begrijp wat het auteursrecht zou moeten bereiken en hoe het dit bereikt, zou je voor die activiteit een licentie nodig hebben. ยฎ

Tijdstempel:

Meer van Het register