Tech Giants ontwijken vragen over LLM-auteursrechtregels

Heruitgegeven door Plato

volgers: 0

Tech-giganten ontwijken vragen over LLM-auteursrechtregels PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

In het Britse parlement ontweken Microsoft en Meta deze week de vraag of makers betaald moeten worden als hun auteursrechtelijk beschermde materiaal wordt gebruikt om grote taalmodellen te trainen.

De tech-titanen, met een gezamenlijke omzet van ruim boven de 200 miljard dollar, waren dat wel gegrild door het House of Lords Communications and Digital Committee toen de kwestie van het auteursrecht in beeld kwam.

In september heeft de Authors' Guild, een branchevereniging voor gepubliceerde schrijvers, 17 auteurs opgericht een class-action rechtszaak aangespannen in de VS over het gebruik door OpenAI van hun materiaal om zijn op LLM gebaseerde diensten te creëren.

OpenAI CEO Sam Altman heeft sindsdien gezegd dat het bedrijf de juridische kosten van zijn klanten voor rechtszaken wegens inbreuk op het auteursrecht zou dekken in plaats van het materiaal uit zijn trainingssets te verwijderen.

Microsoft heeft investeerde $13 miljard aan OpenAI. Het heeft een uitgebreide samenwerking met de machine learning-ontwikkelaar, waarbij de workloads op het Azure-cloudplatform worden aangestuurd en de modellen worden gebruikt om de geautomatiseerde assistent Copilot uit te voeren.

Owen Larter, directeur openbaar beleid bij Microsoft's Office of Responsible AI, zei gisteren in een toespraak tot de Lords: “Het is belangrijk om te beseffen wat een groot taalmodel is. Het is een groot model dat is getraind op tekstgegevens en de associaties tussen verschillende ideeën leert. Het hoeft niet noodzakelijkerwijs iets van onderaf op te zuigen.”

Hij zei dat er een ‘framework’ moet zijn om enige bescherming te bieden voor auteursrechtelijk beschermd materiaal en dat Microsoft de verantwoordelijkheid op zich zou nemen voor elke inbreuk door zijn op LLM gebaseerde systemen. Maar hij zei ook dat Microsoft het recente ondersteunt Valance-rapport naar de “pro-innovatie” AI-wetgeving in Groot-Brittannië, die pleit voor tekst- en data-uitzonderingen in trainingsmodellen.

Maar Donald Michael, Lord Foster uit Bath, drong er bij Larter op aan of hij zou accepteren dat als een bedrijf auteursrechtelijk beschermd materiaal gebruikt om een LLM op te bouwen met winstoogmerk, de eigenaar van het auteursrecht moet worden vergoed.

De Microsoft-directeur zei: “Het is heel belangrijk om te begrijpen dat je deze grote taalmodellen moet trainen op grote datasets als je ze effectief wilt laten presteren, als je ze veilig wilt laten zijn … Er zijn ook enkele concurrentieproblemen [om ervoor te zorgen] dat het trainen van grote modellen voor iedereen beschikbaar is. Als je te ver gaat op een pad waar het heel moeilijk is om gegevens te verkrijgen om modellen te trainen, dan zal de mogelijkheid daartoe ineens alleen het domein zijn van zeer grote bedrijven.”

Er loopt al een rechtszaak om aan te pakken hoe trainingsgegevens worden verzameld Boeken1, Books2 en Books3, die feitelijk auteursrechtelijk beschermd materiaal illegaal kopiëren, zijn gebruikt om populaire LLM's te helpen opbouwen.

Meta zit achter de Lama 2 LLM, dat kan worden opgeschaald naar 70 miljard parameters. De socialemediagigant heeft het model gepromoot als open source, hoewel FOSS-puristen enkele kanttekeningen plaatsen bij zijn aanpak.

In een gesprek met de Lords zei Rob Sherman, vice-president en plaatsvervangend hoofd privacyfunctionaris voor beleid bij Meta, dat het bedrijf de wet zou naleven.

Maar hij voegde eraan toe dat “het behouden van brede toegang tot informatie op internet en informatie, ook voor gebruik bij dit soort innovatie, heel belangrijk is. Ik ben er voorstander van om rechthebbenden de mogelijkheid te geven te beheren hoe hun informatie wordt gebruikt.

“Ik ben een beetje voorzichtig met het idee om bedrijven die AI bouwen te dwingen om op maat gemaakte overeenkomsten te sluiten met individuele rechthebbenden of om te betalen voor inhoud die voor hen geen economische waarde heeft.”

Vorige week vertelde Dan Conway, CEO van de Britse Publishers Association, de commissie dat grote taalmodellen op “absoluut enorme schaal” inbreuk maakten op auteursrechtelijk beschermde inhoud.

“We weten dit in de uitgeverijsector dankzij de Books3-database die 120,000 illegale boektitels bevat, waarvan we weten dat ze zijn opgenomen door grote taalmodellen,” zei hij. “We weten dat de inhoud op absoluut enorme schaal wordt opgenomen door grote taalmodellen. LLM's maken inbreuk op het auteursrecht op meerdere onderdelen van het proces, bijvoorbeeld wanneer ze deze informatie verzamelen, hoe ze deze informatie opslaan en hoe ze ermee omgaan. De auteursrechtwet wordt op grote schaal overtreden.”

Tijdens dezelfde hoorzitting zei dr. Hayleigh Bosher, lector intellectueel eigendomsrecht aan de Brunel University London, dat ze geen technologiebedrijven of makers van inhoud vertegenwoordigde en een neutraal perspectief naar voren bracht.

“Het principe wanneer je een licentie nodig hebt en wanneer niet is duidelijk,” zei ze, “en voor het maken van een reproductie van een auteursrechtelijk beschermd werk zonder toestemming zou een licentie nodig zijn of anderszins een inbreuk zijn. Dat is wat AI doet in verschillende stappen van het proces: de opname, het uitvoeren van het programma en mogelijk zelfs de uitvoer.

“Sommige AI- en technologie-ontwikkelaars pleiten voor een andere interpretatie van de wet. Ik vertegenwoordig geen van beide partijen. Ik ben een expert op het gebied van auteursrechten, en vanuit mijn standpunt, omdat ik begrijp wat het auteursrecht zou moeten bereiken en hoe het dit bereikt, zou je voor die activiteit een licentie nodig hebben. ®

Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
Bron: https://go.theregister.com/feed/www.theregister.com/2023/11/15/house_of_lords_ai_copyright/

Tijdstempel: 15 november 2023

Tijdstempel: 19-2024-XNUMX

OpenAI opent deuren naar DALL-E nadat het paard naar Midjourney is vastgebout, enz.

Broncluster:

Het register

Bronknooppunt: 1703189

Tijdstempel: September 28, 2022

Wordt 2023 het jaar van dynamische desinfo-deepfakes, bedacht door schurkenstaten?

Broncluster:

Het register

Bronknooppunt: 1788779

Tijdstempel: Jan 17, 2023

Britse waakhond-hackles veroorzaakt door AI-cloud-partnerschappen

Broncluster:

Het register

Bronknooppunt: 1963535

Tijdstempel: 12-2024-XNUMX

Heruitgegeven door Plato

Eindelijk helpt iemand AI-modellen mensen met spraakbeperkingen te begrijpen

Belgische bierstudie krijgt smaak voor machinaal leren

OWASP biedt een lijst met de belangrijkste beveiligingsrisico's van LLM-chatbots

Laat die bewuste AI even met rust en repareer eerst die racistische chatbots

UnitedHealthcare heeft een rechtszaak aangespannen wegens door AI geweigerde medische claims

Fujitsu Japan maakt gebruik van de Alloy-serviceprovidercloud van Oracle

OpenAI opent deuren naar DALL-E nadat het paard naar Midjourney is vastgebout, enz.

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account