Auteurs dienen een auteursrechtzaak in om Nvidia's NeMo te torpederen

Auteurs dienen een auteursrechtzaak in om Nvidia's NeMo te torpederen

Auteurs dienen een auteursrechtzaak in om Nvidia's NeMo PlatoBlockchain Data Intelligence te torpederen. Verticaal zoeken. Ai.

Nvidia is de nieuwste technologiegigant die te maken krijgt met beschuldigingen dat het auteursrechtelijk beschermde werken heeft gebruikt om AI-modellen te trainen zonder toestemming van de auteurs.

Een voorgestelde class action proces [PDF], ingediend tegen de GPU supremo in San Francisco op vrijdag 8 maart, beweert dat het bedrijf auteursrechtelijk beschermd materiaal heeft gebruikt om grote taalmodellen te trainen in de Megatron-bibliotheek voor zijn NeMo generatief AI-framework.

De klacht werd ingediend door drie auteurs, Abdi Nazemian, Brian Keene en Stewart O'Nan, die beweren dat de boeken die zij schreven tot het materiaal behoorden dat werd gebruikt om de Megatron LLM's op te leiden.

Uit het dossier blijkt dat Nvidia er niet van wordt beschuldigd het werk van de auteurs zelf openlijk te kopiëren, maar in plaats daarvan een dataset te gebruiken om de Megatron-modellen te trainen waarvan bekend was dat deze een aantal niet-gelicentieerde auteursrechtelijk beschermde werken bevatten.

De rechtszaak heeft specifiek betrekking op modellen die Nvidia in september 2022 heeft uitgebracht, namelijk NeMo Megatron-GPT 1.3B, NeMo Megatron-GPT 5B, NeMo Megatron-GPT 20B en NeMo Megatron-T5 3B.

Deze worden gehost op de website van AI Outfit Gezicht knuffelen, samen met informatie over elk model, inclusief de trainingsdataset. In dit geval vermeldt de informatie dat de modellen zijn getraind op de “The Pile”-dataset, opgesteld door EleutherAI.

De Stapel wordt beschreven als “een dataset van 800 GB met diverse tekst voor taalmodellering”, en een van de samenstellende delen ervan is een verzameling boeken genaamd Books3, die de inhoud bevat van ongeveer 196,640 boeken, inclusief de boeken die door de drie auteurs zijn gemaakt.

Volgens de rechtbank was de Books3-dataset tot oktober 2023 afzonderlijk beschikbaar op Hugging Face, waarna deze werd verwijderd omdat deze “niet meer beschikbaar is en niet langer toegankelijk is vanwege gerapporteerde inbreuk op het auteursrecht.”

De auteurs willen dat de zaak wordt voortgezet als een collectieve actie, waarbij zijzelf optreden als groepsvertegenwoordigers, en vragen om een ​​juryrechtspraak en om schadevergoeding voor de vermeende schendingen van hun auteursrechten.

In een verklaring verzonden naar Het register, zei een woordvoerder van Nvidia: "We respecteren de rechten van alle makers van inhoud en zijn van mening dat we NeMo hebben gemaakt in volledige overeenstemming met de auteursrechtwetgeving."

Dit is niet de eerste zaak waarin een AI-bedrijf wordt aangeklaagd wegens beschuldigingen van inbreuk op het auteursrecht met betrekking tot de gegevens die worden gebruikt om AI-modellen te trainen. In december vorig jaar lanceerde The New York Times een zaak tegen Microsoft en OpenAI over beweringen dat het paar zijn artikelen zonder toestemming had gebruikt om ChatGPT en soortgelijke modellen te bouwen.

Die zaak werd misschien nog interessanter gemaakt door de bewering van OpenAI in januari dat dit wel het geval zou zijn “onmogelijk” om neurale netwerken van het hoogste niveau te bouwen die voldoen aan de hedendaagse behoeften zonder gebruik te maken van auteursrechtelijk beschermde werken van mensen.

Ondertussen is Nvidia nog steeds bezig met het voorbereiden van de AI-pomp met de aankondiging van een nieuwe professionele certificering in generatieve AI om ontwikkelaars te helpen technische geloofwaardigheid op dit gebied te verwerven.

Het zal beschikbaar zijn ter gelegenheid van het GTC-evenement van de in Santa Clara gevestigde gigant later deze maand professioneel certificeringsprogramma zal twee generatieve AI-accreditaties op associate-niveau aanbieden, gericht op vaardigheid in grote taalmodellen en multimodale workflowvaardigheden. ®

Tijdstempel:

Meer van Het register