OpenAI sagsøgte igen for at skrabe og kopiere nyheder

OpenAI sagsøgte igen for at skrabe og kopiere nyheder

OpenAI sued, again, for scraping and replicating news PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Tre digitale udgivere har sagsøgt OpenAI for påstande om, at de stjal deres ophavsretsligt beskyttede artikler for at træne ChatGPT i to separate retssager anlagt onsdag.

ChatGPT blev trænet på store dele af tekst skrabet fra internettet, inklusive masser af journalistik. Nyhedsudgivere er dog ikke glade for, at OpenAI brugte deres artikler til at træne sine modeller uden tilladelse eller kompensation, og New York Times har allerede sagsøgt OpenAI over problemet.

The Intercept, Raw Story, AlterNet er de seneste medieorganisationer til at sagsøge OpenAI for krænkelse af ophavsretten. Intercept anlagde den ene sag, og da Raw Story og AlterNet ejes af den samme enhed, som den indgav den anden. Det samme advokatfirma, Loevy & Loevy, kører begge sager.

The Intercept er også gået efter Microsoft, som bakker op om OpenAI og bruger superlaboratoriets teknologi i sit tilfælde.

Begge retssager anklager de tiltalte for krænkelse af ophavsretten og overtrædelse af Digital Millennium Copyright Act, som forbyder at fjerne navne på forfattere og titler på deres værker for at skjule IP-tyveri.

"Da de befolkede deres træningssæt med journalistiske værker, havde de tiltalte et valg: de kunne træne ChatGPT ved at bruge journalistiske værker med ophavsretsstyringsinformationen beskyttet af DMCA intakt, eller de kunne fjerne den," skriver retsdokumenterne i sagen. initieret af Raw Story og AltNet-staten[PDF].

“Tiltalte valgte sidstnævnte, og i processen trænede ChatGPT til ikke at anerkende eller respektere ophavsret, ikke at underrette ChatGPT-brugere, når de svar, de modtog, var beskyttet af journalisters ophavsret, og ikke at give tilskrivning, når de bruger værker af menneskelige journalister. ”

Lignende DMCA-overtrædelsespåstande fremsat af forfattere i en tidligere retssag mod OpenAI, er det ikke lykkedes.

Advokater, der repræsenterer The Intercept, Raw Story, AlterNet sagde, at det ikke er klart, hvilken tekst OpenAI og Microsoft bruger til at træne deres modeller, men pegede på tre datasæt – WebText, WebText2 og Common Crawl – som de mener omfatter sagsøgernes indhold. Advokaterne mener, at artikler fra alle tre udgivere er blevet skrabet og argumenteret for, at ChatGPT genererer indhold, der efterligner "betydelige mængder" af ophavsretligt beskyttet journalistisk materiale "i det mindste noget af tiden."

"Baseret på de offentligt tilgængelige oplysninger beskrevet ovenfor, blev tusindvis af sagsøgeres ophavsretligt beskyttede værker inkluderet i sagsøgtes træningssæt uden forfatteren, titlen og ophavsretsinformationen, som sagsøgerne formidlet ved udgivelsen af ​​dem," retsdokumenter [PDF] fra The Intercepts juridiske teamstat.

Begge sagsøgere søger erstatning og et påbud, der tvinger AI-chatbot-udviklerne til at fjerne alle kopier af deres ophavsretligt beskyttede værker. De ønsker også, at dommere i det sydlige distrikt i New York tillader en retssag med en jury.

Registret har bedt OpenAI og Microsoft om en kommentar. ®

Tidsstempel:

Mere fra Registret