OpenAI stämde, återigen, för att ha skrapat och replikerat nyheter

OpenAI stämde, återigen, för att ha skrapat och replikerat nyheter

OpenAI stämde, återigen, för att skrapa och replikera nyheter PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Tre digitala utgivare har stämt OpenAI för påståenden om att de stal deras upphovsrättsskyddade artiklar för att träna ChatGPT i två separata stämningar som lämnades in på onsdagen.

ChatGPT tränades på stora delar av text som skrapats från internet, inklusive massor av journalistik. Nyhetsutgivare är dock inte glada över att OpenAI använde deras artiklar för att träna sina modeller utan tillstånd eller kompensation, och New York Times har redan stämt OpenAI över problemet.

The Intercept, Raw Story, AlterNet är de senaste medieorganisationerna som stämmer OpenAI för upphovsrättsintrång. Intercept lämnade in det ena ärendet, och eftersom Raw Story och AlterNet ägs av samma enhet som det lämnade in det andra. Samma advokatbyrå, Loevy & Loevy, driver båda ärendena.

The Intercept har också gått efter Microsoft, som backar upp OpenAI och använder superlabbets teknologi, i sitt fall.

Båda stämningarna anklagar de tilltalade för intrång i upphovsrätten och brott mot Digital Millennium Copyright Act, som förbjuder att ta bort namnen på författare och titlar på deras verk för att dölja IP-stöld.

"När de fyllde sina utbildningsset med journalistiska verk hade de tilltalade ett val: de kunde träna ChatGPT med hjälp av journalistiska verk med upphovsrättshanteringsinformationen skyddad av DMCA intakt, eller så kunde de ta bort den", skriver domstolsdokumenten i målet. initierat av Raw Story och staten AltNet[PDF].

"Svarande valde det senare, och i processen utbildade ChatGPT att inte erkänna eller respektera upphovsrätten, att inte meddela ChatGPT-användare när svaren de fick skyddas av journalisters upphovsrätt, och att inte tillhandahålla erkännande när de använder verk av mänskliga journalister. ”

Liknande påståenden om DMCA-överträdelser, som gjorts av skribenter i en tidigare rättegång mot OpenAI, har inte lyckats.

Advokater som representerar The Intercept, Raw Story, AlterNet sa att det inte är klart vilken text OpenAI och Microsoft använder för att träna sina modeller, men pekade på tre datauppsättningar – WebText, WebText2 och Common Crawl – som de tror inkluderar kärandenas innehåll. Advokaterna tror att artiklar från alla tre utgivarna har skrapats och hävdat att ChatGPT genererar innehåll som efterliknar "betydande mängder" av upphovsrättsskyddat journalistiskt material "åtminstone en del av tiden."

"Baserat på den allmänt tillgängliga informationen som beskrivs ovan inkluderades tusentals kärandens upphovsrättsskyddade verk i svarandens utbildningsuppsättningar utan upphovsman, titel och upphovsrättsinformation som käranden förmedlade när de publicerade dem", domstolsdokument [PDF] från The Intercepts juridiska team.

Båda kärandena kräver skadestånd och ett föreläggande som tvingar AI-chatbotutvecklarna att ta bort alla kopior av deras upphovsrättsskyddade verk. De vill också att domare i New Yorks södra distrikt ska tillåta en juryrättegång.

Registret har bett OpenAI och Microsoft om kommentarer. ®

Tidsstämpel:

Mer från Registret