Autorite gild kaebab OpenAI kohtusse raamatute kasutamise eest ChatGPT koolitamiseks

Taasavaldanud Platon

järgijaid: 0

Autorite gild kaebab OpenAI kohtusse, kuna ta kasutas raamatuid ChatGPT PlatoBlockchain Data Intelligence'i koolitamiseks. Vertikaalne otsing. Ai.

Autorite gild, avaldatud kirjanike kaubandusühendus ja 17 autorit on OpenAI-s vallandanud draakonid, kuna see väidetavalt kasutab nende teoseid oma vestlusrobotite koolitamiseks.

Nimetatud hagejad autoriõiguste rikkumise ühishagi hagis, mis esitati New Yorgi lõunapiirkonnas autoriõiguste eest, on David Baldacci, Mary Bly, Michael Connelly, Sylvia Day, Jonathan Franzen, John Grisham, Elin Hilderbrand, Christina Baker Kline, Maya Shanbhag Lang , Victor LaValle, George RR Martin, Jodi Picoult, Douglas Preston, Roxana Robinson, George Saunders, Scott Turow ja Rachel Vail.

. kaebus [PDF] väidab, et OpenAI teenused ohustavad ilukirjanike elatist teenimise võimalust, kuna suured keelemudelid võimaldavad igaühel automaatselt ja vabalt (või väga odavalt) genereerida tekste, mille loomise eest nad muidu kirjutajatele maksaksid.

Kirjatundjad ei ole rahul sellega, et OpenAI ei õpetanud oma mudeleid nende tööks ilma loata, vaid et AI-süsteemid kopeerivad inimeste päringutele vastates nende kirjutisi ebaõiglaselt, või väidetavalt.

Kaebuses juhitakse tähelepanu sellele, et ChatGPT-l on edukalt palutud luua „üksikasjalik ülevaade eellugude raamatu jaoks Trotside mäng …kasutades samu tegelasi Martini sarja olemasolevatest raamatutest Jää ja tule laul.” Sarnased tulemused olid võimalikud ka teiste hagiga liitunud autorite puhul.

ChatGPT võime seda teha on problemaatiline, kuna autorid ütlesid, et nad ei andnud OpenAI-le juurdepääsu oma teostele, kuna see näib olevat seda teinud. Autorid usuvad, et kui tehisintellekti labor andis koolituse ajal nende töö mudelisse, tähendas see volitamata kopeerimist ja GPT mudelid väljastavad autoriõigustega kaitstud teoste ebaseaduslikke tuletisi.

"Nende algoritmide keskmes on süstemaatiline massiline vargus," väidetakse kohtuasja paberites.

Kaebuses väidetakse, et OpenAI on tunnistanud, et kasutas oma suurte keelemudelite koolitamiseks andmekogumeid nimega Books1 ja Books2, kuid ei ole avaldanud nende sisu. Hagejad kahtlustavad, et piraatraamatud on jõudnud OpenAI koolitusandmetesse.

Võimsuse ja keerukuse kasv GPT-3-lt GPT-4-le viitab koolitusandmete kogumite suuruse korrelatiivsele kasvule, mis suurendab järeldust, et ühte või mitut ülalpool käsitletud väga suurt piraat-e-raamatute allikat pidi olema kasutatud välja õpetada GPT-4,“ väidetakse kaebuses ja lisatakse, et OpenAI ei oleks saanud muul viisil hankida vajaliku hulga raamatuid, et „koolitada” võimsat LLM-i nagu GPT-4.

Tegelikult mainitakse kaebuses üht teist võimalust: ChatGPT koolitamiseks kasutatud sisu eest tasumine. Kuid hagis väidetakse, et OpenAI pole kunagi mõelnud seda teha, ja tsiteerib tegevjuhi Sam Altmani tunnistust Kongressile, et ta usub autoriõigusi ja on tasunud mõnede koolitusandmete eest.

"Ilukirjanduskirjanike jaoks on OpenAI poolt nende teoste volitamata kasutamine identiteedivargus suures ulatuses," ütles Autorite Gildi tegevjuht Mary Rasenberger.

"Ilukirjanduse autorid loovad oma kujutlusvõimest täiesti uusi maailmu – nad loovad oma lugudes kohad, inimesed ja sündmused," lisas ta enne kahetsust: "Inimesed juba levitavad sisu, mis on loodud GPT versioonide abil, mis jäljendavad või kasutavad originaalautoreid. ' tegelased ja lood. Ettevõtted müüvad viipasid, mis võimaldavad teil siseneda autori raamatute maailma. Need on ilmsed esialgsete loojate intellektuaalomandi õiguste rikkumised.

Hagejad soovivad "kahju hüvitamist kaotatud võimaluse eest litsentsida oma teoseid ja turu anastamise eest, mille kostjad [OpenAI] on võimaldanud, muutes hagejad soovimatuteks kaasosalisteks nende endi asendamisel; ja alaline ettekirjutus, et vältida nende kahjude kordumist.

Register on palunud OpenAI-l kommentaari ja värskendab seda lugu, kui saame sisuka vastuse. ®