OpenAI: On mahdotonta kouluttaa huipputason tekoälyä ja välttää tekijänoikeuksia

OpenAI: On mahdotonta kouluttaa huipputason tekoälyä ja välttää tekijänoikeuksia

OpenAI: On mahdotonta kouluttaa huipputason tekoälyä ja välttää tekijänoikeudella suojattua PlatoBlockchain Data Intelligenceä. Pystysuuntainen haku. Ai.

OpenAI on sanonut, että olisi "mahdotonta" rakentaa huipputason neuroverkkoja, jotka vastaavat nykypäivän tarpeita ilman ihmisten tekijänoikeudella suojattua työtä. Microsoftin tukema laboratorio, joka uskoo keräävänsä sisältöä laillisesti malliensa kouluttamiseksi, sanoi, että tekijänoikeuden alaisen julkisen aineiston käyttäminen johtaisi huonompaan tekoälyohjelmistoon.

Tämä väite tulee aikaan, jolloin koneoppimisen maailma ryntää pää edellä tiiliseinää, joka on tekijänoikeuslaki. Juuri tällä viikolla IEEE:n raportti päätti Midjourneyn ja OpenAI:n DALL-E 3:n, kaksi tärkeimmistä tekoälypalveluista, jotka muuttavat tekstikehotteet kuviksi. Ne voivat luoda uudelleen tekijänoikeudella suojattuja kohtauksia elokuvista ja videopeleistä harjoitustietojensa perusteella.

- opiskella, jonka ovat kirjoittaneet tekoälyasiantuntija ja kriitikko Gary Marcus ja digitaalinen kuvittaja Reid Southen, dokumentoivat useita "plagiaattisia tulosteita", joissa OpenAI ja DALL-E 3 tekevät olennaisesti samanlaisia ​​versioita elokuvien kohtauksista, kuvia kuuluisista. näyttelijöitä ja videopelisisältöä.

Marcus ja Southen sanovat, että on lähes varmaa, että Midjourney ja OpenAI ovat kouluttaneet tekoälykuvantuotantomallejaan tekijänoikeuksilla suojatulla materiaalilla.

Onko se laillista ja riskiäkö tekoälytoimittajat tai heidän asiakkaat joutua vastuuseen, on edelleen kiistanalainen kysymys. Raportin havainnot voivat kuitenkin tukea niitä, jotka haastavat Midjourneyn ja DALL-E-valmistajan OpenAI:n oikeuteen tekijänoikeusloukkauksista.

Käyttäjät eivät välttämättä tiedä, loukkaavatko he oikeuksia, kun he tuottavat kuvan

"Sekä OpenAI että Midjourney pystyvät täysin tuottamaan materiaalia, joka näyttää loukkaavan tekijänoikeuksia ja tavaramerkkejä", he kirjoittivat. "Nämä järjestelmät eivät ilmoita käyttäjille, kun he tekevät niin. He eivät anna mitään tietoa tuottamiensa kuvien alkuperästä. Käyttäjät eivät välttämättä tiedä, loukkaavatko he oikeuksia, kun he tuottavat kuvan."

Kumpikaan biz ei ole täysin paljastanut tekoälymalliensa tekemiseen käytettyjä harjoitustietoja.

Se ei ole vain digitaaliset taiteilijat haastavia tekoälyyrityksiä. New York Times äskettäin haastoi OpenAI:n oikeuteen koska sen ChatGPT-tekstimalli sylkee lähes sanatarkkoja kopioita sanomalehden maksumuurin artikkeleista. Kirjan kirjoittajat ovat tehneet samankaltaisia ​​vaatimuksia ohjelmistokehittäjiä.

Aikaisempi tutkimus on ilmoittanut, että OpenAI:n ChatGPT:tä voidaan houkutella harjoitustekstin toistamiseen. Ne, jotka haastavat Microsoftin ja GitHubin oikeuteen, väittävät, että Copilot-koodausavustajamalli toistaa koodin enemmän tai vähemmän sanatarkasti.

Southen huomautti, että Midjourney veloittaa asiakkaita, jotka luovat loukkaavaa sisältöä ja hyötyvät tilaustuloista. "MJ [Midjourney] käyttäjien ei tarvitse myydä kuvia tekijänoikeusrikkomusten vuoksi, MJ jo hyötyy sen luomisesta", hän opined, joka toistaa IEEE:n raportissa esitetyn väitteen.

OpenAI veloittaa myös liittymismaksun ja saa siten voittoa samalla tavalla. OpenAI ja Midjourney eivät vastanneet kommenttipyyntöihin.

Kuitenkin OpenAI maanantaina julkaisi a blogi New York Timesin oikeusjutun käsittelyssä, jonka tekoälymyyjä sanoi, ettei sillä ollut ansioita. Hämmästyttävää kyllä, laboratorio sanoi, että jos sen hermoverkot tuottivat loukkaavaa sisältöä, se oli "vika".

Kaiken kaikkiaan tämän päivän nousujohteinen väitti, että: Se tekee aktiivisesti yhteistyötä uutisorganisaatioiden kanssa; tekijänoikeudella suojattua tietoa koskeva koulutus täyttää tekijänoikeuslain mukaisen kohtuullisen käytön suojan; "" Regurgitaatio" on harvinainen vika, jonka poistamiseksi pyrimme nollaan. ja New York Timesilla on kirsikkapoimittuja esimerkkejä tekstin toistosta, jotka eivät edusta tyypillistä käyttäytymistä.

Laki ratkaisee

Kalifornian Santa Claran yliopiston lakiosaston professori Tyler Ochoa kertoi Rekisteri että vaikka IEEE-raportin havainnot todennäköisesti auttavat tekijänoikeusvaatimuksissa olevia asianosaisia, niiden ei pitäisi - koska artikkelin kirjoittajat ovat hänen mielestään esittäneet väärin, mitä tapahtuu.

"He kirjoittavat: "Voidaanko kuvia luovia malleja saada tuottamaan plagiointia, joka perustuu tekijänoikeusmateriaaliin? … [Me] havaitsimme, että vastaus on selvästi kyllä, vaikka pyytäisimmekin suoraan plagiointia.”

Ochoa kyseenalaisti tämän johtopäätöksen ja väitti, että raportin tekijöiden antamat kehotteet osoittavat, että he todellakin pyytävät suoraan plagiointia. Jokaisessa kehotteessa mainitaan tietyn elokuvan nimi, määritetään kuvasuhde ja kaikissa paitsi yhtä tapauksessa sanat "elokuva" ja "kuvakaappaus" tai "kuvakuva". (Yksi poikkeus kuvaa kuvaa, jonka he halusivat kopioida. )”

Lakiprofessori sanoi, että tekijänoikeuslain kysymys on sen määritteleminen, kuka on vastuussa näistä plagiointituloksista: tekoälymallin luojat vai ihmiset, jotka pyysivät tekoälymallia toistamaan suosittua kohtausta.

"Generatiivinen AI-malli pystyy tuottamaan alkuperäisen tulosteen, ja se pystyy myös toistamaan kohtauksia, jotka muistuttavat kohtauksia tekijänoikeudella suojatuista tuloista pyydettäessä", selitti Ochoa. "Tätä pitäisi analysoida myötävaikuttaisena loukkauksena: mallin esittänyt henkilö on ensisijainen loukkaaja, ja mallin tekijät ovat vastuussa vain, jos he ovat saaneet tietoonsa ensisijaisesta loukkauksesta eivätkä ryhtyneet kohtuullisiin toimenpiteisiin lopettaakseen se."

Ochoa sanoi, että generatiiviset tekoälymallit toistavat todennäköisemmin tiettyjä kuvia, kun näitä kuvia on useita esiintymiä niiden harjoitustietojoukossa.

"Tässä tapauksessa on erittäin epätodennäköistä, että harjoitustiedot sisälsivät kokonaisia ​​elokuvia; on paljon todennäköisempää, että harjoitustiedot sisälsivät still-kuvia elokuvista, jotka jaettiin elokuvan julkisuuskuviksi", hän sanoi. "Nämä kuvat toistettiin useita kertoja koulutustiedoissa, koska tiedotusvälineitä kannustettiin jakamaan kuvia julkisuustarkoituksiin ja niin tehtiin.

"Olisi pohjimmiltaan epäreilua, jos tekijänoikeuksien omistaja rohkaisisi still-kuvien laajaa levittämistä julkisuustarkoituksiin ja valittaisi sitten, että tekoäly jäljittelee näitä kuvia, koska harjoitustiedot sisälsivät useita kopioita samoista kuvista."

Ochoa sanoi, että on olemassa toimenpiteitä, joilla rajoitetaan tällaista tekoälymallien käyttäytymistä. "Kysymys kuuluu, pitäisikö heidän tehdä niin, kun kehotteeseen kirjoittanut henkilö halusi selvästi saada tekoälyn toistamaan tunnistettavan kuvan, ja alkuperäiset still-kuvat tuottaneet elokuvastudiot halusivat selvästi, että kuvat levitetään laajalle. ," hän sanoi.

"Parempi kysymys olisi: Kuinka usein näin tapahtuu, kun kehote ei mainitse tiettyä elokuvaa tai kuvaa tiettyä hahmoa tai kohtausta? Luulen, että puolueeton tutkija todennäköisesti huomaa, että vastaus on harvoin (ehkä melkein ei koskaan).

Tekijänoikeudella suojattu sisältö näyttää kuitenkin olevan olennainen polttoaine näiden mallien toimivuuden kannalta.

OpenAI puolustaa itseään Lordeille

Vasteena tiedustelu Ison-Britannian House of Lordsin viestintä- ja digitaalikomitea OpenAI esitteli tekoälymallien riskejä ja mahdollisuuksia. jättämisestä [PDF] varoittaa, että sen mallit eivät toimi ilman tekijänoikeudella suojatun sisällön koulutusta.

"Koska tekijänoikeus kattaa nykyään lähes kaikenlaisen ihmisen ilmaisun – mukaan lukien blogiviestit, valokuvat, foorumiviestit, ohjelmistokoodinpätkät ja hallituksen asiakirjat - olisi mahdotonta kouluttaa nykypäivän johtavia tekoälymalleja ilman tekijänoikeudella suojattua materiaalia", superlaboratorio sanoi. .

"Koulutustietojen rajoittaminen julkisiin kirjoihin ja piirustuksiin, jotka on luotu yli sata vuotta sitten, saattaa tuottaa mielenkiintoisen kokeilun, mutta se ei tarjoaisi tekoälyjärjestelmiä, jotka vastaavat nykypäivän kansalaisten tarpeita."

Tekoälybiz sanoi uskovansa noudattavansa tekijänoikeuslakia ja että tekijänoikeudella suojattua materiaalia koskeva koulutus on laillista, vaikka se sallii, että "että on vielä tehtävää tekijöiden tukemiseksi ja voimaannuttamiseksi".

Tätä mielipidettä, joka kuulostaa diplomaattiselta tunnustamiselta eettisille huolenaiheille, jotka koskevat korvausta tekijänoikeudella suojatun teoksen väitetystä oikeudenmukaisesta käytöstä, on tarkasteltava yhdessä IEEE:n raportin väitteen kanssa, jonka mukaan "olemme havainneet todisteita siitä, että vanhempi ohjelmistoinsinööri Midjourneyssa osallistui keskustelu helmikuussa 2022 siitä, kuinka voidaan kiertää tekijänoikeuslakia "pesemällä" tietoja "hienosäädön avulla".

Marcus, IEEE-raportin toinen kirjoittaja, ilmaisi skeptisesti OpenAI:n pyrkimyksen saada Yhdistyneessä kuningaskunnassa vihreä valo sen nykyisille liiketoimintakäytännöille.

"Karkea käännös: Emme rikastu upeasti, jos et anna meidän varastaa, joten älä tee varastamista rikokseksi!" hän kirjoitti sosiaalisessa mediassa posti. "Älä pakota meitä maksamaan lisensointi myös maksuja! Toki Netflix saattaa maksaa miljardeja vuodessa lisenssimaksuja, mutta we ei pitäisi olla! Lisää rahaa meille, moar!"

OpenAI on tarjoutunut korvaamaan yritys ChatGPT- ja API-asiakkaat tekijänoikeusvaatimuksia vastaan, mutta ei, jos asiakas tai asiakkaan loppukäyttäjät " tiesivät tai heidän olisi pitänyt tietää, että tulos loukkaa tai todennäköisesti loukkaa" tai jos asiakas on ohittanut turvaominaisuudet, muiden rajoitusten joukossa. Näin ollen DALL-E 3:n pyytäminen luomaan uudelleen kuuluisa elokuvakohtaus – jonka käyttäjien pitäisi tietää, että se on luultavasti tekijänoikeuden alainen – ei oikeuta hyvitykseen.

Midjourney on omaksunut päinvastaisen lähestymistavan ja luvannut metsästää ja haastaa rikkomukseen osallistuneet asiakkaat oikeuteen saadakseen takaisin niihin liittyvistä vaateista aiheutuneet oikeudenkäyntikulut.

"Jos tietoisesti loukkaat jonkun toisen immateriaalioikeuksia ja se maksaa meille rahaa, tulemme etsimään sinut ja keräämään rahat sinulta", Midjourney's sanoo. Käyttöehdot osavaltio. "Saamme myös tehdä muita asioita, kuten yrittää saada tuomioistuimen maksamaan lakipalkkiomme. Älä tee sitä." ®

Aikaleima:

Lisää aiheesta Rekisteri