Teknologiajättiläiset antavat kysymyksiä LLM:n tekijänoikeussäännöistä

Teknologiajättiläiset antavat kysymyksiä LLM:n tekijänoikeussäännöistä

Tekniset jättiläiset pohtivat kysymyksiä LLM:n tekijänoikeussäännöistä PlatoBlockchain Data Intelligencesta. Pystysuuntainen haku. Ai.

Ison-Britannian parlamentissa tällä viikolla Microsoft ja Meta hylkäsivät kysymyksen siitä, pitäisikö tekijöille maksaa, kun heidän tekijänoikeudella suojattua materiaaliaan käytetään suurten kielimallien kouluttamiseen.

Tekniset titaanit, joiden yhteenlaskettu liikevaihto ylitti 200 miljardia dollaria, olivat olleet grillattu House of Lordsin viestintä- ja digitaalikomitea, kun tekijänoikeuskysymys nousi esiin.

Syyskuussa Authors' Guild, kirjailijoiden ammattiyhdistys ja 17 kirjailijaa jätti ryhmäkanteen Yhdysvalloissa yli OpenAI:n materiaalin käytön LLM-pohjaisten palveluidensa luomiseen.

OpenAI:n toimitusjohtaja Sam Altman on sittemmin sanonut, että yritys kattaisi asiakkaidensa oikeudenkäyntikulut tekijänoikeusrikkomuskanteista sen sijaan, että poistaisi materiaalia koulutussarjoistaan.

Microsoft on investoineet 13 miljardia dollaria OpenAI:ssa. Sillä on laajennettu kumppanuus koneoppimiskehittäjän kanssa, joka käyttää työkuormiaan Azure-pilvialustaan ​​ja käyttää sen malleja automaattisen Copilot-avustajan suorittamiseen.

Microsoftin Office of Responsible AI:n yleisen politiikan johtaja Owen Larter sanoi Lordeille eilen: "On tärkeää ymmärtää, mitä suuri kielimalli on. Se on suuri malli, joka on koulutettu tekstidataan ja oppii assosiaatioita eri ideoiden välillä. Se ei välttämättä ime mitään alhaalta."

Hän sanoi, että pitäisi olla "kehys" suojatakseen tekijänoikeudella suojattua materiaalia, ja Microsoft ottaisi vastuun kaikista LLM-pohjaisten järjestelmiensä loukkauksista. Mutta hän sanoi myös Microsoft tukee viime Valance raportti Yhdistyneen kuningaskunnan "innovaatiota edistävään" tekoälylakiin, joka puoltaa teksti- ja datapoikkeuksia koulutusmalleissa.

Mutta Donald Michael, Lord Foster of Bathin, painotti Larteria, hyväksyisikö hän sen, että jos yritys käyttää tekijänoikeudella suojattua materiaalia LLM:n rakentamiseen voittoa tavoitellen, tekijänoikeuksien omistajalle pitäisi saada korvaus.

Microsoftin johtaja sanoi: "On todella tärkeää ymmärtää, että sinun on koulutettava nämä suuret kielimallit suurille tietojoukoille, jos aiot saada ne toimimaan tehokkaasti, jos aiot antaa niiden olla turvallisia... On myös kilpailuongelmia [varmistaessa], että suurten mallien koulutus on kaikkien saatavilla. Jos mennään liian pitkälle polulle, jossa on erittäin vaikeaa saada tietoja mallien kouluttamiseksi, niin yhtäkkiä mahdollisuus tehdä niin on vain erittäin suurten yritysten varassa.

Oikeudenkäynti on jo käynnissä selvittääksesi, miten harjoitustietojoukot muodostuvat Kirjat 1, Books2 ja Books3, jotka piristävät tehokkaasti tekijänoikeudella suojattua materiaalia, on käytetty suosittujen LLM-yritysten rakentamiseen.

Meta on takana Llama 2 LLM, joka skaalaa jopa 70 miljardiin parametriin. Sosiaalisen median jättiläinen on mainostanut mallia avoimena lähdekoodina, vaikka FOSS-puristit huomauttavatkin sen lähestymistavan varoituksista.

Rob Sherman, Metan varapresidentti ja apulaistietosuojapäällikkö, sanoi Lordsille, että yhtiö noudattaa lakia.

Mutta hän lisäsi, että "Internetin tiedon ja tiedon laajan saatavuuden ylläpitäminen, mukaan lukien tämän kaltaisessa innovaatiossa käytettäväksi, on melko tärkeää. Kannatan sitä, että oikeudenhaltijoille annetaan mahdollisuus hallita, miten heidän tietojaan käytetään.

"Suhtaudun hieman varovaisesti ajatukseen, että tekoälyä rakentavat yritykset pakotetaan tekemään räätälöityjä sopimuksia yksittäisten oikeudenhaltijoiden kanssa tai määrätä maksamaan sisällöstä, jolla ei ole heille taloudellista arvoa."

Viime viikolla Dan Conway, Ison-Britannian julkaisijoiden liiton toimitusjohtaja, kertoi komitealle, että suuret kielimallit loukkasivat tekijänoikeudella suojattua sisältöä "täysin massiivisessa mittakaavassa".

"Tiedämme tämän kustannusalalla Books3-tietokannan ansiosta, joka sisältää 120,000 XNUMX piraattikirjan nimikettä, joiden tiedämme joutuneen suuriin kielimalliin", hän sanoi. ”Tiedämme, että sisältöä nielevät valtavassa mittakaavassa suuret kielimallit. LLM:t loukkaavat tekijänoikeuksia prosessin useissa osissa sen suhteen, milloin he keräävät nämä tiedot, kuinka he säilyttävät nämä tiedot ja miten he käsittelevät niitä. Tekijänoikeuslakia rikotaan massiivisessa mittakaavassa."

Samassa kuulemisessa tohtori Hayleigh Bosher, Lontoon Brunel Universityn immateriaalioikeuden lukija, sanoi, ettei hän edustanut teknologiayrityksiä tai sisällöntuottajia ja tarjosi neutraalin näkökulman.

"Periaate, milloin tarvitset lisenssin ja milloin ei, on selvä", hän sanoi, "ja tekijänoikeudella suojatun teoksen kopioiminen ilman lupaa vaatisi lisenssin tai olisi muuten loukkausta. Sitä tekoäly tekee prosessin eri vaiheissa: sisäänotto, ohjelman suorittaminen ja mahdollisesti jopa tulos.

"Jotkut tekoäly- ja teknologiakehittäjät väittävät erilaisen lain tulkinnan. En edusta kumpaakaan puolta. Olen tekijänoikeusasiantuntija, ja asemani perusteella, kun ymmärrät, mitä tekijänoikeudella on tarkoitus saavuttaa ja miten se saavutetaan, tarvitset lisenssin tähän toimintaan. ®

Aikaleima:

Lisää aiheesta Rekisteri