CCC vastaa NTIA:n tietopyyntöön Dual Use Foundation AI -malleista laajalti saatavilla olevilla mallipainoilla » CCC-blogi

CCC vastaa NTIA:n tietopyyntöön Dual Use Foundation AI -malleista laajalti saatavilla olevilla mallipainoilla » CCC-blogi

CCC vastasi viime viikolla Tele- ja tietohallinnon kysymyksiin Tietopyyntö kaksikäyttösäätiön tekoälymalleista, joissa on laajalti saatavilla olevia mallipainoja. CCC:n oma Daniel Lopresti (CCC:n puheenjohtaja ja Lehigh University) ja David Danks (CCC:n toimeenpaneva komitea ja Kalifornian yliopisto, San Diego) auttoivat tämän vastauksen kirjoittamisessa yhdessä useiden muiden tietojenkäsittelyyhteisön jäsenten kanssa. Markus Buehler (Massachusetts Institute of Technology) ja Duncan Watson-Parris (University of California, San Diego), jotka molemmat puhuivat CCC:n sponsoroimassa AAAS-paneelissa tänä vuonna, otsikolla Generatiivinen tekoäly tieteessä: lupaukset ja sudenkuopat, molemmat osallistuivat RFI-vastaukseen sekä Casey Fiesler (University of Colorado, Boulder), joka osallistui CCC:n Sosiaalisen teknologian tutkimuksen tulevaisuus työpaja marraskuussa.

Vastauksessaan kirjoittajat keskittyivät muutamiin RFI:n erityiskysymyksiin, joista yksi kysyi, kuinka mallipainojen laajalle saataville asettamiseen liittyvät riskit verrattuna ei-julkisiin mallipainoihin liittyviin riskeihin. Kirjoittajat vastasivat, että suurin osa generatiivisiin malleihin liittyvistä riskeistä lisääntyy minimaalisesti, kun mallipainot ovat laajalti saatavilla. Suurin osa generatiivisiin malleihin liittyvistä riskeistä liittyy näihin malleihin, koska niiden kyky tuottaa nopeasti valtavia määriä uskottavaa sisältöä käyttäjien syötteiden perusteella ja niiden lähes rajattomat sovellusalueet. Mallipainojen julkistaminen ei vaikuta generatiivisten mallien toimivuuteen, joten tällä hetkellä on vain vähän näyttöä siitä, että painojen saattaminen laajalti saataville loisi merkittävää lisäriskiä sen lisäksi, mitä voitaisiin jo tehdä patentoiduilla tai suljetuilla järjestelmillä. Yksi riski, joka saattaa pahentua, jos patentoitujen mallien painot asetetaan laajalti saataville, on harjoitustietojen paljastumisen mahdollisuus. On epätodennäköistä, että mallin painoja voitaisiin käännellä harjoitustietojen paljastamiseksi, mutta sen ei ole osoitettu olevan matemaattisesti mahdotonta. Korostimme kuitenkin vastauksessamme, että koska generatiiviset mallit tulevat todennäköisesti jatkossakin olemaan suuren yleisön käytössä, suurimmat riskit ovat mielestämme siinä, että edustavia perustamalleja ei saada avoimesti saataville. Jos tutkijoilta ja kiinnostuneilta yhteisön jäseniltä evätään pääsy joihinkin mallipainoihin omistusmalleissa, yhteiskunta ei saa parempaa ymmärrystä siitä, miten nämä mallit toimivat ja kuinka suunnitella kattavampia ja helppokäyttöisempiä malleja.

Suljettujen mallien julkaisemisen jatkaminen jatkaa tekniikan monimuotoisuuden puutetta ja estää tietyntyyppisten tutkimusten tekemisen, kuten näiden mallien puolueellisuusauditointeja, joita suuria teknologiayrityksiä ei kannusteta tekemään. Tulevaisuuden työvoiman koulutus on toinen uskomattoman tärkeä näkökohta. Yhdysvallat ei voi toivoa ylläpitävänsä johtajuutta generatiivisen tekoälyn alalla ilman, että tulevan sukupolven kehittäjät koulutetaan tämäntyyppisiin malleihin jatko- ja jatkokoulutuksessa. On tärkeää, että opiskelijat pääsevät tutustumaan näihin malleihin koulutuksen aikana ymmärtääkseen niiden perustoiminnallisuuden ja oppiakseen ottamaan huomioon eettiset näkökohdat uusien mallien kehittämisessä. Se, että vain suurilla teknologiayrityksillä saa olla työkalut seuraavan sukupolven kouluttamiseen, voi myös johtaa ajattelun hiljentymiseen, ja nämä organisaatiot voivat jättää huomioimatta kokonaisvaltaisen koulutuksen, jonka näiden mallien käyttö voi tarjota tehokkaamman oppimisen tarpeen mukaan -kehyksen hyväksi. Vastauksessamme korostimme myös näiden mallien kehitystä ympäröivän avoimuuden kulttuurin luomisen tärkeyttä ja korostimme, että tällaisen kulttuurin luominen voi olla yhtä tärkeää kuin näiden teknologioiden säätely. Jos teknologiayritysten odotetaan luovan generatiivisia malleja läpinäkyvästi, tulevasta sääntelystä tulee paljon helpompi toteuttaa.

Lopuksi CCC korosti perusmallien lisätutkimuksen tarvetta vedoten siihen, että yleisöllä ei ole tällä hetkellä tietoa siitä, kuinka nämä mallit todella toimivat ja miten ne saavuttavat niiden tuottamia tuloksia. Vastauksessamme listasimme useita vastaamattomia tutkimuskysymyksiä, joihin tutkijat, tiedemiehet, tutkijat ja yhteiskunnallisten kysymysten asiantuntijat ovat valmiita vastaamaan, mikäli he saavat tarvitsemansa avoimen pääsyn sellaisiin suuriin perusmalleihin, joita teollisuus nyt hyödyntää. . Siitä riippuu jatkuva menestys yhteiskuntana.

Lue koko CCC:n vastaus täältä.

Aikaleima:

Lisää aiheesta CCC blogi