CCC svarar på NTIA:s begäran om information om Dual Use Foundation AI-modeller med allmänt tillgängliga modellvikter » CCC-blogg

CCC svarar på NTIA:s begäran om information om Dual Use Foundation AI-modeller med allmänt tillgängliga modellvikter » CCC-blogg

Förra veckan svarade CCC på National Telecommunications and Information Administrations Begäran om information om Dual Use Foundation Artificiell Intelligens-modeller med allmänt tillgängliga modellvikter. CCC:s egen Daniel Lopresti (CCC-ordförande och Lehigh University) och David Danks (CCC:s verkställande kommitté och University of California, San Diego) hjälpte till att skriva detta svar tillsammans med flera andra medlemmar av datorgemenskapen. Markus Buehler (Massachusetts Institute of Technology) och Duncan Watson-Parris (University of California, San Diego), som båda talade vid den CCC-sponsrade AAAS-panelen i år, med titeln, Generativ AI i vetenskap: löften och fallgropar, båda bidrog till RFI-svaret, tillsammans med Casey Fiesler (University of Colorado, Boulder), som deltog i CCC:s Framtidens forskning om social teknik workshop i november.

I sitt svar fokuserade författarna på några specifika frågor från RFI, varav en frågade hur riskerna förknippade med att göra modellvikter allmänt tillgängliga jämför med de som är förknippade med icke-offentliga modellvikter. Författarna svarade att majoriteten av riskerna förknippade med generativa modeller förvärras minimalt genom att göra modellvikter allmänt tillgängliga. De flesta av riskerna relaterade till generativa modeller är inneboende i dessa modeller, på grund av deras förmåga att snabbt generera enorma mängder trovärdigt innehåll baserat på användarinmatningar och deras nästan obegränsade applikationsområden. Att göra modellvikterna allmänt tillgängliga påverkar inte funktionaliteten hos generativa modeller, så för närvarande finns det få bevis för att att göra vikterna allmänt tillgängliga skapar betydande ytterligare risker utöver vad som redan kunde göras med proprietära eller slutna system. En risk som potentiellt skulle kunna förvärras om vikter för proprietära modeller görs allmänt tillgängliga är möjligheten att träningsdata exponeras. Det är osannolikt att modellvikter skulle kunna omvändas för att exponera träningsdata, men det har inte visat sig vara matematiskt omöjligt. Men i vårt svar betonade vi att eftersom generativa modeller sannolikt kommer att fortsätta att användas flitigt av allmänheten, kommer de största riskerna, enligt vår uppfattning, från att inte göra vikter till representativa grundmodeller öppet tillgängliga. Att neka forskare och intresserade samhällsmedlemmar tillgång till vissa modellvikter för proprietära modeller kommer att hindra samhället från att få en bättre förståelse för hur dessa modeller fungerar och hur man utformar mer inkluderande och tillgängliga modeller.

Att fortsätta med att släppa slutna modeller kommer att fortsätta att vidmakthålla bristen på mångfald inom tekniken och kommer att förhindra att vissa typer av forskning utförs, till exempel partiska revisioner av dessa modeller, som stora teknikföretag inte har incitament att genomföra. Utbildning av den framtida arbetskraften är en annan otroligt viktig faktor. USA kan inte hoppas på att behålla ledarskapet inom området generativ AI utan att utbilda den framtida generationen av utvecklare i dessa typer av modeller inom forskarutbildning och forskarutbildning. Det är viktigt att eleverna kan utforska dessa modeller under sin utbildning för att förstå deras grundläggande funktionalitet och för att lära sig hur man kan inkorporera etiska överväganden i utvecklingen av nya modeller. Att endast tillåta stora teknikföretag att ha verktygen för att utbilda nästa generation kan också resultera i tyst tänkande, och dessa organisationer kan förbise en holistisk utbildning som tillgång till dessa modeller kan ge till förmån för ett mer effektivt ramverk för lärande efter behov. I vårt svar lyfte vi också fram vikten av att skapa en öppenhetskultur kring dessa modellers utveckling, och betonade att det kan vara lika viktigt att etablera en sådan kultur som att reglera dessa teknologier. Om det finns en förväntning för teknikföretag att skapa generativa modeller på ett transparent sätt, blir framtida reglering mycket lättare att genomföra.

Slutligen betonade CCC behovet av ytterligare forskning om grundläggande modeller, med hänvisning till allmänhetens nuvarande brist på kunskap om hur dessa modeller faktiskt fungerar och kommer fram till de resultat de producerar. I vårt svar listade vi ett antal obesvarade forskningsfrågor som forskare, forskare, forskare och experter i sociala frågor är redo att börja besvara, förutsatt att de får den öppna tillgång de behöver till de typer av stora grundmodeller som industrin nu utnyttjar . Vår fortsatta framgång som samhälle beror på det.

Läs hela CCC-svaret här.

Tidsstämpel:

Mer från CCC blogg