Keelemudelite juurutamise parimad tavad PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Keelemudelite juurutamise parimad tavad

Keelemudelite juurutamise parimad tavad

Cohere, OpenAI ja AI21 Labs on välja töötanud esialgse parimate tavade kogumi, mis on kohaldatav iga organisatsiooni jaoks, mis arendab või juurutab suuri keelemudeleid. Arvutid, mis oskavad lugeda ja kirjutada, on siin ja neil on potentsiaali igapäevaelu põhjalikult mõjutada. Inimese ja masina interaktsiooni tulevik on täis võimalusi ja lubadusi, kuid iga võimas tehnoloogia vajab hoolikat kasutuselevõttu.

Allolev ühisavaldus kujutab endast sammu kogukonna ülesehitamise suunas, et tulla toime tehisintellekti arenguga kaasnevate ülemaailmsete väljakutsetega, ning julgustame teisi organisatsioone, kes soovivad osaleda, ühendust võtma.

Ühine soovitus keelemudeli kasutuselevõtuks

Soovitame mitmeid põhiprintsiipe, mis aitavad suurte keelemudelite (LLM) pakkujatel selle tehnoloogia riske maandada, et saavutada täielik lubadus inimvõimete suurendamiseks.

Kuigi need põhimõtted töötati välja konkreetselt meie kogemuste põhjal LLM-ide pakkumisel API kaudu, loodame, et need on kasulikud olenemata väljalaskestrateegiast (nt avatud lähteallikatest või ettevõttesisesest kasutusest). Eeldame, et need soovitused muutuvad aja jooksul oluliselt, kuna LLM-ide äriline kasutus ja sellega kaasnevad ohutuskaalutlused on uued ja arenevad. Õpime aktiivselt tundma LLM-i piiranguid ja väärkasutuse võimalusi ning käsitleme neid ning aja jooksul aja jooksul koostöös laiema kogukonnaga ajakohastame neid põhimõtteid ja tavasid.

Jagame neid põhimõtteid lootuses, et teised LLM-i pakkujad võivad neist õppida ja neid omaks võtta ning edendada avalikku arutelu LLM-i arendamise ja kasutuselevõtu üle.

Väärkasutamise keelamine


Avaldage kasutusjuhised ja kasutustingimused LLM-e viisil, mis keelab materiaalse kahju tekitamise üksikisikutele, kogukondadele ja ühiskonnale, näiteks rämpsposti, pettuse või astroturfi kaudu. Kasutusjuhised peaksid samuti täpsustama valdkonnad, kus LLM-i kasutamine nõuab täiendavat kontrolli, ja keelama kõrge riskiga kasutusjuhud, mis ei ole sobivad, näiteks inimeste klassifitseerimine kaitstud omaduste alusel.


Kasutusjuhiste jõustamiseks looge süsteemid ja infrastruktuur. See võib hõlmata kiiruse piiranguid, sisu filtreerimist, rakenduse heakskiitmist enne tootmisjuurdepääsu, anomaalse tegevuse jälgimist ja muid leevendusi.

Leevendage tahtmatut kahju


Leevendage ennetavalt mudeli kahjulikku käitumist. Parimad tavad hõlmavad kõikehõlmavat mudeli hindamist piirangute õigeks hindamiseks, koolituskorpuste võimalike eelarvamuste allikate minimeerimist ja tehnikaid ohtliku käitumise minimeerimiseks, näiteks inimeste tagasisidest õppimise kaudu.


Dokumenteerige teadaolevad nõrkused ja haavatavused, nagu kallutatus või võime luua ebaturvalist koodi, kuna mõnel juhul ei saa ükski ennetav tegevus täielikult kõrvaldada soovimatu kahju tekkimise võimalust. Dokumentatsioon peaks sisaldama ka mudeli- ja kasutusjuhtumipõhiseid parimaid ohutustavasid.

Tehke läbimõeldult koostööd sidusrühmadega


Looge erineva taustaga meeskondi ja küsige laiapõhjalist sisendit. Vaja on erinevaid vaatenurki, et iseloomustada ja käsitleda keelemudelite toimimist reaalse maailma mitmekesisuses, kus kui neid ei kontrollita, võivad need tugevdada eelarvamusi või mõne rühma puhul ebaõnnestuda.


Avaldage avalikult LLM-i ohutuse ja väärkasutusega seotud õppetunde et võimaldada parimate tavade laialdast kasutuselevõttu ja aidata kaasa tööstusharudevahelisele iteratsioonile.


Kohtle austusega kogu tööjõudu keelemudeli tarneahelas. Näiteks peaksid teenusepakkujatel olema kõrged standardid nende töötingimuste suhtes, kes vaatavad mudeli väljundid ettevõttesiseselt läbi, ja müüjad peavad järgima täpselt määratletud standardeid (nt tagama, et märgistajad saaksid teatud ülesandest loobuda).

LLM-i pakkujatena on nende põhimõtete avaldamine esimene samm turvalisema suurte keelemudelite arendamise ja juurutamise ühisel suunamisel. Meil on hea meel jätkata koostööd omavahel ja teiste osapooltega, et leida teisi võimalusi keelemudelite tahtmatute kahjude vähendamiseks ja pahatahtliku kasutamise vältimiseks.

Laadi alla PDF

Toetus teistelt organisatsioonidelt

„Kuigi LLM-idel on palju lubadusi, on neil olulisi ohutusprobleeme, millega tuleb edasi töötada. Need parimad tavad on oluline samm nende mudelite kahjude minimeerimisel ja nende võimaliku kasu maksimeerimisel.

— Antroopne

"Kuna suured keelemudelid (LLM) on muutunud üha võimsamaks ja väljendusrikkamaks, muutub riskide maandamine üha olulisemaks. Tervitame neid ja muid jõupingutusi, et püüda ennetavalt kahjusid leevendada ja tuua kasutajatele esile valdkonnad, mis nõuavad erilist hoolsust. Siin välja toodud põhimõtted annavad olulise panuse ülemaailmsesse vestlusesse.

-John Bansemer, CyberAI projekti direktor ja turbe- ja areneva tehnoloogia keskuse (CSET) vanemteadur

„Google kinnitab kõikehõlmavate strateegiate tähtsust mudeli- ja koolitusandmete analüüsimisel, et leevendada kahju, eelarvamuste ja valeandmete esitamise riske. See on nende tehisintellekti pakkujate läbimõeldud samm, et edendada tehisintellekti ohutuse põhimõtteid ja dokumentatsiooni.

- Google Cloud Platform (GCP)

"Sihtasutuse mudelite, näiteks suurte keelemudelite ohutus on kasvav sotsiaalne mure. Tunnustame Cohere'i, OpenAI-d ja AI21 Labsi esimese sammu eest vastutustundliku arendamise ja kasutuselevõtu kõrgetasemeliste põhimõtete väljatoomiseks mudeliarendajate vaatenurgast. Tööd on veel palju teha ja me usume, et üksikasjalikumate põhimõtete ja kogukonna normide väljatöötamiseks on oluline kaasata rohkem hääli akadeemilistest ringkondadest, tööstusest ja kodanikuühiskonnast. Nagu me oma hiljutises väljaandes märgime blogi postitus, ei ole oluline ainult lõpptulemus, vaid protsessi legitiimsus.

-Percy Liang, Stanfordi sihtasutuste mudelite uurimiskeskuse (CRFM) direktor

Osale

Kui töötate välja keelemudeleid või töötate nende riskide maandamise nimel, räägime teiega hea meelega. Võtke ühendust aadressil bestpractices@openai.com.

Ajatempel:

Veel alates OpenAI