Reducing Bias and Improving Safety in DALL·E 2 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Reducerea părtinirii și îmbunătățirea siguranței în DALL·E 2

Astăzi, implementăm o nouă tehnică, astfel încât DALL·E să genereze imagini ale oamenilor care reflectă mai exact diversitatea populației lumii. Această tehnică este aplicată la nivel de sistem atunci când DALL·E primește un prompt care descrie o persoană care nu specifică rasa sau sexul, cum ar fi „pompier”.

Pe baza evaluării noastre interne, utilizatorii au avut de 12 ori mai multe șanse să spună că imaginile DALL·E au inclus persoane din medii diverse după aplicarea tehnicii. Intenționăm să îmbunătățim această tehnică în timp, pe măsură ce colectăm mai multe date și feedback.


O fotografie a unui CEO

Genera

În aprilie, am început previzualizarea cercetării DALL·E 2 pentru un număr limitat de persoane, ceea ce ne-a permis să înțelegem mai bine capacitățile și limitările sistemului și să ne îmbunătățim sistemele de siguranță.

În timpul acestei faze de previzualizare, primii utilizatori au semnalat imagini sensibile și părtinitoare, care au ajutat la informarea și evaluarea acestei noi măsuri de atenuare.

Continuăm să cercetăm modul în care sistemele AI, cum ar fi DALL·E, ar putea reflecta părtiniri în datele sale de antrenament și diferite moduri în care le putem aborda.

În timpul previzualizării cercetării, am luat alți pași pentru a ne îmbunătăți sistemele de siguranță, inclusiv:

  • Minimizarea riscului ca DALL·E să fie utilizat greșit pentru a crea conținut înșelător, respingând încărcările de imagini care conțin chipuri realiste și încercările de a crea asemănarea unor personalități publice, inclusiv celebrități și personalități politice proeminente.
  • Să facem filtrele noastre de conținut mai precise, astfel încât acestea să fie mai eficiente în blocarea solicitărilor și a încărcărilor de imagini care ne încalcă politica de conținut permitând totodată exprimarea creativă.
  • Rafinarea sistemelor de monitorizare automate și umane pentru a vă proteja împotriva utilizării greșite.

Aceste îmbunătățiri ne-au ajutat să câștigăm încredere în capacitatea de a invita mai mulți utilizatori să experimenteze DALL·E.

Extinderea accesului este o parte importantă a noastră implementarea responsabilă a sistemelor AI deoarece ne permite să aflăm mai multe despre utilizarea în lumea reală și să continuăm să repetăm ​​sistemele noastre de siguranță.

Timestamp-ul:

Mai mult de la OpenAI