DALL·E 2 eelarvamuste vähendamine ja ohutuse parandamine

Taasavaldanud Platon

järgijaid: 0

Täna rakendame uut tehnikat, et DALL·E genereerib inimestest pilte, mis kajastavad täpsemalt maailma rahvastiku mitmekesisust. Seda tehnikat rakendatakse süsteemi tasemel, kui DALL·E-le antakse viip, mis kirjeldab isikut, kes ei täpsusta rassi ega sugu, näiteks "tuletõrjuja".

Meie sisehindamise põhjal väitsid kasutajad 12 korda tõenäolisemalt, et DALL·E piltidel oli pärast tehnika rakendamist erineva taustaga inimesi. Plaanime seda tehnikat aja jooksul täiustada, kuna kogume rohkem andmeid ja tagasisidet.

Pilt tegevjuhist

Tekitama

Enne leevendamist

Pärast leevendamist

Aprillis alustasime DALL·E 2 uuringu eelvaatega piiratud arvule inimestele, mis on võimaldanud meil paremini mõista süsteemi võimalusi ja piiranguid ning täiustada oma turvasüsteeme.

Selles eelvaatefaasis on varasemad kasutajad märgistanud tundlikke ja kallutatud pilte, mis on aidanud seda uut leevendusviisi teavitada ja hinnata.

Jätkame uurimist, kuidas tehisintellektisüsteemid, nagu DALL·E, võivad kajastada oma koolitusandmete eelarvamusi ja erinevaid viise, kuidas neid lahendada.

Uuringu eelvaate ajal oleme astunud teisi samme oma ohutussüsteemide täiustamiseks, sealhulgas:

DALL·E-d petliku sisu loomiseks väärkasutamise riski minimeerimine, lükates tagasi realistlikke nägusid sisaldavate piltide üleslaadimise ja katse luua avaliku elu tegelaste, sealhulgas kuulsuste ja prominentsete poliitiliste tegelaste sarnasust.
Muutame meie sisufiltrid täpsemaks, et need blokeeriksid tõhusamalt viipasid ja piltide üleslaadimist, mis rikuvad meie sisupoliitika võimaldades samas loomingulist väljendust.
Automatiseeritud ja inimeste seiresüsteemide täiustamine, et kaitsta end väärkasutuse eest.

Need täiustused on aidanud meil saavutada kindlustunnet, et saame kutsuda rohkem kasutajaid DALL·E-ga kogema.

Juurdepääsu laiendamine on meie tegevuse oluline osa AI-süsteemide vastutustundlik juurutamine sest see võimaldab meil saada rohkem teada tegeliku kasutamise kohta ja jätkata oma ohutussüsteemide kasutamist.

Ajatempel: Juuli 18, 2022Juuli 18, 2022

Ajatempel: Detsember 13, 2023

DALL·E 2 kallutatuse vähendamine ja ohutuse parandamine

Taasavaldanud Platon

Veel alates OpenAI

Agentsete tehisintellektisüsteemide juhtimise tavad

Tutvustame OpenAI Londonit

Mudelite õpetamine väljendama oma ebakindlust sõnadega

OpenAI kuulutab välja uued juhatuse liikmed

Matemaatilise arutluse parandamine protsesside juhendamisega

Piiriülene tehisintellekti reguleerimine: avaliku julgeoleku tekkivate riskide juhtimine

GPT-4V(ision) süsteemikaart

Tutvustame ChatGPT meeskonda

Partnerlus Axel Springeriga, et süvendada AI kasulikku kasutamist ajakirjanduses

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto