Reducing Bias And Improving Safety In DALL·E 2

Újra kiadta Platón

Követő: 0

Ma új technikát vezetünk be, hogy a DALL·E olyan képeket hozzon létre az emberekről, amelyek pontosabban tükrözik a világ népességének sokszínűségét. Ezt a technikát rendszerszinten alkalmazzák, amikor a DALL·E olyan felszólítást kap, amely olyan személyt ír le, amely nem adja meg a fajt vagy a nemet, például „tűzoltó”.

Belső értékelésünk alapján a felhasználók 12-szer nagyobb valószínűséggel mondták azt, hogy a DALL·E képeken különböző hátterű emberek szerepelnek a technika alkalmazása után. Terveink szerint idővel továbbfejlesztjük ezt a technikát, ahogy egyre több adatot és visszajelzést gyűjtünk.

Egy vezérigazgató fényképe

Generálása

Enyhítés előtt

Enyhítés után

Áprilisban megkezdtük a DALL·E 2 kutatás előzetes megtekintését korlátozott számú ember számára, ami lehetővé tette számunkra, hogy jobban megértsük a rendszer képességeit és korlátait, valamint javítsuk biztonsági rendszereinket.

Ebben az előnézeti szakaszban a korai felhasználók érzékeny és elfogult képeket jelöltek meg, amelyek segítettek tájékozódni és értékelni ezt az új mérséklést.

Továbbra is kutatjuk, hogy az AI-rendszerek, mint például a DALL·E, hogyan tükrözhetik a képzési adatok torzításait, és hogyan kezelhetjük ezeket.

A kutatás előzetese során további lépéseket tettünk biztonsági rendszereink fejlesztése érdekében, többek között:

Minimálisra csökkenti annak kockázatát, hogy a DALL·E-t megtévesztő tartalom létrehozására használják fel azáltal, hogy elutasítja a valósághű arcokat tartalmazó képfeltöltéseket, valamint a közszereplők, köztük hírességek és prominens politikai személyiségek hasonlatosságára tett kísérleteket.
Tartalomszűrőink pontosabbá tétele annak érdekében, hogy hatékonyabban blokkolják az olyan felszólításokat és képfeltöltéseket, amelyek sértik tartalompolitika miközben továbbra is lehetővé teszi a kreatív kifejezést.
Automatizált és emberi felügyeleti rendszerek finomítása a visszaélések elkerülése érdekében.

Ezek a fejlesztések segítettek abban, hogy bizalmat ébresszünk abban, hogy több felhasználót hívhatunk meg a DALL·E kipróbálására.

A hozzáférés bővítése fontos része a mi tevékenységünknek az AI-rendszerek felelősségteljes telepítése mert lehetővé teszi számunkra, hogy többet tudjunk meg a valós használatról, és folytassuk a biztonsági rendszereink ismétlődését.

Időbélyeg: Július 18, 2022Július 18, 2022

Időbélyeg: 13. december 2023.

A torzítás csökkentése és a biztonság javítása a DALL·E 2-ben

Újra kiadta Platón

Még több OpenAI

Gyakorlatok az ügynöki mesterséges intelligencia rendszerek irányításához

Bemutatkozik az OpenAI London

A modellek tanítása bizonytalanságuk szavakkal való kifejezésére

Az OpenAI új tagokat jelent be az igazgatóságba

Matematikai érvelés fejlesztése folyamatfelügyelettel

Határmenti mesterséges intelligencia szabályozás: A közbiztonságot fenyegető új kockázatok kezelése

GPT-4V(ision) rendszerkártya

Bemutatkozik a ChatGPT csapata

Partnerség az Axel Springerrel az AI újságírásban való hasznos felhasználásának elmélyítése érdekében

Rólunk

Vertical Search & Ai

Emelvény

Maradjon kapcsolatban

Fiók