A torzítás csökkentése és a biztonság javítása a DALL·E 2 PlatoBlockchain adatintelligenciában. Függőleges keresés. Ai.

A torzítás csökkentése és a biztonság javítása a DALL·E 2-ben

Ma új technikát vezetünk be, hogy a DALL·E olyan képeket hozzon létre az emberekről, amelyek pontosabban tükrözik a világ népességének sokszínűségét. Ezt a technikát rendszerszinten alkalmazzák, amikor a DALL·E olyan felszólítást kap, amely olyan személyt ír le, amely nem adja meg a fajt vagy a nemet, például „tűzoltó”.

Belső értékelésünk alapján a felhasználók 12-szer nagyobb valószínűséggel mondták azt, hogy a DALL·E képeken különböző hátterű emberek szerepelnek a technika alkalmazása után. Terveink szerint idővel továbbfejlesztjük ezt a technikát, ahogy egyre több adatot és visszajelzést gyűjtünk.


Egy vezérigazgató fényképe

Generálása

Áprilisban megkezdtük a DALL·E 2 kutatás előzetes megtekintését korlátozott számú ember számára, ami lehetővé tette számunkra, hogy jobban megértsük a rendszer képességeit és korlátait, valamint javítsuk biztonsági rendszereinket.

Ebben az előnézeti szakaszban a korai felhasználók érzékeny és elfogult képeket jelöltek meg, amelyek segítettek tájékozódni és értékelni ezt az új mérséklést.

Továbbra is kutatjuk, hogy az AI-rendszerek, mint például a DALL·E, hogyan tükrözhetik a képzési adatok torzításait, és hogyan kezelhetjük ezeket.

A kutatás előzetese során további lépéseket tettünk biztonsági rendszereink fejlesztése érdekében, többek között:

  • Minimálisra csökkenti annak kockázatát, hogy a DALL·E-t megtévesztő tartalom létrehozására használják fel azáltal, hogy elutasítja a valósághű arcokat tartalmazó képfeltöltéseket, valamint a közszereplők, köztük hírességek és prominens politikai személyiségek hasonlatosságára tett kísérleteket.
  • Tartalomszűrőink pontosabbá tétele annak érdekében, hogy hatékonyabban blokkolják az olyan felszólításokat és képfeltöltéseket, amelyek sértik tartalompolitika miközben továbbra is lehetővé teszi a kreatív kifejezést.
  • Automatizált és emberi felügyeleti rendszerek finomítása a visszaélések elkerülése érdekében.

Ezek a fejlesztések segítettek abban, hogy bizalmat ébresszünk abban, hogy több felhasználót hívhatunk meg a DALL·E kipróbálására.

A hozzáférés bővítése fontos része a mi tevékenységünknek az AI-rendszerek felelősségteljes telepítése mert lehetővé teszi számunkra, hogy többet tudjunk meg a valós használatról, és folytassuk a biztonsági rendszereink ismétlődését.

Időbélyeg:

Még több OpenAI