Reduktion af bias og forbedring af sikkerheden i DALL·E 2 PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Reduktion af skævhed og forbedring af sikkerheden i DALL·E 2

I dag implementerer vi en ny teknik, så DALL·E genererer billeder af mennesker, der mere præcist afspejler mangfoldigheden af ​​verdens befolkning. Denne teknik anvendes på systemniveau, når DALL·E får en prompt, der beskriver en person, der ikke specificerer race eller køn, såsom "brandmand".

Baseret på vores interne evaluering var brugerne 12 gange mere tilbøjelige til at sige, at DALL·E-billeder omfattede mennesker med forskellig baggrund, efter at teknikken blev anvendt. Vi planlægger at forbedre denne teknik over tid, efterhånden som vi indsamler flere data og feedback.


Et billede af en administrerende direktør

Generer

I april begyndte vi at forhåndsvise DALL·E 2-forskningen for et begrænset antal mennesker, hvilket har givet os mulighed for bedre at forstå systemets muligheder og begrænsninger og forbedre vores sikkerhedssystemer.

Under denne forhåndsvisningsfase har tidlige brugere markeret følsomme og skæve billeder, som har hjulpet med at informere og evaluere denne nye afbødning.

Vi fortsætter med at undersøge, hvordan AI-systemer, ligesom DALL·E, kan afspejle skævheder i dets træningsdata og forskellige måder, vi kan håndtere dem på.

Under undersøgelsen har vi taget andre skridt for at forbedre vores sikkerhedssystemer, herunder:

  • Minimering af risikoen for, at DALL·E bliver misbrugt til at skabe vildledende indhold ved at afvise billeduploads, der indeholder realistiske ansigter, og forsøg på at skabe lighed med offentlige personer, herunder berømtheder og fremtrædende politiske personer.
  • Gør vores indholdsfiltre mere nøjagtige, så de er mere effektive til at blokere prompter og billedupload, der overtræder vores indholdspolitik samtidig med at det tillader kreativt udtryk.
  • Forfining af automatiserede og menneskelige overvågningssystemer for at beskytte mod misbrug.

Disse forbedringer har hjulpet os med at få tillid til evnen til at invitere flere brugere til at opleve DALL·E.

Udvidelse af adgangen er en vigtig del af vores implementere AI-systemer ansvarligt fordi det giver os mulighed for at lære mere om brug i den virkelige verden og fortsætte med at gentage vores sikkerhedssystemer.

Tidsstempel:

Mere fra OpenAI