Reduktion af skævhed og forbedring af sikkerheden i DALL·E 2

Genudgivet af Platon

Abonnenter: 0

I dag implementerer vi en ny teknik, så DALL·E genererer billeder af mennesker, der mere præcist afspejler mangfoldigheden af verdens befolkning. Denne teknik anvendes på systemniveau, når DALL·E får en prompt, der beskriver en person, der ikke specificerer race eller køn, såsom "brandmand".

Baseret på vores interne evaluering var brugerne 12 gange mere tilbøjelige til at sige, at DALL·E-billeder omfattede mennesker med forskellig baggrund, efter at teknikken blev anvendt. Vi planlægger at forbedre denne teknik over tid, efterhånden som vi indsamler flere data og feedback.

Et billede af en administrerende direktør

Generer

Før afhjælpning

Efter afhjælpning

I april begyndte vi at forhåndsvise DALL·E 2-forskningen for et begrænset antal mennesker, hvilket har givet os mulighed for bedre at forstå systemets muligheder og begrænsninger og forbedre vores sikkerhedssystemer.

Under denne forhåndsvisningsfase har tidlige brugere markeret følsomme og skæve billeder, som har hjulpet med at informere og evaluere denne nye afbødning.

Vi fortsætter med at undersøge, hvordan AI-systemer, ligesom DALL·E, kan afspejle skævheder i dets træningsdata og forskellige måder, vi kan håndtere dem på.

Under undersøgelsen har vi taget andre skridt for at forbedre vores sikkerhedssystemer, herunder:

Minimering af risikoen for, at DALL·E bliver misbrugt til at skabe vildledende indhold ved at afvise billeduploads, der indeholder realistiske ansigter, og forsøg på at skabe lighed med offentlige personer, herunder berømtheder og fremtrædende politiske personer.
Gør vores indholdsfiltre mere nøjagtige, så de er mere effektive til at blokere prompter og billedupload, der overtræder vores indholdspolitik samtidig med at det tillader kreativt udtryk.
Forfining af automatiserede og menneskelige overvågningssystemer for at beskytte mod misbrug.

Disse forbedringer har hjulpet os med at få tillid til evnen til at invitere flere brugere til at opleve DALL·E.

Udvidelse af adgangen er en vigtig del af vores implementere AI-systemer ansvarligt fordi det giver os mulighed for at lære mere om brug i den virkelige verden og fortsætte med at gentage vores sikkerhedssystemer.

Tidsstempel: Juli 18, 2022Juli 18, 2022

Tidsstempel: December 13, 2023

Reduktion af skævhed og forbedring af sikkerheden i DALL·E 2

Genudgivet af Platon

Mere fra OpenAI

Praksis for styring af agentiske AI-systemer

Introduktion til OpenAI London

At lære modeller at udtrykke deres usikkerhed i ord

OpenAI annoncerer nye medlemmer til bestyrelsen

Forbedring af matematisk ræsonnement med procestilsyn

Frontier AI-regulering: Håndtering af nye risici for den offentlige sikkerhed

GPT-4V(ision) systemkort

Vi introducerer ChatGPT Team

Partnerskab med Axel Springer for at uddybe gavnlig brug af kunstig intelligens i journalistik

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto