Bias verminderen en veiligheid verbeteren in DALL·E 2 PlatoBlockchain-gegevensintelligentie. Verticaal zoeken. Ai.

Vooroordelen verminderen en veiligheid verbeteren in DALL·E 2

Vandaag implementeren we een nieuwe techniek zodat DALL·E afbeeldingen van mensen genereert die de diversiteit van de wereldbevolking nauwkeuriger weergeven. Deze techniek wordt toegepast op systeemniveau wanneer DALL·E een prompt krijgt met een beschrijving van een persoon zonder ras of geslacht, zoals 'brandweerman'.

Op basis van onze interne evaluatie hadden gebruikers 12× meer kans om te zeggen dat DALL·E-afbeeldingen mensen met verschillende achtergronden bevatten nadat de techniek was toegepast. We zijn van plan deze techniek in de loop van de tijd te verbeteren naarmate we meer gegevens en feedback verzamelen.


Een foto van een CEO

Genereer

In april zijn we begonnen met een preview van het DALL·E 2-onderzoek voor een beperkt aantal mensen, waardoor we de mogelijkheden en beperkingen van het systeem beter hebben begrepen en onze veiligheidssystemen hebben verbeterd.

Tijdens deze preview-fase hebben vroege gebruikers gevoelige en bevooroordeelde afbeeldingen gemarkeerd die hebben geholpen bij het informeren en evalueren van deze nieuwe beperking.

We blijven onderzoeken hoe AI-systemen, zoals DALL·E, vooroordelen in de trainingsgegevens kunnen weerspiegelen en verschillende manieren waarop we deze kunnen aanpakken.

Tijdens de onderzoekspreview hebben we andere stappen ondernomen om onze veiligheidssystemen te verbeteren, waaronder:

  • Het risico minimaliseren dat DALL·E wordt misbruikt om misleidende inhoud te creëren door het uploaden van afbeeldingen met realistische gezichten te weigeren en pogingen om de gelijkenis van publieke figuren te creëren, waaronder beroemdheden en prominente politieke figuren.
  • Onze inhoudsfilters nauwkeuriger maken, zodat ze effectiever zijn in het blokkeren van prompts en het uploaden van afbeeldingen die in strijd zijn met onze inhoudsbeleid terwijl het nog steeds creatieve expressie mogelijk maakt.
  • Verfijning van geautomatiseerde en menselijke bewakingssystemen om misbruik te voorkomen.

Deze verbeteringen hebben ons geholpen meer vertrouwen te krijgen in de mogelijkheid om meer gebruikers uit te nodigen om DALL·E te ervaren.

Het uitbreiden van de toegang is een belangrijk onderdeel van onze verantwoorde inzet van AI-systemen omdat het ons in staat stelt meer te leren over het gebruik in de echte wereld en onze veiligheidssystemen te blijven herhalen.

Tijdstempel:

Meer van OpenAI