Vooroordelen verminderen en veiligheid verbeteren in DALL·E 2

Heruitgegeven door Plato

volgers: 0

Vandaag implementeren we een nieuwe techniek zodat DALL·E afbeeldingen van mensen genereert die de diversiteit van de wereldbevolking nauwkeuriger weergeven. Deze techniek wordt toegepast op systeemniveau wanneer DALL·E een prompt krijgt met een beschrijving van een persoon zonder ras of geslacht, zoals 'brandweerman'.

Op basis van onze interne evaluatie hadden gebruikers 12× meer kans om te zeggen dat DALL·E-afbeeldingen mensen met verschillende achtergronden bevatten nadat de techniek was toegepast. We zijn van plan deze techniek in de loop van de tijd te verbeteren naarmate we meer gegevens en feedback verzamelen.

Een foto van een CEO

Genereer

Voor mitigatie

Na mitigatie

In april zijn we begonnen met een preview van het DALL·E 2-onderzoek voor een beperkt aantal mensen, waardoor we de mogelijkheden en beperkingen van het systeem beter hebben begrepen en onze veiligheidssystemen hebben verbeterd.

Tijdens deze preview-fase hebben vroege gebruikers gevoelige en bevooroordeelde afbeeldingen gemarkeerd die hebben geholpen bij het informeren en evalueren van deze nieuwe beperking.

We blijven onderzoeken hoe AI-systemen, zoals DALL·E, vooroordelen in de trainingsgegevens kunnen weerspiegelen en verschillende manieren waarop we deze kunnen aanpakken.

Tijdens de onderzoekspreview hebben we andere stappen ondernomen om onze veiligheidssystemen te verbeteren, waaronder:

Het risico minimaliseren dat DALL·E wordt misbruikt om misleidende inhoud te creëren door het uploaden van afbeeldingen met realistische gezichten te weigeren en pogingen om de gelijkenis van publieke figuren te creëren, waaronder beroemdheden en prominente politieke figuren.
Onze inhoudsfilters nauwkeuriger maken, zodat ze effectiever zijn in het blokkeren van prompts en het uploaden van afbeeldingen die in strijd zijn met onze inhoudsbeleid terwijl het nog steeds creatieve expressie mogelijk maakt.
Verfijning van geautomatiseerde en menselijke bewakingssystemen om misbruik te voorkomen.

Deze verbeteringen hebben ons geholpen meer vertrouwen te krijgen in de mogelijkheid om meer gebruikers uit te nodigen om DALL·E te ervaren.

Het uitbreiden van de toegang is een belangrijk onderdeel van onze verantwoorde inzet van AI-systemen omdat het ons in staat stelt meer te leren over het gebruik in de echte wereld en onze veiligheidssystemen te blijven herhalen.

Tijdstempel: 18 juli 202218 juli 2022

Tijdstempel: December 13, 2023

Vooroordelen verminderen en veiligheid verbeteren in DALL·E 2

Heruitgegeven door Plato

Meer van OpenAI

Praktijken voor het besturen van agentische AI-systemen

Introductie van OpenAI Londen

Modellen leren hun onzekerheid in woorden uit te drukken

OpenAI kondigt nieuwe leden aan voor de raad van bestuur

Wiskundig redeneren verbeteren met procesbegeleiding

Frontier AI-regelgeving: beheer van opkomende risico's voor de openbare veiligheid

GPT-4V(ision) systeemkaart

Maak kennis met het ChatGPT-team

Samenwerking met Axel Springer om het nuttige gebruik van AI in de journalistiek te verdiepen

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account