Reduzindo preconceitos e melhorando a segurança no DALL·E 2

Republicado por Platão

seguidores: 0

Hoje estamos implementando uma nova técnica para que o DALL·E gere imagens de pessoas que reflitam com mais precisão a diversidade da população mundial. Esta técnica é aplicada no nível do sistema quando o DALL·E recebe uma mensagem descrevendo uma pessoa que não especifica raça ou gênero, como “bombeiro”.

Com base em nossa avaliação interna, os usuários estavam 12 vezes mais propensos a dizer que as imagens do DALL·E incluíam pessoas de diversas origens após a aplicação da técnica. Planejamos melhorar essa técnica ao longo do tempo, à medida que coletamos mais dados e feedback.

Uma foto de um CEO

Gerar

Antes da mitigação

Após a mitigação

Em abril, começámos a pré-visualizar a investigação do DALL·E 2 a um número limitado de pessoas, o que nos permitiu compreender melhor as capacidades e limitações do sistema e melhorar os nossos sistemas de segurança.

Durante esta fase de pré-visualização, os primeiros utilizadores sinalizaram imagens sensíveis e tendenciosas que ajudaram a informar e avaliar esta nova mitigação.

Continuamos a pesquisar como os sistemas de IA, como o DALL·E, podem refletir preconceitos nos seus dados de treino e diferentes formas de os podermos resolver.

Durante a prévia da pesquisa, tomamos outras medidas para melhorar nossos sistemas de segurança, incluindo:

Minimizar o risco de o DALL·E ser utilizado indevidamente para criar conteúdo enganoso, rejeitando uploads de imagens contendo rostos realistas e tentativas de criar imagens de figuras públicas, incluindo celebridades e figuras políticas proeminentes.
Tornar nossos filtros de conteúdo mais precisos para que sejam mais eficazes no bloqueio de solicitações e uploads de imagens que violem nossos política de conteúdo ao mesmo tempo que permite a expressão criativa.
Refinando sistemas de monitoramento automatizados e humanos para proteção contra uso indevido.

Essas melhorias nos ajudaram a ganhar confiança na capacidade de convidar mais usuários para experimentar o DALL·E.

Expandir o acesso é uma parte importante do nosso implantando sistemas de IA de forma responsável porque nos permite aprender mais sobre o uso no mundo real e continuar a iterar em nossos sistemas de segurança.

Carimbo de hora: 18 de julho de 202218 de julho de 2022

Carimbo de hora: 13 Dezembro, 2023

Reduzindo o viés e melhorando a segurança em DALL·E 2

Republicado por Platão

Mais de OpenAI

Práticas para Governar Sistemas de IA Agentes

Apresentando o OpenAI Londres

Modelos de ensino para expressar sua incerteza em palavras

OpenAI anuncia novos membros para o conselho de administração

Melhorando o raciocínio matemático com supervisão de processo

Regulamentação de IA de fronteira: Gerenciando riscos emergentes para a segurança pública

Placa de sistema GPT-4V (ision)

Apresentando a equipe ChatGPT

Parceria com Axel Springer para aprofundar o uso benéfico da IA no jornalismo

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta