Reduzindo o viés e melhorando a segurança em DALL·E 2 PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Reduzindo o viés e melhorando a segurança em DALL·E 2

Hoje estamos implementando uma nova técnica para que o DALL·E gere imagens de pessoas que reflitam com mais precisão a diversidade da população mundial. Esta técnica é aplicada no nível do sistema quando o DALL·E recebe uma mensagem descrevendo uma pessoa que não especifica raça ou gênero, como “bombeiro”.

Com base em nossa avaliação interna, os usuários estavam 12 vezes mais propensos a dizer que as imagens do DALL·E incluíam pessoas de diversas origens após a aplicação da técnica. Planejamos melhorar essa técnica ao longo do tempo, à medida que coletamos mais dados e feedback.


Uma foto de um CEO

Gerar

Em abril, começámos a pré-visualizar a investigação do DALL·E 2 a um número limitado de pessoas, o que nos permitiu compreender melhor as capacidades e limitações do sistema e melhorar os nossos sistemas de segurança.

Durante esta fase de pré-visualização, os primeiros utilizadores sinalizaram imagens sensíveis e tendenciosas que ajudaram a informar e avaliar esta nova mitigação.

Continuamos a pesquisar como os sistemas de IA, como o DALL·E, podem refletir preconceitos nos seus dados de treino e diferentes formas de os podermos resolver.

Durante a prévia da pesquisa, tomamos outras medidas para melhorar nossos sistemas de segurança, incluindo:

  • Minimizar o risco de o DALL·E ser utilizado indevidamente para criar conteúdo enganoso, rejeitando uploads de imagens contendo rostos realistas e tentativas de criar imagens de figuras públicas, incluindo celebridades e figuras políticas proeminentes.
  • Tornar nossos filtros de conteúdo mais precisos para que sejam mais eficazes no bloqueio de solicitações e uploads de imagens que violem nossos política de conteúdo ao mesmo tempo que permite a expressão criativa.
  • Refinando sistemas de monitoramento automatizados e humanos para proteção contra uso indevido.

Essas melhorias nos ajudaram a ganhar confiança na capacidade de convidar mais usuários para experimentar o DALL·E.

Expandir o acesso é uma parte importante do nosso implantando sistemas de IA de forma responsável porque nos permite aprender mais sobre o uso no mundo real e continuar a iterar em nossos sistemas de segurança.

Carimbo de hora:

Mais de OpenAI