Microsoft modifica Copilot AI em resposta às preocupações da equipe

Microsoft modifica Copilot AI em resposta às preocupações da equipe

Microsoft modifica Copilot AI em resposta às preocupações da equipe PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

A Microsoft atualizou sua ferramenta Copilot AI, bloqueando avisos como “pró-escolha” e “pró-vida” e introduzindo avisos sobre violações de políticas após preocupações da equipe e da FTC.

Depois que um engenheiro de IA da equipe expressou suas preocupações sobre a geração de imagens do Copilot AI Em carta à Comissão Federal de Comércio na quarta-feira, a Microsoft começou a mudar sua ferramenta de inteligência artificial, o Copilot.

Veja também: Startups de IA brilham no primeiro trimestre com aumento de 1% no financiamento de capital de risco

Os termos “pró-vida” e “pró-escolha”, “pró-escolha” [sic] e “quatro e vinte”, que foram todos mencionados na investigação da CNBC na quarta-feira, estão agora bloqueados. Além disso, a CNBC estava ciente do aviso de que infrações repetidas da política poderiam resultar na suspensão do instrumento.

Engenheiro de IA fala

Shane Jones, engenheiro de IA da Microsoft, alerta que o Copilot Designer, o gerador de imagens de IA da empresa, viola as leis de direitos autorais e produz conteúdo violento ou sexual. Jones se ofereceu para usar seu tempo livre para reunir o gerador de imagens em busca de vulnerabilidades, mesmo que ele não esteja envolvido em seu desenvolvimento.

Ele descobriu que o Gerador de Imagens poderia produzir imagens gráficas e sexuais, como cenas violentas envolvendo uso de drogas, consumo de álcool por menores e direito ao aborto.

Depois de compartilhar suas descobertas internamente com a empresa em dezembro do ano passado, ele pediu à Microsoft que retirasse o produto. A Microsoft não seguiu adiante.

Jones enfatiza que conversou com a gerência sênior do Copilot Designer e entrou em contato com o Office for Responsible AI da Microsoft, mas não recebeu uma resposta satisfatória.

Jones se reuniu com membros do Comitê de Comércio, Ciência e Transporte do Senado em janeiro e escreveu uma carta aos senadores dos Estados Unidos.

Ele agora está indo mais longe: solicita melhores salvaguardas, transparência e uma revisão da classificação adulta do aplicativo Android em uma carta ao conselho de administração da Microsoft e a Lina Khan, presidente da Comissão Antitruste dos EUA.

Além disso, ele exigiu uma avaliação imparcial do procedimento de relatório de incidentes de IA da Microsoft, alegando que a OpenAI e a Microsoft estavam cientes dos problemas do gerador de imagens antes do seu lançamento no outono passado.

Jones é o principal gerente de engenharia de software da Microsoft há quase seis anos.

Copiloto responde

De acordo com o alerta de aviso do Copilot, o prompt foi bloqueado e o sistema sinalizou automaticamente esse prompt porque pode entrar em conflito com o seu política de conteúdo. Eles afirmaram que mais violações da política podem levar à suspensão automática do acesso e, se os usuários acharem que isso é um erro, devem denunciá-lo para ajudá-los a melhorar.

Uma melhoria significativa em relação ao início desta semana é que a ferramenta de IA agora recusa pedidos para criar imagens de crianças ou adolescentes fingindo ser assassinos com rifles de assalto, dizendo: “Sinto muito, mas não consigo gerar tal imagem”. Tanto as políticas da Microsoft como os meus princípios éticos são violados. Não me peça para fazer nada que possa ofender ou causar danos a outras pessoas. Eu aprecio a sua cooperação.

A Microsoft O representante disse à CNBC que eles estão monitorando continuamente, fazendo ajustes e implementando controles adicionais para fortalecer ainda mais seus filtros de segurança e mitigar o uso indevido do sistema em resposta a uma pergunta sobre as mudanças. 

Jones escreveu ao conselho de administração da Microsoft e FTC Presidente Lina Khan na quarta-feira, levando suas preocupações um passo adiante. Ele deu à CNBC acesso antecipado às cartas.

A FTC reconheceu o recebimento da carta à CNBC, mas optou por não fornecer quaisquer comentários adicionais para registro.

Carimbo de hora:

Mais de MetaNotícias