Cientistas criaram o ‘OpinionGPT’ para explorar o preconceito humano explícito

Republicado por Platão

seguidores: 0

Uma equipe de pesquisadores da Humboldt-Universitat zu Berlin desenvolveu um modelo de inteligência artificial em grande linguagem com a distinção de ter sido intencionalmente ajustado para gerar resultados com preconceito expresso.

Chamado de OpinionGPT, o modelo da equipe é uma variante ajustada do Llama 2 da Meta, um sistema de IA semelhante em capacidade ao ChatGPT da OpenAI ou ao Claude 2 da Antrópico.

Usando um processo chamado ajuste fino baseado em instruções, o OpinionGPT pode supostamente responder a solicitações como se fosse um representante de um dos 11 grupos tendenciosos: americano, alemão, latino-americano, do Oriente Médio, um adolescente, alguém com mais de 30 anos, uma pessoa mais velha. , um homem, uma mulher, um liberal ou um conservador.

Anunciando “OpinionGPT: Um modelo GPT muito tendencioso”! Experimente aqui: https://t.co/5YJjHlcV4n
Para investigar o impacto do viés nas respostas do modelo, fizemos uma pergunta simples: e se ajustássemos um #GPT modelo apenas com textos escritos por pessoas de tendência política de direita?

[1 / 3]

-Alan Akbik (@alan_akbik) 8 de Setembro de 2023

OpinionGPT foi refinado em um corpus de dados derivados de comunidades “AskX”, chamadas subreddits, no Reddit. Exemplos desses subreddits incluiriam “Ask a Woman” e “Ask an American”.

A equipe começou encontrando subreddits relacionados aos 11 preconceitos específicos e extraindo as 25 mil postagens mais populares de cada um. Eles então mantiveram apenas as postagens que atendiam a um limite mínimo de votos positivos, não continham uma citação incorporada e tinham menos de 80 palavras.

Com o que sobrou, parece que eles usaram um abordagem semelhante à IA Constitucional da Antrópica. Em vez de criar modelos inteiramente novos para representar cada rótulo de polarização, eles essencialmente ajustaram o modelo Llama7 único de 2 bilhões de parâmetros com conjuntos de instruções separados para cada polarização esperada.

Relacionado: O uso de IA nas redes sociais tem potencial para impactar o sentimento dos eleitores

O resultado, com base na metodologia, arquitetura e dados descrito no artigo de investigação da equipa alemã, parece ser um sistema de IA que funciona mais como um gerador de estereótipos do que como uma ferramenta para estudar preconceitos no mundo real.

Devido à natureza dos dados nos quais o modelo foi refinado e à relação duvidosa desses dados com os rótulos que os definem, o OpinionGPT não produz necessariamente texto que se alinhe com qualquer viés mensurável do mundo real. Ele simplesmente gera texto refletindo a tendência de seus dados.

Os próprios pesquisadores reconhecem algumas das limitações que isso impõe ao seu estudo, escrevendo:

"Por exemplo, as respostas dos "americanos" deveriam ser melhor entendidas como 'americanos que postam no Reddit', ou mesmo 'americanos que postam neste subreddit específico'. Da mesma forma, 'alemães' devem ser entendidos como 'alemães que postam neste subreddit'. subreddit específico,' etc.”

Essas advertências poderiam ser ainda mais refinadas para dizer que as postagens vêm, por exemplo, de “pessoas que afirmam ser americanas e que postam neste subreddit específico”, já que não há menção no jornal sobre a verificação se os postadores por trás de uma determinada postagem são de fato representativos. do grupo demográfico ou preconceituoso que afirmam ser.

Os autores prosseguem afirmando que pretendem explorar modelos que delineiem melhor a demografia (ou seja: alemão liberal, alemão conservador).

Os resultados fornecidos pelo OpinionGPT parecem variar entre representar preconceitos demonstráveis e diferir totalmente da norma estabelecida, tornando difícil discernir a sua viabilidade como ferramenta para medir ou descobrir preconceitos reais.

Os cientistas criaram o ‘OpinionGPT’ para explorar o preconceito humano explícito – e você pode testá-lo por si mesmo PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai. — Fonte: Captura de tela, Tabela 2: *Haller et. al., 2023*

De acordo com o OpinionGPT, como mostra a imagem acima, por exemplo, os latino-americanos têm uma tendência a considerar o basquete como seu esporte favorito.

A pesquisa empírica, no entanto, claramente indicam que o futebol (também chamado de futebol em alguns países) e o beisebol são os esportes mais populares em audiência e participação em toda a América Latina.

A mesma tabela também mostra que o OpinionGPT apresenta o “pólo aquático” como seu esporte favorito quando instruído a dar a “resposta de um adolescente”, uma resposta que parece estatisticamente improvável ser representativo da maioria dos jovens de 13 a 19 anos em todo o mundo.

O mesmo vale para a ideia de que a comida favorita do americano médio é “queijo”. Encontrámos dezenas de inquéritos online afirmando que a pizza e os hambúrgueres eram os alimentos favoritos dos americanos, mas não conseguimos encontrar um único inquérito ou estudo que afirmasse que o prato número um dos americanos era simplesmente queijo.

Embora o OpinionGPT possa não ser adequado para estudar preconceitos humanos reais, pode ser útil como uma ferramenta para explorar os estereótipos inerentes a grandes repositórios de documentos, como subreddits individuais ou conjuntos de treinamento de IA.

Para quem está curioso, os pesquisadores criaram o OpinionGPT disponível on-line para testes públicos. No entanto, de acordo com o site, os possíveis usuários devem estar cientes de que “o conteúdo gerado pode ser falso, impreciso ou até mesmo obsceno”.

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
PlatãoESG. Automotivo / EVs, Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
ChartPrime. Eleve seu jogo de negociação com ChartPrime. Acesse aqui.
BlockOffsets. Modernizando a Propriedade de Compensação Ambiental. Acesse aqui.
Fonte: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test

Carimbo de hora: 8 de Setembro de 2023

Carimbo de hora: 5 de Outubro, 2021

Republicado por Platão

Volume do dia de lançamento do VanEck Bitcoin Strategy ETF uma fração do BITO

Os republicanos da Câmara pedem controles mais rígidos de exportação de chips avançados

Elizabeth Warren compara criptografia 'falsa' a CBDCs 'legítimas' em audiência no Senado

Maior operadora móvel do Japão estabelece consórcio Web3

Análise de preço 8/25: BTC, ETH, ADA, BNB, XRP, DOGE, DOT, SOL, UNI, BCH

Coinbase pausa o suporte ao Signet do Signature Bank: relatório

A criptografia pode aliviar as consequências financeiras para as pessoas no Afeganistão

UE vai cortar 7 bancos russos da SWIFT, com russos comuns enfrentando consequências

Notícias bacanas: Walking Dead invadem Sandbox, NFTs de arrendamento de mineração, CryptoPunk na galeria de arte

Os comerciantes acumulam altcoins depois que os touros do Bitcoin conquistam US $ 50 mil

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta