Os cientistas criaram o 'OpinionGPT' para explorar o preconceito humano explícito - e você pode testá-lo por si mesmo

Os cientistas criaram o 'OpinionGPT' para explorar o preconceito humano explícito - e você pode testá-lo por si mesmo

Uma equipe de pesquisadores da Humboldt-Universitat zu Berlin desenvolveu um modelo de inteligência artificial em grande linguagem com a distinção de ter sido intencionalmente ajustado para gerar resultados com preconceito expresso.

Chamado de OpinionGPT, o modelo da equipe é uma variante ajustada do Llama 2 da Meta, um sistema de IA semelhante em capacidade ao ChatGPT da OpenAI ou ao Claude 2 da Antrópico.

Usando um processo chamado ajuste fino baseado em instruções, o OpinionGPT pode supostamente responder a solicitações como se fosse um representante de um dos 11 grupos tendenciosos: americano, alemão, latino-americano, do Oriente Médio, um adolescente, alguém com mais de 30 anos, uma pessoa mais velha. , um homem, uma mulher, um liberal ou um conservador.

OpinionGPT foi refinado em um corpus de dados derivados de comunidades “AskX”, chamadas subreddits, no Reddit. Exemplos desses subreddits incluiriam “Ask a Woman” e “Ask an American”.

A equipe começou encontrando subreddits relacionados aos 11 preconceitos específicos e extraindo as 25 mil postagens mais populares de cada um. Eles então mantiveram apenas as postagens que atendiam a um limite mínimo de votos positivos, não continham uma citação incorporada e tinham menos de 80 palavras.

Com o que sobrou, parece que eles usaram um abordagem semelhante à IA Constitucional da Antrópica. Em vez de criar modelos inteiramente novos para representar cada rótulo de polarização, eles essencialmente ajustaram o modelo Llama7 único de 2 bilhões de parâmetros com conjuntos de instruções separados para cada polarização esperada.

Relacionado: O uso de IA nas redes sociais tem potencial para impactar o sentimento dos eleitores

O resultado, com base na metodologia, arquitetura e dados descrito no artigo de investigação da equipa alemã, parece ser um sistema de IA que funciona mais como um gerador de estereótipos do que como uma ferramenta para estudar preconceitos no mundo real.

Devido à natureza dos dados nos quais o modelo foi refinado e à relação duvidosa desses dados com os rótulos que os definem, o OpinionGPT não produz necessariamente texto que se alinhe com qualquer viés mensurável do mundo real. Ele simplesmente gera texto refletindo a tendência de seus dados.

Os próprios pesquisadores reconhecem algumas das limitações que isso impõe ao seu estudo, escrevendo:

"Por exemplo, as respostas dos "americanos" deveriam ser melhor entendidas como 'americanos que postam no Reddit', ou mesmo 'americanos que postam neste subreddit específico'. Da mesma forma, 'alemães' devem ser entendidos como 'alemães que postam neste subreddit'. subreddit específico,' etc.”

Essas advertências poderiam ser ainda mais refinadas para dizer que as postagens vêm, por exemplo, de “pessoas que afirmam ser americanas e que postam neste subreddit específico”, já que não há menção no jornal sobre a verificação se os postadores por trás de uma determinada postagem são de fato representativos. do grupo demográfico ou preconceituoso que afirmam ser.

Os autores prosseguem afirmando que pretendem explorar modelos que delineiem melhor a demografia (ou seja: alemão liberal, alemão conservador).

Os resultados fornecidos pelo OpinionGPT parecem variar entre representar preconceitos demonstráveis ​​e diferir totalmente da norma estabelecida, tornando difícil discernir a sua viabilidade como ferramenta para medir ou descobrir preconceitos reais.

Os cientistas criaram o ‘OpinionGPT’ para explorar o preconceito humano explícito – e você pode testá-lo por si mesmo PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.
Fonte: Captura de tela, Tabela 2: Haller et. al., 2023

De acordo com o OpinionGPT, como mostra a imagem acima, por exemplo, os latino-americanos têm uma tendência a considerar o basquete como seu esporte favorito.

A pesquisa empírica, no entanto, claramente indicam que o futebol (também chamado de futebol em alguns países) e o beisebol são os esportes mais populares em audiência e participação em toda a América Latina.

A mesma tabela também mostra que o OpinionGPT apresenta o “pólo aquático” como seu esporte favorito quando instruído a dar a “resposta de um adolescente”, uma resposta que parece estatisticamente improvável ser representativo da maioria dos jovens de 13 a 19 anos em todo o mundo.

O mesmo vale para a ideia de que a comida favorita do americano médio é “queijo”. Encontrámos dezenas de inquéritos online afirmando que a pizza e os hambúrgueres eram os alimentos favoritos dos americanos, mas não conseguimos encontrar um único inquérito ou estudo que afirmasse que o prato número um dos americanos era simplesmente queijo.

Embora o OpinionGPT possa não ser adequado para estudar preconceitos humanos reais, pode ser útil como uma ferramenta para explorar os estereótipos inerentes a grandes repositórios de documentos, como subreddits individuais ou conjuntos de treinamento de IA.

Para quem está curioso, os pesquisadores criaram o OpinionGPT disponível on-line para testes públicos. No entanto, de acordo com o site, os possíveis usuários devem estar cientes de que “o conteúdo gerado pode ser falso, impreciso ou até mesmo obsceno”.

Carimbo de hora:

Mais de Cointelegraph