Tiedemiehet loivat "OpinionGPT" tutkiakseen eksplisiittistä ihmisen ennakkoluulottomuutta

Julkaissut Platon

seuraajia: 0

Humboldt-Universitat zu Berlinin tutkijaryhmä on kehittänyt laajan kielen tekoälymallin, joka erottuu siitä, että se on tarkoituksella viritetty tuottamaan tulosteita, joissa on ilmeistä ennakkoluulottomuutta.

OpinionGPT-niminen tiimin malli on viritetty muunnos Meta's Llama 2:sta, tekoälyjärjestelmästä, joka on samanlainen kuin OpenAI:n ChatGPT tai Anthropicin Claude 2.

OpinionGPT voi vastata kehotuksiin ikään kuin se edustaisi yhtä 11 puolueellisesta ryhmästä: amerikkalainen, saksalainen, latinalaisamerikkalainen, Lähi-itä, teini, joku yli 30-vuotias, vanhempi henkilö käyttämällä prosessia, jota kutsutaan ohjepohjaiseksi hienosäädöksi. , mies, nainen, liberaali tai konservatiivi.

Julkistamme "OpinionGPT: Erittäin puolueellinen GPT-malli"! Kokeile täällä: https://t.co/5YJjHlcV4n
Tutkiaksemme harhan vaikutusta mallivastauksiin esitimme yksinkertaisen kysymyksen: Mitä jos virittäisimme a #GPT malli vain poliittisesti oikeistolaisten kirjoittamilla teksteillä?

[1 / 3]

- Alan Akbik (@alan_akbik) Syyskuu 8, 2023

OpinionGPT on jalostettu Redditin "AskX"-yhteisöistä johdettuun datakorkukseen, jota kutsutaan subredditeiksi. Esimerkkejä näistä alikirjoituksista ovat "Kysy naiselta" ja "Kysy amerikkalaisesta".

Ryhmä aloitti etsimällä alikirjoituksia, jotka liittyvät 11 tiettyyn harhaan ja poimimalla kustakin 25 80 suosituinta viestiä. Sitten he säilyttivät vain ne viestit, jotka täyttivät puolustelukynnyksen, eivät sisältäneet upotettua lainausta ja olivat alle XNUMX sanaa.

Jäljelle jääneen kanssa näyttää siltä, että he olisivat käyttäneet lähestymistapa samanlainen kuin Anthropic's Constitutional AI. Sen sijaan, että olisi kehitetty täysin uusia malleja edustamaan kutakin bias-merkkiä, he pääsääntöisesti hienosääsivät yhden 7 miljardin parametrin Llama2-mallin erillisillä ohjesarjoilla kullekin odotetulle harhalle.

Tulos, joka perustuu metodologiaan, arkkitehtuuriin ja tietoihin on kuvattu Saksan ryhmän tutkimuspaperissa, näyttää olevan tekoälyjärjestelmä, joka toimii enemmän stereotypioiden luojana kuin työkaluna todellisen maailman harhaan.

Johtuen tietojen luonteesta, jota mallia on jalostettu ja näiden tietojen kyseenalainen suhde sen määrittäviin tunnisteisiin, OpinionGPT ei välttämättä tulosta tekstiä, joka on linjassa minkään mitattavissa olevan todellisen harhan kanssa. Se yksinkertaisesti tulostaa tekstiä, joka kuvastaa sen tietojen harhaa.

Tutkijat itse tunnustavat joitain rajoituksia, joita tämä asettaa heidän tutkimukselleen, kirjoittamalla:

"Esimerkiksi "amerikkalaisten" vastaukset tulisi ymmärtää paremmin sanoilla "Amerikkalaiset, jotka julkaisevat Redditissä" tai jopa "amerikkalaiset, jotka julkaisevat tässä tietyssä subredditissä." Vastaavasti "saksalaiset" tulisi ymmärtää "saksalaisina, jotka julkaisevat tässä tietyssä subredditissä" jne.

Näitä varoituksia voitaisiin edelleen tarkentaa sanomalla, että viestit ovat peräisin esimerkiksi "ihmisiltä, jotka väittävät olevansa amerikkalaisia, jotka julkaisevat tässä tietyssä subredditissä", koska paperissa ei mainita sen tarkistamisesta, ovatko tietyn viestin takana olevat julisteet todella edustavia. demografisesta tai puolueellisesta ryhmästä, jonka he väittävät olevansa.

Kirjoittajat toteavat edelleen, että he aikovat tutkia malleja, jotka rajaavat demografisia tietoja tarkemmin (eli: liberaali saksalainen, konservatiivinen saksalainen).

OpinionGPT:n antamat tuotokset näyttävät vaihtelevan todettavissa olevan harhan ja jyrkästi vakiintuneesta normista poikkeavien välillä, mikä vaikeuttaa sen elinkelpoisuuden havaitsemista työkaluna todellisen harhan mittaamiseen tai havaitsemiseen.

Tiedemiehet loivat OpinionGPT:n tutkiakseen eksplisiittistä inhimillistä ennakkoluulottomuutta – ja voit testata sitä itse PlatoBlockchain Data Intelligencen. Pystysuuntainen haku. Ai. — Lähde: Kuvakaappaus, Taulukko 2: *Haller et. al., 2023*

OpinionGPT:n mukaan, kuten yllä olevasta kuvasta näkyy, esimerkiksi latinalaisamerikkalaiset ovat puolueellisia siihen, että koripallo on heidän suosikkilajinsa.

Empiirinen tutkimus kuitenkin selvästi ilmaisee että jalkapallo (joissakin maissa kutsutaan myös jalkapalloksi) ja baseball ovat suosituimpia urheilulajeja katsojamäärän ja osallistumisen perusteella kaikkialla Latinalaisessa Amerikassa.

Sama taulukko osoittaa myös, että OpinionGPT ilmoittaa "vesipallon" suosikkiurheilukseen, kun sitä kehotetaan antamaan "teini-ikäisen vastaus", mikä näyttää tilastollisesti. epätodennäköinen edustaa useimpia 13–19-vuotiaita ympäri maailmaa.

Sama pätee ajatukseen, että keskimääräisen amerikkalaisen suosikkiruoka on "juusto". Löysimme verkosta kymmeniä tutkimuksia, joissa väitettiin, että pizza ja hampurilaiset olivat Amerikan suosikkiruokia, mutta emme löytäneet yhtäkään kyselyä tai tutkimusta, joka väittäisi, että amerikkalaisten ykkösruoka olisi vain juustoa.

Vaikka OpinionGPT ei ehkä sovikaan hyvin todellisen inhimillisen ennakkoluulon tutkimiseen, se voi olla hyödyllinen työkalu suurten dokumenttivarastojen, kuten yksittäisten subreddittien tai tekoälyn koulutussarjojen, luontaisten stereotypioiden tutkimiseen.

Niille, jotka ovat uteliaita, tutkijat ovat tehneet OpinionGPT:n saatavissa verkossa julkiseen testaukseen. Verkkosivuston mukaan mahdollisten käyttäjien tulee kuitenkin olla tietoisia siitä, että "luodettu sisältö voi olla väärää, epätarkaa tai jopa säädytöntä".

SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
PlatoESG. Autot / sähköautot, hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
ChartPrime. Nosta kaupankäyntipeliäsi ChartPrimen avulla. Pääsy tästä.
BlockOffsets. Ympäristövastuun omistuksen nykyaikaistaminen. Pääsy tästä.
Lähde: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test

Aikaleima: Syyskuu 8, 2023

Aikaleima: Lokakuu 5, 2021

Julkaissut Platon

VanEck Bitcoin Strategy ETF:n julkaisupäivämäärä on murto-osa BITO:sta

Edustajainhuoneen republikaanit vaativat tiukempaa viennin valvontaa edistyneille siruille

Elizabeth Warren vertaa 'väärennettyä' salausta '' laillisiin '' CBDC: hin senaatin kuulemistilaisuudessa

Japanin suurin matkapuhelinoperaattori perustaa Web3-konsortion

Hinta -analyysi 8/25: BTC, ETH, ADA, BNB, XRP, DOGE, DOT, SOL, UNI, BCH

Coinbase keskeyttää Signature Bankin Signet: Reportin tuen

Salaus voi lievittää Afganistanin ihmisten taloudellisia seurauksia

EU katkaisee seitsemän venäläistä pankkia SWIFT:stä, ja tavalliset venäläiset kohtaavat seurauksia

Nifty News: Walking Dead hyökkää hiekkalaatikkoon, kaivosleasing NFT: t, CryptoPunk taidegalleriassa

Kauppiaat kasaavat altcoineja sen jälkeen, kun Bitcoin -sonnit ottavat 50 XNUMX dollaria

Tietoa meistä

Pystysuuntainen haku ja Ai

foorumi

Pysy yhteydessä

Tili