Anthropic loi demokraattisen AI-chatbotin antamalla käyttäjien valita sen periaatteet.

Anthropic loi demokraattisen AI-chatbotin antamalla käyttäjien valita sen periaatteet.

Anthropic loi demokraattisen AI-chatbotin antamalla käyttäjien valita sen periaatteet. PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.
<!-
HTML-opetusohjelma
->

Anthropic, tekoälyyritys, on räätälöinyt laajan kielimallin (LLM) ottamaan huomioon käyttäjien määrittämiä arvoja uraauurtavassa tekoälyn ominaisuuksien tutkimisessa. Tässä ainutlaatuisessa tutkimuksessa kerättiin palautetta 1,000 XNUMX osallistujalta LLM:n vastausten hienosäätämiseksi heidän kollektiivisten arvioidensa perusteella.

Toisin kuin perinteiset LLM:t, jotka on varustettu ennalta määritellyillä suojakaiteilla tiettyjen tulosten rajoittamiseksi, Anthropicin lähestymistapa kattaa käyttäjäviraston. Mallit, kuten Anthropicin Claude ja OpenAI:n ChatGPT, noudattavat usein ennalta asetettuja turvallisuusreaktioita, erityisesti arkaluonteisten aiheiden osalta. Kriitikot kuitenkin väittävät, että tällaiset interventiot voivat vaarantaa käyttäjien autonomian, koska hyväksyttävyyden määritelmä vaihtelee ja on subjektiivinen kulttuurien ja ajanjaksojen välillä.

Mahdollinen ratkaisu tähän monimutkaiseen haasteeseen on antaa käyttäjille mahdollisuus muokata tekoälymallien arvoja. Anthropic aloitti "Collective Constitutional AI" -kokeilun yhteistyössä Polisin ja Collective Intelligence Projectin kanssa. He ottivat mukaansa 1,000 XNUMX eritaustaista käyttäjää ja esittivät joukon kysymyksiä kyselyissä kerätäkseen arvokkaita oivalluksia.

Kokeilussa annetaan käyttäjille valtuudet määrittää asianmukaisuus altistamatta heitä ei-toivotuille tuloksille. Tämä prosessi sisälsi käyttäjäarvojen esiin tuomisen ja niiden sisällyttämisen valmiiksi koulutettuun malliin. Anthropic käyttää tekniikkaa, joka tunnetaan nimellä "Constitutional AI", jossa mallille tarjotaan joukko noudatettavia sääntöjä, jotka ovat samankaltaisia ​​kuin valtioiden hallintoa ohjaava perustuslaki.

Collective Constitutional AI -kokeessa Anthropic pyrki integroimaan käyttäjäryhmien palautteen mallin rakenteeseen. Anthropicin blogikirjoituksen mukaan tulokset viittaavat tieteelliseen menestykseen ja valottavat haasteita, jotka liittyvät siihen, että käyttäjät voivat määritellä kollektiivisesti LLM-tuotteen arvot.

Merkittävä este, jonka tiimi kohtasi, oli uudenlaisen benchmarking-prosessin kehittäminen. Ottaen huomioon kokeen uraauurtavan luonteen ja luottamuksen Anthropicin perustuslailliseen tekoälymetodologiaan, ei ole olemassa vakiintunutta testiä perusmallien vertaamiseksi joukkolähteistä saatavia arvoja käyttäen hienosäädettyihin malliin.

Loppujen lopuksi näyttää siltä, ​​​​että malli, joka sisälsi käyttäjien kyselypalautteesta saatuja tietoja, osoitti "pientä" parannusta perusmalliin verrattuna puolueellisten tulosten lieventämisessä. Anthropic ilmaisee jännitystä ei pelkästään tuloksena olevasta mallista vaan, mikä vielä tärkeämpää, itse uraauurtavasta prosessista. Tämä kokeilu on yksi ensimmäisistä tapauksista, joissa yleisö kollektiivina tarkoituksella vaikutti suuren kielimallin käyttäytymiseen. Toivomme, että yhteisöt maailmanlaajuisesti rakentavat tällaisia ​​tekniikoita kehittääkseen malleja, jotka vastaavat heidän erityisiä kulttuurisia ja kontekstuaalisia tarpeitaan.

Uusimmat uutiset

DeFi Hope Lendin Ethereum-protokolla on kulunut loppuun

Uusimmat uutiset

FTX-velkojien saatavat ylittävät 50 senttiä

Uusimmat uutiset

Tuoreen tutkimuksen mukaan Bitcoinin pioneeri Hal Finney

Uusimmat uutiset

Asianajajat arvioivat, että SEC:llä on 3–14 prosenttia

Uusimmat uutiset

Thaimaa viivästyttää digitaalisen valuutan luovuttamista; kriitikot vaativat

Aikaleima:

Lisää aiheesta bitcoinin maailma