Tekoälyyritys Anthropic on kehittänyt laajan kielimallin (LLM), joka saattaa olla ensimmäinen laatuaan tutkimuksessa, joka on hienosäädetty käyttäjäyhteisön arvoarviointeja varten.
Mitä tarkoittaa, että tekoälykehitys on demokraattisempaa? Selvittääksemme asian, teimme yhteistyötä @collect_intel käyttää @usepolis laatia tekoälyn perustuslaki ~1000 amerikkalaisen mielipiteiden perusteella. Sitten koulutimme mallin sitä vastaan perustuslaillisen tekoälyn avulla. pic.twitter.com/ZKaXw5K9sU
— Antrooppinen (@AnthropicAI) Lokakuu 17, 2023
Monet yleisölle suunnatut LLM:t on kehitetty suojakaiteilla – koodatuilla ohjeilla, jotka sanelevat tietyn käyttäytymisen – yritettäessä rajoittaa ei-toivottuja tulosteita. Esimerkiksi Anthropicin Claude ja OpenAI:n ChatGPT antavat käyttäjille tyypillisesti turvareaktion väkivaltaisiin tai kiistanalaisiin aiheisiin liittyviin tulospyyntöihin.
Kuitenkin, kuten lukemattomat asiantuntijat ovat huomauttaneet, suojakaiteet ja muut interventiotekniikat voivat ryöstää käyttäjiltä heidän virastonsa. Se, mitä pidetään hyväksyttävänä, ei ole aina hyödyllistä, ja se, mitä pidetään hyödyllisenä, ei ole aina hyväksyttävää. Ja moraalin tai arvopohjaisten tuomioiden määritelmät voivat vaihdella kulttuurien, väestön ja ajanjaksojen välillä.
Yksi mahdollinen ratkaisu tähän on antaa käyttäjien sanella tekoälymallien arvojen kohdistus. Anthropicin "Collective Constitutional AI" -kokeilu on puukko tähän "sotkuiseen haasteeseen".
Anthropic kysyi yhteistyössä Polisin ja Collective Intelligence Projectin kanssa 1,000 XNUMX käyttäjää eri väestöryhmistä ja pyysi heitä vastaamaan kyselyihin.
Haaste keskittyy siihen, että viraston käyttäjät voivat päättää, mikä on sopivaa altistamatta heitä sopimattomille tuloksille. Tämä sisälsi käyttäjäarvojen keräämisen ja näiden ideoiden toteuttamisen malliksi, joka on jo koulutettu.
Anthropic käyttää menetelmää nimeltä "Constitutional AI". ohjata sen pyrkimyksiin virittää LLM-yritykset turvallisuuteen ja hyödyllisyyteen. Pohjimmiltaan tämä tarkoittaa, että mallille annetaan luettelo säännöistä, joita sen on noudatettava, ja sen jälkeen sen kouluttaminen noudattamaan näitä sääntöjä koko prosessin ajan, aivan kuten perustuslaki toimii hallinnon ydinasiakirjana monissa maissa.
Collective Constitutional AI -kokeessa Anthropic yritti integroida ryhmäpohjaisen palautteen mallin rakenteeseen. Tulokset, mukaan Anthropicin blogikirjoitukseen, näyttää olleen tieteellinen menestys, koska se valaisi lisähaasteita kohti tavoitetta, jonka mukaan LLM-tuotteen käyttäjät voivat määrittää yhteiset arvonsa.
Yksi vaikeuksista, jotka tiimin oli voitettava, oli uudenlaisen menetelmän kehittäminen benchmarking-prosessia varten. Koska tämä kokeilu näyttää olevan ensimmäinen laatuaan ja se perustuu Anthropicin perustuslailliseen AI-metodologiaan, ei ole olemassa vakiintunutta testiä perusmallien vertaamiseksi joukkolähteillä oleviin arvoihin viritettyihin.
Loppujen lopuksi näyttää siltä, että malli, joka toteutti käyttäjien kyselyn palautteen tuloksena saatuja tietoja, ylitti perusmallin "hieman" puolueellisten tulosten alueella.
Blogikirjoituksen mukaan:
”Enemmän kuin tuloksena oleva malli, olemme innoissamme prosessista. Uskomme, että tämä saattaa olla yksi ensimmäisistä tapauksista, joissa yleisö on ryhmänä tarkoituksella ohjannut suuren kielimallin käyttäytymistä. Toivomme, että yhteisöt ympäri maailmaa kehittävät tämän kaltaisia tekniikoita kouluttaakseen kulttuuri- ja kontekstikohtaisia malleja, jotka palvelevat heidän tarpeitaan."
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
- PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
- PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
- PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
- Lähde: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- :on
- :On
- $ YLÖS
- 000
- 1
- 17
- a
- Meistä
- hyväksyttävä
- saavuttamisessa
- poikki
- vastaan
- toimisto
- AI
- AI chatbot
- AI-mallit
- suuntaus
- sallia
- Salliminen
- jo
- aina
- Amerikkalaiset
- an
- ja
- vastaus
- Antropinen
- näyttää
- näyttää
- sopiva
- ALUE
- noin
- keinotekoinen
- tekoäly
- Tekoäly (AI)
- AS
- At
- yritys
- yritettiin
- pohja
- perustua
- BE
- ollut
- käyttäytyminen
- Uskoa
- benchmarking
- välillä
- puolueellinen
- Blogi
- rakentaa
- rakennettu
- by
- nimeltään
- CAN
- keskuksissa
- haaste
- haasteet
- chatbot
- ChatGPT
- Cointelegraph
- yhteistyö
- Kollektiivinen
- tuleva
- yhteisöjen
- yhteisö
- vertaamalla
- harkittu
- Perustuslaki
- kiistanalainen
- Ydin
- tiedot
- määritelmät
- demokraattinen
- Väestötiedot
- Määrittää
- kehitetty
- Kehitys
- sanella
- vaikeudet
- suunnattu
- useat
- asiakirja
- ei
- ponnisteluja
- olennaisesti
- vakiintunut
- esimerkki
- innoissaan
- kokeilu
- palaute
- Löytää
- Yritys
- Etunimi
- varten
- alkaen
- edelleen
- Antaa
- Antaminen
- tavoite
- hallinto
- Ryhmä
- HAD
- Olla
- toivoa
- HTTPS
- ideoita
- toteuttaa
- täytäntöön
- täytäntöönpanosta
- in
- ohjeet
- yhdistää
- Älykkyys
- tarkoituksella
- tulee
- osallistuva
- IT
- SEN
- jpg
- tuomiot
- laji
- Kieli
- suuri
- kerroit
- pitää
- RAJOITA
- Lista
- OTK
- monet
- Saattaa..
- tarkoittaa
- Jäsenet
- menetelmä
- Metodologia
- malli
- mallit
- moraali
- lisää
- paljon
- täytyy
- Nations
- tarpeet
- romaani
- marraskuu
- of
- on
- ONE
- Lausunnot
- or
- Muut
- ulos
- päihitti
- ulostulo
- lähdöt
- Voittaa
- kumppanuuteen
- aikoja
- Paikka
- suunnitteilla
- Platon
- Platonin tietotieto
- PlatonData
- mahdollinen
- Kirje
- mahdollinen
- prosessi
- Tuotteet
- projekti
- julkinen
- kysymykset
- liittyvä
- pyynnöt
- vastaus
- Saatu ja
- tulokset
- ryöstää
- säännöt
- Turvallisuus
- tieteellinen
- Sarjat
- palvella
- palvelee
- erityinen
- tutkimus
- menestys
- Tapped
- Kohde
- joukkue-
- tekniikat
- testi
- kuin
- että
- -
- Alue
- maailma
- heidän
- Niitä
- sitten
- Siellä.
- tätä
- ne
- vaikka?
- uhat
- kauttaaltaan
- aika
- että
- Aiheet
- kohti
- Juna
- koulutettu
- koulutus
- viserrys
- tyypillisesti
- toivottuja
- käyttää
- käyttäjä
- Käyttäjät
- käyttötarkoituksiin
- käyttämällä
- arvo
- arvopohjaisen
- arvot
- kautta
- Äänestää
- oli
- we
- Mitä
- joka
- tulee
- with
- ilman
- maailman-
- zephyrnet