Podjetje Anthropic, ki je morda prva tovrstna študija, je razvilo velik jezikovni model (LLM), ki je bil natančno prilagojen za vrednostne sodbe skupnosti uporabnikov.
Kaj pomeni, da je razvoj umetne inteligence bolj demokratičen? Da bi to izvedeli, smo sodelovali z @collect_intel uporabiti @usepolis pripraviti ustavo AI na podlagi mnenj ~1000 Američanov. Nato smo usposobili model proti temu z uporabo ustavne umetne inteligence. pic.twitter.com/ZKaXw5K9sU
— Anthropic (@AnthropicAI) Oktober 17, 2023
Veliko javnih LLM-jev je bilo razvitih z zaščitnimi ograjami – kodiranimi navodili, ki narekujejo specifično vedenje – v poskusu omejitve neželenih rezultatov. Anthropic's Claude in OpenAI's ChatGPT, na primer, uporabnikom običajno nudita pripravljen varnostni odziv na izhodne zahteve, povezane z nasilnimi ali kontroverznimi temami.
Vendar, kot so poudarili številni strokovnjaki, lahko zaščitne ograje in druge intervencijske tehnike služijo oropanju uporabnikov njihove agencije. Kar velja za sprejemljivo, ni vedno uporabno in kar se šteje za koristno, ni vedno sprejemljivo. Definicije morale ali vrednotnih sodb se lahko razlikujejo med kulturami, prebivalci in časovnimi obdobji.
Eno od možnih rešitev za to je omogočiti uporabnikom, da narekujejo usklajevanje vrednosti za modele AI. Anthropicov eksperiment »kolektivne ustavne umetne inteligence« je udarec v ta »neurejen izziv«.
Anthropic je v sodelovanju s Polisom in Collective Intelligence Project izbral 1,000 uporabnikov iz različnih demografskih skupin in jih prosil, naj odgovorijo na vrsto vprašanj z glasovanjem.
Izziv je osredotočen na to, da uporabnikom omogočite agenciji, da ugotovijo, kaj je primerno, ne da bi jih izpostavili neprimernim rezultatom. To je vključevalo pridobivanje uporabniških vrednosti in nato implementacijo teh idej v model, ki je že bil usposobljen.
Anthropic za neposredna svoja prizadevanja za prilagoditev LLM-jev za varnost in uporabnost. V bistvu to vključuje dajanje modela seznama pravil, ki se jih mora držati, in nato usposabljanje za izvajanje teh pravil v celotnem procesu, podobno kot ustava služi kot temeljni dokument za upravljanje v mnogih državah.
V eksperimentu Collective Constitutional AI je Anthropic poskušal integrirati skupinske povratne informacije v strukturo modela. Rezultati, po na objavo v spletnem dnevniku Anthropic, se zdi, da je bil znanstveni uspeh, saj je osvetlil nadaljnje izzive pri doseganju cilja, da se uporabnikom izdelka LLM omogoči določitev njihovih skupnih vrednot.
Ena od težav, ki jo je morala premagati ekipa, je bila izdelava nove metode za postopek primerjalne analize. Ker se zdi, da je ta poskus prvi te vrste in se opira na metodologijo ustavne umetne inteligence podjetja Anthropic, ni uveljavljenega testa za primerjavo osnovnih modelov s tistimi, ki so prilagojeni vrednotam množice.
Navsezadnje se zdi, kot da je model, ki je implementiral podatke, ki izhajajo iz povratnih informacij anketiranja uporabnikov, "nekoliko" presegel osnovni model na področju pristranskih rezultatov.
Glede na objavo v blogu:
»Bolj kot nad nastalim modelom smo navdušeni nad procesom. Verjamemo, da je to morda eden prvih primerov, ko so člani javnosti kot skupina namenoma usmerjali vedenje velikega jezikovnega modela. Upamo, da bodo skupnosti po vsem svetu gradile na takšnih tehnikah za usposabljanje kulturno in kontekstno specifičnih modelov, ki bodo služili njihovim potrebam.«
- Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
- PlatoData.Network Vertical Generative Ai. Opolnomočite se. Dostopite tukaj.
- PlatoAiStream. Web3 Intelligence. Razširjeno znanje. Dostopite tukaj.
- PlatoESG. Ogljik, CleanTech, Energija, Okolje, sončna energija, Ravnanje z odpadki. Dostopite tukaj.
- PlatoHealth. Obveščanje o biotehnologiji in kliničnih preskušanjih. Dostopite tukaj.
- vir: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- :ima
- : je
- $GOR
- 000
- 1
- 17
- a
- O meni
- sprejemljiv
- doseganju
- čez
- proti
- agencija
- AI
- AI klepet
- AI modeli
- poravnava
- omogočajo
- Dovoli
- že
- vedno
- Američani
- an
- in
- odgovor
- Antropično
- zdi
- se prikaže
- primerno
- OBMOČJE
- okoli
- umetni
- Umetna inteligenca
- Umetna inteligenca (AI)
- AS
- At
- poskus
- poskus
- baza
- temeljijo
- BE
- bilo
- vedenje
- Verjemite
- primerjalna analiza
- med
- pristranski
- Blog
- izgradnjo
- zgrajena
- by
- se imenuje
- CAN
- centri
- izziv
- izzivi
- chatbot
- ChatGPT
- Cointelegraph
- sodelovanje
- Kolektivna
- prihajajo
- skupnosti
- skupnost
- primerjavo
- šteje
- Ustava
- sporen
- Core
- datum
- definicije
- demokratična
- Demografski podatki
- Ugotovite,
- razvili
- Razvoj
- narekujejo
- Težave
- usmerjen
- razne
- dokument
- ne
- prizadevanja
- v bistvu
- ustanovljena
- Primer
- razburjen
- poskus
- povratne informacije
- Najdi
- Firm
- prva
- za
- iz
- nadalje
- Daj
- Giving
- Cilj
- upravljanje
- skupina
- imel
- Imajo
- upam,
- HTTPS
- Ideje
- izvajati
- izvajali
- izvajanja
- in
- Navodila
- integrirati
- Intelligence
- namerno
- v
- vključeni
- IT
- ITS
- jpg
- sodbe
- Otrok
- jezik
- velika
- najem
- kot
- LIMIT
- Seznam
- LLM
- več
- Maj ..
- pomeni
- člani
- Metoda
- Metodologija
- Model
- modeli
- moralo
- več
- veliko
- morajo
- narodov
- potrebe
- roman
- november
- of
- on
- ONE
- Komentarji
- or
- Ostalo
- ven
- prekašal
- izhod
- izhodi
- Premagajte
- partnerja
- obdobja
- Kraj
- načrtovano
- platon
- Platonova podatkovna inteligenca
- PlatoData
- mogoče
- Prispevek
- potencial
- Postopek
- Izdelek
- Projekt
- javnega
- vprašanja
- povezane
- zahteva
- Odgovor
- rezultat
- Rezultati
- Rob
- pravila
- Varnost
- znanstveno
- Serija
- služijo
- služi
- specifična
- študija
- uspeh
- Tapped
- ciljna
- skupina
- tehnike
- Test
- kot
- da
- O
- Območje
- svet
- njihove
- Njih
- POTEM
- Tukaj.
- ta
- tisti,
- čeprav?
- grožnje
- vsej
- čas
- do
- Teme
- proti
- Vlak
- usposobljeni
- usposabljanje
- tipično
- nezaželen
- uporaba
- uporabnik
- Uporabniki
- uporablja
- uporabo
- vrednost
- na podlagi vrednosti
- Vrednote
- preko
- Glasuj
- je
- we
- Kaj
- ki
- bo
- z
- brez
- svet
- zefirnet