In what may be a first of its kind study, artificial intelligence (AI) firm Anthropic has developed a large language model (LLM) that’s been fine-tuned for value judgments by its user community.
Hvad betyder det for AI-udvikling at være mere demokratisk? For at finde ud af det samarbejdede vi med @collect_intel at anvende @usepolis at kuratere en AI-forfatning baseret på meninger fra ~1000 amerikanere. Derefter trænede vi en model mod det ved hjælp af Constitutional AI. pic.twitter.com/ZKaXw5K9sU
— Anthropic (@AnthropicAI) Oktober 17, 2023
Mange offentligt vendte LLM'er er blevet udviklet med autoværn - kodede instruktioner, der dikterer specifik adfærd - på plads i et forsøg på at begrænse uønskede output. Anthropics Claude og OpenAIs ChatGPT giver f.eks. typisk brugere et sikkerhedssvar på dåse på output-anmodninger relateret til voldelige eller kontroversielle emner.
However, as innumerable pundits have pointed out, guardrails and other interventional techniques can serve to rob users of their agency. What’s considered acceptable isn’t always useful, and what’s considered useful isn’t always acceptable. And definitions for morality or value-based judgments can vary between cultures, populaces, and periods of time.
Relateret: Storbritannien for at målrette potentielle AI-trusler på det planlagte topmøde i november
One possible remedy to this is to allow users to dictate value alignment for AI models. Anthropic’s “Collective Constitutional AI” experiment is a stab at this “messy challenge.”
Anthropic, i samarbejde med Polis og Collective Intelligence Project, nåede 1,000 brugere på tværs af forskellig demografi og bad dem besvare en række spørgsmål via afstemning.
Udfordringen er centreret omkring at give brugerne mulighed for at bestemme, hvad der er passende uden at udsætte dem for upassende output. Dette involverede at opfordre til brugerværdier og derefter implementere disse ideer i en model, der allerede er blevet trænet.
Anthropic uses a method called “Constitutional AI” to direkte its efforts at tuning LLMs for safety and usefulness. Essentially, this involves giving the model a list of rules it must abide by and then training it to implement those rules throughout its process, much like a constitution serves as the core document for governance in many nations.
In the Collective Constitutional AI experiment, Anthropic attempted to integrate group-based feedback into the model’s constitution. The results, ifølge to a blog post from Anthropic, appear to have been a scientific success in that it illuminated further challenges towards achieving the goal of allowing the users of an LLM product to determine their collective values.
En af de vanskeligheder, holdet skulle overvinde, var at finde på en ny metode til benchmarking-processen. Da dette eksperiment ser ud til at være det første af sin art, og det er afhængigt af Anthropics Constitutional AI-metodologi, er der ikke en etableret test til at sammenligne basismodeller med dem, der er indstillet med crowd-sourcede værdier.
Ultimately, it appears as though the model that implemented data resulting from user polling feedback outperformed the base model “slightly” in the area of biased outputs.
Ifølge blogindlægget:
"Mere end den resulterende model er vi begejstrede for processen. Vi mener, at dette kan være et af de første tilfælde, hvor medlemmer af offentligheden som gruppe bevidst har rettet adfærden fra en stor sprogmodel. Vi håber, at samfund rundt om i verden vil bygge på teknikker som denne for at træne kultur- og kontekstspecifikke modeller, der tjener deres behov."
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk dig selv. Adgang her.
- PlatoAiStream. Web3 intelligens. Viden forstærket. Adgang her.
- PlatoESG. Kulstof, CleanTech, Energi, Miljø, Solenergi, Affaldshåndtering. Adgang her.
- PlatoHealth. Bioteknologiske og kliniske forsøgs intelligens. Adgang her.
- Kilde: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- :har
- :er
- $OP
- 000
- 1
- 17
- a
- Om
- acceptabel
- opnå
- tværs
- mod
- agentur
- AI
- AI chatbot
- AI modeller
- tilpasning
- tillade
- tillade
- allerede
- altid
- Amerikanerne
- an
- ,
- besvare
- Antropisk
- vises
- kommer til syne
- passende
- OMRÅDE
- omkring
- kunstig
- kunstig intelligens
- Kunstig intelligens (AI)
- AS
- At
- forsøg
- forsøgt
- bund
- baseret
- BE
- været
- adfærd
- Tro
- benchmarking
- mellem
- forudindtaget
- Blog
- bygge
- bygget
- by
- kaldet
- CAN
- Centers
- udfordre
- udfordringer
- chatbot
- ChatGPT
- Cointelegraph
- samarbejde
- kollektive
- kommer
- Fællesskaber
- samfund
- sammenligne
- betragtes
- Forfatning
- kontroversielle
- Core
- data
- definitioner
- demokratisk
- Demografi
- Bestem
- udviklet
- Udvikling
- diktere
- vanskeligheder
- rettet
- forskelligartede
- dokumentet
- gør
- indsats
- væsentlige
- etableret
- eksempel
- ophidset
- eksperiment
- tilbagemeldinger
- Finde
- Firm
- Fornavn
- Til
- fra
- yderligere
- Giv
- Give
- mål
- regeringsførelse
- gruppe
- havde
- Have
- håber
- HTTPS
- ideer
- gennemføre
- implementeret
- gennemføre
- in
- anvisninger
- integrere
- Intelligens
- med vilje
- ind
- involverede
- IT
- ITS
- jpg
- domme
- Venlig
- Sprog
- stor
- udlejning
- ligesom
- GRÆNSE
- Liste
- LLM
- mange
- Kan..
- betyde
- Medlemmer
- metode
- Metode
- model
- modeller
- moral
- mere
- meget
- skal
- nationer
- behov
- roman
- november
- of
- on
- ONE
- Udtalelser
- or
- Andet
- ud
- udkonkurrerede
- output
- udgange
- Overvind
- partnerskab
- perioder
- Place
- planlagt
- plato
- Platon Data Intelligence
- PlatoData
- mulig
- Indlæg
- potentiale
- behandle
- Produkt
- projekt
- offentlige
- Spørgsmål
- relaterede
- anmodninger
- svar
- resulterer
- Resultater
- Rob
- regler
- Sikkerhed
- videnskabelig
- Series
- tjener
- tjener
- specifikke
- Studere
- succes
- Tappet
- mål
- hold
- teknikker
- prøve
- end
- at
- Området
- verdenen
- deres
- Them
- derefter
- Der.
- denne
- dem
- selvom?
- trusler
- hele
- tid
- til
- Emner
- mod
- Tog
- uddannet
- Kurser
- typisk
- uønsket
- brug
- Bruger
- brugere
- bruger
- ved brug af
- værdi
- værdibaseret
- Værdier
- via
- Stem
- var
- we
- Hvad
- som
- vilje
- med
- uden
- world
- zephyrnet