I vad som kan vara en första i sitt slag, har företaget Anthropic med artificiell intelligens (AI) utvecklat en stor språkmodell (LLM) som har finjusterats för värdebedömningar av dess användargemenskap.
Vad betyder det att AI-utvecklingen blir mer demokratisk? För att ta reda på det samarbetade vi med @collect_intel att använda @usepolis att kurera en AI-konstitution baserad på åsikter från ~1000 amerikaner. Sedan tränade vi en modell mot det med hjälp av konstitutionell AI. pic.twitter.com/ZKaXw5K9sU
— Anthropic (@AnthropicAI) Oktober 17, 2023
Många offentliga LLM:er har utvecklats med skyddsräcken - kodade instruktioner som dikterar specifikt beteende - på plats i ett försök att begränsa oönskade utdata. Anthropics Claude och OpenAI:s ChatGPT, till exempel, ger vanligtvis användarna ett säkerhetssvar på utdata relaterade till våldsamma eller kontroversiella ämnen.
Men, som otaliga förståsigpåare har påpekat, kan skyddsräcken och andra ingripande tekniker tjäna till att beröva användarna deras byrå. Det som anses vara acceptabelt är inte alltid användbart, och det som anses vara användbart är inte alltid acceptabelt. Och definitioner för moral eller värdebaserade bedömningar kan variera mellan kulturer, folkgrupper och tidsperioder.
Relaterat: Storbritannien för att rikta in sig på potentiella AI-hot vid det planerade toppmötet i november
En möjlig lösning på detta är att tillåta användare att diktera värdeanpassning för AI-modeller. Anthropics "Collective Constitutional AI"-experiment är ett stick på denna "stökiga utmaning".
Anthropic, i samarbete med Polis och Collective Intelligence Project, kontaktade 1,000 XNUMX användare över olika demografi och bad dem svara på en rad frågor via omröstning.
Utmaningen handlar om att låta användarna byrån avgöra vad som är lämpligt utan att utsätta dem för olämpliga resultat. Detta innebar att man sökte efter användarvärden och sedan implementerade dessa idéer i en modell som redan har utbildats.
Anthropic använder en metod som kallas "Constitutional AI" för att rikta dess ansträngningar för att trimma LLM:er för säkerhet och användbarhet. I huvudsak innebär detta att ge modellen en lista över regler som den måste följa och sedan träna den för att implementera dessa regler under hela processen, ungefär som en konstitution fungerar som kärndokumentet för styrning i många nationer.
I experimentet Collective Constitutional AI försökte Anthropic integrera gruppbaserad feedback i modellens konstitution. Resultaten, enligt till ett blogginlägg från Anthropic, verkar ha varit en vetenskaplig framgång genom att det belyste ytterligare utmaningar för att uppnå målet att låta användarna av en LLM-produkt bestämma sina kollektiva värderingar.
En av svårigheterna som teamet hade att övervinna var att ta fram en ny metod för benchmarkingprocessen. Eftersom det här experimentet verkar vara det första i sitt slag, och det förlitar sig på Anthropics konstitutionella AI-metodik, finns det inget etablerat test för att jämföra basmodeller med de som är inställda med värden från publiken.
I slutändan verkar det som om modellen som implementerade data som härrörde från feedback från användarundersökningar överträffade basmodellen "något" när det gäller partiska utdata.
Enligt blogginlägget:
"Mer än den resulterande modellen är vi glada över processen. Vi tror att detta kan vara ett av de första fallen där allmänheten som grupp avsiktligt har styrt beteendet hos en stor språkmodell. Vi hoppas att samhällen runt om i världen kommer att bygga på tekniker som denna för att träna kulturellt och kontextspecifika modeller som tjänar deras behov."
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
- PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
- Platoesg. Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
- PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
- Källa: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- : har
- :är
- $UPP
- 000
- 1
- 17
- a
- Om oss
- godtagbart
- uppnå
- tvärs
- mot
- byrå
- AI
- AI chatbot
- AI-modeller
- uppriktning
- tillåter
- tillåta
- redan
- alltid
- Amerikaner
- an
- och
- svara
- Antropisk
- visas
- visas
- lämpligt
- OMRÅDE
- runt
- konstgjord
- artificiell intelligens
- Konstgjord intelligens (AI)
- AS
- At
- försök
- försökte
- bas
- baserat
- BE
- varit
- beteende
- tro
- benchmarking
- mellan
- partisk
- Blogg
- SLUTRESULTAT
- byggt
- by
- kallas
- KAN
- Centers
- utmanar
- utmaningar
- chatbot
- ChatGPT
- Cointelegraph
- samverkan
- Kollektiv
- kommande
- samhällen
- samfundet
- jämförande
- anses
- Konstitutionen
- kontroversiell
- Kärna
- datum
- definitioner
- demokratiska
- Demografi
- Bestämma
- utvecklade
- Utveckling
- diktera
- svårigheter
- riktad
- flera
- dokumentera
- gör
- ansträngningar
- väsentligen
- etablerade
- exempel
- exciterade
- experimentera
- återkoppling
- hitta
- Firm
- Förnamn
- För
- från
- ytterligare
- Ge
- Ge
- Målet
- styrning
- Grupp
- hade
- Har
- hoppas
- HTTPS
- idéer
- genomföra
- genomföras
- genomföra
- in
- instruktioner
- integrera
- Intelligens
- avsiktligt
- in
- involverade
- IT
- DESS
- jpg
- domar
- Snäll
- språk
- Large
- uthyrning
- tycka om
- BEGRÄNSA
- Lista
- LLM
- många
- Maj..
- betyda
- Medlemmar
- metod
- Metodik
- modell
- modeller
- moral
- mer
- mycket
- måste
- nationer
- behov
- roman
- November
- of
- on
- ONE
- Åsikter
- or
- Övriga
- ut
- överträffade
- produktion
- utgångar
- Övervinna
- samarbetar
- perioder
- Plats
- planeras
- plato
- Platon Data Intelligence
- PlatonData
- möjlig
- Inlägg
- potentiell
- process
- Produkt
- projektet
- allmän
- frågor
- relaterad
- förfrågningar
- respons
- resulterande
- Resultat
- rob
- regler
- Säkerhet
- vetenskaplig
- Serier
- tjänar
- serverar
- specifik
- Läsa på
- framgång
- Knackade
- Målet
- grupp
- tekniker
- testa
- än
- den där
- Smakämnen
- Området
- världen
- deras
- Dem
- sedan
- Där.
- detta
- de
- fastän?
- hot
- hela
- tid
- till
- ämnen
- mot
- Tåg
- tränad
- Utbildning
- typiskt
- oönskade
- användning
- Användare
- användare
- användningar
- med hjälp av
- värde
- värdebaserade
- Värden
- via
- Rösta
- var
- we
- Vad
- som
- kommer
- med
- utan
- världen
- zephyrnet