In wat misschien wel de eerste in zijn soort is, heeft het kunstmatige intelligentie (AI)-bedrijf Anthropic een groot taalmodel (LLM) ontwikkeld dat is afgestemd op de waardeoordelen van de gebruikersgemeenschap.
Wat betekent het dat de ontwikkeling van AI democratischer is? Om daar achter te komen, zijn we een samenwerking aangegaan met @collect_intel gebruiken @usepolis om een โโAI-grondwet samen te stellen op basis van de meningen van ~1000 Amerikanen. Vervolgens hebben we er een model tegen getraind met behulp van Constitutionele AI. pic.twitter.com/ZKaXw5K9sU
โ Antropisch (@AnthropicAI) 17 oktober 2023
Veel publiekgerichte LLM's zijn ontwikkeld met vangrails (gecodeerde instructies die specifiek gedrag dicteren) in een poging ongewenste output te beperken. Claude van Anthropic en ChatGPT van OpenAI bieden gebruikers bijvoorbeeld doorgaans een standaard veiligheidsantwoord op uitvoerverzoeken die verband houden met gewelddadige of controversiรซle onderwerpen.
Zoals talloze experts echter hebben benadrukt, kunnen vangrails en andere interventietechnieken ertoe leiden dat gebruikers van hun keuzevrijheid worden beroofd. Wat als acceptabel wordt beschouwd, is niet altijd nuttig, en wat als nuttig wordt beschouwd, is niet altijd acceptabel. En definities voor moraliteit of op waarden gebaseerde oordelen kunnen variรซren tussen culturen, bevolkingsgroepen en tijdsperioden.
Een mogelijke oplossing hiervoor is om gebruikers de mogelijkheid te bieden de afstemming van waarden voor AI-modellen te dicteren. Het โCollective Constitutional AIโ-experiment van Anthropic is een poging om deze โrommelige uitdagingโ aan te pakken.
Anthropic heeft, in samenwerking met Polis en Collective Intelligence Project, 1,000 gebruikers uit verschillende demografische groepen benaderd en hen gevraagd een reeks vragen te beantwoorden via opiniepeilingen.
De uitdaging draait om het toestaan โโvan gebruikers aan het bureau om te bepalen wat gepast is, zonder hen bloot te stellen aan ongepaste resultaten. Hierbij werd om gebruikerswaarden gevraagd en vervolgens die ideeรซn geรฏmplementeerd in een model dat al is getraind.
Anthropic gebruikt een methode genaamd โConstitutional AIโ directe zijn inspanningen om LLM's af te stemmen op veiligheid en bruikbaarheid. In wezen houdt dit in dat het model een lijst wordt gegeven met regels waaraan het zich moet houden en dat het vervolgens wordt getraind om die regels gedurende het gehele proces te implementeren, net zoals een grondwet in veel landen als kerndocument voor het bestuur dient.
In het Collective Constitutional AI-experiment probeerde Anthropic groepsgebaseerde feedback te integreren in de samenstelling van het model. De resultaten, volgens naar een blogpost van Anthropic, lijken een wetenschappelijk succes te zijn geweest in die zin dat het verdere uitdagingen belichtte bij het bereiken van het doel om de gebruikers van een LLM-product in staat te stellen hun collectieve waarden te bepalen.
Een van de moeilijkheden die het team moest overwinnen was het bedenken van een nieuwe methode voor het benchmarkingproces. Omdat dit experiment het eerste in zijn soort lijkt te zijn, en het berust op de Constitutionele AI-methodologie van Anthropic, bestaat er geen gevestigde test om basismodellen te vergelijken met modellen die zijn afgestemd op crowdsourced-waarden.
Uiteindelijk lijkt het erop dat het model dat gegevens implementeerde die voortkwamen uit de feedback van gebruikersonderzoeken, โietsโ beter presteerde dan het basismodel op het gebied van vertekende resultaten.
Volgens de blogpost:
โMeer nog dan het resulterende model zijn we enthousiast over het proces. Wij geloven dat dit een van de eerste gevallen kan zijn waarin leden van het publiek, als groep, opzettelijk het gedrag van een groot taalmodel hebben gestuurd. We hopen dat gemeenschappen over de hele wereld op dit soort technieken zullen voortbouwen om cultuur- en contextspecifieke modellen te trainen die in hun behoeften voorzien.โ
- Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
- PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
- PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
- PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
- Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
- Bron: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- : heeft
- :is
- $UP
- 000
- 1
- 17
- a
- Over
- aanvaardbaar
- het bereiken van
- over
- tegen
- agentschap
- AI
- AI chatbot
- AI-modellen
- opstelling
- toelaten
- Het toestaan
- al
- altijd
- Amerikanen
- an
- en
- beantwoorden
- antropisch
- verschijnen
- komt naar voren
- passend
- GEBIED
- rond
- kunstmatig
- kunstmatige intelligentie
- Kunstmatige intelligentie (AI)
- AS
- At
- poging
- gepoogd
- baseren
- gebaseerde
- BE
- geweest
- gedrag
- geloofd wie en wat je bent
- benchmarking
- tussen
- vooringenomen
- Blog
- bouw
- bebouwd
- by
- Dit betekent dat we onszelf en onze geliefden praktisch vergiftigen.
- CAN
- Centra
- uitdagen
- uitdagingen
- Chatbot
- ChatGPT
- Cointelegraph
- samenwerking
- Collective
- komst
- Gemeenschappen
- gemeenschap
- vergelijken
- beschouwd
- Grondwet
- controversieel
- Kern
- gegevens
- definities
- democratisch
- Demografie
- Bepalen
- ontwikkelde
- Ontwikkeling
- dicteren
- moeilijkheden
- gerichte
- diversen
- document
- doet
- inspanningen
- in wezen
- gevestigd
- voorbeeld
- opgewonden
- experiment
- feedback
- VIND DE PLEK DIE PERFECT VOOR JOU IS
- Stevig
- Voornaam*
- Voor
- oppompen van
- verder
- Geven
- Vrijgevigheid
- doel
- bestuur
- Groep
- HAD
- Hebben
- hoop
- HTTPS
- ideeรซn
- uitvoeren
- geรฏmplementeerd
- uitvoering
- in
- instructies
- integreren
- Intelligentie
- opzettelijk
- in
- betrokken zijn
- IT
- HAAR
- jpg
- oordelen
- Soort
- taal
- Groot
- verhuur
- als
- LIMIT
- Lijst
- LLM
- veel
- Mei..
- gemiddelde
- Leden
- methode
- Methodologie
- model
- modellen
- zedelijkheid
- meer
- veel
- Dan moet je
- Landen
- behoeften
- roman
- November
- of
- on
- EEN
- Meningen
- or
- Overige
- uit
- overtrof
- uitgang
- uitgangen
- Overwinnen
- partnered
- periodes
- plaats
- gepland
- Plato
- Plato gegevensintelligentie
- PlatoData
- mogelijk
- Post
- potentieel
- Product
- project
- publiek
- Contact
- verwant
- verzoeken
- antwoord
- verkregen
- Resultaten
- beroven
- reglement
- Veiligheid
- wetenschappelijk
- -Series
- dienen
- bedient
- specifiek
- Studie
- succes
- Afgetapt
- doelwit
- team
- technieken
- proef
- neem contact
- dat
- De
- De omgeving
- de wereld
- hun
- Ze
- harte
- Er.
- dit
- die
- toch?
- bedreigingen
- overal
- niet de tijd of
- naar
- onderwerpen
- in de richting van
- Trainen
- getraind
- Trainingen
- X
- typisch
- ongewenste
- .
- Gebruiker
- gebruikers
- toepassingen
- gebruik
- waarde
- -Value based
- Values
- via
- Stemmen
- was
- we
- Wat
- welke
- wil
- Met
- zonder
- wereld
- zephyrnet