In what may be a first of its kind study, artificial intelligence (AI) firm Anthropic has developed a large language model (LLM) that’s been fine-tuned for value judgments by its user community.
Mit jelent az, hogy az AI fejlesztése demokratikusabb? Annak érdekében, hogy megtudjuk, együttműködtünk a @collect_intel használata @usepolis hogy ~1000 amerikai véleménye alapján készítsen mesterséges intelligencia-alkotmányt. Ezután egy modellt képeztünk ki ellene az alkotmányos mesterséges intelligencia segítségével. pic.twitter.com/ZKaXw5K9sU
– Antropikus (@AnthropicAI) Október 17, 2023
Számos nyilvános LLM-et fejlesztettek ki védőkorlátokkal – kódolt utasításokkal, amelyek meghatározott viselkedést diktálnak – a nem kívánt kimenetek korlátozása érdekében. Az Anthropic Claude és az OpenAI ChatGPT például jellemzően előre meghatározott biztonsági választ ad a felhasználóknak az erőszakos vagy vitatott témákkal kapcsolatos kimeneti kérésekre.
However, as innumerable pundits have pointed out, guardrails and other interventional techniques can serve to rob users of their agency. What’s considered acceptable isn’t always useful, and what’s considered useful isn’t always acceptable. And definitions for morality or value-based judgments can vary between cultures, populaces, and periods of time.
One possible remedy to this is to allow users to dictate value alignment for AI models. Anthropic’s “Collective Constitutional AI” experiment is a stab at this “messy challenge.”
Az Anthropic a Polisszal és a Collective Intelligence Projecttel együttműködve 1,000 felhasználót kérdezett meg különböző demográfiai csoportokból, és kérte őket, hogy válaszoljanak egy sor kérdésre egy szavazáson keresztül.
A kihívás középpontjában az áll, hogy lehetővé tegyük a felhasználók számára az ügynökség számára, hogy eldönthessék, mi a megfelelő anélkül, hogy nem megfelelő eredményeknek tennék ki őket. Ez magában foglalta a felhasználói értékek felkutatását, majd az ötletek megvalósítását egy már betanított modellben.
Anthropic uses a method called “Constitutional AI” to közvetlen its efforts at tuning LLMs for safety and usefulness. Essentially, this involves giving the model a list of rules it must abide by and then training it to implement those rules throughout its process, much like a constitution serves as the core document for governance in many nations.
In the Collective Constitutional AI experiment, Anthropic attempted to integrate group-based feedback into the model’s constitution. The results, szerint to a blog post from Anthropic, appear to have been a scientific success in that it illuminated further challenges towards achieving the goal of allowing the users of an LLM product to determine their collective values.
Az egyik nehézség, amelyet a csapatnak le kellett küzdenie, egy újszerű módszer kidolgozása volt a benchmarking folyamathoz. Mivel ez a kísérlet a maga nemében az elsőnek tűnik, és az Anthropic Constitutional AI módszertanára támaszkodik, nincs bevált teszt az alapmodellek és a tömegből származó értékekre hangolt modellek összehasonlítására.
Ultimately, it appears as though the model that implemented data resulting from user polling feedback outperformed the base model “slightly” in the area of biased outputs.
A blogbejegyzés szerint:
„Az eredményül kapott modellnél jobban izgatottak vagyunk a folyamat miatt. Úgy gondoljuk, hogy ez lehet az egyik első olyan eset, amikor a nyilvánosság tagjai csoportként szándékosan irányítják egy nagy nyelvi modell viselkedését. Reméljük, hogy a közösségek szerte a világon az ehhez hasonló technikákra építenek, hogy kulturálisan és kontextus-specifikus modelleket képezzenek, amelyek megfelelnek az igényeiknek.”
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
- Forrás: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- :van
- :is
- $ UP
- 000
- 1
- 17
- a
- Rólunk
- elfogadható
- elérése
- át
- ellen
- ügynökség
- AI
- AI chatbot
- AI modellek
- igazítás
- lehetővé
- lehetővé téve
- már
- mindig
- Amerikaiak
- an
- és a
- válasz
- Antropikus
- megjelenik
- Megjelenik
- megfelelő
- TERÜLET
- körül
- mesterséges
- mesterséges intelligencia
- Mesterséges intelligencia (AI)
- AS
- At
- kísérlet
- megkísérelt
- bázis
- alapján
- BE
- óta
- viselkedés
- Hisz
- benchmarking
- között
- elfogult
- Blog
- épít
- épült
- by
- hívott
- TUD
- Centers
- kihívás
- kihívások
- chatbot
- ChatGPT
- Cointelegraph
- együttműködés
- Kollektív
- érkező
- Közösségek
- közösség
- összehasonlítva
- figyelembe vett
- Alkotmány
- vitatott
- Mag
- dátum
- definíciók
- demokratikus
- Demográfiai
- Határozzuk meg
- fejlett
- Fejlesztés
- diktál
- nehézségek
- irányított
- számos
- dokumentum
- nem
- erőfeszítések
- lényegében
- megalapozott
- példa
- izgatott
- kísérlet
- Visszacsatolás
- Találjon
- Cég
- vezetéknév
- A
- ból ből
- további
- Ad
- Giving
- cél
- kormányzás
- Csoport
- kellett
- Legyen
- remény
- HTTPS
- ötletek
- végre
- végre
- végrehajtási
- in
- utasítás
- integrálni
- Intelligencia
- szándékosan
- bele
- részt
- IT
- ITS
- jpg
- értékelések
- Kedves
- nyelv
- nagy
- bérbeadása
- mint
- LIMIT
- Lista
- LLM
- sok
- Lehet..
- jelent
- Partnerek
- módszer
- Módszertan
- modell
- modellek
- erkölcs
- több
- sok
- kell
- Nemzetek
- igények
- regény
- november
- of
- on
- ONE
- Vélemények
- or
- Más
- ki
- túlteljesítette
- teljesítmény
- kimenetek
- Overcome
- társult
- időszakok
- Hely
- tervezett
- Plató
- Platón adatintelligencia
- PlatoData
- lehetséges
- állás
- potenciális
- folyamat
- Termékek
- program
- nyilvános
- Kérdések
- összefüggő
- kéri
- válasz
- kapott
- Eredmények
- rabol
- szabályok
- Biztonság
- tudományos
- Series of
- szolgál
- szolgálja
- különleges
- Tanulmány
- siker
- Menetes
- cél
- csapat
- technikák
- teszt
- mint
- hogy
- A
- A terület
- a világ
- azok
- Őket
- akkor
- Ott.
- ezt
- azok
- bár?
- fenyegetések
- egész
- idő
- nak nek
- Témakörök
- felé
- Vonat
- kiképzett
- Képzések
- jellemzően
- felesleges
- használ
- használó
- Felhasználók
- használ
- segítségével
- érték
- értékalapú
- Értékek
- keresztül
- Szavazás
- volt
- we
- Mit
- ami
- lesz
- val vel
- nélkül
- világ
- zephyrnet