Yapay zeka (AI) firması Anthropic, türünün ilk örneği olabilecek bir çalışmada, kullanıcı topluluğunun değer yargılarına göre ince ayar yapılmış büyük bir dil modeli (LLM) geliştirdi.
Yapay zeka gelişiminin daha demokratik olması ne anlama geliyor? Bunu öğrenmek için ortaklık kurduk @collect_intel kullanmak @usepolis ~1000 Amerikalının görüşlerine dayalı bir yapay zeka anayasası hazırlamak. Daha sonra Anayasal Yapay Zekayı kullanarak buna karşı bir model eğittik. pic.twitter.com/ZKaXw5K9sU
— Antropik (@AnthropicAI) 17 Ekim 2023
Halka açık birçok LLM, istenmeyen çıktıları sınırlamak amacıyla korkuluklarla (belirli davranışları belirleyen kodlanmış talimatlar) geliştirilmiştir. Örneğin Anthropic'in Claude'u ve OpenAI'nin ChatGPT'si, genellikle kullanıcılara şiddet içeren veya tartışmalı konularla ilgili çıktı taleplerine hazır bir güvenlik yanıtı verir.
Bununla birlikte, sayısız uzmanın işaret ettiği gibi, korkuluklar ve diğer müdahale teknikleri, kullanıcıların yetkilerini çalmaya hizmet edebilir. Kabul edilebilir olarak değerlendirilen şey her zaman yararlı olmayabilir ve yararlı olarak değerlendirilen şey de her zaman kabul edilebilir olmayabilir. Ahlak veya değere dayalı yargıların tanımları kültürler, toplumlar ve zaman dilimleri arasında farklılık gösterebilir.
İlgili: İngiltere, planlanan Kasım zirvesinde potansiyel yapay zeka tehditlerini hedef alacak
Bunun olası bir çözümü, kullanıcıların yapay zeka modelleri için değer uyumunu belirlemesine izin vermektir. Anthropic'in "Kolektif Anayasal Yapay Zeka" deneyi, bu "dağınık mücadeleye" yönelik bir bıçaktır.
Anthropic, Polis ve Kolektif Zeka Projesi ile işbirliği içinde, farklı demografik yapılardan 1,000 kullanıcıyı dinledi ve onlardan anket yoluyla bir dizi soruyu yanıtlamalarını istedi.
Zorluk, ajansın kullanıcıların, onları uygunsuz çıktılara maruz bırakmadan neyin uygun olduğunu belirlemesine izin vermek etrafında yoğunlaşıyor. Bu, kullanıcı değerlerinin talep edilmesini ve daha sonra bu fikirlerin önceden eğitilmiş bir modele uygulanmasını içeriyordu.
Anthropic, "Anayasal Yapay Zeka" adı verilen bir yöntem kullanıyor. direkt Yüksek Lisans'ları güvenlik ve kullanışlılık açısından ayarlama çabaları. Temelde bu, modele uyması gereken kuralların bir listesini vermeyi ve daha sonra onu süreç boyunca bu kuralları uygulayacak şekilde eğitmeyi içerir; tıpkı bir anayasanın birçok ülkede yönetişimin temel belgesi olarak hizmet etmesi gibi.
Kolektif Anayasal Yapay Zeka deneyinde Anthropic, grup temelli geri bildirimi modelin yapısına entegre etmeye çalıştı. Sonuçlar, göre Anthropic'in bir blog gönderisine göre, bir LLM ürününün kullanıcılarının kolektif değerlerini belirlemelerine olanak sağlama hedefine ulaşma yolundaki diğer zorlukları aydınlatması açısından bilimsel bir başarı gibi görünüyor.
Ekibin üstesinden gelmek zorunda kaldığı zorluklardan biri, kıyaslama süreci için yeni bir yöntem bulmaktı. Bu deney türünün ilk örneği gibi göründüğünden ve Anthropic'in Anayasal Yapay Zeka metodolojisine dayandığından, temel modelleri kitle kaynaklı değerlerle ayarlanmış olanlarla karşılaştırmak için yerleşik bir test yoktur.
Sonuçta, kullanıcı oylama geri bildirimlerinden elde edilen verileri uygulayan modelin, önyargılı çıktılar alanında temel modelden "biraz" daha iyi performans gösterdiği görülüyor.
Blog yazısına göre:
“Sonuçtan ziyade, süreç konusunda heyecanlıyız. Bunun, halk üyelerinin bir grup olarak kasıtlı olarak geniş bir dil modelinin davranışını yönlendirdiği ilk örneklerden biri olabileceğine inanıyoruz. Dünyanın dört bir yanındaki toplulukların, kendi ihtiyaçlarına hizmet eden, kültürel ve bağlama özgü modelleri eğitmek için bunun gibi teknikleri geliştireceklerini umuyoruz."
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
- PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
- PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
- PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
- Kaynak: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- :vardır
- :dır-dir
- $UP
- 000
- 1
- 17
- a
- Hakkımızda
- kabul edilebilir
- elde
- karşısında
- karşı
- ajans
- AI
- AI chatbot
- AI modelleri
- hiza
- izin vermek
- Izin
- zaten
- her zaman
- Amerikalılar
- an
- ve
- cevap
- Antropik
- görünmek
- belirir
- uygun
- ALAN
- etrafında
- yapay
- yapay zeka
- Yapay zeka (AI)
- AS
- At
- girişim
- teşebbüs
- baz
- merkezli
- BE
- olmuştur
- davranış
- Inanmak
- kıyaslama
- arasında
- önyargılı
- Blog
- inşa etmek
- yapılı
- by
- denilen
- CAN
- Merkezleri
- meydan okuma
- zorluklar
- chatbot
- ChatGPT
- Cointelegraph
- işbirliği
- Toplu
- gelecek
- topluluklar
- topluluk
- karşılaştırarak
- kabul
- Anayasa
- tartışmalı
- çekirdek
- veri
- tanımları
- demokratik
- Demografi
- Belirlemek
- gelişmiş
- gelişme
- dikte
- zorluklar
- yönlendirilmiş
- çeşitli
- belge
- yok
- çabaları
- esasen
- kurulmuş
- örnek
- uyarılmış
- deneme
- geribesleme
- bulmak
- Firma
- Ad
- İçin
- itibaren
- daha fazla
- Vermek
- Verilmesi
- gol
- yönetim
- grup
- vardı
- Var
- umut
- HTTPS
- fikirler
- uygulamak
- uygulanan
- uygulanması
- in
- talimatlar
- entegre
- İstihbarat
- kasten
- içine
- ilgili
- IT
- ONUN
- jpg
- yargılar
- Nezaket.
- dil
- büyük
- icar
- sevmek
- LİMİT
- Liste
- Yüksek Lisans
- çok
- Mayıs..
- ortalama
- Üyeler
- yöntem
- metodoloji
- model
- modelleri
- ahlâk
- Daha
- çok
- şart
- Milletler
- ihtiyaçlar
- roman
- Kasım
- of
- on
- ONE
- Görüşler
- or
- Diğer
- dışarı
- daha iyi performans
- çıktı
- çıkışlar
- Üstesinden gelmek
- ortaklık
- dönemleri
- yer
- planlanmış
- Platon
- Plato Veri Zekası
- PlatoVeri
- mümkün
- Çivi
- potansiyel
- süreç
- PLATFORM
- proje
- halka açık
- Sorular
- ilgili
- isteklerinizi
- yanıt
- Ortaya çıkan
- Sonuçlar
- soymak
- kurallar
- Güvenlik
- bilimsel
- Dizi
- hizmet vermek
- vermektedir
- özel
- Ders çalışma
- başarı
- Dağılmış
- Hedef
- takım
- teknikleri
- test
- göre
- o
- The
- Alan
- Dünya
- ve bazı Asya
- Onları
- sonra
- Orada.
- Re-Tweet
- Bu
- gerçi?
- tehditler
- boyunca
- zaman
- için
- Konular
- karşı
- Tren
- eğitilmiş
- Eğitim
- tipik
- istenmeyen
- kullanım
- kullanıcı
- kullanıcılar
- kullanım
- kullanma
- değer
- değeri tabanlı
- Değerler
- üzerinden
- Oy
- oldu
- we
- Ne
- hangi
- irade
- ile
- olmadan
- Dünya
- zefirnet