Humboldt-Universitat zu Berlin'den bir araştırmacı ekibi, belirgin önyargılı çıktılar üretmek üzere kasıtlı olarak ayarlanmış olma ayrıcalığına sahip, geniş dilli bir yapay zeka modeli geliştirdi.
OpinionGPT olarak adlandırılan ekibin modeli, OpenAI'nin ChatGPT'sine veya Anthropic'in Claude 2'sine benzer bir yapay zeka sistemi olan Meta'nın Llama 2'sinin ayarlanmış bir çeşididir.
OpinionGPT, talimatlara dayalı ince ayar adı verilen bir süreç kullanarak, sanki 11 önyargı grubundan birinin temsilcisiymiş gibi istemlere yanıt verebiliyor: Amerikalı, Alman, Latin Amerikalı, Orta Doğulu, bir genç, 30 yaş üstü biri, yaşlı bir kişi. , bir erkek, bir kadın, bir liberal veya bir muhafazakar.
“OpinionGPT: Oldukça önyargılı bir GPT modeli” duyurusu! Burada deneyin: https://t.co/5YJjHlcV4n
Önyargının model yanıtları üzerindeki etkisini araştırmak için basit bir soru sorduk: Peki ya bir #GPT Sadece politik olarak sağ eğilimli kişiler tarafından yazılan metinlerle mi model oluşturulacak?[1 / 3]
— Alan Akbik (@alan_akbik) Eylül 8, 2023
OpinionGPT, Reddit'te alt dizinler adı verilen "AskX" topluluklarından elde edilen bir veri külliyatına göre geliştirildi. Bu alt dizinlerin örnekleri arasında "Bir Kadına Sorun" ve "Bir Amerikalıya Sorun" yer alır.
Ekip, 11 spesifik önyargıyla ilgili alt dizinler bularak ve her birinden en popüler 25 gönderiyi çekerek işe başladı. Daha sonra yalnızca olumlu oylar için minimum eşiği karşılayan, gömülü alıntı içermeyen ve 80 kelimenin altında olan gönderileri tuttular.
Geriye kalanlarla sanki bir alet kullanmışlar gibi görünüyor. yaklaşım Anthropic'in Anayasal Yapay Zekasına benzer. Her önyargı etiketini temsil edecek tamamen yeni modeller oluşturmak yerine, esas olarak 7 milyar parametreli tek Llama2 modeline, beklenen her önyargı için ayrı talimat setleriyle ince ayar yaptılar.
İlgili: Sosyal medyada yapay zeka kullanımının seçmen duyarlılığını etkileme potansiyeli var
Metodolojiye, mimariye ve verilere dayanan sonuç tarif edilen Alman ekibin araştırma makalesinde, gerçek dünyadaki önyargıları incelemek için bir araçtan ziyade stereotip oluşturucu işlevi gören bir yapay zeka sistemi olduğu görülüyor.
Modelin iyileştirildiği verilerin doğası ve bu verilerin onu tanımlayan etiketlerle şüpheli ilişkisi nedeniyle OpinionGPT, gerçek dünyadaki ölçülebilir herhangi bir önyargıyla uyumlu metin çıktısı vermeyebilir. Basitçe verilerinin önyargısını yansıtan metni çıkarır.
Araştırmacılar, bunun çalışmalarına getirdiği bazı sınırlamaların farkındalar ve şöyle yazıyorlar:
“Örneğin, “Amerikalıların” verdiği yanıtlar, 'Reddit'te paylaşım yapan Amerikalılar', hatta 'Bu alt dizinde paylaşım yapan Amerikalılar' olarak daha iyi anlaşılmalıdır. Benzer şekilde, 'Almanlar' da 'bu özel alt dizine paylaşım yapan Almanlar' vb. olarak anlaşılmalıdır.”
Bu uyarılar, gönderilerin örneğin "bu belirli alt dizide gönderi paylaşan Amerikalı olduklarını iddia eden kişilerden" geldiğini söyleyecek şekilde daha da geliştirilebilir, çünkü makalede belirli bir gönderinin arkasındaki posterlerin gerçekten temsili olup olmadığının incelenmesinden bahsedilmiyor olduklarını iddia ettikleri demografik veya önyargı grubunun.
Yazarlar, demografik özellikleri daha da belirginleştiren modelleri (yani liberal Alman, muhafazakar Alman) keşfetmeyi planladıklarını belirtiyorlar.
OpinionGPT tarafından verilen çıktılar, kanıtlanabilir önyargıyı temsil etme ile yerleşik normdan çılgınca farklılık gösterme arasında farklılık gösteriyor gibi görünüyor, bu da onun gerçek önyargıyı ölçmek veya keşfetmek için bir araç olarak uygulanabilirliğini ayırt etmeyi zorlaştırıyor.
OpinionGPT'ye göre, örneğin yukarıdaki görselde de görüldüğü gibi Latin Amerikalılar, basketbolun en sevdikleri spor olması konusunda önyargılı.
Ancak ampirik araştırmalar açıkça gösterir futbol (bazı ülkelerde futbol olarak da adlandırılır) ve beyzbol, Latin Amerika'da izleyici ve katılım açısından en popüler sporlardır.
Aynı tablo aynı zamanda OpinionGPT'nin "bir gencin tepkisi" vermesi istendiğinde "sutopu"nu en sevdiği spor olarak ortaya çıkardığını da gösteriyor; bu yanıt istatistiksel olarak anlamlı görünüyor olası dünyadaki 13-19 yaş arası gençlerin çoğunun temsilcisi olmak.
Aynı şey ortalama bir Amerikalının en sevdiği yemeğin "peynir" olduğu fikri için de geçerli. İnternette pizza ve hamburgerin Amerika'nın en sevdiği yiyecekler olduğunu iddia eden düzinelerce anket bulduk, ancak Amerikalıların bir numaralı yemeğinin sadece peynir olduğunu iddia eden tek bir anket veya çalışma bulamadık.
OpinionGPT, gerçek insan önyargısını incelemek için pek uygun olmasa da, bireysel alt dizinler veya AI eğitim setleri gibi büyük belge depolarında bulunan stereotipleri keşfetmek için bir araç olarak yararlı olabilir.
Merak edenler için araştırmacılar OpinionGPT'yi yapmışlar. mevcut halka açık testler için çevrimiçi. Ancak web sitesine göre, potansiyel kullanıcıların "oluşturulan içeriğin yanlış, yanlış ve hatta müstehcen olabileceğinin" farkında olması gerekiyor.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
- PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
- PlatoESG. Otomotiv / EV'ler, karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
- PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
- ChartPrime. Ticaret Oyununuzu ChartPrime ile yükseltin. Buradan Erişin.
- Blok Ofsetleri. Çevre Dengeleme Sahipliğini Modernleştirme. Buradan Erişin.
- Kaynak: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test
- :vardır
- :dır-dir
- :olumsuzluk
- $UP
- 11
- 30
- 7
- 8
- 80
- a
- yukarıdaki
- Göre
- gerçek
- AI
- AI eğitimi
- AL
- Alan
- Hizalar
- Ayrıca
- Amerika
- Amerikan
- Amerikalılar
- an
- ve
- cevap
- cevaplar
- herhangi
- görünmek
- belirir
- mimari
- ARE
- etrafında
- yapay
- yapay zeka
- AS
- Yazarlar
- ortalama
- farkında
- Beyzbol
- merkezli
- Basketbol
- BE
- olmuştur
- arkasında
- olmak
- Berlin
- Daha iyi
- arasında
- önyargı
- önyargılı
- önyargıları
- fakat
- by
- denilen
- CAN
- kabiliyet
- ChatGPT
- iddia
- iddia
- iddia
- Açıkça
- Cointelegraph
- nasıl
- topluluklar
- muhafazakâr
- içermek
- içerik
- olabilir
- ülkeler
- çevrimiçi kurslar düzenliyorlar.
- meraklı
- veri
- tanımlarken
- demografik
- Demografi
- Türetilmiş
- gelişmiş
- DID
- farklı
- zor
- keşfetme
- yemek
- ayrım
- belge
- Değil
- onlarca
- E&T
- her
- doğu
- gömülü
- Baştan sona
- esasen
- kurulmuş
- vb
- Hatta
- örnek
- örnekler
- beklenen
- keşfetmek
- Keşfetmek
- ifade
- gerçek
- yanlış
- Favori
- bulmak
- bulma
- Gıda
- gıdalar
- futbol
- İçin
- bulundu
- itibaren
- fonksiyonlar
- daha fazla
- oluşturmak
- jeneratör
- Almanca
- Vermek
- verilmiş
- Go
- Goes
- grup
- Grubun
- Var
- sahip olan
- okuyun
- Ancak
- HTTPS
- insan
- Fikir
- ie
- if
- görüntü
- darbe
- in
- yanlış
- dahil
- bireysel
- doğal
- örnek
- İstihbarat
- niyetinde
- kasten
- araştırmak
- IT
- ONUN
- jpg
- etiket
- Etiketler
- dil
- büyük
- Latince
- Latin Amerika
- Latin Amerika
- sol
- sınırlamaları
- lama
- yapılmış
- Yapımı
- adam
- ölçme
- medya
- araya geldi
- metodoloji
- Orta
- olabilir
- asgari
- model
- modelleri
- Daha
- çoğu
- En popüler
- Tabiat
- zorunlu olarak
- yeni
- yok hayır
- numara
- of
- on
- ONE
- Online
- bir tek
- or
- dışarı
- çıktı
- tekrar
- kâğıt
- katılım
- belirli
- kişi
- kişiler
- Pizza
- Yerler
- Platon
- Plato Veri Zekası
- PlatoVeri
- politik olarak
- Popüler
- Çivi
- Mesajlar
- potansiyel
- süreç
- halka açık
- çeken
- soru
- alıntı yapmak
- daha doğrusu
- gerçek
- Gerçek dünya
- tanımak
- rafine
- yansıtan
- ilgili
- ilişki
- temsil etmek
- temsilci
- temsil
- araştırma
- Araştırmacılar
- Yanıtlamak
- yanıtları
- sonuç
- aynı
- söylemek
- bilim adamları
- görünüyor
- ayrı
- Setleri
- meli
- gösterilen
- Gösteriler
- benzer
- benzer şekilde
- Basit
- sadece
- tek
- Futbol
- Sosyal Medya
- sosyal medya
- biraz
- Birisi
- özel
- Dönme
- Spor
- Spor
- başladı
- Eyalet
- Ders çalışma
- Ders çalışıyor
- böyle
- Anket
- sistem
- tablo
- takım
- genç
- test
- Test yapmak
- metin
- göre
- o
- The
- Dünya
- ve bazı Asya
- kendilerini
- sonra
- Bunlar
- onlar
- Re-Tweet
- Bu
- gerçi?
- eşik
- boyunca
- için
- araç
- karşı
- Eğitim
- denemek
- altında
- anladım
- üzerine
- kullanım
- Kullanılmış
- kullanıcılar
- Varyant
- çok
- yaşayabilirlik
- oy
- oldu
- we
- Web sitesi
- vardı
- Ne
- ne zaman
- olup olmadığını
- DSÖ
- ile
- kadın
- sözler
- Dünya
- olur
- yazı yazıyor
- yazılı
- yıl
- Sen
- kendiniz
- zefirnet