Dalam studi yang mungkin merupakan penelitian pertama kali ini, perusahaan kecerdasan buatan (AI) Anthropic telah mengembangkan model bahasa besar (LLM) yang telah disesuaikan untuk penilaian nilai oleh komunitas penggunanya.
Apa maksudnya agar pengembangan AI menjadi lebih demokratis? Untuk mengetahuinya, kami bermitra dengan @collect_intel untuk menggunakan @usepolis untuk menyusun konstitusi AI berdasarkan pendapat ~1000 orang Amerika. Kemudian kami melatih model untuk melawannya menggunakan AI Konstitusional. pic.twitter.com/ZKaXw5K9sU
โ Antropik (@AntropikAI) Oktober 17, 2023
Banyak LLM yang berhubungan dengan publik telah dikembangkan dengan pagar pembatas โ instruksi terkode yang menentukan perilaku tertentu โ sebagai upaya untuk membatasi keluaran yang tidak diinginkan. Claude dari Anthropic dan ChatGPT OpenAI, misalnya, biasanya memberi pengguna respons keamanan terekam terhadap permintaan keluaran yang terkait dengan topik kekerasan atau kontroversial.
Namun, seperti yang telah ditunjukkan oleh banyak pakar, pagar pembatas dan teknik intervensi lainnya dapat berfungsi untuk merampas hak pilihan pengguna. Apa yang dianggap dapat diterima belum tentu bermanfaat, dan apa yang dianggap bermanfaat belum tentu dapat diterima. Dan definisi moralitas atau penilaian berdasarkan nilai dapat bervariasi antar budaya, masyarakat, dan periode waktu.
Terkait: Inggris akan menargetkan potensi ancaman AI pada pertemuan puncak bulan November yang direncanakan
Salah satu solusi yang mungkin untuk mengatasi masalah ini adalah dengan memungkinkan pengguna menentukan penyelarasan nilai untuk model AI. Eksperimen โCollective Constitutional AIโ yang dilakukan oleh Anthropic merupakan upaya untuk mengatasi โtantangan yang berantakanโ ini.
Anthropic, bekerja sama dengan Polis dan Collective Intelligence Project, menjangkau 1,000 pengguna dari berbagai demografi dan meminta mereka menjawab serangkaian pertanyaan melalui polling.
Tantangannya berpusat pada pemberian kesempatan kepada pengguna lembaga untuk menentukan apa yang sesuai tanpa memaparkan mereka pada keluaran yang tidak sesuai. Hal ini melibatkan pengumpulan nilai-nilai pengguna dan kemudian menerapkan ide-ide tersebut ke dalam model yang telah dilatih.
Anthropic menggunakan metode yang disebut โAI Konstitusionalโ untuk langsung upayanya dalam menyesuaikan LLM untuk keamanan dan kegunaan. Pada dasarnya, hal ini melibatkan pemberian daftar peraturan yang harus dipatuhi oleh model tersebut dan kemudian melatih model tersebut untuk menerapkan peraturan tersebut di seluruh prosesnya, seperti halnya konstitusi yang berfungsi sebagai dokumen inti pemerintahan di banyak negara.
Dalam eksperimen AI Konstitusi Kolektif, Anthropic berupaya mengintegrasikan umpan balik berbasis kelompok ke dalam konstitusi model. Hasil, menurut ke postingan blog dari Anthropic, tampaknya merupakan keberhasilan ilmiah karena menjelaskan tantangan lebih lanjut dalam mencapai tujuan yang memungkinkan pengguna produk LLM menentukan nilai kolektif mereka.
Salah satu kesulitan yang harus diatasi oleh tim adalah menemukan metode baru untuk proses benchmarking. Karena eksperimen ini tampaknya merupakan yang pertama dari jenisnya, dan bergantung pada metodologi AI Konstitusional Anthropic, tidak ada pengujian yang dapat dilakukan untuk membandingkan model dasar dengan model yang disesuaikan dengan nilai-nilai yang bersumber dari banyak orang.
Pada akhirnya, tampaknya model yang menerapkan data yang dihasilkan dari umpan balik jajak pendapat pengguna โsedikitโ mengungguli model dasar dalam hal keluaran yang bias.
Per posting blog:
โLebih dari model yang dihasilkan, kami sangat antusias dengan prosesnya. Kami percaya bahwa ini mungkin salah satu contoh pertama di mana anggota masyarakat, sebagai sebuah kelompok, dengan sengaja mengarahkan perilaku model bahasa yang besar. Kami berharap komunitas di seluruh dunia akan memanfaatkan teknik seperti ini untuk melatih model yang spesifik secara budaya dan konteks untuk memenuhi kebutuhan mereka.โ
- Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
- PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
- PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
- PlatoESG. Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
- PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
- Sumber: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- :memiliki
- :adalah
- $NAIK
- 000
- 1
- 17
- a
- Tentang Kami
- diterima
- mencapai
- di seluruh
- terhadap
- badan
- AI
- AI chatbot
- Model AI
- penjajaran
- mengizinkan
- Membiarkan
- sudah
- selalu
- Amerika
- an
- dan
- menjawab
- Antropik
- muncul
- muncul
- sesuai
- DAERAH
- sekitar
- buatan
- kecerdasan buatan
- Kecerdasan buatan (AI)
- AS
- At
- usaha
- berusaha
- mendasarkan
- berdasarkan
- BE
- menjadi
- laku
- Percaya
- benchmarking
- antara
- bias
- Blog
- membangun
- dibangun di
- by
- bernama
- CAN
- Pusat
- menantang
- tantangan
- ChatBot
- ChatGPT
- Cointelegraph
- kolaborasi
- Kolektif
- kedatangan
- Masyarakat
- masyarakat
- pembandingan
- dianggap
- Konstitusi
- kontroversial
- Core
- data
- definisi
- demokratis
- Demografi
- Menentukan
- dikembangkan
- Pengembangan
- mendikte
- kesulitan
- diarahkan
- beberapa
- dokumen
- tidak
- upaya
- dasarnya
- mapan
- contoh
- gembira
- eksperimen
- umpan balik
- Menemukan
- Perusahaan
- Pertama
- Untuk
- dari
- lebih lanjut
- Memberikan
- Pemberian
- tujuan
- pemerintahan
- Kelompok
- memiliki
- Memiliki
- berharap
- HTTPS
- ide-ide
- melaksanakan
- diimplementasikan
- mengimplementasikan
- in
- instruksi
- mengintegrasikan
- Intelijen
- dengan sengaja
- ke
- terlibat
- IT
- NYA
- jpg
- penilaian
- Jenis
- bahasa
- besar
- membiarkan
- 'like'
- MEMBATASI
- Daftar
- LLM
- banyak
- Mungkin..
- berarti
- Anggota
- metode
- Metodologi
- model
- model
- moralitas
- lebih
- banyak
- harus
- Bangsa
- kebutuhan
- novel
- November
- of
- on
- ONE
- Pendapat
- or
- Lainnya
- di luar
- mengungguli
- keluaran
- output
- Mengatasi
- bermitra
- periode
- Tempat
- berencana
- plato
- Kecerdasan Data Plato
- Data Plato
- mungkin
- Pos
- potensi
- proses
- Produk
- proyek
- publik
- Pertanyaan
- terkait
- permintaan
- tanggapan
- dihasilkan
- Hasil
- merampok
- aturan
- Safety/keselamatan
- ilmiah
- Seri
- melayani
- melayani
- tertentu
- Belajar
- sukses
- Tapped
- target
- tim
- teknik
- uji
- dari
- bahwa
- Grafik
- Daerah
- Dunia
- mereka
- Mereka
- kemudian
- Sana.
- ini
- itu
- meskipun?
- ancaman
- di seluruh
- waktu
- untuk
- Topik
- terhadap
- Pelatihan VE
- terlatih
- Pelatihan
- khas
- tidak diinginkan
- menggunakan
- Pengguna
- Pengguna
- kegunaan
- menggunakan
- nilai
- berbasis nilai
- Nilai - Nilai
- melalui
- Memilih
- adalah
- we
- Apa
- yang
- akan
- dengan
- tanpa
- dunia
- zephyrnet.dll