ในการศึกษาครั้งนี้อาจเป็นครั้งแรก บริษัทปัญญาประดิษฐ์ (AI) Anthropic ได้พัฒนาโมเดลภาษาขนาดใหญ่ (LLM) ที่ได้รับการปรับแต่งอย่างละเอียดเพื่อการตัดสินคุณค่าโดยชุมชนผู้ใช้
การพัฒนา AI จะเป็นประชาธิปไตยมากขึ้นหมายความว่าอย่างไร เพื่อค้นหาเราร่วมมือกับ @collect_intel ใช้ @usepolis เพื่อดูแลจัดการรัฐธรรมนูญ AI ตามความคิดเห็นของชาวอเมริกันประมาณ 1000 คน จากนั้นเราก็ฝึกโมเดลเพื่อต่อต้านมันโดยใช้ Constitutional AI pic.twitter.com/ZKaXw5K9sU
— มานุษยวิทยา (@AnthropicAI) ตุลาคม 17, 2023
LLM ที่หันหน้าสู่สาธารณะจำนวนมากได้รับการพัฒนาโดยมีราวกั้น — คำแนะนำที่เข้ารหัสซึ่งกำหนดพฤติกรรมเฉพาะ — ในสถานที่เพื่อพยายามจำกัดเอาต์พุตที่ไม่ต้องการ ตัวอย่างเช่น Claude ของ Anthropic และ ChatGPT ของ OpenAI โดยทั่วไปจะให้การตอบสนองด้านความปลอดภัยแก่ผู้ใช้ต่อคำขอเอาต์พุตที่เกี่ยวข้องกับหัวข้อที่มีความรุนแรงหรือเป็นที่ถกเถียง
อย่างไรก็ตาม ดังที่ผู้เชี่ยวชาญมากมายได้ชี้ให้เห็น ราวกั้นและเทคนิคการแทรกแซงอื่น ๆ สามารถทำหน้าที่ปล้นผู้ใช้หน่วยงานของตนได้ สิ่งที่ถือว่ายอมรับไม่ได้มีประโยชน์เสมอไป และสิ่งที่ถือว่ามีประโยชน์ก็ไม่เป็นที่ยอมรับเสมอไป และคำจำกัดความของการตัดสินทางศีลธรรมหรือคุณค่าอาจแตกต่างกันไปตามวัฒนธรรม ประชากร และช่วงเวลา
ที่เกี่ยวข้อง สหราชอาณาจักรกำหนดเป้าหมายภัยคุกคาม AI ที่อาจเกิดขึ้นในการประชุมสุดยอดเดือนพฤศจิกายนที่วางแผนไว้
วิธีแก้ไขประการหนึ่งที่เป็นไปได้คือการอนุญาตให้ผู้ใช้สามารถกำหนดการจัดตำแหน่งค่าสำหรับโมเดล AI ได้ การทดลอง "Collective Constitutional AI" ของ Anthropic ถือเป็น "ความท้าทายที่ยุ่งวุ่นวาย"
Anthropic ร่วมมือกับ Polis และ Collective Intelligence Project เข้าถึงผู้ใช้ 1,000 รายจากกลุ่มประชากรที่หลากหลาย และขอให้พวกเขาตอบคำถามต่างๆ ผ่านการสำรวจความคิดเห็น
ความท้าทายมุ่งเน้นไปที่การอนุญาตให้ผู้ใช้หน่วยงานกำหนดสิ่งที่เหมาะสมโดยไม่เปิดเผยผลลัพธ์ที่ไม่เหมาะสม สิ่งนี้เกี่ยวข้องกับการเรียกร้องค่านิยมของผู้ใช้ จากนั้นนำแนวคิดเหล่านั้นไปใช้ในแบบจำลองที่ได้รับการฝึกอบรมแล้ว
Anthropic ใช้วิธีการที่เรียกว่า "Constitutional AI" เพื่อ โดยตรง ความพยายามในการปรับแต่ง LLM เพื่อความปลอดภัยและประโยชน์ โดยพื้นฐานแล้ว สิ่งนี้เกี่ยวข้องกับการให้รายการกฎที่ต้องปฏิบัติตามแก่โมเดล จากนั้นจึงฝึกอบรมให้นำกฎเหล่านั้นไปใช้ตลอดกระบวนการ เหมือนกับที่รัฐธรรมนูญทำหน้าที่เป็นเอกสารหลักในการกำกับดูแลในหลายประเทศ
ในการทดลอง Collective Constitutional AI นั้น Anthropic พยายามรวมความคิดเห็นแบบกลุ่มเข้ากับรัฐธรรมนูญของแบบจำลอง ผลลัพธ์ ตาม ในบล็อกโพสต์จาก Anthropic ดูเหมือนจะประสบความสำเร็จทางวิทยาศาสตร์โดยให้ความกระจ่างถึงความท้าทายเพิ่มเติมในการบรรลุเป้าหมายในการอนุญาตให้ผู้ใช้ผลิตภัณฑ์ LLM สามารถกำหนดค่านิยมโดยรวมของตนได้
ปัญหาอย่างหนึ่งที่ทีมต้องเอาชนะคือการคิดค้นวิธีการใหม่สำหรับกระบวนการเปรียบเทียบมาตรฐาน เนื่องจากการทดลองนี้ดูเหมือนจะเป็นการทดลองครั้งแรก และอาศัยวิธี Constitutional AI ของ Anthropic จึงยังไม่มีการทดสอบที่กำหนดไว้สำหรับการเปรียบเทียบแบบจำลองพื้นฐานกับแบบจำลองที่ปรับแต่งด้วยค่านิยมที่มาจากฝูงชน
ท้ายที่สุดแล้ว ดูเหมือนว่าโมเดลที่ใช้ข้อมูลซึ่งเป็นผลมาจากความคิดเห็นของผู้ใช้ที่โพลสำรวจนั้นมีประสิทธิภาพเหนือกว่าโมเดลพื้นฐาน "เล็กน้อย" ในส่วนของเอาท์พุตเอนเอียง
ต่อโพสต์บล็อก:
“มากกว่าผลลัพธ์ที่ได้ เรารู้สึกตื่นเต้นกับกระบวนการนี้ เราเชื่อว่านี่อาจเป็นหนึ่งในกรณีแรกๆ ที่สมาชิกของสาธารณะในฐานะกลุ่ม มีเจตนาชี้นำพฤติกรรมของแบบจำลองภาษาขนาดใหญ่ เราหวังว่าชุมชนทั่วโลกจะสร้างเทคนิคเช่นนี้เพื่อฝึกอบรมโมเดลเฉพาะทางวัฒนธรรมและบริบทที่ตอบสนองความต้องการของพวกเขา”
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- :มี
- :เป็น
- $ ขึ้น
- 000
- 1
- 17
- a
- เกี่ยวกับเรา
- ยอมรับได้
- การบรรลุ
- ข้าม
- กับ
- บริษัท ตัวแทน
- AI
- AI แชทบอท
- โมเดล AI
- การวางแนว
- อนุญาต
- การอนุญาต
- แล้ว
- เสมอ
- ชาวอเมริกัน
- an
- และ
- คำตอบ
- มานุษยวิทยา
- ปรากฏ
- ปรากฏ
- เหมาะสม
- AREA
- รอบ
- เทียม
- ปัญญาประดิษฐ์
- ปัญญาประดิษฐ์ (AI)
- AS
- At
- ความพยายาม
- พยายาม
- ฐาน
- ตาม
- BE
- รับ
- พฤติกรรม
- เชื่อ
- การเปรียบเทียบ
- ระหว่าง
- ลำเอียง
- บล็อก
- สร้าง
- สร้าง
- by
- ที่เรียกว่า
- CAN
- ศูนย์
- ท้าทาย
- ความท้าทาย
- chatbot
- ChatGPT
- Cointelegraph
- การทำงานร่วมกัน
- โดยรวม
- มา
- ชุมชน
- ชุมชน
- เปรียบเทียบ
- ถือว่า
- รัฐธรรมนูญ
- แย้ง
- แกน
- ข้อมูล
- คำจำกัดความ
- ประชาธิปัตย์
- ประชากร
- กำหนด
- พัฒนา
- พัฒนาการ
- บอกให้เขียน
- ความยากลำบาก
- กำกับการแสดง
- หลาย
- เอกสาร
- ทำ
- ความพยายาม
- เป็นหลัก
- ที่จัดตั้งขึ้น
- ตัวอย่าง
- ตื่นเต้น
- การทดลอง
- ข้อเสนอแนะ
- หา
- บริษัท
- ชื่อจริง
- สำหรับ
- ราคาเริ่มต้นที่
- ต่อไป
- ให้
- ให้
- เป้าหมาย
- การกำกับดูแล
- บัญชีกลุ่ม
- มี
- มี
- ความหวัง
- HTTPS
- ความคิด
- การดำเนินการ
- การดำเนินการ
- การดำเนินการ
- in
- คำแนะนำการใช้
- รวบรวม
- Intelligence
- จงใจ
- เข้าไป
- ร่วมมือ
- IT
- ITS
- jpg
- คำตัดสิน
- ชนิด
- ภาษา
- ใหญ่
- การให้
- กดไลก์
- LIMIT
- รายการ
- LLM
- หลาย
- อาจ..
- หมายความ
- สมาชิก
- วิธี
- ระเบียบวิธี
- แบบ
- โมเดล
- ศีลธรรม
- ข้อมูลเพิ่มเติม
- มาก
- ต้อง
- เนชั่น
- ความต้องการ
- นวนิยาย
- พฤศจิกายน
- of
- on
- ONE
- ความคิดเห็น
- or
- อื่นๆ
- ออก
- เฮง
- เอาท์พุต
- เอาท์พุท
- เอาชนะ
- ร่วมมือ
- งวด
- สถานที่
- การวางแผน
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- เป็นไปได้
- โพสต์
- ที่มีศักยภาพ
- กระบวนการ
- ผลิตภัณฑ์
- โครงการ
- สาธารณะ
- คำถาม
- ที่เกี่ยวข้อง
- การร้องขอ
- คำตอบ
- ส่งผลให้
- ผลสอบ
- ปล้น
- กฎระเบียบ
- ความปลอดภัย
- วิทยาศาสตร์
- ชุด
- ให้บริการ
- ให้บริการอาหาร
- โดยเฉพาะ
- ศึกษา
- ความสำเร็จ
- เคาะ
- เป้า
- ทีม
- เทคนิค
- ทดสอบ
- กว่า
- ที่
- พื้นที่
- พื้นที่
- โลก
- ของพวกเขา
- พวกเขา
- แล้วก็
- ที่นั่น
- นี้
- เหล่านั้น
- แต่?
- ภัยคุกคาม
- ตลอด
- เวลา
- ไปยัง
- หัวข้อ
- ไปทาง
- รถไฟ
- ผ่านการฝึกอบรม
- การฝึกอบรม
- พูดเบาและรวดเร็ว
- เป็นปกติ
- ที่ไม่พึงประสงค์
- ใช้
- ผู้ใช้งาน
- ผู้ใช้
- ใช้
- การใช้
- ความคุ้มค่า
- มีมูลค่าตาม
- ความคุ้มค่า
- ผ่านทาง
- โหวต
- คือ
- we
- อะไร
- ที่
- จะ
- กับ
- ไม่มี
- โลก
- ลมทะเล