แนวทางปฏิบัติที่ดีที่สุดสำหรับการปรับใช้แบบจำลองภาษา

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

แนวทางปฏิบัติที่ดีที่สุดสำหรับการปรับใช้แบบจำลองภาษา

Cohere, OpenAI และ AI21 Labs ได้พัฒนาชุดแนวทางปฏิบัติเบื้องต้นเบื้องต้นที่ใช้ได้กับองค์กรใดๆ ที่กำลังพัฒนาหรือปรับใช้โมเดลภาษาขนาดใหญ่ คอมพิวเตอร์ที่สามารถอ่านและเขียนได้อยู่ที่นี่ และมีศักยภาพที่จะส่งผลกระทบต่อชีวิตประจำวันโดยพื้นฐาน อนาคตของการปฏิสัมพันธ์ระหว่างมนุษย์กับเครื่องจักรนั้นเต็มไปด้วยความเป็นไปได้และสัญญา แต่เทคโนโลยีที่ทรงพลังใด ๆ จำเป็นต้องมีการปรับใช้อย่างระมัดระวัง

คำแถลงร่วมด้านล่างแสดงถึงขั้นตอนในการสร้างชุมชนเพื่อจัดการกับความท้าทายระดับโลกที่นำเสนอโดยความก้าวหน้าของ AI และเราสนับสนุนให้องค์กรอื่น ๆ ที่ต้องการมีส่วนร่วมติดต่อ

คำแนะนำร่วมสำหรับการปรับใช้แบบจำลองภาษา

เรากำลังแนะนำหลักการสำคัญหลายประการเพื่อช่วยให้ผู้ให้บริการแบบจำลองภาษาขนาดใหญ่ (LLM) ลดความเสี่ยงของเทคโนโลยีนี้ เพื่อให้บรรลุตามคำมั่นสัญญาอย่างเต็มที่ว่าจะเพิ่มขีดความสามารถของมนุษย์

แม้ว่าหลักการเหล่านี้ได้รับการพัฒนาโดยเฉพาะจากประสบการณ์ของเราในการจัดหา LLM ผ่าน API เราหวังว่าหลักการเหล่านี้จะมีประโยชน์โดยไม่คำนึงถึงกลยุทธ์การเปิดตัว (เช่น โอเพ่นซอร์สหรือการใช้งานภายในบริษัท) เราคาดว่าคำแนะนำเหล่านี้จะเปลี่ยนแปลงอย่างมากเมื่อเวลาผ่านไป เนื่องจากการใช้ LLM ในเชิงพาณิชย์และข้อควรพิจารณาด้านความปลอดภัยที่มาพร้อมๆ กันเป็นเรื่องใหม่และกำลังพัฒนา เรากำลังเรียนรู้อย่างจริงจังและจัดการกับข้อจำกัดและแนวทางของ LLM สำหรับการใช้ในทางที่ผิด และจะอัปเดตหลักการและแนวทางปฏิบัติเหล่านี้โดยร่วมมือกับชุมชนในวงกว้างมากขึ้นเมื่อเวลาผ่านไป

เรากำลังแบ่งปันหลักการเหล่านี้โดยหวังว่าผู้ให้บริการ LLM รายอื่นอาจเรียนรู้และนำหลักการเหล่านี้ไปใช้ และเพื่อพัฒนาการอภิปรายสาธารณะเกี่ยวกับการพัฒนาและการปรับใช้ LLM

ห้ามใช้ในทางที่ผิด

เผยแพร่แนวทางการใช้งานและเงื่อนไขการใช้งาน ของ LLMs ในลักษณะที่ห้ามไม่ให้มีการทำอันตรายต่อบุคคล ชุมชน และสังคม เช่น ผ่านสแปม การฉ้อโกง หรือการหลอกลวงทางอินเทอร์เน็ต แนวทางการใช้งานควรระบุโดเมนที่การใช้ LLM ต้องมีการตรวจสอบอย่างละเอียดเป็นพิเศษ และห้ามกรณีการใช้งานที่มีความเสี่ยงสูงที่ไม่เหมาะสม เช่น การจัดประเภทบุคคลตามลักษณะที่ได้รับการคุ้มครอง

สร้างระบบและโครงสร้างพื้นฐานเพื่อบังคับใช้แนวทางการใช้งาน. ซึ่งอาจรวมถึงการจำกัดอัตรา การกรองเนื้อหา การอนุมัติแอปพลิเคชันก่อนการเข้าถึงการผลิต การตรวจสอบกิจกรรมที่ผิดปกติ และการบรรเทาผลกระทบอื่นๆ

บรรเทาอันตรายที่ไม่ได้ตั้งใจ

ลดพฤติกรรมของโมเดลที่เป็นอันตรายในเชิงรุก. แนวทางปฏิบัติที่ดีที่สุด ได้แก่ การประเมินแบบจำลองที่ครอบคลุมเพื่อประเมินข้อจำกัดอย่างเหมาะสม ลดแหล่งที่มาของอคติที่อาจเกิดขึ้นในการฝึกอบรมร่างกาย และเทคนิคในการลดพฤติกรรมที่ไม่ปลอดภัย เช่น ผ่านการเรียนรู้จากคำติชมของมนุษย์

บันทึกจุดอ่อนและจุดอ่อนที่ทราบเช่น ความลำเอียงหรือความสามารถในการสร้างรหัสที่ไม่ปลอดภัย เนื่องจากในบางกรณี ไม่มีระดับของการดำเนินการป้องกันใดที่สามารถขจัดโอกาสที่จะเกิดอันตรายโดยไม่ตั้งใจได้อย่างสมบูรณ์ เอกสารประกอบควรรวมถึงรูปแบบและแนวทางปฏิบัติที่ดีที่สุดด้านความปลอดภัยเฉพาะกรณีใช้งาน

ร่วมมือกับผู้มีส่วนได้ส่วนเสียอย่างรอบคอบ

สร้างทีมที่มีภูมิหลังที่หลากหลาย และขอข้อมูลในวงกว้าง มุมมองที่หลากหลายจำเป็นต่อการกำหนดลักษณะและระบุว่าแบบจำลองภาษาจะดำเนินการอย่างไรในความหลากหลายของโลกแห่งความเป็นจริง ซึ่งหากไม่เลือก สิ่งเหล่านี้อาจส่งเสริมอคติหรือล้มเหลวในการทำงานสำหรับบางกลุ่ม

เปิดเผยบทเรียนที่ได้เรียนรู้เกี่ยวกับความปลอดภัย LLM และการใช้ในทางที่ผิดต่อสาธารณะ เพื่อให้สามารถนำไปใช้อย่างกว้างขวางและช่วยในการทำซ้ำข้ามอุตสาหกรรมในแนวปฏิบัติที่ดีที่สุด

ปฏิบัติต่อแรงงานทั้งหมดในห่วงโซ่อุปทานแบบจำลองภาษาด้วยความเคารพ. ตัวอย่างเช่น ผู้ให้บริการควรมีมาตรฐานระดับสูงสำหรับสภาพการทำงานของผู้ที่ตรวจสอบผลลัพธ์ของแบบจำลองภายในองค์กร และกำหนดให้ผู้ขายมีมาตรฐานที่กำหนดไว้อย่างดี (เช่น ตรวจสอบให้แน่ใจว่าผู้ติดฉลากสามารถเลือกไม่รับงานที่กำหนดได้)

ในฐานะผู้ให้บริการ LLM การเผยแพร่หลักการเหล่านี้ถือเป็นก้าวแรกในแนวทางการทำงานร่วมกันในการพัฒนาและปรับใช้โมเดลภาษาขนาดใหญ่ที่ปลอดภัยยิ่งขึ้น เรารู้สึกตื่นเต้นที่จะทำงานร่วมกันและกับฝ่ายอื่นๆ ต่อไปเพื่อระบุโอกาสอื่นๆ เพื่อลดอันตรายที่ไม่ได้ตั้งใจจากและป้องกันการใช้รูปแบบภาษาอย่างมุ่งร้าย

ดาวน์โหลดเป็น PDF

การสนับสนุนจากองค์กรอื่นๆ

“แม้ว่า LLM จะรักษาสัญญาไว้ได้มาก แต่ก็มีปัญหาด้านความปลอดภัยที่สำคัญซึ่งจำเป็นต้องดำเนินการแก้ไข แนวทางปฏิบัติที่ดีที่สุดเหล่านี้เป็นขั้นตอนสำคัญในการลดอันตรายของแบบจำลองเหล่านี้ให้เหลือน้อยที่สุดและเพิ่มผลประโยชน์ที่เป็นไปได้สูงสุด”

—มานุษยวิทยา

“เนื่องจากแบบจำลองภาษาขนาดใหญ่ (LLM) มีประสิทธิภาพและแสดงออกมากขึ้น การลดความเสี่ยงจึงมีความสำคัญมากขึ้น เรายินดีกับความพยายามเหล่านี้และความพยายามอื่นๆ ในการดำเนินการในเชิงรุกเพื่อลดอันตรายและเน้นย้ำไปยังผู้ใช้ที่ต้องการความขยันเป็นพิเศษ หลักการที่อธิบายไว้ในที่นี้เป็นส่วนสำคัญในการสนทนาทั่วโลก”

—John Bansemer ผู้อำนวยการโครงการ CyberAI และผู้อาวุโส ศูนย์ความปลอดภัยและเทคโนโลยีเกิดใหม่ (CSET)

“Google ยืนยันถึงความสำคัญของกลยุทธ์ที่ครอบคลุมในการวิเคราะห์แบบจำลองและข้อมูลการฝึกอบรมเพื่อลดความเสี่ยงของอันตราย ความลำเอียง และการสื่อให้เข้าใจผิด เป็นขั้นตอนที่รอบคอบโดยผู้ให้บริการ AI เหล่านี้เพื่อส่งเสริมหลักการและเอกสารเกี่ยวกับความปลอดภัยของ AI”

—Google คลาวด์แพลตฟอร์ม (GCP)

“ความปลอดภัยของแบบจำลองพื้นฐาน เช่น โมเดลภาษาขนาดใหญ่ เป็นปัญหาทางสังคมที่เพิ่มขึ้น เราขอยกย่อง Cohere, OpenAI และ AI21 Labs สำหรับขั้นตอนแรกในการร่างหลักการระดับสูงสำหรับการพัฒนาอย่างรับผิดชอบและการปรับใช้จากมุมมองของนักพัฒนาโมเดล ยังมีงานอีกมากที่ต้องทำ และเราเชื่อว่าจำเป็นต้องมีส่วนร่วมกับเสียงจากภาควิชาการ อุตสาหกรรม และภาคประชาสังคมให้มากขึ้นเพื่อพัฒนาหลักการและบรรทัดฐานของชุมชนที่มีรายละเอียดมากขึ้น ตามที่เราระบุไว้ในล่าสุดของเรา โพสต์บล็อกมันไม่ได้เป็นเพียงผลลัพธ์สุดท้าย แต่ความชอบธรรมของกระบวนการที่สำคัญ”

—เพอร์ซี เหลียง ผู้อำนวยการศูนย์วิจัยโมเดลมูลนิธิสแตนฟอร์ด (CRFM)