การลดอคติและปรับปรุงความปลอดภัยใน DALL·E 2

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

วันนี้ เรากำลังใช้เทคนิคใหม่เพื่อให้ DALL·E สร้างภาพผู้คนที่สะท้อนความหลากหลายของประชากรโลกได้แม่นยำยิ่งขึ้น เทคนิคนี้ใช้ในระดับระบบเมื่อ DALL·E ได้รับพร้อมท์ให้อธิบายบุคคลที่ไม่ได้ระบุเชื้อชาติหรือเพศ เช่น “นักผจญเพลิง”

จากการประเมินภายในของเรา ผู้ใช้มีแนวโน้มที่จะบอกว่ารูปภาพของ DALL·E รวมผู้คนที่มีภูมิหลังที่หลากหลายมากขึ้นถึง 12 เท่าหลังจากที่ใช้เทคนิคนี้ เราวางแผนที่จะปรับปรุงเทคนิคนี้เมื่อเวลาผ่านไปในขณะที่เรารวบรวมข้อมูลและข้อเสนอแนะเพิ่มเติม

รูปถ่ายของ CEO

ผลิต

ก่อนผ่อนปรน

หลังผ่อนปรน

ในเดือนเมษายน เราเริ่มแสดงตัวอย่างงานวิจัยของ DALL·E 2 กับคนจำนวนจำกัด ซึ่งทำให้เราเข้าใจความสามารถและข้อจำกัดของระบบได้ดีขึ้น และปรับปรุงระบบความปลอดภัยของเรา

ในช่วงการแสดงตัวอย่างนี้ ผู้ใช้กลุ่มแรกได้ตั้งค่าสถานะภาพที่ละเอียดอ่อนและมีความเอนเอียง ซึ่งช่วยแจ้งและประเมินการบรรเทาผลกระทบใหม่นี้

เรากำลังดำเนินการวิจัยอย่างต่อเนื่องว่าระบบ AI เช่น DALL·E อาจสะท้อนถึงความลำเอียงในข้อมูลการฝึกอบรมและวิธีการต่างๆ ที่เราสามารถจัดการกับปัญหาเหล่านี้ได้อย่างไร

ในระหว่างการแสดงตัวอย่างการวิจัย เราได้ดำเนินการขั้นตอนอื่นๆ เพื่อปรับปรุงระบบความปลอดภัยของเรา รวมถึง:

ลดความเสี่ยงที่ DALL·E จะถูกนำไปใช้ในทางที่ผิดเพื่อสร้างเนื้อหาที่หลอกลวงโดยปฏิเสธการอัปโหลดรูปภาพที่มีใบหน้าที่เหมือนจริงและพยายามสร้างภาพเหมือนของบุคคลสาธารณะ รวมถึงคนดังและบุคคลสำคัญทางการเมือง
ทำให้ตัวกรองเนื้อหาของเรามีความแม่นยำมากขึ้นเพื่อให้มีประสิทธิภาพมากขึ้นในการบล็อกข้อความแจ้งและการอัปโหลดภาพที่ละเมิด นโยบายเนื้อหา ในขณะที่ยังคงแสดงออกอย่างสร้างสรรค์
การปรับแต่งระบบการตรวจสอบอัตโนมัติและของมนุษย์เพื่อป้องกันการใช้ในทางที่ผิด

การปรับปรุงเหล่านี้ช่วยให้เรามั่นใจในความสามารถในการเชิญผู้ใช้ให้มาสัมผัสกับ DALL·E ได้มากขึ้น

การขยายการเข้าถึงเป็นส่วนสำคัญของ ปรับใช้ระบบ AI อย่างมีความรับผิดชอบ เพราะช่วยให้เราเรียนรู้เพิ่มเติมเกี่ยวกับการใช้งานจริงและทำซ้ำในระบบความปลอดภัยของเราต่อไป

ประทับเวลา: กรกฎาคม 18, 2022กรกฎาคม 18, 2022

ประทับเวลา: ธันวาคม 13, 2023

การลดอคติและปรับปรุงความปลอดภัยใน DALL·E 2

เผยแพร่ซ้ำโดยเพลโต

เพิ่มเติมจาก OpenAI

แนวทางปฏิบัติสำหรับการควบคุมระบบ Agentic AI

ขอแนะนำ OpenAI ลอนดอน

การสอนแบบจำลองเพื่อแสดงความไม่แน่นอนด้วยคำพูด

OpenAI ประกาศสมาชิกใหม่ต่อคณะกรรมการบริหาร

การปรับปรุงการให้เหตุผลทางคณิตศาสตร์ด้วยการกำกับดูแลกระบวนการ

กฎระเบียบของ Frontier AI: การจัดการความเสี่ยงที่เกิดขึ้นต่อความปลอดภัยสาธารณะ

การ์ดระบบ GPT-4V(ision)

ขอแนะนำทีม ChatGPT

ร่วมมือกับ Axel Springer เพื่อใช้ประโยชน์จาก AI ในการสื่อสารมวลชนให้ลึกซึ้งยิ่งขึ้น

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้