ลดอคติและปรับปรุงความปลอดภัยใน DALL·E 2 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

การลดอคติและปรับปรุงความปลอดภัยใน DALL·E 2

วันนี้ เรากำลังใช้เทคนิคใหม่เพื่อให้ DALL·E สร้างภาพผู้คนที่สะท้อนความหลากหลายของประชากรโลกได้แม่นยำยิ่งขึ้น เทคนิคนี้ใช้ในระดับระบบเมื่อ DALL·E ได้รับพร้อมท์ให้อธิบายบุคคลที่ไม่ได้ระบุเชื้อชาติหรือเพศ เช่น “นักผจญเพลิง”

จากการประเมินภายในของเรา ผู้ใช้มีแนวโน้มที่จะบอกว่ารูปภาพของ DALL·E รวมผู้คนที่มีภูมิหลังที่หลากหลายมากขึ้นถึง 12 เท่าหลังจากที่ใช้เทคนิคนี้ เราวางแผนที่จะปรับปรุงเทคนิคนี้เมื่อเวลาผ่านไปในขณะที่เรารวบรวมข้อมูลและข้อเสนอแนะเพิ่มเติม


รูปถ่ายของ CEO

ผลิต

ในเดือนเมษายน เราเริ่มแสดงตัวอย่างงานวิจัยของ DALL·E 2 กับคนจำนวนจำกัด ซึ่งทำให้เราเข้าใจความสามารถและข้อจำกัดของระบบได้ดีขึ้น และปรับปรุงระบบความปลอดภัยของเรา

ในช่วงการแสดงตัวอย่างนี้ ผู้ใช้กลุ่มแรกได้ตั้งค่าสถานะภาพที่ละเอียดอ่อนและมีความเอนเอียง ซึ่งช่วยแจ้งและประเมินการบรรเทาผลกระทบใหม่นี้

เรากำลังดำเนินการวิจัยอย่างต่อเนื่องว่าระบบ AI เช่น DALL·E อาจสะท้อนถึงความลำเอียงในข้อมูลการฝึกอบรมและวิธีการต่างๆ ที่เราสามารถจัดการกับปัญหาเหล่านี้ได้อย่างไร

ในระหว่างการแสดงตัวอย่างการวิจัย เราได้ดำเนินการขั้นตอนอื่นๆ เพื่อปรับปรุงระบบความปลอดภัยของเรา รวมถึง:

  • ลดความเสี่ยงที่ DALL·E จะถูกนำไปใช้ในทางที่ผิดเพื่อสร้างเนื้อหาที่หลอกลวงโดยปฏิเสธการอัปโหลดรูปภาพที่มีใบหน้าที่เหมือนจริงและพยายามสร้างภาพเหมือนของบุคคลสาธารณะ รวมถึงคนดังและบุคคลสำคัญทางการเมือง
  • ทำให้ตัวกรองเนื้อหาของเรามีความแม่นยำมากขึ้นเพื่อให้มีประสิทธิภาพมากขึ้นในการบล็อกข้อความแจ้งและการอัปโหลดภาพที่ละเมิด นโยบายเนื้อหา ในขณะที่ยังคงแสดงออกอย่างสร้างสรรค์
  • การปรับแต่งระบบการตรวจสอบอัตโนมัติและของมนุษย์เพื่อป้องกันการใช้ในทางที่ผิด

การปรับปรุงเหล่านี้ช่วยให้เรามั่นใจในความสามารถในการเชิญผู้ใช้ให้มาสัมผัสกับ DALL·E ได้มากขึ้น

การขยายการเข้าถึงเป็นส่วนสำคัญของ ปรับใช้ระบบ AI อย่างมีความรับผิดชอบ เพราะช่วยให้เราเรียนรู้เพิ่มเติมเกี่ยวกับการใช้งานจริงและทำซ้ำในระบบความปลอดภัยของเราต่อไป

ประทับเวลา:

เพิ่มเติมจาก OpenAI