Giảm sai lệch và cải thiện tính an toàn trong DALL·E 2

Được xuất bản lại bởi Plato

Người theo dõi: 0

Hôm nay, chúng tôi đang triển khai một kỹ thuật mới để DALL · E tạo ra hình ảnh của những người phản ánh chính xác hơn sự đa dạng của dân số thế giới. Kỹ thuật này được áp dụng ở cấp hệ thống khi DALL · E được đưa ra lời nhắc mô tả một người không xác định chủng tộc hoặc giới tính, chẳng hạn như “lính cứu hỏa”.

Dựa trên đánh giá nội bộ của chúng tôi, người dùng có khả năng nói rằng hình ảnh DALL · E bao gồm những người có hoàn cảnh khác nhau sau khi áp dụng kỹ thuật này cao hơn 12 lần. Chúng tôi có kế hoạch cải thiện kỹ thuật này theo thời gian khi chúng tôi thu thập thêm dữ liệu và phản hồi.

Một bức ảnh của một giám đốc điều hành

Tạo ra

Trước khi giảm thiểu

Sau khi giảm thiểu

Vào tháng 2, chúng tôi bắt đầu xem trước nghiên cứu DALL · E XNUMX cho một số người giới hạn, điều này cho phép chúng tôi hiểu rõ hơn về các khả năng và hạn chế của hệ thống cũng như cải thiện hệ thống an toàn của chúng tôi.

Trong giai đoạn xem trước này, những người dùng ban đầu đã gắn cờ các hình ảnh nhạy cảm và thiên vị đã giúp thông báo và đánh giá việc giảm thiểu mới này.

Chúng tôi đang tiếp tục nghiên cứu cách các hệ thống AI, như DALL · E, có thể phản ánh các thành kiến trong dữ liệu đào tạo của nó và các cách khác nhau mà chúng tôi có thể giải quyết chúng.

Trong quá trình xem trước nghiên cứu, chúng tôi đã thực hiện các bước khác để cải thiện hệ thống an toàn của mình, bao gồm:

Giảm thiểu nguy cơ DALL · E bị lạm dụng để tạo ra nội dung lừa đảo bằng cách từ chối tải lên hình ảnh có các khuôn mặt thực tế và cố gắng tạo ra sự giống với các nhân vật của công chúng, bao gồm cả những người nổi tiếng và các nhân vật chính trị nổi tiếng.
Làm cho các bộ lọc nội dung của chúng tôi chính xác hơn để chúng có hiệu quả hơn trong việc chặn các lời nhắc và tải lên hình ảnh vi phạm chính sách nội dung trong khi vẫn cho phép thể hiện sáng tạo.
Tinh chỉnh các hệ thống giám sát tự động và con người để đề phòng việc sử dụng sai mục đích.

Những cải tiến này đã giúp chúng tôi tự tin vào khả năng mời thêm người dùng trải nghiệm DALL · E.

Mở rộng quyền truy cập là một phần quan trọng trong triển khai các hệ thống AI một cách có trách nhiệm bởi vì nó cho phép chúng tôi tìm hiểu thêm về cách sử dụng trong thế giới thực và tiếp tục lặp lại các hệ thống an toàn của chúng tôi.

Dấu thời gian: 18 Tháng Bảy, 202218 Tháng Bảy, 2022

Dấu thời gian: Tháng Mười Hai 13, 2023

Giảm thiên vị và cải thiện an toàn trong DALL · E 2

Được xuất bản lại bởi Plato

Thêm từ OpenAI

Thực tiễn quản lý hệ thống AI tác nhân

Giới thiệu OpenAI Luân Đôn

Dạy các mô hình để thể hiện sự không chắc chắn của họ trong lời nói

OpenAI công bố thành viên mới vào ban giám đốc

Cải thiện suy luận toán học với giám sát quy trình

Quy định Frontier AI: Quản lý rủi ro mới nổi đối với an toàn công cộng

Thẻ hệ thống GPT-4V(ision)

Giới thiệu nhóm ChatGPT

Hợp tác với Axel Springer để tăng cường sử dụng AI có lợi trong báo chí

Về chúng tôi

Tìm kiếm dọc & Ai

Nền tảng

NHẬN THÔNG TIN

Tài khoản