Microsoft sửa đổi AI Copilot để giải quyết mối lo ngại của nhân viên

Microsoft sửa đổi AI Copilot để giải quyết mối lo ngại của nhân viên

Microsoft sửa đổi AI Copilot để giải quyết mối lo ngại của nhân viên PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Microsoft đã cập nhật công cụ Copilot AI của mình, chặn các lời nhắc như “ủng hộ sự lựa chọn” và “ủng hộ cuộc sống”, đồng thời đưa ra các cảnh báo về vi phạm chính sách sau những lo ngại của nhân viên và FTC.

Sau khi một kỹ sư AI của nhân viên bày tỏ mối lo ngại về khả năng tạo hình ảnh của Copilot AI trong một lá thư gửi Ủy ban Thương mại Liên bang hôm thứ Tư, Microsoft đã bắt đầu thay đổi công cụ trí tuệ nhân tạo của mình, Copilot.

Ngoài ra đọc: Các công ty khởi nghiệp AI tỏa sáng trong quý 1 với nguồn vốn đầu tư mạo hiểm tăng 40%

Các thuật ngữ “ủng hộ sự sống” và “ủng hộ sự lựa chọn”, “ủng hộ choce” [sic] và “bốn hai mươi”, tất cả đều được đề cập trong cuộc điều tra của CNBC hôm thứ Tư, hiện đã bị chặn. Ngoài ra, CNBC vừa nhận được cảnh báo rằng việc vi phạm chính sách nhiều lần có thể dẫn đến việc đình chỉ công cụ.

Kỹ sư AI lên tiếng

Shane Jones, một kỹ sư AI tại Microsoft, cảnh báo rằng Phi công phụ Designer, công cụ tạo hình ảnh AI của công ty, vi phạm luật bản quyền và sản xuất nội dung bạo lực hoặc khiêu dâm. Jones đề nghị sử dụng thời gian rảnh rỗi của mình để lập nhóm đỏ cho trình tạo hình ảnh để tìm ra các lỗ hổng mặc dù anh ấy không tham gia vào quá trình phát triển nó.

Anh phát hiện ra rằng Image Generator có thể tạo ra các hình ảnh phản cảm và khiêu dâm, chẳng hạn như các cảnh bạo lực liên quan đến sử dụng ma túy, uống rượu khi chưa đủ tuổi vị thành niên và quyền phá thai.

Sau khi chia sẻ những phát hiện của mình với công ty trong nội bộ vào tháng 12 năm ngoái, anh ấy đã yêu cầu Microsoft rút sản phẩm này. Microsoft đã không làm theo.

Jones nhấn mạnh rằng ông đã nói chuyện với quản lý cấp cao tại Copilot Designer và liên hệ với Văn phòng AI có trách nhiệm của Microsoft, nhưng ông vẫn chưa nhận được phản hồi thỏa đáng.

Jones đã gặp các thành viên của Ủy ban Thương mại, Khoa học và Giao thông Vận tải Thượng viện vào tháng 1 và viết một lá thư cho các thượng nghị sĩ Hoa Kỳ.

Anh ấy hiện đang tiến xa hơn: anh ấy yêu cầu cải thiện các biện pháp bảo vệ, tính minh bạch và sửa đổi xếp hạng người lớn của ứng dụng Android trong một lá thư gửi ban giám đốc Microsoft và Lina Khan, chủ tịch Ủy ban chống độc quyền Hoa Kỳ.

Ngoài ra, ông yêu cầu đánh giá khách quan về quy trình báo cáo sự cố AI của Microsoft, cáo buộc rằng OpenAI và Microsoft đã biết về các vấn đề của trình tạo hình ảnh trước khi phát hành vào mùa thu năm ngoái.

Jones đã là giám đốc kỹ thuật phần mềm chính của Microsoft trong gần sáu năm.

Phi công phụ trả lời

Theo cảnh báo của Copilot, lời nhắc đã bị chặn và hệ thống của họ tự động gắn cờ lời nhắc này vì nó có thể xung đột với chính sách nội dung. Họ tuyên bố rằng vi phạm chính sách nhiều hơn có thể dẫn đến việc tự động đình chỉ quyền truy cập và nếu người dùng cho rằng đây là sai sót, họ nên báo cáo để giúp họ cải thiện.

Một cải tiến đáng kể so với đầu tuần này là công cụ AI hiện từ chối yêu cầu tạo hình ảnh trẻ em hoặc thanh thiếu niên giả làm sát thủ bằng súng trường tấn công và nói: “Tôi xin lỗi, nhưng tôi không thể tạo ra một hình ảnh như vậy”. Cả chính sách của Microsoft lẫn nguyên tắc đạo đức của tôi đều bị vi phạm. Đừng yêu cầu tôi làm bất cứ điều gì có thể xúc phạm hoặc gây tổn hại cho người khác. Tôi đánh giá cao sự hợp tác của bạn.

A microsoft đại diện nói với CNBC rằng họ đang liên tục theo dõi, điều chỉnh và áp dụng các biện pháp kiểm soát bổ sung để tăng cường hơn nữa các bộ lọc an toàn và giảm thiểu việc lạm dụng hệ thống để trả lời câu hỏi liên quan đến những thay đổi. 

Jones đã viết thư cho ban giám đốc của Microsoft và FTC Chủ tịch Lina Khan vào thứ Tư, đưa mối quan tâm của ông tiến thêm một bước. Ông đã cấp cho CNBC quyền truy cập trước vào các bức thư.

FTC thừa nhận đã nhận được bức thư gửi CNBC nhưng quyết định không đưa ra bất kỳ bình luận bổ sung nào cho hồ sơ.

Dấu thời gian:

Thêm từ MetaNews