Một nhóm các nhà nghiên cứu từ Humboldt-Universitat zu Berlin đã phát triển một mô hình trí tuệ nhân tạo ngôn ngữ lớn với điểm khác biệt là đã được điều chỉnh có chủ ý để tạo ra kết quả đầu ra có thành kiến rõ ràng.
Được gọi là OpinionGPT, mô hình của nhóm là một biến thể được điều chỉnh của Llama 2 của Meta, một hệ thống AI có khả năng tương tự như ChatGPT của OpenAI hoặc Claude 2 của Anthropic.
Bằng cách sử dụng quy trình được gọi là tinh chỉnh dựa trên hướng dẫn, OpinionGPT có thể tự nhận là phản hồi các lời nhắc như thể đó là đại diện của một trong 11 nhóm thành kiến: Người Mỹ, người Đức, người Mỹ Latinh, người Trung Đông, thanh thiếu niên, người trên 30 tuổi, người lớn tuổi , một người đàn ông, một người phụ nữ, một người theo chủ nghĩa tự do hay một người bảo thủ.
Công bố “OpinionGPT: Một mô hình GPT rất thiên vị”! Hãy thử nó ở đây: https://t.co/5YJjHlcV4n
Để điều tra tác động của sự thiên vị đối với các câu trả lời của mô hình, chúng tôi đã hỏi một câu hỏi đơn giản: Điều gì sẽ xảy ra nếu chúng tôi điều chỉnh một #GPT chỉ mô hình hóa với các văn bản được viết bởi những người thiên về chính trị?[1 / 3]
— Alan Akbik (@alan_akbik) Ngày 8 tháng 2023 năm XNUMX
Ý kiếnGPT đã được tinh chỉnh trên kho dữ liệu lấy từ cộng đồng “AskX”, được gọi là subreddits, trên Reddit. Ví dụ về các subreddits này sẽ bao gồm “Hỏi một người phụ nữ” và “Hỏi một người Mỹ”.
Nhóm bắt đầu bằng cách tìm các subreddit liên quan đến 11 thành kiến cụ thể và lấy ra 25 nghìn bài đăng phổ biến nhất từ mỗi thành kiến. Sau đó, họ chỉ giữ lại những bài đăng đáp ứng ngưỡng tối thiểu để được tán thành, không chứa trích dẫn được nhúng và dưới 80 từ.
Với những gì còn lại, có vẻ như họ đã sử dụng một phương pháp tiếp cận tương tự như AI Hiến pháp của Anthropic. Thay vì tạo ra các mô hình hoàn toàn mới để thể hiện từng nhãn thiên vị, về cơ bản, họ đã tinh chỉnh mô hình Llama7 gồm 2 tỷ tham số với các bộ hướng dẫn riêng biệt cho từng độ lệch dự kiến.
Liên quan: Việc sử dụng AI trên mạng xã hội có khả năng tác động đến tâm lý cử tri
Kết quả dựa trên phương pháp luận, kiến trúc và dữ liệu mô tả trong bài nghiên cứu của nhóm người Đức, dường như là một hệ thống AI hoạt động giống như một công cụ tạo khuôn mẫu hơn là một công cụ để nghiên cứu xu hướng trong thế giới thực.
Do tính chất của dữ liệu mà mô hình đã được tinh chỉnh và mối quan hệ không rõ ràng của dữ liệu đó với các nhãn xác định nó, OpinionGPT không nhất thiết xuất ra văn bản phù hợp với bất kỳ sai lệch nào có thể đo lường được trong thế giới thực. Nó chỉ đơn giản là xuất ra văn bản phản ánh sự thiên vị của dữ liệu của nó.
Bản thân các nhà nghiên cứu cũng nhận ra một số hạn chế mà điều này đặt ra trong nghiên cứu của họ, họ viết:
“Ví dụ: phản hồi của “người Mỹ” nên được hiểu rõ hơn là 'Người Mỹ đăng trên Reddit' hoặc thậm chí là 'Người Mỹ đăng trên subreddit cụ thể này'. Tương tự, 'Người Đức' nên được hiểu là 'Người Đức đăng bài trên subreddit cụ thể này', v.v.”
Những cảnh báo này có thể được tinh chỉnh thêm để nói rằng các bài đăng đến từ, chẳng hạn như "những người tự xưng là người Mỹ đăng trên subreddit cụ thể này", vì không có đề cập nào trong bài báo kiểm tra xem liệu những người đăng đằng sau một bài đăng nhất định có thực sự mang tính đại diện hay không. thuộc nhóm nhân khẩu học hoặc thành kiến mà họ tuyên bố là.
Các tác giả tiếp tục tuyên bố rằng họ có ý định khám phá các mô hình phân định sâu hơn về nhân khẩu học (ví dụ: người Đức theo chủ nghĩa tự do, người Đức bảo thủ).
Các kết quả đầu ra do OpinionGPT đưa ra dường như khác nhau giữa việc thể hiện sự thiên vị có thể chứng minh được và sự khác biệt rất lớn so với tiêu chuẩn đã thiết lập, khiến việc phân biệt khả năng tồn tại của nó như một công cụ để đo lường hoặc phát hiện sự thiên vị thực tế trở nên khó khăn.
Theo OpinionGPT, chẳng hạn như trong hình trên, người Mỹ Latinh thiên vị bóng rổ là môn thể thao yêu thích của họ.
Tuy nhiên, nghiên cứu thực nghiệm rõ ràng chỉ rằng bóng đá (còn được gọi là bóng đá ở một số quốc gia) và bóng chày là những môn thể thao phổ biến nhất tính theo lượng người xem và sự tham gia trên khắp Châu Mỹ Latinh.
Bảng tương tự cũng cho thấy OpinionGPT coi “bóng nước” là môn thể thao yêu thích của nó khi được hướng dẫn đưa ra “câu trả lời của một thiếu niên”, một câu trả lời có vẻ thống kê. không trở thành đại diện của hầu hết thanh niên 13-19 tuổi trên toàn thế giới.
Điều tương tự cũng xảy ra với ý tưởng rằng món ăn yêu thích của người Mỹ trung bình là “phô mai”. Chúng tôi tìm thấy hàng chục cuộc khảo sát trực tuyến tuyên bố rằng pizza và hamburger là những món ăn yêu thích của người Mỹ, nhưng không thể tìm thấy một cuộc khảo sát hay nghiên cứu nào khẳng định món ăn số một của người Mỹ chỉ đơn giản là phô mai.
Mặc dù OpinionGPT có thể không phù hợp để nghiên cứu thành kiến thực tế của con người, nhưng nó có thể hữu ích như một công cụ để khám phá các khuôn mẫu vốn có trong các kho tài liệu lớn như các subreddits riêng lẻ hoặc bộ đào tạo AI.
Đối với những người tò mò, các nhà nghiên cứu đã đưa ra OpinionGPT có sẵn trực tuyến để thử nghiệm công khai. Tuy nhiên, theo trang web, những người dùng tương lai nên lưu ý rằng “nội dung được tạo có thể sai, không chính xác hoặc thậm chí tục tĩu”.
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
- PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
- Trung tâmESG. Ô tô / Xe điện, Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
- PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
- ChartPrime. Nâng cao trò chơi giao dịch của bạn với ChartPrime. Truy cập Tại đây.
- BlockOffsets. Hiện đại hóa quyền sở hữu bù đắp môi trường. Truy cập Tại đây.
- nguồn: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test
- : có
- :là
- :không phải
- $ LÊN
- 11
- 30
- 7
- 8
- 80
- a
- ở trên
- Theo
- thực tế
- AI
- Đào tạo AI
- AL
- Alan
- Căn chỉnh
- Ngoài ra
- Mỹ
- American
- Mỹ
- an
- và
- trả lời
- câu trả lời
- bất kì
- xuất hiện
- xuất hiện
- kiến trúc
- LÀ
- xung quanh
- nhân tạo
- trí tuệ nhân tạo
- AS
- tác giả
- Trung bình cộng
- nhận thức
- Bóng chày
- dựa
- Bóng rổ
- BE
- được
- sau
- được
- Berlin
- Hơn
- giữa
- thiên vị
- có thành kiến
- thành kiến
- nhưng
- by
- gọi là
- CAN
- khả năng
- ChatGPT
- xin
- tuyên bố
- tuyên bố
- Rõ ràng
- Cointelegraph
- Đến
- Cộng đồng
- bảo thủ
- chứa
- nội dung
- có thể
- nước
- tạo ra
- tò mò
- dữ liệu
- xác định
- nhân khẩu học
- Nhân khẩu học
- Nguồn gốc
- phát triển
- ĐÃ LÀM
- khác nhau
- khó khăn
- khám phá
- món ăn
- phân biệt
- tài liệu
- Không
- hàng chục
- E&T
- mỗi
- phía đông
- nhúng
- hoàn toàn
- chủ yếu
- thành lập
- vv
- Ngay cả
- ví dụ
- ví dụ
- dự kiến
- khám phá
- Khám phá
- bày tỏ
- thực tế
- sai
- Yêu thích
- Tìm kiếm
- tìm kiếm
- thực phẩm
- thực phẩm
- Bóng đá
- Trong
- tìm thấy
- từ
- chức năng
- xa hơn
- tạo ra
- máy phát điện
- Tiếng Đức
- Cho
- được
- Go
- Đi
- Nhóm
- Các nhóm
- Có
- có
- tại đây
- Tuy nhiên
- HTTPS
- Nhân loại
- ý tưởng
- ie
- if
- hình ảnh
- Va chạm
- in
- không chính xác
- bao gồm
- hệ thống riêng biệt,
- vốn có
- ví dụ
- Sự thông minh
- ý định
- cố ý
- điều tra
- IT
- ITS
- jpg
- nhãn
- Nhãn
- Ngôn ngữ
- lớn
- Tiếng Latin
- Mỹ La-tinh
- người châu Mỹ La-tinh
- trái
- hạn chế
- Loài đà mã ở nam mỹ
- thực hiện
- Làm
- người đàn ông
- đo lường
- Phương tiện truyền thông
- hoàn tất
- Phương pháp luận
- Tên đệm
- Might
- tối thiểu
- kiểu mẫu
- mô hình
- chi tiết
- hầu hết
- Phổ biến nhất
- Thiên nhiên
- nhất thiết
- Mới
- Không
- con số
- of
- on
- ONE
- Trực tuyến
- có thể
- or
- ra
- đầu ra
- kết thúc
- Giấy
- tham gia
- riêng
- người
- người
- Bánh Pizza
- Nơi
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- về mặt chính trị
- Phổ biến
- Bài đăng
- bài viết
- tiềm năng
- quá trình
- công khai
- kéo
- câu hỏi
- trích dẫn
- hơn
- thực
- thế giới thực
- công nhận
- tinh chế
- phản ánh
- liên quan
- mối quan hệ
- đại diện
- đại diện
- đại diện
- nghiên cứu
- nhà nghiên cứu
- Trả lời
- phản ứng
- kết quả
- tương tự
- nói
- các nhà khoa học
- dường như
- riêng biệt
- bộ
- nên
- thể hiện
- Chương trình
- tương tự
- Tương tự
- Đơn giản
- đơn giản
- duy nhất
- Bóng đá
- Mạng xã hội
- truyền thông xã hội
- một số
- Một người nào đó
- riêng
- Quay
- thể thao
- Thể thao
- bắt đầu
- Tiểu bang
- Học tập
- Học tập
- như vậy
- Khảo sát
- hệ thống
- bàn
- nhóm
- thiếu niên
- thử nghiệm
- Kiểm tra
- văn bản
- hơn
- việc này
- Sản phẩm
- thế giới
- cung cấp their dịch
- tự
- sau đó
- Kia là
- họ
- điều này
- những
- Tuy nhiên?
- ngưỡng
- khắp
- đến
- công cụ
- đối với
- Hội thảo
- thử
- Dưới
- hiểu
- trên
- Sử dụng
- đã sử dụng
- Người sử dụng
- biến thể
- rất
- khả năng tồn tại
- bỏ phiếu
- là
- we
- Website
- là
- Điều gì
- khi nào
- liệu
- CHÚNG TÔI LÀ
- với
- người phụ nữ
- từ
- thế giới
- sẽ
- viết
- viết
- năm
- Bạn
- mình
- zephyrnet