ChatGPT đang thay thế con người trong các nghiên cứu về hành vi của con người—và nó hoạt động tốt một cách đáng ngạc nhiên

ChatGPT đang thay thế con người trong các nghiên cứu về hành vi của con người—và nó hoạt động tốt một cách đáng ngạc nhiên

ChatGPT đang thay thế con người trong các nghiên cứu về hành vi con người—và nó hoạt động hiệu quả một cách đáng ngạc nhiên. Tìm kiếm dọc. Ái.

Tôi là một fan cuồng của chương trình du lịch của Anthony Bourdain Những phần không biết. Trong mỗi tập phim, người đầu bếp đến thăm những ngôi làng xa xôi trên toàn cầu, ghi lại cuộc sống, ẩm thực và văn hóa của các bộ lạc trong khu vực bằng một trái tim và khối óc rộng mở.

Chương trình cung cấp một cái nhìn thoáng qua về sự đa dạng đáng kinh ngạc của nhân loại. Các nhà khoa học xã hội có mục tiêu tương tự—hiểu hành vi của những người, nhóm và nền văn hóa khác nhau—nhưng sử dụng nhiều phương pháp khác nhau trong các tình huống được kiểm soát. Đối với cả hai, ngôi sao của những theo đuổi này là đối tượng: con người.

Nhưng nếu bạn thay thế con người bằng chatbot AI thì sao?

Ý tưởng nghe có vẻ phi lý. Tuy nhiên, nhờ sự ra đời của ChatGPT và các mô hình ngôn ngữ lớn (LLM) khác, các nhà khoa học xã hội đang nảy ra ý tưởng sử dụng những công cụ này để nhanh chóng xây dựng các nhóm “con người mô phỏng” đa dạng và chạy thử nghiệm để thăm dò hành vi và giá trị của họ như một đại diện cho đối tác sinh học của chúng.

Nếu bạn đang tưởng tượng tâm trí con người được tái tạo bằng kỹ thuật số, thì không phải vậy. Ý tưởng là khai thác chuyên môn của ChatGPT trong việc bắt chước phản ứng của con người. Bởi vì các mô hình thu thập lượng dữ liệu trực tuyến khổng lồ—blog, bình luận trên Youtube, tiểu thuyết của người hâm mộ, sách—chúng dễ dàng nắm bắt được mối quan hệ giữa các từ trong nhiều ngôn ngữ. Các thuật toán phức tạp này cũng có thể giải mã các khía cạnh sắc thái của ngôn ngữ, chẳng hạn như sự mỉa mai, mỉa mai, ẩn dụ và giọng điệu cảm xúc, một khía cạnh quan trọng trong giao tiếp của con người trong mọi nền văn hóa. Những điểm mạnh này giúp các LLM bắt chước nhiều tính cách tổng hợp với nhiều niềm tin khác nhau.

Một phần thưởng khác? So với những người tham gia là con người, ChatGPT và các LLM khác không mệt mỏi, cho phép các nhà khoa học thu thập dữ liệu và kiểm tra các lý thuyết về hành vi của con người với tốc độ chưa từng thấy.

Ý tưởng này, mặc dù gây tranh cãi, nhưng đã nhận được sự ủng hộ. Một bài báo gần đây khi xem xét lĩnh vực non trẻ này, chúng tôi nhận thấy rằng trong một số tình huống được thiết kế cẩn thận nhất định, phản hồi của ChatGPT tương quan với phản hồi của khoảng 95% người tham gia.

AI “có thể thay đổi cuộc chơi nghiên cứu khoa học xã hội,” nói Tiến sĩ Igor Grossman tại Đại học Waterloo, người cùng với các đồng nghiệp gần đây đã viết một bài báo về tương lai trong Khoa học. Chìa khóa để sử dụng Homo silic trong nghiên cứu? Nhóm nghiên cứu cho biết quản lý thiên vị cẩn thận và độ trung thực của dữ liệu.

Thăm dò tâm trí xã hội con người

Khoa học xã hội chính xác là gì?

Nói một cách đơn giản, nó đang nghiên cứu cách con người—với tư cách cá nhân hoặc một nhóm—hành xử trong những hoàn cảnh khác nhau, cách họ tương tác với nhau và phát triển như một nền văn hóa. Đó là một chiếc ô theo đuổi học thuật với nhiều ngành: kinh tế, khoa học chính trị, nhân chủng học và tâm lý học.

Kỷ luật giải quyết một loạt các chủ đề nổi bật trong hệ tư tưởng hiện tại. Tác động của phương tiện truyền thông xã hội đối với sức khỏe tâm thần là gì? Thái độ của công chúng hiện nay đối với biến đổi khí hậu khi các đợt thời tiết khắc nghiệt gia tăng là gì? Các nền văn hóa khác nhau coi trọng các phương pháp giao tiếp như thế nào—và điều gì gây ra hiểu lầm?

Một nghiên cứu khoa học xã hội bắt đầu với một câu hỏi và một giả thuyết. Một trong những sở thích của tôi: các nền văn hóa có chịu đựng mùi cơ thể khác nhau không? (Không đua đâu, đề tài đã được nghiên cứu một chút, và vâng, có một sự khác biệt!)

Sau đó, các nhà khoa học sử dụng nhiều phương pháp khác nhau, chẳng hạn như bảng câu hỏi, kiểm tra hành vi, quan sát và lập mô hình để kiểm tra ý tưởng của họ. Các cuộc khảo sát là một công cụ đặc biệt phổ biến, bởi vì các câu hỏi có thể được thiết kế và hiệu đính chặt chẽ và dễ dàng tiếp cận nhiều người khi được phân phối trực tuyến. Sau đó, các nhà khoa học phân tích các câu trả lời bằng văn bản và rút ra những hiểu biết sâu sắc về hành vi của con người. Nói cách khác, việc sử dụng ngôn ngữ của người tham gia là rất quan trọng đối với những nghiên cứu này.

Vậy ChatGPT phù hợp như thế nào?

'Người đồng tính Silicus'

Đối với Grossman, LLM đằng sau các chatbot như ChatGPT hay Bard của Google thể hiện một cơ hội chưa từng có để thiết kế lại các thí nghiệm khoa học xã hội.

Các tác giả cho biết, vì được đào tạo trên các tập dữ liệu khổng lồ nên LLM “có thể đại diện cho rất nhiều trải nghiệm và quan điểm của con người”. Bởi vì các mô hình “đi lang thang” tự do không biên giới trên internet—giống như những người thường xuyên đi du lịch quốc tế—họ có thể áp dụng và thể hiện phạm vi phản hồi rộng hơn so với các đối tượng là con người được tuyển dụng.

ChatGPT cũng không bị ảnh hưởng bởi các thành viên khác trong nghiên cứu hoặc cảm thấy mệt mỏi, có khả năng cho phép nó tạo ra phản hồi ít thiên vị hơn. Những đặc điểm này có thể đặc biệt hữu ích trong “các dự án có rủi ro cao” - ví dụ: bắt chước phản ứng của những người sống ở các quốc gia có chiến tranh hoặc có chế độ khó khăn thông qua các bài đăng trên mạng xã hội. Đổi lại, các phản hồi có thể cung cấp thông tin về các biện pháp can thiệp trong thế giới thực.

Tương tự, các LLM được đào tạo về các chủ đề nóng về văn hóa như bản sắc giới tính hoặc thông tin sai lệch có thể tái tạo các trường phái tư tưởng hoặc lý thuyết khác nhau để thông báo chính sách. Thay vì cẩn thận thăm dò ý kiến ​​của hàng trăm nghìn người tham gia là con người, AI có thể nhanh chóng tạo ra phản hồi dựa trên diễn ngôn trực tuyến.

Bên cạnh việc sử dụng thực tế tiềm năng, LLM cũng có thể hoạt động như các đối tượng kỹ thuật số tương tác với những người tham gia là con người trong các thí nghiệm khoa học xã hội, hơi giống với các nhân vật không phải người chơi (NPC) trong trò chơi điện tử. Ví dụ: LLM có thể áp dụng các “tính cách” khác nhau và tương tác trực tuyến với các tình nguyện viên trên toàn cầu bằng văn bản bằng cách hỏi họ cùng một câu hỏi. Bởi vì các thuật toán không ngủ, nên nó có thể chạy 24/7. Sau đó, dữ liệu kết quả có thể giúp các nhà khoa học khám phá cách các nền văn hóa đa dạng đánh giá thông tin tương tự và cách các quan điểm—và thông tin sai lệch—lan truyền.

Bước chân em bé

Ý tưởng sử dụng chatbot thay cho con người trong các nghiên cứu vẫn chưa phải là chủ đạo.

Nhưng có bằng chứng ban đầu rằng nó có thể hoạt động. MỘT nghiên cứu trước được phát hành vào tháng này từ Georgia Tech, Microsoft Research và Olin College đã phát hiện ra rằng một LLM sao chép phản ứng của con người trong nhiều thí nghiệm tâm lý học cổ điển, bao gồm cả thí nghiệm nổi tiếng Thí nghiệm sốc Milgram.

Tuy nhiên, vẫn còn một câu hỏi quan trọng: những mô hình này có thể thực sự nắm bắt được phản ứng của con người tốt đến mức nào?

Có một số trở ngại.

Đầu tiên là chất lượng của thuật toán và dữ liệu huấn luyện. Hầu hết nội dung trực tuyến bị chi phối bởi chỉ một số ít ngôn ngữ. Một LLM được đào tạo dựa trên những dữ liệu này có thể dễ dàng bắt chước cảm xúc, quan điểm hoặc thậm chí là đánh giá đạo đức của những người sử dụng các ngôn ngữ đó—đến lượt nó lại thừa hưởng sự thiên vị từ dữ liệu đào tạo.

Grossman cho biết: “Sự sao chép sai lệch này là một mối quan tâm lớn vì nó có thể khuếch đại sự chênh lệch rất lớn mà các nhà khoa học xã hội cố gắng khám phá trong nghiên cứu của họ.

Một số nhà khoa học cũng lo lắng rằng LLMs chỉ là hồi phục những gì họ được nói. Đó là phản đề của một nghiên cứu khoa học xã hội, trong đó điểm chính là nắm bắt được con người trong tất cả vẻ đẹp đa dạng và phức tạp của nó. Mặt khác, ChatGPT và các mô hình tương tự được biết là “ảo giác,” bịa ra thông tin nghe có vẻ hợp lý nhưng lại sai sự thật.

Hiện tại, “các mô hình ngôn ngữ lớn dựa vào 'những cái bóng' của trải nghiệm con người," Grossman nói. Bởi vì các hệ thống AI này phần lớn là các hộp đen, nên rất khó để hiểu cách thức hoặc lý do tại sao chúng tạo ra các phản hồi nhất định—một điều hơi phiền phức khi sử dụng chúng làm đại diện cho con người trong các thí nghiệm hành vi.

Các tác giả cho biết, bất chấp những hạn chế, “LLM cho phép các nhà khoa học xã hội thoát khỏi các phương pháp nghiên cứu truyền thống và tiếp cận công việc của họ theo những cách sáng tạo”. Bước đầu tiên, Homo silicus có thể giúp động não và nhanh chóng kiểm tra các giả thuyết, trong đó những giả thuyết đầy hứa hẹn sẽ được xác nhận sâu hơn trong quần thể người.

Nhưng để các ngành khoa học xã hội thực sự chào đón AI, cần phải có sự minh bạch, công bằng và quyền tiếp cận bình đẳng đối với các hệ thống mạnh mẽ này. Các LLM rất khó đào tạo và tốn kém, với các mô hình gần đây ngày càng đóng cửa sau những bức tường phí khổng lồ.

“Chúng ta phải đảm bảo rằng các LLM khoa học xã hội, giống như tất cả các mô hình khoa học, là mã nguồn mở, nghĩa là các thuật toán và dữ liệu lý tưởng của chúng đều có sẵn cho tất cả mọi người để xem xét, kiểm tra và sửa đổi,” nói tác giả nghiên cứu Tiến sĩ Dawn Parker tại Đại học Waterloo. “Chỉ bằng cách duy trì tính minh bạch và khả năng nhân rộng, chúng ta mới có thể đảm bảo rằng nghiên cứu khoa học xã hội do AI hỗ trợ thực sự đóng góp vào hiểu biết của chúng ta về trải nghiệm của con người.”

Ảnh: Gerd AltmannPixabay

Dấu thời gian:

Thêm từ Trung tâm cá biệt