ChatGPT 正在取代人类进行人类行为研究,而且效果出奇的好

ChatGPT 正在取代人类进行人类行为研究,而且效果出奇的好

ChatGPT 正在取代人类进行人类行为研究,而且它的效果出奇的好 PlatoBlockchain 数据智能。 垂直搜索。 人工智能。

我是安东尼·波登旅行节目的超级粉丝 零件未知. 在每一集中,厨师都会走访世界各地的偏远村庄,以开放的心态和思想记录当地部落的生活、食物和文化。

该节目让我们一睹人类惊人的多样性。 社会科学家有一个相似的目标——了解不同人、群体和文化的行为——但在受控情况下使用多种方法。 对于两者来说,这些追求的主角都是主体:人类。

但如果用人工智能聊天机器人取代人类呢?

这个想法听起来很荒谬。 然而,由于 ChatGPT 和其他大型语言模型 (LLM) 的出现,社会科学家正在考虑使用这些工具快速构建不同的“模拟人类”群体,并进行实验来探究他们的行为和价值观,作为其生物对应物的代理。

如果您想象的是数字化重建的人类思维,那不是这样。 这个想法是利用 ChatGPT 在模仿人类反应方面的专业知识。 由于这些模型会抓取大量在线数据(博客、Youtube 评论、同人小说、书籍),因此它们很容易捕获多种语言的单词之间的关系。 这些复杂的算法还可以解码语言的细微差别,例如反讽、讽刺、隐喻和情绪语气,这是每种文化中人类交流的一个关键方面。 这些优势使法学硕士能够模仿具有广泛信仰的多个合成人格。

另一个奖金? 与人类参与者相比,ChatGPT 和其他法学硕士不会感到疲倦,使科学家能够以前所未有的速度收集数据并测试有关人类行为的理论。

这个想法虽然有争议,但已经得到了支持。 最近的一篇文章 回顾这个新兴领域发现,在某些精心设计的场景中,ChatGPT 的反应与大约 95% 的人类参与者的反应相关。

人工智能“可以改变社会科学研究的游戏规则” 说过 滑铁卢大学的伊戈尔·格罗斯曼 (Igor Grossman) 博士最近与同事在 科学。 使用关键 硅人 在研究中? 该团队表示,谨慎的偏见管理和数据保真度。

探索人类社会心灵

社会科学到底是什么?

简而言之,它正在研究人类(无论是作为个体还是作为一个群体)在不同环境下的行为方式、他们如何相互作用以及作为一种文化的发展。 它是一个涵盖多个分支的学术追求的总括:经济学、政治学、人类学和心理学。

该学科涉及当前时代精神中突出的广泛主题。 社交媒体对心理健康有何影响? 随着恶劣天气事件的增加,当前公众对气候变化的态度是什么? 不同的文化如何评价沟通方式?什么会引发误解?

社会科学研究从问题和假设开始。 我最喜欢的问题之一:不同文化对体味的容忍程度是否不同? (不开玩笑, 话题 已在医 相当多,是的, 有区别!)

然后,科学家们使用各种方法,如问卷调查、行为测试、观察和建模来检验他们的想法。 调查是一种特别受欢迎的工具,因为问题可以经过严格设计和审查,并且在线分发时可以轻松覆盖到广泛的人群。 然后,科学家分析书面回复并深入了解人类行为。 换句话说,参与者的语言使用对于这些研究至关重要。

那么 ChatGPT 如何融入其中呢?

“西利库斯人”

对于格罗斯曼来说,ChatGPT 或 Google 的 Bard 等聊天机器人背后的法学硕士代表了重新设计社会科学实验的前所未有的机会。

作者表示,由于法学硕士接受过海量数据集的培训,因此“可以代表大量的人类经验和观点”。 因为模型可以无国界地在互联网上自由“漫游”——就像经常出国旅行的人一样——与招募的人类受试者相比,他们可能会采取并表现出更广泛的反应。

ChatGPT 也不会受到研究中其他成员的影响或感到疲倦,这可能使其产生较少偏见的反应。 这些特征在“高风险项目”中可能特别有用,例如,通过社交媒体帖子模仿生活在战争国家或困难政权下的人们的反应。 反过来,这些反应可以为现实世界的干预提供信息。

同样,接受过性别认同或错误信息等文化热门话题培训的法学硕士可以重现不同的理论或意识形态思想流派,为政策提供信息。 人工智能无需费力地对数十万人类参与者进行民意调查,而是可以根据在线讨论快速生成响应。

除了潜在的现实生活用途之外,法学硕士还可以充当数字主体,在社会科学实验中与人类参与者互动,有点类似于视频游戏中的非玩家角色 (NPC)。 例如,法学硕士可以采用不同的“个性”,并通过询问相同的问题,使用文本与全球各地的人类志愿者在线互动。 由于算法不会休眠,因此它可以 24/7 运行。 由此产生的数据可以帮助科学家探索不同文化如何评估相似信息以及观点和错误信息如何传播。

婴儿的步骤

在研究中使用聊天机器人代替人类的想法尚未成为主流。

但早期证据表明它是可行的。 A 印前研究 佐治亚理工学院、微软研究院和奥林学院本月发布的报告发现,法学硕士在许多经典心理学实验中复制了人类的反应,包括臭名昭著的心理学实验 米尔格拉姆冲击实验.

然而一个关键问题仍然存在:这些模型能否真正捕捉到人类的反应?

有几个绊脚石。

首先是算法和训练数据的质量。 大多数在线内容仅由少数几种语言主导。 经过这些数据训练的法学硕士可以轻松模仿使用这些语言的人的情绪、观点甚至道德判断,进而继承训练数据中的偏见。

格罗斯曼说:“这种偏见的再现是一个主要问题,因为它可能会放大社会科学家在研究中努力发现的差异。”

一些科学家还担心法学硕士只是 反刍 他们被告知的事情。 它与社会科学研究相反,社会科学研究的主要目的是捕捉人性的多样性和复杂性之美。 另一方面,ChatGPT 和类似模型以“幻觉的,”编造听起来似乎有道理但实际上是错误的信息。

目前,“大型语言模型依赖于人类经验的‘影子’,”格罗斯曼说。 由于这些人工智能系统很大程度上是黑匣子,因此很难理解它们如何或为何产生某些响应——在行为实验中将它们用作人类代理时有点麻烦。

作者说,尽管存在局限性,“法学硕士允许社会科学家突破传统的研究方法,以创新的方式开展工作。” 作为第一步,硅人可以帮助集思广益并快速检验假设,并在人类中进一步验证有希望的假设。

但社会科学要真正欢迎人工智能,就需要透明、公平以及平等地使用这些强大的系统。 法学硕士的培训既困难又昂贵,最近的模型越来越多地被高额付费墙所关闭。

“我们必须确保社会科学法学硕士,像所有科学模型一样,是开源的,这意味着他们的算法和理想的数据可供所有人审查、测试和修改,” 说过 该研究的作者是滑铁卢大学的 Dawn Parker 博士。 “只有保持透明度和可复制性,我们才能确保人工智能辅助的社会科学研究真正有助于我们对人类经验的理解。”

图片来源: 格德阿尔特曼Pixabay

时间戳记:

更多来自 奇异枢纽