“真实”世界:AI 特工在 16 位虚拟城镇中计划聚会并互相约约会

“真实”世界:AI 特工在 16 位虚拟城镇中计划聚会并互相约约会

“真实”世界:人工智能代理在 16 位虚拟城镇柏拉图区块链数据智能中计划聚会并互相约约会。垂直搜索。人工智能。

“这是关于 25 个视频游戏角色的真实故事,他们被选中住在一个小镇上,并记录下他们的生活……以了解当计算机不再礼貌时会发生什么……以及 开始变得真实设立的区域办事处外,我们在美国也开设了办事处,以便我们为当地客户提供更多的支持。“

谷歌和斯坦福大学的研究人员最近制作了一个新的真人秀节目——用人工智能代理而不是人。

使用 OpenAI 的病毒聊天机器人 ChatGPT 和一些自定义代码,他们生成了 25 个具有背景故事、个性、记忆和动机的 AI 角色。 然后,研究人员将这些角色放入一个 16 位视频游戏小镇,让他们继续他们的生活。 所以呢 当计算机开始变得真实时会发生什么?

“生成代理醒来,做早餐,然后去上班,”研究人员在一篇文章中写道 预印纸 发布到 arXiv 概述了该项目。 “艺术家作画,作者写作; 他们形成意见,互相注意,并发起对话; 他们在计划第二天时会记住并反思过去的日子。”

不完全是引人入胜的电视,但归根结底是一个巨大的机器学习算法……自言自语,令人惊讶地栩栩如生。

AI 小镇 Smallville 只是 AI 迷人时刻的最新发展。 虽然 ChatGPT 的基本版本一次进行一个交互——写一个提示,得到一个回复​​——一些分支项目 正在将 ChatGPT 与其他程序相结合,以自动完成一系列任务。 这些可能包括制作待办事项清单并逐一核对清单上的项目,谷歌搜索信息并总结结果, 编写和调试代码,甚至批评和纠正 ChatGPT 自己的输出。

正是这些级联的互动让《超人前传》也能运作起来。 研究人员精心设计了一系列配套算法,这些算法共同为简单的人工智能代理提供支持,这些代理可以存储记忆,然后根据这些记忆进行反思、计划和行动。

第一步是创建角色。 为此,研究人员以详细提示的形式编写基本记忆,描述该角色的个性、动机和情况。 这是论文中的一个简短示例:“John Lin 是 Willow Market and Pharmacy 的一名药店店主,他喜欢帮助别人。 他一直在寻找使客户更容易获得药物的方法。 John Lin 与大学教授妻子 Mei Lin 和正在学习音乐理论的儿子 Eddy Lin 住在一起。”

但表征还不够。 每个角色也需要一段记忆。 因此,该团队创建了一个名为“记忆流”的数据库,用日常语言记录代理人的经历。

当访问记忆流时,代理会显示最近的、重要的和相关的记忆。 最“重要”的事件被记录为独立的记忆,研究人员称之为“反思”。 最后,智能体使用一组越来越详细的提示来创建计划,这些提示将一天分成越来越小的时间增量——每个高级计划因此被分解成更小的步骤。 这些计划也被添加到内存流中以供检索。

随着智能体开始一天的工作——将文本提示转化为行动以及与游戏中其他角色的对话——它利用其经验、思考和计划的记忆流来通知每个行动和对话。 同时,新的体验反馈到信息流中。 这个过程相当简单,但当通过 ChatGPT 接口与 OpenAI 的大型语言模型相结合时,输出却出奇地复杂,甚至是突发的。

在一次测试中,该团队促使一个角色伊莎贝拉计划一个情人节派对,并促使另一个角色玛丽亚暗恋第三个角色克劳斯。 伊莎贝拉继续邀请朋友和顾客参加聚会,装饰咖啡馆,并招募她的朋友玛丽亚帮忙。 玛丽亚向克劳斯提到了派对并邀请他和她一起去。 五名特工参加了聚会——但同样是人——有几个人表现不佳或根本没有出现。

除了最初的种子——党的计划和迷恋——其余的都是自动出现的。 作者写道:“传播信息、装饰、互相约见、到达派对以及在派对上相互交流等社交行为都是由代理架构发起的。”

值得注意的是,在大多数情况下,这可以通过简单地将 ChatGPT 拆分为多个功能部分和个性并相互发挥作用来实现。

视频游戏是这种可信、开放式交互的最明显应用,尤其是与高保真化身结合使用时。 非玩家角色可以从脚本交互演变为 与令人信服的人物对话.

研究人员警告说,人们可能会想与现实人物建立关系——已经存在的趋势——设计师应该注意添加内容护栏,并在角色是代理人时始终否认。 其他风险包括一般适用于生成式 AI 的风险,例如错误信息的传播和对代理的过度依赖。

这种方法 可能不够实用 尚未在主流视频游戏中工作,但这确实表明这样的未来可能很快就会到来。

代理商的更大趋势也是如此。 尽管大肆宣传,但目前的实施仍然有限. 但是连接多个算法——完成插件和互联网访问——可能允许创建有能力的、类似助手的代理,这些代理可以在提示时执行多步任务。 从长远来看,这种自动化人工智能可能非常有用,但也会带来算法失调导致大规模意外问题的风险。

目前,最明显的是生成式 AI 与开发人员和研究人员社区之间的舞蹈如何继续呈现出令人惊讶的新方向和新功能——一个目前还没有放缓迹象的反馈循环。

图片来源:“生成代理:人类行为的交互式模拟”,Joon Sung Park、Joseph C. O'Brien、Carrie J. Cai、Meredith Ringel Morris、Percy Liang、Michael S. Bernstein

时间戳记:

更多来自 奇异枢纽