人工智能已经掌握了人类已知的一些最复杂的游戏,但模型通常是为解决特定类型的挑战而定制的。 其创建者表示,一种新的 DeepMind 算法可以处理更广泛的游戏,这可能是迈向更通用人工智能的一步。
使用游戏作为人工智能的基准有着悠久的历史。 1997 年,IBM 的“深蓝”算法击败国际象棋世界冠军加里·卡斯帕罗夫,被誉为该领域的里程碑。 同样,当 DeepMind 的 AlphaGo 被击败 2016 年,世界顶级围棋选手之一李世石 (Lee Sedol) 的演讲引发了人们对人工智能潜力的一阵兴奋。
DeepMind 凭借 AlphaZero 取得了成功,一个掌握了多种游戏的模型,包括国际象棋和将棋。 但尽管如此令人印象深刻,AlphaZero 只适用于完美信息游戏,其中游戏的每个细节(除了对手的意图)对双方玩家都是可见的。 这包括围棋和国际象棋等游戏,双方玩家始终可以看到棋盘上的所有棋子。
相反,不完美信息游戏涉及对其他玩家隐藏的一些细节。 扑克就是一个典型的例子,因为玩家无法看到对手拿着什么牌。 现在也有一些模型可以在此类游戏中击败专业人士,但它们使用的方法与 AlphaZero 等算法完全不同。
现在,DeepMind 的研究人员结合了这两种方法的要素,创建了一个可以在国际象棋、围棋和扑克方面击败人类的模型。 该团队声称,这一突破可以加速创建更通用的人工智能算法的努力,这些算法可以学习解决各种任务。
构建人工智能来玩完美信息游戏的研究人员通常依赖于一种称为树搜索的方法。 这探索了游戏从当前状态发展的多种方式,不同的分支映射了潜在的移动序列。 AlphaGo 将树搜索与机器学习技术相结合,模型通过反复对弈并从错误中学习来完善其技能。
当谈到不完美信息博弈时,研究人员倾向于依赖博弈论,使用数学模型来制定战略问题的最合理的解决方案。 博弈论在经济学中广泛用于理解人们如何在不同情况下做出选择,其中许多选择涉及不完全信息。
2016 年,出现了一个名为 深栈 在无限注扑克中击败了人类专业人士,但该模型针对该特定游戏是高度专业化的。 然而,DeepStack 团队的大部分成员现在都在 DeepMind 工作,他们将用于构建 DeepStack 的技术与 AlphaZero 中使用的技术结合起来。
这种新算法被称为“游戏学生”,它结合了树搜索、自我对弈和博弈论来解决完美和不完美的信息游戏。 在一个 进纸 科学,研究人员报告说,该算法击败了最好的公开可用的人工智能扑克游戏 Slumbot,并且还可以达到人类专业水平的围棋和国际象棋,尽管它无法与 AlphaZero 等专门算法相匹配。
但在人工智能研究中,成为一名多面手而不是一名大师可以说是一个更大的奖项。 虽然深度学习通常可以在特定任务上实现超人的表现,但开发可应用于广泛问题的更通用形式的人工智能则更加棘手。 研究人员表示,能够解决完美和不完美信息博弈的模型是“迈向任意环境的真正通用算法的重要一步”。
重要的是不要从结果中推断太多,来自英国爱丁堡大学的 Michael Rovatsos, 告诉 “新科学家”. 人工智能仍然在简单且受控的游戏环境中运行,其中可能的动作数量有限,规则也明确定义。 这与现实世界的混乱现实相去甚远。
但即使这只是一小步,能够将两种截然不同的游戏的领先方法结合到一个模型中也是一项重大成就。 这肯定可以成为未来功能更强大、更通用的模型的蓝图。
- :具有
- :是
- :不是
- :在哪里
- 2016
- a
- Able
- 关于
- 加快
- 成就
- 行动
- AI
- 研究
- 算法
- 算法
- 所有类型
- 还
- 时刻
- an
- 和
- 应用的
- 的途径
- 方法
- 保健
- 按理说
- AS
- At
- 可使用
- 母婴
- BE
- 打
- 因为
- 作为
- 基准
- 最佳
- 大
- 蓝色
- 蓝图
- 板
- 都
- 分支机构
- 突破
- 建立
- 建筑物
- 建
- 但是
- by
- 被称为
- CAN
- 能力
- 当然
- 挑战
- 冠军
- 棋
- 选择
- 索赔
- 经典
- 明确地
- 组合
- 结合
- 结合
- 购买的订单均
- 复杂
- 对比
- 受控
- 可以
- 创建信息图
- 创作者
- 信用
- 电流
- 当前状态
- 深
- 深入学习
- DeepMind
- 定义
- 细节
- 详情
- 发展
- 不同
- 经济学
- 工作的影响。
- 分子
- 完全
- 环境
- 环境中
- 甚至
- 所有的
- 例子
- 激动
- 探讨
- 广泛
- 远
- 孤岛惊魂
- 部分
- 慌张
- 针对
- 形式
- 止
- 未来
- 游戏
- Games
- 其他咨询
- 一般情报
- 通常
- Go
- 手
- 有
- 老旧房屋
- 高度
- 保持
- 创新中心
- 但是
- HTTPS
- 人
- 人类
- if
- 重要
- 有声有色
- in
- 包括
- 包含
- 信息
- 代替
- 房源搜索
- 意图
- 涉及
- IT
- 它的
- 本身
- 已知
- 领导
- 学习用品
- 学习
- 导致
- 李
- Level
- 喜欢
- 有限
- 长
- 机
- 机器学习
- 使
- 男子
- 许多
- 地图
- 制图
- 主
- 匹配
- 数学的
- Michael (中国)
- 里程碑
- 错误
- 模型
- 模型
- 更多
- 最先进的
- 移动
- 许多
- 多数
- 全新
- 现在
- 数
- of
- 经常
- on
- 一
- 仅由
- 公然
- 操作
- 对手
- 其他名称
- 输出
- 特别
- 员工
- 性能
- 件
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 播放
- 播放机
- 球员
- 播放
- 扑克
- 可能
- 潜力
- 奖金
- 问题
- 所以专业
- 专业人士
- 进展
- 范围
- 宁
- 合理的
- 真实
- 真实的世界
- 现实
- 依靠
- 反复
- 报告
- 研究
- 研究人员
- 成果
- 定位、竞价/采购和分析/优化数字媒体采购,但算法只不过是解决问题的操作和规则。
- 对工资盗窃
- 说
- 科学
- 搜索
- 看到
- 显著
- 同样
- 简易
- 单
- 情况
- 技能
- 解决方案
- 解决
- 一些
- 专门
- 具体的
- 州/领地
- 步
- 仍
- 善用
- 学生
- 成功
- 滑车
- 量身定制
- 任务
- 团队
- 技术
- 技术
- 比
- 这
- 未来
- 其
- 理论
- 那里。
- 博曼
- 他们
- Free Introduction
- 那些
- 虽然?
- 至
- 也有
- 最佳
- 对于
- 向
- 树
- 真正
- 二
- Uk
- 理解
- 大学
- 使用
- 用过的
- 使用
- 运用
- 各种
- 非常
- 可见
- 是
- 方法
- 什么是
- ,尤其是
- 这
- 而
- 宽
- 大范围
- 更宽
- 中
- 工作
- 合作
- 世界
- 世界
- 和风网