谷歌宣布推出 Genie,一款用于制作手机游戏的应用程序,作为其持续投资人工智能的一部分。
由谷歌旗下人工智能初创公司 DeepMind 开发的生成式人工智能模型 Genie 进行了现场演示。 Genie 从数十万个游戏视频中学习游戏机制,并可以用最少的提示生成可玩的游戏。
谷歌 DeepMind 推出人工智能“精灵”,可立即变出可玩的游戏 https://t.co/9c6iMsZ1Qa $ GOOG $谷歌
— BizTechia (@BizTechia) 2024 年 2 月 27 日
另请参阅: Figure AI 将为解决劳动力问题的人形机器人筹集 675 亿美元
揭开精灵面纱
正如谷歌官方DeepMind中所述 博客文章,Genie 是使用在线视频训练的基础世界模型。该模型可以通过合成图像、照片甚至草图生成无穷无尽的可玩(动作可控)世界。
Genie 是生成交互环境的缩写,由 Google 和不列颠哥伦比亚大学合作开发。只需一张图像,它就可以根据用户提示生成横向卷轴 2D 平台游戏,例如《魂斗罗》和《超级马里奥兄弟》。
然而,谷歌 DeepMind 在公告中表示,它正在以 Genie 的形式引入生成人工智能(AI)的“新范式”。此外,该公司承认生成式人工智能模型的出现,能够通过语言、图像甚至视频生成新颖且富有创意的内容。
谷歌推出精灵
生成交互环境
介绍一下 Genie,这是第一个通过无标签的互联网视频以无监督方式训练的生成交互环境。该模型可以被提示生成无数种动作可控的虚拟…… pic.twitter.com/ZO1focG7Vx
—AK(@_akhaliq) 2024 年 2 月 26 日
据谷歌称,Genie 接受训练的 200,000 小时无人监管的公共互联网游戏视频中,很大一部分是 2D 平台游戏,而不是完整的虚拟现实游戏。
精灵的规格
在维度方面,Genie 拥有 11 亿个参数。该模型还包含时空视频分词器、自回归动力学模型和简单且可扩展的潜在动作模型。这些规范使 Genie 能够在生成的环境中逐帧运行,即使在训练时没有标签或其他特定领域的要求。
此外,尽管 Genie 接受了纯视频数据的训练,但仍可以指示生成一组多样化的交互式和可控环境。 Genie 只需一张图像提示即可创建可玩的环境,这与众多可以用语言图像甚至视频生成创意内容的生成式 AI 模型不同。
然而,谷歌 DeepMind 开发者 Tim Rocktäschel 在 X(以前的 Twitter)上表示,他们专注于规模而不是添加归纳偏差。
我们不增加归纳偏差,而是关注规模。我们使用来自 200D 平台的超过 2 万小时视频的数据集并训练 11B 世界模型。以无人监督的方式,精灵学习以一致的方式控制角色的各种潜在动作。 pic.twitter.com/71a3iuAGZA
— 蒂姆·罗克塔舍尔 (@_rockt) 2024 年 2 月 26 日
他补充说,他们使用来自 200D 平台游戏的超过 2 万小时视频的数据集并训练 11B 世界模型。以无人监督的方式,精灵学习了持续控制角色的各种潜在动作。
精灵的能力
根据 谷歌 研究人员表示,Genie 由三个模型驱动:预测下一帧中将发生什么的动态模型、将原始视频帧转换为离散标记的视频标记器以及可以推断视频帧之间动作的潜在动作模型。
Genie 的基础模型无需经过动作或文本注释训练即可识别游戏主要角色,这是其独特功能之一。得益于驱动它的模型,用户可以轻松地控制角色 AI生成 虚拟现实环境。
Rocktäschel还表示Genie可以将其他媒体变成游戏。可以要求 Genie 根据随附的 Google DeepMind 研究论文中的各种输入创建各种动作可控的虚拟世界。
我真的很高兴能透露什么 @GoogleDeepMind的开放式团队一直在努力🚀。我们介绍 Genie 🧞,这是一种专门根据互联网视频训练的基础世界模型,可以在给定图像提示的情况下生成无数种动作可控的 2D 世界。 pic.twitter.com/TnQ8uv81wc
— 蒂姆·罗克塔舍尔 (@_rockt) 2024 年 2 月 26 日
此外,Rocktäschel 表示该模型可以将任何图像转换为可玩的 2D 世界。据他介绍,精灵可以将人类设计的创作(例如草图)变为现实,例如塞内卡(Seneca)和凯斯宾(Caspian)这两位有史以来最年轻的世界创造者的美丽艺术品。
- :具有
- :是
- $UP
- 000
- 10
- 11
- 200
- 26%
- 27
- 2D
- a
- 对,能力--
- 根据
- 承认
- 法案
- 操作
- 行动
- 添加
- 添加
- 另外
- AI
- AI模型
- 还
- am
- an
- 和
- 公布
- 公告
- 任何
- 应用
- 保健
- 人造的
- 人工智能
- 人工智能(AI)
- 艺术品
- AS
- At
- 基于
- BE
- 美丽
- 很
- 作为
- 之间
- 偏见
- 亿
- 带来
- 英国的
- 不列颠哥伦比亚省
- 兄弟
- by
- CAN
- 能力
- 字符
- 字符
- COLUMBIA
- 购买的订单均
- 公司
- 一贯
- 始终如一
- 内容
- 控制
- 兑换
- 可以
- 创建信息图
- 创作
- 创意奖学金
- 创作者
- 信用
- data
- DeepMind
- 演示
- 证明
- 尽管
- 发达
- 开发商
- 尺寸
- 不同
- 驾驶
- 驱动
- ,我们将参加
- 动态
- 动力学
- 费力
- 出现
- enable
- 无穷
- 环境
- 环境中
- 甚至
- EVER
- 例子
- 兴奋
- 只
- 特征
- 姓氏:
- 专注焦点
- 针对
- 申请
- 以前
- 基金会
- 基础
- FRAME
- 止
- ,
- 游戏
- 游戏
- Games
- 赌博
- 生成
- 产生
- 发电
- 生成的
- 生成式人工智能
- Genie
- 特定
- 谷歌
- 谷歌的
- 发生
- 高
- 他
- HOURS
- HTTPS
- 人形
- 数百
- 鉴定
- 图片
- 图片
- in
- 包括
- 输入
- 即刻
- 房源搜索
- 互动
- 网络
- 成
- 介绍
- 介绍
- 投资
- IT
- 它的
- JPG
- 只是
- 只有一个
- 标签
- 语言
- 可以学习
- 生活
- 生活
- 使
- 制作
- 方式
- 马里奥
- 最大宽度
- 机械学
- 媒体
- 百万
- 最小
- 联络号码
- 手机游戏
- 模型
- 模型
- 下页
- 小说
- 众多
- of
- 官方
- on
- 一
- 正在进行
- 在线
- 打开
- or
- 其他名称
- 超过
- 纸类
- 参数
- 部分
- 合作伙伴
- 照片
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 一部分
- 预测
- 礼物
- 小学
- 生产
- 生成
- 提示
- 国家
- 提高
- 宁
- 原
- 阅读
- 现实
- 真
- 岗位要求
- 研究
- 研究人员
- 揭示
- s
- 说
- 可扩展性
- 鳞片
- 集
- 短
- 显著
- 简易
- 单
- 规格
- 看台
- 启动
- 说
- 这样
- 超级
- 合成的
- 团队
- 文本
- 比
- 谢谢
- 这
- 博曼
- 他们
- 数千
- 三
- Tim
- 至
- 令牌
- 培训
- 熟练
- 产品培训
- true
- 转
- 原来
- 二
- 独特
- 大学
- 不像
- 推出
- 使用
- 用户
- 运用
- 各种
- 各个
- 通过
- 视频
- 视频
- 在线会议
- 虚拟现实
- 虚拟现实游戏
- 虚拟世界
- 是
- 方法..
- we
- 什么是
- ,尤其是
- 将
- 也完全不需要
- 世界
- 世界
- X
- 最年轻的
- 和风网