Sora 是 OpenAI 创建的令人印象深刻的新型生成视频模型,可以将简短的文本描述转换为一分钟长的、复杂的高清电影剪辑。
OpenAIChatGPT 聊天机器人和静态图像生成器 DALL-E 的母公司是众多竞相增强这款即时视频生成器的公司之一。其他公司包括 Runway 等初创企业,以及 Google 和 Facebook 和 Instagram 的所有者 Meta Platforms Inc. 等科技巨头。
该技术有可能完全取代技术水平较低的数字艺术家,同时加快经验丰富的电影制作人的工作速度。
另请参阅: OpenAI 联合创始人 Andrej Karpathy 辞职,转而关注个人风险投资
隆重介绍 Sora,我们的文本转视频模型。
Sora 可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。 https://t.co/7j2JN27M3W
提示:“美丽的,白雪皑皑的...... pic.twitter.com/ruTEWn87vf
- OpenAI(@OpenAI) 2024 年 2 月 15 日
释放索拉
OpenAI 将其新系统命名为 Sora,日语中天空的意思。该技术的开发团队,包括研究人员蒂姆·布鲁克斯和比尔·皮布尔斯,选择这个名字是因为它“唤起了无限创造潜力的想法”。
Sora 是我们的第一个视频生成模型 - 它可以创建长达 1 分钟的高清视频。 AGI 将能够模拟物理世界,而 Sora 是朝这个方向迈出的关键一步。很高兴能与您合作 @比尔皮布 at @openai 在过去的一年 https://t.co/p4kAkRR0i0 pic.twitter.com/Hipku1LFRM
— 蒂姆·布鲁克斯 (@_tim_brooks) 2024 年 2 月 15 日
他们还表示,该公司尚未向公众发布 Sora,因为它仍在调查与该系统相关的风险。相反,OpenAI 正在与一组选定的学者和其他外部研究人员共享该技术,这些研究人员将对该技术进行“红队”(红队),这个术语描述的是寻找潜在的滥用行为。
布鲁克斯博士表示,这样做的目的是预览即将发生的事情,以便人们能够看到这项技术的功能并获得反馈。
OpenAI 为视频添加标签
OpenAI 已经为系统创建的视频添加了水印标记,以表明它们是由人工智能 (AI) 生成的。然而,该公司承认这些可以被删除。他们补充说,识别它们也很困难。
根据 OpenAI他们正在教授人工智能 (AI) 来理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。
此外,他们还向几位视觉艺术家、设计师和电影制作人授予访问权限,以获取有关如何改进该模型以对创意专业人士最有帮助的反馈。
这是我们的视频生成模型 sora:https://t.co/CDr4DdCrh1
今天,我们开始红队并为有限数量的创作者提供访问权限。@_tim_brooks @比尔皮布 @模型机械师 真是不可思议;他们和团队的出色工作。
非凡的时刻。
— 山姆·奥特曼 (@sama) 2024 年 2 月 15 日
他们很早就分享了自己的研究进展,以便开始与 OpenAI 以外的人合作并获取反馈,让公众了解即将出现的人工智能功能。
开发索拉
然而, OpenAI 拒绝透露系统学习的视频数量或视频来源。他们只是表示,培训内容包括公开视频和版权所有者许可的视频。
该公司因使用受版权保护的内容而多次被起诉。它可能是想保持相对于竞争对手的优势,因此它没有透露任何有关用于培训其技术的数据的信息。
此外,该模型对语言有深刻的理解,使其能够准确地解释提示并生成引人注目的字符,生动地传达情感。 Sora 还可以产生多个镜头,以在单个生成的视频中保持视觉镜头和角色。
OpenAI 在其 X 手柄上分享了生成视频的提示,引起了 X 用户的一些反应。
提示:“一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走起路来自信又随意…… pic.twitter.com/cjIdgYFaWq
- OpenAI(@OpenAI) 2024 年 2 月 15 日
该模型的弱点
据 OpenAI 称,当前模型存在弱点。它可能需要帮助来准确模拟复杂场景的物理原理,并且可能需要帮助来理解因果关系的特定实例。例如,一个人可能咬了一块饼干,但之后饼干可能没有咬痕。
该模型可能还需要澄清提示的空间细节,例如,混合左右,并且可能需要帮助精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。
- :具有
- :是
- :不是
- :在哪里
- $UP
- 1
- 12
- 13
- 15%
- 60
- 9
- a
- Able
- 关于
- 学者
- ACCESS
- 准确
- 添加
- 推进
- 优点
- 德盛
- AI
- 已经
- 还
- 惊人
- 其中
- an
- 和
- 什么
- 保健
- 人造的
- 人工智能
- 人工智能(AI)
- 艺术家
- 相关
- At
- 可使用
- BE
- 因为
- 很
- 法案
- 黑色
- 靴子
- 都
- 但是
- by
- 来了
- 相机
- CAN
- 能力
- 原因
- 造成
- 挑战
- 字符
- 字符
- 聊天机器人
- ChatGPT
- 选择
- 城市
- 联合创始人
- 公司
- 公司
- 引人注目
- 竞争对手
- 完全
- 复杂
- 信心十足地
- 内容
- 版权
- 创建信息图
- 创建
- 创意奖学金
- 创作者
- 电流
- 达尔-e
- data
- 描述
- 描述
- 设计师
- 详细
- 详情
- 研发支持
- 开发团队
- 数字
- 方向
- 透露
- 不会
- 向下
- dr
- 早
- 效果
- 情绪
- 使
- 提高
- 事件
- 例子
- 眼部彩妆
- 特色
- 反馈
- 满
- 电影
- 电影制片人
- 姓氏:
- 以下
- 针对
- 止
- Gain增益
- 生成
- 产生
- 代
- 生成的
- 发电机
- 得到
- 越来越
- 巨头
- 给
- 目标
- 谷歌
- 发放
- 团队
- 民政事务总署
- 处理
- 有
- 帮助
- 有帮助
- 相关信息
- 高清
- 高度
- 持有人
- 地平线
- 创新中心
- How To
- 但是
- HTTPS
- 主意
- 鉴定
- 有声有色
- in
- 公司
- 包括
- 包括
- 包含
- 难以置信
- 表明
- 即食类
- 即刻
- 房源搜索
- 意图
- 相互作用
- 成
- 错综复杂
- IT
- 它的
- 日文
- 保持
- 键
- 语言
- 知道
- 左
- 减
- 行货
- 喜欢
- 有限
- 无限
- 长
- 寻找
- 保持
- 许多
- 标记
- 可能..
- 元
- 元平台
- 可能
- 分钟
- 搅和
- 模型
- 模型
- 时刻
- 最先进的
- 运动
- 多
- 姓名
- 命名
- 需求
- 氖
- 全新
- 数
- of
- 提供
- on
- 仅由
- OpenAI
- or
- 其他名称
- 我们的
- 学校以外
- 超过
- 业主
- 母公司
- 过去
- 员工
- 人
- 个人
- 的
- 物理
- 地方
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 潜力
- 精确的
- 预览
- 大概
- 问题
- 产生
- 专业人士
- 深刻的
- 进展
- 提示
- 国家
- 公然
- 宁
- 反应
- 阅读
- 真实的世界
- 真
- 红色
- 释放
- 去除
- 更换
- 要求
- 研究
- 研究人员
- 右
- 风险
- 跑道
- 说
- Sam
- 山姆·奥特曼
- 现场
- 场景
- 搜索
- 老练
- 秒
- 看到
- 选
- 感
- 几个
- 共用的,
- 共享
- 她
- 射击
- 镜头
- 模拟
- 技能的
- 天空
- So
- 解决
- 空间的
- 具体的
- 开始
- 初创公司
- 开始
- 说
- 步
- 步骤
- 仍
- 街头
- 时尚
- 起诉
- 系统
- 采取
- 教诲
- 团队
- 科技
- 科技巨头
- 技术
- 专业技术
- 术语
- 文本
- 这
- 其
- 他们
- 博曼
- 他们
- Free Introduction
- 高兴
- Tim
- 次
- 时
- 至
- 东京
- 培训
- 产品培训
- 轨道
- 改造
- true
- 试图
- 理解
- 理解
- 用过的
- 用户
- 运用
- 充满活力
- 视频
- 视频
- 视觉
- 走
- 温暖
- 是
- 水印
- we
- 弱点
- 为
- 什么是
- 什么是
- 而
- WHO
- 将
- 中
- 女子
- Word
- 工作
- 工作
- 加工
- 世界
- X
- 年
- 但
- 和风网