OpenAI によって作成された印象的な新しい生成ビデオ モデルである Sora は、短いテキストの説明を取得して、それを 1 分間の複雑な高解像度のフィルム クリップに変換できます。
OpenAIChatGPT チャットボットと静止画像ジェネレーター DALL-E の親会社である は、このインスタント ビデオ ジェネレーターの強化を競っている多くの企業の 1 つです。他の企業には、Runway のような新興企業や、Google や Facebook や Instagram の所有者である Meta Platforms Inc. などのテクノロジー大手が含まれます。
このテクノロジーは、熟練した映画制作者の作業をスピードアップしながら、スキルの低いデジタル アーティストを完全に置き換える可能性を秘めています。
また読む: OpenAIの共同創設者アンドレイ・カルパシー氏が辞任、個人ベンチャーに目を向ける
テキストからビデオへのモデルである Sora を紹介します。
Sora は、非常に詳細なシーン、複雑なカメラの動き、生き生きとした感情を持った複数のキャラクターをフィーチャーした最大 60 秒のビデオを作成できます。 https://t.co/7j2JN27M3W
プロンプト:「美しい、雪だ... pic.twitter.com/ruTEWn87vf
- OpenAI(@OpenAI) 2024 年 2 月 15 日
ソラを解放する
OpenAI はその新しいシステムを、日本語の空を意味する「Sora」と名付けました。研究者のティム・ブルックス氏とビル・ピーブルズ氏を含むこの技術の開発チームは、「無限の創造的可能性を想起させる」という理由でこの名前を選んだ。
Sora は当社初のビデオ生成モデルです。最長 1 分の HD ビデオを作成できます。 AGI は物理世界をシミュレートできるようになり、Sora はその方向への重要なステップとなります。と一緒にこれに取り組むことができてとてもうれしく思います @billpeeb at @openai 昨年 https://t.co/p4kAkRR0i0 pic.twitter.com/Hipku1LFRM
— ティム・ブルックス (@_tim_brooks) 2024 年 2 月 15 日
また同社は、システムに関連するリスクをまだ調査中であるため、Soraをまだ一般公開していないとも述べた。むしろ、OpenAI は、「レッドチーム」(悪用の可能性を探すことを表す用語)となる学者やその他の外部研究者の選ばれたグループとテクノロジーを共有しています。
ブルックス博士によると、ここでの目的は、人々がこのテクノロジーの機能を確認し、フィードバックを得られるように、今後の展開のプレビューを提供することです。
OpenAI がビデオにタグを付ける
OpenAI はすでに、システムによって作成されたビデオにウォーターマークのタグを付けて、人工知能 (AI) によって生成されたことを示しています。ただし、同社はこれらが削除される可能性があることを認めています。彼らは、それらを特定するのが難しい場合もあると付け加えた。
による OpenAI、彼らは、現実世界のインタラクションを必要とする問題を人々が解決するのに役立つモデルをトレーニングすることを目標に、動いている物理世界を理解し、シミュレーションするように人工知能 (AI) を教えています。
さらに、クリエイティブな専門家にとって最も役立つようにモデルを進化させる方法についてフィードバックを得るために、数人のビジュアル アーティスト、デザイナー、映画製作者にアクセスを許可しています。
これが私たちのビデオ生成モデルである sora です。https://t.co/CDr4DdCrh1
本日、私たちはレッドチームを開始し、限られた数のクリエイターにアクセスを提供します。@_tim_brooks @billpeeb @model_mechanic 本当に信じられないほどです。彼らとチームによる素晴らしい仕事。
注目すべき瞬間。
—サム・アルトマン(@sama) 2024 年 2 月 15 日
彼らは、OpenAI 以外の人々と協力してフィードバックを得て、一般の人々に AI の機能がどのようなものになるのかを理解してもらうために、研究の進捗状況を早期に共有しています。
ソラの開発
しかしながら、 OpenAI システムが学習したビデオの数や、それらがどこから来たのかについては明らかにしなかった。彼らは、トレーニングには一般に公開されているビデオと著作権所有者によってライセンスされたビデオの両方が含まれているとだけ述べました。
同社は著作権で保護されたコンテンツを使用したとして何度か訴訟を起こされている。おそらく競合他社よりも優位性を維持しようとしているため、技術のトレーニングに使用されたデータについては何も開示していません。
さらに、このモデルは言語を深く理解しており、プロンプトを正確に解釈し、感情を生き生きと伝える魅力的なキャラクターを生成することができます。 Sora は、単一生成されたビデオ内で視覚的なショットとキャラクターを維持する複数のショットを生成することもできます。
OpenAI は、X ハンドルでビデオを生成するプロンプトを共有し、X ユーザーからいくつかの反応を引き起こしました。
プロンプト: 「スタイリッシュな女性が、暖かく輝くネオンとアニメーションの街の看板で満たされた東京の通りを歩いています。彼女は黒い革のジャケット、赤い長いドレス、黒いブーツを着ており、黒い財布を持っています。彼女はサングラスと赤い口紅をつけています。彼女は自信を持ってカジュアルに歩いています。 pic.twitter.com/cjIdgYFaWq
- OpenAI(@OpenAI) 2024 年 2 月 15 日
モデルの弱点
OpenAIによると、現在のモデルには弱点があるという。複雑なシーンの物理を正確にシミュレートするのに助けが必要な場合や、原因と結果の特定のインスタンスを理解するのに助けが必要な場合があります。たとえば、人がクッキーを噛んだとしても、その後クッキーに噛み跡が残らない場合があります。
モデルはまた、プロンプトの空間的な詳細 (たとえば、左右の混同) を明確にする必要がある場合や、特定のカメラの軌跡をたどるなど、時間の経過とともに発生するイベントの正確な説明に支援が必要な場合もあります。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://metanews.com/openai-presents-ai-that-produces-eye-popping-videos-instantly/
- :持っている
- :は
- :not
- :どこ
- $UP
- 1
- 12
- 13
- 視聴者の38%が
- 60
- 9
- a
- できる
- 私たちについて
- 学者
- アクセス
- 正確にデジタル化
- 追加されました
- 進める
- 利点
- AGI
- AI
- 既に
- また
- 驚くべき
- 間で
- an
- および
- 何でも
- です
- 人工の
- 人工知能
- 人工知能(AI)
- Artists
- 関連する
- At
- 利用できます
- BE
- なぜなら
- き
- ビル
- ブラック
- ブーツ
- 両言語で
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- 来ました
- カメラ
- 缶
- 機能
- 原因となる
- 原因
- 挑戦
- 文字
- 文字
- チャットボット
- AI言語モデルを活用してコードのデバッグからデータの異常検出まで、
- 選んだ
- 市町村
- 共同創設者
- 企業
- 会社
- 説得力のある
- 競合他社
- 完全に
- 複雑な
- 自信を持って
- コンテンツ
- 著作権
- 作ります
- 作成した
- クリエイティブ
- クリエイター
- 電流プローブ
- ドール
- データ
- 説明する
- 説明
- デザイナー
- 詳細な
- 細部
- 開発
- 開発チーム
- デジタル
- 方向
- 開示する
- そうではありません
- ダウン
- dr
- 早い
- 効果
- 感情
- 有効にする
- 高めます
- イベント
- 例
- 視線
- 特色
- フィードバック
- 埋め
- 膜
- 映画製作者
- 名
- フォロー中
- から
- 利得
- 生成する
- 生成された
- 世代
- 生々しい
- ジェネレータ
- 取得する
- 受け
- 巨人
- 与える
- 目標
- でログイン
- 付与
- グループ
- 持っていました
- ハンドル
- 持ってる
- 助けます
- 役立つ
- こちら
- 高精細度の
- 非常に
- ホルダー
- 地平線
- 認定条件
- How To
- しかしながら
- HTTPS
- アイデア
- 識別する
- 印象的
- in
- (株)
- include
- 含まれました
- 含めて
- 信じられない
- 示す
- インスタグラム
- インスタント
- 瞬時に
- インテリジェンス
- 意図
- 相互作用
- に
- 複雑な
- IT
- ITS
- 日本語
- キープ
- キー
- 言語
- 学んだ
- 左
- less
- ライセンス供与
- ような
- 限定的
- 限りない
- 長い
- 探して
- 維持する
- 多くの
- マーク
- 五月..
- Meta
- メタプラットフォーム
- かもしれない
- 分
- 混合
- モデル
- 瞬間
- 最も
- モーション
- の試合に
- 名
- 名前付き
- 必要
- Neon
- 新作
- 数
- of
- 提供すること
- on
- の
- OpenAI
- or
- その他
- 私たちの
- 外側
- が
- 所有者
- 親会社
- 過去
- のワークプ
- 人
- 個人的な
- 物理的な
- 物理学
- 場所
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 潜在的な
- 正確な
- プレビュー
- 多分
- 問題
- 生産する
- 専門家
- 深遠な
- 進捗
- プロンプト
- 公共
- 公然と
- むしろ
- 反応
- 読む
- 現実の世界
- 本当に
- レッド
- リリース
- 削除済み
- replace
- 必要とする
- 研究
- 研究者
- 右
- リスク
- 滑走路
- 前記
- サム
- Sam Altman
- シーン
- シーン
- 検索
- 味付け
- 秒
- 選択
- センス
- いくつかの
- shared
- シェアリング
- 彼女
- ショット
- ショット
- シミュレートする
- 熟練した
- 空
- So
- 解決する
- 空間の
- 特定の
- start
- ベンチャー
- 起動
- 明記
- 手順
- ステップ
- まだ
- ストリート
- スタイリッシュ
- 訴え
- 取る
- ティーチング
- チーム
- テク
- ハイテク巨人
- テクノロジー
- テクノロジー
- 期間
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- それ
- アプリ環境に合わせて
- それら
- ボーマン
- 彼ら
- この
- 興奮
- ティム
- 時間
- <font style="vertical-align: inherit;">回数</font>
- 〜へ
- 東京
- トレーニング
- トレーニング
- 軌跡
- 最適化の適用
- true
- しよう
- さえずり
- わかる
- 理解する
- 中古
- users
- 活気のある
- ビデオ
- 動画
- ビジュアル
- 散歩
- 暖かいです
- ました
- 透かし
- we
- 弱点
- した
- この試験は
- 何ですか
- while
- 誰
- 意志
- 以内
- 女性
- Word
- 仕事
- 働いていました
- ワーキング
- 世界
- X
- 年
- まだ
- ゼファーネット