Meta が次世代 AI エミュのビデオとエミュ編集を発表

Meta が次世代 AI エミュのビデオとエミュ編集を発表

Meta が次世代 AI エミュ ビデオとエミュ編集 PlatoBlockchain Data Intelligence を発表。垂直検索。あい。

生成 AI の領域は急速な進歩を遂げており、2023 年にはこの分野で大きな進歩が見られます。 Meta (旧 Facebook) は、今年の Meta Connect イベントで、画像生成の画期的な基礎モデルである Emu を紹介しました。 これ テクノロジー Meta のアプリ ファミリ全体、特に Instagram の AI 画像編集ツールにおける数多くの AI エクスペリエンスを支えています。 これらのツールを使用すると、ユーザーは視覚スタイルや背景を変更して写真を変換できます。 さらに、Meta AI の Imagine 機能により、メッセージやグループ チャット内でフォトリアリスティックな画像を容易に生成できます。

ビデオ生成におけるブレークスルー: エミュレーションビデオ

Emu Video は、テキストからビデオへの生成に Emu モデルを利用する、極めて重要な開発として登場しました。 拡散モデルに基づいたこの革新的なアプローチは、高品質のビデオを作成するためのシンプルかつ効率的な方法を提供します。 このプロセスには 512 つのフェーズが含まれます。最初にテキスト プロンプトから画像を生成し、次にテキストと画像の両方を条件としたビデオを作成します。 この因数分解された方法論により、ビデオ生成モデルの効率的なトレーニングが可能になります。 Emu Video の優位性は明らかです。512 fps で 16 × XNUMX ビデオを生成するには XNUMX つの拡散モデルのみが必要であり、複数のモデルが必要だった以前の方法とはまったく対照的です。 人間による評価では、品質とテキスト プロンプトへの準拠性の両方において、そのパフォーマンスが以前のテクノロジーを上回っており、Emu Video が非常に好まれていることが示されています。

画像編集に革命を起こす: Emu Edit

Meta の Emu Edit は、正確なピクセル レベルの変更に焦点を当てた、画像編集におけるパラダイム シフトを表しています。 このツールを使用すると、ローカルおよびグローバルの変更、背景の調整、色や幾何学的変換などの複雑な編集タスクが可能になります。 Emu Edit は、編集命令に関連するピクセルのみが確実に変更され、画像の対象外部分の整合性が維持されるという点で際立っています。 Emu Edit をトレーニングするために、Meta は 10 万の合成サンプルで構成される広範なデータセットを開発しました。各サンプルには、入力画像、編集タスクの説明、ターゲットの出力画像が含まれています。 命令の忠実性と画質の点で優れたパフォーマンスを発揮します。

Meta における生成 AI の未来

生成 AI のこうした進歩は、創造的な表現がよりアクセスしやすく多様になる未来を示唆しています。 Emu Video と Emu Edit は、人々がメディアを作成および共有する方法に革命を起こす可能性があります。 プロのアーティストから一般ユーザーまで、新しい形式の表現と創造性を可能にするツールを提供します。 彼らはプロのクリエイターの代替ではありませんが、自己表現と創造的な探求を強化するためのプラットフォームを提供します。

メディアのレポートでは、Emu Video の合理化されたプロセスと Emu Edit の正確なピクセルレベルの編集機能が強調されています。 このテクノロジーのシンプルさと効率性、そしてビデオや画像の編集に革命をもたらす可能性が強調されています。 ただし、規制当局からの厳しい監視を考慮して、メタはこれらの AI ソリューションの導入に慎重に取り組んでいます。 Metaは、自社のAI機能をFacebookやInstagramでのマーケティングや政治キャンペーンには利用できないことを明らかにした。 それにもかかわらず、プラットフォームの基本的な広告規制は現在、AI について特に扱っていません。

画像ソース:Shutterstock

タイムスタンプ:

より多くの ブロックチェーンニュース