Metaは水曜日、テキストの説明から音声を自動的に作成できるXNUMXつのAIモデルのセットであるAudioCraftをリリースした。
書かれたプロンプトを受け取り、それを画像やその他のテキストに変換する生成 AI モデルが成熟し続ける中、コンピューター科学者は機械学習を使用して他の形式のメディアを作成することを検討しています。
AI システムにとってオーディオ、特に音楽は困難です。なぜなら、ソフトウェアは数分間にわたって一貫したパターンを生成することを学習し、キャッチーで聞き心地の良いものを生成するのに十分な創造性を備えている必要があるからです。
「44.1 kHz (音楽録音の標準品質) でサンプリングされた数分の典型的な音楽トラックは、数百万のタイムステップで構成されています」とチーム メタは説明しました。 つまり、オーディオ生成モデルは人間に優しいトラックを構築するために大量のデータを出力する必要があります。
「それに比べて、Llama や Llama 2 のようなテキストベースの生成モデルには、サンプルあたりわずか数千のタイムステップを表すサブワードとして処理されたテキストが供給されます。」
Facebook の巨人は、人々が AudioCraft を使用して、楽器の演奏を学ばなくてもコンピュータ生成サウンドの作成を実験できるようにすることを構想しています。 このツールキットは、MusicGen、AudioGen、EnCodec の XNUMX つのモデルで構成されています。
MusicGen は、Meta が所有またはライセンスを取得した 20,000 時間の録音と、それに対応するテキストの説明を使用してトレーニングされました。 AudioGen は音楽よりも効果音の生成に重点を置いており、公開データに基づいてトレーニングされています。 最後に、EnCodec は、高忠実度でオーディオ信号を圧縮および解凍できる非可逆ニューラル コーデックとして説明されています。
Meta氏は、AudioCraftを「オープンソース化」していると述べたが、それはある程度のことだ。 モデルの作成とトレーニング、および推論の実行に必要なソフトウェアは、オープンソースの MIT ライセンスの下で入手できます。 このコードは、研究プロジェクトだけでなく、無料 (フリーダムや無料ビールなど) および商用アプリケーションでも使用できます。
とはいえ、モデルの重みはオープンソースではありません。 これらは、商業利用を特に禁止するクリエイティブ コモンズ ライセンスに基づいて共有されます。 で見たように ラマ2、メタがオープンソース関連について話すときは、必ずチェックしてください 細かい文字.
MusicGen と AudioGen は、入力テキスト プロンプトが与えられるとサウンドを生成します。 Meta の AudioCraft で、「風が吹いて口笛が鳴る」や「キャッチーなメロディー、トロピカルなパーカッション、陽気なリズムを備えたビーチに最適なポップ ダンス トラック」という説明から作成された短いクリップを聞くことができます。 ランディングページはこちら.
短い効果音はリアルですが、音楽っぽい効果音はあまり良くないと思います。 それらは、ヒットシングルというよりは、悪いホールドミュージックやエレベーターソングの繰り返しの一般的なジングルのように聞こえます。
Meta の研究者は、AudioGen について次のように述べています。 ここで深く – 生のオーディオを一連のトークンに変換し、これらを高忠実度のオーディオに変換して入力を再構築することによってトレーニングされました。 言語モデルは、入力テキスト プロンプトのスニペットを音声トークンにマッピングして、単語と音の相関関係を学習します。 ミュージックジェネ は、効果音ではなく音楽サンプルに対して同様のプロセスを使用してトレーニングされました。
「研究を不可解なブラックボックスとして保持するのではなく、これらのモデルをどのように開発するかをオープンにして、研究者であろうと音楽コミュニティ全体であろうと、人々がこれらのモデルが何をできるのかを理解するのに役立ちます。実行し、何ができないかを理解し、実際にそれらを使用する権限を与えてください」とチーム・メタは主張した。
「将来的には、メタバース用の世界を構築する大規模な開発者であれ、ミュージシャン (アマチュア、プロ、またはそれ以外の場合は、次の作品に取り組んでいる人、または創造的な資産のレベルを上げたいと考えている中小企業の経営者です。」
AudioCraftコードを取得できます こちら、そして MusicGen を試してみましょう こちら 試してみてください。 ®
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 自動車/EV、 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- ブロックオフセット。 環境オフセット所有権の近代化。 こちらからアクセスしてください。
- 情報源: https://go.theregister.com/feed/www.theregister.com/2023/08/02/meta_audiocraft_release/
- :持っている
- :は
- :not
- $UP
- 000
- 1
- 20
- 7
- a
- 私たちについて
- 実際に
- AI
- AIモデル
- AIシステム
- 許可
- 並んで
- 素人
- an
- および
- どれか
- です
- 主張した
- AS
- 資産
- At
- オーディオ
- 自動的に
- 利用できます
- バック
- 悪い
- BE
- (ダグラス・ビーチ)
- ビール
- さ
- の間に
- ブラック
- 吹きます
- ボックス
- ビルド
- 建物
- ビジネス
- by
- 缶
- できる
- チェック
- クリップ
- CO
- コード
- コヒーレント
- コマーシャル
- コモンズ
- コミュニティ
- 比較
- 構図
- コンピュータ
- コンピューターで生成
- からなる
- 続ける
- 変換
- 相関
- 対応する
- 可能性
- 作ります
- 作成した
- 作成
- クリエイティブ
- ダンス
- データ
- 度
- 深さ
- 記載された
- 開発する
- Developer
- 難しい
- do
- 間に
- 早い
- 簡単に
- 効果
- 権限を与え
- 十分な
- 確保する
- 構想する
- 特に
- 実験
- 説明
- 速いです
- FRBは
- フィードバック
- 少数の
- 忠実
- 最後に
- 終わり
- 焦点を当て
- フォーム
- 無料版
- 自由
- から
- 未来
- 生成する
- 生成
- 生々しい
- 生成AI
- 取得する
- 巨大な
- 与えられた
- 素晴らしい
- 持って
- 聞く
- 助けます
- ことができます
- ハイ
- ヒット
- HOURS
- 認定条件
- HTTPS
- 画像
- 改善します
- in
- 楽器
- に
- IT
- 繰り返し
- JPG
- ただ
- 保管
- 言語
- 大
- LEARN
- 学習
- ライセンス
- ライセンス供与
- ような
- ラマ
- 探して
- たくさん
- 機械
- 機械学習
- 製
- 作成
- ゲレンデマップ
- 成熟した
- メディア
- Meta
- メタバース
- 何百万
- 分
- マサチューセッツ工科大学(MIT)
- モデル
- 他には?
- 音楽を聴く際のスピーカーとして
- ミュージシャン
- 必要とされる
- 次の
- 数
- of
- on
- もの
- 開いた
- オープンソース
- 意見
- or
- その他
- さもないと
- 私たちの
- でる
- 出力
- が
- 所有している
- 所有者
- ページ
- パターン
- のワークプ
- 以下のために
- パーカッション
- 完璧
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プレイ
- ポップ
- プロセス
- 処理済み
- 作り出す
- プロ
- プロジェクト(実績作品)
- プロトタイピング
- 公共
- 品質
- むしろ
- Raw
- RE
- 現実的な
- リリース
- リリース
- 反復的な
- 表す
- 研究
- 研究者
- ラン
- s
- 前記
- 見ました
- 言う
- 科学者たち
- シーケンス
- セッションに
- shared
- ショート
- 信号
- 同様の
- から
- 小さい
- ソフトウェア
- 何か
- 音
- ソース
- 部品調達
- 特に
- ステージ
- 標準
- システム
- 取る
- トーク
- チーム
- より
- それ
- 未来
- メタバース
- アプリ環境に合わせて
- それら
- ボーマン
- 彼ら
- しかし?
- 数千
- 三
- 時間
- 〜へ
- トークン
- ツールキット
- 追跡する
- トレーニング
- 訓練された
- 変換
- 試します
- 順番
- 典型的な
- 下
- わかる
- つかいます
- 中古
- 大いに
- ました
- we
- Wednesday
- WELL
- この試験は
- たびに
- かどうか
- which
- 全体
- 風
- 無し
- 言葉
- 仕事
- ワーキング
- 世界の
- 書かれた
- You
- ゼファーネット