Çarşamba günü Meta, metin açıklamalarından otomatik olarak ses oluşturabilen üç AI modelinden oluşan bir dizi AudioCraft'ı piyasaya sürdü.
Yazılı yönlendirmeleri alıp bunları görsellere veya daha fazla metne dönüştüren üretken yapay zeka modelleri olgunlaşmaya devam ettikçe, bilgisayar bilimcileri makine öğrenimini kullanarak diğer medya türlerini oluşturmanın yollarını arıyor.
Yazılımın birkaç dakika içinde tutarlı desenler üretmeyi öğrenmesi ve akılda kalıcı veya dinlenmesi hoş bir şey oluşturacak kadar yaratıcı olması gerektiğinden, ses, özellikle de müzik, yapay zeka sistemleri için zordur.
Team Meta, "44.1 kHz'de (müzik kayıtlarının standart kalitesi olan) örneklenen birkaç dakikalık tipik bir müzik parçası milyonlarca zaman adımından oluşur" diye açıkladı. Yani, ses üreten bir modelin, insan dostu bir parça oluşturmak için çok fazla veri çıkışı yapması gerekir.
"Karşılaştırıldığında, Llama ve Llama 2 gibi metin tabanlı üretken modeller, örnek başına yalnızca birkaç binlerce zaman adımını temsil eden alt kelimeler olarak işlenmiş metinlerle beslenir."
Facebook devi, insanların AudioCraft'ı kullanarak herhangi bir enstrüman çalmayı öğrenmelerine gerek kalmadan bilgisayar tarafından üretilen sesleri denemelerini öngörüyor. Araç seti üç modelden oluşur: MusicGen, AudioGen ve EnCodec.
MusicGen, Meta'nın sahip olduğu veya lisansladığı 20,000 saatlik kayıtların yanı sıra ilgili metin açıklamaları konusunda da eğitildi. AudioGen, müzikten ziyade ses efektleri oluşturmaya daha fazla odaklanmıştır ve halka açık veriler üzerinde eğitilmiştir. Son olarak EnCodec, ses sinyallerini yüksek doğrulukla sıkıştırabilen ve açabilen kayıplı bir sinir kodlayıcı olarak tanımlanıyor.
Meta bunun AudioCraft'ın "açık kaynaklı" olduğunu ve bir dereceye kadar öyle olduğunu söyledi. Modelleri oluşturmak, eğitmek ve çıkarımları yürütmek için gereken yazılım, açık kaynaklı bir MIT lisansı kapsamında mevcuttur. Kod, ücretsiz (özgürlük ve bedava birada olduğu gibi) ve ticari uygulamaların yanı sıra araştırma projelerinde de kullanılabilir.
Bununla birlikte, model ağırlıkları açık kaynak değildir. Ticari kullanımı özellikle yasaklayan Creative Commons lisansı altında paylaşılmaktadır. ile gördüğümüz gibi Llama 2, Meta ne zaman açık kaynak kullanımından bahsetse, kontrol et ince baskı.
MusicGen ve AudioGen, bir giriş metni istemi verildiğinde sesler üretir. Meta'nın AudioCraft'ında "rüzgâr eserken ıslık çalmak" ve "akılda kalıcı melodiler, tropik perküsyonlar ve neşeli ritimlerle plaj için mükemmel bir pop dans parçası" açıklamalarından oluşturulan kısa klipleri duyabilirsiniz. açılış sayfası, burada.
Kısa ses efektleri gerçekçi, ancak müzik benzeri olanlar bizce pek iyi değil. Hit single'lardan ziyade kötü bekleme müziği veya asansör şarkıları için tekrarlayan ve genel jingle'lar gibi geliyorlar.
Meta'daki araştırmacılar AudioGen'in tanımladığını söyledi burada derinlemesine – ham sesi bir dizi jetona dönüştürerek ve bunları yüksek kalitede sese dönüştürerek girişi yeniden yapılandırarak eğitildi. Bir dil modeli, kelimeler ve sesler arasındaki korelasyonu öğrenmek için giriş metni isteminin parçacıklarını ses belirteçleriyle eşleştirir. MüzikGen ses efektleri yerine müzik örnekleri üzerinde benzer bir süreç kullanılarak eğitildi.
"Çalışmayı aşılmaz bir kara kutu olarak tutmak yerine, bu modelleri nasıl geliştirdiğimiz konusunda açık olmak ve bunların insanlar için (ister araştırmacılar ister bir bütün olarak müzik topluluğu olsun) kullanımının kolay olmasını sağlamak, insanların bu modellerin neler yapabileceğini anlamalarına yardımcı olur." yapın, ne yapamayacaklarını anlayın ve bunları gerçekten kullanma yetkisine sahip olun," diye savundu Meta Ekibi.
"Gelecekte, üretken yapay zeka, ister meta veri tabanı için dünyalar inşa eden büyük bir geliştirici, ister bir müzisyen (amatör, profesyonel veya aksi takdirde) bir sonraki kompozisyonları üzerinde çalışıyorlar veya yaratıcı varlıklarını üst düzeye çıkarmak isteyen küçük veya orta ölçekli bir işletme sahibi."
AudioCraft kodunu alabilirsiniz okuyunve MusicGen ile denemeler yapın okuyun ve deneyin. ®
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
- PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
- PlatoESG. Otomotiv / EV'ler, karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
- Blok Ofsetleri. Çevre Dengeleme Sahipliğini Modernleştirme. Buradan Erişin.
- Kaynak: https://go.theregister.com/feed/www.theregister.com/2023/08/02/meta_audiocraft_release/
- :vardır
- :dır-dir
- :olumsuzluk
- $UP
- 000
- 1
- 20
- 7
- a
- Hakkımızda
- aslında
- AI
- AI modelleri
- AI sistemleri
- Izin
- yanında
- amatör
- an
- ve
- herhangi
- uygulamaları
- ARE
- savundu
- AS
- Varlıklar
- At
- ses
- otomatik olarak
- mevcut
- Arka
- Kötü
- BE
- plaj
- bira
- olmak
- arasında
- Siyah
- üfleme
- kutu
- inşa etmek
- bina
- iş
- by
- CAN
- yetenekli
- Kontrol
- klipleri
- CO
- kod
- tutarlı
- ticari
- Avam
- topluluk
- karşılaştırma
- kompozisyon
- bilgisayar
- bilgisayar tarafından oluşturulan
- oluşur
- devam etmek
- dönüştürme
- Ilişki
- uyan
- olabilir
- yaratmak
- çevrimiçi kurslar düzenliyorlar.
- Oluşturma
- Yaratıcı
- dans
- veri
- derece
- derinlik
- tarif edilen
- geliştirmek
- Geliştirici
- zor
- do
- sırasında
- Erken
- kolay
- etkileri
- yetkisi
- yeterli
- sağlanması
- öngörülüyor
- özellikle
- deneme
- açıkladı
- Daha hızlı
- Fed
- geribesleme
- az
- vefa
- Nihayet
- ince
- odaklanmış
- İçin
- formlar
- Ücretsiz
- Freedom
- itibaren
- gelecek
- oluşturmak
- üreten
- üretken
- üretken yapay zeka
- almak
- dev
- verilmiş
- harika
- sahip olan
- duymak
- yardım et
- yardımcı olur
- Yüksek
- vurmak
- ambar
- SAAT
- Ne kadar
- HTTPS
- görüntüleri
- iyileştirmek
- in
- giriş
- enstrüman
- içine
- IT
- tekrarlama
- jpg
- sadece
- koruma
- dil
- büyük
- ÖĞRENİN
- öğrenme
- Lisans
- ruhsatlı
- sevmek
- lama
- bakıyor
- Çok
- makine
- makine öğrenme
- yapılmış
- Yapımı
- Haritalar
- olgun
- medya
- Meta
- metaverse
- milyonlarca
- dakika
- İLE
- model
- modelleri
- Daha
- Music
- Müzisyen
- gerekli
- sonraki
- numara
- of
- on
- olanlar
- açık
- açık kaynak
- Görüş
- or
- Diğer
- aksi takdirde
- bizim
- dışarı
- çıktı
- tekrar
- Sahip olunan
- sahip
- Kanal
- desen
- İnsanlar
- başına
- vurmalı
- MÜKEMMEL OLAN YERİ BULUN
- Platon
- Plato Veri Zekası
- PlatoVeri
- OYNA
- pop
- süreç
- İşlenmiş
- üretmek
- profesyonel
- Projeler
- prototip
- halka açık
- kalite
- daha doğrusu
- Çiğ
- RE
- реалистичный,en
- serbest
- Bildirileri
- tekrarlayan
- temsil etmek
- araştırma
- Araştırmacılar
- koşmak
- s
- Adı geçen
- testere
- söylemek
- bilim adamları
- Dizi
- set
- Paylaşılan
- kısa
- sinyalleri
- benzer
- beri
- küçük
- Yazılım
- bir şey
- Ses
- Kaynak
- Kaynak Bulma
- özellikle
- aşamaları
- standart
- Sistemler
- Bizi daha iyi tanımak için
- Görüşmeler
- takım
- göre
- o
- The
- Gelecek
- metaverse
- ve bazı Asya
- Onları
- Bunlar
- onlar
- gerçi?
- Binlerce
- üç
- zaman
- için
- Jeton
- araç
- iz
- Tren
- eğitilmiş
- dönüşüm
- denemek
- DÖNÜŞ
- tipik
- altında
- anlamak
- kullanım
- Kullanılmış
- kullanma
- çok
- oldu
- we
- Çarşamba
- İYİ
- Ne
- her ne zaman
- olup olmadığını
- hangi
- bütün
- rüzgar
- ile
- olmadan
- sözler
- İş
- çalışma
- Dünyanın en
- yazılı
- Sen
- zefirnet