متا روز چهارشنبه AudioCraft را منتشر کرد، مجموعه ای از سه مدل هوش مصنوعی که قادر به ایجاد خودکار صدا از توضیحات متن است.
از آنجایی که مدلهای مولد هوش مصنوعی که دستورات نوشتاری را دریافت میکنند و آنها را به تصویر یا متن بیشتری تبدیل میکنند، همچنان به رشد خود ادامه میدهند، دانشمندان رایانه به دنبال ساخت اشکال دیگری از رسانه با استفاده از یادگیری ماشین هستند.
صدا برای سیستمهای هوش مصنوعی، بهویژه موسیقی، دشوار است، زیرا نرمافزار باید یاد بگیرد که الگوهای منسجمی را در چند دقیقه تولید کند و به اندازه کافی خلاق باشد تا چیزی جذاب یا دلپذیر برای شنیدن تولید کند.
تیم متا توضیح داد: «یک قطعه موسیقی معمولی چند دقیقهای که با فرکانس 44.1 کیلوهرتز (که کیفیت استاندارد ضبطهای موسیقی است) نمونهبرداری شده است، از میلیونها گام تشکیل شده است. به این معنا که یک مدل تولید کننده صدا باید داده های زیادی را برای ساخت یک آهنگ دوستدار انسان تولید کند.
در مقایسه، مدلهای تولیدی مبتنی بر متن مانند Llama و Llama 2 با متن پردازش شده به عنوان کلمات فرعی تغذیه میشوند که تنها چند هزار گام در هر نمونه را نشان میدهند.
غول فیس بوک افرادی را تصور می کند که از AudioCraft برای آزمایش صداهای تولید شده توسط رایانه بدون نیاز به یادگیری نواختن هیچ ساز استفاده می کنند. این جعبه ابزار از سه مدل MusicGen، AudioGen و EnCodec تشکیل شده است.
MusicGen بر روی 20,000 ساعت ضبط، تحت مالکیت یا مجوز متا، همراه با توضیحات متنی مربوطه آموزش دیده است. AudioGen بیشتر بر روی تولید جلوه های صوتی متمرکز است تا موسیقی، و بر روی داده های عمومی آموزش دیده است. در نهایت، EnCodec به عنوان یک کدک عصبی با اتلاف توصیف میشود که میتواند سیگنالهای صوتی را با دقت بالا فشرده و از حالت فشرده خارج کند.
متا گفت که AudioCraft "منبع باز" است و تا حدی است. نرم افزار مورد نیاز برای ایجاد و آموزش مدل ها، و اجرای استنتاج، تحت مجوز منبع باز MIT در دسترس است. این کد را می توان در برنامه های کاربردی رایگان (مانند آزادی و آبجو رایگان) و تجاری و همچنین پروژه های تحقیقاتی استفاده کرد.
گفته می شود، وزن های مدل منبع باز نیستند. آنها تحت مجوز Creative Commons به اشتراک گذاشته می شوند که به طور خاص استفاده تجاری را ممنوع می کند. همانطور که دیدیم با لاما 2، هر زمان که متا در مورد چیزهای منبع باز صحبت می کند، بررسی کنید چاپ ریز.
MusicGen و AudioGen صداهایی را تولید میکنند که یک اعلان متن ورودی ایجاد میکنند. میتوانید کلیپهای کوتاه ایجاد شده از توضیحات «سوت زدن همراه با وزش باد» و «آهنگ رقص پاپ با ملودیهای جذاب، سازهای کوبهای استوایی، و ریتمهای شاد، مناسب برای ساحل» را در AudioCraft بشنوید. صفحه فرود، اینجا.
جلوه های صوتی کوتاه واقع گرایانه هستند، اگرچه از نظر ما آنهایی که شبیه به موسیقی هستند عالی نیستند. آنها بهجای تکآهنگهای پرطرفدار، شبیه صدای جینگهای تکراری و عمومی برای موسیقیهای هولد بد یا آهنگهای آسانسور هستند.
محققان در Meta گفتند AudioGen – شرح داده شد در عمق اینجا – با تبدیل صدای خام به دنباله ای از نشانه ها، و بازسازی ورودی با تبدیل مجدد آن به صدا با وفاداری بالا آموزش داده شد. یک مدل زبان، تکههایی از متن ورودی را به نشانههای صوتی نگاشت تا ارتباط بین کلمات و صداها را بیاموزد. MusicGen با استفاده از یک فرآیند مشابه بر روی نمونه های موسیقی به جای جلوه های صوتی آموزش داده شد.
به جای اینکه کار را به عنوان یک جعبه سیاه نفوذ ناپذیر نگه دارید، باز بودن در مورد چگونگی توسعه این مدلها و اطمینان از اینکه استفاده از آنها برای افراد آسان است – چه محققین و چه جامعه موسیقی در کل – به مردم کمک میکند بفهمند این مدلها چه چیزی میتوانند داشته باشند. انجام دهند، بفهمند که آنها چه کاری را نمی توانند انجام دهند، و برای استفاده واقعی از آنها قدرت پیدا کنند.» تیم متا استدلال کرد.
در آینده، هوش مصنوعی مولد میتواند به افراد کمک کند تا زمان تکرار را به میزان قابل توجهی بهبود بخشند و به آنها اجازه میدهد در مراحل اولیه نمونهسازی و grayboxing بازخورد سریعتر دریافت کنند – چه توسعهدهنده بزرگی که دنیاها را برای متاورس میسازد، چه یک موسیقیدان (آماتور، حرفهای یا در غیر این صورت) روی ترکیب بعدی خود کار می کنند، یا یک صاحب کسب و کار کوچک یا متوسط که به دنبال ارتقای سطح دارایی های خلاق خود است.
می توانید کد AudioCraft را دریافت کنید اینجا کلیک نماییدو با MusicGen آزمایش کنید اینجا کلیک نمایید و آن را امتحان کنید ®
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. خودرو / خودروهای الکتریکی، کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- BlockOffsets. نوسازی مالکیت افست زیست محیطی. دسترسی به اینجا.
- منبع: https://go.theregister.com/feed/www.theregister.com/2023/08/02/meta_audiocraft_release/
- : دارد
- :است
- :نه
- $UP
- 000
- 1
- 20
- 7
- a
- درباره ما
- واقعا
- AI
- مدل های هوش مصنوعی
- سیستم های هوش مصنوعی
- اجازه دادن
- در کنار
- اماتور
- an
- و
- هر
- برنامه های کاربردی
- هستند
- استدلال کرد
- AS
- دارایی
- At
- سمعی
- بطور خودکار
- در دسترس
- به عقب
- بد
- BE
- ساحل
- آبجو
- بودن
- میان
- سیاه پوست
- دمیدن
- جعبه
- ساختن
- بنا
- کسب و کار
- by
- CAN
- توانا
- بررسی
- کلیپ های
- CO
- رمز
- منسجم
- تجاری
- مردم عادی
- انجمن
- مقایسه
- ترکیب
- کامپیوتر
- تولید شده توسط رایانه
- تشکیل شده است
- ادامه دادن
- تبدیل
- ارتباط
- متناظر
- میتوانست
- ایجاد
- ایجاد شده
- ایجاد
- خالق
- رقص
- داده ها
- درجه
- عمق
- شرح داده شده
- توسعه
- توسعه دهنده
- مشکل
- do
- در طی
- در اوایل
- ساده
- اثرات
- قدرت
- کافی
- حصول اطمینان از
- پیش بینی می کند
- به خصوص
- تجربه
- توضیح داده شده
- فیس بوک
- سریعتر
- تغذیه
- باز خورد
- کمی از
- وفاداری
- سرانجام
- پایان
- متمرکز شده است
- برای
- اشکال
- رایگان
- آزادی
- از جانب
- آینده
- تولید می کنند
- مولد
- مولد
- هوش مصنوعی مولد
- دریافت کنید
- غول
- داده
- بزرگ
- داشتن
- شنیدن
- کمک
- کمک می کند
- زیاد
- اصابت
- نگه داشتن
- ساعت ها
- چگونه
- HTTPS
- تصاویر
- بهبود
- in
- ورودی
- سند
- به
- IT
- تکرار
- JPG
- تنها
- نگهداری
- زبان
- بزرگ
- یاد گرفتن
- یادگیری
- مجوز
- مجاز
- پسندیدن
- پشم لاما
- به دنبال
- خیلی
- دستگاه
- فراگیری ماشین
- ساخته
- ساخت
- نقشه ها
- بالغ
- رسانه ها
- متا
- متاوررس
- میلیون ها نفر
- دقیقه
- MIT
- مدل
- مدل
- بیش
- موسیقی
- نوازنده
- ضروری
- بعد
- عدد
- of
- on
- آنهایی که
- باز کن
- منبع باز
- نظر
- or
- دیگر
- در غیر این صورت
- ما
- خارج
- تولید
- روی
- متعلق به
- مالک
- با ما
- الگوهای
- مردم
- برای
- دق
- کامل
- افلاطون
- هوش داده افلاطون
- PlatoData
- بازی
- پاپ
- روند
- فرآوری شده
- تولید کردن
- حرفه ای
- پروژه ها
- نمونه سازی
- عمومی
- کیفیت
- نسبتا
- خام
- RE
- واقع بینانه
- منتشر شد
- منتشر شده
- تکراری
- نشان دادن
- تحقیق
- محققان
- دویدن
- s
- سعید
- دید
- گفتن
- دانشمندان
- دنباله
- تنظیم
- به اشتراک گذاشته شده
- کوتاه
- سیگنال
- مشابه
- پس از
- کوچک
- نرم افزار
- چیزی
- صدا
- منبع
- سپارش
- به طور خاص
- مراحل
- استاندارد
- سیستم های
- گرفتن
- مذاکرات
- تیم
- نسبت به
- که
- La
- آینده
- متروورس
- شان
- آنها
- اینها
- آنها
- اگر چه؟
- هزاران نفر
- سه
- زمان
- به
- نشانه
- ابزار
- مسیر
- قطار
- آموزش دیده
- تبدیل شدن
- امتحان
- دور زدن
- نوعی
- زیر
- فهمیدن
- استفاده کنید
- استفاده
- با استفاده از
- به شدت
- بود
- we
- چهار شنبه
- خوب
- چی
- هر زمان که
- چه
- که
- تمام
- باد
- با
- بدون
- کلمات
- مهاجرت کاری
- کارگر
- جهان
- کتبی
- شما
- زفیرنت