मेटा ने बुधवार को ऑडियोक्राफ्ट जारी किया, जो तीन एआई मॉडल का एक सेट है जो पाठ विवरण से स्वचालित रूप से ध्वनि बनाने में सक्षम है।
जैसे-जैसे जेनेरिक एआई मॉडल लिखित संकेत लेते हैं और उन्हें छवियों या अधिक टेक्स्ट में बदलते हैं, परिपक्व होते जा रहे हैं, कंप्यूटर वैज्ञानिक मशीन लर्निंग का उपयोग करके मीडिया के अन्य रूप बनाने पर विचार कर रहे हैं।
एआई सिस्टम, विशेष रूप से संगीत के लिए ऑडियो कठिन है, क्योंकि सॉफ़्टवेयर को कई मिनटों में सुसंगत पैटर्न बनाना सीखना होता है और सुनने के लिए कुछ आकर्षक या सुखद उत्पन्न करने के लिए पर्याप्त रचनात्मक होना पड़ता है।
टीम मेटा ने बताया, "44.1 किलोहर्ट्ज़ (जो संगीत रिकॉर्डिंग की मानक गुणवत्ता है) पर नमूना किए गए कुछ मिनटों का एक विशिष्ट संगीत ट्रैक में लाखों टाइमस्टेप होते हैं।" कहने का तात्पर्य यह है कि, एक ऑडियो-जनरेटिंग मॉडल को मानव-अनुकूल ट्रैक बनाने के लिए बहुत सारे डेटा का आउटपुट देना पड़ता है।
"तुलना में, लामा और लामा 2 जैसे टेक्स्ट-आधारित जेनरेटर मॉडल को उप-शब्दों के रूप में संसाधित पाठ के साथ खिलाया जाता है जो प्रति नमूना केवल कुछ हज़ार टाइमस्टेप का प्रतिनिधित्व करता है।"
फेसबुक की दिग्गज कंपनी की कल्पना है कि ऑडियोक्राफ्ट का उपयोग करने वाले लोग किसी भी उपकरण को बजाना सीखे बिना कंप्यूटर-जनित ध्वनि बनाने का प्रयोग करेंगे। टूलकिट तीन मॉडलों से बना है: MusicGen, AudioGen, और EnCodec।
MusicGen को मेटा के स्वामित्व या लाइसेंस प्राप्त 20,000 घंटों की रिकॉर्डिंग के साथ-साथ उनके संबंधित पाठ विवरण पर प्रशिक्षित किया गया था। AudioGen संगीत के बजाय ध्वनि प्रभाव उत्पन्न करने पर अधिक केंद्रित है, और इसे सार्वजनिक डेटा पर प्रशिक्षित किया गया था। अंत में, एनकोडेक को एक हानिपूर्ण तंत्रिका कोडेक के रूप में वर्णित किया गया है जो उच्च निष्ठा के साथ ऑडियो सिग्नल को संपीड़ित और डीकंप्रेस कर सकता है।
मेटा ने कहा कि यह "ओपन सोर्सिंग" ऑडियोक्राफ्ट था, और यह एक हद तक है। मॉडल बनाने और प्रशिक्षित करने और अनुमान चलाने के लिए आवश्यक सॉफ़्टवेयर ओपन-सोर्स एमआईटी लाइसेंस के तहत उपलब्ध है। कोड का उपयोग मुफ़्त (जैसे आज़ादी और मुफ़्त बियर में) और व्यावसायिक अनुप्रयोगों के साथ-साथ अनुसंधान परियोजनाओं में भी किया जा सकता है।
जैसा कि कहा गया है, मॉडल भार खुला स्रोत नहीं हैं। इन्हें क्रिएटिव कॉमन्स लाइसेंस के तहत साझा किया जाता है जो विशेष रूप से व्यावसायिक उपयोग को प्रतिबंधित करता है। जैसा कि हमने साथ देखा लामा 2, जब भी मेटा ओपन सोर्सिंग सामग्री के बारे में बात करता है, तो जाँच करें ठीक प्रिंट.
MusicGen और AudioGen एक इनपुट टेक्स्ट प्रॉम्प्ट दिए जाने पर ध्वनियाँ उत्पन्न करते हैं। आप मेटा के ऑडियोक्राफ्ट पर "हवा के झोंके के साथ सीटी बजाना" और "आकर्षक धुनों, उष्णकटिबंधीय ताल और उत्साहित लय के साथ पॉप डांस ट्रैक, समुद्र तट के लिए बिल्कुल उपयुक्त" विवरणों से बनाई गई छोटी क्लिप सुन सकते हैं। लैंडिंग पृष्ठ, यहाँ.
लघु ध्वनि प्रभाव यथार्थवादी हैं, हालांकि हमारी राय में संगीत जैसे प्रभाव अच्छे नहीं हैं। वे हिट सिंगल्स के बजाय ख़राब संगीत या एलेवेटर गानों के लिए दोहराए जाने वाले और सामान्य जिंगल्स की तरह लगते हैं।
मेटा के शोधकर्ताओं ने कहा AudioGen - वर्णित यहाँ गहराई में - कच्चे ऑडियो को टोकन के अनुक्रम में परिवर्तित करके और इन्हें उच्च निष्ठा पर ऑडियो में परिवर्तित करके इनपुट का पुनर्निर्माण करके प्रशिक्षित किया गया था। एक भाषा मॉडल शब्दों और ध्वनियों के बीच संबंध जानने के लिए इनपुट टेक्स्ट प्रॉम्प्ट के स्निपेट्स को ऑडियो टोकन पर मैप करता है। संगीत जनरल ध्वनि प्रभावों के बजाय संगीत के नमूनों पर एक समान प्रक्रिया का उपयोग करके प्रशिक्षित किया गया था।
"काम को एक अभेद्य ब्लैक बॉक्स के रूप में रखने के बजाय, हम इन मॉडलों को कैसे विकसित करते हैं इसके बारे में खुला होना और यह सुनिश्चित करना कि वे लोगों के लिए उपयोग करना आसान हो - चाहे वह शोधकर्ता हों या समग्र रूप से संगीत समुदाय - लोगों को यह समझने में मदद करता है कि ये मॉडल क्या कर सकते हैं करें, समझें कि वे क्या नहीं कर सकते हैं, और वास्तव में उनका उपयोग करने के लिए सशक्त बनें,'टीम मेटा ने तर्क दिया।
“भविष्य में, जेनेरिक एआई लोगों को प्रारंभिक प्रोटोटाइप और ग्रेबॉक्सिंग चरणों के दौरान तेजी से प्रतिक्रिया प्राप्त करने की अनुमति देकर पुनरावृत्ति समय में काफी सुधार करने में मदद कर सकता है - चाहे वे मेटावर्स के लिए दुनिया बनाने वाले एक बड़े डेवलपर हों, एक संगीतकार (शौकिया, पेशेवर, या) अन्यथा) अपनी अगली रचना पर काम कर रहे हैं, या एक छोटे या मध्यम आकार के व्यवसाय के मालिक अपनी रचनात्मक संपत्ति को उन्नत करना चाह रहे हैं।"
आप ऑडियोक्राफ्ट कोड प्राप्त कर सकते हैं यहाँ उत्पन्न करें, और MusicGen के साथ प्रयोग करें यहाँ उत्पन्न करें और इसे आज़माएं. ®
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. ऑटोमोटिव/ईवीएस, कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- BlockOffsets. पर्यावरणीय ऑफसेट स्वामित्व का आधुनिकीकरण। यहां पहुंचें।
- स्रोत: https://go.theregister.com/feed/www.theregister.com/2023/08/02/meta_audiocraft_release/
- :हैस
- :है
- :नहीं
- $यूपी
- 000
- 1
- 20
- 7
- a
- About
- वास्तव में
- AI
- एआई मॉडल
- एआई सिस्टम
- की अनुमति दे
- साथ - साथ
- शौकिया
- an
- और
- कोई
- अनुप्रयोगों
- हैं
- तर्क दिया
- AS
- संपत्ति
- At
- ऑडियो
- स्वतः
- उपलब्ध
- वापस
- बुरा
- BE
- समुद्र तट
- बीयर
- जा रहा है
- के बीच
- काली
- आंधी
- मुक्केबाज़ी
- निर्माण
- इमारत
- व्यापार
- by
- कर सकते हैं
- सक्षम
- चेक
- क्लिप
- CO
- कोड
- सुसंगत
- वाणिज्यिक
- जन
- समुदाय
- तुलना
- रचना
- कंप्यूटर
- कंप्यूटर जनित
- होते हैं
- जारी रखने के
- परिवर्तित
- सह - संबंध
- इसी
- सका
- बनाना
- बनाया
- बनाना
- क्रिएटिव
- नृत्य
- तिथि
- डिग्री
- गहराई
- वर्णित
- विकसित करना
- डेवलपर
- मुश्किल
- do
- दौरान
- शीघ्र
- आसान
- प्रभाव
- सशक्त
- पर्याप्त
- सुनिश्चित
- envisions
- विशेष रूप से
- प्रयोग
- समझाया
- फेसबुक
- और तेज
- फेड
- प्रतिक्रिया
- कुछ
- निष्ठा
- अंत में
- अंत
- ध्यान केंद्रित
- के लिए
- रूपों
- मुक्त
- स्वतंत्रता
- से
- भविष्य
- उत्पन्न
- सृजन
- उत्पादक
- जनरेटिव एआई
- मिल
- विशाल
- दी
- महान
- होने
- सुनना
- मदद
- मदद करता है
- हाई
- मारो
- पकड़
- घंटे
- कैसे
- HTTPS
- छवियों
- में सुधार
- in
- निवेश
- साधन
- में
- IT
- यात्रा
- जेपीजी
- केवल
- रखना
- भाषा
- बड़ा
- जानें
- सीख रहा हूँ
- लाइसेंस
- लाइसेंस - प्राप्त
- पसंद
- लामा
- देख
- लॉट
- मशीन
- यंत्र अधिगम
- बनाया गया
- निर्माण
- मैप्स
- परिपक्व
- मीडिया
- मेटा
- मेटावर्स
- लाखों
- मिनटों
- एमआईटी
- आदर्श
- मॉडल
- अधिक
- संगीत
- संगीतकार
- जरूरत
- अगला
- संख्या
- of
- on
- लोगों
- खुला
- खुला स्रोत
- राय
- or
- अन्य
- अन्यथा
- हमारी
- आउट
- उत्पादन
- के ऊपर
- स्वामित्व
- मालिक
- पृष्ठ
- पैटर्न उपयोग करें
- स्टाफ़
- प्रति
- टक्कर
- उत्तम
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- प्ले
- पॉप
- प्रक्रिया
- प्रसंस्कृत
- उत्पादन
- पेशेवर
- परियोजनाओं
- प्रोटोटाइप
- सार्वजनिक
- गुणवत्ता
- बल्कि
- कच्चा
- RE
- यथार्थवादी
- रिहा
- विज्ञप्ति
- बार - बार आने वाला
- प्रतिनिधित्व
- अनुसंधान
- शोधकर्ताओं
- रन
- s
- कहा
- देखा
- कहना
- वैज्ञानिकों
- अनुक्रम
- सेट
- साझा
- कम
- संकेत
- समान
- के बाद से
- छोटा
- सॉफ्टवेयर
- कुछ
- ध्वनि
- स्रोत
- सोर्सिंग
- विशेष रूप से
- चरणों
- मानक
- सिस्टम
- लेना
- बाते
- टीम
- से
- कि
- RSI
- भविष्य
- मेटावर्स
- लेकिन हाल ही
- उन
- इन
- वे
- हालांकि?
- हजारों
- तीन
- पहर
- सेवा मेरे
- टोकन
- टूलकिट
- ट्रैक
- रेलगाड़ी
- प्रशिक्षित
- बदलने
- कोशिश
- मोड़
- ठेठ
- के अंतर्गत
- समझना
- उपयोग
- प्रयुक्त
- का उपयोग
- बेहद
- था
- we
- बुधवार
- कुंआ
- क्या
- जब कभी
- या
- कौन कौन से
- पूरा का पूरा
- हवा
- साथ में
- बिना
- शब्द
- काम
- काम कर रहे
- दुनिया की
- लिखा हुआ
- आप
- जेफिरनेट