सोरा एआई तुरंत चौंका देने वाले वीडियो तैयार करता है

सोरा एआई तुरंत चौंका देने वाले वीडियो तैयार करता है

सोरा एआई तुरंत चौंका देने वाले वीडियो तैयार करता है प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

सोरा, ओपनएआई द्वारा बनाया गया एक प्रभावशाली नया जेनरेटिव वीडियो मॉडल है, जो एक संक्षिप्त टेक्स्ट विवरण ले सकता है और इसे एक मिनट लंबी, जटिल, हाई-डेफिनिशन फिल्म क्लिप में बदल सकता है।

OpenAIचैटजीपीटी चैटबॉट और स्टिल-इमेज जनरेटर DALL-E की मूल कंपनी, इस त्वरित वीडियो जनरेटर को बेहतर बनाने की होड़ में लगी कई कंपनियों में से एक है। अन्य कंपनियों में रनवे जैसे स्टार्ट-अप और Google और मेटा प्लेटफ़ॉर्म इंक जैसे तकनीकी दिग्गज, फेसबुक और इंस्टाग्राम के मालिक शामिल हैं।

प्रौद्योगिकी में अनुभवी फिल्म निर्माताओं के काम को गति देते हुए कम कुशल डिजिटल कलाकारों को पूरी तरह से बदलने की क्षमता है।

यह भी पढ़ें: ओपनएआई के सह-संस्थापक, आंद्रेज कारपैथी ने इस्तीफा दिया, निजी उद्यमों पर नजरें गड़ाए हुए हैं

सोरा को रिहा करना

OpenAI ने अपने नए सिस्टम का नाम सोरा रखा, जो आकाश के लिए जापानी शब्द है। शोधकर्ता टिम ब्रूक्स और बिल पीबल्स सहित प्रौद्योगिकी की विकास टीम ने यह नाम इसलिए चुना क्योंकि यह "असीमित रचनात्मक क्षमता के विचार को उजागर करता है।"

उन्होंने यह भी कहा कि कंपनी ने अभी तक सोरा को जनता के लिए जारी नहीं किया है क्योंकि वह अभी भी सिस्टम से जुड़े जोखिमों पर गौर कर रही है। बल्कि, OpenAI प्रौद्योगिकी को शिक्षाविदों और अन्य बाहरी शोधकर्ताओं के एक चयनित समूह के साथ साझा कर रहा है जो इसे "रेड टीम" करेंगे, जो संभावित दुरुपयोग की खोज का वर्णन करने के लिए एक शब्द है।

डॉ. ब्रूक्स के अनुसार, यहां इरादा क्षितिज पर क्या है उसका पूर्वावलोकन देना है ताकि लोग इस तकनीक की क्षमताओं को देख सकें और प्रतिक्रिया प्राप्त कर सकें।

OpenAI वीडियो टैग करता है

OpenAI पहले से ही सिस्टम द्वारा बनाए गए वीडियो को वॉटरमार्क के साथ टैग करता है ताकि यह दर्शाया जा सके कि वे कृत्रिम बुद्धिमत्ता (एआई) द्वारा उत्पन्न किए गए थे। हालाँकि, कंपनी मानती है कि इन्हें हटाया जा सकता है। उन्होंने कहा कि इन्हें पहचानना भी चुनौतीपूर्ण हो सकता है।

के अनुसार OpenAI, वे गतिमान भौतिक दुनिया को समझने और उसका अनुकरण करने के लिए कृत्रिम बुद्धिमत्ता (एआई) सिखा रहे हैं, जिसका लक्ष्य प्रशिक्षण मॉडल हैं जो लोगों को उन समस्याओं को हल करने में मदद करते हैं जिनके लिए वास्तविक दुनिया की बातचीत की आवश्यकता होती है।

इसके अतिरिक्त, वे रचनात्मक पेशेवरों के लिए मॉडल को सबसे अधिक उपयोगी बनाने के तरीके पर प्रतिक्रिया प्राप्त करने के लिए कई दृश्य कलाकारों, डिजाइनरों और फिल्म निर्माताओं तक पहुंच प्रदान कर रहे हैं।

वे ओपनएआई के बाहर के लोगों के साथ काम करना शुरू करने और उनसे प्रतिक्रिया प्राप्त करने के लिए और जनता को यह एहसास दिलाने के लिए कि एआई क्षमताएं क्षितिज पर क्या हैं, अपनी शोध प्रगति को जल्दी से साझा कर रहे हैं।

सोरा का विकास करना

हालांकि, OpenAI सिस्टम ने कितने वीडियो से सीखे या वे कहां से आए, इसका खुलासा करने से इनकार कर दिया। उन्होंने केवल इतना कहा कि प्रशिक्षण में सार्वजनिक रूप से उपलब्ध वीडियो और कॉपीराइट धारकों द्वारा लाइसेंस प्राप्त वीडियो दोनों शामिल थे।

कॉपीराइट सामग्री का उपयोग करने के लिए कंपनी पर कई बार मुकदमा दायर किया गया है। यह संभवतः प्रतिस्पर्धियों पर बढ़त बनाए रखने की कोशिश कर रहा है, इसलिए यह अपनी प्रौद्योगिकियों को प्रशिक्षित करने के लिए उपयोग किए गए डेटा के बारे में कुछ भी खुलासा नहीं करता है।

इसके अलावा, मॉडल के पास भाषा की गहरी समझ है, जो इसे संकेतों की सटीक व्याख्या करने और सम्मोहक चरित्र उत्पन्न करने में सक्षम बनाती है जो भावनाओं को स्पष्ट रूप से व्यक्त करते हैं। सोरा कई शॉट्स भी ले सकता है जो एकल-जनरेटेड वीडियो के भीतर दृश्य शॉट और चरित्र को बनाए रखते हैं।

ओपनएआई ने अपने एक्स हैंडल पर एक वीडियो बनाने का संकेत साझा किया, जिससे एक्स उपयोगकर्ताओं की ओर से कई प्रतिक्रियाएं आईं।

मॉडल की कमजोरियाँ

ओपनएआई के मुताबिक, मौजूदा मॉडल में कमजोरियां हैं। इसे किसी जटिल दृश्य की भौतिकी का सटीक अनुकरण करने में सहायता की आवश्यकता हो सकती है और कारण और प्रभाव के विशिष्ट उदाहरणों को समझने में सहायता की आवश्यकता हो सकती है। उदाहरण के लिए, कोई व्यक्ति कुकी को काट सकता है, लेकिन बाद में, कुकी पर काटने का निशान नहीं हो सकता है।

मॉडल को प्रॉम्प्ट के स्थानिक विवरण को स्पष्ट करने की भी आवश्यकता हो सकती है, उदाहरण के लिए, बाएं और दाएं को मिलाना, और समय के साथ होने वाली घटनाओं के सटीक विवरण में मदद की आवश्यकता हो सकती है, जैसे कि एक विशिष्ट कैमरा प्रक्षेपवक्र का अनुसरण करना।

समय टिकट:

से अधिक मेटान्यूज