Sora AI তাত্ক্ষণিকভাবে চোখের পপিং ভিডিও তৈরি করে

Sora AI তাত্ক্ষণিকভাবে চোখের পপিং ভিডিও তৈরি করে

Sora AI Produces Eye-Popping Videos Instantly PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Sora, OpenAI দ্বারা তৈরি একটি চিত্তাকর্ষক নতুন জেনারেটিভ ভিডিও মডেল, একটি সংক্ষিপ্ত পাঠ্য বিবরণ নিতে পারে এবং এটিকে একটি মিনিট-দীর্ঘ, জটিল, হাই-ডেফিনিশন ফিল্ম ক্লিপে রূপান্তর করতে পারে।

OpenAI, ChatGPT চ্যাটবটের মূল কোম্পানি এবং স্টিল-ইমেজ জেনারেটর DALL-E, এই তাত্ক্ষণিক ভিডিও জেনারেটরকে উন্নত করার জন্য প্রত্যাশী অনেক কোম্পানির মধ্যে একটি। অন্যান্য কোম্পানিগুলির মধ্যে রয়েছে রানওয়ের মতো স্টার্ট-আপ এবং গুগল এবং মেটা প্ল্যাটফর্ম ইনকর্পোরেটেডের মতো প্রযুক্তি জায়ান্ট, ফেসবুক এবং ইনস্টাগ্রামের মালিক।

পাকা চলচ্চিত্র নির্মাতাদের কাজকে গতিশীল করার সময় প্রযুক্তিটি সম্পূর্ণরূপে কম দক্ষ ডিজিটাল শিল্পীদের প্রতিস্থাপন করার ক্ষমতা রাখে।

এছাড়াও পড়ুন: ওপেনএআই-এর সহ-প্রতিষ্ঠাতা, আন্দ্রেজ কার্পাথি, স্টেপ ডাউন, আইজ ব্যক্তিগত উদ্যোগ

সোরাকে মুক্তি দিচ্ছে

OpenAI তার নতুন সিস্টেমের নাম Sora, আকাশের জাপানি শব্দ। গবেষক টিম ব্রুকস এবং বিল পিবলস সহ প্রযুক্তির বিকাশকারী দল এই নামটি বেছে নিয়েছে কারণ এটি "সীমাহীন সৃজনশীল সম্ভাবনার ধারণাকে জাগিয়ে তোলে।"

তারা আরও বলেছে যে সংস্থাটি এখনও সোরাকে জনসাধারণের কাছে প্রকাশ করতে পারেনি কারণ এটি এখনও সিস্টেমের সাথে সম্পর্কিত ঝুঁকিগুলি সন্ধান করছে। বরং, OpenAI প্রযুক্তিটি শিক্ষাবিদদের একটি নির্বাচিত গোষ্ঠী এবং অন্যান্য বাইরের গবেষকদের সাথে ভাগ করছে যারা এটিকে "লাল দল" করবে, সম্ভাব্য অপব্যবহারের অনুসন্ধানের জন্য একটি শব্দ।

ডঃ ব্রুকসের মতে, এখানে উদ্দেশ্য হল দিগন্তে যা আছে তার একটি পূর্বরূপ দেওয়া যাতে লোকেরা এই প্রযুক্তির ক্ষমতা দেখতে পারে এবং প্রতিক্রিয়া পেতে পারে।

OpenAI ভিডিও ট্যাগ করে

ওপেনএআই ইতিমধ্যেই সিস্টেমের তৈরি ভিডিওগুলিকে জলছাপ দিয়ে ট্যাগ করে তা নির্দেশ করে যে সেগুলি কৃত্রিম বুদ্ধিমত্তা (AI) দ্বারা তৈরি হয়েছে৷ তবে, সংস্থাটি স্বীকার করেছে যে এইগুলি সরানো যেতে পারে। তারা যোগ করেছে যে তাদের সনাক্ত করাও চ্যালেঞ্জিং হতে পারে।

অনুসারে OpenAI, তারা কৃত্রিম বুদ্ধিমত্তা (AI) শেখাচ্ছেন গতিশীল ভৌত জগতকে বুঝতে এবং অনুকরণ করতে, প্রশিক্ষণের মডেলের লক্ষ্য নিয়ে যা মানুষকে বাস্তব-বিশ্বের মিথস্ক্রিয়া প্রয়োজন এমন সমস্যার সমাধান করতে সহায়তা করে।

উপরন্তু, তারা সৃজনশীল পেশাদারদের জন্য সবচেয়ে সহায়ক হতে মডেলটিকে কীভাবে অগ্রসর করা যায় সে সম্পর্কে প্রতিক্রিয়া পেতে বেশ কয়েকটি ভিজ্যুয়াল শিল্পী, ডিজাইনার এবং চলচ্চিত্র নির্মাতাদের অ্যাক্সেস প্রদান করছে।

ওপেনএআই-এর বাইরের লোকেদের সাথে কাজ শুরু করার জন্য এবং তাদের কাছ থেকে প্রতিক্রিয়া পাওয়ার জন্য এবং দিগন্তে AI ক্ষমতাগুলি কী রয়েছে তা জনসাধারণকে বোঝাতে তারা তাদের গবেষণার অগ্রগতি ভাগ করে নিচ্ছে।

সোরা উন্নয়নশীল

যাহোক, OpenAI সিস্টেমটি কতগুলি ভিডিও শিখেছে বা কোথা থেকে এসেছে তা প্রকাশ করতে অস্বীকার করেছে৷ তারা শুধুমাত্র বলেছে যে প্রশিক্ষণে সর্বজনীনভাবে উপলব্ধ ভিডিও এবং কপিরাইট ধারকদের দ্বারা লাইসেন্সকৃত ভিডিও উভয়ই অন্তর্ভুক্ত ছিল।

কপিরাইটযুক্ত বিষয়বস্তু ব্যবহারের জন্য কোম্পানির বিরুদ্ধে একাধিকবার মামলা করা হয়েছে। এটি সম্ভবত প্রতিযোগীদের উপর একটি সুবিধা রাখার চেষ্টা করছে, তাই এটি এর প্রযুক্তিগুলি প্রশিক্ষণের জন্য ব্যবহৃত ডেটা সম্পর্কে কিছু প্রকাশ করে না।

তদুপরি, মডেলটির ভাষার গভীর উপলব্ধি রয়েছে, এটি প্রম্পটগুলিকে সঠিকভাবে ব্যাখ্যা করতে এবং আবেগকে স্পষ্টভাবে প্রকাশ করে এমন বাধ্যতামূলক চরিত্র তৈরি করতে সক্ষম করে। Sora একটি একক-জেনারেটেড ভিডিওর মধ্যে ভিজ্যুয়াল শট এবং চরিত্র বজায় রাখে এমন বেশ কয়েকটি শটও ঘটাতে পারে।

OpenAI তাদের X হ্যান্ডেলে একটি ভিডিও তৈরি করার প্রম্পট শেয়ার করেছে, যার ফলে X ব্যবহারকারীদের কাছ থেকে বেশ কিছু প্রতিক্রিয়া হয়েছে।

মডেলের দুর্বলতা

OpenAI এর মতে, বর্তমান মডেলের দুর্বলতা রয়েছে। এটি একটি জটিল দৃশ্যের পদার্থবিদ্যাকে সঠিকভাবে অনুকরণ করতে সহায়তার প্রয়োজন হতে পারে এবং কারণ এবং প্রভাবের নির্দিষ্ট উদাহরণগুলি বোঝার জন্য সাহায্যের প্রয়োজন হতে পারে। উদাহরণস্বরূপ, একজন ব্যক্তি একটি কুকি কামড় দিতে পারে, কিন্তু পরে, কুকিতে একটি কামড়ের চিহ্ন নাও থাকতে পারে।

মডেলটিকে একটি প্রম্পটের স্থানিক বিশদ ব্যাখ্যা করতে হতে পারে, উদাহরণস্বরূপ, বাম এবং ডানে মিশ্রিত করা, এবং নির্দিষ্ট ক্যামেরা ট্র্যাজেক্টোরি অনুসরণ করার মতো সময়ের সাথে সংঘটিত ঘটনাগুলির সুনির্দিষ্ট বিবরণে সহায়তার প্রয়োজন হতে পারে।

সময় স্ট্যাম্প:

থেকে আরো মেটানিউজ