মেটা নেক্সট-জেন এআই ইমু ভিডিও এবং ইমু সম্পাদনা উন্মোচন করেছে

মেটা নেক্সট-জেন এআই ইমু ভিডিও এবং ইমু সম্পাদনা উন্মোচন করেছে

মেটা উন্মোচন করে নেক্সট-জেন এআই ইমু ভিডিও এবং ইমু এডিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্স। উল্লম্ব অনুসন্ধান. আ.

জেনারেটিভ এআই-এর ক্ষেত্র দ্রুত অগ্রগতির সাক্ষী হচ্ছে, 2023 ডোমেনে একটি উল্লেখযোগ্য অগ্রগতি চিহ্নিত করেছে। মেটা, পূর্বে Facebook, এই বছরের মেটা কানেক্ট ইভেন্টে ইমু, ইমেজ তৈরির জন্য একটি যুগান্তকারী ভিত্তি মডেল চালু করেছে। এই প্রযুক্তি Meta-এর অ্যাপ পরিবার জুড়ে অসংখ্য AI অভিজ্ঞতাকে আন্ডারপিন করে, বিশেষ করে Instagram-এর AI ইমেজ এডিটিং টুলগুলিতে। এই সরঞ্জামগুলি ব্যবহারকারীদের তাদের ভিজ্যুয়াল শৈলী বা পটভূমি পরিবর্তন করে ফটোগুলিকে রূপান্তর করতে সক্ষম করে৷ তাছাড়া, Meta AI-তে Imagine বৈশিষ্ট্যটি মেসেজ বা গ্রুপ চ্যাটের মধ্যে ফটোরিয়ালিস্টিক ইমেজ তৈরি করতে সহায়তা করে।

ভিডিও জেনারেশনে ব্রেকথ্রু: ইমু ভিডিও

টেক্সট-টু-ভিডিও জেনারেশনের জন্য ইমু মডেল ব্যবহার করে ইমু ভিডিও একটি গুরুত্বপূর্ণ উন্নয়ন হিসেবে আবির্ভূত হয়েছে। এই উদ্ভাবনী পদ্ধতি, ডিফিউশন মডেলের উপর ভিত্তি করে, উচ্চ-মানের ভিডিও তৈরি করার জন্য একটি সহজ কিন্তু কার্যকর পদ্ধতি অফার করে। প্রক্রিয়াটি দুটি পর্যায় জড়িত: প্রাথমিকভাবে টেক্সট প্রম্পট থেকে ছবি তৈরি করা এবং পরবর্তীতে টেক্সট এবং ইমেজ উভয়ের উপর শর্তযুক্ত ভিডিও তৈরি করা। এই ফ্যাক্টরাইজড পদ্ধতি ভিডিও জেনারেশন মডেলের দক্ষ প্রশিক্ষণের জন্য অনুমতি দেয়। ইমু ভিডিওর শ্রেষ্ঠত্ব স্পষ্ট, কারণ এটিতে 512 fps-এ 512×16 ভিডিও তৈরি করতে শুধুমাত্র দুটি ডিফিউশন মডেলের প্রয়োজন হয়, যা একাধিক মডেলের প্রয়োজন পূর্ববর্তী পদ্ধতির সম্পূর্ণ বিপরীত। মানুষের মূল্যায়ন ইমু ভিডিওর জন্য একটি শক্তিশালী পছন্দ দেখিয়েছে, এর কার্যকারিতা গুণমান এবং টেক্সট প্রম্পট মেনে চলার ক্ষেত্রে আগের প্রযুক্তিগুলিকে ছাড়িয়ে গেছে।

বিপ্লবী চিত্র সম্পাদনা: ইমু সম্পাদনা

মেটার ইমু সম্পাদনা চিত্র সম্পাদনায় একটি দৃষ্টান্ত পরিবর্তনের প্রতিনিধিত্ব করে, সুনির্দিষ্ট পিক্সেল-স্তরের পরিবর্তনের উপর ফোকাস করে। এই টুলটি স্থানীয় এবং বিশ্বব্যাপী পরিবর্তন, ব্যাকগ্রাউন্ড সমন্বয়, এবং রঙ এবং জ্যামিতিক রূপান্তরের মতো জটিল সম্পাদনা কাজগুলিকে সক্ষম করে। ইমু সম্পাদনাটি নিশ্চিত করে যে কেবলমাত্র সম্পাদনার নির্দেশাবলীর সাথে প্রাসঙ্গিক পিক্সেলগুলি পরিবর্তন করা হয়েছে, চিত্রের লক্ষ্যহীন অংশগুলির অখণ্ডতা বজায় রাখা হয়েছে৷ ইমু সম্পাদনাকে প্রশিক্ষণ দেওয়ার জন্য, মেটা 10 মিলিয়ন সংশ্লেষিত নমুনা সমন্বিত একটি বিস্তৃত ডেটাসেট তৈরি করেছে, যার প্রতিটিতে একটি ইনপুট চিত্র, একটি সম্পাদনা কাজের বিবরণ এবং লক্ষ্যযুক্ত আউটপুট চিত্র রয়েছে। মডেলটি নির্দেশনার বিশ্বস্ততা এবং চিত্রের গুণমানের ক্ষেত্রে ব্যতিক্রমী কর্মক্ষমতা প্রদর্শন করে।

মেটাতে জেনারেটিভ এআই এর ভবিষ্যত

জেনারেটিভ এআই-এর এই অগ্রগতিগুলি ভবিষ্যতের দিকে ইঙ্গিত দেয় যেখানে সৃজনশীল অভিব্যক্তি আরও অ্যাক্সেসযোগ্য এবং বৈচিত্র্যময়। ইমু ভিডিও এবং ইমু সম্পাদনা সম্ভাব্যভাবে বিপ্লব করতে পারে কিভাবে লোকেরা মিডিয়া তৈরি এবং ভাগ করে। তারা পেশাদার শিল্পী থেকে নৈমিত্তিক ব্যবহারকারীদের জন্য সকলের জন্য সরঞ্জাম অফার করে, নতুন ধরনের অভিব্যক্তি এবং সৃজনশীলতা সক্ষম করে। যদিও তারা পেশাদার নির্মাতাদের বিকল্প নয়, তারা উন্নত আত্ম-প্রকাশ এবং সৃজনশীল অন্বেষণের জন্য একটি প্ল্যাটফর্ম প্রদান করে।

মিডিয়া রিপোর্টগুলি ইমু ভিডিওর সুবিন্যস্ত প্রক্রিয়া এবং ইমু সম্পাদনার সুনির্দিষ্ট পিক্সেল-স্তরের সম্পাদনা ক্ষমতার উপর জোর দেয়। প্রযুক্তির সরলতা এবং দক্ষতা হাইলাইট করা হয়েছে, এর সাথে ভিডিও এবং চিত্র সম্পাদনায় বিপ্লব ঘটানোর সম্ভাবনা রয়েছে। যাইহোক, মেটা নিয়ন্ত্রকদের কাছ থেকে কঠোরভাবে যাচাই-বাছাই করে সতর্কতার সাথে এই AI সমাধানগুলির স্থাপনার দিকে এগিয়ে যায়। মেটা স্পষ্ট করেছে যে এর AI ক্ষমতাগুলি ফেসবুক এবং ইনস্টাগ্রামে বিপণন বা রাজনৈতিক প্রচারণার জন্য উপলব্ধ হবে না। তা সত্ত্বেও, প্ল্যাটফর্মের মৌলিক বিজ্ঞাপন বিধিগুলি বর্তমানে বিশেষভাবে AI-কে সম্বোধন করে না।

চিত্র উত্স: শাটারস্টক

সময় স্ট্যাম্প:

থেকে আরো ব্লকচেইন নিউজ