AI আধিপত্যের দৌড় অব্যাহত থাকায়, মাইক্রোসফ্ট এখন তার সর্বশেষ টুল, VASA-1 এর মাধ্যমে মানুষের প্রতিকৃতি ছবিকে কথা বলার মুখ বা ভিডিওতে রূপান্তর করতে চায়।
টেক জায়ান্টের একটি গবেষণা পত্র অনুসারে, মাইক্রোসফ্ট এআই রেসকে অন্য স্তরে নিয়ে যাচ্ছে ভাসা 1, ভিজ্যুয়াল অ্যাফেক্টিভ স্কিল (VAS) সহ ভার্চুয়াল চরিত্রগুলির প্রাণবন্ত কথা বলা মুখগুলি তৈরি করার কাঠামো, সবই একটি প্রতিকৃতি থেকে।
এছাড়াও পড়ুন: ভিডিও গেম ইন্ডাস্ট্রি রাশ AI ওভার ইউনিয়নাইজ করতে
প্রতিকৃতি থেকে কথা বলা মুখ
যদিও এটি এখনও জনসাধারণের জন্য উপলব্ধ নয়, টুলটি একটি একক প্রতিকৃতি ফটো এবং বক্তৃতা অডিও নেয় এবং সুনির্দিষ্ট ঠোঁট-অডিও সিঙ্ক, প্রাণবন্ত মুখের আচরণ এবং রিয়েল-টাইমে উত্পন্ন প্রাকৃতিক মাথার নড়াচড়া সহ একটি হাইপার-রিয়ালিস্টিক কথা বলার মুখের ভিডিও তৈরি করে।
টুলটি এখনও মাইক্রোসফ্ট রিসার্চ টিমের সাথে রিসার্চ প্রিভিউ পর্যায়ে রয়েছে এবং ডেমো ভিডিওগুলি "চিত্তাকর্ষক দেখায়।"
যদিও Nvidia এবং Runway-এর মতো কোম্পানিগুলির ইতিমধ্যেই একই রকম মাথার নড়াচড়া এবং ঠোঁট সিঙ্ক প্রযুক্তি রয়েছে, VASA-1 মনে হচ্ছে "অনেক উচ্চ মানের এবং বাস্তববাদের" যা মুখের শিল্পকর্মকে হ্রাস করে। টম এর গাইড.
অতিরিক্তভাবে, অডিও চালিত অ্যানিমেশনের এই পদ্ধতিটিও সাম্প্রতিকের মতো ভ্লগার এআই গুগল রিসার্চ দ্বারা মডেল।
মাইক্রোসফ্টের মতে, যদিও প্রদর্শনের উদাহরণের সমস্ত চিত্রগুলি ডাল-ই দ্বারা তৈরি সিন্থেটিক, VASA-1 এখনও একটি বাস্তব চিত্রকে অ্যানিমেট করতে পারে।
ডেমো দেখায় যে বিভিন্ন লোক প্রায় স্বাভাবিক নড়াচড়া, মুখের অভিব্যক্তি, চোখের নড়াচড়ার সাথে কথা বলছে "অন্যান্য সরঞ্জামগুলিতে মুখের উপরে এবং নীচের চারপাশে কোনও শিল্পকর্ম দেখা যায় না।"
এটি কাজ করার জন্য একটি মুখ-ফরোয়ার্ড পোর্ট্রেট শৈলী ইমেজ প্রয়োজন হয় না.
মাইক্রোসফট সবেমাত্র VASA-1 চালু করেছে।
এটি একটি নতুন এআই মডেল যা 1টি ফটো এবং 1টি অডিওকে সম্পূর্ণ প্রাণবন্ত মানুষের ডিপফেকে পরিণত করতে পারে৷
নির্বাচনের আগে এই অধিকার বাদ দিতে হবে 😬pic.twitter.com/MuLkZVOKRM
— রোয়ান চেউং (@rowancheung) এপ্রিল 18, 2024
ভাসা-১ এর লোকজন কথা বলেছে
ইতিমধ্যেই, AI উত্সাহীরা X প্ল্যাটফর্মে এটিকে "বন্য" এবং "উন্মাদ" হিসাবে বর্ণনা করা প্রযুক্তি দ্বারা হতবাক বলে মনে হচ্ছে।
"প্রতিটি প্রকাশের মধ্যে আমরা যে উন্নতি পাচ্ছি তা অবিশ্বাস্য," বলেছেন লিনাস একেনস্টাম।
অন্যরা মনে করেন যে বিশ্ব "মিডিয়া বিষয়বস্তু তৈরির উপায়ে ভূমিকম্পের পরিবর্তন" এবং কীভাবে এটি ব্যবহার করা হয় তা প্রত্যক্ষ করছে।
স্যাম নামে পরিচিত আরেকজন উত্সাহী বলেছেন, "এটি মন ছুঁয়ে যাওয়া, বাস্তববাদটি শীর্ষস্থানীয়।"
যদিও অন্যরা এই টুলটির ক্ষমতাকে চিনতে পারে, তারা মনে করে যে মাইক্রোসফটের পক্ষ থেকে এমন একটি টুল প্রবর্তন করা একটু দায়িত্বজ্ঞানহীন কাজ যা সহজেই ব্যবহার করা যেতে পারে। নির্বাচন deepfakes.
"নির্বাচনের আগে এই অধিকার বাদ দিতে চাই," লিখেছেন এক্স প্ল্যাটফর্মে রোয়ান চেউং।
অন্য ব্যবহারকারী ইভান কার্স্টেল একটি কঠোর সতর্কতা সহ মন্তব্য করেছেন: "মাইক্রোসফ্ট রিসার্চের VASA-1 একটি গেম-চেঞ্জার, শুধুমাত্র একটি ফটো এবং অডিও থেকে হাইপার-রিয়ালিস্টিক এআই-জেনারেটেড ভিডিও তৈরি করে।"
"ক্লাসিক সিনেমার কিংবদন্তি পুনরুজ্জীবিত করা থেকে ব্যক্তিগতকৃত মিডিয়া পর্যন্ত সম্ভাবনাগুলি অফুরন্ত। তবে আসুন গভীর নকল ঝুঁকি সম্পর্কে সতর্ক থাকি।"
ইতিমধ্যেই, বিশ্ব নির্বাচনী ডিপফেকের প্রবাহ দেখেছে যেখানে প্রচার প্রচারের জন্য এআই ব্যবহার করে রাজনীতিবিদদের কণ্ঠস্বর বা ছবি ব্যবহার করা হয়েছে। বিশ্ব জনসংখ্যার প্রায় এক-তৃতীয়াংশ এই বছর নির্বাচনে যাচ্ছে।
যাইহোক, মাইক্রোসফ্টের গবেষকরা ইঙ্গিত করেছেন যে এটি শুধুমাত্র প্রদর্শনের জন্য এবং বর্তমানে একটি পাবলিক রিলিজ বা বিকাশকারীদের জন্য এটি উপলব্ধ করার কোন পরিকল্পনা নেই।
VASA-1 কিভাবে কাজ করে?
টমস গাইড অনুসারে, গবেষকরা নিজেরাই মডেলের "একটি গানের সাথে পুরোপুরি ঠোঁট-সিঙ্ক করার ক্ষমতায় অবাক হয়েছেন, প্রশিক্ষণ ডেটাসেটে কোনও সঙ্গীত ব্যবহার না হওয়া সত্ত্বেও গায়কের কথাগুলিকে সমস্যা ছাড়াই প্রতিফলিত করে।"
উপরন্তু, VASA-1 বিখ্যাত ছবির মতো ঐতিহাসিক প্রতিকৃতি সহ বিভিন্ন চিত্র শৈলী পরিচালনা করে মোনালিসা.
টুলটি তার উন্নত লিপ-সিঙ্ক ক্ষমতার পিছনে গেমিংয়ে ব্যবহার করা যেতে পারে। বিশেষজ্ঞরা বলেছেন, এটি নিমজ্জনের জন্য একটি গেম চেঞ্জার হতে পারে।
অতিরিক্তভাবে, প্রযুক্তিটি সোশ্যাল মিডিয়া ভিডিওগুলির জন্য অবতার তৈরিতে সহায়ক হতে পারে, যেমনটি সিন্থেসিয়া এবং হেজেনের মতো সংস্থাগুলির ক্ষেত্রে।
AI-ভিত্তিক চলচ্চিত্র এবং মিউজিক ভিডিও নির্মাণগুলি আরও বাস্তবসম্মত ভিডিওর জন্য VASA-1 প্রযুক্তির সুবিধা নিতে পারে।
ওপেনএআই-তে মাইক্রোসফটের অংশীদারিত্ব থাকার সম্ভাবনা রয়েছে, VASA-1 একটি "ভবিষ্যত কপিলট" এর অংশ হতে পারে Sora, মিশ্রণ."
- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- PlatoData.Network উল্লম্ব জেনারেটিভ Ai. নিজেকে ক্ষমতায়িত করুন। এখানে প্রবেশ করুন.
- প্লেটোএআইস্ট্রিম। Web3 ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- প্লেটোইএসজি। কার্বন, ক্লিনটেক, শক্তি, পরিবেশ সৌর, বর্জ্য ব্যবস্থাপনা. এখানে প্রবেশ করুন.
- প্লেটো হেলথ। বায়োটেক এবং ক্লিনিক্যাল ট্রায়াল ইন্টেলিজেন্স। এখানে প্রবেশ করুন.
- উত্স: https://metanews.com/enthusiasts-smitten-by-image-to-video-tool-vasa-1/
- : আছে
- : হয়
- :না
- :কোথায়
- 1
- 10
- 7
- 8
- a
- ক্ষমতার
- ক্ষমতা
- সম্পর্কে
- অনুযায়ী
- অগ্রসর
- AI
- সতর্ক
- সব
- প্রায়
- ইতিমধ্যে
- এছাড়াও
- an
- এবং
- সজীব
- অ্যানিমেশন
- অন্য
- অভিগমন
- রয়েছি
- কাছাকাছি
- AS
- At
- অডিও
- সহজলভ্য
- অবতার
- পিছনে
- BE
- হয়েছে
- আগে
- আচরণ
- হচ্ছে
- মধ্যে
- বিট
- ফুঁ
- পাদ
- কিন্তু
- by
- CAN
- কেস
- মতভেদ
- পরিবর্তন
- অক্ষর
- চেউং
- সিনেমা
- সর্বোত্তম
- মন্তব্য
- কোম্পানি
- ক্ষয়প্রাপ্ত
- বিষয়বস্তু
- চলতে
- পারা
- নির্মিত
- তৈরি করা হচ্ছে
- এখন
- ডাল-ই
- deepfakes
- ডেমো
- প্রদর্শন
- বর্ণনা
- সত্ত্বেও
- ডেভেলপারদের
- বিভিন্ন
- না
- চালিত
- ড্রপ
- প্রতি
- সহজে
- নির্বাচন
- অবিরাম
- কৌতূহলী ব্যক্তি
- উত্সাহীদের
- উদাহরণ
- বিশেষজ্ঞদের
- এক্সপ্রেশন
- চোখ
- মুখ
- মুখ
- সম্মুখস্থ
- বিখ্যাত
- সংস্থাগুলো
- জন্য
- ফ্রেমওয়ার্ক
- থেকে
- সম্পূর্ণরূপে
- খেলা
- খেলা পরিবর্তনকারী
- দূ্যত
- উত্পন্ন
- পেয়ে
- দৈত্য
- বিশ্বব্যাপী
- চালু
- গুগল
- পেয়েছিলাম
- কৌশল
- আছে
- জমিদারি
- মাথা
- ঊর্ধ্বতন
- ঐতিহাসিক
- কিভাবে
- HTTPS দ্বারা
- মানবীয়
- হাইপার-রিয়ালিস্টিক
- চিহ্নিত
- ভাবমূর্তি
- চিত্র
- নিমজ্জন
- চিত্তাকর্ষক
- উন্নতি
- in
- অন্যান্য
- সুদ্ধ
- অবিশ্বাস্য
- জ্ঞাপিত
- শিল্প
- অন্ত: প্রবাহ
- যান্ত্রিক
- ইন্টিগ্রেশন
- মধ্যে
- প্রবর্তন করা
- উপস্থাপিত
- সমস্যা
- IT
- এর
- JPEG
- মাত্র
- সর্বশেষ
- কিংবদন্তী
- উচ্চতা
- লেভারেজ
- প্রাণবন্ত
- মত
- লিনাস
- মেকিং
- কাজে ব্যবহৃত
- মিডিয়া
- মাইক্রোসফট
- মন
- মডেল
- অধিক
- মুখ
- আন্দোলন
- আন্দোলন
- চলচ্চিত্র
- অনেক
- সঙ্গীত
- প্রাকৃতিক
- নতুন
- না।
- এখন
- এনভিডিয়া
- of
- on
- OpenAI
- or
- অন্যান্য
- অন্যরা
- শেষ
- কাগজ
- অংশ
- সম্প্রদায়
- জনগণের
- ব্যক্তিগতকৃত
- ছবি
- ছবি
- ছবি
- টুকরা
- পরিকল্পনা সমূহ
- মাচা
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- নির্বাচনে
- জনসংখ্যা
- প্রতিকৃতি
- পোর্ট্রেট
- সম্ভাবনার
- যথাযথ
- প্রি
- উত্পাদন করে
- প্রযোজনার
- প্রচারণার
- প্রকাশ্য
- গুণ
- জাতি
- পড়া
- বাস্তব
- প্রকৃত সময়
- বাস্তবতা
- বাস্তবানুগ
- সাম্প্রতিক
- চেনা
- হ্রাস
- অনুধ্যায়ী
- মুক্তি
- প্রয়োজন
- গবেষণা
- গবেষকরা
- অধিকার
- ঝুঁকি
- বিমানের নির্মিত পথ
- নলখাগড়া
- s
- বলেছেন
- স্যাম
- মনে
- দেখা
- পরিবর্তন
- শো
- অনুরূপ
- গায়ক
- একক
- দক্ষতা
- সামাজিক
- সামাজিক মাধ্যম
- গান
- বক্তৃতা
- বিস্তার
- পর্যায়
- পণ
- থাকা
- এখনো
- শৈলী
- বিস্মিত
- সুসংগত.
- কৃত্রিম
- লাগে
- গ্রহণ
- কথা বলা
- টীম
- প্রযুক্তি
- টেক জায়ান্ট
- প্রযুক্তিঃ
- যে
- সার্জারির
- বিশ্ব
- নিজেদের
- সেখানে।
- তারা
- মনে
- তৃতীয়
- এই
- এই বছর
- থেকে
- টুল
- সরঞ্জাম
- শীর্ষ
- প্রশিক্ষণ
- রুপান্তর
- সত্য
- চালু
- টুইটার
- ব্যবহৃত
- ব্যবহারকারী
- ব্যবহারকারী
- ব্যবহার
- ভাস
- ভিডিও
- Videos
- চেক
- ভার্চুয়াল
- চাক্ষুষ
- ভয়েস
- চায়
- সতর্কবার্তা
- উপায়..
- যে
- যখন
- সঙ্গে
- ছাড়া
- প্রত্যক্ষীকরণ
- শব্দ
- হয়া যাই ?
- বিশ্ব
- X
- বছর
- এখনো
- zephyrnet