নির্বাচিত পরীক্ষায় AI-তৈরি সঙ্গীত নিয়ে YouTube পরীক্ষা-নিরীক্ষা করে

নির্বাচিত পরীক্ষায় AI-তৈরি সঙ্গীত নিয়ে YouTube পরীক্ষা-নিরীক্ষা করে

প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্স বাছাই পরীক্ষায় AI-তৈরি সঙ্গীত নিয়ে YouTube পরীক্ষা-নিরীক্ষা করে। উল্লম্ব অনুসন্ধান. আ.

ইউটিউব এমন সফ্টওয়্যার নিয়ে পরীক্ষা-নিরীক্ষা করছে যা Google DeepMind দ্বারা নির্মিত Lyria নামক একটি AI মডেল ব্যবহার করে সঙ্গীত তৈরি করে৷

গুগলের মালিকানাধীন হোম-ভিডিও জায়ান্ট বৃহস্পতিবার ঘোষণা করেছে দুটি বৈশিষ্ট্য যা এটি পরীক্ষকদের একটি ছোট গোষ্ঠীর কাছে ঠেলে দিচ্ছে: ড্রিম ট্র্যাক এবং মিউজিক এআই টুল। 

ড্রিম ট্র্যাক একটি পাঠ্য-ভিত্তিক প্রম্পটকে একটি সংক্ষিপ্ত অডিও স্নিপেটে রূপান্তরিত করে যা বিভিন্ন পপ তারকাদের ভয়েস এবং শৈলীর অনুকরণ করে - যেমন অ্যালেক বেঞ্জামিন, চার্লি পুথ, চার্লি এক্সসিএক্স, ডেমি লোভাটো, জন লেজেন্ড, সিয়া, টি-পেইন, ট্রয়ে সিভান এবং পাপুস। শিল্পীর পছন্দ এখন পর্যন্ত এই পারফর্মারদের মধ্যেই সীমাবদ্ধ কারণ কপিরাইট যুদ্ধ এড়াতে গুগলকে লিরিয়াকে তাদের সঙ্গীতে প্রশিক্ষণ দেওয়ার জন্য লাইসেন্স নিয়ে আলোচনা করতে হয়েছে।

ড্রিম ট্র্যাক টি-পেইনের স্টাইলে "ফ্লোরিডায় একটি রৌদ্রোজ্জ্বল সকাল, আরএন্ডবি" প্রম্পটের জন্য কী তৈরি করে তা আপনি শুনতে পারেন - একজন শিল্পী যিনি অটোটিউনের মাধ্যমে তার ভয়েস পরিবর্তন করার জন্য সুপরিচিত - নীচে৷ 

ইউটিউব ভিডিও

এটি অবশ্যই টি-পেইনের মতো শোনাচ্ছে এবং গানের কথাগুলি উপযুক্ত এবং প্রম্পটের সাথে মেলে। ড্রিম ট্র্যাক বর্তমানে শুধুমাত্র "সীমিত সংখ্যক নির্মাতাদের" জন্য উপলব্ধ যারা AI-তৈরি ট্র্যাকের 30-সেকেন্ডের ক্লিপ তৈরি করতে পারে যা YouTube Shorts - সাধারণত মিনিট-দৈর্ঘ্যের ভিডিও হিসাবে পোস্ট করা যেতে পারে। 

মিউজিক এআই টুল আরও আকর্ষণীয় এবং দরকারী বলে মনে হচ্ছে। এটি লোকেদের অনুমতি দেয়, বিশেষ করে যাদের কোনো বা অনেক যন্ত্র নেই, একটি অডিও ক্লিপকে রূপান্তরিত করতে দেয় - যেমন একটি জ্যা বা কেউ একটি সুর গুনছে - এমন কিছুতে যা আসল শব্দটি ধরে রাখে কিন্তু অন্য যন্ত্রের আকারে বাজানো হয়। 

সবচেয়ে চিত্তাকর্ষক ডেমো, সম্ভবত, একগুচ্ছ "না-না-না" গানের ধ্বনিকে একটি অর্কেস্ট্রাল স্কোরে রূপান্তরিত করে, স্ট্রিং ইন্সট্রুমেন্ট দিয়ে সম্পূর্ণ যা মনে হয় এটি একটি চলচ্চিত্রের জন্য কিছুটা বিশ্বাসযোগ্য সাউন্ডট্র্যাক হতে পারে। আপনি এটি নীচে শুনতে পারেন.

ইউটিউব ভিডিও

ইউটিউব শুধুমাত্র নির্বাচিত শিল্পী, গীতিকার এবং প্রযোজকদের সাথে মিউজিক এআই টুল শেয়ার করছে যা এই মুহূর্তে এর মিউজিক এআই ইনকিউবেটর প্রোগ্রামের অংশ। 

মিউজিক AI টুল বিশেষ করে কীভাবে বাদ্যযন্ত্র গাইতে বা বাজাতে হয় তা না জেনেই নতুন ফর্মে সঙ্গীত তৈরি করতে দেয় – অনেকটা যেমন কেউ কীভাবে আঁকতে বা আঁকা যায় না জেনেই আর্টওয়ার্ক তৈরি করতে টেক্সট-টু-ইমেজ মডেল ব্যবহার করতে পারে।

এটি আমাদেরকে মনে করিয়ে দেয় বহু বছর আগে, ইলেকট্রনিক মিউজিকের উত্থানে, যখন নিন্দুকেরা হাহাকার করে বলেছিল যে সিন্থেসাইজার এবং কম্পিউটার-এডেড সিকোয়েন্সিং যে কেউ তথাকথিত বাস্তব সঙ্গীতজ্ঞদের মতো ট্র্যাকগুলি মন্থন করতে দেয়।

"এই পরীক্ষাগুলি শিল্পী এবং নির্মাতাদের তাদের কল্পনাকে প্রসারিত করতে এবং তাদের সৃজনশীল প্রক্রিয়াগুলিকে বাড়িয়ে তুলতে সাহায্য করার জন্য AI বৈশিষ্ট্যগুলির সম্ভাব্যতা অন্বেষণ করে," ব্যাখ্যা যথাক্রমে YouTube-এর Lyor Cohen এবং Toni Reid, গ্লোবাল হেড অফ মিউজিক, এবং VP উদীয়মান অভিজ্ঞতা এবং সম্প্রদায়ের পণ্য।

“এবং পালাক্রমে, ভক্তরা তাদের পছন্দের সৃজনশীলদের সাথে নতুন উপায়ে সংযোগ করতে সক্ষম হবে, ইন্টারেক্টিভ সরঞ্জাম এবং অভিজ্ঞতার মাধ্যমে তাদের আরও কাছাকাছি নিয়ে আসবে। এই সবই আমাদের প্রযুক্তিকে পুনরাবৃত্তি এবং উন্নত করতে সাহায্য করবে, ভবিষ্যতের জন্য অ্যাপ্লিকেশনগুলিকে অবহিত করবে।"

জেনারেটিভ এআই এবং সঙ্গীত, তবে, বিশেষ করে চতুর। অডিও তৈরি করতে সক্ষম এমন মডেলগুলি তৈরি করা যা আসলেই ভাল শোনায় তা নয়, তবে সিস্টেমগুলিকে প্রশিক্ষণ দেওয়ার জন্য ডেটা সুরক্ষিত করাও কঠিন। রেকর্ড লেবেলগুলি তাদের কপিরাইট রক্ষা করার ক্ষেত্রে কুখ্যাতভাবে বিচারপ্রবণ হয় - যেমনটি YouTube খুব ভালো করেই জানে৷ ভিডিও সাইটটি বলেছে যে এটি এই সমস্যাগুলির চারপাশে কাজ করছে এবং শিল্পীদের তাদের সঙ্গীতের জন্য ক্ষতিপূরণ দেওয়ার জন্য লাইসেন্সিং চুক্তিতে প্রবেশ করার চেষ্টা করছে। 

“এআই প্রদত্ত অসাধারণ সুযোগ থাকা সত্ত্বেও, আমরা এটাও স্বীকার করি যে এটি একটি দ্রুত বিকশিত স্থান যা জটিল চ্যালেঞ্জ উপস্থাপন করে। YouTube-এর সবচেয়ে বড় শক্তিগুলির মধ্যে একটি হল সঙ্গীত শিল্পের অংশীদারদের সাথে আমাদের দৃঢ় সম্পর্ক৷ আমরা এই নতুন যুগে প্রবেশ করার সাথে সাথে তাদের সাথে সহযোগিতা করার জন্য প্রতিশ্রুতিবদ্ধ, সমালোচনামূলকভাবে একসাথে নতুন সুযোগগুলি অন্বেষণ করছি এবং বুদ্ধিমান এবং টেকসই নিয়ন্ত্রণ, নগদীকরণ এবং অ্যাট্রিবিউশন ফ্রেমওয়ার্কগুলি বিকাশ করছি,” কোহেন এবং রিড যোগ করেছেন।

এদিকে, গুগল ডিপমাইন্ডের গবেষকরা নকল এআই-জেনারেটেড অডিওর সমস্যা মোকাবেলা করছেন যা শ্রোতাদের ম্যানিপুলেট বা বিভ্রান্ত করতে ব্যবহার করা যেতে পারে। লাইরিয়া মডেল ব্যবহার করে তৈরি ট্র্যাকগুলি সিন্থেটিক সামগ্রী সনাক্ত করতে ব্যবহৃত সিন্থআইডি টুল থেকে অদৃশ্য ওয়াটারমার্ক বহন করবে। সিনথআইডি দৃশ্যত কাজ করে অডিও ডেটাকে দ্বি-মাত্রিক স্পেকট্রোগ্রামে রূপান্তর করে, সেই উপস্থাপনায় একটি ডিজিটাল ওয়াটারমার্ক প্রয়োগ করে এবং এটিকে আবার অডিওতে রূপান্তর করে।

“ওয়াটারমার্কটি সনাক্তযোগ্যতা বজায় রাখার জন্য ডিজাইন করা হয়েছে এমনকি যখন অডিও সামগ্রীতে শব্দ সংযোজন, MP3 সংকোচন, বা ট্র্যাকের গতি বাড়ানো এবং ধীর করার মতো অনেক সাধারণ পরিবর্তনের মধ্য দিয়ে যায়। সিন্থআইডি একটি ট্র্যাক জুড়ে একটি ওয়াটারমার্কের উপস্থিতি শনাক্ত করতে পারে যে কোনও গানের কিছু অংশ লিরিয়া দ্বারা তৈরি করা হয়েছে কিনা তা নির্ধারণ করতে সহায়তা করতে পারে,” ডিপমাইন্ড ব্যাখ্যা। ®

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী