ডেভিড হোলজ, এআই আর্ট জেনারেটর মিডজার্নির প্রতিষ্ঠাতা, ইমেজিং প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের ভবিষ্যত সম্পর্কে। উল্লম্ব অনুসন্ধান. আ.

ডেভিড হোলজ, এআই আর্ট জেনারেটর মিডজার্নির প্রতিষ্ঠাতা, ইমেজিংয়ের ভবিষ্যতের বিষয়ে

সাক্ষাত্কার 2008 সালে, ডেভিড হোলজ লিপ মোশন নামে একটি হার্ডওয়্যার পেরিফেরাল ফার্ম সহ-প্রতিষ্ঠা করেন। তিনি গত বছর পর্যন্ত এটি চালিয়েছিলেন যখন তিনি মিডজউরি তৈরি করতে চলে যান।

মিডজার্নি বর্তমান আকারে একটি টেক্সট প্রম্পট থেকে এআই-জেনারেটেড আর্ট তৈরির জন্য একটি সামাজিক নেটওয়ার্ক – ইনপুট প্রম্পটে একটি শব্দ বা বাক্যাংশ টাইপ করুন এবং আপনি প্রায় এক মিনিট গণনার পরে স্ক্রিনে একটি আকর্ষণীয় বা সম্ভবত বিস্ময়কর চিত্র পাবেন। এটি কিছু ক্ষেত্রে ওপেনএআই এর অনুরূপ DALL-E2.

"এই সমস্ত অকেজো সৌন্দর্য" টেক্সট প্রম্পট ব্যবহার করে আকাশ এবং মেঘের মধ্যযাত্রার চিত্র। উত্স: দ্বারা উত্পন্ন মিডজার্নি

উভয়ই বিশাল সংখ্যক ইমেজের উপর প্রশিক্ষিত বড় এআই মডেলের ফলাফল। কিন্তু মিডজার্নির নিজস্ব স্বতন্ত্র শৈলী আছে, যা থেকে দেখা যায় এই টুইটার থ্রেড. সাম্প্রতিক দিনগুলিতে উভয়ই পাবলিক বিটা পরীক্ষায় প্রবেশ করেছে (যদিও DALL-E 2 অ্যাক্সেস ধীরে ধীরে প্রসারিত হচ্ছে)।

টেক্সট ইনপুট ব্যবহার করে এআই মডেল থেকে উচ্চ-মানের ছবি তৈরি করার ক্ষমতা গত বছর OpenAI-এর প্রকাশের পর একটি জনপ্রিয় কার্যকলাপ হয়ে ওঠে। ক্লিপ (কন্ট্রাস্টিভ ল্যাঙ্গুয়েজ–ইমেজ প্রাক-প্রশিক্ষণ), যা টেক্সট বর্ণনার সাথে কতটা ভালোভাবে জেনারেট করা ছবিগুলিকে মূল্যায়ন করার জন্য ডিজাইন করা হয়েছিল। মুক্তির পর, শিল্পী রায়ান মারডক (@advadnoun টুইটারে) খুঁজে পেয়েছে প্রক্রিয়াটি বিপরীত হতে পারে - পাঠ্য ইনপুট প্রদান করে, আপনি অন্যান্য AI মডেলের সাহায্যে ইমেজ আউটপুট পেতে পারেন।

এর পরে, জেনারেটিভ আর্ট সম্প্রদায় বিভিন্ন ধরণের মডেল এবং কৌশল ব্যবহার করে চিত্র তৈরি করতে পাইথন কোড প্রকাশ করে জ্বরপূর্ণ অনুসন্ধানের সময় শুরু করে।

"গত বছরের কিছু সময়, আমরা দেখেছিলাম যে AI এর কিছু ক্ষেত্র ছিল যা সত্যিই আকর্ষণীয় উপায়ে অগ্রগতি করছে," হোলজ এর সাথে একটি সাক্ষাত্কারে ব্যাখ্যা করেছিলেন নিবন্ধনকর্মী. "তাদের মধ্যে একটি ছিল AI এর ভাষা বোঝার ক্ষমতা।"

হোলজ ট্রান্সফরমারের মতো উন্নয়নের দিকে ইঙ্গিত করেছেন, একটি গভীর শিক্ষার মডেল যা CLIP-কে অবহিত করে এবং ডিফিউশন মডেল, GAN-এর বিকল্প। ক্যাথরিন ক্রসন (টুইটারে @RiversHaveWings নামে পরিচিত) দ্বারা বিকশিত তিনি বলেন, "যেটি সত্যিই ব্যক্তিগতভাবে আমার চোখে আঘাত করেছিল তা হল CLIP-নির্দেশিত প্রসারণ।"

স্টেরিওটাইপড ফ্লোরিডার মানুষ নয়

হোলজ ফ্লোরিডায় বড় হয়েছিলেন এবং হাই স্কুলে একটি ডিজাইন ব্যবসা করেছিলেন যেখানে তিনি গণিত এবং পদার্থবিদ্যা অধ্যয়ন করেছিলেন। তিনি একটি ফলিত গণিতের পিএইচডি-তে কাজ করছিলেন এবং লিপ মোশন শুরু করার জন্য 2008 সালে অনুপস্থিতির ছুটি নিয়েছিলেন। পরের বছর, তিনি ম্যাক্স প্ল্যাঙ্ক ইনস্টিটিউটে একজন ছাত্র গবেষক হিসেবে এক বছর অতিবাহিত করেন, তারপরে নাসা ল্যাংলি রিসার্চ সেন্টারে লিডার, মঙ্গল অভিযান এবং বায়ুমণ্ডলীয় বিজ্ঞানের উপর কাজ করা একজন স্নাতক ছাত্র গবেষক হিসেবে দুই বছর অতিবাহিত করেন।

"আমি ছিলাম, কেন আমি এই সমস্ত জিনিস নিয়ে কাজ করছি?" তিনি ব্যাখ্যা করেছেন। "আমি কেবল একটি দুর্দান্ত জিনিস নিয়ে কাজ করতে চাই যা আমি খুব পছন্দ করি।"

তাই তিনি লিপ মোশনের উপর দৃষ্টি নিবদ্ধ করেন, যা হাতের গতি ট্র্যাক করার জন্য একটি হার্ডওয়্যার ডিভাইস তৈরি করে এবং ডিভাইস ইনপুটের জন্য এটি ব্যবহার করে। তিনি বারো বছর কোম্পানিটি পরিচালনা করেছিলেন এবং যখন তিনি এটি ছেড়েছিলেন তখন প্রায় 100 জন লোক নিয়োগ করেছিলেন।

মিডজার্নি, তিনি বলেন, এই মুহূর্তে বেশ ছোট। "আমরা প্রায় 10 জনের মতো," তিনি ব্যাখ্যা করেছিলেন। “আমরা স্ব-অর্থায়ন করছি. আমাদের কোনো বিনিয়োগকারী নেই। আমরা সত্যিই আর্থিকভাবে অনুপ্রাণিত নই। আমরা এখানে এমন কিছু বিষয় নিয়ে কাজ করতে এসেছি যা আমরা আগ্রহী এবং মজা করি। এবং আমরা অনেকগুলি বিভিন্ন প্রকল্পে কাজ করছিলাম।"

হোলজ বলেছেন AI এর প্রযুক্তিগত দিক এবং এটি কতটা উন্নতি করবে তা পূর্বাভাস দেওয়া মোটামুটি সহজ। "কিন্তু এর মানবিক প্রভাব কল্পনা করা এত কঠিন," তিনি বলেছিলেন। “এখানে এমন কিছু আছে যা মানবতা এবং প্রযুক্তির সংযোগস্থলে রয়েছে। এটি আসলে কী এবং এটি কী হওয়া উচিত তা বোঝার জন্য, আমাদের সত্যিই অনেক পরীক্ষা-নিরীক্ষা করতে হবে।"

সামনের রাস্তা

মিডজার্নির মতো টুলস এবং ব্লেন্ডারের মতো ডাউনলোডযোগ্য ওপেন সোর্স গ্রাফিক্স অ্যাপ্লিকেশন বা অ্যাডোব ফটোশপের মতো স্থানীয়ভাবে ইনস্টল করা বাণিজ্যিক অ্যাপ্লিকেশন (এটি ক্লাউড পরিষেবা হওয়ার আগে) এর মধ্যে পার্থক্যের মধ্যে এআই ইমেজ প্রযুক্তির অস্থির প্রকৃতি স্পষ্ট।

মিডজার্নি একটি সামাজিক প্রেক্ষাপটে বিদ্যমান। এর ফ্রন্ট-এন্ড হল চ্যাট সার্ভিস ডিসকর্ড। নতুন ব্যবহারকারীরা ডিসকর্ডের মিডজার্নি সার্ভারে লগ ইন করে এবং তারপরে বিভিন্ন নবাগত চ্যানেলে অসংখ্য অন্যান্য ব্যবহারকারীর সাথে ছবি তৈরি করার জন্য পাঠ্য প্রম্পট জমা দিতে পারে।

প্রায় এক মিনিটের মধ্যে সেই চ্যানেলের সমস্ত ব্যবহারকারীদের জন্য ফলস্বরূপ চিত্রগুলি, যা সম্প্রদায়ের ধারণাকে শক্তিশালী করতে সহায়তা করে। যারা $10/মাস বা $30/মাসের সাবস্ক্রিপশনে আপগ্রেড করার সিদ্ধান্ত নিয়েছে তারা ডিসকর্ড অ্যাপে মিডজার্নি বটে একটি ব্যক্তিগত সরাসরি বার্তা হিসাবে পাঠ্য জমা দিতে পারে এবং জনসাধারণের অন্যান্য ব্যবহারকারীদের কাছ থেকে স্ক্রিন-স্ক্রলিং জলপ্রপাত ছাড়াই প্রতিক্রিয়া হিসাবে চিত্রগুলি গ্রহণ করতে পারে। চ্যানেল যদিও জেনারেট করা ছবিগুলি ডিফল্টরূপে সর্বজনীনভাবে দেখা যায়।

একটি সামাজিক অ্যাপ হিসাবে, মিডজার্নি অনুমোদিত বিষয়বস্তু সম্পর্কে নিয়মের সাপেক্ষে - এমন কিছু যা ব্লেন্ডার বা অন্যান্য স্থানীয়ভাবে ইনস্টল করা অ্যাপের ব্যবহারকারীদের চিন্তা করতে হবে না। Midjourney এর পরিষেবার শর্তাবলী বলে: “কোন প্রাপ্তবয়স্ক বিষয়বস্তু বা গোর নয়। অনুগ্রহ করে দৃষ্টিকটু বা বিরক্তিকর বিষয়বস্তু তৈরি করা এড়িয়ে চলুন। আমরা স্বয়ংক্রিয়ভাবে কিছু টেক্সট ইনপুট ব্লক করব।"

DALL-E 2 অনুরূপ সাপেক্ষে যদিও আরো ব্যাপক সীমাবদ্ধতা রয়েছে, যেমন এটিতে বর্ণিত হয়েছে বিষয়বস্তু নীতি.

"আমি মনে করি যদি আমরা এমন একটি বিশ্বে বাস করতাম যেখানে সামাজিক মিডিয়া ছিল না, তাহলে আমাদের কোন বিধিনিষেধের প্রয়োজন হবে না," হোলজ বলেছিলেন। "...ফটোশপ যখন আবিষ্কৃত হয়েছিল, তখন আসলে এটি সম্পর্কে প্রেস ছিল, যেখানে এটির মতো, 'ওহ, আপনি যে কোনও কিছু নকল করতে পারেন এবং এটি কিছুটা ভীতিজনক।' [কিন্তু এখন], আগের চেয়ে চাঞ্চল্যকর হওয়া অনেক বেশি লাভজনক।"

"আজকাল, যে কেউ চাঞ্চল্যকর হতে পারে, এবং মূলত এর থেকে লাভবান হতে পারে, আপনি জানেন," হোলজ বলেছিলেন। “এবং তাই এটি যা করে তা নাটক এবং চাঞ্চল্যকরতার বাজার তৈরি করে। এই কারণেই আমি মনে করি আমাদের আরও একটু সতর্ক হতে হবে, কারণ এক পর্যায়ে, লোকেরা যা করবে তা হল তারা বলবে, 'ঠিক আছে, আমি এর ছবি তুলতে পারি, সবচেয়ে নাটকীয় এবং আক্রমণাত্মক এবং ভয়ঙ্কর জিনিস কী? বানাতে পারি?'"

সহজ উত্তর নেই

হোলজ অনুমতি দেয় যে সামাজিক প্ল্যাটফর্মগুলি এই সমস্যাগুলি প্রশমিত করার জন্য কিছু করতে পারে তবে বলে যে কোনও সহজ উত্তর নেই। "দুর্ভাগ্যবশত, এটিকে মোকাবেলা করার একটি সুস্পষ্ট উপায় নেই, একটি সমাজ ছাড়া, চাঞ্চল্যকরতাকে কম পুরস্কৃত করা," তিনি বলেছিলেন। "তবে, আমার ধারণা হল যে কেউ সত্যিই চাঞ্চল্যকরতা কমাতে সামাজিক প্ল্যাটফর্মগুলি পরিবর্তন করার চেষ্টা করছে না, কারণ এটি তাদের এখন অর্থ উপার্জন করে।"

আরো কি, তিনি বলেন, যেহেতু মিডজার্নির লক্ষ্য 13 বছরের বেশি বয়সী যেকোন ব্যক্তির জন্য একটি সামাজিক স্থান হওয়া, তাই চরম বা গ্রাফিক বিষয়বস্তুর বিরুদ্ধে নিয়ম থাকা প্রয়োজন।

"আমরা সত্যিই এমন লোকেদের জন্য বিভক্ত স্থান চাই না যারা মৃতদেহ তৈরি করতে পছন্দ করে বা নগ্ন ছবি পছন্দ করে," হোলজ ব্যাখ্যা করেছিলেন। “আমরা কেবল এটি মোকাবেলা করতে চাই না। আমরা মনে করি না যে এই পর্যায়ে আমাদের নৈতিক দায়িত্ব আছে। আমরা একটি সুন্দর সামাজিক স্থান চাই যাতে লোকেরা একসাথে জিনিস তৈরি করতে পারে এবং বিক্ষুব্ধ না হয়, মূলত, এবং নিরাপদ বোধ করতে পারে।"

সেই লক্ষ্যে, কোম্পানির প্রায় 40 জন মডারেটর রয়েছে যা ব্যবহারকারীরা তৈরি করা চিত্রগুলির উপর নজর রাখে।

মিডজার্নির সামাজিক দিকটি সম্প্রতি ছবির গুণমান উন্নত করতে শুরু করেছে। হোলজ বলেছেন যে কোম্পানির প্রকৌশলীরা সম্প্রতি তার সফ্টওয়্যারটির তিনটি সংস্করণ চালু করেছে, যা প্রথমবারের মতো ব্যবহারকারীর কার্যকলাপ এবং প্রতিক্রিয়ার উপর ভিত্তি করে একটি প্রতিক্রিয়া লুপ অন্তর্ভুক্ত করেছে।

"আপনি যদি v3 স্টাফ তাকান, এই বিশাল উন্নতি আছে," তিনি বলেন. “এটা মন-বিস্মৃতভাবে ভালো এবং আমরা আসলে এতে আর কোনো শিল্প রাখিনি। ব্যবহারকারীরা কোন ছবি পছন্দ করেছে এবং তারা কীভাবে এটি ব্যবহার করছে সে সম্পর্কে আমরা শুধু ডেটা নিয়েছি। এবং এটি আসলে এটি আরও ভাল করেছে।"

মিডজার্নি টেক স্ট্যাক সম্পর্কে জিজ্ঞাসা করা হলে, হোলজ বিব্রতকর। "কোন সময়ে, আমরা সম্ভবত একটি প্রেস রিলিজ করতে যাচ্ছি বিশেষভাবে কোন বিক্রেতাদের আমরা ব্যবহার করছি," তিনি বলেছিলেন। “আমি কি বলতে পারি যে আমাদের কাছে বিলিয়ন প্যারামিটার সহ এই বড় এআই মডেল রয়েছে। তারা কোটি কোটি ছবির উপর প্রশিক্ষিত।"

হোলজ বলেছেন যে ব্যবহারকারীরা প্রতিদিন লক্ষ লক্ষ এবং লক্ষ লক্ষ ছবি তৈরি করছেন, এবং সবুজ শক্তি কম্পিউট প্রদানকারী ব্যবহার করে তা করছেন - যা প্রকৃতপক্ষে প্রধান ক্লাউড কম্পিউটিং প্রদানকারীদের ক্ষেত্রকে সংকীর্ণ করে না কারণ তারা সবাই অন্তত কার্বন নিরপেক্ষ বলে দাবি করে।

"প্রতিটি চিত্রই পেটোপস নিচ্ছে," তিনি বলেছিলেন, একটি শব্দ যার অর্থ প্রতি সেকেন্ডে 10^15 অপারেশন৷ “তাই 1000 ট্রিলিয়ন অপারেশন। আমি ঠিক জানি না এটি পাঁচটি নাকি 10 বা 50৷ তবে এটি একটি চিত্র তৈরি করতে 1000 ট্রিলিয়ন অপারেশন৷ এটি সম্ভবত সবচেয়ে ব্যয়বহুল … আপনি যদি মিডজার্নিকে কল করেন, একটি পরিষেবা - যেমন আপনি এটিকে একটি পরিষেবা বা পণ্য বলবেন - নিঃসন্দেহে, এমন কোনও পরিষেবা আগে কখনও হয়নি যেখানে একজন নিয়মিত ব্যক্তি এত গণনা ব্যবহার করছেন।"

আমাদের খাবার ও কাপড়ে রাখছে

তবুও মিডজার্নি প্রদত্ত স্তরগুলিতে বিনামূল্যে পরিষেবা দ্বারা আনা গ্রাহকদের আপসেল করার পথে এবং তারপরে জনসাধারণের কাছে যাওয়ার আগে বা অধিগ্রহণ করার আগে ভাল অর্থপ্রদানকারী এন্টারপ্রাইজ ক্লায়েন্টদের আকর্ষণ করার পথে নয়।

"আমরা একটি স্টার্টআপের মতো নই যে প্রচুর অর্থ সংগ্রহ করে এবং তারপরে তাদের ব্যবসা বা পণ্য কী তা নিশ্চিত না এবং দীর্ঘ সময়ের জন্য অর্থ হারায়," হোলজ বলেছিলেন। “আমরা একটি স্ব-অর্থায়নকৃত গবেষণা ল্যাবের মতো। আমরা কিছু পরিমাণ অর্থ হারাতে পারি। আমাদের কাছে অন্য কারো টাকার 100 মিলিয়ন ডলার হারানোর মতো নেই। সত্যি বলতে, আমরা ইতিমধ্যেই লাভজনক, এবং আমরা ভালো আছি।"

"এটি একটি খুব সহজ ব্যবসায়িক মডেল, যা, লোকেরা কি এটি ব্যবহার করে উপভোগ করে? তারপর যদি তারা তা করে তবে তাদের এটি ব্যবহারের খরচ দিতে হবে কারণ কাঁচা খরচ আসলে বেশ ব্যয়বহুল। এবং তারপরে আমরা এর উপরে একটি শতাংশ যোগ করি, যা আমাদের খাওয়ানো এবং ঘর করার জন্য যথেষ্ট। এবং তাই আমরা এটি করছি।"

ভবিষ্যতের জন্য, স্কেলিং একটি সমস্যা হতে পারে। হোলজ বলেছিলেন যে মিডজার্নিতে বর্তমানে কয়েক হাজার লোক পরিষেবাটি ব্যবহার করছে, যার জন্য 10,000 সার্ভারের মতো কিছু প্রয়োজন।

"যদি 10 মিলিয়ন মানুষ এভাবে প্রযুক্তি ব্যবহার করার চেষ্টা করত," তিনি বলেছিলেন, "আসলে পর্যাপ্ত কম্পিউটার নেই। বিশ্বে AI করার জন্য এক মিলিয়ন ফ্রি সার্ভার নেই। আমি মনে করি প্রযুক্তিটি বাস্তবে যারা এটি ব্যবহার করতে চায় তাদের কাছে পৌঁছানোর আগেই বিশ্বে কম্পিউটার ফুরিয়ে যাবে।"

মানুষ এটা কি জন্য ব্যবহার করছে? ঠিক আছে, আপনি যদি একটি মিডজার্নি অ্যাকাউন্টে সাইন ইন করে থাকেন তবে আপনি দেখতে পাবেন যে লোকেরা এর মাধ্যমে কী তৈরি করছে কমিউনিটি ফিড পৃষ্ঠা এটি আকর্ষণীয়, প্রায়শই চমকপ্রদ ভাল, চিত্রগুলির একটি ধ্রুবক প্রবাহ।

"অধিকাংশ মানুষ শুধু মজা করছে," হোলজ বলেছেন। "আমি মনে করি এটি সবচেয়ে বড় জিনিস কারণ এটি আসলে শিল্প সম্পর্কে নয়, এটি কল্পনা সম্পর্কে।"

পেশাদার হচ্ছে

কিন্তু ব্যবহারকারীদের প্রায় 30 শতাংশের জন্য, এটি পেশাদার। হোলজ বলেন, অনেক গ্রাফিক শিল্পী তাদের ধারণা উন্নয়ন কর্মপ্রবাহের অংশ হিসেবে মিডজার্নি ব্যবহার করেন। তারা একটি ধারণার উপর কয়েকটি বৈচিত্র তৈরি করে এবং ক্লায়েন্টদের কাছে উপস্থাপন করে যে তাদের কোন দিকটি অনুসরণ করা উচিত।

"পেশাদাররা তাদের সৃজনশীল বা যোগাযোগ প্রক্রিয়াকে সুপারচার্জ করতে এটি ব্যবহার করছেন," হোলজ ব্যাখ্যা করেছেন। "এবং তারপরে অনেক লোক এটি নিয়ে খেলছিল।"

হতে পারে 20 শতাংশ মানুষ মিডজার্নি ব্যবহার করে যা হলজ আর্ট থেরাপি হিসাবে বর্ণনা করে। উদাহরণস্বরূপ, কুকুর মারা যাওয়ার পরে কুকুরের ছবি তৈরি করা। "তারা এটিকে একটি মানসিক এবং বুদ্ধিবৃত্তিক প্রতিফলিত হাতিয়ার হিসাবে ব্যবহার করছে," তিনি বলেছিলেন। "এবং এটি সত্যিই দুর্দান্ত।"

হোলজ মিডজার্নি ব্যবহার করে জাল ফটোগ্রাফ তৈরি করার ধারণাটি অপছন্দ করেন। "জাল ছবি তৈরি করতে সম্পাদকীয়ভাবে এটি ব্যবহার করা অত্যন্ত বিপজ্জনক," তিনি বলেছিলেন। "কেউ এটা করা উচিত নয়।" তবে তিনি বাণিজ্যিক চিত্রের উত্স হিসাবে মিডজার্নির জন্য আরও উন্মুক্ত, উল্লেখ করেছেন যে দ্য ইকোনমিস্ট একটি মিডজার্নি গ্রাফিক চালায় জুনে এর প্রচ্ছদে।

"আমরা সম্প্রতি লোকেদের বাণিজ্যিকভাবে এটি ব্যবহার করার অনুমতি দিয়েছি," হোলজ বলেছেন। “দীর্ঘ সময় ধরে, এটি শুধুমাত্র অ-বাণিজ্যিক ছিল। এবং তাই আমরা যা করছি তার মধ্যে একটি হল আমরা কেবল এটি দেখছি, লোকেরা কী করছে, এবং আমরা সিদ্ধান্ত নিতে পারি যে আমরা এর কিছুর সাথে স্বাচ্ছন্দ্য বোধ করছি না এবং তারপরে আমরা একটি নিয়ম চালু করব যে আপনাকে বলবে এটাকে আর শুধু সেই জিনিসগুলোর জন্য ব্যবহার করতে পারবে না।"

হোলজ বলেছিলেন যে তিনি মিডজার্নির মতো AI সরঞ্জামগুলিকে পেশাদার শিল্পী বানানোর পরিবর্তে শিল্পীদের তারা যা করে তাতে আরও ভাল করে তোলে। "এই সরঞ্জামগুলি ব্যবহার করে একজন শিল্পী এই সরঞ্জামগুলি ব্যবহার করে একজন নিয়মিত ব্যক্তির চেয়ে সর্বদা ভাল। কিছু সময়ে, এই সরঞ্জামগুলি ব্যবহার করার চাপ থাকতে পারে কারণ আপনি এমন জিনিসগুলি তৈরি করতে পারেন যা এত দুর্দান্ত? আমি মনে করি, হ্যাঁ. কিন্তু এই মুহূর্তে, আমি মনে করি না এটি এখনও পুরোপুরি আছে। কিন্তু আগামী দুই বছরের মধ্যে এটা আরও ভালো হয়ে যাবে।”

Midjourney এবং DALL-E 2 কপিরাইট বা নির্দিষ্ট লাইসেন্সের অধীনে কাজ থেকে তৈরি করা বৃহৎ AI মডেলগুলি কপিরাইট আইনের সাথে এবং বিষয়বস্তু নির্মাতাদের নিজস্ব ধারণার সাথে তাদের কাজকে কীভাবে আচরণ করা উচিত তার সাথে মিলিত হতে পারে কিনা সে সম্পর্কে দীর্ঘদিনের উদ্বেগের প্রতি আরও মনোযোগ আকর্ষণ করেছে।

আমেরিকা, মামলার দেশ

মিডজার্নি আউটপুটের পরিপ্রেক্ষিতে, বর্তমান মার্কিন আইনশাস্ত্র এআই-উত্পন্ন চিত্রগুলিতে কপিরাইট দেওয়ার সম্ভাবনাকে অস্বীকার করে। ফেব্রুয়ারিতে, মার্কিন কপিরাইট অফিস পর্যালোচনা বোর্ড প্রত্যাখ্যাত [PDF] একটি কম্পিউটার-উত্পাদিত ল্যান্ডস্কেপ শিরোনামের একটি কপিরাইট মঞ্জুর করার দ্বিতীয় অনুরোধ "স্বর্গে একটি সাম্প্রতিক প্রবেশ" কারণ এটি মানুষের লেখকত্ব ছাড়াই তৈরি করা হয়েছিল৷

একটি ফোন সাক্ষাত্কারে, সান্তা ক্লারা বিশ্ববিদ্যালয়ের আইন বিভাগের অধ্যাপক টাইলার ওচোয়া বলেছেন নিবন্ধনকর্মী, “ইউএস কপিরাইট অফিস বলেছে যে এটি [গ্রহণযোগ্য] যদি একজন শিল্পী AI ব্যবহার করে একটি কাজ তৈরিতে তাদের সহায়তা করে যতক্ষণ না কিছু মানুষের সৃজনশীলতা জড়িত থাকে। যদি আপনি কেবল টেক্সট টাইপ করেন এবং এআই একটি কাজ তৈরি করে, তবে এটি স্পষ্টতই বর্তমান আইনের অধীনে কপিরাইট সুরক্ষার বিষয় নয়।"

Midjourney-এর পরিষেবার শর্তাবলী বলে যে "আপনি পরিষেবাগুলির সাথে তৈরি করা সমস্ত সম্পদের মালিক", কিন্তু পরিষেবার সাথে তৈরি সামগ্রী পুনরুত্পাদন করার জন্য কোম্পানির ব্যবহারকারীদের কাছ থেকে একটি কপিরাইট লাইসেন্সের প্রয়োজন - ব্যবহারকারীদের ছবি হোস্ট করার জন্য একটি প্রয়োজনীয় সতর্কতা, এমনকি যদি এটি সন্দেহজনক বলে মনে হয় টেক্সট ইনপুটের মাধ্যমে মিডজার্নি ইমেজ তৈরি করার কোনো কপিরাইট আছে যা বোঝানো বা বলবৎ করা যায়।

সবসময় এমনটা নাও হতে পারে। ওচোয়া বলেছিলেন যে তিনি বিশ্বাস করেন যে স্টিভেন থ্যালার, যিনি "স্বর্গে একটি সাম্প্রতিক প্রবেশদ্বার" তৈরি করেছিলেন, তিনি হয়তো কপিরাইট অফিসের এআই-ভিত্তিক লেখকত্বের প্রত্যাখ্যানকে আদালতে চ্যালেঞ্জ করতে চাইতে পারেন, যদিও এটি এখনও হয়নি।

কপিরাইটযুক্ত সামগ্রীতে প্রশিক্ষিত AI মডেলগুলি থেকে উদ্ভূত সম্ভাব্য কপিরাইট উদ্বেগও রয়েছে। "প্রশ্ন হল প্রশিক্ষণ এবং AI এর জন্য সেই ছবিগুলি ব্যবহার করা একটি ন্যায্য ব্যবহার হবে কিনা," ওচোয়া বলেছেন। "এবং আমি মনে করি সেই প্রসঙ্গে ন্যায্য ব্যবহারের জন্য মামলাটি মোটামুটি শক্তিশালী।"

অতিরিক্তভাবে, যারা বিদ্যমান কপিরাইটযুক্ত সামগ্রীর সাথে যথেষ্ট পরিমাণে অনুরূপ চিত্র তৈরি করেন তাদের জন্য সম্ভাব্য দায়বদ্ধতা রয়েছে৷ "যদি আপনার প্রশিক্ষণ সেটটি যথেষ্ট বড় না হয়, তাহলে এআই যা থুতু দেয় তা এটির মতোই ভয়ঙ্কর দেখাতে পারে," ওচোয়া ব্যাখ্যা করেছেন, উল্লেখ করে যে সমস্যাটি হল এটি একটি কপিরাইট লঙ্ঘন কিনা। "পরোক্ষভাবে, আমি মনে করি এটি খুব সম্ভবত হতে পারে।"

মিডজার্নি-উত্পাদিত সম্পদ ব্যবহার করে ক্লায়েন্টদের সম্ভাব্য আইনি ঝুঁকির জন্য, ওচোয়া বলেছিলেন যে তিনি মনে করেন এটি মোটামুটি কম। যদি একটি এআই মডেলের প্রশিক্ষণ কপিরাইট লঙ্ঘন করে, তবে ক্লায়েন্ট জড়িত হওয়ার আগে এটি করা হয়েছিল, তিনি ব্যাখ্যা করেছিলেন। "সুতরাং যদি ক্লায়েন্ট কোনোভাবে AI তৈরিতে স্পনসর না করে, আমি মনে করি না [ক্লায়েন্ট] প্রশিক্ষণ সেটের কোনো লঙ্ঘনের জন্য দায়ী হবে," তিনি বলেছিলেন। “এবং এটি এখানে সবচেয়ে শক্তিশালী দাবি। তাই আমি মনে করি ক্লায়েন্টরা এই ছবিগুলি ব্যবহার করার ক্ষেত্রে বেশ শক্ত অবস্থানে রয়েছে, ধরে নিই যে এটি ভালভাবে সম্পন্ন হয়েছে।"

হোলজ স্বীকার করেছেন যে আইনি পরিস্থিতির স্বচ্ছতার অভাব রয়েছে।

"এই মুহুর্তে, আইনে এই ধরণের জিনিস সম্পর্কে সত্যিই কিছু নেই," তিনি বলেছিলেন। “আমার জানামতে, প্রতিটি একক বড় AI মডেল মূলত ইন্টারনেটে থাকা জিনিসগুলির উপর প্রশিক্ষিত। এবং যে ঠিক আছে, এই মুহূর্তে. এটি সম্পর্কে বিশেষভাবে কোন আইন নেই। ভবিষ্যতে হয়তো থাকবে। কিন্তু এটি একটি অভিনব এলাকা, যেমন GPL প্রোগ্রামিং কোডের চারপাশে একটি অভিনব আইনি জিনিস ছিল. এবং এটি সত্যই এমন কিছু হয়ে উঠতে 20 বা 30 বছরের মতো লেগেছিল যা আইনী ব্যবস্থা বের করতে শুরু করেছে।"

হোলজ বলেছিলেন যে তিনি বিশ্বাস করেন যে এই প্রযুক্তি সম্পর্কে সংশ্লিষ্ট পক্ষগুলি কীভাবে অনুভব করে তা বোঝা এই মুহূর্তে আরও গুরুত্বপূর্ণ। "আমাদের অনেক শিল্পী আছে যারা আমাদের জিনিস ব্যবহার করে, এবং আমরা ক্রমাগত তাদের সাথে চেক করছি, 'আপনি কি এই বিষয়ে ঠিক বোধ করছেন?'" তিনি বলেছিলেন।

হোলজ বলেছিলেন যে যদি স্থিতাবস্থা নিয়ে যথেষ্ট অসন্তোষ থাকে তবে শিল্পীদের জন্য যাদের কাজ প্রশিক্ষণের মডেলগুলিতে যায় তাদের জন্য ভবিষ্যতে কোনও ধরণের অর্থপ্রদানের কাঠামো সম্পর্কে চিন্তা করা মূল্যবান হতে পারে। কিন্তু তিনি লক্ষ্য করেছেন যে অবদানের পরিমাণ মূল্যায়ন করা বর্তমানে কঠিন। তিনি বলেন, "এই মুহূর্তে এরকম যেকোনো কিছুর জন্য চ্যালেঞ্জ হল এটি আসলে পরিষ্কার নয় যে কী এআই মডেলগুলিকে ভালভাবে কাজ করছে।" “যদি আমি সেখানে একটি কুকুরের একটি ছবি রাখি, তবে এটি আসলে [এআই মডেল] কুকুরের ছবি তুলতে কতটা সাহায্য করে। এটি আসলে পরিষ্কার নয় যে ডেটার কোন অংশগুলি আসলে [মডেল] কী ক্ষমতা দিচ্ছে।"

মিডজার্নিকে এর স্বাতন্ত্র্যসূচক নান্দনিকতা কী দেয় তা জিজ্ঞাসা করা হলে, হোলজ বলেছিলেন যে মিডজার্নি DALL-E 2 এর সাথে যা করছে তা তিনি সত্যিই তুলনা করতে পারেন না, তবে সাধারণভাবে এআই গবেষকরা যা অপ্টিমাইজ করে তা পাওয়ার প্রবণতা পান। যদি তারা "কুকুর" শব্দটি রাখে তবে তারা সম্ভবত একটি কুকুরের ছবি চায়।

“আমাদের জন্য, আমরা যখন এটিকে অপ্টিমাইজ করছিলাম, আমরা এটিকে সুন্দর দেখতে চেয়েছিলাম, এবং সুন্দর মানে বাস্তবসম্মত নয়। … যদি কিছু হয়, আসলে আমরা ফটো থেকে একটু দূরে এটি পক্ষপাতিত্ব করি। … আমি জানি এই প্রযুক্তি একটি গভীর নকল সুপার মেশিন হিসাবে ব্যবহার করা যেতে পারে. এবং আমি মনে করি না বিশ্বের আরও জাল ফটো দরকার। আমি সত্যিই বিশ্বে নকল ছবির উৎস হতে চাই না।”

“আমাদের জিনিসগুলি ছবির মতো দেখায় এমন কিছু তৈরি করলে আমি আসলে অস্বস্তি বোধ করি। এবং এর অর্থ এই নয় যে আমরা কখনই লোকেদের এমন জিনিসগুলিকে আরও বাস্তবসম্মত করতে দেব না। যে জিনিসগুলিকে আরও বাস্তবসম্মত দেখায় তা করার চেষ্টা করার জন্য বৈধ ব্যবহারের ক্ষেত্রে রয়েছে৷ যাইহোক, আমি দৃঢ়ভাবে অনুভব করি যে, ডিফল্টরূপে, যখন কেউ আমাদের সিস্টেম ব্যবহার করে, তখন এটি একটি নকল ছবি তৈরি করা উচিত নয়।"

“কিন্তু আমি মনে করি বিশ্বের আরও সৌন্দর্য প্রয়োজন। মূলত, আমি যদি এমন কিছু তৈরি করি যা মানুষকে সুন্দর জিনিস তৈরি করতে দেয় এবং পৃথিবীতে আরও সুন্দর জিনিস থাকে, তবে আমি ডিফল্টরূপে এটাই চাই।" ®

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী