OpenAI: শীর্ষ-স্তরের AI প্রশিক্ষণ এবং কপিরাইট এড়ানো অসম্ভব

OpenAI: শীর্ষ-স্তরের AI প্রশিক্ষণ এবং কপিরাইট এড়ানো অসম্ভব

OpenAI: শীর্ষ-স্তরের AI প্রশিক্ষণ দেওয়া এবং কপিরাইট PlatoBlockchain ডেটা ইন্টেলিজেন্স এড়ানো অসম্ভব। উল্লম্ব অনুসন্ধান. আ.

ওপেনএআই বলেছে যে মানুষের কপিরাইটযুক্ত কাজ ব্যবহার না করে আজকের চাহিদা পূরণ করে এমন শীর্ষ-স্তরের নিউরাল নেটওয়ার্ক তৈরি করা "অসম্ভব" হবে। মাইক্রোসফ্ট-সমর্থিত ল্যাব, যা বিশ্বাস করে যে এটি তার মডেলদের প্রশিক্ষণের জন্য আইনত কন্টেন্ট সংগ্রহ করছে, বলেছে কপিরাইট-এর বাইরের পাবলিক ডোমেন উপাদান ব্যবহার করলে সাব-পার এআই সফ্টওয়্যার হবে।

এই দাবিটি এমন এক সময়ে আসে যখন মেশিন-লার্নিং বিশ্ব কপিরাইট আইনের ইটের প্রাচীরের দিকে প্রথমে দৌড়াচ্ছে। এই সপ্তাহে একটি IEEE রিপোর্ট মিডজার্নি এবং OpenAI-এর DALL-E 3, টেক্সট প্রম্পটকে ছবিতে পরিণত করার জন্য দুটি প্রধান AI পরিষেবা, তাদের প্রশিক্ষণ ডেটার উপর ভিত্তি করে ফিল্ম এবং ভিডিও গেমগুলি থেকে কপিরাইটযুক্ত দৃশ্যগুলি পুনরায় তৈরি করতে পারে।

সার্জারির অধ্যয়ন, একজন এআই বিশেষজ্ঞ এবং সমালোচক গ্যারি মার্কাস দ্বারা সহ-লেখক এবং রিড সাউথেন, একজন ডিজিটাল ইলাস্ট্রেটর, "প্ল্যাজিয়ারিস্টিক আউটপুট" এর একাধিক উদাহরণ নথিভুক্ত করেছেন যেখানে OpenAI এবং DALL-E 3 চলচ্চিত্রের দৃশ্যের, বিখ্যাতদের ছবিগুলির উল্লেখযোগ্যভাবে অনুরূপ সংস্করণ উপস্থাপন করে। অভিনেতা, এবং ভিডিও গেম সামগ্রী।

মার্কাস এবং সাউথেন বলেছেন যে এটি প্রায় নিশ্চিত যে মিডজার্নি এবং ওপেনএআই তাদের নিজ নিজ এআই ইমেজ-জেনারেশন মডেলগুলিকে কপিরাইটযুক্ত সামগ্রীতে প্রশিক্ষণ দিয়েছে।

এটি আইনী কিনা এবং এআই বিক্রেতা বা তাদের গ্রাহকদের দায়বদ্ধ হওয়ার ঝুঁকি রয়েছে কিনা, বিতর্কিত প্রশ্ন থেকে যায়। যাইহোক, প্রতিবেদনের ফলাফলগুলি কপিরাইট লঙ্ঘনের জন্য মিডজার্নি এবং DALL-E নির্মাতা ওপেনএআই-এর বিরুদ্ধে মামলাকারীদের শক্তিশালী করতে পারে।

ব্যবহারকারীরা জানেন না, যখন তারা একটি চিত্র তৈরি করে, তারা লঙ্ঘন করছে কিনা

"ওপেনএআই এবং মিডজার্নি উভয়ই কপিরাইট এবং ট্রেডমার্ক লঙ্ঘন করে এমন সামগ্রী তৈরি করতে সম্পূর্ণরূপে সক্ষম," তারা লিখেছেন৷ “এই সিস্টেমগুলি ব্যবহারকারীদেরকে অবহিত করে না যখন তারা তা করে। তারা যে ছবিগুলি তৈরি করে তার উত্স সম্পর্কে তারা কোনও তথ্য সরবরাহ করে না। ব্যবহারকারীরা হয়তো জানেন না, যখন তারা একটি ছবি তৈরি করে, তারা লঙ্ঘন করছে কিনা।"

কোন বিজ তাদের AI মডেলগুলি তৈরি করতে ব্যবহৃত প্রশিক্ষণের ডেটা পুরোপুরি প্রকাশ করেনি।

এটা ঠিক না ডিজিটাল শিল্পী চ্যালেঞ্জিং এআই কোম্পানিগুলো। সম্প্রতি নিউইয়র্ক টাইমস OpenAI এর বিরুদ্ধে মামলা করেছে কারণ এর চ্যাটজিপিটি টেক্সট মডেল সংবাদপত্রের পেওয়াল করা নিবন্ধগুলির প্রায়-শব্দের কপিগুলিকে থুতু দেবে৷ বই লেখক অনুরূপ দাবি দাখিল করেছে, যেমন আছে সফ্টওয়্যার ডেভেলপারদের.

পূর্বে গবেষণা ইঙ্গিত দিয়েছে যে ওপেনএআই-এর চ্যাটজিপিটি প্রশিক্ষণের পাঠ্য পুনরুত্পাদন করার জন্য সংযুক্ত করা যেতে পারে। এবং যারা মাইক্রোসফ্ট এবং গিটহাবের বিরুদ্ধে মামলা করে তারা দাবি করে যে কপিলট কোডিং সহকারী মডেলটি কমবেশি শব্দগুচ্ছ কোড পুনরুত্পাদন করবে।

সাউথেন পর্যবেক্ষণ করেছেন যে মিডজার্নি গ্রাহকদের চার্জ করছে যারা লঙ্ঘনকারী সামগ্রী তৈরি করছে এবং সাবস্ক্রিপশন আয়ের মাধ্যমে লাভ করছে। "এমজে [মিডজার্নি] ব্যবহারকারীদের সম্ভাব্যভাবে ঘটতে কপিরাইট লঙ্ঘনের জন্য ছবি বিক্রি করতে হবে না, এমজে ইতিমধ্যেই এর সৃষ্টি থেকে লাভ করেছে," তিনি মতে, IEEE রিপোর্টে তৈরি একটি যুক্তির প্রতিধ্বনি।

ওপেনএআই একটি সাবস্ক্রিপশন ফিও নেয় এবং একইভাবে লাভ করে। ওপেনএআই এবং মিডজার্নি কেউই মন্তব্যের অনুরোধে সাড়া দেয়নি।

তবে ওপেনএআই সোমবার একটি প্রকাশ করেছে ব্লগ পোস্ট নিউ ইয়র্ক টাইমস মামলা মোকাবেলা করে, যা এআই বিক্রেতা বলেছিলেন যে যোগ্যতার অভাব রয়েছে। আশ্চর্যজনকভাবে, ল্যাবটি বলেছে যে যদি এর নিউরাল নেটওয়ার্কগুলি লঙ্ঘনকারী সামগ্রী তৈরি করে তবে এটি একটি "বাগ" ছিল।

মোট, আপস্টার্ট আজ যুক্তি দিয়েছে যে: এটি সক্রিয়ভাবে সংবাদ সংস্থাগুলির সাথে সহযোগিতা করে; কপিরাইটযুক্ত ডেটার প্রশিক্ষণ কপিরাইট আইনের অধীনে ন্যায্য ব্যবহারের প্রতিরক্ষার জন্য যোগ্যতা অর্জন করে; "'রিগারজিটেশন' একটি বিরল বাগ যা আমরা শূন্যে নিয়ে যাওয়ার জন্য কাজ করছি"; এবং নিউ ইয়র্ক টাইমস-এ পাঠ্য পুনরুত্পাদনের চেরি-বাছাই করা উদাহরণ রয়েছে যা সাধারণ আচরণের প্রতিনিধিত্ব করে না।

আইন সিদ্ধান্ত নেবে

ক্যালিফোর্নিয়ার সান্তা ক্লারা বিশ্ববিদ্যালয়ের আইন বিভাগের অধ্যাপক টাইলার ওচোয়া বলেছেন নিবন্ধনকর্মী যদিও IEEE রিপোর্টের ফলাফলগুলি কপিরাইট দাবির সাথে মামলাকারীদের সাহায্য করতে পারে, তাদের উচিত নয় - কারণ নিবন্ধের লেখকরা, তার দৃষ্টিতে, যা ঘটছে তা ভুলভাবে উপস্থাপন করেছেন৷

"তারা লিখেছেন: 'ছবি তৈরির মডেলগুলি কি কপিরাইট সামগ্রীর উপর ভিত্তি করে চুরির আউটপুট তৈরি করতে প্ররোচিত হতে পারে? … [ডব্লিউ] আমি খুঁজে পেয়েছি যে উত্তরটি স্পষ্টভাবে হ্যাঁ, এমনকি সরাসরি চুরির আউটপুট না চাওয়া ছাড়াই।'”

ওচোয়া সেই উপসংহারে প্রশ্ন তুলেছেন, যুক্তি দিয়ে প্রতিবেদনের লেখকরা "প্রবেশ করেছে প্রমাণ করে যে তারা সরাসরি চুরির আউটপুট চাচ্ছে। প্রতিটি একক প্রম্পট একটি নির্দিষ্ট সিনেমার শিরোনাম উল্লেখ করে, আকৃতির অনুপাত উল্লেখ করে এবং একটি ক্ষেত্রে বাদে সব ক্ষেত্রে, 'মুভি' এবং 'স্ক্রিনশট' বা 'স্ক্রিনক্যাপ' শব্দগুলি। (একটি ব্যতিক্রম চিত্রটি বর্ণনা করে যা তারা প্রতিলিপি করতে চেয়েছিল।)

আইন প্রফেসর বলেছেন যে কপিরাইট আইনের সমস্যাটি নির্ধারণ করছে যে এই চুরির আউটপুটগুলির জন্য কে দায়ী: এআই মডেলের নির্মাতা বা যারা এআই মডেলকে একটি জনপ্রিয় দৃশ্য পুনরুত্পাদন করতে বলেছেন।

"জেনারেটিভ এআই মডেলটি আসল আউটপুট তৈরি করতে সক্ষম, এবং এটি এমন দৃশ্যগুলি পুনরুত্পাদন করতেও সক্ষম যা কপিরাইটযুক্ত ইনপুট থেকে দৃশ্যের সাথে সাদৃশ্যপূর্ণ, যখন প্রম্পট করা হয়," ওচোয়া ব্যাখ্যা করেছেন। "এটি অবদানকারী লঙ্ঘনের একটি কেস হিসাবে বিশ্লেষণ করা উচিত: যে ব্যক্তি মডেলটিকে প্ররোচিত করেছেন তিনি প্রাথমিক লঙ্ঘনকারী, এবং মডেলটির নির্মাতারা কেবল তখনই দায়বদ্ধ যদি তাদের প্রাথমিক লঙ্ঘন সম্পর্কে সচেতন করা হয় এবং তারা থামানোর জন্য যুক্তিসঙ্গত পদক্ষেপ না নেয়। এটা।"

ওচোয়া বলেছেন যে জেনারেটিভ এআই মডেলগুলি তাদের প্রশিক্ষণ ডেটা সেটে সেই চিত্রগুলির একাধিক উদাহরণ থাকলে নির্দিষ্ট চিত্রগুলি পুনরুত্পাদন করার সম্ভাবনা বেশি থাকে।

“এই ক্ষেত্রে, প্রশিক্ষণের তথ্যে সম্পূর্ণ সিনেমা অন্তর্ভুক্ত হওয়ার সম্ভাবনা খুবই কম; এটা অনেক বেশি সম্ভব যে প্রশিক্ষণের ডেটাতে সিনেমার স্থির চিত্র অন্তর্ভুক্ত করা হয়েছে যেগুলি সিনেমার প্রচার স্থিরচিত্র হিসাবে বিতরণ করা হয়েছিল,” তিনি বলেছিলেন। "এই ছবিগুলি প্রশিক্ষণের ডেটাতে একাধিকবার পুনরুত্পাদন করা হয়েছিল কারণ মিডিয়া আউটলেটগুলি প্রচারের উদ্দেশ্যে সেই ছবিগুলি বিতরণ করতে উত্সাহিত হয়েছিল এবং তাই করেছিল৷

"একজন কপিরাইট মালিকের পক্ষে প্রচারের উদ্দেশ্যে স্থির চিত্রগুলির ব্যাপক প্রচারকে উত্সাহিত করা মৌলিকভাবে অন্যায্য হবে এবং তারপরে অভিযোগ করুন যে সেই চিত্রগুলি একটি AI দ্বারা অনুকরণ করা হচ্ছে কারণ প্রশিক্ষণের ডেটাতে একই চিত্রগুলির একাধিক অনুলিপি অন্তর্ভুক্ত ছিল।"

ওচোয়া বলেন, এআই মডেল থেকে এই ধরনের আচরণ সীমিত করার পদক্ষেপ রয়েছে। "প্রশ্ন হল তাদের তা করা উচিত কিনা, যখন প্রম্পটে প্রবেশকারী ব্যক্তি স্পষ্টভাবে একটি স্বীকৃত চিত্র পুনরুত্পাদন করার জন্য AI পেতে চেয়েছিলেন এবং মূল স্থির চিত্রগুলি তৈরি করে এমন মুভি স্টুডিওগুলি স্পষ্টতই চায় যে সেই স্থির চিত্রগুলি ব্যাপকভাবে বিতরণ করা হোক। ," সে বলেছিল.

"একটি ভাল প্রশ্ন হবে: যখন প্রম্পট একটি নির্দিষ্ট সিনেমার উল্লেখ করে না বা একটি নির্দিষ্ট চরিত্র বা দৃশ্য বর্ণনা করে না তখন এটি কতবার ঘটে? আমি মনে করি একজন নিরপেক্ষ গবেষক সম্ভবত উত্তরটি খুব কমই খুঁজে পাবেন (সম্ভবত প্রায় কখনই নয়)।

তা সত্ত্বেও, কপিরাইটযুক্ত বিষয়বস্তু এই মডেলগুলিকে ভালভাবে কাজ করার জন্য অপরিহার্য জ্বালানী বলে মনে হচ্ছে।

OpenAI লর্ডসের কাছে নিজেকে রক্ষা করে

জবাবে একটি তদন্ত যুক্তরাজ্যের হাউস অফ লর্ডস কমিউনিকেশনস এবং ডিজিটাল কমিটি দ্বারা এআই মডেলগুলির ঝুঁকি এবং সুযোগগুলির মধ্যে, ওপেনএআই একটি উপস্থাপন করেছে নমন [PDF] সতর্কতা যে এর মডেলগুলি কপিরাইটযুক্ত সামগ্রীতে প্রশিক্ষিত না হয়ে কাজ করবে না৷

"কারণ কপিরাইট আজ কার্যত প্রতিটি ধরণের মানুষের অভিব্যক্তিকে কভার করে - ব্লগ পোস্ট, ফটোগ্রাফ, ফোরাম পোস্ট, সফ্টওয়্যার কোডের স্ক্র্যাপ এবং সরকারী নথি সহ - কপিরাইটযুক্ত সামগ্রী ব্যবহার না করে আজকের শীর্ষস্থানীয় এআই মডেলগুলিকে প্রশিক্ষণ দেওয়া অসম্ভব হবে," সুপার ল্যাব বলেছে .

"এক শতাব্দীরও বেশি আগে তৈরি করা পাবলিক ডোমেন বই এবং অঙ্কনগুলিতে প্রশিক্ষণের ডেটা সীমিত করা একটি আকর্ষণীয় পরীক্ষা হতে পারে, তবে আজকের নাগরিকদের চাহিদা পূরণ করে এমন AI সিস্টেম সরবরাহ করবে না।"

এআই বিজ বলেছে যে এটি বিশ্বাস করে যে এটি কপিরাইট আইন মেনে চলে এবং কপিরাইটযুক্ত উপাদানের প্রশিক্ষণ আইনসম্মত, যদিও এটি অনুমতি দেয় যে "নির্মাতাদের সমর্থন ও ক্ষমতায়নের জন্য এখনও কাজ করা বাকি আছে।"

সেই অনুভূতি, যা কপিরাইটযুক্ত কাজের যুক্তিযুক্ত ন্যায্য ব্যবহারের জন্য ক্ষতিপূরণের বিষয়ে নৈতিক উদ্বেগের কূটনৈতিক স্বীকৃতির মতো শোনায়, এটি IEEE রিপোর্টের দাবির সাথে বিবেচনা করা উচিত যে, “আমরা প্রমাণ পেয়েছি যে মিডজার্নির একজন সিনিয়র সফ্টওয়্যার ইঞ্জিনিয়ার এতে অংশ নিয়েছিলেন। একটি কথোপকথন 2022 সালের ফেব্রুয়ারিতে 'একটি সূক্ষ্ম সুর করা কোডেক্সের মাধ্যমে' ডেটা 'লন্ডারিং' করে কীভাবে কপিরাইট আইন এড়ানো যায়।

আইইইই রিপোর্টের সহ-লেখক মার্কাস, যুক্তরাজ্যে তার বর্তমান ব্যবসায়িক অনুশীলনের জন্য একটি নিয়ন্ত্রক সবুজ আলো পাওয়ার জন্য OpenAI-এর প্রচেষ্টা নিয়ে সংশয় প্রকাশ করেছেন।

"মোটামুটি অনুবাদ: আপনি যদি আমাদের চুরি করতে না দেন তবে আমরা দুর্দান্তভাবে ধনী হব না, তাই দয়া করে চুরি করাকে অপরাধ করবেন না!" তিনি একটি সোশ্যাল মিডিয়ায় লিখেছেন পোস্ট. “আমাদের অর্থ প্রদান করবেন না লাইসেন্সিং ফি, হয়! নিশ্চিত Netflix লাইসেন্স ফি বছরে বিলিয়ন দিতে পারে, কিন্তু we করা উচিত নয়! আমাদের জন্য আরও টাকা, মোর!

OpenAI এন্টারপ্রাইজ ChatGPT এবং API গ্রাহকদের ক্ষতিপূরণ দেওয়ার প্রস্তাব দিয়েছে কপিরাইট দাবির বিরুদ্ধে, যদিও গ্রাহক বা গ্রাহকের শেষ ব্যবহারকারীরা "আউটপুট লঙ্ঘন করছে বা সম্ভবত লঙ্ঘন করছে" বা গ্রাহক নিরাপত্তা বৈশিষ্ট্যগুলিকে বাইপাস করে থাকলে তা জানতেন বা জানা উচিত ছিল না, অন্যান্য সীমাবদ্ধতার মধ্যে. এইভাবে, DALL-E 3 কে একটি বিখ্যাত চলচ্চিত্রের দৃশ্য পুনরায় তৈরি করতে বলা - যা ব্যবহারকারীদের জানা উচিত সম্ভবত কপিরাইট দ্বারা আচ্ছাদিত - ক্ষতিপূরণের জন্য যোগ্য হবে না।

মিডজার্নি বিপরীত পন্থা নিয়েছে, লঙ্ঘনের সাথে জড়িত গ্রাহকদের খুঁজে বের করার এবং সংশ্লিষ্ট দাবি থেকে উদ্ভূত আইনি খরচ পুনরুদ্ধারের জন্য মামলা করার প্রতিশ্রুতি দিয়েছে।

"আপনি যদি জেনেশুনে অন্য কারো মেধা সম্পত্তি লঙ্ঘন করেন, এবং এতে আমাদের অর্থ ব্যয় হয়, আমরা আপনাকে খুঁজে বের করব এবং আপনার কাছ থেকে সেই অর্থ সংগ্রহ করব," মিডজার্নির সেবা পাবার শর্ত অবস্থা. “আমরা অন্যান্য জিনিসও করতে পারি, যেমন আপনি আমাদের আইনি ফি পরিশোধ করার জন্য আদালতে যাওয়ার চেষ্টা করুন। এটা করো না।" ®

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী