লেখকরা এনভিডিয়ার নেমো টর্পেডোতে কপিরাইট মামলা দায়ের করেছেন

লেখকরা এনভিডিয়ার নেমো টর্পেডোতে কপিরাইট মামলা দায়ের করেছেন

লেখকরা Nvidia-এর NeMo PlatoBlockchain ডেটা ইন্টেলিজেন্স টর্পেডোতে কপিরাইট মামলা দায়ের করেছেন। উল্লম্ব অনুসন্ধান. আ.

এনভিডিয়া হল সর্বশেষ প্রযুক্তি জায়ান্ট যা অভিযোগের মুখোমুখি যে এটি লেখকদের অনুমতি ছাড়াই এআই মডেলগুলিকে প্রশিক্ষণের জন্য কপিরাইটযুক্ত কাজগুলি ব্যবহার করেছে।

একটি প্রস্তাবিত ক্লাস অ্যাকশন মামলা 8 মার্চ শুক্রবার সান ফ্রান্সিসকোতে জিপিইউ সুপ্রিমোর বিরুদ্ধে দায়ের করা [পিডিএফ] দাবি করেছে যে কোম্পানিটি মেগাট্রন লাইব্রেরিতে বড় ভাষার মডেলগুলিকে প্রশিক্ষণ দেওয়ার জন্য কপিরাইটযুক্ত উপাদান ব্যবহার করেছে NeMo জেনারেটিভ এআই ফ্রেমওয়ার্ক.

অভিযোগটি তিনজন লেখক, আবদি নাজেমিয়ান, ব্রায়ান কিইন এবং স্টুয়ার্ট ও'নান দ্বারা দায়ের করা হয়েছিল, যারা দাবি করেছেন যে তাদের লেখা বইগুলি মেগাট্রন এলএলএম প্রশিক্ষণের জন্য ব্যবহৃত উপাদানগুলির মধ্যে ছিল।

আদালতের ফাইলিং থেকে, এটি প্রতীয়মান হয় যে এনভিডিয়াকে লেখকদের কাজকে স্পষ্টভাবে অনুলিপি করার জন্য অভিযুক্ত করা হয়নি, বরং মেগাট্রন মডেলগুলিকে প্রশিক্ষণ দেওয়ার জন্য একটি ডেটাসেট ব্যবহার করা হয়েছে যা অনেকগুলি লাইসেন্সবিহীন কপিরাইটযুক্ত কাজ রয়েছে বলে পরিচিত ছিল।

মামলাটি বিশেষভাবে সেই মডেলগুলিকে নির্দেশ করে যেগুলি Nvidia সেপ্টেম্বর 2022-এ প্রকাশ করেছে, যথা NeMo Megatron-GPT 1.3B, NeMo Megatron-GPT 5B, NeMo Megatron-GPT 20B, এবং NeMo Megatron-T5 3B৷

এগুলি এআই পোশাক দ্বারা পরিচালিত ওয়েবসাইটে হোস্ট করা হয় আলিঙ্গন মুখ, প্রতিটি মডেল সম্পর্কে তথ্য সহ, এর প্রশিক্ষণ ডেটাসেট সহ। এই ক্ষেত্রে, তথ্যে বলা হয়েছে যে মডেলগুলিকে EleutherAI দ্বারা প্রস্তুত করা "দ্য পাইল" ডেটাসেটের উপর প্রশিক্ষণ দেওয়া হয়েছিল।

পাইলকে "ভাষা মডেলিংয়ের জন্য বৈচিত্র্যপূর্ণ পাঠ্যের একটি 800GB ডেটাসেট" হিসাবে বর্ণনা করা হয়েছে এবং এর একটি উপাদান হল Books3 নামক বইয়ের একটি সংগ্রহ, যাতে প্রায় 196,640টি বইয়ের বিষয়বস্তু রয়েছে, যার মধ্যে তিনজন লেখকের তৈরি বইগুলিও রয়েছে৷

আদালতের ফাইলিং অনুসারে, Books3 ডেটাসেটটি 2023 সালের অক্টোবর পর্যন্ত Hugging Face-এ আলাদাভাবে উপলব্ধ ছিল, যখন এটি অপসারণ করা হয়েছিল কারণ এটি "বিলুপ্ত এবং রিপোর্ট করা কপিরাইট লঙ্ঘনের কারণে আর অ্যাক্সেসযোগ্য নয়।"

লেখকরা চান যে মামলাটি একটি শ্রেণী ব্যবস্থা হিসাবে এগিয়ে যাক, নিজেরা শ্রেণী প্রতিনিধি হিসাবে কাজ করে এবং তাদের কপিরাইট লঙ্ঘনের অভিযোগের জন্য জুরির বিচার এবং ক্ষতিপূরণের জন্য জিজ্ঞাসা করছে।

একটি বিবৃতিতে পাঠানো হয়েছে নিবন্ধনকর্মী, এনভিডিয়ার একজন মুখপাত্র বলেছেন: "আমরা সমস্ত সামগ্রী নির্মাতাদের অধিকারকে সম্মান করি এবং বিশ্বাস করি যে আমরা কপিরাইট আইনের সাথে সম্পূর্ণ সম্মতিতে NeMo তৈরি করেছি।"

AI মডেলগুলিকে প্রশিক্ষণ দেওয়ার জন্য ব্যবহৃত ডেটা সম্পর্কিত কপিরাইট লঙ্ঘনের অভিযোগে কোনও AI কোম্পানির বিরুদ্ধে মামলা করার এটি প্রথম ঘটনা নয়। গত বছরের ডিসেম্বরে দ্য নিউ ইয়র্ক টাইমস একটি চালু করেছে মাইক্রোসফ্ট এবং ওপেনএআইয়ের বিরুদ্ধে মামলা এই জুটি ChatGPT এবং অনুরূপ মডেলগুলি তৈরি করার অনুমতি ছাড়াই তাদের নিবন্ধগুলি ব্যবহার করেছিল বলে দাবি করেছে৷

জানুয়ারিতে OpenAI-এর দাবির দ্বারা এই কেসটি সম্ভবত আরও আকর্ষণীয় হয়ে উঠেছে যে এটি হবে শীর্ষ স্তরের নিউরাল নেটওয়ার্ক তৈরি করা "অসম্ভব" যা মানুষের কপিরাইটযুক্ত কাজগুলি ব্যবহার না করেই আজকের চাহিদা পূরণ করে৷

ইতিমধ্যে, এনভিডিয়া এখনও এই এলাকায় প্রযুক্তিগত বিশ্বাসযোগ্যতা প্রতিষ্ঠা করতে ডেভেলপারদের সাহায্য করার জন্য জেনারেটিভ এআই-তে একটি নতুন পেশাদার শংসাপত্রের ঘোষণার সাথে এআই পাম্পকে প্রাইমিং করছে।

এই মাসের শেষের দিকে সান্তা ক্লারা-ভিত্তিক দৈত্যের GTC ইভেন্টের সাথে মিলিত হওয়ার জন্য উপলভ্য হতে সেট করা হয়েছে, পেশাদার সার্টিফিকেশন প্রোগ্রাম বৃহৎ ভাষার মডেল এবং মাল্টিমোডাল ওয়ার্কফ্লো দক্ষতার উপর দৃষ্টি নিবদ্ধ করে দুটি সহযোগী-স্তরের জেনারেটিভ এআই স্বীকৃতি প্রদান করবে। ®

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী