लेखकों ने टारपीडो एनवीडिया के नेमो पर कॉपीराइट मुकदमा दायर किया

लेखकों ने टारपीडो एनवीडिया के नेमो पर कॉपीराइट मुकदमा दायर किया

लेखकों ने टारपीडो एनवीडिया के नेमो प्लेटोब्लॉकचेन डेटा इंटेलिजेंस पर कॉपीराइट मुकदमा दायर किया। लंबवत खोज. ऐ.

एनवीडिया उन आरोपों का सामना करने वाली नवीनतम तकनीकी दिग्गज है कि उसने लेखकों की अनुमति प्राप्त किए बिना एआई मॉडल को प्रशिक्षित करने के लिए कॉपीराइट कार्यों का उपयोग किया।

एक प्रस्तावित वर्ग कार्रवाई मुक़दमा [पीडीएफ] शुक्रवार 8 मार्च को सैन फ्रांसिस्को में जीपीयू सुप्रीमो के खिलाफ दायर की गई, जिसमें दावा किया गया है कि कंपनी ने मेगेट्रॉन लाइब्रेरी में बड़े भाषा मॉडल को प्रशिक्षित करने के लिए कॉपीराइट सामग्री का उपयोग किया है। निमो जेनरेटिव एआई फ्रेमवर्क.

शिकायत तीन लेखकों, आब्दी नाज़ेमियन, ब्रायन कीने और स्टीवर्ट ओ'नान द्वारा दायर की गई थी, जिनका दावा है कि उनके द्वारा लिखी गई किताबें मेगेट्रॉन एलएलएम को प्रशिक्षित करने के लिए उपयोग की जाने वाली सामग्री में से थीं।

अदालत में दायर की गई फाइलिंग से, ऐसा प्रतीत होता है कि एनवीडिया पर लेखकों के काम की खुलेआम नकल करने का आरोप नहीं है, बल्कि मेगेट्रॉन मॉडल को प्रशिक्षित करने के लिए एक डेटासेट का उपयोग करने का आरोप है, जिसमें कई बिना लाइसेंस वाले कॉपीराइट कार्य शामिल थे।

मुकदमा विशेष रूप से उन मॉडलों को संदर्भित करता है जिन्हें एनवीडिया ने सितंबर 2022 में जारी किया था, अर्थात् निमो मेगेट्रॉन-जीपीटी 1.3बी, नेमो मेगेट्रॉन-जीपीटी 5बी, नेमो मेगेट्रॉन-जीपीटी 20बी, और नेमो मेगेट्रॉन-टी5 3बी।

इन्हें एआई संगठन द्वारा संचालित वेबसाइट पर होस्ट किया गया है गले लगना, साथ ही प्रत्येक मॉडल के बारे में जानकारी, जिसमें उसका प्रशिक्षण डेटासेट भी शामिल है। इस मामले में, जानकारी में कहा गया है कि मॉडलों को EleutherAI द्वारा तैयार किए गए "द पाइल" डेटासेट पर प्रशिक्षित किया गया था।

पाइल को "भाषा मॉडलिंग के लिए विविध पाठ का 800 जीबी डेटासेट" के रूप में वर्णित किया गया है और इसका एक घटक भाग बुक्स 3 नामक पुस्तकों का एक संग्रह है, जिसमें लगभग 196,640 पुस्तकों की सामग्री शामिल है, जिसमें तीन लेखकों द्वारा बनाई गई पुस्तकें भी शामिल हैं।

अदालत में दायर याचिका के अनुसार, बुक्स3 डेटासेट अक्टूबर 2023 तक हगिंग फेस पर अलग से उपलब्ध था, जब इसे हटा दिया गया क्योंकि यह "निष्क्रिय है और रिपोर्ट किए गए कॉपीराइट उल्लंघन के कारण अब पहुंच योग्य नहीं है।"

लेखक चाहते हैं कि मामला वर्ग कार्रवाई के रूप में आगे बढ़े, वे स्वयं वर्ग प्रतिनिधि के रूप में कार्य करें, और जूरी ट्रायल की मांग कर रहे हैं और अपने कॉपीराइट के कथित उल्लंघन के लिए हर्जाने की मांग कर रहे हैं।

भेजे गए एक बयान में रजिस्टरएनवीडिया के प्रवक्ता ने कहा: "हम सभी सामग्री निर्माताओं के अधिकारों का सम्मान करते हैं और मानते हैं कि हमने कॉपीराइट कानून के पूर्ण अनुपालन में NeMo बनाया है।"

एआई मॉडल को प्रशिक्षित करने के लिए उपयोग किए गए डेटा के संबंध में कॉपीराइट उल्लंघन के आरोप में एआई कंपनी पर मुकदमा चलाने का यह पहला मामला नहीं है। पिछले साल दिसंबर में न्यूयॉर्क टाइम्स ने एक लॉन्च किया था माइक्रोसॉफ्ट और ओपनएआई के खिलाफ मामला इस दावे पर कि इस जोड़ी ने चैटजीपीटी और इसी तरह के मॉडल बनाने के लिए अपने लेखों का उपयोग बिना अनुमति के किया था।

जनवरी में ओपनएआई के दावे से यह मामला शायद और अधिक दिलचस्प हो गया था शीर्ष स्तरीय तंत्रिका नेटवर्क बनाना "असंभव"। जो लोगों के कॉपीराइट किए गए कार्यों का उपयोग किए बिना आज की ज़रूरतों को पूरा करता है।

इस बीच, एनवीडिया अभी भी इस क्षेत्र में तकनीकी विश्वसनीयता स्थापित करने में डेवलपर्स की मदद करने के लिए जेनेरिक एआई में एक नए पेशेवर प्रमाणन की घोषणा के साथ एआई पंप को बढ़ावा दे रहा है।

इस महीने के अंत में सांता क्लारा स्थित दिग्गज कंपनी के जीटीसी कार्यक्रम के साथ उपलब्ध होने के लिए तैयार है व्यावसायिक प्रमाणन कार्यक्रम बड़े भाषा मॉडल और मल्टीमॉडल वर्कफ़्लो कौशल में दक्षता पर ध्यान केंद्रित करते हुए, दो सहयोगी-स्तरीय जेनरेटिव एआई मान्यताएं प्रदान करेगा। ®

समय टिकट:

से अधिक रजिस्टर