Autorii depun proces pentru drepturi de autor pentru a torpila NeMo de la Nvidia

Autorii depun proces pentru drepturi de autor pentru a torpila NeMo de la Nvidia

Autorii depun un proces pentru drepturi de autor pentru a torpila NeMo PlatoBlockchain Data Intelligence de la Nvidia. Căutare verticală. Ai.

Nvidia este cel mai recent gigant tehnologic care se confruntă cu acuzațiile că a folosit lucrări protejate prin drepturi de autor pentru a antrena modele AI fără a obține permisiunea autorilor.

O acțiune colectivă propusă proces [PDF] depusă împotriva GPU supremo din San Francisco vineri, 8 martie, susține că compania a folosit materiale protejate prin drepturi de autor pentru a antrena modele mari de limbi în biblioteca Megatron pentru Cadrul AI generativ NeMo.

Plângerea a fost depusă de trei autori, Abdi Nazemian, Brian Keene și Stewart O'Nan, care susțin că cărțile pe care le-au scris s-au numărat printre materialele folosite pentru instruirea LLM-urilor Megatron.

Din dosarul instanței, reiese că Nvidia nu este acuzată că a copiat în mod deschis lucrările autorilor în sine, ci că a folosit un set de date pentru a antrena modelele Megatron despre care se știa că conține o serie de lucrări fără licență și protejate prin drepturi de autor.

Procesul se referă în mod specific la modelele pe care Nvidia le-a lansat în septembrie 2022, și anume NeMo Megatron-GPT 1.3B, NeMo Megatron-GPT 5B, NeMo Megatron-GPT 20B și NeMo Megatron-T5 3B.

Acestea sunt găzduite pe site-ul web operat de AI outfit Fata îmbrățișată, împreună cu informații despre fiecare model, inclusiv setul de date de antrenament al acestuia. În acest caz, informațiile arată că modelele au fost antrenate pe setul de date „The Pile” pregătit de EleutherAI.

Teancul este descris ca „un set de date de 800 GB de text divers pentru modelarea limbajului”, iar una dintre părțile sale constitutive este o colecție de cărți numită Books3, care conține conținutul a aproximativ 196,640 de cărți, inclusiv cele create de cei trei autori.

Potrivit dosarului instanței, setul de date Books3 a fost disponibil separat pe Hugging Face până în octombrie 2023, când a fost eliminat deoarece „este defunct și nu mai este accesibil din cauza încălcării drepturilor de autor raportate”.

Autorii doresc ca cazul să se desfășoare ca o acțiune colectivă, cu ei înșiși în calitate de reprezentanți ai clasei, și cer un proces cu juriu și despăgubiri pentru presupusele încălcări ale drepturilor de autor.

Într-o declarație trimisă la Registrul, a declarat un purtător de cuvânt al Nvidia: „Respectăm drepturile tuturor creatorilor de conținut și credem că am creat NeMo în deplină conformitate cu legea drepturilor de autor”.

Acesta nu este primul caz în care o companie de inteligență artificială este dat în judecată pentru acuzații de încălcare a drepturilor de autor privind datele utilizate pentru antrenarea modelelor de inteligență artificială. În decembrie anul trecut, The New York Times a lansat un caz împotriva Microsoft și OpenAI din cauza afirmațiilor că perechea și-a folosit articolele fără permisiune pentru a construi ChatGPT și modele similare.

Acest caz a fost probabil mai interesant de afirmația OpenAI din ianuarie că va fi „imposibil” să construiești rețele neuronale de top care răspund nevoilor actuale fără a folosi lucrările oamenilor protejate prin drepturi de autor.

Între timp, Nvidia încă amorsează pompa AI cu anunțul unei noi certificări profesionale în AI generativă pentru a ajuta dezvoltatorii să-și stabilească credibilitatea tehnică în acest domeniu.

Se pregătește să devină disponibil pentru a coincide cu evenimentul GTC al gigantului din Santa Clara la sfârșitul acestei luni, the program de certificare profesională va oferi două acreditări AI generative la nivel de asociat, concentrându-se pe competența în modele de limbaj mari și abilități de flux de lucru multimodal. ®

Timestamp-ul:

Mai mult de la Registrul