저자, Nvidia의 NeMo 어뢰에 대한 저작권 소송 제기

저자, Nvidia의 NeMo 어뢰에 대한 저작권 소송 제기

저자는 Nvidia의 NeMo PlatoBlockchain Data Intelligence에 대해 저작권 소송을 제기했습니다. 수직 검색. 일체 포함.

Nvidia는 저작자의 허가 없이 AI 모델을 훈련시키기 위해 저작권이 있는 저작물을 사용했다는 주장에 직면한 최신 기술 대기업입니다.

제안된 집단 소송 소송 8월 XNUMX일 금요일 샌프란시스코에서 GPU 슈프리모에 대해 제기된 [PDF]는 회사가 Megatron 라이브러리에서 대규모 언어 모델을 교육하기 위해 저작권이 있는 자료를 사용했다고 주장합니다. NeMo 생성 AI 프레임워크.

불만 사항은 Abdi Nazemian, Brian Keene, Stewart O'Nan 등 세 명의 저자가 제기했으며, 이들은 자신이 쓴 책이 Megatron LLM을 교육하는 데 사용된 자료 중 하나라고 주장했습니다.

법원 서류에 따르면 엔비디아는 저자의 저작물 자체를 명백히 복사한 것이 아니라, 라이선스가 부여되지 않은 다수의 저작물을 포함하는 것으로 알려진 메가트론 모델을 훈련하기 위해 데이터세트를 사용했다는 혐의로 기소된 것으로 보입니다.

소송은 특히 Nvidia가 2022년 1.3월에 출시한 모델, 즉 NeMo Megatron-GPT 5B, NeMo Megatron-GPT 20B, NeMo Megatron-GPT 5B 및 NeMo Megatron-T3 XNUMXB를 대상으로 합니다.

AI 복장이 운영하는 웹사이트에서 호스팅됩니다. 포옹하는 얼굴, 훈련 데이터 세트를 포함한 각 모델에 대한 정보와 함께. 이 경우 정보에는 모델이 EleutherAI가 준비한 "The Pile" 데이터 세트에 대해 훈련되었다고 명시되어 있습니다.

Pile은 "언어 모델링을 위한 다양한 텍스트의 800GB 데이터 세트"로 설명되며, 그 구성 부분 중 하나는 Books3이라는 책 모음으로, 여기에는 세 명의 저자가 만든 책을 포함하여 약 196,640권의 책 내용이 포함되어 있습니다.

법원 서류에 따르면 Books3 데이터세트는 2023년 XNUMX월까지 Hugging Face에서 별도로 사용할 수 있었지만 이후 "저작권 침해 신고로 인해 존재하지 않으며 더 이상 액세스할 수 없다"는 이유로 제거되었습니다.

저자는 사건이 집단 소송으로 진행되어 스스로 집단 대표가 되기를 원하며 배심원 재판과 저작권 위반 혐의에 대한 손해 배상을 요구하고 있습니다.

보낸 성명서 등록Nvidia 대변인은 "우리는 모든 콘텐츠 제작자의 권리를 존중하며 저작권법을 완벽하게 준수하여 NeMo를 만들었다고 믿습니다."라고 말했습니다.

AI 모델 훈련에 사용된 데이터와 관련해 AI 기업이 저작권 침해 혐의로 소송을 제기한 사례는 이번이 처음이 아니다. 지난해 12월 뉴욕타임스는 Microsoft 및 OpenAI에 대한 소송 쌍이 ChatGPT 및 유사한 모델을 구축하기 위해 허가 없이 기사를 사용했다는 주장에 대해.

이 사례는 아마도 1월 OpenAI의 주장으로 인해 더욱 흥미로워졌을 것입니다. 최고 수준의 신경망 구축은 "불가능" 사람들의 저작물을 사용하지 않고 오늘날의 요구를 충족시키는 것입니다.

한편, Nvidia는 개발자가 이 분야에서 기술적 신뢰성을 확립할 수 있도록 돕기 위해 생성 AI에 대한 새로운 전문 인증을 발표하면서 AI 펌프를 준비하고 있습니다.

이번 달 말 산타클라라에 본사를 둔 거대 기업의 GTC 이벤트와 동시에 제공될 예정인 전문 인증 프로그램 대규모 언어 모델의 숙련도와 다중 모드 워크플로 기술에 중점을 두고 두 가지 준회원 수준 생성 AI 인증을 제공합니다. ®

타임 스탬프 :

더보기 등록