Nvidia는 저작자의 허가 없이 AI 모델을 훈련시키기 위해 저작권이 있는 저작물을 사용했다는 주장에 직면한 최신 기술 대기업입니다.
제안된 집단 소송 소송 8월 XNUMX일 금요일 샌프란시스코에서 GPU 슈프리모에 대해 제기된 [PDF]는 회사가 Megatron 라이브러리에서 대규모 언어 모델을 교육하기 위해 저작권이 있는 자료를 사용했다고 주장합니다. NeMo 생성 AI 프레임워크.
불만 사항은 Abdi Nazemian, Brian Keene, Stewart O'Nan 등 세 명의 저자가 제기했으며, 이들은 자신이 쓴 책이 Megatron LLM을 교육하는 데 사용된 자료 중 하나라고 주장했습니다.
법원 서류에 따르면 엔비디아는 저자의 저작물 자체를 명백히 복사한 것이 아니라, 라이선스가 부여되지 않은 다수의 저작물을 포함하는 것으로 알려진 메가트론 모델을 훈련하기 위해 데이터세트를 사용했다는 혐의로 기소된 것으로 보입니다.
소송은 특히 Nvidia가 2022년 1.3월에 출시한 모델, 즉 NeMo Megatron-GPT 5B, NeMo Megatron-GPT 20B, NeMo Megatron-GPT 5B 및 NeMo Megatron-T3 XNUMXB를 대상으로 합니다.
AI 복장이 운영하는 웹사이트에서 호스팅됩니다. 포옹하는 얼굴, 훈련 데이터 세트를 포함한 각 모델에 대한 정보와 함께. 이 경우 정보에는 모델이 EleutherAI가 준비한 "The Pile" 데이터 세트에 대해 훈련되었다고 명시되어 있습니다.
Pile은 "언어 모델링을 위한 다양한 텍스트의 800GB 데이터 세트"로 설명되며, 그 구성 부분 중 하나는 Books3이라는 책 모음으로, 여기에는 세 명의 저자가 만든 책을 포함하여 약 196,640권의 책 내용이 포함되어 있습니다.
법원 서류에 따르면 Books3 데이터세트는 2023년 XNUMX월까지 Hugging Face에서 별도로 사용할 수 있었지만 이후 "저작권 침해 신고로 인해 존재하지 않으며 더 이상 액세스할 수 없다"는 이유로 제거되었습니다.
저자는 사건이 집단 소송으로 진행되어 스스로 집단 대표가 되기를 원하며 배심원 재판과 저작권 위반 혐의에 대한 손해 배상을 요구하고 있습니다.
보낸 성명서 등록Nvidia 대변인은 "우리는 모든 콘텐츠 제작자의 권리를 존중하며 저작권법을 완벽하게 준수하여 NeMo를 만들었다고 믿습니다."라고 말했습니다.
AI 모델 훈련에 사용된 데이터와 관련해 AI 기업이 저작권 침해 혐의로 소송을 제기한 사례는 이번이 처음이 아니다. 지난해 12월 뉴욕타임스는 Microsoft 및 OpenAI에 대한 소송 쌍이 ChatGPT 및 유사한 모델을 구축하기 위해 허가 없이 기사를 사용했다는 주장에 대해.
이 사례는 아마도 1월 OpenAI의 주장으로 인해 더욱 흥미로워졌을 것입니다. 최고 수준의 신경망 구축은 "불가능" 사람들의 저작물을 사용하지 않고 오늘날의 요구를 충족시키는 것입니다.
한편, Nvidia는 개발자가 이 분야에서 기술적 신뢰성을 확립할 수 있도록 돕기 위해 생성 AI에 대한 새로운 전문 인증을 발표하면서 AI 펌프를 준비하고 있습니다.
이번 달 말 산타클라라에 본사를 둔 거대 기업의 GTC 이벤트와 동시에 제공될 예정인 전문 인증 프로그램 대규모 언어 모델의 숙련도와 다중 모드 워크플로 기술에 중점을 두고 두 가지 준회원 수준 생성 AI 인증을 제공합니다. ®
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
- PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
- PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
- 출처: https://go.theregister.com/feed/www.theregister.com/2024/03/11/authors_file_lawsuit_to_torpedo/
- :이다
- :아니
- 1
- 2022
- 2023
- 7
- 8
- a
- 소개
- 얻기 쉬운
- 비난
- 고발 당한
- 동작
- 반대
- AI
- AI 모델
- All
- 주장
- 주장 된
- 따라
- 중
- an
- 및
- 강의자료
- 등장하다
- 있군요
- 지역
- 기사
- AS
- 질문
- 작성자
- 가능
- BE
- 때문에
- 가
- 존재
- 믿으세요
- 도서
- 브라이언
- 빌드
- 비자 면제 프로그램에 해당하는 국가의 시민권을 가지고 있지만
- by
- 라는
- 케이스
- 인증
- ChatGPT
- 청구
- 주장
- 수업
- 집단 소송
- CO
- 수집
- 회사
- 불평
- compliance
- 성분
- 포함하는
- 이 포함되어 있습니다
- 함유량
- 콘텐츠 제작자
- 내용
- 사자
- 저작권
- 저작권 침해
- 저작권
- 법정
- 법원 제출
- 만든
- 크리에이터
- 신뢰성
- 데이터
- XNUMX월
- 없어져 버린
- 기술 된
- 개발자
- 몇몇의
- 두
- 마다
- 세우다
- 이벤트
- 페이스메이크업
- 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에
- 제출
- 철하기
- 먼저,
- 초점
- 럭셔리
- 시스코
- 금요일
- 가득 찬
- 생성적인
- 제너레이티브 AI
- 거대한
- GPU
- 했다
- 도움
- 호스팅
- HTTPS
- 불가능한
- in
- 포함
- 정보
- 위반
- 를 받아야 하는 미국 여행자
- 흥미있는
- Isn
- IT
- 그
- 그 자체
- 일월
- JPG
- 알려진
- 언어
- 넓은
- 성
- 작년
- 후에
- 최근
- 시작
- 법
- 소송
- 도서관
- 이상
- 만든
- Mar
- 자료
- 소개
- Microsoft
- 모델
- 모델링
- 모델
- 달
- 배우기
- 즉
- 요구
- 신경의
- 신제품
- 뉴욕
- 뉴욕 타임스
- 아니
- 번호
- 엔비디아
- 획득
- 십월
- of
- 제공
- on
- ONE
- OpenAI
- 운영
- 위에
- 쌍
- 부품
- 사람들
- 혹시
- 허가
- 플라톤
- 플라톤 데이터 인텔리전스
- 플라토데이터
- 준비
- 진행
- 링크를
- 제안 된
- 펌프
- 의미
- 에 관한
- 출시
- 제거됨
- 보고
- 대표
- 점
- 권리
- s
- 말했다
- 산
- 샌프란시스코
- 산타
- 전송
- XNUMX월
- 피복재
- 비슷한
- 기술
- 구체적으로
- 대변인
- 성명서
- 미국
- 스튜어트
- 아직도
- 소송을 제기
- 기술
- 기술 거인
- 테크니컬
- 본문
- 그
- XNUMXD덴탈의
- 정보
- 뉴욕 타임즈
- 그들의
- 그들 자신
- 그들
- 이
- 그
- 세
- 시대
- 에
- 오늘
- Train
- 훈련 된
- 트레이닝
- 시도
- 두
- 까지
- 익숙한
- 사용
- 위반
- 필요
- 였다
- we
- 웹 사이트
- 했다
- 언제
- 어느
- 누구
- 의지
- 과
- 없이
- 작업
- 워크플로우
- 일
- 겠지
- 쓴
- year
- 요크
- 제퍼 넷