Người đoạt giải Pulitzer và những người khác kiện OpenAI

Người đoạt giải Pulitzer và những người khác kiện OpenAI

Tiểu thuyết gia người Mỹ đoạt giải Pulitzer Michael Chabon và một số nhà văn khác đã đệ đơn kiện tập thể cáo buộc OpenAI vi phạm bản quyền vì bị cáo buộc đưa tác phẩm của họ vào bộ dữ liệu được sử dụng để đào tạo các mô hình đằng sau ChatGPT.

Vụ kiện tuyên bố rằng OpenAI “tạo một mạng lưới rộng khắp internet” để nắm bắt bộ nội dung toàn diện nhất hiện có nhằm đào tạo tốt hơn các mô hình GPT của nó, được cho là “nhất thiết” dẫn dắt nó “nắm bắt, tải xuống và sao chép các tác phẩm viết, vở kịch và bài viết."

Một trong những phần thú vị hơn của vụ kiện là cáo buộc về cách các tác giả tin rằng doanh nghiệp AI đã chạm tay vào “hai tập đoàn sách dựa trên internet”, trong đó lưu ý rằng OpenAI chỉ gọi đơn giản là “Books1” và “Books2”. Hồ sơ cáo buộc rằng trong bài báo tháng 2020 năm 3 giới thiệu GPT-16, “Mô hình ngôn ngữ là những người học ít cơ hội”, OpenAI đã tiết lộ rằng ngoài các tập dữ liệu trang web “Thu thập thông tin chung” và “Văn bản web”, “3% tập dữ liệu đào tạo GPT1 đến từ… 'Books2' và 'BooksXNUMX'.”

Vụ kiện của người viết tiếp tục cáo buộc rằng chỉ có một vài nơi trên internet công cộng chứa nhiều tài liệu này, đồng thời tuyên bố rằng tập dữ liệu Books1 của OpenAI “dựa trên Dự án tiêu chuẩn Gutenberg Corpus hoặc chính Dự án Gutenberg” và cáo buộc AI biz về tìm nguồn cung ứng Books2 từ:

các trang web “thư viện bóng tối” khét tiếng, như Library Genesis (“LibGen”), Z-Library, Sci-Hub và Bibliotik, nơi lưu trữ các bộ sưu tập khổng lồ gồm sách lậu, tài liệu nghiên cứu và các tài liệu dựa trên văn bản khác. Các tài liệu được tổng hợp bởi các trang web này cũng được cung cấp với số lượng lớn thông qua hệ thống torrent.

Ngoài ra trong bộ đồ còn có người đoạt giải Tony và Grammy David Henry Hwang, nhà viết kịch và biên kịch đằng sau. M. bướm, tiếng Trung, Mặt vàngKhiêu vũ và Đường sắt; Người chiến thắng Peabody và Tình yêu và những cuộc theo đuổi bất khả thi khác tác giả Ayelet Waldman; Những người phụ nữ chúng tôi đã chôn cất tác giả Rachel Louise Snyder; Và Ai là người giàu? người ghi chép Matthew Klam.

Những người viết cáo buộc rằng bởi vì “khi ChatGPT được nhắc, nó không chỉ tạo ra các bản tóm tắt mà còn tạo ra các phân tích chuyên sâu về các chủ đề có trong các tác phẩm có bản quyền của Nguyên đơn”, nên người viết tin rằng “mô hình GPT cơ bản đã được đào tạo bằng cách sử dụng các tác phẩm của nguyên đơn”. .”

Luật sư của tác giả cũng khẳng định rằng khi được yêu cầu viết một đoạn văn theo phong cách Những cuộc phiêu lưu kỳ thú của Kavalier & Clay, cuốn sách đã đưa tiểu thuyết gia người Mỹ Chabon đoạt giải Pulitzer, ChatGPT đã tạo ra một đoạn văn bắt chước phong cách viết của ông và bao gồm các đề cập đến các nhân vật đối mặt với “sức nặng của thế giới trong chiến tranh”.

Ảnh chụp màn hình từ đơn khiếu nại, triển lãm A

Ảnh chụp màn hình từ đơn khiếu nại, tang vật A (bấm vào để phóng to)

Sản phẩm phù hợp với [PDF] đã được nộp lên tòa án liên bang California vào cuối tuần trước và ngày hôm qua đã được giao cho Thẩm phán Sơ thẩm San Francisco Peter H. Kang.

OpenAI đang phải đối mặt với nhiều vụ kiện xung quanh bản quyền – bao gồm cả hai vụ kiện ở San Francisco do tiểu thuyết gia Paul Tremblay và Mona Awad đệ trình, cũng như diễn viên hài Sarah Silverman và tiểu thuyết gia Christopher Golden và Richard Kadrey. Các luật sư của họ lập luận trong những trường hợp đó rằng AI biz không vi phạm luật bản quyền, đồng thời khẳng định LLM của ChatGPT được bảo vệ theo học thuyết “sử dụng hợp pháp” của Hoa Kỳ. Lập luận của họ là cách doanh nghiệp sử dụng văn bản phù hợp với tiêu chuẩn Hoa Kỳ luật bản Quyên, cho phép ngoại lệ sử dụng hợp lý đối với cái gọi là "cách sử dụng mang tính biến đổi" tác phẩm - bản phối lại của bản gốc phục vụ mục đích hoặc đối tượng khán giả khác.

Văn phòng Bản quyền Hoa Kỳ đang hiện tại tìm kiếm bình luận về nghiên cứu về luật bản quyền và các vấn đề chính sách do hệ thống trí tuệ nhân tạo đưa ra.

Cơ quan bảo vệ OpenAI vẫn chưa đưa ra phản hồi đối với khiếu nại của Chabon. Chúng tôi đã yêu cầu OpenAI đưa ra bình luận.

Các cáo buộc trong vụ việc bao gồm vi phạm bản quyền trực tiếp và gián tiếp, xóa bỏ trái phép thông tin quản lý bản quyền, cạnh tranh không lành mạnh và làm giàu bất chính. Họ đang tìm kiếm một lệnh cấm đối với hành vi vi phạm bản quyền của họ cũng như những thiệt hại không xác định.

Ông chủ OpenAI, Sam Altman tuần trước đã ghi điểm đầu tiên cho Indonesia thị thực vàng – nghĩa là giờ đây anh ấy có thể sống ở quốc gia quần đảo này tới 10 năm – để ghi nhận tiềm năng “tạo ra đầu tư trong nước” của anh ấy. ®

Dấu thời gian:

Thêm từ Đăng ký