ผู้ชนะรางวัลพูลิตเซอร์และคนอื่นๆ ฟ้อง OpenAI

ผู้ชนะรางวัลพูลิตเซอร์และคนอื่นๆ ฟ้อง OpenAI

Michael Chabon นักเขียนนวนิยายชาวอเมริกันเจ้าของรางวัลพูลิตเซอร์และนักเขียนอีกหลายคนได้ยื่นฟ้องในชั้นเรียนโดยกล่าวหาว่า OpenAI ละเมิดลิขสิทธิ์ เนื่องจากถูกกล่าวหาว่าดึงงานของพวกเขาเข้าสู่ชุดข้อมูลที่ใช้ในการฝึกโมเดลที่อยู่เบื้องหลัง ChatGPT

คำร้องดังกล่าวอ้างว่า OpenAI “กระจายเครือข่ายอินเทอร์เน็ต” เพื่อจับภาพชุดเนื้อหาที่ครอบคลุมที่สุดที่มีอยู่เพื่อฝึกฝนโมเดล GPT ให้ดีขึ้น โดยถูกกล่าวหาว่า “จำเป็น” นำไปสู่การ “จับภาพ ดาวน์โหลด และคัดลอกงานเขียน บทละคร และลิขสิทธิ์ที่มีลิขสิทธิ์ บทความ”

ส่วนที่น่าสนใจอีกประการหนึ่งของคดีนี้คือข้อกล่าวหาว่าผู้เขียนเชื่อว่าธุรกิจ AI จับมือกับ "องค์กรหนังสือทางอินเทอร์เน็ตสองแห่ง" ซึ่งตั้งข้อสังเกตว่า OpenAI เรียกง่ายๆ ว่า "Books1" และ "Books2" การยื่นฟ้องกล่าวหาว่าในรายงานเดือนกรกฎาคม 2020 ที่แนะนำ GPT-3 “โมเดลภาษาเป็นผู้เรียนเพียงไม่กี่คน” OpenAI เปิดเผยว่านอกเหนือจากชุดข้อมูลหน้าเว็บ “การรวบรวมข้อมูลทั่วไป” และ “WebText” แล้ว “16 เปอร์เซ็นต์ของชุดข้อมูลการฝึกอบรม GPT3 มาจาก… 'Books1' และ 'Books2'”

คดีความของนักเขียนยังกล่าวหาว่ามีเพียงไม่กี่ที่บนอินเทอร์เน็ตสาธารณะที่มีเนื้อหาจำนวนมากนี้ โดยอ้างว่าชุดข้อมูล Books1 ของ OpenAI “ขึ้นอยู่กับ Standardized Project Gutenberg Corpus หรือ Project Gutenberg เอง” และกล่าวหาว่าธุรกิจ AI ของ การจัดหา Books2 จาก:

เว็บไซต์ “ห้องสมุดเงา” ที่น่าอับอาย เช่น Library Genesis (“LibGen”), Z-Library, Sci-Hub และ Bibliotik ซึ่งรวบรวมคอลเลกชันหนังสือละเมิดลิขสิทธิ์ เอกสารวิจัย และเนื้อหาที่เป็นข้อความอื่นๆ จำนวนมาก เนื้อหาที่รวบรวมโดยเว็บไซต์เหล่านี้ยังมีให้บริการจำนวนมากผ่านระบบทอร์เรนต์

นอกจากนี้ ผู้ที่รวมอยู่ในคดีนี้คือ เดวิด เฮนรี ฮวาง เจ้าของรางวัลโทนี่และแกรมมี่ ซึ่งเป็นผู้เขียนบทละครและผู้เขียนบทที่อยู่เบื้องหลัง เอ็ม บัตเตอร์ฟลาย, ชิงลิช, หน้าเหลืองและ การเต้นรำและทางรถไฟ; ผู้ชนะพีบอดีและ ความรักและการแสวงหาสิ่งที่เป็นไปไม่ได้อื่นๆ ผู้เขียน อาเยเล็ต วัลด์แมน; ผู้หญิงที่เราฝังไว้ ผู้แต่ง ราเชล หลุยส์ สไนเดอร์; และ ใครรวย? นักเขียน แมทธิว คลัม

ผู้เขียนกล่าวหาว่าเนื่องจาก "เมื่อ ChatGPT ได้รับแจ้ง ไม่เพียงแต่สร้างบทสรุปเท่านั้น แต่ยังสร้างการวิเคราะห์เชิงลึกของประเด็นต่างๆ ที่มีอยู่ในงานที่มีลิขสิทธิ์ของโจทก์ด้วย" ผู้เขียนเชื่อว่า "แบบจำลอง GPT พื้นฐานได้รับการฝึกฝนโดยใช้ผลงานของโจทก์ [the] ”

ทนายความของนักเขียนยังอ้างว่าเมื่อถูกขอให้เขียนย่อหน้าในลักษณะของ การผจญภัยอันน่าทึ่งของ Kavalier & Clayซึ่งเป็นหนังสือที่ Chabon นักเขียนนวนิยายชาวสหรัฐฯ บรรจุพูลิตเซอร์ของเขา ChatGPT ได้สร้างข้อความที่เลียนแบบสไตล์การเขียนของเขา และรวมถึงการอ้างอิงถึงตัวละครที่เกี่ยวข้องกับ "น้ำหนักของโลกแห่งสงคราม"

ภาพหน้าจอจากการร้องเรียนนิทรรศการ A

ภาพหน้าจอจากการร้องเรียน นิทรรศการ A (คลิกเพื่อดูภาพขยาย)

พื้นที่ สูท [PDF] ถูกฟ้องในศาลรัฐบาลกลางของรัฐแคลิฟอร์เนียเมื่อปลายสัปดาห์ที่แล้ว และเมื่อวานได้รับมอบหมายให้เป็นผู้พิพากษาผู้พิพากษาซานฟรานซิสโก ปีเตอร์ เอช. คัง

OpenAI กำลังเผชิญกับการฟ้องร้องหลายคดีเกี่ยวกับลิขสิทธิ์ รวมถึงสองคดีในซานฟรานซิสโกที่ฟ้องโดยนักประพันธ์ Paul Tremblay และ Mona Awad และอีกคดีหนึ่งคือ Sarah Silverman นักแสดงตลกและนักประพันธ์ Christopher Golden และ Richard Kadrey ทนายความโต้แย้งในกรณีเหล่านั้นว่าธุรกิจ AI ไม่ได้ละเมิดกฎหมายลิขสิทธิ์ โดยอ้างว่า LLM ของ ChatGPT ได้รับการคุ้มครองภายใต้หลักคำสอนของสหรัฐอเมริกาเรื่อง "การใช้งานโดยชอบธรรม" ข้อโต้แย้งของพวกเขาคือวิธีที่ธุรกิจใช้ข้อความนั้นสอดคล้องกับสหรัฐอเมริกา กฎหมายลิขสิทธิ์ซึ่งอนุญาตให้มีข้อยกเว้นการใช้งานโดยชอบธรรมสำหรับสิ่งที่เรียกว่า "การใช้งานเชิงเปลี่ยนแปลง" ของงาน ซึ่งเป็นการรีมิกซ์ต้นฉบับที่มีจุดประสงค์หรือผู้ชมที่แตกต่างกัน

สำนักงานลิขสิทธิ์ของสหรัฐอเมริกาคือ ในปัจจุบัน แสวงหาความคิดเห็นในการศึกษากฎหมายลิขสิทธิ์และประเด็นนโยบายที่เกิดจากระบบปัญญาประดิษฐ์

กลาโหมสำหรับ OpenAI ยังไม่ได้ยื่นตอบสนองต่อข้อร้องเรียน Chabon เราได้ขอความคิดเห็นจาก OpenAI

ข้อกล่าวหาในคดีนี้ ได้แก่ การละเมิดลิขสิทธิ์ทั้งทางตรงและทางอ้อม การลบข้อมูลการจัดการลิขสิทธิ์อย่างผิดกฎหมาย การแข่งขันที่ไม่เป็นธรรม และการเพิ่มคุณค่าอย่างไม่ยุติธรรม พวกเขากำลังขอคำสั่งห้ามการละเมิดลิขสิทธิ์ของตนตลอดจนความเสียหายที่ไม่ได้ระบุรายละเอียด

Sam Altman หัวหน้า OpenAI ทำประตูแรกของอินโดนีเซียเมื่อสัปดาห์ที่แล้ว วีซ่าทอง – หมายความว่าขณะนี้เขาสามารถอาศัยอยู่ในประเทศหมู่เกาะได้นานถึง 10 ปี – โดยตระหนักถึงศักยภาพของเขาในการ “สร้างการลงทุนขาเข้า” ®

ประทับเวลา:

เพิ่มเติมจาก ลงทะเบียน