Authors Guild ฟ้อง OpenAI ฐานใช้หนังสือเพื่อฝึก ChatGPT

Authors Guild ฟ้อง OpenAI ฐานใช้หนังสือเพื่อฝึก ChatGPT

Authors Guild ฟ้อง OpenAI ฐานใช้หนังสือเพื่อฝึกอบรม ChatGPT PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

Authors Guild สมาคมการค้าสำหรับนักเขียนที่ได้รับการตีพิมพ์ และผู้เขียน 17 คนได้ปลดปล่อยมังกรบน OpenAI จากการถูกกล่าวหาว่าใช้งานของพวกเขาเพื่อฝึกแชทบอท

โจทก์ที่มีชื่ออยู่ในคดีฟ้องร้องกลุ่มการละเมิดลิขสิทธิ์ ซึ่งยื่นฟ้องในเขตทางใต้ของนิวยอร์กเพื่อขอลิขสิทธิ์ ได้แก่ David Baldacci, Mary Bly, Michael Connelly, Sylvia Day, Jonathan Franzen, John Grisham, Elin Hilderbrand, Christina Baker Kline, Maya Shanbhag Lang , วิคเตอร์ ลาวัลเล่, จอร์จ อาร์อาร์ มาร์ติน, โจดี้ พิคูลต์, ดักลาส เพรสตัน, ร็อกซาน่า โรบินสัน, จอร์จ ซอนเดอร์ส, สก็อตต์ ทูโรว์ และราเชล เวล

พื้นที่ การร้องเรียน [PDF] ให้เหตุผลว่าบริการของ OpenAI “เป็นอันตรายต่อความสามารถของนักเขียนนิยายในการหาเลี้ยงชีพ โดยที่โมเดลภาษาขนาดใหญ่อนุญาตให้ใครก็ตามสร้างข้อความโดยอัตโนมัติและอิสระ (หรือถูกมาก) ซึ่งพวกเขาจะจ่ายเงินให้นักเขียนเพื่อสร้าง”

นักเขียนไม่พอใจที่ไม่เพียงแต่ฝึกโมเดล OpenAI ในการทำงานโดยไม่ได้รับอนุญาตเท่านั้น แต่ยังรวมถึงระบบ AI คัดลอกงานเขียนของพวกเขาอย่างไม่ยุติธรรมเมื่อตอบสนองต่อคำขอของผู้คน หรือถูกกล่าวหาว่าเป็นเช่นนั้น

การร้องเรียนชี้ให้เห็นว่า ChatGPT ได้รับแจ้งให้สร้าง “โครงร่างโดยละเอียดสำหรับหนังสือพรีเควลเพื่อ เกมบัลลังก์ … ใช้ตัวละครเดียวกันจากหนังสือที่มีอยู่ของ Martin ในซีรีส์นี้ เพลงของไฟและน้ำแข็ง” ผลลัพธ์ที่คล้ายคลึงกันนี้เป็นไปได้สำหรับผู้เขียนคนอื่น ๆ ที่เข้าร่วมคดีนี้

ความสามารถของ ChatGPT เป็นปัญหา เนื่องจากผู้เขียนกล่าวว่าพวกเขาไม่ได้อนุญาตให้ OpenAI เข้าถึงผลงานของพวกเขาตามที่ดูเหมือนว่าจะทำเช่นนั้น ผู้เขียนเชื่อว่าเมื่อห้องปฏิบัติการ AI ป้อนงานของตนลงในแบบจำลองในระหว่างการฝึกอบรม นี่ถือเป็นการคัดลอกโดยไม่ได้รับอนุญาต และแบบจำลอง GPT ทำให้เกิดผลงานลอกเลียนแบบที่ผิดกฎหมายจากงานที่มีลิขสิทธิ์

“หัวใจของอัลกอริธึมเหล่านี้คือการโจรกรรมอย่างเป็นระบบในวงกว้าง” เอกสารคดีกล่าวอ้าง

การร้องเรียนระบุว่า OpenAI ยอมรับว่าใช้ชุดข้อมูลชื่อ "Books1" และ "Books2" เพื่อฝึกโมเดลภาษาขนาดใหญ่ แต่ไม่ได้เปิดเผยเนื้อหา โจทก์สงสัยว่าหนังสือละเมิดลิขสิทธิ์ได้เข้าสู่ข้อมูลการฝึกอบรม OpenAI

“การเติบโตในด้านประสิทธิภาพและความซับซ้อนจาก GPT-3 ไปจนถึง GPT-4 แสดงให้เห็นการเติบโตที่สัมพันธ์กันในขนาดของชุดข้อมูล 'การฝึกอบรม' ซึ่งทำให้เกิดข้อสรุปว่าต้องใช้ eBook ละเมิดลิขสิทธิ์ขนาดใหญ่อย่างน้อยหนึ่งแหล่งที่กล่าวถึงข้างต้นเพื่อ ' ฝึกฝน 'GPT-4” คำร้องเรียนระบุ พร้อมเสริมว่า “ไม่มีทางอื่นที่ OpenAI จะได้รับหนังสือจำนวนมากที่จำเป็นในการ 'ฝึกฝน' LLM ที่ทรงพลังเช่น GPT-4”

จริงๆ แล้ว การร้องเรียนกล่าวถึงอีกวิธีหนึ่ง นั่นคือการชำระค่าเนื้อหาที่ใช้ในการฝึกอบรม ChatGPT แต่คำฟ้องดังกล่าวอ้างว่า OpenAI ไม่เคยคิดที่จะทำเช่นนั้น และอ้างถึงคำให้การของ CEO Sam Altman ต่อสภาคองเกรสว่าเขาเชื่อในลิขสิทธิ์และได้จ่ายค่าข้อมูลการฝึกอบรมบางส่วนแล้ว

“สำหรับนักเขียนนิยาย การใช้งาน OpenAI โดยไม่ได้รับอนุญาตถือเป็นการขโมยข้อมูลประจำตัวในวงกว้าง” Mary Rasenberger ซีอีโอของ Authors Guild กล่าว

“ผู้เขียนนิยายสร้างโลกใหม่จากจินตนาการของพวกเขา พวกเขาสร้างสถานที่ ผู้คน และเหตุการณ์ต่างๆ ในเรื่องราวของพวกเขา” เธอกล่าวเสริมก่อนคร่ำครวญว่า “ผู้คนต่างเผยแพร่เนื้อหาที่สร้างโดย GPT เวอร์ชันที่เลียนแบบหรือใช้ผู้เขียนต้นฉบับอยู่แล้ว ' ตัวละครและเรื่องราว บริษัทต่างๆ กำลังขายคำแนะนำที่ช่วยให้คุณสามารถ 'เข้าสู่โลก' ของหนังสือของผู้แต่งได้ สิ่งเหล่านี้เป็นการละเมิดสิทธิ์ในทรัพย์สินทางปัญญาของผู้สร้างต้นฉบับอย่างชัดเจน”

โจทก์ต้องการ “ค่าเสียหายสำหรับการสูญเสียโอกาสในการออกใบอนุญาตผลงานของตน และการแย่งชิงตลาด จำเลย [OpenAI] ได้เปิดใช้งานโดยการทำให้โจทก์ไม่เต็มใจเป็นผู้สมรู้ร่วมคิดในการทดแทนตนเอง และคำสั่งห้ามถาวรเพื่อป้องกันอันตรายเหล่านี้ไม่ให้เกิดขึ้นอีก”

ลงทะเบียน ได้ขอความคิดเห็นจาก OpenAI และจะอัปเดตเรื่องราวนี้หากเราได้รับการตอบกลับที่สำคัญ ®

ประทับเวลา:

เพิ่มเติมจาก ลงทะเบียน