คำถามเป็ดยักษ์ใหญ่ด้านเทคโนโลยีเกี่ยวกับกฎลิขสิทธิ์ LLM

คำถามเป็ดยักษ์ใหญ่ด้านเทคโนโลยีเกี่ยวกับกฎลิขสิทธิ์ LLM

ยักษ์ใหญ่ด้านเทคโนโลยีหลบคำถามเกี่ยวกับกฎลิขสิทธิ์ LLM PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

ในรัฐสภาของสหราชอาณาจักรในสัปดาห์นี้ Microsoft และ Meta ตอบคำถามว่าผู้สร้างควรได้รับเงินหรือไม่ เมื่อใช้เนื้อหาที่มีลิขสิทธิ์ของตนในการฝึกโมเดลภาษาขนาดใหญ่

บริษัทยักษ์ใหญ่ด้านเทคโนโลยีซึ่งมีรายได้รวมกันเกินกว่า 200 พันล้านดอลลาร์กำลังเป็นอยู่ ย่าง โดยคณะกรรมการการสื่อสารและดิจิทัลของ House of Lords เมื่อคำถามเกี่ยวกับลิขสิทธิ์เข้ามาสนใจ

ในเดือนกันยายน สมาคมนักเขียน ซึ่งเป็นสมาคมการค้าสำหรับนักเขียนที่ได้รับการตีพิมพ์ และผู้แต่ง 17 คน ยื่นฟ้องแบบกลุ่ม ในสหรัฐอเมริกาเกี่ยวกับการใช้สื่อของ OpenAI เพื่อสร้างบริการที่ใช้ LLM

Sam Altman ซีอีโอของ OpenAI กล่าวว่าบริษัทจะรับผิดชอบค่าใช้จ่ายทางกฎหมายของลูกค้าสำหรับการฟ้องร้องเรื่องการละเมิดลิขสิทธิ์ แทนที่จะลบเนื้อหาออกจากชุดการฝึกอบรม

Microsoft มี การลงทุน OpenAI มูลค่า 13 พันล้านดอลลาร์ มีการขยายความร่วมมือกับนักพัฒนาแมชชีนเลิร์นนิง ขับเคลื่อนปริมาณงานบนแพลตฟอร์มคลาวด์ Azure และใช้โมเดลเพื่อรันผู้ช่วยอัตโนมัติ Copilot

เมื่อวานนี้ Owen Larter ผู้อำนวยการฝ่ายนโยบายสาธารณะของ Office of Responsible AI ของ Microsoft กล่าวกับ Lords ว่า "สิ่งสำคัญคือต้องเข้าใจว่าโมเดลภาษาขนาดใหญ่คืออะไร เป็นโมเดลขนาดใหญ่ที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลข้อความ โดยเรียนรู้การเชื่อมโยงระหว่างแนวคิดต่างๆ ไม่จำเป็นต้องดูดอะไรขึ้นมาจากข้างใต้”

เขากล่าวว่าควรมี “กรอบการทำงาน” เพื่อให้การปกป้องเนื้อหาที่มีลิขสิทธิ์ และ Microsoft จะรับผิดชอบต่อการละเมิดใด ๆ โดยระบบที่ใช้ LLM แต่เขายังกล่าวอีกว่า Microsoft รองรับล่าสุด รายงานม่านบังตา เข้าสู่กฎหมาย AI “เชิงนวัตกรรม” ในสหราชอาณาจักรซึ่งสนับสนุนข้อยกเว้นข้อความและข้อมูลในโมเดลการฝึกอบรม

แต่โดนัลด์ ไมเคิล ลอร์ดฟอสเตอร์แห่งบาธ กดดันลาร์เตอร์ว่าเขาจะยอมรับหรือไม่ว่าหากบริษัทใช้เนื้อหาที่มีลิขสิทธิ์เพื่อสร้าง LLM เพื่อหากำไร เจ้าของลิขสิทธิ์ควรได้รับการชดใช้

ผู้อำนวยการ Microsoft กล่าวว่า “เป็นเรื่องสำคัญมากที่จะต้องเข้าใจว่าคุณต้องฝึกโมเดลภาษาขนาดใหญ่เหล่านี้บนชุดข้อมูลขนาดใหญ่ หากคุณต้องการให้โมเดลทำงานได้อย่างมีประสิทธิผล หากคุณต้องการปล่อยให้โมเดลมีความปลอดภัย … นอกจากนี้ยังมีปัญหาการแข่งขันบางประการ [เพื่อให้แน่ใจว่า] ทุกคนสามารถฝึกฝนโมเดลขนาดใหญ่ได้ หากคุณไปไกลเกินไปในเส้นทางที่ยากเกินไปในการรับข้อมูลเพื่อฝึกโมเดล ทันใดนั้น ความสามารถในการทำเช่นนั้นจะคงไว้เพียงบริษัทขนาดใหญ่เท่านั้น”

การดำเนินคดีอยู่ในระหว่างการดำเนินการ เพื่อระบุวิธีชุดข้อมูลการฝึกอบรม หนังสือ1, Books2 และ Books3 ซึ่งละเมิดลิขสิทธิ์เนื้อหาที่มีลิขสิทธิ์อย่างมีประสิทธิภาพ ถูกนำมาใช้เพื่อช่วยสร้าง LLM ยอดนิยม

เมต้าอยู่ข้างหลัง. ลามะ 2 LLMซึ่งขยายขนาดพารามิเตอร์ได้สูงสุดถึง 70 พันล้านพารามิเตอร์ ยักษ์ใหญ่โซเชียลมีเดียได้ส่งเสริมโมเดลนี้เป็นโอเพ่นซอร์ส แม้ว่าผู้พิถีพิถันของ FOSS จะชี้ให้เห็นถึงคำเตือนบางประการในแนวทางของมัน

Rob Sherman รองประธานและรองหัวหน้าเจ้าหน้าที่ความเป็นส่วนตัวด้านนโยบายของ Meta กล่าวกับ Lords ว่าบริษัทจะปฏิบัติตามกฎหมาย

แต่เขาเสริมว่า “การรักษาการเข้าถึงข้อมูลบนอินเทอร์เน็ตและข้อมูลในวงกว้างรวมถึงการใช้นวัตกรรมเช่นนี้ถือเป็นสิ่งสำคัญมาก ฉันสนับสนุนให้ผู้ถือสิทธิ์สามารถจัดการวิธีการใช้ข้อมูลของตนได้

“ฉันค่อนข้างระมัดระวังเล็กน้อยเกี่ยวกับแนวคิดในการบังคับให้บริษัทต่างๆ ที่กำลังสร้าง AI ต้องทำข้อตกลงตามความต้องการกับผู้ถือสิทธิ์รายบุคคล หรือคำสั่งให้ชำระค่าเนื้อหาที่ไม่มีคุณค่าทางเศรษฐกิจสำหรับพวกเขา”

เมื่อสัปดาห์ที่แล้ว Dan Conway ซีอีโอของสมาคมผู้จัดพิมพ์แห่งสหราชอาณาจักรกล่าวกับคณะกรรมการว่าโมเดลภาษาขนาดใหญ่กำลังละเมิดเนื้อหาที่มีลิขสิทธิ์ใน "ขนาดมหึมาอย่างแน่นอน"

“เรารู้สิ่งนี้ในอุตสาหกรรมการพิมพ์เนื่องจากฐานข้อมูล Books3 ซึ่งแสดงรายการหนังสือละเมิดลิขสิทธิ์ 120,000 เล่ม ซึ่งเรารู้ว่ามีโมเดลภาษาขนาดใหญ่นำเข้ามา” เขากล่าว “เรารู้ว่าเนื้อหากำลังถูกนำเข้าในปริมาณมหาศาลโดยโมเดลภาษาขนาดใหญ่ LLM ละเมิดลิขสิทธิ์ในหลายส่วนของกระบวนการในแง่ของเวลาที่พวกเขารวบรวมข้อมูลนี้ วิธีที่พวกเขาจัดเก็บข้อมูลนี้ และวิธีการที่พวกเขาจัดการกับมัน กฎหมายลิขสิทธิ์กำลังถูกทำลายครั้งใหญ่”

ในการพิจารณาคดีครั้งเดียวกัน ดร. เฮย์ลีห์ โบเชอร์ ผู้อ่านกฎหมายทรัพย์สินทางปัญญาที่มหาวิทยาลัยบรูเนล ลอนดอน กล่าวว่าเธอไม่ได้เป็นตัวแทนของบริษัทเทคโนโลยีหรือผู้สร้างเนื้อหา และเสนอทัศนคติที่เป็นกลาง

“หลักการที่ว่าเมื่อใดที่คุณต้องการใบอนุญาตและเมื่อคุณไม่ชัดเจน” เธอกล่าว “และการทำซ้ำงานที่ได้รับการคุ้มครองลิขสิทธิ์โดยไม่ได้รับอนุญาตนั้นจะต้องได้รับใบอนุญาตหรืออาจเป็นการละเมิด นั่นคือสิ่งที่ AI ทำในขั้นตอนต่างๆ ของกระบวนการ: การนำเข้า การรันโปรแกรม และแม้กระทั่งเอาต์พุต

“นักพัฒนา AI และเทคโนโลยีบางคนโต้แย้งการตีความกฎหมายที่แตกต่างออกไป ฉันไม่ได้เป็นตัวแทนของฝ่ายใดฝ่ายหนึ่ง ฉันเป็นผู้เชี่ยวชาญด้านลิขสิทธิ์ และจากตำแหน่งของฉัน การทำความเข้าใจว่าลิขสิทธิ์ควรบรรลุอะไรและบรรลุได้อย่างไร คุณจะต้องมีใบอนุญาตสำหรับกิจกรรมนั้น” ®

ประทับเวลา:

เพิ่มเติมจาก ลงทะเบียน