OpenAI: ไม่สามารถฝึก AI ระดับสูงและหลีกเลี่ยงลิขสิทธิ์ได้

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

OpenAI: ไม่สามารถฝึก AI ระดับสูงได้ และหลีกเลี่ยง PlatoBlockchain Data Intelligence อันเป็นลิขสิทธิ์ ค้นหาแนวตั้ง AI.

OpenAI กล่าวว่า "เป็นไปไม่ได้" ที่จะสร้างโครงข่ายประสาทเทียมระดับสูงที่ตอบสนองความต้องการในปัจจุบันโดยไม่ต้องใช้งานที่มีลิขสิทธิ์ของผู้คน ห้องแล็บที่ได้รับการสนับสนุนจาก Microsoft ซึ่งเชื่อว่ากำลังเก็บเกี่ยวเนื้อหาดังกล่าวอย่างถูกกฎหมายเพื่อการฝึกอบรมโมเดลของตน กล่าวว่าการใช้เนื้อหาที่เป็นสาธารณสมบัติที่ไม่มีลิขสิทธิ์จะส่งผลให้ซอฟต์แวร์ AI ด้อยคุณภาพ

การยืนยันนี้เกิดขึ้นในช่วงเวลาที่โลกแห่งการเรียนรู้ของเครื่องกำลังวิ่งไปที่กำแพงอิฐซึ่งเป็นกฎหมายลิขสิทธิ์เป็นอันดับแรก ในสัปดาห์นี้ รายงาน IEEE ได้สรุปว่า Midjourney และ DALL-E 3 ของ OpenAI ซึ่งเป็นบริการ AI หลักสองบริการในการเปลี่ยนข้อความแจ้งเป็นรูปภาพ สามารถสร้างฉากที่มีลิขสิทธิ์ขึ้นมาใหม่จากภาพยนตร์และวิดีโอเกมตามข้อมูลการฝึกอบรมของพวกเขา

พื้นที่ ศึกษาร่วมเขียนโดย Gary Marcus ผู้เชี่ยวชาญด้าน AI และนักวิจารณ์ และ Reid Southen นักวาดภาพประกอบดิจิทัล บันทึก "ผลลัพธ์จากการลอกเลียนแบบ" หลายอินสแตนซ์ ซึ่ง OpenAI และ DALL-E 3 เรนเดอร์ฉากในเวอร์ชันที่คล้ายกันอย่างมากจากภาพยนตร์ รูปภาพของคนดัง นักแสดงและเนื้อหาวิดีโอเกม

Marcus และ Southen กล่าวว่าเกือบจะแน่ใจว่า Midjourney และ OpenAI ได้ฝึกฝนโมเดลการสร้างภาพ AI ของตนในเนื้อหาที่มีลิขสิทธิ์

ไม่ว่าจะถูกกฎหมายหรือไม่ และผู้จำหน่าย AI หรือลูกค้าของพวกเขามีความเสี่ยงที่จะถูกรับผิดชอบหรือไม่ ยังคงเป็นคำถามที่ถกเถียงกันอยู่ อย่างไรก็ตาม การค้นพบของรายงานอาจสนับสนุนผู้ที่ฟ้องร้อง Midjourney และผู้ผลิต OpenAI ของ DALL-E ในข้อหาละเมิดลิขสิทธิ์

ผู้ใช้อาจไม่ทราบว่าเมื่อใดที่พวกเขาสร้างภาพไม่ว่าจะละเมิดหรือไม่

“ทั้ง OpenAI และ Midjourney มีความสามารถอย่างเต็มที่ในการผลิตเนื้อหาที่ดูเหมือนจะละเมิดลิขสิทธิ์และเครื่องหมายการค้า” พวกเขาเขียน “ระบบเหล่านี้จะไม่แจ้งให้ผู้ใช้ทราบเมื่อทำเช่นนั้น พวกเขาไม่ได้ให้ข้อมูลใดๆ เกี่ยวกับแหล่งที่มาของภาพที่พวกเขาสร้างขึ้น ผู้ใช้อาจไม่ทราบว่าเมื่อใดที่พวกเขาสร้างภาพว่าพวกเขาละเมิดหรือไม่”

ทั้งสองธุรกิจไม่ได้เปิดเผยข้อมูลการฝึกอบรมที่ใช้สร้างโมเดล AI ของตนอย่างครบถ้วน

มันไม่ใช่แค่ ศิลปินดิจิทัล บริษัท AI ที่ท้าทาย เดอะนิวยอร์กไทมส์ เมื่อเร็วๆ นี้ ฟ้อง OpenAI เนื่องจากโมเดลข้อความ ChatGPT จะแยกสำเนาบทความเพย์วอลล์ของหนังสือพิมพ์ออกมาใกล้เคียงคำต่อคำ ผู้เขียนหนังสือ ได้ยื่นคำร้องที่คล้ายกันดังที่ได้มี พัฒนาซอฟต์แวร์.

ก่อน การวิจัย ได้ระบุว่า ChatGPT ของ OpenAI สามารถเกลี้ยกล่อมให้สร้างข้อความการฝึกอบรมได้ และผู้ที่ฟ้องร้อง Microsoft และ GitHub โต้แย้งว่าโมเดลผู้ช่วยเขียนโค้ด Copilot จะสร้างโค้ดซ้ำไม่มากก็น้อยตามคำต่อคำ

Southen ตั้งข้อสังเกตว่า Midjourney กำลังเรียกเก็บเงินจากลูกค้าที่สร้างเนื้อหาที่ละเมิดและได้รับผลกำไรจากรายได้จากการสมัครสมาชิก “ผู้ใช้ MJ [Midjourney] ไม่จำเป็นต้องขายภาพเนื่องจากการละเมิดลิขสิทธิ์ที่อาจเกิดขึ้น MJ ได้กำไรจากการสร้างสรรค์แล้ว” เขา ความเห็นสะท้อนข้อโต้แย้งที่เกิดขึ้นในรายงาน IEEE

OpenAI ยังเรียกเก็บค่าธรรมเนียมการสมัครสมาชิกและผลกำไรในลักษณะเดียวกัน ทั้ง OpenAI และ Midjourney ไม่ตอบสนองต่อคำร้องขอความคิดเห็น

อย่างไรก็ตาม OpenAI ในวันจันทร์เผยแพร่ไฟล์ โพสต์บล็อก กล่าวถึงคดีความของ New York Times ซึ่งผู้ขาย AI กล่าวว่าไม่มีคุณธรรม น่าประหลาดใจที่ห้องแล็บกล่าวว่าหากโครงข่ายประสาทเทียมของตนสร้างเนื้อหาที่ละเมิด มันจะเป็น “ข้อบกพร่อง”

โดยรวมแล้ว ผู้ที่พุ่งพรวดในวันนี้โต้แย้งว่า: ร่วมมือกับองค์กรข่าวอย่างแข็งขัน การฝึกอบรมเกี่ยวกับข้อมูลที่มีลิขสิทธิ์มีคุณสมบัติในการป้องกันการใช้งานโดยชอบธรรมภายใต้กฎหมายลิขสิทธิ์ “การสำลัก” เป็นข้อผิดพลาดที่หาได้ยากซึ่งเรากำลังพยายามทำให้เป็นศูนย์”; และ New York Times ได้เลือกตัวอย่างการทำสำเนาข้อความที่ไม่ได้แสดงถึงพฤติกรรมทั่วไป

กฎหมายจะเป็นผู้ตัดสิน

Tyler Ochoa ศาสตราจารย์ภาควิชากฎหมายที่มหาวิทยาลัยซานตาคลาราในแคลิฟอร์เนียกล่าว ลงทะเบียน แม้ว่าการค้นพบของรายงาน IEEE มีแนวโน้มที่จะช่วยเหลือผู้ฟ้องร้องในการเรียกร้องลิขสิทธิ์ แต่ก็ไม่ควร เนื่องจากผู้เขียนบทความในความเห็นของเขา บิดเบือนความจริงว่าเกิดอะไรขึ้น

“พวกเขาเขียนว่า: 'โมเดลการสร้างภาพสามารถชักจูงให้ผลิตผลงานลอกเลียนแบบจากเนื้อหาที่มีลิขสิทธิ์ได้หรือไม่? … [W]e พบว่าคำตอบนั้นชัดเจนว่าใช่ แม้จะไม่ได้เรียกร้องผลลัพธ์จากการลอกเลียนแบบโดยตรงก็ตาม'”

Ochoa ตั้งคำถามถึงข้อสรุปนั้น โดยโต้แย้งตามคำแนะนำของผู้เขียนรายงาน “เข้ามาแสดงให้เห็นว่าแท้จริงแล้ว พวกเขาเรียกร้องผลงานลอกเลียนแบบโดยตรง ทุกข้อความแจ้งจะกล่าวถึงชื่อเรื่องของภาพยนตร์ใดเรื่องหนึ่ง ระบุอัตราส่วนภาพ และในกรณีทั้งหมดยกเว้นกรณีเดียว คำว่า 'ภาพยนตร์' และ 'ภาพหน้าจอ' หรือ 'ภาพหน้าจอ' (ข้อยกเว้นหนึ่งข้ออธิบายถึงรูปภาพที่ต้องการทำซ้ำ )”

ศาสตราจารย์ด้านกฎหมายกล่าวว่าปัญหาของกฎหมายลิขสิทธิ์กำลังกำหนดว่าใครเป็นผู้รับผิดชอบต่อผลงานลอกเลียนแบบเหล่านี้: ผู้สร้างโมเดล AI หรือผู้ที่ขอให้โมเดล AI สร้างฉากยอดนิยมขึ้นมาใหม่

“โมเดล AI เจนเนอเรชั่นสามารถสร้างเอาต์พุตต้นฉบับได้ และยังสามารถสร้างฉากที่คล้ายกับฉากจากอินพุตที่มีลิขสิทธิ์เมื่อได้รับแจ้ง” Ochoa อธิบาย “สิ่งนี้ควรได้รับการวิเคราะห์ในกรณีของการละเมิดที่มีส่วนสนับสนุน: บุคคลที่แจ้งโมเดลนั้นถือเป็นผู้ละเมิดหลัก และผู้สร้างโมเดลจะต้องรับผิดเฉพาะในกรณีที่พวกเขาทราบถึงการละเมิดหลัก และพวกเขาไม่ได้ดำเนินการตามขั้นตอนที่สมเหตุสมผลเพื่อหยุด มัน."

Ochoa กล่าวว่าโมเดล AI ทั่วไปมีแนวโน้มที่จะสร้างภาพเฉพาะมากขึ้นเมื่อมีภาพเหล่านั้นหลายอินสแตนซ์ในชุดข้อมูลการฝึกอบรม

“ในกรณีนี้ ไม่น่าเป็นไปได้อย่างยิ่งที่ข้อมูลการฝึกอบรมจะรวมภาพยนตร์ทั้งเรื่อง มีความเป็นไปได้มากกว่ามากที่ข้อมูลการฝึกอบรมจะรวมภาพนิ่งจากภาพยนตร์ที่เผยแพร่เป็นภาพนิ่งประชาสัมพันธ์สำหรับภาพยนตร์” เขากล่าว “ภาพเหล่านั้นถูกทำซ้ำหลายครั้งในข้อมูลการฝึกอบรม เนื่องจากสื่อได้รับการสนับสนุนให้เผยแพร่ภาพเหล่านั้นเพื่อวัตถุประสงค์ในการประชาสัมพันธ์และทำเช่นนั้น

“โดยพื้นฐานแล้วจะไม่ยุติธรรมสำหรับเจ้าของลิขสิทธิ์ที่จะสนับสนุนการเผยแพร่ภาพนิ่งในวงกว้างเพื่อวัตถุประสงค์ในการประชาสัมพันธ์ แล้วบ่นว่าภาพเหล่านั้นถูกเลียนแบบโดย AI เนื่องจากข้อมูลการฝึกอบรมมีสำเนาของภาพเดียวกันเหล่านั้นหลายชุด”

Ochoa กล่าวว่ามีขั้นตอนในการจำกัดพฤติกรรมดังกล่าวจากโมเดล AI “คำถามคือพวกเขาควรจะทำเช่นนั้นหรือไม่ ในเมื่อบุคคลที่ป้อนข้อความแจ้งอย่างชัดเจนต้องการให้ AI สร้างภาพที่เป็นที่รู้จัก และสตูดิโอภาพยนตร์ที่ผลิตภาพนิ่งต้นฉบับต้องการให้ภาพนิ่งเหล่านั้นเผยแพร่ในวงกว้างอย่างชัดเจน ," เขาพูดว่า.

“คำถามที่ดีกว่าคือ: สิ่งนี้จะเกิดขึ้นบ่อยแค่ไหนเมื่อข้อความแจ้งไม่ได้กล่าวถึงภาพยนตร์ใดเรื่องหนึ่งหรืออธิบายตัวละครหรือฉากที่เฉพาะเจาะจง ฉันคิดว่านักวิจัยที่เป็นกลางคงจะพบว่าคำตอบนั้นแทบจะไม่มีเลย (บางทีแทบจะไม่เคยเลย)”

อย่างไรก็ตาม เนื้อหาที่มีลิขสิทธิ์ดูเหมือนจะเป็นส่วนสำคัญในการทำให้โมเดลเหล่านี้ทำงานได้ดี

OpenAI ปกป้องตัวเองต่อลอร์ด

ในการตอบสนองต่อ สอบถามรายละเอียดเพิ่มเติม OpenAI นำเสนอความเสี่ยงและโอกาสของโมเดล AI โดย House of Lords Communications and Digital Committee ของสหราชอาณาจักร ส่ง [PDF] เตือนว่าโมเดลจะไม่ทำงานหากไม่ได้รับการฝึกอบรมเกี่ยวกับเนื้อหาที่มีลิขสิทธิ์

“เนื่องจากลิขสิทธิ์ในปัจจุบันครอบคลุมการแสดงออกของมนุษย์แทบทุกประเภท รวมถึงโพสต์บนบล็อก รูปถ่าย โพสต์ในฟอรัม เศษโค้ดซอฟต์แวร์ และเอกสารของรัฐบาล จึงเป็นไปไม่ได้ที่จะฝึกอบรมโมเดล AI ชั้นนำในปัจจุบันโดยไม่ใช้สื่อที่มีลิขสิทธิ์” Super Lab กล่าว .

“การจำกัดข้อมูลการฝึกอบรมไว้เฉพาะหนังสือและภาพวาดที่เป็นสาธารณสมบัติที่สร้างขึ้นเมื่อกว่าศตวรรษก่อนอาจทำให้เกิดการทดลองที่น่าสนใจ แต่จะไม่จัดให้มีระบบ AI ที่ตอบสนองความต้องการของพลเมืองในปัจจุบัน”

ธุรกิจ AI กล่าวว่าเชื่อว่าเป็นไปตามกฎหมายลิขสิทธิ์และการฝึกอบรมเกี่ยวกับเนื้อหาที่มีลิขสิทธิ์นั้นถูกต้องตามกฎหมาย แม้ว่าจะอนุญาตให้ “ยังมีงานที่ต้องทำเพื่อสนับสนุนและเพิ่มขีดความสามารถให้กับผู้สร้าง”

ความรู้สึกดังกล่าว ซึ่งฟังดูเหมือนการรับรู้ทางการทูตถึงข้อกังวลด้านจริยธรรมเกี่ยวกับการชดเชยสำหรับการใช้งานที่มีลิขสิทธิ์โดยชอบธรรมที่สามารถโต้แย้งได้ ควรได้รับการพิจารณาร่วมกับคำกล่าวอ้างของรายงาน IEEE ที่ว่า "เราได้ค้นพบหลักฐานที่แสดงว่าวิศวกรซอฟต์แวร์อาวุโสของ Midjourney เข้ามามีส่วนร่วมใน บทสนทนา ในเดือนกุมภาพันธ์ 2022 เกี่ยวกับวิธีการหลบเลี่ยงกฎหมายลิขสิทธิ์โดยการ 'ฟอก' ข้อมูล 'ผ่าน codex ที่ได้รับการปรับแต่ง'”

Marcus ผู้ร่วมเขียนรายงาน IEEE แสดงความกังขาต่อความพยายามของ OpenAI ที่จะได้รับไฟเขียวด้านกฎระเบียบในสหราชอาณาจักรสำหรับการดำเนินธุรกิจในปัจจุบัน

“การแปลคร่าวๆ: เราจะไม่รวยมหาศาลถ้าคุณไม่ให้เราขโมย ดังนั้นโปรดอย่าก่ออาชญากรรม!” เขาเขียนในโซเชียลมีเดีย เสา. “อย่าให้เราจ่ายเงิน การออกใบอนุญาต ค่าธรรมเนียมด้วย! แน่นอนว่า Netflix อาจจ่ายค่าธรรมเนียมใบอนุญาตเป็นพันล้านต่อปี แต่ we ไม่ควรจะต้อง! เงินมากขึ้นสำหรับเราคร่ำครวญ!”

OpenAI ได้เสนอที่จะชดใช้ค่าเสียหายให้กับลูกค้า ChatGPT และ API ขององค์กร ต่อการเรียกร้องลิขสิทธิ์แม้ว่าจะไม่ใช่หากลูกค้าหรือผู้ใช้ปลายทางของลูกค้า “รู้หรือควรรู้ว่าเอาต์พุตนั้นถูกละเมิดหรือมีแนวโน้มที่จะละเมิด” หรือหากลูกค้าข้ามคุณสมบัติด้านความปลอดภัย ท่ามกลางข้อจำกัดอื่นๆ. ดังนั้น การขอให้ DALL-E 3 สร้างฉากภาพยนตร์ชื่อดังขึ้นมาใหม่ ซึ่งผู้ใช้ควรรู้ว่าอาจมีลิขสิทธิ์คุ้มครองอยู่ จะไม่เข้าข่ายได้รับการชดใช้ค่าเสียหาย

Midjourney ใช้แนวทางตรงกันข้าม โดยสัญญาว่าจะตามล่าและฟ้องร้องลูกค้าที่เกี่ยวข้องกับการละเมิดเพื่อชดใช้ค่าใช้จ่ายทางกฎหมายที่เกิดจากการเรียกร้องที่เกี่ยวข้อง

“หากคุณจงใจละเมิดทรัพย์สินทางปัญญาของผู้อื่น และนั่นทำให้เราต้องเสียเงิน เราจะตามหาคุณและเก็บเงินนั้นจากคุณ” Midjourney’s ใช้บริการมา สถานะ. “เราอาจทำอย่างอื่นด้วย เช่น พยายามขอให้ศาลเพื่อให้คุณชำระค่าธรรมเนียมทางกฎหมายของเรา อย่าทำอย่างนั้น” ®

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
ที่มา: https://go.theregister.com/feed/www.theregister.com/2024/01/08/midjourney_openai_copyright/

ประทับเวลา: January 8, 2024

ประทับเวลา: กรกฎาคม 6, 2023

เผยแพร่ซ้ำโดยเพลโต

สาเหตุทั่วไป 3 ประการที่ทำให้การวิเคราะห์และโครงการ AI ล้มเหลว

Intel ผลักดันชุดอ้างอิง AI เพื่อช่วยขายซิลิกอน

การเพิ่มขึ้นของเครื่องจักรช้ากว่าที่คาดไว้ World Economic Forum กล่าว

สำนักพิมพ์ทางวิชาการกำลังใช้ซอฟต์แวร์ AI เพื่อตรวจจับนักวิทยาศาสตร์ที่ไม่ดีในการดูแลข้อมูล

การแจ้งเตือนของผู้ดูแลระบบ: Copilot มาถึงบน Windows Server 2022

Alibaba Cloud ให้บริการ LLMs-as-a-service แบบกำหนดเอง

คอร์ SiFive RISC-V ที่เลือกสำหรับโหนดประมวลผล AI ของ Google

หัวหน้า Google Cloud รู้สึกตื่นเต้นกับเรื่อง AI นี้มาก

'หนังสือที่เขียนโดย AI' เกี่ยวกับไฟป่า Maui ขายดีใน Amazon

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้