AI ในปัจจุบันคือปัญญาประดิษฐ์ประดิษฐ์

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

AI ในปัจจุบันคือปัญญาประดิษฐ์ ปัญญาประดิษฐ์ PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

พนักงานที่ได้รับการว่าจ้างผ่านบริการคราวด์ซอร์สอย่าง Amazon Mechanical Turk กำลังใช้โมเดลภาษาขนาดใหญ่เพื่อทำงานให้เสร็จ ซึ่งอาจส่งผลเสียต่อโมเดล AI ในอนาคต

ข้อมูลมีความสำคัญต่อ AI นักพัฒนาต้องการชุดข้อมูลที่สะอาดและมีคุณภาพสูงเพื่อสร้างระบบแมชชีนเลิร์นนิงที่แม่นยำและเชื่อถือได้ อย่างไรก็ตาม การรวบรวมข้อมูลที่มีค่าและมีคุณภาพสูงสุดอาจเป็นเรื่องที่น่าเบื่อ บริษัทต่างๆ มักจะหันไปใช้แพลตฟอร์มของบุคคลที่สาม เช่น Amazon Mechanical Turk เพื่อสั่งให้กลุ่มคนทำงานราคาถูกทำงานซ้ำๆ เช่น ติดฉลากวัตถุ อธิบายสถานการณ์ ถอดความข้อความ และใส่คำอธิบายประกอบข้อความ

เอาต์พุตของพวกมันสามารถล้างข้อมูลและป้อนลงในโมเดลเพื่อฝึกให้จำลองการทำงานในสเกลอัตโนมัติที่ใหญ่ขึ้นมากได้

แบบจำลอง AI จึงถูกสร้างขึ้นบนหลังของแรงงานมนุษย์: ผู้คนที่ต้องทำงานหนัก ให้ตัวอย่างการฝึกอบรมจำนวนมากสำหรับระบบ AI ที่องค์กรสามารถใช้เพื่อสร้างรายได้หลายพันล้านดอลลาร์

แต่การทดลองที่ดำเนินการโดยนักวิจัยที่ École polytechnique fédérale de Lausanne (EPFL) ในสวิตเซอร์แลนด์ ได้ข้อสรุปว่าคนงานที่มาจากฝูงชนเหล่านี้กำลังใช้ระบบ AI เช่น แชทบอท ChatGPT ของ OpenAI เพื่อทำงานแปลกๆ ทางออนไลน์

ไม่แนะนำให้ฝึกโมเดลด้วยเอาต์พุตของตัวเอง เราอาจเห็นโมเดล AI ได้รับการฝึกอบรมเกี่ยวกับข้อมูลที่ไม่ได้สร้างโดยคน แต่โดยโมเดล AI อื่นๆ ซึ่งบางทีอาจเป็นโมเดลเดียวกันด้วยซ้ำ ซึ่งอาจนำไปสู่คุณภาพผลลัพธ์ที่เลวร้าย มีอคติมากขึ้น และผลกระทบที่ไม่พึงประสงค์อื่นๆ

การทดลอง

นักวิชาการได้คัดเลือกชาวเติร์กเชิงกลจำนวน 44 คนเพื่อสรุปบทคัดย่อของเอกสารการวิจัยทางการแพทย์ 16 ฉบับ และประเมินว่า 33 ถึง 46 เปอร์เซ็นต์ของข้อความที่คนงานส่งมานั้นสร้างขึ้นโดยใช้แบบจำลองภาษาขนาดใหญ่ พนักงานจำนวนมากมักได้รับค่าจ้างต่ำ การใช้ AI เพื่อสร้างการตอบสนองโดยอัตโนมัติช่วยให้พวกเขาทำงานได้เร็วขึ้นและรับงานมากขึ้นเพื่อเพิ่มค่าจ้าง

ทีมงานชาวสวิสได้ฝึกตัวแยกประเภทเพื่อทำนายว่าสิ่งที่ส่งมาจากชาวเติร์กนั้นเกิดจากฝีมือมนุษย์หรือ AI นักวิชาการยังได้บันทึกการกดแป้นพิมพ์ของคนงานเพื่อตรวจสอบว่าพนักงานเสิร์ฟคัดลอกและวางข้อความลงบนแพลตฟอร์มหรือพิมพ์ข้อความเอง มีโอกาสเสมอที่ใครบางคนใช้แชทบอทแล้วพิมพ์ผลลัพธ์ด้วยตนเอง – แต่นั่นไม่น่าเป็นไปได้ เราคิดว่า

“เราพัฒนาวิธีการเฉพาะเจาะจงซึ่งทำงานได้ดีมากในการตรวจจับข้อความสังเคราะห์ในสถานการณ์ของเรา” Manoel Ribeiro ผู้เขียนร่วมของ การศึกษา และนักศึกษาปริญญาเอกที่ EPFL กล่าว ลงทะเบียน ในสัปดาห์นี้

“ในขณะที่วิธีการแบบดั้งเดิมพยายามตรวจหาข้อความสังเคราะห์ 'ในบริบทใดๆ' แนวทางของเรามุ่งเน้นไปที่การตรวจหาข้อความสังเคราะห์ในสถานการณ์เฉพาะของเรา”

ลักษณนามไม่สมบูรณ์แบบในการระบุว่ามีคนใช้ระบบ AI หรือสร้างผลงานของตนเองหรือไม่ นักวิชาการรวมผลลัพธ์ของตัวแยกประเภทเข้ากับข้อมูลการกดแป้นพิมพ์เพื่อให้แน่ใจมากขึ้นเมื่อมีคนคัดลอกและวางจากบอทหรือสร้างเนื้อหาของตนเอง

ข้อมูลของมนุษย์คือมาตรฐานทองคำ เพราะมนุษย์คือมนุษย์ที่เราให้ความสำคัญ

“เราสามารถตรวจสอบผลลัพธ์ของเราได้โดยใช้ข้อมูลการกดแป้นพิมพ์ที่เรารวบรวมจาก MTurk” Ribeiro กล่าวกับเรา “ตัวอย่างเช่น เราพบว่าข้อความทั้งหมดที่ไม่ได้คัดลอกมาถูกจัดประเภทโดยเราว่าเป็น 'ของจริง' ซึ่งแสดงให้เห็นว่ามีผลบวกลวงเพียงเล็กน้อย”

รหัสและข้อมูลที่ใช้ในการรันการทดสอบ สามารถพบได้ที่นี่บน GitHub

มีอีกเหตุผลหนึ่งที่การทดลองนี้ไม่น่าจะเป็นตัวแทนที่ยุติธรรมอย่างสมบูรณ์ของจำนวนคนงานจริงๆ ที่ใช้ AI เพื่อทำให้งานคราวด์ซอร์สเป็นแบบอัตโนมัติ ผู้เขียนทราบว่างานการสรุปข้อความนั้นเหมาะสมกับโมเดลภาษาขนาดใหญ่เมื่อเทียบกับงานประเภทอื่นๆ ซึ่งหมายความว่าผลลัพธ์อาจคลาดเคลื่อนต่อผู้ปฏิบัติงานจำนวนมากขึ้นโดยใช้เครื่องมือเช่น ChatGPT

ชุดข้อมูล 46 คำตอบจากพนักงาน 44 คนยังมีขนาดเล็ก คนงานได้รับค่าจ้าง 1 ดอลลาร์สำหรับการสรุปข้อความแต่ละครั้ง ซึ่งอีกครั้งอาจสนับสนุนเฉพาะการใช้ AI เท่านั้น

โมเดลภาษาขนาดใหญ่จะแย่ลงหากได้รับการฝึกฝนมากขึ้นเกี่ยวกับเนื้อหาปลอมที่สร้างโดย AI ที่รวบรวมจากแพลตฟอร์มคราวด์ซอร์ส นักวิจัยแย้ง ชุดอย่าง OpenAI จะเก็บวิธีฝึกโมเดลล่าสุดไว้เป็นความลับ และอาจไม่ต้องพึ่งพาสิ่งต่างๆ เช่น Mechanical Turk มากนัก หากเป็นเช่นนั้น ที่กล่าวว่า โมเดลอื่นๆ จำนวนมากอาจต้องพึ่งพาแรงงานมนุษย์ ซึ่งอาจใช้บอทเพื่อสร้างข้อมูลการฝึกอบรม ซึ่งเป็นปัญหา

ประการแรก Mechanical Turk วางตลาดในฐานะผู้ให้บริการ "โซลูชันการติดฉลากข้อมูลเพื่อขับเคลื่อนโมเดลแมชชีนเลิร์นนิง"

“ข้อมูลของมนุษย์คือมาตรฐานทองคำ เพราะมนุษย์คือมนุษย์ที่เราใส่ใจ ไม่ใช่โมเดลภาษาขนาดใหญ่” Riberio กล่าว “ผมจะไม่กินยาที่ได้รับการทดสอบในแบบจำลองทางชีวภาพของแมลงหวี่เท่านั้น” เขากล่าวเป็นตัวอย่าง

การตอบสนองที่เกิดจากโมเดล AI ในปัจจุบันมักจะค่อนข้างธรรมดาหรือเล็กน้อย และไม่จับความซับซ้อนและความหลากหลายของความคิดสร้างสรรค์ของมนุษย์ นักวิจัยแย้ง

“บางครั้งสิ่งที่เราต้องการศึกษาด้วยข้อมูลที่รวบรวมจากฝูงชนก็เป็นวิธีที่มนุษย์ไม่สมบูรณ์” โรเบิร์ต เวสต์ ผู้ร่วมเขียนรายงานและผู้ช่วยศาสตราจารย์แห่งคณะวิทยาการคอมพิวเตอร์และการสื่อสารของ EPFL กล่าวกับเรา

ในขณะที่ AI ปรับปรุงอย่างต่อเนื่อง มีแนวโน้มว่างานที่มาจากฝูงชนจะเปลี่ยนไป Riberio คาดการณ์ว่าโมเดลภาษาขนาดใหญ่สามารถแทนที่พนักงานบางคนในงานเฉพาะได้ “อย่างไรก็ตาม ในทางที่ขัดแย้งกัน ข้อมูลของมนุษย์อาจมีค่ามากกว่าที่เคย และอาจเป็นไปได้ว่าแพลตฟอร์มเหล่านี้จะสามารถใช้วิธีต่างๆ เพื่อป้องกันการใช้โมเดลภาษาขนาดใหญ่ และทำให้แน่ใจว่าข้อมูลดังกล่าวยังคงเป็นแหล่งข้อมูลของมนุษย์”

ใครจะไปรู้ บางทีมนุษย์อาจลงเอยด้วยการร่วมมือกับโมเดลภาษาขนาดใหญ่เพื่อสร้างการตอบสนองด้วยเช่นกัน เขากล่าวเสริม ®

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
การเงิน EVM ส่วนต่อประสานแบบครบวงจรสำหรับการเงินแบบกระจายอำนาจ เข้าถึงได้ที่นี่.
กลุ่มสื่อควอนตัม IR/PR ขยาย เข้าถึงได้ที่นี่.
เพลโตไอสตรีม. ข้อมูลอัจฉริยะ Web3 ขยายความรู้ เข้าถึงได้ที่นี่.
ที่มา: https://go.theregister.com/feed/www.theregister.com/2023/06/16/crowd_workers_bots_ai_training/

ประทับเวลา: มิถุนายน 16, 2023

ประทับเวลา: May 18, 2023

AI ในปัจจุบันคือปัญญาประดิษฐ์ประดิษฐ์

เผยแพร่ซ้ำโดยเพลโต

การทดลอง

เพิ่มเติมจาก ลงทะเบียน

ธรรมชาติของการเปลี่ยนแปลง

Google, Apple กำลังทำข้อตกลงเพื่อนำ Gemini มาสู่ iDevices

สิงคโปร์ปรับปรุง AI ที่ใช้ในการตรวจจับผู้สูบบุหรี่

UN ใช้มติ AI ที่สนับสนุนโดยสหรัฐฯ และไม่มีข้อผูกมัด

Spotify ใช้ AI เพื่อโคลนเสียงของ Podcaster เป็นภาษาสเปน

ข่าว 'หลัก': Microsoft เลื่อน Bing chatbot ทางลัดไปยัง Windows 11

AI กำลังมาหางานของคุณหรือไม่? อาจจะ แต่ขึ้นอยู่กับ

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้