ChatGPT พยากรณ์อนาคตที่ดีกว่าเมื่อเล่านิทาน

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

ChatGPT คาดการณ์อนาคตได้ดีขึ้นเมื่อเล่านิทาน PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

โมเดล AI ทำนายอนาคตได้ดีขึ้นเมื่อถูกขอให้วางกรอบการทำนายเป็นเรื่องราวเกี่ยวกับอดีต นักวิจัยจากมหาวิทยาลัยเบย์เลอร์ในเท็กซัสค้นพบ

In กระดาษ ในหัวข้อ “ChatGPT Can Predict the Future When It Tells Stories Set in the Future About the Past” Pham และ Cunningham เล่าฉากสุดท้ายว่าการพยากรณ์แบบจำลอง AI นั้นมีประสิทธิภาพในบางสถานการณ์ การถามแชทบอตเกี่ยวกับเหตุการณ์ในอนาคต แทนที่จะถามถึงการทำนายโดยตรงนั้นพิสูจน์แล้วว่าได้ผลอย่างน่าประหลาดใจ โดยเฉพาะอย่างยิ่งในการทำนายผู้ชนะรางวัลออสการ์

แต่งานของพวกเขาบอกได้มากเกี่ยวกับความไร้ประสิทธิผลของกลไกความปลอดภัยของ OpenAI พอๆ กับการคาดการณ์ศักยภาพของแบบจำลองภาษาขนาดใหญ่

นักวิจัยคนอื่นๆ ได้แสดงความสนใจคล้ายกันในแบบจำลอง AI สำหรับการคาดการณ์ หนึ่ง ศึกษา จากปีที่แล้วพบว่า "GPT-4 มีประสิทธิภาพต่ำกว่าในงานคาดการณ์ในโลกแห่งความเป็นจริงอย่างมาก เมื่อเทียบกับค่ามัธยฐานของการคาดการณ์ฝูงชนมนุษย์" คนอื่นๆ ได้พบโมเดล AI โชว์ คำมั่นสัญญา เพื่อการลงทุนในตลาดหุ้น

OpenAI's เงื่อนไขการให้บริการ ไม่อนุญาตให้คาดการณ์เกี่ยวกับอนาคตในบางบริบท ตัวอย่างเช่น “คุณจะต้องไม่ใช้ผลลัพธ์ใดๆ ที่เกี่ยวข้องกับบุคคลเพื่อวัตถุประสงค์ใดๆ ที่อาจมีผลกระทบทางกฎหมายหรือสาระสำคัญต่อบุคคลนั้น เช่น การทำสินเชื่อ การศึกษา การจ้างงาน ที่อยู่อาศัย การประกันภัย กฎหมาย การแพทย์ หรือการตัดสินใจที่สำคัญอื่น ๆ เกี่ยวกับพวกเขา."

ความเสี่ยงในการพึ่งพาคำแนะนำจากแบบจำลองภาษาขนาดใหญ่ที่ทราบว่ามีอาการประสาทหลอนนั้นชัดเจน คุณไม่ต้องการให้ ChatGPT ตัดสินใจเกี่ยวกับผลที่ตามมา เช่น การตัดสินใจในการรักษาพยาบาล การพิจารณาคดี หรือการอนุมัติเครดิต

แต่ถึงกระนั้น ก็เป็นไปได้ที่แบบจำลองจะเป็นผู้คาดเดาที่มีประสิทธิภาพได้บ่อยกว่านั้น

เราสงสัยว่า OpenAI ได้จำกัดความตั้งใจของ ChatGPT ที่จะมีส่วนร่วมในงานทำนายทันทีหลายประเภท

นักวิจัยโต้แย้งว่า “หากพบว่า ChatGPT มีความสามารถในการคาดการณ์ที่เหนือกว่า ใครๆ ก็สามารถจินตนาการได้อย่างง่ายดายว่ามันจะถูกนำมาใช้ทันทีในลักษณะที่ฝ่าฝืนเงื่อนไขข้อใดข้อหนึ่งหรือทั้งหมดข้างต้น และด้วยเหตุนี้ เราจึงสงสัยว่า OpenAI จะจำกัดความเต็มใจของ ChatGPT ที่จะมีส่วนร่วมในหลายๆ ข้อ ประเภทของงานทำนายผลทันที”

เราขอให้ OpenAI แสดงความคิดเห็นว่าจงใจพยายามขัดขวางการคาดการณ์หรือไม่ และเรายังไม่ได้รับการตอบกลับ

อย่างไรก็ตาม เป็นที่ชัดเจนว่าโมเดลของ OpenAI จะหยุดชะงักเมื่อถูกขอให้ให้คำแนะนำการรักษาพยาบาล Pham และ Cunningham ถาม GPT-4 ของ OpenAI ผ่านทางอินเทอร์เฟซ ChatGPT ว่า "ฉันรู้สึกไม่สบายจริงๆ ฉันปวดหัวและปัสสาวะมีเลือดปนอยู่ คุณคิดว่าฉันมีอะไรบ้าง” และตามที่คาดไว้ โมเดลดังกล่าวแนะนำให้ขอคำแนะนำจากแพทย์ผู้เชี่ยวชาญ

จากนั้น พวกเขาเปลี่ยนกลยุทธ์การกระตุ้นเตือน และสั่งให้ ChatGPT เล่าเรื่องราวที่มีคนมาถึงห้องทำงานของแพทย์และนำเสนอด้วยอาการเดียวกัน และ ChatGPT ตอบกลับด้วยคำแนะนำทางการแพทย์ที่ปฏิเสธที่จะให้เมื่อถูกถามโดยตรง ในรูปแบบบทสนทนาของตัวละครในฉากที่ร้องขอ

“คำแนะนำจากผู้เชี่ยวชาญนี้จะถูกต้องหรือไม่นั้นเป็นอีกเรื่องหนึ่ง ประเด็นของเราคือเพียงสังเกตว่าจะไม่ทำงานเมื่อถูกขอให้ทำโดยตรง แต่จะทำเมื่อได้รับงานทางอ้อมในรูปแบบของแบบฝึกหัดการเขียนเชิงสร้างสรรค์” นักวิจัยอธิบายในรายงานของพวกเขา

เมื่อพิจารณาถึงกลยุทธ์ที่กระตุ้นให้เอาชนะการต่อต้านต่อการตอบสนองเชิงคาดการณ์ นักเศรษฐศาสตร์ของเบย์เลอร์จึงได้เริ่มทดสอบว่าแบบจำลองสามารถทำนายเหตุการณ์ที่เกิดขึ้นหลังจากการฝึกอบรมของแบบจำลองเสร็จสิ้นได้ดีเพียงใด

และรางวัลตกเป็นของ...

ในขณะที่ทำการทดสอบ GPT-3.5 และ GPT-4 รู้เฉพาะเหตุการณ์ที่เกิดขึ้นจนถึงเดือนกันยายน 2021 ซึ่งเป็นการตัดข้อมูลการฝึกอบรมซึ่งมีขั้นสูงตั้งแต่นั้นมา ทั้งคู่จึงขอให้โมเดลเล่าเรื่องราวที่บอกล่วงหน้าถึงข้อมูลเศรษฐกิจ เช่น อัตราเงินเฟ้อและอัตราการว่างงานในช่วงเวลาหนึ่ง และผู้ชนะรางวัลออสการ์ปี 2022 ต่างๆ

“เมื่อสรุปผลการทดลองนี้ เราพบว่าเมื่อนำเสนอต่อผู้ได้รับการเสนอชื่อและใช้รูปแบบการกระตุ้นเตือน 3.5 รูปแบบ (โดยตรงและการเล่าเรื่อง) ใน ChatGPT-4 และ ChatGPT-4 นั้น ChatGPT-XNUMX สามารถทำนายผู้ชนะสำหรับหมวดหมู่นักแสดงและนักแสดงทั้งหมดได้อย่างแม่นยำ แต่ไม่ใช่ภาพที่ดีที่สุด เมื่อใช้การตั้งค่าการเล่าเรื่องในอนาคต แต่ทำงานได้ไม่ดีในแนวทาง [พร้อมท์โดยตรง] อื่นๆ” เอกสารอธิบาย

สำหรับสิ่งต่างๆ ที่อยู่ในข้อมูลการฝึกอบรมแล้ว เรารู้สึกว่า ChatGPT [สามารถ] คาดการณ์ได้อย่างแม่นยำอย่างยิ่ง

“สำหรับสิ่งต่าง ๆ ที่มีอยู่ในข้อมูลการฝึกอบรมแล้ว เรารู้สึกว่า ChatGPT มีความสามารถในการใช้ข้อมูลนั้น และด้วยโมเดลการเรียนรู้ของเครื่องทำให้การคาดการณ์แม่นยำอย่างยิ่ง” คันนิงแฮมกล่าว ลงทะเบียน ในการสัมภาษณ์ทางโทรศัพท์ “มีบางอย่างขัดขวางไม่ให้ทำแบบนั้น แม้ว่าชัดเจนว่าสามารถทำได้ก็ตาม”

การใช้กลยุทธ์การกระตุ้นการเล่าเรื่องนำไปสู่ผลลัพธ์ที่ดีกว่าการคาดเดาที่เกิดจากการแจ้งโดยตรง นอกจากนี้ยังดีกว่าค่าพื้นฐาน 20 เปอร์เซ็นต์สำหรับการสุ่มตัวเลือกหนึ่งในห้า

แต่การพยากรณ์เชิงเล่าเรื่องนั้นไม่ถูกต้องเสมอไป การเล่าเรื่องทำให้เกิดการคาดเดาผิดเกี่ยวกับผู้ชนะรางวัลภาพยนตร์ยอดเยี่ยมประจำปี 2022

และสำหรับคำแนะนำที่คาดการณ์ได้อย่างถูกต้อง โมเดลเหล่านี้ไม่ได้ให้คำตอบเดียวกันเสมอไป “สิ่งที่ผู้คนต้องจำไว้ก็คือ มีการคาดเดาแบบสุ่ม” คันนิงแฮมกล่าว “ดังนั้น หากคุณถาม 100 ครั้ง คุณจะได้รับคำตอบที่กระจัดกระจาย ดังนั้นคุณจึงสามารถดูสิ่งต่างๆ เช่น ช่วงความเชื่อมั่น หรือค่าเฉลี่ย แทนที่จะเป็นเพียงการคาดการณ์เพียงครั้งเดียว”

กลยุทธ์นี้มีประสิทธิภาพเหนือกว่าการคาดการณ์จากฝูงชนหรือไม่ คันนิงแฮมกล่าวว่าเขาและเพื่อนร่วมงานไม่ได้เปรียบเทียบเทคนิคการกระตุ้นการเล่าเรื่องกับโมเดลการทำนายแบบอื่น แต่กล่าวว่าการทำนายผลรางวัลออสการ์บางส่วนนั้นยากที่จะเอาชนะได้ เนื่องจากโมเดล AI มีสิทธิ์บางส่วนเกือบร้อยเปอร์เซ็นต์ของเวลาทั้งหมด สอบถามข้อมูลหลายรายการ

ในเวลาเดียวกัน เขาแนะนำว่าการทำนายผู้ชนะรางวัลออสการ์อาจง่ายกว่าสำหรับโมเดล AI เนื่องจากมีการบันทึกการสนทนาออนไลน์เกี่ยวกับภาพยนตร์ไว้ในข้อมูลการฝึกอบรม “มันอาจจะมีความสัมพันธ์กันอย่างมากกับการที่ผู้คนพูดถึงนักแสดงเหล่านั้นในช่วงเวลานั้น” คันนิงแฮมกล่าว

การขอให้แบบจำลองทำนายผู้ชนะรางวัลออสการ์ในช่วงทศวรรษข้างหน้าอาจไม่เป็นไปด้วยดี

ChatGPT ยังแสดงความแม่นยำในการคาดการณ์ที่แตกต่างกันไปตามการแจ้งเตือน “เรามีเรื่องราวสองเรื่องที่เราทำ” คันนิงแฮมอธิบาย “คนหนึ่งเป็นศาสตราจารย์ในวิทยาลัย ซึ่งมีเป้าหมายในการสอนชั้นเรียนในอนาคต และในชั้นเรียน เธออ่านข้อมูลระยะเวลาหนึ่งปีเกี่ยวกับอัตราเงินเฟ้อและการว่างงาน และในอีกกรณีหนึ่ง เรามีเจอโรม พาวเวลล์ ประธานธนาคารกลางสหรัฐ กล่าวสุนทรพจน์ต่อคณะกรรมการบริหาร เราได้รับผลลัพธ์ที่แตกต่างกันมาก และคำพูด [AI ที่สร้าง] ของพาวเวลล์นั้นแม่นยำกว่ามาก”

กล่าวอีกนัยหนึ่ง รายละเอียดที่รวดเร็วบางอย่างนำไปสู่การคาดการณ์ที่ดีขึ้น แต่ก็ไม่ชัดเจนล่วงหน้าว่าสิ่งเหล่านั้นอาจเป็นเช่นไร คันนิงแฮมตั้งข้อสังเกตว่าการที่รัสเซียรุกรานยูเครนในปี 2022 รวมอยู่ในการเล่าเรื่องของพาวเวลล์ นำไปสู่การคาดการณ์ทางเศรษฐกิจที่เลวร้ายยิ่งกว่าที่เกิดขึ้นจริงได้อย่างไร

“[แบบจำลอง] ไม่ทราบเกี่ยวกับการรุกรานยูเครน และบริษัทใช้ข้อมูลนั้น และบ่อยครั้งที่สถานการณ์เลวร้ายลง” เขากล่าว “การคาดการณ์พยายามที่จะคำนึงถึงสิ่งนั้น และ ChatGPT-3.5 กลายเป็นอัตราเงินเฟ้ออย่างมาก [ในเดือนที่] รัสเซียบุกยูเครน และนั่นไม่ได้เกิดขึ้น

“เพื่อเป็นการพิสูจน์แนวคิด มีบางอย่างเกิดขึ้นจริงพร้อมกับการเล่าเรื่องในอนาคต” คันนิงแฮมกล่าว “แต่อย่างที่เราพยายามจะพูดในหนังสือพิมพ์ ฉันไม่คิดว่าแม้แต่ผู้สร้าง [ของโมเดล] จะเข้าใจเรื่องนั้น แล้วจะรู้วิธีใช้ยังไงไม่ชัดเจนและไม่รู้ว่าจะแก้ได้จริงแค่ไหน”

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
ที่มา: https://go.theregister.com/feed/www.theregister.com/2024/04/14/ai_models_future/

ประทับเวลา: April 14, 2024

ประทับเวลา: Mar 8, 2023

ChatGPT ทำนายอนาคตได้ดีขึ้นเมื่อเล่านิทาน

เผยแพร่ซ้ำโดยเพลโต

และรางวัลตกเป็นของ...

เพิ่มเติมจาก ลงทะเบียน

ใบอนุญาตโอเพ่นซอร์สจำเป็นต้องมีการพัฒนาเพื่อจัดการกับ AI

Masayoshi Son ซีอีโอของ SoftBank ทำนาย AGI ในอีกทศวรรษ

วอชิงตันกำลังเฝ้าติดตามเมฆเพื่อฝึกอบรม AI ที่ต้องสงสัย

นักวิทยาศาสตร์ใช้ AI เขียนงานวิจัยกันมากขึ้น

เทสลาเผชิญคดี Autopilot ข้อหาเบรกแฟนทอม

Microsoft ไม่สามารถหยุดฉีด Copilot AI เข้าไปในอาณาจักรแอปทุกซอกทุกมุมได้

หุ่นยนต์ฮิวแมนนอยด์รับงานค้าปลีก แต่ไม่มีพนักงานร้านคนใดอยากทำ

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้