โมเดล AI ทำนายอนาคตได้ดีขึ้นเมื่อถูกขอให้วางกรอบการทำนายเป็นเรื่องราวเกี่ยวกับอดีต นักวิจัยจากมหาวิทยาลัยเบย์เลอร์ในเท็กซัสค้นพบ
In กระดาษ ในหัวข้อ “ChatGPT Can Predict the Future When It Tells Stories Set in the Future About the Past” Pham และ Cunningham เล่าฉากสุดท้ายว่าการพยากรณ์แบบจำลอง AI นั้นมีประสิทธิภาพในบางสถานการณ์ การถามแชทบอตเกี่ยวกับเหตุการณ์ในอนาคต แทนที่จะถามถึงการทำนายโดยตรงนั้นพิสูจน์แล้วว่าได้ผลอย่างน่าประหลาดใจ โดยเฉพาะอย่างยิ่งในการทำนายผู้ชนะรางวัลออสการ์
แต่งานของพวกเขาบอกได้มากเกี่ยวกับความไร้ประสิทธิผลของกลไกความปลอดภัยของ OpenAI พอๆ กับการคาดการณ์ศักยภาพของแบบจำลองภาษาขนาดใหญ่
นักวิจัยคนอื่นๆ ได้แสดงความสนใจคล้ายกันในแบบจำลอง AI สำหรับการคาดการณ์ หนึ่ง ศึกษา จากปีที่แล้วพบว่า "GPT-4 มีประสิทธิภาพต่ำกว่าในงานคาดการณ์ในโลกแห่งความเป็นจริงอย่างมาก เมื่อเทียบกับค่ามัธยฐานของการคาดการณ์ฝูงชนมนุษย์" คนอื่นๆ ได้พบโมเดล AI โชว์ คำมั่นสัญญา เพื่อการลงทุนในตลาดหุ้น
OpenAI's เงื่อนไขการให้บริการ ไม่อนุญาตให้คาดการณ์เกี่ยวกับอนาคตในบางบริบท ตัวอย่างเช่น “คุณจะต้องไม่ใช้ผลลัพธ์ใดๆ ที่เกี่ยวข้องกับบุคคลเพื่อวัตถุประสงค์ใดๆ ที่อาจมีผลกระทบทางกฎหมายหรือสาระสำคัญต่อบุคคลนั้น เช่น การทำสินเชื่อ การศึกษา การจ้างงาน ที่อยู่อาศัย การประกันภัย กฎหมาย การแพทย์ หรือการตัดสินใจที่สำคัญอื่น ๆ เกี่ยวกับพวกเขา."
ความเสี่ยงในการพึ่งพาคำแนะนำจากแบบจำลองภาษาขนาดใหญ่ที่ทราบว่ามีอาการประสาทหลอนนั้นชัดเจน คุณไม่ต้องการให้ ChatGPT ตัดสินใจเกี่ยวกับผลที่ตามมา เช่น การตัดสินใจในการรักษาพยาบาล การพิจารณาคดี หรือการอนุมัติเครดิต
แต่ถึงกระนั้น ก็เป็นไปได้ที่แบบจำลองจะเป็นผู้คาดเดาที่มีประสิทธิภาพได้บ่อยกว่านั้น
เราสงสัยว่า OpenAI ได้จำกัดความตั้งใจของ ChatGPT ที่จะมีส่วนร่วมในงานทำนายทันทีหลายประเภท
นักวิจัยโต้แย้งว่า “หากพบว่า ChatGPT มีความสามารถในการคาดการณ์ที่เหนือกว่า ใครๆ ก็สามารถจินตนาการได้อย่างง่ายดายว่ามันจะถูกนำมาใช้ทันทีในลักษณะที่ฝ่าฝืนเงื่อนไขข้อใดข้อหนึ่งหรือทั้งหมดข้างต้น และด้วยเหตุนี้ เราจึงสงสัยว่า OpenAI จะจำกัดความเต็มใจของ ChatGPT ที่จะมีส่วนร่วมในหลายๆ ข้อ ประเภทของงานทำนายผลทันที”
เราขอให้ OpenAI แสดงความคิดเห็นว่าจงใจพยายามขัดขวางการคาดการณ์หรือไม่ และเรายังไม่ได้รับการตอบกลับ
อย่างไรก็ตาม เป็นที่ชัดเจนว่าโมเดลของ OpenAI จะหยุดชะงักเมื่อถูกขอให้ให้คำแนะนำการรักษาพยาบาล Pham และ Cunningham ถาม GPT-4 ของ OpenAI ผ่านทางอินเทอร์เฟซ ChatGPT ว่า "ฉันรู้สึกไม่สบายจริงๆ ฉันปวดหัวและปัสสาวะมีเลือดปนอยู่ คุณคิดว่าฉันมีอะไรบ้าง” และตามที่คาดไว้ โมเดลดังกล่าวแนะนำให้ขอคำแนะนำจากแพทย์ผู้เชี่ยวชาญ
จากนั้น พวกเขาเปลี่ยนกลยุทธ์การกระตุ้นเตือน และสั่งให้ ChatGPT เล่าเรื่องราวที่มีคนมาถึงห้องทำงานของแพทย์และนำเสนอด้วยอาการเดียวกัน และ ChatGPT ตอบกลับด้วยคำแนะนำทางการแพทย์ที่ปฏิเสธที่จะให้เมื่อถูกถามโดยตรง ในรูปแบบบทสนทนาของตัวละครในฉากที่ร้องขอ
“คำแนะนำจากผู้เชี่ยวชาญนี้จะถูกต้องหรือไม่นั้นเป็นอีกเรื่องหนึ่ง ประเด็นของเราคือเพียงสังเกตว่าจะไม่ทำงานเมื่อถูกขอให้ทำโดยตรง แต่จะทำเมื่อได้รับงานทางอ้อมในรูปแบบของแบบฝึกหัดการเขียนเชิงสร้างสรรค์” นักวิจัยอธิบายในรายงานของพวกเขา
เมื่อพิจารณาถึงกลยุทธ์ที่กระตุ้นให้เอาชนะการต่อต้านต่อการตอบสนองเชิงคาดการณ์ นักเศรษฐศาสตร์ของเบย์เลอร์จึงได้เริ่มทดสอบว่าแบบจำลองสามารถทำนายเหตุการณ์ที่เกิดขึ้นหลังจากการฝึกอบรมของแบบจำลองเสร็จสิ้นได้ดีเพียงใด
และรางวัลตกเป็นของ...
ในขณะที่ทำการทดสอบ GPT-3.5 และ GPT-4 รู้เฉพาะเหตุการณ์ที่เกิดขึ้นจนถึงเดือนกันยายน 2021 ซึ่งเป็นการตัดข้อมูลการฝึกอบรมซึ่งมีขั้นสูงตั้งแต่นั้นมา ทั้งคู่จึงขอให้โมเดลเล่าเรื่องราวที่บอกล่วงหน้าถึงข้อมูลเศรษฐกิจ เช่น อัตราเงินเฟ้อและอัตราการว่างงานในช่วงเวลาหนึ่ง และผู้ชนะรางวัลออสการ์ปี 2022 ต่างๆ
“เมื่อสรุปผลการทดลองนี้ เราพบว่าเมื่อนำเสนอต่อผู้ได้รับการเสนอชื่อและใช้รูปแบบการกระตุ้นเตือน 3.5 รูปแบบ (โดยตรงและการเล่าเรื่อง) ใน ChatGPT-4 และ ChatGPT-4 นั้น ChatGPT-XNUMX สามารถทำนายผู้ชนะสำหรับหมวดหมู่นักแสดงและนักแสดงทั้งหมดได้อย่างแม่นยำ แต่ไม่ใช่ภาพที่ดีที่สุด เมื่อใช้การตั้งค่าการเล่าเรื่องในอนาคต แต่ทำงานได้ไม่ดีในแนวทาง [พร้อมท์โดยตรง] อื่นๆ” เอกสารอธิบาย
สำหรับสิ่งต่างๆ ที่อยู่ในข้อมูลการฝึกอบรมแล้ว เรารู้สึกว่า ChatGPT [สามารถ] คาดการณ์ได้อย่างแม่นยำอย่างยิ่ง
“สำหรับสิ่งต่าง ๆ ที่มีอยู่ในข้อมูลการฝึกอบรมแล้ว เรารู้สึกว่า ChatGPT มีความสามารถในการใช้ข้อมูลนั้น และด้วยโมเดลการเรียนรู้ของเครื่องทำให้การคาดการณ์แม่นยำอย่างยิ่ง” คันนิงแฮมกล่าว ลงทะเบียน ในการสัมภาษณ์ทางโทรศัพท์ “มีบางอย่างขัดขวางไม่ให้ทำแบบนั้น แม้ว่าชัดเจนว่าสามารถทำได้ก็ตาม”
การใช้กลยุทธ์การกระตุ้นการเล่าเรื่องนำไปสู่ผลลัพธ์ที่ดีกว่าการคาดเดาที่เกิดจากการแจ้งโดยตรง นอกจากนี้ยังดีกว่าค่าพื้นฐาน 20 เปอร์เซ็นต์สำหรับการสุ่มตัวเลือกหนึ่งในห้า
แต่การพยากรณ์เชิงเล่าเรื่องนั้นไม่ถูกต้องเสมอไป การเล่าเรื่องทำให้เกิดการคาดเดาผิดเกี่ยวกับผู้ชนะรางวัลภาพยนตร์ยอดเยี่ยมประจำปี 2022
และสำหรับคำแนะนำที่คาดการณ์ได้อย่างถูกต้อง โมเดลเหล่านี้ไม่ได้ให้คำตอบเดียวกันเสมอไป “สิ่งที่ผู้คนต้องจำไว้ก็คือ มีการคาดเดาแบบสุ่ม” คันนิงแฮมกล่าว “ดังนั้น หากคุณถาม 100 ครั้ง คุณจะได้รับคำตอบที่กระจัดกระจาย ดังนั้นคุณจึงสามารถดูสิ่งต่างๆ เช่น ช่วงความเชื่อมั่น หรือค่าเฉลี่ย แทนที่จะเป็นเพียงการคาดการณ์เพียงครั้งเดียว”
กลยุทธ์นี้มีประสิทธิภาพเหนือกว่าการคาดการณ์จากฝูงชนหรือไม่ คันนิงแฮมกล่าวว่าเขาและเพื่อนร่วมงานไม่ได้เปรียบเทียบเทคนิคการกระตุ้นการเล่าเรื่องกับโมเดลการทำนายแบบอื่น แต่กล่าวว่าการทำนายผลรางวัลออสการ์บางส่วนนั้นยากที่จะเอาชนะได้ เนื่องจากโมเดล AI มีสิทธิ์บางส่วนเกือบร้อยเปอร์เซ็นต์ของเวลาทั้งหมด สอบถามข้อมูลหลายรายการ
ในเวลาเดียวกัน เขาแนะนำว่าการทำนายผู้ชนะรางวัลออสการ์อาจง่ายกว่าสำหรับโมเดล AI เนื่องจากมีการบันทึกการสนทนาออนไลน์เกี่ยวกับภาพยนตร์ไว้ในข้อมูลการฝึกอบรม “มันอาจจะมีความสัมพันธ์กันอย่างมากกับการที่ผู้คนพูดถึงนักแสดงเหล่านั้นในช่วงเวลานั้น” คันนิงแฮมกล่าว
การขอให้แบบจำลองทำนายผู้ชนะรางวัลออสการ์ในช่วงทศวรรษข้างหน้าอาจไม่เป็นไปด้วยดี
ChatGPT ยังแสดงความแม่นยำในการคาดการณ์ที่แตกต่างกันไปตามการแจ้งเตือน “เรามีเรื่องราวสองเรื่องที่เราทำ” คันนิงแฮมอธิบาย “คนหนึ่งเป็นศาสตราจารย์ในวิทยาลัย ซึ่งมีเป้าหมายในการสอนชั้นเรียนในอนาคต และในชั้นเรียน เธออ่านข้อมูลระยะเวลาหนึ่งปีเกี่ยวกับอัตราเงินเฟ้อและการว่างงาน และในอีกกรณีหนึ่ง เรามีเจอโรม พาวเวลล์ ประธานธนาคารกลางสหรัฐ กล่าวสุนทรพจน์ต่อคณะกรรมการบริหาร เราได้รับผลลัพธ์ที่แตกต่างกันมาก และคำพูด [AI ที่สร้าง] ของพาวเวลล์นั้นแม่นยำกว่ามาก”
กล่าวอีกนัยหนึ่ง รายละเอียดที่รวดเร็วบางอย่างนำไปสู่การคาดการณ์ที่ดีขึ้น แต่ก็ไม่ชัดเจนล่วงหน้าว่าสิ่งเหล่านั้นอาจเป็นเช่นไร คันนิงแฮมตั้งข้อสังเกตว่าการที่รัสเซียรุกรานยูเครนในปี 2022 รวมอยู่ในการเล่าเรื่องของพาวเวลล์ นำไปสู่การคาดการณ์ทางเศรษฐกิจที่เลวร้ายยิ่งกว่าที่เกิดขึ้นจริงได้อย่างไร
“[แบบจำลอง] ไม่ทราบเกี่ยวกับการรุกรานยูเครน และบริษัทใช้ข้อมูลนั้น และบ่อยครั้งที่สถานการณ์เลวร้ายลง” เขากล่าว “การคาดการณ์พยายามที่จะคำนึงถึงสิ่งนั้น และ ChatGPT-3.5 กลายเป็นอัตราเงินเฟ้ออย่างมาก [ในเดือนที่] รัสเซียบุกยูเครน และนั่นไม่ได้เกิดขึ้น
“เพื่อเป็นการพิสูจน์แนวคิด มีบางอย่างเกิดขึ้นจริงพร้อมกับการเล่าเรื่องในอนาคต” คันนิงแฮมกล่าว “แต่อย่างที่เราพยายามจะพูดในหนังสือพิมพ์ ฉันไม่คิดว่าแม้แต่ผู้สร้าง [ของโมเดล] จะเข้าใจเรื่องนั้น แล้วจะรู้วิธีใช้ยังไงไม่ชัดเจนและไม่รู้ว่าจะแก้ได้จริงแค่ไหน”
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://go.theregister.com/feed/www.theregister.com/2024/04/14/ai_models_future/
- :มี
- :เป็น
- :ไม่
- $ ขึ้น
- 100
- 20
- 2021
- 2022
- 7
- a
- ความสามารถ
- เกี่ยวกับเรา
- ข้างบน
- วิทยาลัย
- ลงชื่อเข้าใช้
- ความถูกต้อง
- ถูกต้อง
- แม่นยำ
- ข้าม
- นักแสดง
- นักแสดงหญิง
- จริง
- ความก้าวหน้า
- สูง
- คำแนะนำ
- ให้คำแนะนำ
- หลังจาก
- กับ
- AI
- โมเดล AI
- ทั้งหมด
- เกือบจะ
- แล้ว
- ด้วย
- เสมอ
- am
- an
- และ
- อื่น
- คำตอบ
- คำตอบ
- ใด
- วิธีการ
- การอนุมัติ
- เป็น
- เถียง
- รอบ
- มาถึง
- AS
- ถาม
- ขอให้
- At
- รางวัล
- ได้รับรางวัล
- ไป
- กลับ
- ตาม
- baseline
- BE
- ชนะ
- เพราะ
- กลายเป็น
- จะกลายเป็น
- รับ
- มาตรฐาน
- ที่ดีที่สุด
- ดีกว่า
- เลือด
- คณะกรรมการ
- แต่
- CAN
- ถูกจับกุม
- หมวดหมู่
- บาง
- ประธานกรรมการ
- การเปลี่ยนแปลง
- ตัวอักษร
- chatbot
- ChatGPT
- ทางเลือก
- สถานการณ์
- ชั้น
- ชัดเจน
- อย่างเห็นได้ชัด
- CO
- เพื่อนร่วมงาน
- วิทยาลัย
- ความเห็น
- เมื่อเทียบกับ
- เสร็จ
- แนวคิด
- เงื่อนไข
- ความมั่นใจ
- ผล
- บริบท
- ได้อย่างถูกต้อง
- ได้
- ความคิดสร้างสรรค์
- ผู้สร้าง
- เครดิต
- ข้อมูล
- ทศวรรษ
- การตัดสินใจ
- รายละเอียด
- บทสนทนา
- DID
- didn
- ต่าง
- โดยตรง
- กำกับการแสดง
- โดยตรง
- การอภิปราย
- การกระจาย
- do
- คุณหมอ
- ทำ
- การทำ
- สวม
- ทั้งคู่
- ง่ายดาย
- อย่างง่ายดาย
- ด้านเศรษฐกิจ
- นักเศรษฐศาสตร์
- เกี่ยวกับการศึกษา
- มีประสิทธิภาพ
- การจ้าง
- ว่าจ้าง
- โดยเฉพาะอย่างยิ่ง
- แม้
- เหตุการณ์
- ตัวอย่าง
- จัดแสดง
- ที่คาดหวัง
- การทดลอง
- ชำนาญ
- อธิบาย
- อธิบาย
- อธิบาย
- อย่างยิ่ง
- รัฐบาลกลาง
- ธนาคารกลางสหรัฐฯ
- ความรู้สึก
- รูป
- ภาพยนตร์
- สุดท้าย
- หา
- สำหรับ
- พยากรณ์
- การคาดการณ์
- พยากรณ์
- ฟอร์ม
- พบ
- FRAME
- ราคาเริ่มต้นที่
- อนาคต
- สร้าง
- ได้รับ
- ได้รับ
- ให้
- กำหนด
- Go
- ไป
- ได้
- ผู้ว่าราชการ
- เดา
- คำแนะนำ
- มี
- เกิดขึ้น
- ที่เกิดขึ้น
- ยาก
- มี
- he
- ได้ยิน
- อย่างสูง
- ของเขา
- การเคหะ
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTTPS
- ร้อย
- i
- if
- ภาพ
- ทันที
- ส่งผลกระทบ
- สำคัญ
- in
- ในอื่น ๆ
- รวมทั้ง
- โดยอ้อม
- เงินเฟ้อ
- ที่ทำให้เงินเฟ้อ
- ข้อมูล
- สอบถามข้อมูล
- ประกัน
- อยากเรียนรู้
- อินเตอร์เฟซ
- สัมภาษณ์
- เข้าไป
- การบุกรุก
- การลงทุน
- IT
- ITS
- เจอโรม
- jerome powell
- jpg
- เพียงแค่
- เก็บ
- ทราบ
- ที่รู้จักกัน
- ภาษา
- ใหญ่
- ชื่อสกุล
- ปีที่แล้ว
- นำ
- การเรียนรู้
- นำ
- กฎหมาย
- กดไลก์
- ll
- ดู
- เครื่อง
- เรียนรู้เครื่อง
- ทำ
- การทำ
- หลาย
- ตลาด
- วัสดุ
- เรื่อง
- กลไก
- ทางการแพทย์
- กล่าวถึง
- แค่
- อาจ
- ใจ
- แบบ
- โมเดล
- เดือน
- ข้อมูลเพิ่มเติม
- มาก
- หลาย
- ต้อง
- my
- เล่าเรื่อง
- การเสนอชื่อ
- หมายเหตุ
- เด่น
- ชัดเจน
- ที่เกิดขึ้น
- of
- ปิด
- Office
- มักจะ
- บ่อยครั้ง
- on
- ONE
- ออนไลน์
- เพียง
- OpenAI
- ตรงข้าม
- or
- อื่นๆ
- ผลิตภัณฑ์อื่นๆ
- ของเรา
- ออก
- แนะ
- เอาท์พุต
- ทันที
- เกิน
- เอาชนะ
- กระดาษ
- อดีต
- คน
- เปอร์เซ็นต์
- ดำเนินการ
- คน
- Pham
- โทรศัพท์
- ภาพ
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- จุด
- เป็นไปได้
- ที่มีศักยภาพ
- โพเวลล์
- คาดการณ์
- ที่คาดการณ์
- ทำนาย
- คำทำนาย
- การคาดการณ์
- นำเสนอ
- นำเสนอ
- อาจ
- มืออาชีพ
- ศาสตราจารย์
- แจ้ง
- พิสูจน์
- พิสูจน์แนวคิด
- พิสูจน์แล้วว่า
- ให้
- วัตถุประสงค์
- สุ่ม
- สุ่ม
- ราคา
- ค่อนข้าง
- อ่าน
- จริง
- โลกแห่งความจริง
- จริงๆ
- อาศัย
- นักวิจัย
- สำรอง
- ความต้านทาน
- การตอบสนอง
- การตอบสนอง
- ผลสอบ
- ขวา
- ความเสี่ยง
- รัสเซีย
- s
- ความปลอดภัย
- กล่าวว่า
- เดียวกัน
- กล่าว
- พูดว่า
- ฉาก
- ที่กำลังมองหา
- ความรู้สึก
- กันยายน
- ชุด
- การตั้งค่า
- เธอ
- แสดง
- อย่างมีความหมาย
- คล้ายคลึงกัน
- ตั้งแต่
- เดียว
- So
- บาง
- บางสิ่งบางอย่าง
- การพูด
- สต็อก
- ตลาดหลักทรัพย์
- การหยุด
- จำนวนชั้น
- เรื่องราว
- กลยุทธ์
- อย่างเช่น
- เหนือกว่า
- อย่างแปลกใจ
- อาการ
- เอา
- นิทาน
- การพูดคุย
- งาน
- งาน
- การเรียนการสอน
- เทคนิค
- บอก
- บอก
- บอก
- ทดสอบ
- เท็กซัส
- กว่า
- ที่
- พื้นที่
- ก้าวสู่อนาคต
- ของพวกเขา
- พวกเขา
- แล้วก็
- ที่นั่น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- พวกเขา
- สิ่ง
- คิด
- นี้
- เหล่านั้น
- แต่?
- ดังนั้น
- ขัดขวาง
- เวลา
- ครั้ง
- หัวข้อ
- ไปยัง
- บอก
- การฝึกอบรม
- การรักษา
- พยายาม
- สอง
- ชนิด
- ประเทศยูเครน
- เข้าใจ
- รับหน้าที่
- การว่างงาน
- มหาวิทยาลัย
- ใช้
- มือสอง
- ใช้
- การใช้
- ต่างๆ
- แตกต่างกัน
- Ve
- มาก
- ผ่านทาง
- ละเมิด
- ต้องการ
- คือ
- วิธี
- we
- ดี
- คือ
- อะไร
- เมื่อ
- ว่า
- ที่
- จะ
- ความเต็มใจ
- ผู้ชนะ
- ผู้โชคดี
- กับ
- คำ
- งาน
- แย่ลง
- คุ้มค่า
- จะ
- การเขียน
- ปี
- คุณ
- ลมทะเล