โลกแห่ง 'ความจริง': ตัวแทน AI วางแผนปาร์ตี้และชวนกันออกเดทในเมืองเสมือนจริง 16 บิต

โลกแห่ง 'ความจริง': ตัวแทน AI วางแผนปาร์ตี้และชวนกันออกเดทในเมืองเสมือนจริง 16 บิต

โลกแห่ง 'ความจริง': เจ้าหน้าที่ AI วางแผนปาร์ตี้และชวนกันออกเดทในเมืองเสมือน 16 บิต PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

“นี่คือเรื่องจริงของตัวละครในวิดีโอเกม 25 ตัวที่ถูกเลือกให้อาศัยอยู่ในเมืองและถูกบันทึกเทปชีวิตไว้...เพื่อค้นหาว่าจะเกิดอะไรขึ้นเมื่อคอมพิวเตอร์หยุดสุภาพ...และ เริ่มเป็นจริง".

นักวิจัยจาก Google และ Stanford ได้สร้างรายการเรียลลิตี้รูปแบบใหม่โดยใช้ตัวแทน AI แทนคน

ด้วยการใช้ ChatGPT แชทบอทไวรัสของ OpenAI และโค้ดที่กำหนดเอง พวกเขาสร้างตัวละคร AI 25 ตัวพร้อมเรื่องราวเบื้องหลัง บุคลิก ความทรงจำ และแรงจูงใจ จากนั้นนักวิจัยก็ทิ้งตัวละครเหล่านี้ไว้ในเมืองวิดีโอเกม 16 บิต แล้วปล่อยให้พวกเขาดำเนินชีวิตต่อไป ดังนั้นอะไร ทำ เกิดขึ้นเมื่อคอมพิวเตอร์เริ่มเป็นจริง?

“สารก่อกำเนิดตื่นขึ้น ทำอาหารเช้า และไปทำงาน” นักวิจัยเขียนไว้ในก กระดาษพิมพ์ล่วงหน้า โพสต์ไปที่ arXiv โดยสรุปโครงการ “ศิลปินวาดภาพในขณะที่ผู้เขียนเขียน พวกเขาสร้างความคิดเห็นและสังเกตซึ่งกันและกันและเริ่มการสนทนา พวกเขาจำและไตร่ตรองถึงวันที่ผ่านมาในขณะที่พวกเขาวางแผนในวันถัดไป”

ไม่ใช่ทีวีที่โลดโผนซะทีเดียว แต่เหมือนจริงอย่างน่าประหลาดใจสำหรับอัลกอริทึมการเรียนรู้ของเครื่องขนาดใหญ่…พูดกับตัวเอง

Smallville เมือง AI เป็นเพียงการพัฒนาล่าสุดในช่วงเวลาที่น่าสนใจสำหรับ AI แม้ว่า ChatGPT เวอร์ชันพื้นฐานจะใช้การโต้ตอบทีละรายการ เขียนข้อความแจ้ง รับการตอบกลับโครงการหน่อจำนวนมาก กำลังรวม ChatGPT กับโปรแกรมอื่นๆ เพื่อทำงานให้เสร็จสมบูรณ์โดยอัตโนมัติ สิ่งเหล่านี้อาจรวมถึงการสร้างรายการสิ่งที่ต้องทำและทำเครื่องหมายออกจากรายการทีละรายการ ข้อมูล Google และสรุปผลลัพธ์ การเขียนและการดีบักโค้ดแม้กระทั่งการวิจารณ์และแก้ไขผลลัพธ์ของ ChatGPT เอง

การโต้ตอบแบบเรียงซ้อนเหล่านี้ทำให้ Smallville ทำงานได้ดีเช่นกัน นักวิจัยได้สร้างชุดอัลกอริทึมร่วมที่ร่วมกันขับเคลื่อนตัวแทน AI ง่ายๆ ที่สามารถจัดเก็บความทรงจำ จากนั้นสะท้อน วางแผน และดำเนินการตามความทรงจำเหล่านั้น

ขั้นตอนแรกคือการสร้างตัวละคร ในการทำเช่นนี้ นักวิจัยจะเขียนความทรงจำพื้นฐานในรูปแบบของข้อความแจ้งโดยละเอียดที่อธิบายถึงบุคลิก แรงจูงใจ และสถานการณ์ของตัวละครนั้น นี่คือตัวอย่างย่อจากเอกสาร: “John Lin เป็นเจ้าของร้านยาที่ Willow Market and Pharmacy ผู้รักการช่วยเหลือผู้คน เขามักจะมองหาวิธีที่จะทำให้กระบวนการรับยาง่ายขึ้นสำหรับลูกค้าของเขา John Lin อาศัยอยู่กับ Mei Lin ภรรยาของเขา ซึ่งเป็นอาจารย์วิทยาลัย และลูกชาย Eddy Lin ซึ่งเป็นนักศึกษาที่เรียนทฤษฎีดนตรี”

แต่ลักษณะเฉพาะไม่เพียงพอ ตัวละครแต่ละตัวยังต้องการหน่วยความจำ ดังนั้น ทีมงานจึงสร้างฐานข้อมูลที่เรียกว่า "สตรีมหน่วยความจำ" ซึ่งจะบันทึกประสบการณ์ของเจ้าหน้าที่ในภาษาประจำวัน

เมื่อเข้าถึงสตรีมหน่วยความจำ เอเจนต์จะแสดงความทรงจำล่าสุด สำคัญ และเกี่ยวข้อง เหตุการณ์ที่มี "ความสำคัญ" สูงสุดจะถูกบันทึกเป็นความทรงจำที่แยกจากกัน ซึ่งนักวิจัยเรียกว่า "ภาพสะท้อน" สุดท้าย ตัวแทนสร้างแผนโดยใช้รังของการแจ้งเตือนที่มีรายละเอียดมากขึ้นเรื่อยๆ ซึ่งจะแบ่งวันออกเป็นเวลาทีละเล็กทีละน้อย ดังนั้นแผนระดับสูงแต่ละแผนจึงถูกแบ่งออกเป็นขั้นตอนย่อยๆ แผนเหล่านี้ยังถูกเพิ่มไปยังสตรีมหน่วยความจำเพื่อเรียกค้น

ขณะที่เอเจนต์ดำเนินไปในแต่ละวัน—แปลข้อความแจ้งเป็นการกระทำและการสนทนากับตัวละครอื่นๆ ในเกม—เอเจนต์ใช้สตรีมความทรงจำของประสบการณ์ การไตร่ตรอง และแผนการเพื่อแจ้งการกระทำและการสนทนาแต่ละรายการ ในขณะเดียวกัน ประสบการณ์ใหม่ๆ ก็ย้อนกลับเข้ามาในสตรีม กระบวนการนี้ค่อนข้างง่าย แต่เมื่อรวมเข้ากับโมเดลภาษาขนาดใหญ่ของ OpenAI โดยใช้อินเทอร์เฟซ ChatGPT ผลลัพธ์ที่ได้จะซับซ้อนอย่างน่าประหลาดใจแม้กระทั่งโผล่ออกมา

ในการทดสอบ ทีมงานได้กระตุ้นให้ตัวละครชื่ออิซาเบลลาวางแผนจัดงานปาร์ตี้วันวาเลนไทน์ และอีกคนหนึ่งชื่อมาเรียตกหลุมรักเคลาส์คนที่สาม อิซาเบลลาเชิญเพื่อนๆ และลูกค้ามาร่วมงานปาร์ตี้ ตกแต่งร้านกาแฟ และจ้างมาเรีย เพื่อนของเธอมาช่วยงาน มาเรียพูดถึงงานเลี้ยงของเคลาส์และเชิญให้เขาไปกับเธอ ตัวแทนห้าคนเข้าร่วมงานเลี้ยง—แต่ก็เป็นมนุษย์เหมือนกัน—เกล็ดเล็กชิ้นน้อยหรือเพียงแค่ไม่ปรากฏตัว

นอกเหนือจากจุดเริ่มต้น - แผนปาร์ตี้และความสนใจ - ส่วนที่เหลือก็เกิดขึ้นเอง “พฤติกรรมทางสังคมของการบอกต่อ การตกแต่ง การชวนกัน การมาถึงงานปาร์ตี้ และการมีปฏิสัมพันธ์ซึ่งกันและกันในงานปาร์ตี้นั้นริเริ่มโดยสถาปัตยกรรมของตัวแทน” ผู้เขียนเขียน

เป็นเรื่องน่าทึ่งที่สามารถทำได้ โดยส่วนใหญ่แล้วเพียงแค่แบ่ง ChatGPT ออกเป็นส่วนต่างๆ ของฟังก์ชันการทำงานและบุคลิกลักษณะต่างๆ แล้วแยกส่วนออกจากกัน

วิดีโอเกมเป็นแอปพลิเคชั่นที่ชัดเจนที่สุดของการโต้ตอบแบบปลายเปิดที่เชื่อได้ โดยเฉพาะอย่างยิ่งเมื่อรวมกับอวาตาร์ที่มีความเที่ยงตรงสูง ตัวละครที่ไม่ใช่ผู้เล่นสามารถพัฒนาจากการโต้ตอบตามสคริปต์เป็น บทสนทนาที่มีบุคลิกน่าเชื่อ.

นักวิจัยเตือนผู้คนอาจถูกล่อลวงให้สร้างความสัมพันธ์กับตัวละครที่สมจริง—เทรนด์ที่มาแล้ว—และผู้ออกแบบควรเพิ่มเกราะป้องกันเนื้อหาและปฏิเสธเสมอเมื่อตัวละครเป็นตัวแทน ความเสี่ยงอื่นๆ รวมถึงความเสี่ยงที่เกี่ยวข้องกับการกำเนิด AI โดยรวม เช่น การแพร่กระจายของข้อมูลที่ผิดและการพึ่งพาตัวแทนมากเกินไป

วิธีนี้ อาจไม่สามารถใช้งานได้จริง เพื่อทำงานในวิดีโอเกมกระแสหลัก แต่ก็แนะนำว่าอนาคตดังกล่าวน่าจะมาในเร็ว ๆ นี้

เช่นเดียวกับแนวโน้มที่ใหญ่ขึ้นในตัวแทน การใช้งานปัจจุบันยังมีจำกัดแม้ว่าจะมีการโฆษณาเกินจริงก็ตาม. แต่เชื่อมต่ออัลกอริธึมหลายตัว—พร้อมปลั๊กอินและการเข้าถึงอินเทอร์เน็ต—อาจอนุญาตให้มีการสร้างตัวแทนที่มีลักษณะคล้ายผู้ช่วยที่มีความสามารถซึ่งสามารถทำงานหลายขั้นตอนพร้อมกันได้ ในระยะยาว AI อัตโนมัติดังกล่าวอาจมีประโยชน์มาก แต่ก็มีความเสี่ยงที่อัลกอริทึมจะวางไม่ตรงแนว ซึ่งก่อให้เกิดปัญหาที่ไม่คาดคิดในวงกว้าง

สำหรับตอนนี้ สิ่งที่ชัดเจนที่สุดคือการเต้นรำระหว่างเจเนอเรทีฟเอไอกับชุมชนนักพัฒนาและนักวิจัยยังคงแสดงทิศทางและความสามารถใหม่ๆ ที่น่าประหลาดใจอย่างต่อเนื่อง ซึ่งเป็นวงจรป้อนกลับที่ยังไม่แสดงสัญญาณของการชะลอตัว

เครดิตรูปภาพ: “Generative Agents: Interactive Simulacra of Human Behavior” Joon Sung Park, Joseph C. O'Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang, Michael S. Bernstein

ประทับเวลา:

เพิ่มเติมจาก Hub เอกพจน์