AI ใหม่ของ Meta อยู่ในอันดับที่ 10% ในเกม 'การทูต' และผู้เล่นที่เป็นมนุษย์ก็ไม่มีใครฉลาดกว่า PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

AI ใหม่ของ Meta อยู่ใน 10% แรกในเกม 'Diplomacy' และผู้เล่นที่เป็นมนุษย์ก็ไม่มีใครฉลาดกว่าใคร

AI เชี่ยวชาญบางอย่างมากที่สุด เกมที่ซับซ้อน มนุษย์รู้จัก แต่ในขณะที่มักจะเก่งในการแข่งขัน ความร่วมมือไม่ได้เกิดขึ้นโดยธรรมชาติ ตอนนี้ AI จาก Meta ได้เชี่ยวชาญการทูตของเกมแล้ว ซึ่งคุณจะต้องทำงานร่วมกับผู้เล่นคนอื่นเพื่อเอาชนะ

ความเชี่ยวชาญของ Google ในด้าน เกมโก ได้รับการยกย่องว่าเป็นก้าวสำคัญสำหรับ AI แต่ถึงแม้จะมีความซับซ้อนที่ไม่อาจปฏิเสธได้ แต่ก็เหมาะกับตรรกะการคำนวณของเครื่องจักรในหลายๆ ด้าน เป็นเกมที่มีข้อมูลสมบูรณ์แบบ ซึ่งคุณสามารถมองเห็นการเคลื่อนไหวของฝ่ายตรงข้ามได้อย่างเต็มที่ และการชนะหมายถึงความสามารถในการเอาชนะผู้เล่นคนอื่น

ในทางกลับกัน การทูตเป็นเรื่องที่ยุ่งยากกว่ามาก เกมกระดานมีผู้เล่นสูงสุดเจ็ดคน เกิน อำนาจทางทหารของยุโรปและใช้กองทัพเพื่อควบคุมเมืองยุทธศาสตร์ แต่ผู้เล่นจะได้รับอนุญาตให้เจรจากันเพื่อสร้างและทำลายพันธมิตรเพื่อแสวงหาการครอบงำทั้งหมด

ยิ่งไปกว่านั้น การเคลื่อนไหวของผู้เล่นทั้งหมดจะทำพร้อมกันในแต่ละเทิร์น ดังนั้นคุณจึงไม่สามารถตอบสนองต่อสิ่งที่คนอื่นทำ ซึ่งหมายความว่าการชนะเกมต้องใช้การผสมผสานที่ซับซ้อนของการคิดเชิงกลยุทธ์ ความสามารถในการร่วมมือกับผู้เล่นอื่น และทักษะการเจรจาโน้มน้าวใจ แม้ว่า AI จะเชี่ยวชาญในกลยุทธ์ที่บริสุทธิ์อยู่แล้ว แต่ทักษะอื่นๆ เหล่านั้นได้พิสูจน์แล้วว่ายากกว่ามากในการทำซ้ำ

AI ใหม่ที่ออกแบบโดยนักวิจัยที่ Meta อาจมีขั้นตอนสำคัญในทิศทางนั้น ใน กระดาษที่เผยแพร่ สัปดาห์ที่ผ่านมา in วิทยาศาสตร์, พวกเขาอธิบายถึงระบบที่เรียกว่า Cicero ซึ่งติดอันดับผู้เล่น 10 เปอร์เซ็นต์แรกในลีกการทูตออนไลน์ และได้รับคะแนนเฉลี่ยมากกว่าสองเท่าของผู้เล่นที่เป็นมนุษย์

"ซิเซโรมีความอดทน โหดเหี้ยม และอดทน” แอนดรูว์ กอฟฟ์ แชมป์โลกด้านการทูต XNUMX สมัยid ใน วิดีโอที่ผลิตโดย Meta. “มันเล่นโดยปราศจากอารมณ์ความรู้สึกของมนุษย์ ซึ่งบางครั้งทำให้คุณตัดสินใจได้ไม่ดี มันแค่ประเมินสถานการณ์และทำการตัดสินใจที่ดีที่สุด ไม่ใช่แค่เพื่อมัน แต่สำหรับคนที่มันทำงานด้วย”

การสร้าง Cicero ทำให้นักวิจัย Meta ต้องรวมวิธี AI ที่ล้ำสมัยจากสองสาขาย่อยที่แตกต่างกัน ได้แก่ การให้เหตุผลเชิงกลยุทธ์และการประมวลผลภาษาธรรมชาติ หัวใจของระบบคือระบบมีอัลกอริทึมการวางแผนที่คาดการณ์การเคลื่อนไหวของผู้เล่นคนอื่นและใช้สิ่งนี้เพื่อกำหนดกลยุทธ์ของตนเอง อัลกอริทึมนี้ได้รับการฝึกฝนโดยให้ AI เล่นซ้ำแล้วซ้ำอีก ในขณะเดียวกันก็พยายามเลียนแบบวิธีที่มนุษย์เล่นเกม

นักวิจัยได้แสดงให้เห็นแล้วว่าโมดูลการวางแผนนี้เพียงอย่างเดียวสามารถทำได้ เอาชนะมืออาชีพของมนุษย์ ในเวอร์ชันที่เรียบง่ายของเกม แต่ในการวิจัยล่าสุดนี้ ทีมงานได้รวมโมเดลนี้เข้ากับโมเดลภาษาขนาดใหญ่ที่ได้รับการฝึกฝนสำหรับข้อความจำนวนมหาศาลจากอินเทอร์เน็ต จากนั้นปรับแต่งอย่างละเอียดโดยใช้บทสนทนาจากเกมออนไลน์ 40,000 เกมของ Diplomacy สิ่งนี้ทำให้ Cicero ที่ได้รับการอัพเกรดสามารถตีความข้อความจากผู้เล่นคนอื่นได้ และ ฝีมือตัวเองด้วย ข้อความ เพื่อชักชวนให้มาทำงานร่วมกัน

ระบบรวมเริ่มต้นโดยใช้สถานะปัจจุบันของกระดานและบทสนทนาที่ผ่านมาเพื่อทำนายว่าผู้เล่นแต่ละคนมีแนวโน้มที่จะทำอะไร จากนั้นจึงจัดทำแผนปฏิบัติการสำหรับทั้งตัวมันเองและพันธมิตรก่อนที่จะสร้างข้อความที่ออกแบบมาเพื่อสรุปเจตนาและรับประกันความร่วมมือของผู้เล่นรายอื่น

กว่า 40 เกมในการแข่งขันออนไลน์ Cicero สื่อสารกับผู้เล่นอื่น ๆ 82 คนอย่างมีประสิทธิภาพเพื่ออธิบายความตั้งใจ ประสานงานการดำเนินการ และเจรจาพันธมิตร ที่สำคัญคือ นักวิจัยกล่าวว่าพวกเขาไม่เห็นหลักฐานจากข้อความในเกมที่ผู้เล่นที่เป็นมนุษย์สงสัยว่าพวกเขากำลังร่วมมือกับ AI

อย่างไรก็ตาม ความสามารถในการสื่อสารของนางแบบไม่ได้ไร้ที่ติ มันมีความสามารถมากกว่าที่จะคายข้อความไร้สาระหรือข้อความที่ไม่สอดคล้องกับเป้าหมาย ดังนั้นนักวิจัยจึงต้องสร้างข้อความของผู้สมัครหลายรายการในแต่ละครั้ง จากนั้นจึงใช้กลไกการกรองต่างๆ เพื่อกำจัดขยะ และถึงอย่างนั้น นักวิจัยก็ยอมรับว่าบางครั้งข้อความที่ไร้เหตุผลก็หลุดลอยไปเป็ด ตลอด

สิ่งนี้ชี้ให้เห็นว่ารูปแบบภาษาที่เป็นหัวใจของ Cicero ยังไม่เข้าใจสิ่งที่เกิดขึ้นอย่างแท้จริง และเป็นเพียงการสร้างข้อความที่ฟังดูน่าเชื่อถือซึ่งจำเป็นต้องได้รับการตรวจสอบเพื่อให้แน่ใจว่าบรรลุผลลัพธ์ที่ต้องการ

เขียนเข้า สนทนา, Toby Walsh นักวิจัยด้าน AI จาก University of New South Wales ในออสเตรเลียยังตั้งข้อสังเกตด้วยว่า Cicero นั้นซื่อสัตย์อย่างไม่มีข้อผิดพลาด ซึ่งแตกต่างจากผู้เล่นที่เป็นมนุษย์ส่วนใหญ่ แม้ว่านี่จะเป็นกลยุทธ์ที่มีประสิทธิภาพอย่างน่าประหลาดใจ แต่ก็อาจเป็นจุดอ่อนที่สำคัญหากคู่แข่งรู้ว่าคู่ต่อสู้ของพวกเขาจะไม่พยายามหลอกลวงพวกเขา

อย่างไรก็ตาม ความก้าวหน้าครั้งนี้ถือเป็นก้าวที่สำคัญ และ Facebook หวังว่าจะมีแอพพลิเคชั่นที่เหนือกว่าเกมกระดาน ในโพสต์บล็อกนักวิจัยกล่าวว่าความสามารถในการใช้อัลกอริธึมการวางแผนเพื่อควบคุมการสร้างภาษาอาจทำให้การสนทนากับแชทบอท AI ยาวนานและสมบูรณ์ยิ่งขึ้น หรือสร้างตัวละครในวิดีโอเกมที่สามารถปรับให้เข้ากับพฤติกรรมของผู้เล่นได้

เครดิตภาพ: มาเบลแอมเบอร์ / 4008 ภาพ

ประทับเวลา:

เพิ่มเติมจาก Hub เอกพจน์