AI mới của Meta được xếp hạng trong top 10% trong trò chơi 'Ngoại giao'—và người chơi con người không phải là trí thông minh dữ liệu PlatoBlockchain khôn ngoan hơn. Tìm kiếm dọc. Ái.

Trí tuệ nhân tạo mới của Meta được xếp hạng trong Top 10% tại Trò chơi 'Ngoại giao'—và người chơi là con người không phải là người khôn ngoan hơn

AI đã thành thạo một số thứ nhất trò chơi phức tạp con người biết đến, nhưng trong khi nó thường vượt trội trong cạnh tranh, thì sự hợp tác không đến một cách tự nhiên. Giờ đây, một AI từ Meta đã thành thạo trò chơi Ngoại giao, trò chơi yêu cầu bạn phải hợp tác với những người chơi khác để giành chiến thắng.

Sự thành thạo của Google về trò chơi cờ vây được ca ngợi là một cột mốc quan trọng đối với AI, nhưng bất chấp sự phức tạp không thể phủ nhận của nó, theo nhiều cách, nó rất phù hợp với logic tính toán lạnh lùng của một cỗ máy. Đây là một trò chơi có thông tin hoàn hảo, nơi bạn có thể nhìn thấy đầy đủ các bước di chuyển của đối thủ và chiến thắng đơn giản có nghĩa là có thể vượt qua một người chơi khác.

Ngoại giao, mặt khác, là một vấn đề phức tạp hơn nhiều. Trò chơi cờ có tới bảy người chơi tham gia kết thúc cường quốc quân sự châu Âu và sử dụng quân đội của họ để kiểm soát các thành phố chiến lược. Nhưng người chơi được phép thương lượng với nhau để thành lập và phá vỡ các liên minh nhằm theo đuổi sự thống trị hoàn toàn.

Hơn nữa, tất cả các bước di chuyển của người chơi được thực hiện đồng thời ở mỗi lượt, vì vậy bạn không thể phản ứng đơn giản với những gì người khác làm. Điều này có nghĩa là các trò chơi chiến thắng đòi hỏi sự kết hợp phức tạp giữa tư duy chiến lược, khả năng hợp tác với những người chơi khác và kỹ năng đàm phán thuyết phục. Mặc dù AI đã thành thạo chiến lược thuần túy, nhưng những kỹ năng khác đó tỏ ra khó tái tạo hơn nhiều.

Tuy nhiên, một AI mới được thiết kế bởi các nhà nghiên cứu tại Meta có thể đã tiến một bước lớn theo hướng đó. trong một giấy xuất bản tuần trước in Khoa học, họ mô tả một hệ thống có tên là Cicero được xếp hạng trong 10 phần trăm người chơi hàng đầu trong giải đấu Ngoại giao trực tuyến và đạt được hơn gấp đôi số điểm trung bình của những người chơi là con người.

"Cicero kiên cường, tàn nhẫn và kiên nhẫn,” nhà ngoại giao ba lần vô địch thế giới Andrew Goff said trong một video do Meta sản xuất. “Nó chơi mà không có nhiều cảm xúc của con người, đôi khi khiến bạn đưa ra những quyết định tồi tệ. Nó chỉ đánh giá tình hình và đưa ra quyết định tốt nhất, không chỉ cho nó mà còn cho những người mà nó làm việc cùng.”

Việc tạo Cicero yêu cầu các nhà nghiên cứu Meta kết hợp các phương pháp AI tiên tiến nhất từ ​​hai lĩnh vực phụ khác nhau: lý luận chiến lược và xử lý ngôn ngữ tự nhiên. Về cơ bản, hệ thống có một thuật toán lập kế hoạch dự đoán nước đi của những người chơi khác và sử dụng thuật toán này để xác định chiến lược của chính nó. Thuật toán này được đào tạo bằng cách yêu cầu AI tự chơi đi chơi lại, đồng thời cố gắng bắt chước cách con người chơi trò chơi.

Các nhà nghiên cứu đã chỉ ra rằng chỉ riêng mô-đun lập kế hoạch này đã có thể đánh bại con người trong một phiên bản đơn giản hóa của trò chơi. Nhưng trong nghiên cứu mới nhất này, nhóm đã kết hợp nó với một mô hình ngôn ngữ lớn được đào tạo trên lượng lớn văn bản từ internet, sau đó tinh chỉnh bằng cách sử dụng đoạn hội thoại từ 40,000 trò chơi trực tuyến của Diplomacy. Điều này đã mang lại cho Cicero được nâng cấp khả năng giải thích cả tin nhắn từ những người chơi khác cũng thủ công của riêng mình tin nhắn để thuyết phục họ làm việc cùng nhau.

Hệ thống kết hợp bắt đầu bằng cách sử dụng trạng thái hiện tại của bàn cờ và cuộc đối thoại trong quá khứ để dự đoán khả năng mỗi người chơi sẽ làm gì. Sau đó, nó đưa ra một kế hoạch hành động cho cả chính nó và các đối tác trước khi tạo các thông báo được thiết kế để phác thảo ý định của nó và đảm bảo sự hợp tác của những người chơi khác.

Hơn 40 trận đấu trong giải đấu trực tuyến, Cicero đã giao tiếp hiệu quả với 82 người chơi khác để giải thích ý định, phối hợp hành động và đàm phán liên minh. Điều quan trọng, các nhà nghiên cứu cho biết họ không thấy bằng chứng nào từ các tin nhắn trong trò chơi cho thấy người chơi nghi ngờ họ đang hợp tác với AI.

Tuy nhiên, khả năng giao tiếp của người mẫu không hoàn hảo. Nó thừa khả năng đưa ra những thông điệp vô nghĩa hoặc những thông điệp không phù hợp với mục tiêu của nó, vì vậy các nhà nghiên cứu phải tạo ra nhiều thông điệp ứng cử viên trong mỗi lần di chuyển và sau đó sử dụng các cơ chế lọc khác nhau để loại bỏ rác. Và thậm chí sau đó, các nhà nghiên cứu thừa nhận rằng những thông điệp phi logic đôi khi bị trượtPED xuyên qua.

Điều này cho thấy rằng mô hình ngôn ngữ cốt lõi của Cicero vẫn chưa thực sự hiểu chuyện gì đang xảy ra và chỉ đơn giản là tạo ra những thông điệp nghe có vẻ hợp lý, sau đó cần được kiểm tra lại để đảm bảo chúng đạt được kết quả mong muốn.

Viết vào Conversation, Nhà nghiên cứu AI Toby Walsh tại Đại học New South Wales ở Úc cũng lưu ý rằng Cicero rất trung thực, không giống như hầu hết những người chơi là con người. Mặc dù đây là một chiến lược hiệu quả đáng kinh ngạc, nhưng nó có thể là một điểm yếu lớn nếu các đối thủ nhận ra rằng đối thủ của họ sẽ không bao giờ cố gắng lừa dối họ.

Tuy nhiên, bước tiến này là một bước tiến quan trọng và Facebook hy vọng nó có thể có các ứng dụng vượt xa các trò chơi trên bàn cờ. Trong bài đăng trên blog, các nhà nghiên cứu cho biết khả năng sử dụng thuật toán lập kế hoạch để kiểm soát việc tạo ngôn ngữ có thể giúp trò chuyện với chatbot AI lâu hơn và phong phú hơn hoặc tạo nhân vật trò chơi điện tử có thể thích ứng với hành vi của người chơi.

Ảnh: MabelAmber / 4008 hình ảnh

Dấu thời gian:

Thêm từ Trung tâm cá biệt