AI Baru Meta Berada di Peringkat 10% Teratas di Game 'Diplomasi'—dan Pemain Manusia Bukanlah Kecerdasan Data PlatoBlockchain yang Lebih Bijaksana. Pencarian Vertikal. Ai.

AI Baru Meta Berperingkat 10% Teratas di Game 'Diplomasi'—dan Pemain Manusia Tidak Lebih Bijaksana

AI telah menguasai sebagian besar permainan yang kompleks diketahui manusia, tetapi meskipun sering unggul dalam persaingan, kerja sama tidak muncul secara alami. Kini AI dari Meta telah menguasai permainan Diplomacy, yang mengharuskan Anda bekerja sama dengan pemain lain untuk menang.

penguasaan Google atas permainan Go dielu-elukan sebagai tonggak utama AI, tetapi terlepas dari kerumitannya yang tak terbantahkan, AI dalam banyak hal sangat cocok untuk logika mesin yang dingin dan penuh perhitungan. Ini adalah permainan informasi yang sempurna, di mana Anda memiliki visibilitas penuh atas gerakan lawan Anda, dan menang berarti mampu mengalahkan satu pemain lain.

Diplomasi, di sisi lain, adalah urusan yang jauh lebih berantakan. Permainan papan melihat hingga tujuh pemain mengambil lebih kekuatan militer Eropa dan menggunakan pasukan mereka untuk menguasai kota-kota strategis. Tetapi pemain diizinkan untuk bernegosiasi satu sama lain untuk membentuk dan menghancurkan aliansi dalam mengejar dominasi total.

Terlebih lagi, gerakan semua pemain dilakukan secara bersamaan di setiap giliran, jadi Anda tidak bisa begitu saja bereaksi terhadap apa yang dilakukan orang lain. Ini berarti bahwa memenangkan permainan membutuhkan kombinasi pemikiran strategis yang kompleks, kemampuan untuk bekerja sama dengan pemain lain, dan keterampilan negosiasi yang persuasif. Sementara AI telah menguasai strategi murni, keterampilan lain itu terbukti jauh lebih sulit untuk ditiru.

AI baru yang dirancang oleh para peneliti di Meta mungkin telah mengambil langkah besar ke arah itu. Di sebuah kertas diterbitkan minggu lalu in Ilmu, mereka menggambarkan sistem yang disebut Cicero yang menempati peringkat 10 persen pemain teratas dalam liga Diplomasi online dan mencapai lebih dari dua kali lipat skor rata-rata pemain manusia.

"Cicero ulet, kejam, dan sabar, ”juara dunia Diplomasi tiga kali Andrew Goff said dalam video yang diproduksi oleh Meta. “Itu dimainkan tanpa banyak emosi manusia yang terkadang membuat Anda membuat keputusan yang buruk. Itu hanya menilai situasi dan membuat keputusan terbaik, tidak hanya untuk itu, tetapi untuk orang-orang yang bekerja dengannya.

Membuat Cicero mengharuskan peneliti Meta untuk menggabungkan metode AI canggih dari dua subbidang yang berbeda: penalaran strategis dan pemrosesan bahasa alami. Pada intinya, sistem ini memiliki algoritme perencanaan yang memprediksi pergerakan pemain lain dan menggunakannya untuk menentukan strateginya sendiri. Algoritma ini dilatih dengan membuat AI bermain sendiri berulang kali, sambil mencoba meniru cara manusia memainkan permainan tersebut.

Para peneliti telah menunjukkan bahwa modul perencanaan saja sudah mampu mengalahkan pro manusia dalam versi permainan yang disederhanakan. Namun dalam penelitian terbaru ini, tim menggabungkannya dengan model bahasa besar yang dilatih pada sejumlah besar teks dari internet, dan kemudian disesuaikan menggunakan dialog dari 40,000 game online Diplomacy. Ini memberi Cicero yang ditingkatkan kemampuan untuk menafsirkan pesan dari pemain lain dan juga kerajinan sendiri pesan membujuk mereka untuk bekerja sama.

Sistem gabungan dimulai dengan menggunakan keadaan papan saat ini dan dialog sebelumnya untuk memprediksi apa yang kemungkinan akan dilakukan setiap pemain. Itu kemudian muncul dengan rencana tindakan untuk dirinya sendiri dan mitranya sebelum menghasilkan pesan yang dirancang untuk menguraikan niatnya dan memastikan kerja sama dari pemain lain.

Lebih dari 40 pertandingan di turnamen online, Cicero berkomunikasi secara efektif dengan 82 pemain lain untuk menjelaskan niatnya, mengoordinasikan tindakan, dan menegosiasikan aliansi. Yang terpenting, para peneliti mengatakan mereka tidak melihat bukti dari pesan dalam game bahwa pemain manusia mencurigai mereka bekerja sama dengan AI.

Namun, kemampuan komunikatif sang model tidaklah sempurna. Ini lebih dari mampu mengeluarkan pesan yang tidak masuk akal atau yang tidak sesuai dengan tujuannya, sehingga para peneliti harus membuat beberapa pesan kandidat di setiap gerakan dan kemudian menggunakan berbagai mekanisme penyaringan untuk membuang sampah. Dan bahkan kemudian, para peneliti mengakui bahwa pesan yang tidak masuk akal terkadang terpelesetped melalui.

Ini menunjukkan bahwa model bahasa di jantung Cicero masih belum benar-benar memahami apa yang sedang terjadi dan hanya menghasilkan pesan yang terdengar masuk akal yang kemudian perlu diperiksa untuk memastikannya mencapai hasil yang diinginkan.

Menulis di Percakapan, Peneliti AI Toby Walsh di University of New South Wales di Australia juga mencatat bahwa Cicero sangat jujur, tidak seperti kebanyakan pemain manusia. Meskipun ini adalah strategi yang sangat efektif, ini bisa menjadi kelemahan utama jika pesaing mengetahui bahwa lawan mereka tidak akan pernah mencoba dan menipu mereka.

Namun, kemajuannya signifikan, dan Facebook berharap dapat memiliki aplikasi yang jauh melampaui permainan papan. Dalam posting blog, para peneliti mengatakan kemampuan untuk menggunakan algoritme perencanaan untuk mengontrol pembuatan bahasa dapat memungkinkan percakapan yang lebih lama dan lebih kaya dengan AI chatbots atau membuat karakter video game yang dapat beradaptasi dengan perilaku pemain.

Gambar Kredit: Gambar MabelAmber / 4008

Stempel Waktu:

Lebih dari Hub Singularity