Meta'nın Yeni Yapay Zekası 'Diplomasi' Oyununda İlk %10'da Yer Aldı ve İnsan Oyuncular Hiç Bilge Değildi PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Meta'nın Yeni Yapay Zekası 'Diplomasi' Oyununda İlk %10'da Yer Aldı ve İnsan Oyuncular Daha Akıllı Değildi

AI en çok bazılarında ustalaştı karmaşık oyunlar insan tarafından bilinir, ancak genellikle rekabette üstün olsa da, işbirliği o kadar doğal değildir. Artık Meta'dan bir yapay zeka, kazanmak için diğer oyuncularla birlikte çalışmanızı gerektiren Diplomacy oyununda ustalaştı.

Google'ın ustalığı Git oyunu AI için önemli bir dönüm noktası olarak selamlandı, ancak inkar edilemez karmaşıklığına rağmen, birçok yönden bir makinenin soğuk, hesaplayıcı mantığına çok uygun. Bu, rakibinizin hamlelerini tam olarak görebildiğiniz ve kazanmanın basitçe başka bir oyuncuyu alt edebilmek anlamına geldiği, mükemmel bilgi içeren bir oyundur.

Öte yandan diplomasi çok daha karmaşık bir meseledir. Tahta oyunu yedi oyuncuya kadar görüyor tekrar Avrupalı ​​askeri güçler ve ordularını stratejik şehirlerin kontrolünü ele geçirmek için kullanıyorlar. Ancak oyuncuların, toplam hakimiyet arayışında ittifaklar oluşturmak ve bozmak için birbirleriyle müzakere etmelerine izin verilir.

Dahası, tüm oyuncuların hamleleri her turda aynı anda yapılır, böylece diğerlerinin yaptıklarına öylece tepki veremezsiniz. Bu, oyunları kazanmanın stratejik düşünme, diğer oyuncularla işbirliği yapma yeteneği ve ikna edici müzakere becerilerinin karmaşık bir kombinasyonunu gerektirdiği anlamına gelir. Yapay zeka zaten saf stratejide ustalaşmış olsa da, bu diğer becerilerin kopyalanmasının çok daha zor olduğu kanıtlanmıştır.

Yine de Meta'daki araştırmacılar tarafından tasarlanan yeni bir yapay zeka, bu yönde büyük bir adım atmış olabilir. İçinde yayınlanan kağıt geçen hafta in Bilim, bir çevrimiçi Diplomasi liginde oyuncuların ilk yüzde 10'unda yer alan ve insan oyuncuların ortalama puanını iki katından fazla elde eden Cicero adlı bir sistemi tanımlıyorlar.

"Cicero dayanıklı, acımasız ve sabırlı," üç kez Diplomasi dünya şampiyonu Andrew Goff said içinde Meta tarafından üretilen video. “Bazen kötü kararlar almanıza neden olan çok fazla insani duygu olmadan oynuyor. Sadece durumu değerlendiriyor ve sadece kendisi için değil, birlikte çalıştığı insanlar için en iyi kararı veriyor.”

Cicero'yu oluşturmak, Meta araştırmacılarının iki farklı alt alandan en son teknoloji yapay zeka yöntemlerini birleştirmelerini gerektirdi: stratejik akıl yürütme ve doğal dil işleme. Sistemin kalbinde, diğer oyuncuların hareketlerini tahmin eden ve bunu kendi stratejisini belirlemek için kullanan bir planlama algoritması vardır. Bu algoritma, yapay zekanın kendisini tekrar tekrar oynatması ve aynı zamanda insanların oyunu oynama şeklini taklit etmeye çalışmasıyla eğitildi.

Araştırmacılar, bu planlama modülünün tek başına insan artılarını yen oyunun basitleştirilmiş bir versiyonunda. Ancak bu son araştırmada ekip, onu internetten çok miktarda metin üzerinde eğitilmiş ve ardından 40,000 çevrimiçi Diplomasi oyunundan diyalog kullanılarak ince ayar yapılmış büyük bir dil modeliyle birleştirdi. Bu, yükseltilmiş Cicero'ya diğer oyunculardan gelen mesajları yorumlama yeteneği verdi. ve ayrıca kendi işini yap mesajları birlikte çalışmaya ikna etmektir.

Kombine sistem, tahtanın mevcut durumunu ve her oyuncunun ne yapacağını tahmin etmek için geçmiş diyalogları kullanarak başlar. Ardından, amacını ana hatlarıyla belirtmek ve diğer oyuncuların işbirliğini sağlamak için tasarlanmış mesajlar üretmeden önce hem kendisi hem de ortakları için bir eylem planı oluşturur.

Çevrim içi turnuvada 40'tan fazla oyunda Cicero, niyetlerini açıklamak, eylemleri koordine etmek ve ittifaklar müzakere etmek için 82 diğer oyuncuyla etkili bir şekilde iletişim kurdu. En önemlisi, araştırmacılar, oyun içi mesajlardan, insan oyuncuların bir yapay zeka ile takım kurduklarından şüphelendiklerine dair hiçbir kanıt görmediklerini söylüyorlar.

Ancak, modelin iletişim becerileri kusursuz değildi. Saçma sapan veya hedefleriyle tutarsız mesajlar verme kapasitesinden daha fazlasıdır, bu nedenle araştırmacıların her harekette birden fazla aday mesaj oluşturması ve ardından çöpü ayıklamak için çeşitli filtreleme mekanizmaları kullanması gerekiyordu. Ve o zaman bile, araştırmacılar mantıksız mesajların bazen kaydığını kabul ediyorlar.ped ile.

Bu, Cicero'nun kalbindeki dil modelinin hala neler olup bittiğini gerçekten anlamadığını ve sadece kulağa makul gelen mesajlar ürettiğini ve ardından istenen sonuçlara ulaştıklarından emin olmak için incelenmesi gerektiğini gösteriyor.

Yazı yazmak Konuşma, Avustralya'daki New South Wales Üniversitesi'nden AI araştırmacısı Toby Walsh da, çoğu insan oyuncunun aksine, Cicero'nun hatasız bir şekilde dürüst olduğunu belirtiyor. Bu şaşırtıcı derecede etkili bir strateji olsa da, rakiplerinin onları asla kandırmaya çalışmayacağını anlaması büyük bir zayıflık olabilir.

Bununla birlikte, ilerleme önemli ve Facebook, masa oyunlarının çok ötesinde uygulamalara sahip olabileceğini umuyor. Bir blog yazısında, araştırmacılar, dil üretimini kontrol etmek için planlama algoritmalarını kullanma yeteneğinin, AI sohbet botlarıyla çok daha uzun ve daha zengin konuşmalar yapmayı veya bir oyuncunun davranışına uyum sağlayabilen video oyunu karakterleri yaratmayı mümkün kılabileceğini söylüyor.

Resim Kredi: MabelKehribar / 4008 görsel

Zaman Damgası:

Den fazla Tekillik Merkezi