Neden Herkes ChatGPT Chatbot PlatoBlockchain Veri Zekasını Seviyor? Dikey Arama. Ai.

Neden Herkes ChatGPT Chatbot'u Seviyor?

Uzun zamandır yapay zekanın (AI) fethetmesi için çok zorlayıcı olduğuna inanılan başka bir oyun botların eline geçti: Stratego.

Londra merkezli bir şirket tarafından yapılan bir yapay zeka olan DeepNash DeepMind, artık kusurlu bilgilere karşı uzun vadeli stratejik düşünmeyi gerektiren bir masa oyunu olan Stratego'daki uzman insanlarla eşleşiyor.

Bu son başarı, daha önce insanların gücü olduğu düşünülen oyunlarda yapay zekalar için bir başka büyük galibiyetin ardından geldi.

Daha geçen hafta, Meta'dan Cicero, bir yapay zeka insan oyuncuları alt edebilir Diplomasi oyununda, çevrimiçi ortamda rakiplerini zekice alt ederek tarih yazdı.

Stratejik muhakeme ve oyun üzerine çalışan bir bilgisayar bilimcisi olan Ann Arbor'daki Michigan Üniversitesi'nden Michael Wellman, "Son yıllarda yapay zeka tarafından niteliksel olarak farklı oyun özelliklerinin fethedilme veya yeni seviyelere çıkma oranı oldukça dikkat çekici" diyor. teori.

Wellman, "Stratego ve Diplomacy birbirinden oldukça farklıdır ve aynı zamanda benzer kilometre taşlarına ulaşılmış oyunlardan oldukça farklı zorlu özelliklere sahiptir" dedi.

Eksik bilgi

Oyun genellikle satranç, Go veya pokerden çok daha karmaşık özelliklere sahiptir. Satranç, Go ve Poker'in tümü yapay zekalar tarafından yönetilmiştir.

Stratego oyununda iki oyuncu bir tahtaya 40'ar taş koyar, ancak rakibinin taşlarının ne olduğunu görmemelidir.

Oyunun amacı, rakibin taşlarını ortadan kaldırmak ve bir bayrağı ele geçirmek için taşları sırayla hareket ettirmektir. 

Stratego'nun oyun ağacı - oyunun gidebileceği tüm olası yolların bir grafiği - Go'nun 10535'ına karşı 10360 durumu var. 

Bir oyunun başlangıcındaki kusurlu bilgiler söz konusu olduğunda, Stratego'nun 1066 olası özel konumu vardır; bu rakam, iki oyunculu Texas hold'em pokerde bu türden yalnızca 106 başlangıç ​​durumunu gölgede bırakır.

Paris'te yaşayan bir DeepMind araştırmacısı olan Julien Perolat, "Stratego'daki olası sonuçların sayısının katıksız karmaşıklığı, mükemmel bilgi oyunlarında iyi performans gösteren ve hatta poker için çalışan algoritmaların çalışmadığı anlamına gelir" diyor.

DeepNash, Perolat ve meslektaşları tarafından geliştirilmiştir.

Nash'ten ilham alan bot

Botun adı, oyuncular tarafından takip edilebilecek ve hiçbir oyuncunun strateji değiştirerek fayda sağlamayacağı bir "istikrarlı stratejiler dizisi" olduğunu varsayan Nash denge teorisini ortaya atan ünlü ABD'li matematikçi John Nash'e bir övgüdür. kendi başlarına. Bu nedenle, oyunlar sıfır, bir veya birçok Nash dengesine sahip olma eğilimindedir.

DeepNash, bir Nash dengesi bulmak için pekiştirmeli öğrenme algoritmasını ve derin sinir ağını birleştirir. 

Genel olarak, takviyeli öğrenme, akıllı bir aracının (bilgisayar programı) çevre ile etkileşime girdiği ve oyunun her durumu için eylemi dikte etmek için en iyi politikayı öğrendiği yerdir. 

Optimal bir politikaya sahip olmak için DeepNash kendisine karşı toplam 5.5 milyar oyun oynadı. 

Temelde, bir taraf cezalandırılırsa, diğeri ödüllendirilir ve politikayı temsil eden sinir ağının değişkenleri buna göre ayarlanır.

AI, Stratego'da İnsanları Yener – DeepMash ile Tanışın

AI, Stratego'da İnsanları Yener – DeepMash ile Tanışın

Bir aşamada, DeepNash yaklaşık bir Nash dengesine yakınsar. Diğer Botların aksine, DeepNash kendini s olmadan optimize eder.oyun ağacını tarayarak.

DeepNash, iki hafta boyunca çevrimiçi oyun platformu Gravon'da insan Stratego oyuncularına karşı oynadı.

Ai, 50 maçta yarıştıktan sonra 2002'den beri tüm Gravon Stratego oyuncuları arasında üçüncü sırada yer aldı. 

Paris'te yaşayan bir DeepMind araştırmacısı olan ekip üyesi Karl Tuyls, "Çalışmamız, Stratego gibi kusurlu bilgiler içeren karmaşık bir oyunun onu çözmek için arama teknikleri gerektirmediğini gösteriyor" diyor. "Bu, AI'da ileriye doğru gerçekten büyük bir adım."

Diğer araştırmacılar da bu başarıdan etkileniyor.

Etkileyici sonuçlar

Merkezi New York City'de bulunan Meta AI'da araştırmacı ve 2019'da poker oynayan AI Pluribus4'ü bildiren ekibin bir üyesi olan Noam Brown, "Sonuçlar etkileyici," diyor.

Facebook'un ana şirketi Meta'da Brown ve meslektaşları, yedi oyuncunun bir harita üzerinde parçaları hareket ettirerek Avrupa'nın coğrafi kontrolü için rekabet ettiği bir oyun olan Diplomacy'yi oynayabilen bir yapay zeka geliştirdi.

Diplomaside amaç, birimleri (filolar ve ordular) hareket ettirerek ikmal merkezlerinin kontrolünü ele geçirmektir. 

Meta, Cicero'nun oldukça önemli olduğunu çünkü yapay zekanın düşmanca olmayan ortamlara dayandığını söylüyor.

İletişimin hiçbir değerinin olmadığı Satranç, Go ve Poker gibi tamamen çekişmeli ortamlarda çok aracılı yapay zeka için önceki büyük başarıların olduğu geçmişten farklı olarak, Cicero stratejik bir muhakeme motoru ve kontrol edilebilir diyalog modülü kullanır.

Brown, "İki oyunculu sıfır toplamlı oyunların ötesine geçtiğinizde, Nash dengesi fikri artık insanlarla iyi oynamak için o kadar kullanışlı değil" diyor.

Brown ve ekibi, Diplomasi'nin insan oyuncuları içeren çevrimiçi bir versiyonunun 125,261 oyunundan elde edilen verileri kullanarak Cicero'yu eğitti. 

Cicero, kendi kendine oynama verilerini ve bir stratejik muhakeme modülünü (SRM) kullanarak, oyunun durumuna ve birikmiş mesajlara, diğer oyuncuların olası hareketlerine ve politikalarına göre değerlendirme yapmayı öğrendi. 

AI, Stratego'da İnsanları Yener – DeepMash ile Tanışın

AI, Stratego'da İnsanları Yener – DeepMash ile Tanışın

Meta, webDiplomacy.net'te çevrimiçi oynanan 125,261 Diplomasi oyunundan veri topladığını söylüyor. Bu oyunların toplam 40,408'i diyalog içeriyordu ve oyuncular arasında toplam 12,901,662 mesaj değiş tokuşu yapıldı.

Gerçek dünya davranışı

Brown, Cicero gibi oyun oynayan Robotların insanlarla etkileşime geçebileceğine inanıyor ve "yetersiz ve hatta irrasyonel insan eylemlerinin gerçek dünya uygulamalarının önünü açabileceğini" açıklıyor.

"Kendi kendine giden bir araba yapıyorsanız, yoldaki diğer tüm sürücülerin tamamen mantıklı olduğunu ve en uygun şekilde davranacağını varsaymak istemezsiniz" diyor.

Cicero'nun bu yönde büyük bir adım olduğunu ekliyor. "Hala oyun dünyasında bir ayağımız var ama artık gerçek dünyada da bir ayağımız var."

Wellman gibi diğerleri de aynı fikirde, ancak daha fazla işin yapılması gerektiğinde ısrar ediyor. "Bu tekniklerin çoğu, eğlence amaçlı oyunların ötesinde gerçekten de gerçek dünyadaki uygulamalarla ilgilidir" diyor. "Yine de, bir noktada, önde gelen AI araştırma laboratuvarlarının eğlence ortamlarının ötesine geçmesi ve gerçekten önemsediğimiz daha yumuşak gerçek dünya 'oyunlarında' bilimsel ilerlemeyi nasıl ölçeceğini bulması gerekiyor."

/MetaHaberler.

Zaman Damgası:

Den fazla MetaHaberler