Новий штучний інтелект від Meta увійшов до 10% найкращих у грі «Дипломатія», а люди-гравці не виявилися мудрішими PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Новий штучний інтелект від Meta увійшов до 10% найкращих у грі «Дипломатія» — і гравці-люди не були мудрішими

ШІ освоїв деякі з них складні ігри відомий людині, але хоча він часто перевершує конкуренцію, співпраця не є природною. Тепер штучний інтелект від Meta опанував гру Diplomacy, яка вимагає від вас працювати з іншими гравцями, щоб перемогти.

Майстерність Google у гра Go був визнаний важливою віхою для ШІ, але, незважаючи на його незаперечну складність, він багато в чому добре підходить для холодної, обчислювальної логіки машини. Це гра з ідеальною інформацією, де ви повністю бачите рухи свого суперника, а виграти просто означає можливість перевершити іншого гравця.

Дипломатія, з іншого боку, набагато складніша справа. У настільній грі беруть участь до семи гравців над європейських військових держав і використовувати їх армії, щоб взяти під контроль стратегічні міста. Але гравцям дозволено вести переговори один з одним, щоб створювати та розривати союзи в гонитві за повним пануванням.

Більше того, усі ходи гравців виконуються одночасно на кожному ході, тому ви не можете просто реагувати на дії інших. Це означає, що перемога в іграх вимагає складного поєднання стратегічного мислення, здатності співпрацювати з іншими гравцями та навичок переконливого ведення переговорів. Хоча ШІ вже опанував чисту стратегію, інші навички виявилося набагато складнішими для повторення.

Проте новий штучний інтелект, розроблений дослідниками Meta, міг зробити великий крок у цьому напрямку. В опубліковано папір минулого тижня in наука, вони описують систему під назвою Cicero, яка потрапила до 10 відсотків найкращих гравців у онлайн-лізі Дипломатії та досягла більш ніж подвійного середнього балу серед гравців-людей.

"Цицерон витривалий, безжальний і терплячий», – сказав тричі чемпіон світу з дипломатії Ендрю Гофф.id В відео виробництва Meta. «Це гра без великої кількості людських емоцій, які іноді змушують вас приймати неправильні рішення. Він просто оцінює ситуацію та приймає найкраще рішення не лише для себе, але й для людей, з якими працює».

Створення Цицерона вимагало від дослідників Meta поєднання найсучасніших методів штучного інтелекту з двох різних підсфер: стратегічного мислення та обробки природної мови. У своїй основі система має алгоритм планування, який передбачає дії інших гравців і використовує це для визначення власної стратегії. Цей алгоритм було навчено, змушуючи ШІ грати сам себе знову і знову, а також намагаючись імітувати те, як люди грають у гру.

Дослідники вже показали, що тільки цей модуль планування здатний бити людських профі у спрощеній версії гри. Але в цьому останньому дослідженні команда поєднала його з великою мовною моделлю, навченою на величезній кількості тексту з Інтернету, а потім налаштованою за допомогою діалогів із 40,000 XNUMX онлайн-ігор Diplomacy. Це дало оновленому Цицерону можливість інтерпретувати повідомлення від інших гравців та також створювати свої власні повідомлення щоб переконати їх працювати разом.

Комбінована система починає використовувати поточний стан дошки та минулі діалоги, щоб передбачити, що, ймовірно, зробить кожен гравець. Потім він складає план дій як для себе, так і для своїх партнерів, перш ніж генерувати повідомлення, призначені для окреслення його намірів і забезпечення співпраці інших гравців.

У понад 40 іграх онлайн-турніру Cicero ефективно спілкувався з 82 іншими гравцями, щоб пояснити свої наміри, координувати дії та домовитися про союзи. Важливо те, що дослідники кажуть, що вони не бачать жодних доказів у повідомленнях у грі про те, що гравці підозрюють, що вони об’єднуються з ШІ.

Однак комунікативні здібності моделі не були бездоганними. Він більш ніж здатний викидати безглузді повідомлення або повідомлення, які не відповідають його цілям, тому дослідникам довелося генерувати кілька повідомлень-кандидатів під час кожного руху, а потім використовувати різні механізми фільтрації, щоб відсіяти сміття. І навіть тоді дослідники визнають, що нелогічні повідомлення іноді прослизаютьпед до кінця.

Це свідчить про те, що мовна модель, яка лежить в основі Цицерона, досі насправді не розуміє, що відбувається, і просто створює правдоподібні повідомлення, які потім потрібно перевірити, щоб переконатися, що вони досягають бажаних результатів.

Введення в Бесіда, Дослідник ШІ Тобі Уолш з Університету Нового Південного Уельсу в Австралії також зазначає, що Цицерон безпомилково чесний, на відміну від більшості гравців-людей. Хоча це напрочуд ефективна стратегія, вона може стати серйозною слабкістю, якщо конкуренти здогадаються, що їхній опонент ніколи не намагатиметься їх обдурити.

Тим не менш, прогрес є значним, і Facebook сподівається, що він може мати програми далеко за межами настільних ігор. У блозі, дослідники кажуть, що можливість використовувати алгоритми планування для керування генерацією мови може зробити можливим вести набагато довші та насиченіші розмови з чат-ботами ШІ або створювати персонажів відеоігор, які можуть адаптуватися до поведінки гравця.

Зображення Фото: MabelAmber / 4008 зображень

Часова мітка:

Більше від Хаб сингулярності