Новий штучний інтелект від Meta увійшов до 10% найкращих у грі «Diplomacy»

Перевидано Платоном

читають: 0

ШІ освоїв деякі з них складні ігри відомий людині, але хоча він часто перевершує конкуренцію, співпраця не є природною. Тепер штучний інтелект від Meta опанував гру Diplomacy, яка вимагає від вас працювати з іншими гравцями, щоб перемогти.

Майстерність Google у гра Go був визнаний важливою віхою для ШІ, але, незважаючи на його незаперечну складність, він багато в чому добре підходить для холодної, обчислювальної логіки машини. Це гра з ідеальною інформацією, де ви повністю бачите рухи свого суперника, а виграти просто означає можливість перевершити іншого гравця.

Дипломатія, з іншого боку, набагато складніша справа. У настільній грі беруть участь до семи гравців над європейських військових держав і використовувати їх армії, щоб взяти під контроль стратегічні міста. Але гравцям дозволено вести переговори один з одним, щоб створювати та розривати союзи в гонитві за повним пануванням.

Більше того, усі ходи гравців виконуються одночасно на кожному ході, тому ви не можете просто реагувати на дії інших. Це означає, що перемога в іграх вимагає складного поєднання стратегічного мислення, здатності співпрацювати з іншими гравцями та навичок переконливого ведення переговорів. Хоча ШІ вже опанував чисту стратегію, інші навички виявилося набагато складнішими для повторення.

Проте новий штучний інтелект, розроблений дослідниками Meta, міг зробити великий крок у цьому напрямку. В опубліковано папір минулого тижня in наука, вони описують систему під назвою Cicero, яка потрапила до 10 відсотків найкращих гравців у онлайн-лізі Дипломатії та досягла більш ніж подвійного середнього балу серед гравців-людей.

"Цицерон витривалий, безжальний і терплячий», – сказав тричі чемпіон світу з дипломатії Ендрю Гофф.id В відео виробництва Meta. «Це гра без великої кількості людських емоцій, які іноді змушують вас приймати неправильні рішення. Він просто оцінює ситуацію та приймає найкраще рішення не лише для себе, але й для людей, з якими працює».

Створення Цицерона вимагало від дослідників Meta поєднання найсучасніших методів штучного інтелекту з двох різних підсфер: стратегічного мислення та обробки природної мови. У своїй основі система має алгоритм планування, який передбачає дії інших гравців і використовує це для визначення власної стратегії. Цей алгоритм було навчено, змушуючи ШІ грати сам себе знову і знову, а також намагаючись імітувати те, як люди грають у гру.

Дослідники вже показали, що тільки цей модуль планування здатний бити людських профі у спрощеній версії гри. Але в цьому останньому дослідженні команда поєднала його з великою мовною моделлю, навченою на величезній кількості тексту з Інтернету, а потім налаштованою за допомогою діалогів із 40,000 XNUMX онлайн-ігор Diplomacy. Це дало оновленому Цицерону можливість інтерпретувати повідомлення від інших гравців та також створювати свої власні повідомлення щоб переконати їх працювати разом.

Комбінована система починає використовувати поточний стан дошки та минулі діалоги, щоб передбачити, що, ймовірно, зробить кожен гравець. Потім він складає план дій як для себе, так і для своїх партнерів, перш ніж генерувати повідомлення, призначені для окреслення його намірів і забезпечення співпраці інших гравців.

У понад 40 іграх онлайн-турніру Cicero ефективно спілкувався з 82 іншими гравцями, щоб пояснити свої наміри, координувати дії та домовитися про союзи. Важливо те, що дослідники кажуть, що вони не бачать жодних доказів у повідомленнях у грі про те, що гравці підозрюють, що вони об’єднуються з ШІ.

Однак комунікативні здібності моделі не були бездоганними. Він більш ніж здатний викидати безглузді повідомлення або повідомлення, які не відповідають його цілям, тому дослідникам довелося генерувати кілька повідомлень-кандидатів під час кожного руху, а потім використовувати різні механізми фільтрації, щоб відсіяти сміття. І навіть тоді дослідники визнають, що нелогічні повідомлення іноді прослизаютьпед до кінця.

Це свідчить про те, що мовна модель, яка лежить в основі Цицерона, досі насправді не розуміє, що відбувається, і просто створює правдоподібні повідомлення, які потім потрібно перевірити, щоб переконатися, що вони досягають бажаних результатів.

Введення в Бесіда, Дослідник ШІ Тобі Уолш з Університету Нового Південного Уельсу в Австралії також зазначає, що Цицерон безпомилково чесний, на відміну від більшості гравців-людей. Хоча це напрочуд ефективна стратегія, вона може стати серйозною слабкістю, якщо конкуренти здогадаються, що їхній опонент ніколи не намагатиметься їх обдурити.

Тим не менш, прогрес є значним, і Facebook сподівається, що він може мати програми далеко за межами настільних ігор. У блозі, дослідники кажуть, що можливість використовувати алгоритми планування для керування генерацією мови може зробити можливим вести набагато довші та насиченіші розмови з чат-ботами ШІ або створювати персонажів відеоігор, які можуть адаптуватися до поведінки гравця.

Зображення Фото: MabelAmber / 4008 зображень

Часова мітка: Листопад 28, 2022Листопад 28, 2022

Часова мітка: Листопад 4, 2023

Новий штучний інтелект від Meta увійшов до 10% найкращих у грі «Дипломатія» — і гравці-люди не були мудрішими

Перевидано Платоном

Більше від Хаб сингулярності

Автономні вантажівки будуть курсувати автомагістралями наступного року, повідомляє стартап

Спільнота будинків, надрукованих на 3D, будується для тих, хто пережив лісову пожежу в Орегоні

Ця плаваюча вітротурбіна «піраміда» вироблятиме більше енергії за нижчою ціною, каже компанія

Чудові технічні історії цього тижня з усього Інтернету (до 6 серпня)

Чудові технічні історії цього тижня з усього Інтернету (до 2 липня)

Арифметика має біологічне походження — це вираження в символах «глибинної структури» нашого сприйняття

Філе справжньої риби було надруковано на 3D з клітин, вирощених у лабораторії

Свині з клітинами людського мозку та біологічними чіпами: як вирощені в лабораторії гібридні форми життя вводять в оману наукову етику

Чудові технічні історії цього тижня з Інтернету (до 4 листопада)

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки