Metas neue KI rangierte beim Spiel „Diplomacy“ unter den besten 10 % – und menschliche Spieler waren nicht so klüger wie PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Metas neue KI unter den Top 10 % beim Spiel „Diplomacy“ – und menschliche Spieler waren nicht klüger

KI hat einige der am meisten gemeistert komplexe Spiele Menschen bekannt, aber obwohl es sich oft im Wettbewerb auszeichnet, ist Zusammenarbeit nicht so selbstverständlich. Jetzt hat eine KI von Meta das Spiel Diplomatie gemeistert, bei dem Sie mit anderen Spielern zusammenarbeiten müssen, um zu gewinnen.

Googles Beherrschung der Spiel von Go wurde als wichtiger Meilenstein für KI gefeiert, aber trotz seiner unbestreitbaren Komplexität ist es in vielerlei Hinsicht gut für die kalte, berechnende Logik einer Maschine geeignet. Es ist ein Spiel der perfekten Informationen, bei dem Sie die Züge Ihres Gegners vollständig sehen können, und gewinnen bedeutet einfach, einen anderen Spieler überlisten zu können.

Diplomatie hingegen ist eine viel chaotischere Angelegenheit. Bei dem Brettspiel nehmen bis zu sieben Spieler teil übrig Europäische Militärmächte und nutzen ihre Armeen, um die Kontrolle über strategische Städte zu übernehmen. Aber die Spieler dürfen miteinander verhandeln, um Allianzen zu bilden und zu brechen, um die totale Vorherrschaft zu erlangen.

Darüber hinaus werden die Züge aller Spieler in jeder Runde gleichzeitig ausgeführt, sodass Sie nicht einfach auf das reagieren können, was andere tun. Das bedeutet, dass das Gewinnen von Spielen eine komplexe Kombination aus strategischem Denken, der Fähigkeit zur Zusammenarbeit mit anderen Spielern und überzeugendem Verhandlungsgeschick erfordert. Während die KI die reine Strategie bereits gemeistert hat, haben sich diese anderen Fähigkeiten als viel schwieriger zu replizieren erwiesen.

Eine neue KI, die von Forschern bei Meta entwickelt wurde, könnte jedoch einen großen Schritt in diese Richtung gemacht haben. In einem Papier veröffentlicht letzte Woche in Wissenschaft, Sie beschreiben ein System namens Cicero, das zu den besten 10 Prozent der Spieler in einer Online-Diplomatie-Liga gehörte und mehr als das Doppelte der durchschnittlichen Punktzahl der menschlichen Spieler erreichte.

"Cicero ist belastbar, rücksichtslos und geduldig“, sagt der dreimalige Diplomatie-Weltmeister Andrew Goffid in einem Video produziert von Meta. „Es spielt ohne viel menschliche Emotion, die dich manchmal dazu bringt, schlechte Entscheidungen zu treffen. Es bewertet einfach die Situation und trifft die beste Entscheidung, nicht nur für sich selbst, sondern auch für die Menschen, mit denen es arbeitet.“

Um Cicero zu erschaffen, mussten Meta-Forscher modernste KI-Methoden aus zwei verschiedenen Teilbereichen kombinieren: strategisches Denken und Verarbeitung natürlicher Sprache. Das Herzstück des Systems ist ein Planungsalgorithmus, der die Züge anderer Spieler vorhersagt und daraus seine eigene Strategie bestimmt. Dieser Algorithmus wurde trainiert, indem die KI dazu gebracht wurde, sich immer wieder selbst zu spielen, während sie gleichzeitig versuchte, die Art und Weise nachzuahmen, wie Menschen das Spiel spielen.

Dass allein dieses Planungsmodul dazu in der Lage ist, hatten die Forscher bereits gezeigt menschliche Profis schlagen in einer vereinfachten Version des Spiels. Aber in dieser neuesten Forschung kombinierte das Team es mit einem großen Sprachmodell, das mit riesigen Textmengen aus dem Internet trainiert und dann mit Dialogen aus 40,000 Online-Spielen von Diplomacy verfeinert wurde. Dies gab dem aktualisierten Cicero die Möglichkeit, Nachrichten von anderen Spielern zu interpretieren und auch selber basteln Nachrichten um sie zur Zusammenarbeit zu überreden.

Das kombinierte System beginnt mit der Verwendung des aktuellen Zustands des Bretts und vergangener Dialoge, um vorherzusagen, was jeder Spieler wahrscheinlich tun wird. Anschließend erstellt es einen Aktionsplan für sich und seine Partner, bevor es Nachrichten generiert, die seine Absicht skizzieren und die Zusammenarbeit anderer Akteure sicherstellen sollen.

In über 40 Spielen des Online-Turniers kommunizierte Cicero effektiv mit 82 anderen Spielern, um seine Absichten zu erklären, Aktionen zu koordinieren und Allianzen auszuhandeln. Entscheidend ist, dass die Forscher sagen, dass sie in den Nachrichten im Spiel keine Beweise dafür gesehen haben, dass menschliche Spieler vermuteten, dass sie sich mit einer KI zusammenschließen.

Die kommunikativen Fähigkeiten des Models waren jedoch nicht tadellos. Es ist mehr als in der Lage, unsinnige oder mit seinen Zielen unvereinbare Nachrichten auszuspucken, sodass die Forscher bei jedem Zug mehrere Kandidatennachrichten generieren und dann verschiedene Filtermechanismen verwenden mussten, um den Müll auszusortieren. Und selbst dann räumen die Forscher ein, dass manchmal unlogische Botschaften untergehenped durch.

Dies deutet darauf hin, dass das Sprachmodell im Herzen von Cicero immer noch nicht wirklich versteht, was vor sich geht, und einfach plausibel klingende Nachrichten produziert, die dann überprüft werden müssen, um sicherzustellen, dass sie die gewünschten Ergebnisse erzielen.

Schreiben in Das Gespräch, Der KI-Forscher Toby Walsh von der University of New South Wales in Australien stellt außerdem fest, dass Cicero im Gegensatz zu den meisten menschlichen Spielern untrüglich ehrlich ist. Obwohl dies eine überraschend effektive Strategie ist, könnte es eine große Schwäche sein, wenn Konkurrenten herausfinden, dass ihr Gegner niemals versuchen wird, sie zu täuschen.

Der Fortschritt ist dennoch beträchtlich, und Facebook hofft, dass es weit über Brettspiele hinaus Anwendung finden könnte. In einem Blogbeitrag, sagen die Forscher, dass die Fähigkeit, Planungsalgorithmen zur Steuerung der Spracherzeugung zu verwenden, es ermöglichen könnte, viel längere und reichhaltigere Gespräche mit KI-Chatbots zu führen oder Videospielfiguren zu erstellen, die sich an das Verhalten eines Spielers anpassen können.

Bild-Kredit: MabelAmber / 4008 Bilder

Zeitstempel:

Mehr von Singularity Hub