Nowa sztuczna inteligencja Meta znalazła się w gronie 10% najlepszych w grze „Dyplomacja” — a gracze-ludzie nie byli mądrzejsi od inteligencji danych PlatoBlockchain. Wyszukiwanie pionowe. AI.

Nowa sztuczna inteligencja Meta znalazła się wśród 10% najlepszych w grze „Dyplomacja” — a ludzie nie byli mądrzejsi

Sztuczna inteligencja opanowała niektóre z większości złożone gry znany człowiekowi, ale chociaż często przoduje w rywalizacji, współpraca nie przychodzi tak naturalnie. Teraz sztuczna inteligencja z Meta opanowała grę Dyplomacja, która wymaga współpracy z innymi graczami, aby wygrać.

Mistrzostwo Google w gra w Go został okrzyknięty kamieniem milowym dla sztucznej inteligencji, ale pomimo swojej niezaprzeczalnej złożoności, pod wieloma względami dobrze pasuje do zimnej, kalkulującej logiki maszyny. To gra z doskonałą informacją, w której masz pełny wgląd w ruchy przeciwnika, a wygrana oznacza po prostu przechytrzenie jednego innego gracza.

Z drugiej strony dyplomacja to znacznie bardziej chaotyczna sprawa. W grze planszowej bierze udział do siedmiu graczy koniec Europejskie potęgi militarne i użyj ich armii do przejęcia kontroli nad strategicznymi miastami. Ale gracze mogą negocjować ze sobą, aby tworzyć i zrywać sojusze w dążeniu do całkowitej dominacji.

Co więcej, ruchy wszystkich graczy wykonywane są jednocześnie w każdej turze, więc nie możesz po prostu reagować na to, co robią inni. Oznacza to, że wygrywanie gier wymaga złożonego połączenia strategicznego myślenia, umiejętności współpracy z innymi graczami oraz perswazyjnych umiejętności negocjacyjnych. Podczas gdy sztuczna inteligencja opanowała już czystą strategię, te inne umiejętności okazały się znacznie trudniejsze do powielenia.

Nowa sztuczna inteligencja zaprojektowana przez naukowców z Meta mogła jednak zrobić duży krok w tym kierunku. W artykuł opublikowany zeszły tydzień in nauka, opisują system o nazwie Cicero, który znalazł się wśród 10 procent najlepszych graczy w internetowej lidze Diplomacy i osiągnął ponad dwukrotnie wyższy średni wynik niż ludzie.

"Cicero jest odporny, bezwzględny i cierpliwy” — trzykrotny mistrz świata w dziedzinie dyplomacji, Andrew Goff, said w wideo wyprodukowane przez Meta. „Gra bez wielu ludzkich emocji, które czasami powodują, że podejmujesz złe decyzje. Po prostu ocenia sytuację i podejmuje najlepszą decyzję, nie tylko dla siebie, ale także dla ludzi, z którymi pracuje”.

Stworzenie Cicero wymagało od badaczy Meta połączenia najnowocześniejszych metod sztucznej inteligencji z dwóch różnych poddziedzin: rozumowania strategicznego i przetwarzania języka naturalnego. W sercu systemu znajduje się algorytm planowania, który przewiduje ruchy innych graczy i wykorzystuje to do określenia własnej strategii. Algorytm ten został przeszkolony, zmuszając sztuczną inteligencję do grania w kółko, jednocześnie starając się naśladować sposób, w jaki ludzie grają w tę grę.

Badacze wykazali już, że sam ten moduł planowania jest w stanie to zrobić pokonać ludzkich zawodowców w uproszczonej wersji gry. Jednak w ramach ostatnich badań zespół połączył to z dużym modelem językowym wytrenowanym na ogromnych ilościach tekstu z Internetu, a następnie dopracowanym za pomocą dialogów z 40,000 XNUMX gier online w Dyplomację. Dało to ulepszonemu Cyceronowi możliwość interpretowania wiadomości od innych graczy i również tworzyć własne wiadomości przekonać ich do współpracy.

Połączony system rozpoczyna się od wykorzystania aktualnego stanu planszy i wcześniejszych dialogów, aby przewidzieć, co każdy gracz prawdopodobnie zrobi. Następnie opracowuje plan działania zarówno dla siebie, jak i dla swoich partnerów, zanim wygeneruje wiadomości mające na celu nakreślenie jego zamiarów i zapewnienie współpracy innych graczy.

W ponad 40 grach w turnieju online Cicero skutecznie komunikował się z 82 innymi graczami, aby wyjaśniać swoje zamiary, koordynować działania i negocjować sojusze. Co najważniejsze, naukowcy twierdzą, że nie widzieli żadnych dowodów z wiadomości w grze, które wskazywałyby, że ludzie podejrzewali, że współpracują z sztuczną inteligencją.

Jednak zdolności komunikacyjne modelki nie były bez zarzutu. Jest więcej niż zdolny do wypluwania bezsensownych wiadomości lub niezgodnych z jego celami, więc badacze musieli generować wiele potencjalnych wiadomości przy każdym ruchu, a następnie używać różnych mechanizmów filtrujących, aby usunąć śmieci. Nawet wtedy badacze przyznają, że nielogiczne komunikaty czasami się wymykająped przez.

Sugeruje to, że model językowy leżący u podstaw Cycerona nadal tak naprawdę nie rozumie, co się dzieje, i po prostu generuje wiarygodnie brzmiące komunikaty, które następnie należy zweryfikować, aby upewnić się, że osiągnęły pożądane rezultaty.

Pisanie w Konwersacje, Badacz sztucznej inteligencji Toby Walsh z University of New South Wales w Australii również zauważa, że ​​Cicero jest nieomylnie uczciwy, w przeciwieństwie do większości ludzkich graczy. Chociaż jest to zaskakująco skuteczna strategia, może okazać się poważną słabością, jeśli konkurenci zorientują się, że ich przeciwnik nigdy nie będzie próbował ich oszukać.

Postęp jest jednak znaczący, a Facebook ma nadzieję, że może mieć zastosowania daleko poza grami planszowymi. W poście na blogu, naukowcy twierdzą, że możliwość wykorzystania algorytmów planowania do kontrolowania generowania języka może umożliwić prowadzenie znacznie dłuższych i bogatszych rozmów z chatbotami AI lub tworzenie postaci z gier wideo, które mogą dostosować się do zachowania gracza.

Kredytowych Image: MabelAmber / 4008 zdjęć

Znak czasu:

Więcej z Centrum osobliwości