Matematyka stojąca za Wordle’em odgaduje inteligencję danych PlatoBlockchain. Wyszukiwanie pionowe. AI.

Matematyka stojąca za domysłami Wordle'a

Wprowadzenie

W prostej grze Wordle gracze muszą odgadnąć tajne pięcioliterowe słowo w sześciu lub mniej turach na podstawie wskazówek dotyczących obecności i lokalizacji liter ujawnionych przez ich poprzednie odgadnięcia. Chociaż w przeszłości pojawiały się podobne gry, każdy, kto gra w Wordle w danym dniu, musi odkryć to samo tajne słowo, co ułatwia dzielenie się swoimi próbami i dyskutowanie o grze wśród znajomych. Charakterystyczna struktura i sposób prezentacji gry zainspirowały pytania w naszym najnowszym artykule Zagadka spostrzeżeń. Odpowiedzi omówiono poniżej.

Jednym z kluczy do dobrej gry Wordle jest wybranie mocnego słowa początkowego. Wcielenie analiz komputerowych techniki teorii informacji zasugeruj, że początkowe słowa, takie jak „łupek” i „żuraw”, umożliwiają tobie (lub w każdym razie algorytmowi komputerowemu) rozwiązanie Wordles średnio w najmniejszej liczbie tur. Jednak wielu rozwiązujących ludzi czuje się bardziej komfortowo, wybierając słowo bogate w samogłoski, takie jak „adieu”, „audio” lub „raise”. To uczucie ma zarówno intuicyjne, jak i racjonalne podstawy. Po pierwsze, umieszczone samogłoski umożliwiają znalezienie „kręgosłupa” samogłoski, który może ograniczyć liczbę spółgłosek, których trzeba szukać. Na przykład, jeśli wiesz, że słowo wygląda jak _AI_E po zagraniu „podbij”, pozostało tylko kilka możliwych słów: „naiwny”, „zrezygnować” i „kukurydza”. Po drugie, samogłoski maksymalizują ilość, którą można nazwać „pokryciem” — między zaledwie pięcioma samogłoskami a Y możemy uzyskać co najmniej jedną pozytywną literę w każdej z 2,309 odpowiedzi. Aby uzyskać tego rodzaju doskonałe pokrycie spółgłoskami, musiałbyś wypróbować wszystkie 20 z nich, co wymagałoby co najmniej pięciu tur.

Nasza pierwsza łamigłówka rzuciła czytelnikom wyzwanie, aby dowiedzieć się, które z tych trzech słów bogatych w samogłoski jest najlepszym pierwszym odgadnięciem.

Łamigłówka 1 

Poniższa tabela przedstawia częstotliwość, z jaką osiem liter w słowach „adieu”, „audio” i „raise” pojawia się na każdej pozycji na całej liście odpowiedzi Wordle, składającej się z 2,309 słów. Opierając się na tej tabeli, określ, ilu zielonych i żółtych odpowiedzi możesz się spodziewać na całej liście odpowiedzi Wordle dla każdego z trzech początkowych słów bogatych w samogłoski: „adieu”, „audio” i „raise”. (W Wordle litera jest wyświetlana na zielonym tle, jeśli znajduje się we właściwym miejscu, i na żółtym tle, jeśli znajduje się w słowie, ale w niewłaściwym miejscu). Co to mówi o ich oczekiwanej wydajności jako słów początkowych? ?

Czytelnik Roba Corletta pokazał, jak obliczyć liczbę oczekiwanych zielonych i żółtych z tej tabeli. Dla „adieu” A jest poprawną pierwszą literą dla 140 słów, D jest poprawną drugą literą dla 20 słów i tak dalej. Całkowita liczba zielonych we wszystkich możliwych odpowiedziach Wordle jest ich sumą. Zatem „adieu” daje w sumie 140 + 20 + 266 + 318 + 1 = 745 greensów. W przypadku żółtych musimy zacząć od tego, ile razy dana litera występuje co najmniej raz w słowie (906 dla A w „adieu”) i odjąć liczbę razy, gdy jest zielona (140), aby uzyskać liczbę żółtych (766) . Dodaj liczby dla każdej litery w słowie, aby uzyskać całkowitą liczbę żółtych. Możemy podzielić te liczby przez całkowitą liczbę odpowiedzi (2,309), aby uzyskać oczekiwaną liczbę zielonych i żółtych w jednej turze, ale ponieważ ten krok jest wspólny dla wszystkich naszych początkowych słów, możemy po prostu pracować z sumami, aby porównać trzy z nich. Ponieważ wybraliśmy te słowa specjalnie do znalezienia rdzenia samogłoski, możemy również obliczyć, ile zielonych pochodzi z samogłosek. Oto wyniki.

Jak widać nie ma porównania! „Podnieś” przewyższa „adieu” pod każdym względem, dając więcej zieleni i żółci oraz więcej samogłosek we właściwych miejscach, nie mówiąc już o tym, że wyłapujesz lub wykluczasz również dwie najczęstsze spółgłoski. „Audio” jest odległą trzecią pod względem wszystkich tych miar. Zauważ, że chociaż możesz uzyskać informacje o tym, które litery są nieobecne, nawet jeśli nie dostaniesz żadnych żółtych ani zielonych, jako czytelnik Maks Davies zauważyłeś, z pewnością uzyskasz więcej informacji, gdy uzyskasz jeden lub więcej żółtych i zielonych. Tak więc, użytkownicy „adieu”, być może nadszedł czas, aby powiedzieć adieu.

Pytanie 1

To było pytanie o to, jak bardzo powinniśmy cenić zielenie w stosunku do żółci: Ile żółci jest równych jednej zieleni? Jasny charakter naszych wyników powyżej eliminuje potrzebę odpowiedzi na to pytanie dla powyższego porównania, ale jest to interesujące pytanie. Ta wycena ma dwa aspekty. Pierwszym z nich jest aspekt ludzki: Jaką wagę przywiązujesz do wysiłku umysłowego potrzebnego do wymyślenia wszystkich różnych sposobów umieszczenia żółtej litery? Nie da się zaprzeczyć, że spożywanie dużej ilości greensów ułatwia życie i daje nam większy zastrzyk dopaminy. Z punktu widzenia teorii informacji musiałbyś przejrzeć każde słowo początkowe dla każdego słowa odpowiedzi i porównać, ile tur zajęłoby rozwiązanie zagadki, gdy te same litery były zielone, z tym, kiedy były żółte w każdym przypadku.

Chociaż jest to ogromne zadanie, udało mi się to zrobić dla najlepszego możliwego komputerowego słowa startowego (niejasne słowo „tarse”, które oznacza samca sokoła, którego pełne drzewo optymalnych rozwiązań zostało umieszczone w Internecie przez matematyka Alexa Selby'ego). Odpowiedź jest zaskakująca. Średnia liczba tur wymaganych dla rozwiązania komputerowego wykorzystującego słowo odpowiedzi, które w pierwszej turze dawało tylko zielone, wyniosła 3.34, podczas gdy liczba tur wymaganych, gdy były tylko żółte litery, wyniosła 3.51, co oznacza zaledwie 5% wzrost! Najwyraźniej dla algorytmu komputerowego umieszczenie żółtych liter, które nam, ludziom, wydaje się tak onieśmielające, można osiągnąć bez zbytniej kary. Domyślam się, że różnica byłaby większa dla człowieka rozwiązującego nie tylko liczbę wymaganych tur, ale także wysiłek umysłowy i czas potrzebny do rozwiązania.

Łamigłówka 2

A) Jeśli w pierwszej turze zdobędziesz wszystkie pięć żółtych, jaka jest maksymalna liczba tur, jakie może zająć znalezienie odpowiedzi, zakładając najlepszą grę?

As Roba Corletta i Sama Rhoadsa poprawnie sformułowana, teoretyczna odpowiedź to pięć: w pełni żółta kombinacja liter, taka jak ABCDE, mogłaby opierać się odkryciu przez kolejne cztery tury, ponieważ być może będziesz musiał przejrzeć BCDEA, CDEAB i DEABC, zanim odkryjesz, że odpowiedzią jest EABCD. W praktyce jednak takie cykliczne „słowa” nie są możliwe właśnie dlatego, że prawdziwe słowa mają zdefiniowane wzorce samogłosek i spółgłosek, których nie można dowolnie rozciągać. Nawet słowa z wieloma anagramami można rozwiązać w nie więcej niż trzech próbach, jak zademonstrował Rob Corlett za pomocą „analizy”.

B) Czy zdarza się, że żółknięcie litery w określonej pozycji jest bardziej wartościowe niż patrzenie, jak zmienia kolor na zielony? Jeśli tak, czy możesz podać przykład i wyjaśnić, dlaczego tak powinno być?

Tak, litera pojawiająca się na żółto może w rzadkich przypadkach być cenniejsza niż ta sama litera pojawiająca się na zielono, jeśli jest to litera, która rzadko pojawia się na innych pozycjach. Często dzieje się tak z Y, które w przeważającej mierze znajduje się na końcu słowa. Załóżmy, że zaczynasz od „brzuch”, a zarówno B, jak i Y wychodzą na zielono. Masz wiele możliwości: „baggy”, „mały”, „bobby”, „boot”, „krzaczasty” itp. Ale jeśli zarówno B, jak i Y wypadną na żółto, jest tylko jedna możliwość: „otchłań”.

Pytanie 2

Czy osoba z dobrym słownictwem niejasnych słów w Scrabble ma przewagę lub wadę w graniu w Wordle?

Jako były gracz turniejowy Scrabble, który spędził kilka godzin na zapamiętywaniu niejasnych słów, myślę, że jest to zarówno zaleta, jak i wada. Kiedy po raz pierwszy zacząłem grać w Wordle, często widziałem możliwość i próbowałem wykluczyć nietypowe słowa, które, jak później zdałem sobie sprawę, prawie nie miały szansy być poprawne. (W terminologii golfowej, której często używa moja grupa Wordle, określamy to jako utrudnienie przez wyimaginowane zagrożenie). dla wszystkich rodzimych użytkowników języka angielskiego w USA. Nawet słowa, które są dość rzadkie, ale nie są niejasne, nie znajdują się na liście odpowiedzi Wordle. Na przykład niedawno zmarnowałem kolejkę, grając w „lateks”, dość popularne słowo, które okazuje się nie być możliwą odpowiedzią Wordle. Tak więc, podobnie jak wszyscy gracze Wordle, musiałem zbudować umysłowy model słowa, które mogłoby być odpowiedzią Wordle, i specjalnie ignorować rodzaje rzadkich i niejasnych słów, których chętnie użyłbym, aby zdobyć więcej punktów w Scrabble. Z drugiej strony znajomość tych rzadkich słów przydaje się w „zamiataniu spółgłosek”, co czasami trzeba zrobić, aby uniknąć spędzenia wielu tur na odgadywaniu kilku podobnych słów jeden po drugim. Na przykład, jeśli masz _RA_E i patrzysz na kilka możliwych słów zawierających D, G i K, takich jak „hamulec”, „kaczor”, „drape”, „stopień” i „winogrono”, warto wiedzieć i zagraj w słowo „kedge”, co może zagwarantować znalezienie rozwiązania w ciągu dwóch kolejnych tur (kedge oznacza przemieszczenie statku przez rzucenie kotwicy na odległość, a następnie pociągnięcie go mocną liną).

Codzienne rozwiązywanie tej samej układanki Wordle, co wszyscy inni, zachęca do zabawy towarzyskiej. Ale w internecie pełno jest spoilerów i to wiadomo niektórzy oszukują w raportowaniu swoich wyników. Następna łamigłówka dotyczy kwestii, kiedy podejrzenia o oszukiwanie w grupie Wordle są uzasadnione wyłącznie na podstawie nieprawdopodobieństwa wyniku danej osoby. Ponownie, ta łamigłówka jest ujęta w kategoriach punktacji golfowej: rozwiązanie Wordle w trzech turach jest określane jako birdie, zdobycie go w dwóch turach to orzeł, a zdobycie słowa w pierwszej turze jest oczywiście hole-in-one .)

Łamigłówka 3

Tradycyjnym naukowym kryterium do dalszych badań jest to, czy prawdopodobieństwo przypadkowego wystąpienia wyniku ( wartość alfa) wynosi mniej niż 5% lub mniej niż 1%, w zależności od celów naukowców. Wynik jest wówczas uważany za statystycznie istotny na poziomie 5% lub 1%. Ponieważ nie jest przyjemnie podejrzewać ludzi o oszustwo, kiedy tak nie jest, wybierzmy w tym dochodzeniu bardziej konserwatywny poziom 1%.

Załóżmy, że należysz do grupy Wordle składającej się z 10 graczy, którzy codziennie od 200 dni dzielą się między sobą wynikami. Załóżmy, że bardzo dobry gracz może spodziewać się ptaszka co 2.5 gry, orła co 40 gier i dziurki w jednym co 2,000 gier (co są rozsądnymi szacunkami w świecie rzeczywistym).

A) Ile ptaszków z rzędu miałoby znaczenie na poziomie 1% w twojej grupie w tym czasie?

B) Ile orłów z rzędu?

C) Ile dziur w jednym rzędzie?

Kluczem tutaj jest uświadomienie sobie, że populacja liczy 2,000 osób. Tak więc, aby osiągnąć ten poziom istotności, musiałbyś zobaczyć zdarzenie, które zdarza się rzadziej niż raz na 200,000 XNUMX gier osobowych wyłącznie przez przypadek.

A) Dobra passa birdie lub lepsza: prawdopodobieństwo trafienia birdie lub lepszej w jednej grze wynosi 2/5 + 1/40 + 1/2,000 = 0.4255, czyli 1 na około 2.35 gry. Nazwijmy to B. Najniższa moc B przekracza 200,000 XNUMX B15, czyli ponad 368,000 XNUMX (B14 wynosi około 157,000 tys.). Tak więc dobra passa wynosząca 15 lub więcej dla kogokolwiek w grupie spełniałaby to rygorystyczne kryterium, ale jedna z 14 nie. Jeśli podejrzewasz pojedynczego gracza, musiałbyś zobaczyć wydarzenie, które zdarza się rzadziej niż raz na 20,000 12 gier, co miałoby miejsce z passą 1,850 ptasich lub lepszych wyników. (Zauważ, że rzeczywista liczba okazji do posiadania serii te długości są nieco mniejsze: w rzeczywistości jest to 188 gier dla grupy i XNUMX gier dla pojedynczego gracza, ale w tym przypadku nie ma to znaczenia).

Należy pamiętać, że są to częstotliwości dla doświadczonych graczy, a podejrzane serie dla większości grup i osób byłyby mniejsze. Aby zastosować to kryterium w praktyce, musisz określić odpowiadające im częstotliwości birdie, eagle i hole-in-one, które widzisz, a także wziąć pod uwagę liczbę gier rozegranych w twojej grupie.

B) Smugi orła lub lepszego: prawdopodobieństwo wystąpienia orła lub lepszego wynosi 1/40 + 1/2,000 = 0.0255, czyli około 1 do 39.2. Długości smug, które przekraczają nasz poziom istotności, wynoszą 4 dla grupy i 3 dla podejrzanej osoby.

C) Smugi typu dziura w jednym: Długość smugi, która przekracza nasz poziom istotności, wynosi 2 zarówno dla grupy, jak i dla podejrzanego osobnika.

Istnieje zastrzeżenie co do dwóch ostatnich odpowiedzi: są to rzadkie zdarzenia, a wielkość próby jest bardzo mała, więc musisz być ostrożny. Większość statystyków na ogół czekałaby, aż zobaczyłaby co najmniej pięć lub więcej przypadków orłów lub dziur w jednym, niekoniecznie jako część serii, zanim uznałaby, że może zastosować test istotności.

Pytanie 3

Jest całkiem możliwe, że częstotliwość dobrych wyników w twojej grupie jest znacznie wyższa niż częstotliwość przewidywana przypadkowo, bez oszukiwania. Jak byś to wytłumaczył?

Jednym z możliwych powodów tego, jak Roba Corletta wyjaśnia, może być tak, że „wszyscy gracze skrupulatnie zapisują każdy wynik”. Jak wyjaśniłem we wstępie do łamigłówki 4, odpowiedzi Wordle nie będą powtarzane przez mniej więcej pięć lat w obecnej konfiguracji. Więc nawet jeśli nikt nie oszukuje ani nie zna wszystkich słów z listy odpowiedzi, ta informacja może pomóc każdej osobie lub grupie stopniowo osiągać lepsze wyniki.

Ale jest też inny powód: lista może nie być dobrze dobrana losowo. Grając w Wordle w ciągu ostatnich kilku miesięcy, zauważyłem, że ilekroć był wybór między dwoma lub więcej słowami, prostsze słowa były bardziej poprawne niż słowa mniej popularne. Na przykład, gdybyś miał A, N i E, a pozostałymi do wyboru byłyby słowa takie jak „skraść się”, „hiena” i „lewatywa”, mógłbyś bez wahania zagrać najprostsze słowo (w tym przypadku „skraść się”) i byłbyś poprawiać znacznie częściej, niż można by się spodziewać przez czysty przypadek. W rzeczywistości użyłem listy częstotliwości słów angielskiej prozy, aby sprawdzić, jak często odpowiedzi, z którymi się spotykałem w ciągu dwóch miesięcy, porównano ze średnim słowem na liście odpowiedzi Wordle. Odpowiedzi, które napotkałem, były o około 25% częstsze niż przeciętne słowo na liście odpowiedzi Wordle, a co ważniejsze, w przypadku najrzadszych słów na liście (dolne 10%) tylko jedna trzecia odpowiedzi pojawiła się jako przypuszczalna do. Orły zdarzały się z częstotliwością bliższą 1/20 niż 1/40 w oparciu o czysty przypadek. Wygląda więc na to, że sekwencja odpowiedzi Wordle'a nie jest dobrze losowana i albo jest naładowana prostszymi słowami, albo tak się składa, że ​​przechodzimy przez część listy, która składa się z prostszych słów.

Istotna ostatnia zmiana polega na tym The New York Times mianowany redaktorem Wordle zaprogramować słowo dnia począwszy od 7 listopada. Od tego czasu usuwanie trudnych lub obraźliwych słów z listy z presekwencjonowaną listą stało się bardziej powszechne, w tym zastępowanie, za kulisami, słów takich jak „ombre”, „wymiotować” i „ dupa." Choć rozumiem potrzebę tzw Czasy aby oczyścić i uprościć słowa Wordle, aby zapobiec oburzeniu milionów grających ludzi, sprawia, że ​​gra jest mniej losowa i o wiele bardziej przewidywalna. Jeszcze gorsza jest niefortunna tendencja redakcyjna w ciągu ostatnich kilku tygodni do wybierania słów pasujących do dnia, takich jak „uczta” w Święto Dziękczynienia i „medal” w Dzień Weteranów. Sprowadza się to do podania dodatkowej wskazówki na temat słowa jeszcze przed rozpoczęciem gry, ułatwiając układanie układanki i umniejszając jej bogate powiązanie z teorią informacji. Mam nadzieję, że to chwilowa aberracja, ponieważ losowość jest istotnym elementem tej gry. Większość ludzi, którzy przekazał informację zwrotną do The New York Times o tych wyborach redakcyjnych czułem się tak samo.

Nasza czwarta zagadka opierała się na fakcie, że przy obecnej architekturze rozwiązania Wordle nigdy się nie powtórzą, dopóki lista nie wyczerpie się po mniej więcej pięciu latach.

Łamigłówka 4

Pomyśl o osobie z doskonałą pamięcią przeszłych rozwiązań. Dla takiej osoby odpowiedź byłaby oczywista w ostatnim dniu listy 2,309 słów Wordle'a. Czy możesz szybko oszacować, ile dziur w jednym miejscu ta osoba spodziewałaby się pokonać w czasie trwania całej listy, bez wykonywania rzeczywistych obliczeń? Następnie, jeśli możesz, spróbuj wykonać rzeczywiste obliczenia.

Roba Corletta odpowiedział doskonale, logicznie oceniając odpowiedź na 8.25, a następnie obliczając odpowiedź na 8.32. Poniżej przytoczono kluczowe obliczenia Corletta. Możesz sprawdzić komentarz pod kątem doskonałej techniki szacowania.

Jeśli m słowa i zgadujesz, wtedy szanse na poprawne rozwiązanie wynoszą 1/m. Jeśli masz 1 słowo, szanse wynoszą 1/1, 2 słowa 1/2, 3 słowa 1/3 itd. Jeśli dodasz je do siebie, otrzymasz oczekiwaną liczbę dziur w jednym! …

[To] wymaga od nas obliczenia sumy odwrotności wszystkich liczb od 2309 do 1. Zrobiłem to w arkuszu kalkulacyjnym i okazało się, że suma wynosi 8.32, co jest zadowalająco bliskie moim szacunkom!

Nasze ostatnie pytanie dotyczyło tego, jak poprawić losowość słów w Wordle, zachowując jednocześnie jego projekt „po stronie klienta”. Zanim mianowano redaktora Wordle, nie było codziennego doboru losowego słów: słowa pochodziły z pobranej z góry listy, która nie była dobrze losowana, jak wspomniałem powyżej. Następnie na urządzeniu klienta (użytkownika) zostało wygenerowane słowo rozwiązania Wordle z listy słów w zależności od aktualnej daty, a cała zagadka została rozstrzygnięta również na urządzeniu użytkownika. Kod potrzebny do wykonania tego wszystkiego jest pobierany każdego dnia przy pierwszym połączeniu użytkownika z witryną. Użytkownik nie musi być później online.

Pytanie 4

Jak zaprojektowałbyś Wordle, aby zachował projekt po stronie klienta, zapewniając, że każdy otrzyma to samo słowo rozwiązania w danym dniu, ale losuje odpowiedzi w rozsądny sposób, bez konieczności codziennej zmiany kodu?

Było kilka dobrych odpowiedzi na pytanie o randomizację. Kilku czytelników zasugerowało użycie liczby pseudolosowej z predefiniowanym ziarnem do utworzenia indeksu na liście odpowiedzi Wordle. Mumintrolet napisał nawet program, który losowo tasuje pięć list odpowiedzi Wordle (trwających 32 lata), upewniając się, że żadne słowo nie powtórzy się w ciągu roku. Dla mnie najbardziej atrakcyjna procedura pochodziła z Ślepa Temida, który zasugerował, że losowe ziarno użyte do procedury randomizacji powinno być ostatnimi czterema cyframi liczby osób, które grały w grę w określonym czasie. (Ponieważ w Wordle można grać w dowolnym miejscu na świecie, musiałoby to odbywać się w strefach czasowych nad wschodnim Pacyfikiem, zaczynając od międzynarodowej linii zmiany daty!) Wspaniałe w tym jest to, że nikt, nawet New York Times Edytor Wordle wiedziałby, jakie to słowo było dzień przed jego użyciem.

Żaden z tych mechanizmów nie może być całkowicie wykonany po stronie klienta, ponieważ Tima Rossa wskazany. Następne słowo musiałby wygenerować serwer, a to słowo lub jego numer indeksu musiałby zostać pobrany, być może w postaci zaszyfrowanej wraz z resztą kodu. Jak zauważył Ross, obecnie 2,309 słów odpowiedzi jest wyraźnie widocznych w kolejności dat w kodzie źródłowym, co może ujawnić każda przeglądarka. Jednym ze sposobów może być zaszyfrowanie listy słów odpowiedzi i zapisanie jej w kolejności alfabetycznej, a nie według daty.

Chociaż sugerowane ulepszenia losowości pomogłyby, szyfrowanie nie będzie miało żadnego znaczenia, ponieważ w Internecie nadal będzie wiele spoilerów i wiele sposobów na oszukiwanie.

Dziękuję wszystkim, którzy przyczynili się do tej interesującej dyskusji. Nagroda Insights za tę zagadkę trafia do Roba Corletta. Gratulacje! Kolejna nasza zagadka pojawi się w lutym. Do tego czasu wesołych zagadek i wesołych świąt!

Znak czasu:

Więcej z Magazyn ilościowy