Matematica din spatele Wordle ghiceste Inteligența datelor PlatoBlockchain. Căutare verticală. Ai.

Matematica din spatele ghicirilor Wordle

Introducere

În jocul simplu Wordle, jucătorii trebuie să ghicească un cuvânt secret de cinci litere în șase sau mai puține ture, pe baza indicii despre prezența și locația literelor dezvăluite de presupunerile lor anterioare. În timp ce jocuri oarecum similare au apărut în trecut, toți cei care joacă Wordle într-o anumită zi trebuie să descopere același cuvânt secret, ceea ce facilitează împărtășirea încercărilor tale și discutarea jocului între prietenii tăi. Structura distinctivă și prezentarea jocului au inspirat întrebările din ultimul nostru Puzzle de perspective. Răspunsurile sunt discutate mai jos.

O cheie pentru a juca un joc Wordle bun este să alegeți un cuvânt puternic de început. Încorporarea analizelor computerizate tehnici de teoria informaţiei sugerează că cuvintele de pornire precum „ardezie” și „macara” vă permit (sau un algoritm de computer, în orice caz) să rezolvați Wordles în cel mai mic număr de ture în medie. Cu toate acestea, mulți rezolvatori umani se simt mai confortabil alegând un cuvânt bogat în vocale, cum ar fi „adieu”, „audio” sau „ridicare”. Acest sentiment are atât o bază intuitivă, cât și una rațională. În primul rând, vocalele plasate vă permit să găsiți o „coloană vertebrală” vocală care poate restricționa numărul de consoane pe care trebuie să le căutați. De exemplu, dacă știi că cuvântul arată ca _AI_E după ce joci „crește”, mai sunt doar câteva cuvinte posibile: „naiv”, „renunță” și „porumb”. În al doilea rând, vocalele maximizează o cantitate care poate fi numită „acoperire” - doar între cele cinci vocale și Y, putem obține cel puțin o literă pozitivă în fiecare dintre cele 2,309 de răspunsuri. Pentru a obține acest tip de acoperire perfectă cu consoane, ar trebui să le încercați pe toate cele 20, ceea ce ar necesita cel puțin cinci ture.

Primul nostru puzzle i-a provocat pe cititori să-și dea seama care dintre aceste trei cuvinte bogate în vocale este cea mai bună presupunere.

puzzle 1 

Următorul tabel oferă frecvența cu care cele opt litere din cuvintele „adieu”, „audio” și „raise” apar în fiecare poziție pe întreaga listă de răspunsuri Wordle de 2,309 de cuvinte. Pe baza acestui tabel, determinați câte verzi și galbeni vă puteți aștepta să treceți peste întreaga listă de răspunsuri Wordle pentru fiecare dintre cele trei cuvinte de început bogate în vocale: „adieu”, „audio” și „raise”. (În Wordle, o literă este afișată cu un fundal verde dacă este în locul potrivit și un fundal galben dacă este în cuvânt, dar este în locul greșit.) Ce vă spune aceasta despre performanța așteptată ca cuvinte de început ?

Cititor Rob Corlett a arătat cum se calculează numărul de verzi și galbeni așteptați din acest tabel. Pentru „adieu”, A este prima literă corectă pentru 140 de cuvinte, D este a doua literă corectă pentru 20 de cuvinte și așa mai departe. Numărul total de verzi peste toate răspunsurile Wordle posibile este suma acestora. Deci „adio” obține un total de 140 + 20 + 266 + 318 + 1 = 745 de verdeață. Pentru galbeni, trebuie să începem cu numărul de ori când litera apare cel puțin o dată într-un cuvânt (906 pentru A din „adieu”) și să scădem de câte ori este verde (140) pentru a obține numărul de galbeni (766). . Adăugați numerele pentru fiecare literă din cuvânt pentru a obține numărul total de galbeni. Putem împărți aceste numere la numărul total de răspunsuri (2,309) pentru a obține așteptările de verzi și galbeni pentru o singură tură, dar deoarece acest pas este comun pentru toate cuvintele noastre de început, putem lucra doar cu totalurile pentru a compara cele trei dintre ei. Deoarece am ales aceste cuvinte special pentru a găsi o coloană vertebrală vocală, putem calcula, de asemenea, câte dintre verzi provin din vocale. Iată rezultatele.

După cum puteți vedea, nu există comparație! „Ridicare” este superior „adieu” în fiecare măsură, dând mai multe verzi și galbeni și dând mai multe vocale în locurile potrivite, ca să nu mai vorbim despre faptul că prinzi sau excluzi și două dintre cele mai comune consoane. „Audio” este o treime îndepărtată în toate aceste măsuri. Rețineți că, deși puteți obține unele informații despre ce litere lipsesc, chiar dacă nu primiți nici galben sau verde, în calitate de cititor Max Davies a subliniat, cu siguranță obțineți mai multe informații atunci când obțineți unul sau mai multe galbene și verzi. Așadar, utilizatorii „adio”, poate că este timpul să vă spuneți adio.

Întrebare 1

Aceasta a fost o întrebare despre cât de mult ar trebui să prețuim verdele în raport cu galbenii: Câți galbeni sunt egali cu un singur verde? Natura clară a rezultatelor noastre de mai sus înlătură necesitatea de a răspunde la acest lucru pentru comparația de mai sus, dar este o întrebare interesantă. Există două aspecte ale acestei evaluări. Primul este aspectul uman: Câtă pondere acordați efortului mental necesar pentru a descoperi diferitele moduri în care poate fi plasată o literă galbenă? Nu se poate nega că lovind o mulțime de verdețuri ușurează viața și ne oferă un plus de dopamină. Din punctul de vedere al teoriei informațiilor, ar trebui să treceți peste fiecare cuvânt de început pentru fiecare cuvânt de răspuns și să comparați câte ture ar fi necesare pentru a rezolva puzzle-ul atunci când aceleași litere erau verzi în comparație cu când erau galbene în fiecare caz.

Deși aceasta este o sarcină uriașă, am reușit să o fac pentru cel mai bun cuvânt posibil de pornire pentru computer (cuvântul obscur „tarse”, care înseamnă un șoim mascul, al cărui arbore de soluții optime a fost complet). postat on-line de matematicianul Alex Selby). Răspunsul este surprinzător. Numărul mediu de ture necesare pentru o soluție computerizată care folosește un cuvânt de răspuns care a produs doar verzi la prima tură a fost de 3.34, în timp ce numărul de ture necesare când erau doar litere galbene a fost de 3.51, o creștere de doar 5%! Evident, la un algoritm computerizat, plasarea literelor galbene, ceea ce pare atât de intimidant pentru noi, oamenii, poate fi realizată fără prea multă penalizare. Aș ghici că diferența ar fi mai mare pentru un rezolvator uman nu doar în numărul de ture necesare, ci și în efortul mental și timpul necesar pentru a rezolva.

puzzle 2

A) Dacă primești toate cele cinci galbene la prima tură, care este numărul maxim de ture poate dura pentru a găsi răspunsul, presupunând că jocul este cel mai bun?

As Rob Corlett și Sam Rhoads spus corect, răspunsul teoretic este cinci: o combinație complet galbenă de litere, cum ar fi ABCDE, ar putea rezista descoperirii încă patru ture, deoarece ar putea fi necesar să parcurgeți BCDEA, CDEAB și DEABC înainte de a descoperi că răspunsul a fost EABCD. În practică, totuși, astfel de „cuvinte” ciclice nu sunt posibile tocmai pentru că cuvintele reale au modele vocale și consoane definite care nu pot fi întinse în mod arbitrar. Chiar și cuvintele cu multe anagrame pot fi rezolvate în cel mult trei încercări, așa cum a demonstrat Rob Corlett cu „parse”.

B) Se întâmplă vreodată ca o literă într-o anumită poziție să se îngălbenească este mai valoros decât să o vezi devenind verde? Dacă da, poți să dai un exemplu și să explici de ce ar trebui să fie acest lucru?

Da, o literă care vine în galben poate, în cazuri rare, să fie mai valoroasă decât aceeași literă care vine în verde, dacă este o literă care apare rar în celelalte poziții. Acest lucru se întâmplă adesea cu Y, care se găsește în mod covârșitor la sfârșitul unui cuvânt. Să presupunem că începeți cu „burtă” și atât B, cât și Y apar în verde. Rămân cu multe posibilități: „baggy”, „bitty”, „bobby”, „bobby”, „tufos” etc. Dar dacă atât B, cât și Y apar galben, există o singură posibilitate: „abis”.

Întrebare 2

O persoană cu un vocabular bun de cuvinte obscure Scrabble are un avantaj sau un dezavantaj în a juca Wordle?

Fiind un fost jucător de Scrabble de turneu care a petrecut câteva ore memorând cuvinte obscure, cred că este atât un avantaj, cât și un dezavantaj. Când am început să joc Wordle, m-am trezit adesea văzând posibilitatea și încercând să exclud cuvinte neobișnuite despre care mi-am dat seama mai târziu că nu au aproape nicio șansă să fie corecte. (În terminologia de golf, pe care grupul meu Wordle o folosește frecvent, ne referim la aceasta ca fiind împiedicată de un pericol imaginar.) După cum am descris în coloana puzzle, răspunsurile Wordle sunt extrase dintr-o listă de cuvinte simple, dintre care majoritatea sunt cunoscute. tuturor vorbitorilor nativi de engleză din SUA. Chiar și cuvintele care sunt oarecum neobișnuite, dar care nu sunt obscure, nu sunt pe lista de răspunsuri Wordle. De exemplu, recent am pierdut o tură jucând „latex”, un cuvânt destul de comun care se dovedește a nu fi un posibil răspuns Wordle. Așa că, la fel ca toți jucătorii de Wordle, a trebuit să construiesc un model mental al tipului de cuvânt care ar putea fi un răspuns Wordle și să ignor în mod specific tipurile de cuvinte rare și obscure pe care le-aș folosi cu plăcere pentru a obține mai multe puncte în Scrabble. Pe de altă parte, cunoașterea acestor cuvinte rare este utilă în „consoanele de măturare”, pe care uneori trebuie să le faci pentru a evita să petreci multe rânduri ghicind o grămadă de cuvinte similare unul câte unul. De exemplu, dacă aveți _RA_E și vă uitați la o grămadă de cuvinte posibile care conțin D, G și K, cum ar fi „frână”, „drake”, „drape”, „grade” și „grape”, vă ajută să cunoașteți și jucați cuvântul „kedge”, care vă poate garanta găsirea soluției în încă două ture (a strânge înseamnă a muta o navă aruncând ancora la distanță și apoi trăgând de ea cu o frânghie solidă).

Obținerea aceluiași puzzle Wordle ca toți ceilalți în fiecare zi încurajează jocul social. Dar spoilerele abundă pe internet și se știe că unii oameni trișează în raportarea scorurilor lor. Următorul puzzle tratează întrebarea când suspiciunile de înșelăciune într-un grup Wordle sunt justificate doar pe baza improbabilității scorului unei persoane. Din nou, acest puzzle este încadrat în termeni de punctaj de golf: o soluție Wordle în trei ture se numește pasăre, obținerea ei în două ture este un vultur și obținerea unui cuvânt chiar la prima tură este, desigur, o gaură în unu. .)

puzzle 3

Un criteriu științific tradițional pentru investigarea în continuare este dacă probabilitatea ca un rezultat să apară întâmplător ( valoare alfa) este mai mică de 5% sau mai mică de 1%, în funcție de obiectivele cercetătorilor. Rezultatul este apoi considerat a fi semnificativ statistic la nivelul de 5% sau 1%. Deoarece nu este frumos să suspectezi oamenii că trișează atunci când nu sunt, haideți să alegem nivelul mai conservator de 1% în această investigație.

Să presupunem că aparțineți unui grup Wordle de 10 jucători care au împărtășit rezultatele în fiecare zi timp de 200 de zile. Să presupunem că un jucător uman foarte bun se poate aștepta să obțină o pasăre la fiecare 2.5 jocuri, un vultur la fiecare 40 de jocuri și o gaură în unu la fiecare 2,000 de jocuri (care sunt estimări rezonabile din lumea reală).

A) Câte păsări la rând ar fi semnificative la nivelul de 1% în grupul tău în acest timp?

B) Câți vulturi la rând?

C) Câte găuri într-una la rând?

Cheia aici este să realizezi că ai o populație de 2,000 de jocuri-persoană. Așadar, pentru a ajunge la acest nivel de semnificație, ar trebui să vedeți un eveniment care s-ar întâmpla mai rar decât o dată la 200,000 de jocuri cu persoane doar din întâmplare.

A) Drumuri de păsări sau mai bune: Probabilitatea de a obține o pasăre sau mai bună într-un singur joc este 2/5 + 1/40 + 1/2,000 = 0.4255, care este 1 în aproximativ 2.35 jocuri. Să numim asta B. Cea mai mică putere a B care depășește 200,000 is B15, care este mai mult de 368,000 (B14 este de aproximativ 157,000). Deci, o serie de păsări sau mai bune de 15 sau mai mult pentru oricine din grup ar satisface acest criteriu strict, dar unul din 14 nu ar satisface. Dacă suspectați un jucător individual, ar trebui să vedeți un eveniment care are loc mai rar decât o dată la 20,000 de jocuri, ceea ce s-ar întâmpla cu o serie de păsări sau mai bune de 12. (Rețineți că numărul real de oportunități de a avea șiruri de aceste lungimi sunt puțin mai mici: este de fapt 1,850 de jocuri pentru grup și 188 de jocuri pentru jucătorul individual, dar asta nu face diferența în acest caz).

Rețineți că acestea sunt frecvențele pentru jucătorii experți, iar liniile suspecte pentru majoritatea grupurilor și indivizilor ar fi mai mici. Pentru a aplica acest criteriu în practică, ar trebui să determinați frecvențele corespunzătoare de pasăre, vultur și hole-in-one pe care le vedeți și, de asemenea, să țineți cont de numărul de jocuri care au fost jucate în grupul dvs.

B) Dâre de vultur sau mai bine: probabilitatea pentru un vultur sau mai bună este 1/40 + 1/2,000 = 0.0255, sau aproximativ 1 din 39.2. Lungimile seriei care depășesc nivelul nostru de semnificație sunt 4 pentru grup și 3 pentru o persoană suspectată.

C) Dâre „hole-in-one”: lungimea șirului care depășește nivelul nostru de semnificație este 2 atât pentru grup, cât și pentru o persoană suspectată.

Există o avertizare la ultimele două răspunsuri: acestea sunt evenimente rare, iar dimensiunea eșantionului este foarte mică, așa că trebuie să fiți atenți. Majoritatea statisticienilor ar aștepta, în general, până când au văzut cel puțin cinci sau mai multe cazuri de vulturi sau găuri în unu, nu neapărat ca parte a unei șiruri, înainte de a se simți confortabil să aplice un test de semnificație.

Întrebare 3

Este cu totul posibil ca frecvența rezultatelor bune în grupul tău să fie semnificativ mai mare decât frecvența prezisă întâmplător, fără ca nimeni să trișeze. Cum ai explica asta?

Un posibil motiv pentru aceasta, ca Rob Corlett explică, ar putea fi că „toți jucătorii țin evidența asiduă a fiecărui rezultat”. După cum am explicat în preludiul puzzle-ului 4, răspunsurile Wordle nu se vor repeta timp de aproximativ cinci ani în configurația actuală. Așadar, chiar dacă nimeni nu trișează sau nu știe toate cuvintele din lista de răspunsuri, aceste informații pot ajuta totuși orice individ sau grup să aibă treptat o performanță mai bună.

Dar există și un alt motiv: este posibil ca lista să nu fie bine randomizată. Jucând Wordle în ultimele câteva luni, am observat că ori de câte ori a fost de ales între două sau mai multe cuvinte, cuvintele mai simple erau mai probabil să fie corecte decât cuvintele mai puțin obișnuite. De exemplu, dacă ați avea A, N și E și alegerile rămase ar fi cuvinte precum „furisare”, „hienă” și „clismă”, ați putea juca fără ezitare cel mai simplu cuvânt („furisat” în acest caz) și ați fi corectați mult mai des decât v-ați aștepta din pură întâmplare. De fapt, am folosit o listă de frecvență a cuvintelor în proză în limba engleză pentru a verifica cât de comune au fost răspunsurile pe care le-am întâlnit pe parcursul a două luni în comparație cu un cuvânt mediu din lista de răspunsuri Wordle. Răspunsurile pe care le-am întâlnit au fost cu aproximativ 25% mai frecvente decât cuvântul mediu din lista de răspunsuri Wordle și, mai important, pentru cele mai rare cuvinte din listă (cele 10 de jos), doar o treime din numărul de răspunsuri au apărut ca răspunsuri decât se presupunea. la. Vulturii s-au întâmplat cu o frecvență mai apropiată de 1/20 decât de 1/40 bazată pe pură șansă. Deci, se pare că secvența de răspunsuri Wordle nu este bine randomizată și fie este încărcată în față cu cuvinte mai simple, fie se întâmplă să parcurgem o parte a listei care constă din cuvinte mai simple.

O schimbare semnificativă recentă este aceea New York Times numit editor Wordle pentru a programa cuvântul zilei începând cu 7 noiembrie. De atunci, eliminarea cuvintelor dificile sau jignitoare din lista pre-secvențiată a devenit mai comună, inclusiv înlocuirea, în culise, a unor cuvinte precum „ombre”, „vomit” și „ Fanny.” În timp ce înțeleg nevoia pentru Times pentru a igieniza și a simplifica cuvintele Wordle pentru a preveni indignarea milioanelor de oameni care joacă, face jocul mai puțin aleatoriu și mult mai previzibil. Și mai rău este tendința editorială nefericită din ultimele săptămâni de a alege un cuvânt care să se potrivească zilei, cum ar fi „sărbătoarea” de Ziua Recunoștinței și „medalia” de Ziua Veteranilor. Acest lucru înseamnă a oferi un indiciu suplimentar despre cuvânt chiar înainte de începerea jocului, ușurând puzzle-ul și diminuând conexiunea bogată a teoriei informațiilor. Sper că aceasta este o aberație temporară, deoarece aleatorietatea este un element esențial al acestui joc. Majoritatea oamenilor care a dat feedback la New York Times despre aceste alegeri editoriale simțit la fel.

Al patrulea puzzle al nostru s-a bazat pe faptul că, în conformitate cu arhitectura actuală, soluțiile Wordle nu se vor repeta niciodată până când lista nu se va termina după cinci ani și ceva.

puzzle 4

Luați în considerare o persoană cu o memorie perfectă a soluțiilor din trecut. Pentru o astfel de persoană, răspunsul ar fi evident în ultima zi a listei de 2,309 de cuvinte a lui Wordle. Puteți estima rapid câte găuri într-unul s-ar aștepta această persoană să obțină peste durata întregii liste, fără a face calculul propriu-zis? Apoi, dacă puteți, încercați și faceți calculul propriu-zis.

Rob Corlett a răspuns perfect, estimând logic răspunsul la 8.25 și apoi calculând răspunsul la 8.32. Calculele cheie ale lui Corlett sunt citate mai jos. Puteți verifica comentariul pentru tehnica excelentă de estimare.

Dacă aveţi m cuvinte și ghiciți, atunci șansele de a face bine sunt 1/m. Dacă aveți 1 cuvânt, șansele sunt 1/1, 2 cuvinte 1/2, 3 cuvinte 1/3 etc. Dacă le adunați împreună, obțineți numărul așteptat de găuri în unu! …

[Acest lucru] are nevoie de noi să calculăm suma reciprocelor tuturor numerelor de la 2309 până la 1. Am făcut acest lucru într-o foaie de calcul și am găsit că totalul este 8.32, satisfăcător de aproape de estimarea mea!

Ultima noastră întrebare a fost cum să îmbunătățim randomizarea cuvintelor în Wordle, păstrând în același timp designul „partea clientului”. Înainte de numirea editorului Wordle, nu exista o randomizare zilnică a cuvintelor: cuvintele proveneau dintr-o listă pre-secvențială descărcată care nu era foarte bine randomizată, așa cum am menționat mai sus. Apoi cuvântul soluție al lui Wordle a fost generat pe dispozitivul clientului (utilizatorului) din lista de cuvinte în funcție de data curentă, iar întregul puzzle a fost adjudecat și pe dispozitivul utilizatorului. Codul pentru a face toate acestea este descărcat chiar de prima dată când un utilizator se conectează la site-ul web în fiecare zi. Ulterior, utilizatorul nu trebuie să fie online.

Întrebare 4

Cum ați proiecta Wordle astfel încât să păstreze designul la nivelul clientului, asigurându-vă că toată lumea primește același cuvânt de soluție într-o anumită zi, dar randomizează răspunsurile într-un mod sensibil, fără a necesita o modificare a codului în fiecare zi?

Au existat câteva răspunsuri bune la întrebarea de randomizare. Câțiva cititori au sugerat utilizarea unui număr pseudoaleatoriu cu o sămânță predefinită pentru a crea un index în lista de răspunsuri Wordle. Mumintrollet chiar a scris un program care amestecă aleatoriu cinci liste de răspunsuri Wordle (care durează 32 de ani), asigurându-se că niciun cuvânt nu se repetă într-un an. Pentru mine, procedura cea mai atrăgătoare a venit de la BlindThemis, care a sugerat că semințele aleatorii utilizate pentru procedura de randomizare ar trebui să fie ultimele patru cifre ale numărului de persoane care au jucat jocul până la un anumit timp. (Din moment ce Wordle poate fi jucat oriunde în lume, acest lucru ar trebui să se facă în fusurile orare din Pacificul de Est, începând de la Linia Internațională de Date!) Lucrul grozav la asta este că nimeni, nici măcar New York Times Editorul Wordle, ar ști care este cuvântul cu o zi înainte de a fi folosit.

Niciunul dintre aceste mecanisme nu poate fi realizat complet pe partea clientului, așa cum Tim Ross Evidențiat. Următorul cuvânt ar trebui să fie generat de server, iar acest cuvânt sau numărul său de index ar trebui descărcat, eventual în formă criptată cu restul codului. După cum a subliniat Ross, în prezent, cele 2,309 de cuvinte de răspuns sunt vizibile clar în ordinea datei în codul sursă, pe care orice browser îl poate dezvălui. O abordare ar putea fi criptarea listei de cuvinte de răspuns și salvarea acesteia în ordine alfabetică, mai degrabă decât în ​​ordinea datei.

Deși îmbunătățirile sugerate ale randomizării ar ajuta, criptarea nu va face nicio diferență, deoarece vor exista în continuare mai multe spoilere pe internet și mai multe moduri de a înșela.

Mulțumesc tuturor celor care au contribuit la această discuție interesantă. Premiul Insights pentru acest puzzle îi revine lui Rob Corlett. Felicitări! Următorul nostru puzzle va apărea în februarie. Până atunci, încurcătură fericită și sărbători fericite!

Timestamp-ul:

Mai mult de la Quantamagazina