Matematika za besednimi ugibanji

Ponovno objavil Platon

Spremljevalci: 0

V preprosti igri Wordle morajo igralci uganiti skrivno besedo s petimi črkami v šestih ali manj obratih na podlagi namigov o prisotnosti in lokaciji črk, razkritih s prejšnjimi ugibanji. Medtem ko so se nekoliko podobne igre pojavljale v preteklosti, mora vsak, ki igra Wordle na določen dan, odkriti isto skrivno besedo, kar olajša delitev vaših poskusov in razpravljanje o igri med prijatelji. Posebna struktura in predstavitev igre sta navdihnila vprašanja v našem najnovejšem Sestavljanke vpogledov. Odgovori so obravnavani spodaj.

Eden od ključev do dobre igre Wordle je izbira močne začetne besede. Računalniške analize vključujejo tehnike informacijske teorije namigujejo, da vam začetni besedi, kot sta "skrilavec" in "žerjav", omogoči (ali računalniškemu algoritmu, v vsakem primeru) rešiti Wordle v povprečju najmanjše število obratov. Vendar pa se mnogi človeški reševalci počutijo bolj udobno, če izberejo besedo, bogato z samoglasniki, kot je »adieu«, »audio« ali »raise«. Ta občutek ima tako intuitivno kot racionalno osnovo. Prvič, postavljeni samoglasniki vam omogočajo, da najdete "hrbtenico" samoglasnikov, ki lahko omeji število soglasnikov, ki jih morate iskati. Na primer, če veste, da je beseda videti kot _AI_E, potem ko igrate "raise", je na voljo samo še nekaj možnih besed: "naiven", "waive" in "maize". Drugič, samoglasniki povečajo količino, ki jo lahko imenujemo "pokritost" - med samo petimi samoglasniki in Y lahko dobimo vsaj eno pozitivno črko v vsakem od 2,309 odgovorov. Da bi dobili tako popolno pokritost s soglasniki, bi jih morali preizkusiti vseh 20, kar bi zahtevalo vsaj pet obratov.

Naša prva uganka je bralce izzvala, da ugotovijo, katera od teh treh samoglasniško bogatih besed je najboljša prva ugibanja.

Uganka 1

Naslednja tabela prikazuje pogostost, s katero se osem črk v besedah »adieu«, »audio« in »raise« pojavi na vsakem mestu na celotnem seznamu odgovorov Wordle z 2,309 besedami. Na podlagi te tabele določite, koliko zelenih in rumenih barv lahko pričakujete na celotnem seznamu odgovorov Wordle za vsako od treh začetnih besed, bogatih z samoglasniki: »adieu«, »audio« in »raise«. (V Wordlu je črka prikazana z zelenim ozadjem, če je na pravem mestu, in z rumenim ozadjem, če je v besedi, vendar je na napačnem mestu.) Kaj vam to pove o njihovi pričakovani uspešnosti kot začetnih besed ?

Bralec Rob Corlett je pokazal, kako izračunati število pričakovanih zelenih in rumenih iz te tabele. Za »adieu« je A pravilna prva črka za 140 besed, D je pravilna druga črka za 20 besed in tako naprej. Skupno število zelenic med vsemi možnimi odgovori Wordle je vsota teh. Torej "adieu" dobi skupno 140 + 20 + 266 + 318 + 1 = 745 zelencev. Pri rumenih moramo začeti s številom, kolikokrat se črka pojavi vsaj enkrat v besedi (906 za A v »adieu«) in odšteti, kolikokrat je zelena (140), da dobimo število rumenih (766). . Dodajte številke za vsako črko v besedi, da dobite skupno število rumenih. Te številke lahko delimo s skupnim številom odgovorov (2,309), da dobimo pričakovano število zelenih in rumenih za posamezen obrat, a ker je ta korak skupen vsem našim začetnim besedam, lahko samo delamo s seštevki za primerjavo treh izmed njih. Ker smo te besede izbrali posebej za iskanje samoglasniške hrbtenice, lahko tudi izračunamo, koliko zelenja izvira iz samoglasnikov. Tukaj so rezultati.

Kot vidite, ni primerjave! »Raise« je boljši od »adieu« v vseh merah, saj daje več zelenih in rumenih barv in daje več samoglasnikov na njihovih pravih mestih, da niti ne omenjamo dejstva, da ujamete ali izločite tudi dva najpogostejša soglasnika. »Avdio« je pri vseh teh merilih daleč tretji. Upoštevajte, da lahko dobite nekaj informacij o tem, katere črke manjkajo, tudi če ne dobite rumenih ali zelenih, kot bralec Max Davies poudarjeno, zagotovo dobite več informacij, ko dobite enega ali več rumenih in zelenih. Torej, »adieu« uporabniki, morda je čas, da rečemo adijo.

Vprašanje 1

To je bilo vprašanje o tem, koliko bi morali ceniti zeleno glede na rumeno: Koliko rumenih barv je enako eni sami zeleni? Zaradi jasne narave naših zgornjih rezultatov ni potrebe po odgovoru na to vprašanje za zgornjo primerjavo, vendar je to zanimivo vprašanje. To vrednotenje ima dva vidika. Prvi je človeški vidik: kolikšno težo pripisujete miselnemu naporu, ki je potreben, da ugotovite vse različne načine, na katere je mogoče postaviti rumeno črko? Ni mogoče zanikati, da uživanje velike količine zelenja olajša življenje in nam daje več dopamina. Z vidika informacijske teorije bi morali pregledati vsako začetno besedo za vsako odgovorno besedo in primerjati, koliko obratov bi bilo potrebnih za rešitev uganke, ko bi bile iste črke zelene, v primerjavi s tem, ko bi bile rumene v vsakem primeru.

Čeprav je to ogromna naloga, mi jo je uspelo opraviti za najboljšo možno računalniško začetno besedo (nejasna beseda »tarse«, ki pomeni moškega sokola, katerega celotno optimalno drevo rešitev je bilo objavljeni na spletu matematika Alexa Selbyja). Odgovor je presenetljiv. Povprečno število obratov, potrebnih za računalniško rešitev z besedo odgovora, ki je v prvem krogu ustvarila samo zelene barve, je bilo 3.34, medtem ko je bilo potrebno število obratov, ko so bile samo rumene črke, 3.51, kar je zgolj 5-odstotno povečanje! Očitno je računalniškemu algoritmu postavitev rumenih črk, ki se nam ljudem zdi tako zastrašujoča, mogoče doseči brez prevelike kazni. Predvidevam, da bi bila razlika za človeškega reševalca večja ne le v številu potrebnih obratov, ampak tudi v miselnem naporu in času, ki je potreben za reševanje.

Uganka 2

A) Če dobite vseh pet rumenih na prvi potezi, koliko je največje število potez, ki jih lahko potrebujete, da najdete odgovor ob predpostavki najboljše igre?

As Rob Corlett in Sam Rhoads Če pravilno navedete, je teoretični odgovor pet: popolnoma rumena kombinacija črk, kot je ABCDE, bi se lahko upirala odkritju še štiri zavoje, saj boste morda morali krožiti skozi BCDEA, CDEAB in DEABC, preden odkrijete, da je odgovor EABCD. V praksi pa takšne ciklične »besede« niso možne ravno zato, ker imajo prave besede določene vzorce samoglasnikov in soglasnikov, ki jih ni mogoče poljubno raztegniti. Tudi besede s številnimi anagrami je mogoče rešiti v največ treh poskusih, kot je pokazal Rob Corlett z "parse".

B) Ali se kdaj zgodi, da je to, da črka na določenem mestu postane rumena, bolj dragoceno kot videti, da postane zelena? Če da, lahko navedete primer in pojasnite, zakaj bi moralo biti tako?

Da, rumena črka je lahko v redkih primerih bolj vredna kot ista zelena črka, če je črka, ki se redko pojavi na drugih mestih. To se pogosto zgodi z Y, ki ga v veliki večini najdemo na koncu besede. Recimo, da začnete s "trebuhom" in tako B kot Y postaneta zelena. Ostajajo vam številne možnosti: »vrečasto«, »majhno«, »bobby«, »booty«, »bushy« itd. Če pa sta tako B kot Y rumena, obstaja samo ena možnost: »prepad«.

Vprašanje 2

Ali ima oseba z dobrim besediščem nejasnih besed Scrabble prednost ali slabost pri igranju Wordla?

Kot nekdanji igralec turnirja Scrabble, ki je porabil kar nekaj ur za pomnjenje nejasnih besed, menim, da je to tako prednost kot slabost. Ko sem prvič začel igrati Wordle, sem ugotovil, da pogosto vidim možnost in poskušam izključiti neobičajne besede, za katere sem kasneje ugotovil, da skoraj nimajo možnosti, da bi bile pravilne. (V golfski terminologiji, ki jo moja skupina Wordle pogosto uporablja, temu pravimo, da je oviran zaradi namišljene nevarnosti.) Kot sem opisal v stolpcu z ugankami, so odgovori Wordle sestavljeni iz seznama preprostih besed, od katerih je večina znanih. za vse materne govorce ameriške angleščine. Tudi besede, ki so nekoliko neobičajne, vendar ne nejasne, niso na seznamu odgovorov Wordle. Na primer, pred kratkim sem zapravil igranje "lateksa", dokaj pogoste besede, za katero se je izkazalo, da ni možen odgovor Wordle. Torej, kot vsi igralci Wordla, sem moral zgraditi miselni model besede, ki bi lahko bila odgovor Wordle, in posebej ignorirati vrste redkih in nejasnih besed, ki bi jih z veseljem uporabil, da bi dosegel več točk v Scrabble. Po drugi strani pa vam poznavanje teh redkih besed pride prav pri »pometanju soglasnikov«, ki ga morate včasih storiti, da se izognete ugibanju množice podobnih besed eno za drugo. Na primer, če imate _RA_E in gledate kup možnih besed, ki vsebujejo D, G in K, kot so »brake«, »drake«, »drape«, »grade« in »grape«, je koristno vedeti in igrajte besedo »kedge«, ki lahko zagotovi rešitev še v dveh obratih (kedge pomeni premakniti ladjo tako, da na daljavo odvržete sidro in ga nato potegnete z močno vrvjo).

Če vsak dan dobite enako uganko Wordle kot vsi drugi, spodbuja družabno igro. Toda na internetu je veliko spojlerjev in to je znano nekateri ljudje goljufajo pri poročanju svojih rezultatov. Naslednja uganka se ukvarja z vprašanjem, kdaj so sumi o goljufanju v skupini Wordle utemeljeni zgolj na podlagi neverjetnosti rezultata osebe. Tudi ta uganka je uokvirjena z izrazi točkovanja golfa: rešitev Wordle v treh obratih se imenuje ptiček, dobiti jo v dveh obratih je orel in dobiti besedo v prvem krogu je seveda luknja v enem .)

Uganka 3

Tradicionalno znanstveno merilo za nadaljnje raziskovanje je, če je verjetnost, da se izid zgodi po naključju ( vrednost alfa) je manj kot 5 % ali manj kot 1 %, odvisno od ciljev raziskovalcev. Rezultat se nato šteje za statistično značilnega na ravni 5 % ali 1 %. Ker ni lepo sumiti ljudi, da goljufajo, čeprav niso, izberimo bolj konzervativno raven 1 % v tej preiskavi.

Recimo, da pripadate skupini Wordle 10 igralcev, ki si 200 dni vsak dan izmenjujejo rezultate. Predpostavimo, da lahko zelo dober človeški igralec pričakuje, da bo dobil ptička vsaki 2.5 igre, orla vsakih 40 iger in hole-in-one vsakih 2,000 iger (kar so razumne ocene v resničnem svetu).

A) Koliko ptičkov zapored bi bilo v tem času pomembnih na ravni 1 % v vaši skupini?

B) Koliko orlov je v vrsti?

C) Koliko lukenj v eni zaporedoma?

Ključno pri tem je, da se zavedate, da imate velikost populacije 2,000 oseb-iger. Torej, da bi dosegli to raven pomembnosti, bi morali videti dogodek, ki bi se zgodil manj pogosto kot enkrat v 200,000 igrah oseb zgolj po naključju.

A) Nizi ptička ali boljšega: Verjetnost, da dobite ptička ali boljšega v eni igri, je 2/5 + 1/40 + 1/2,000 = 0.4255, kar je 1 v približno 2.35 igrah. Recimo temu B. Najnižja moč B ki presega 200,000 je B¹⁵, kar je več kot 368,000 (B¹⁴ je približno 157,000). Torej bi niz ptičkov ali boljših 15 ali več za kogar koli v skupini zadostil temu strogemu kriteriju, eden od 14 pa ne. Če sumite na posameznega igralca, bi morali videti dogodek, ki se zgodi manj pogosto kot enkrat v 20,000 igrah, kar bi se zgodilo z nizom 12. (Upoštevajte, da je dejansko število priložnosti za nize te dolžine so nekoliko manjše: dejansko je 1,850 iger za skupino in 188 iger za posameznega igralca, vendar to v tem primeru ne pomeni razlike).

Upoštevajte, da so to frekvence za izkušene igralce in da bi bili sumljivi nizi za večino skupin in posameznikov manjši. Za uporabo tega kriterija v praksi bi morali določiti ustrezne frekvence ptička, orla in luknje v enem, ki jih vidite, in upoštevati tudi število iger, ki so bile odigrane v vaši skupini.

B) Nizi orla ali boljšega: verjetnost za orla ali boljšega je 1/40 + 1/2,000 = 0.0255 ali približno 1 proti 39.2. Dolžine nizov, ki presegajo našo raven pomembnosti, so 4 za skupino in 3 za domnevnega posameznika.

C) Dolžina niza lukenj v enem: Dolžina niza, ki presega našo raven pomembnosti, je 2 tako za skupino kot za osumljenega posameznika.

Pri zadnjih dveh odgovorih obstaja opozorilo: to so redki dogodki in velikost vzorca je zelo majhna, zato morate biti previdni. Večina statistikov bi na splošno počakala, dokler ne bi videla vsaj pet ali več primerov orlov ali lukenj v enem, ne nujno kot del niza, preden bi lahko uporabili test pomembnosti.

Vprašanje 3

Povsem možno je, da je pogostost dobrih rezultatov v vaši skupini bistveno višja od pogostosti, napovedane po naključju, ne da bi kdo goljufal. Kako bi to pojasnil?

Eden od možnih razlogov za to, kot Rob Corlett pojasnjuje, bi lahko bilo, da "vsi igralci skrbno beležijo vsak rezultat." Kot sem razložil v uvodu k uganki 4, se odgovori Wordle v trenutni nastavitvi ne bodo ponavljali približno pet let. Tudi če nihče ne goljufa ali ne pozna vseh besed na seznamu odgovorov, lahko te informacije še vedno pomagajo kateremu koli posamezniku ali skupini, da postopoma deluje bolje.

Vendar obstaja še en razlog: seznam morda ni dobro naključen. Ko sem zadnjih nekaj mesecev igral Wordle, sem opazil, da so bile preprostejše besede bolj verjetno pravilne kot manj pogoste besede, ko je bilo mogoče izbirati med dvema ali več besedami. Na primer, če bi imeli A, N in E in bi bile na voljo besede, kot so »prikradti se«, »hijena« in »klistir«, bi lahko brez obotavljanja odigrali najpreprostejšo besedo (v tem primeru »prikradli«) in bili bi popraviti veliko pogosteje, kot bi pričakovali po čistem naključju. Pravzaprav sem uporabil seznam pogostosti besed v angleški prozi, da bi preveril, kako pogosti so bili odgovori, na katere sem naletel v dveh mesecih, v primerjavi s povprečno besedo na seznamu odgovorov Wordle. Odgovori, na katere sem naletel, so bili približno 25 % pogostejši od povprečne besede na seznamu odgovorov Wordle, in kar je še pomembneje, za najredkejše besede na seznamu (spodnjih 10 %) se jih je kot odgovorov pojavilo le tretjina toliko, kot je bilo predvideno. do. Orli so se zgodili s pogostnostjo bližje 1/20 in ne 1/40, ki temelji na čisti naključju. Torej se zdi, da zaporedje odgovorov Wordle ni dobro randomizirano in je bodisi na začetku naloženo s preprostejšimi besedami ali pa gremo skozi del seznama, ki je sestavljen iz preprostejših besed.

Pomembna nedavna sprememba je ta The New York Times imenovan za urednika Wordla za programiranje dnevne besede, ki se začne 7. novembra. Od takrat je odstranjevanje težkih ali žaljivih besed s prednastavljenega seznama postalo pogostejše, vključno z zamenjavo v zakulisju besed, kot so »ombre«, »bruhanje« in » fanny." Čeprav razumem potrebo po Krat razkužiti in poenostaviti besede v Wordlu, da bi preprečili ogorčenje milijonov ljudi, ki igrajo, naredi igro manj naključno in toliko bolj predvidljivo. Še hujša je nesrečna težnja urednikov v zadnjih nekaj tednih, da izberejo besedo, ki ustreza dnevu, kot je "praznik" na zahvalni dan in "medalja" na dan veteranov. To pomeni, da daste dodaten namig o besedi, še preden se igra začne, kar olajša uganko in zmanjša njeno bogato povezavo s teorijo informacij. Upam, da gre za začasno odstopanje, ker je naključnost bistveni element te igre. Večina ljudi, ki podal povratne informacije do The New York Times o teh uredniških odločitvah menil enako.

Naša četrta uganka je temeljila na dejstvu, da se rešitve Wordle v svoji trenutni arhitekturi ne bodo nikoli ponovile, dokler seznama po približno petih letih ne bo zmanjkalo.

Uganka 4

Razmislite o osebi s popolnim spominom na pretekle rešitve. Za takšno osebo bi bil odgovor očiten zadnji dan Wordlovega 2,309-besednega seznama. Ali lahko hitro ocenite, koliko lukenj v enem bi ta oseba pričakovala, da bo dosegla v času trajanja celotnega seznama, ne da bi naredili dejanski izračun? Potem, če lahko, poskusite narediti dejanski izračun.

Rob Corlett je na to odgovoril odlično, tako da je odgovor logično ocenil na 8.25, nato pa izračunal, da je odgovor 8.32. Corlettovi ključni izračuni so navedeni spodaj. Za odlično tehniko ocenjevanja si lahko ogledate komentar.

Če imate m besede in ugibate, potem so možnosti, da boste pravilno razumeli, 1/m. Če imate 1 besedo, so možnosti 1/1, 2 besedi 1/2, 3 besede 1/3 itd. Če to seštejete, dobite pričakovano število lukenj v enem! …

[Za to] potrebujemo, da izračunamo vsoto recipročnih vrednosti vseh števil od 2309 do 1. To sem naredil v preglednici in ugotovil, da je vsota 8.32, kar je zadovoljivo blizu moji oceni!

Naše zadnje vprašanje je bilo vprašanje, kako izboljšati naključno razvrščanje besed v Wordlu, hkrati pa ohraniti njegovo zasnovo na strani odjemalca. Preden je bil imenovan urednik Wordle, ni bilo vsakodnevnega naključnega razvrščanja besed: besede so prihajale iz prenesenega vnaprej zaporednega seznama, ki ni bil zelo dobro naključno razporejen, kot sem omenil zgoraj. Nato se je na odjemalčevi (uporabnikovi) napravi iz seznama besed glede na trenutni datum generirala beseda rešitve Wordle, celotna uganka pa je bila presojena tudi na uporabnikovi napravi. Koda za vse to se prenese takoj, ko se uporabnik vsak dan prvič poveže s spletno stranjo. Uporabniku potem ni treba biti na spletu.

Vprašanje 4

Kako bi zasnovali Wordle, tako da bi ohranil zasnovo na strani odjemalca in zagotovil, da vsi dobijo isto besedo rešitve na določen dan, vendar bi odgovore naključno razvrstil na razumen način, ne da bi morali vsak dan spreminjati kodo?

Na vprašanje o randomizaciji je bilo nekaj dobrih odgovorov. Nekaj bralcev je predlagalo uporabo psevdonaključnega števila z vnaprej določenim semenom za ustvarjanje indeksa na seznamu odgovorov Wordle. Mumintrollet celo napisal program, ki naključno premeša pet seznamov odgovorov Wordle (traja 32 let) in poskrbi, da se nobena beseda ne ponovi v enem letu. Zame je bil najbolj privlačen postopek Slepa Temida, ki je predlagal, da bi moralo biti naključno seme, uporabljeno za postopek randomizacije, zadnje štiri števke števila ljudi, ki so igrali igro do določenega časa. (Ker je Wordle mogoče igrati kjer koli na svetu, bi bilo to treba storiti v časovnih pasovih nad vzhodnim Pacifikom, začenši z mednarodno datumsko mejo!) Odlična stvar pri tem je, da nihče, niti New York Times Urejevalnik Wordle bi vedel, kakšna je beseda, dan preden je bila uporabljena.

Nobenega od teh mehanizmov ni mogoče v celoti izvesti na strani odjemalca, npr Tim Ross izpostavljeno. Naslednjo besedo bi moral ustvariti strežnik, to besedo ali njeno indeksno številko pa bi bilo treba prenesti, po možnosti v šifrirani obliki s preostalo kodo. Kot je poudaril Ross, je trenutno 2,309 besed odgovora jasno vidnih v datumskem vrstnem redu v izvorni kodi, kar lahko razkrije kateri koli brskalnik. Eden od pristopov bi lahko bil šifriranje seznama odgovorov in shranjevanje po abecednem vrstnem redu namesto po datumu.

Medtem ko bi predlagane izboljšave pri naključnem izboru pomagale, šifriranje ne bo nič spremenilo, saj bo na internetu še vedno več razvajalcev in več načinov goljufanja.

Hvala vsem, ki ste prispevali k tej zanimivi razpravi. Nagrado Insights za to uganko prejme Rob Corlett. čestitke! Naša naslednja uganka se bo pojavila februarja. Do takrat pa veselo ugankarjenje in lepe praznike!

Časovni žig: December 2, 2022December 2, 2022

Časovni žig: Maj 30, 2023

Matematika za besednimi ugibanji

Ponovno objavil Platon

Uganka 1

Vprašanje 1

Uganka 2

Vprašanje 2

Uganka 3

Vprašanje 3

Uganka 4

Vprašanje 4

Več od Quantamagazine

Osupljivo obnašanje rekurzivnih zaporedij | Revija Quanta

V naših mobilnih urah je našla celo življenje odkritij | Revija Quanta

Stroji se učijo bolje, če jih naučimo osnov

Deveto Dedekindovo število, ki sta ga našli dve neodvisni skupini | Revija Quanta

Inovatorji pri gradnji molekul so leta 2022 prejeli Nobelovo nagrado za kemijo

Odkrita asimetrija v porazdelitvi galaksij

Robot, ki podira rekorde, poudarja, kako so živali odlične pri skakanju

Fiziki so končno našli težavo, ki jo zmorejo le kvantni računalniki | Revija Quanta

O nas

Navpično iskanje in Ai

Platforma

Ostanite povezani

Račun

Predstavitev

Uganka 1

Vprašanje 1

Uganka 2

Vprašanje 2

Uganka 3

Vprašanje 3

Uganka 4

Vprašanje 4

Več od Quantamagazine

O nas

Navpično iskanje in Ai

Platforma

Ostanite povezani

Račun