Wordle'i taga olev matemaatika arvab PlatoBlockchaini andmeluure. Vertikaalne otsing. Ai.

Matemaatika Wordle'i oletuste taga

Sissejuhatus

Lihtsas Wordle mängus peavad mängijad kuue või vähema käiguga ära arvama salajase viietähelise sõna, tuginedes vihjetele nende varasemate oletuste käigus leitud tähtede olemasolu ja asukoha kohta. Kuigi mõneti sarnaseid mänge on varem ilmunud, peavad kõik, kes konkreetsel päeval Wordle'i mängivad, avastama sama salasõna, mis teeb oma katsete jagamise ja mängu üle sõpradega arutlemise lihtsaks. Mängu eripärane struktuur ja esitlus inspireerisid küsimusi meie viimases Insights puzzle. Vastuseid arutatakse allpool.

Hea Wordle'i mängu mängimise üks võti on tugeva algussõna valimine. Arvutianalüüsid kehastavad infoteooria tehnikad viitavad sellele, et algussõnad, nagu "kiltkivi" ja "kraana", võimaldavad teil (või arvutialgoritmil igal juhul) Wordles'i lahendada keskmiselt väikseima pöörete arvuga. Paljud inimlahendajad tunnevad end aga mugavamalt, kui valivad täishäälikurikka sõna, nagu „jätke”, „heli” või „tõsta”. Sellel tundel on nii intuitiivne kui ka ratsionaalne alus. Esiteks võimaldavad paigutatud vokaalid leida täishääliku selgroo, mis võib piirata otsitavate kaashäälikute arvu. Näiteks kui teate, et pärast sõna "tõstmine" mängimist näeb sõna välja nagu _AI_E, on jäänud vaid mõned võimalikud sõnad: "naiivne", "loobub" ja "mais". Teiseks maksimeerivad vokaalid kogust, mida võib nimetada katvuseks – ainult viie vokaali ja Y vahel võime saada igas 2,309 vastuses vähemalt ühe positiivse tähe. Sellise täiusliku kaashäälikute katvuse saamiseks peaksite proovima neid kõiki 20, mis nõuab vähemalt viit pööret.

Meie esimene mõistatus esitas lugejatele väljakutse välja selgitada, milline neist kolmest täishäälikurikkast sõnast on parim esimene oletus.

Mõistatus 1 

Järgmises tabelis on toodud kaheksa tähe esinemissagedus sõnades "jätke", "heli" ja "tõus" igas positsioonis kogu Wordle'i vastuste loendis, mis koosneb 2,309 sõnast. Selle tabeli põhjal määrake, kui palju rohelisi ja kollaseid võite oodata, et saada üle Wordle'i vastuste loendist iga kolme täishäälikurikka algussõna puhul: "jätke", "heli" ja "tõsta". (Wordle'is kuvatakse tähte rohelise taustaga, kui see on õiges kohas, ja kollasel taustal, kui see on sõnas, kuid on vales kohas.) Mida see ütleb teile nende eeldatava toimimise kohta algussõnadena ?

lugeja Rob Corlett näitas, kuidas arvutada sellest tabelist eeldatavate roheliste ja kollaste arv. Adieu puhul on A õige esimene täht 140 sõna puhul, D on 20 sõna õige teine ​​täht ja nii edasi. Greene koguarv kõigi võimalike Wordle vastuste kohta on nende summa. Seega saab adieu kokku 140 + 20 + 266 + 318 + 1 = 745 rohelist. Kollaste värvide puhul peame alustama tähtede arvust, mis ühes sõnas esineb vähemalt üks kord (906 tähe A puhul "jätkuga") ja lahutama rohelise värvi kordi (140), et saada kollaste arv (766). . Kollaste koguarvu saamiseks lisage sõna iga tähe numbrid. Võime jagada need arvud vastuste koguarvuga (2,309), et saada roheliste ja kollaste ootused ühe pöörde jaoks, kuid kuna see samm on ühine kõigi meie algussõnade jaoks, saame nende kolme võrdlemiseks lihtsalt töötada kogusummadega. nendest. Kuna oleme need sõnad valinud spetsiaalselt vokaali selgroo leidmiseks, saame ka arvutada, kui palju rohelisi tuleb vokaalidest. Siin on tulemused.

Nagu näete, pole võrrelda! "Tõstke" on parem kui "adieu" igas mõõdus, andes rohkem rohelisi ja kollaseid ning andes rohkem täishäälikuid nende õigetesse kohtadesse, rääkimata sellest, et püüate kinni või välistate ka kahte kõige levinumat kaashäälikut. "Audio" on kõigi nende meetmete kauge kolmas koht. Pange tähele, et kuigi saate lugejana teavet selle kohta, millised tähed puuduvad, isegi kui te ei saa kollaseid ega rohelisi Max Davies märkis, et kindlasti saate rohkem teavet, kui saate ühe või mitu kollast ja rohelist. Seega, "adieu" kasutajad, võib-olla on aeg hüvasti jätta.

Küsimus 1

See oli küsimus, kui palju me peaksime väärtustama rohelisi võrreldes kollastega: Mitu kollast võrdub ühe rohelisega? Meie ülaltoodud tulemuste selge olemus välistab vajaduse sellele ülaltoodud võrdluse jaoks vastata, kuid see on huvitav küsimus. Sellel hindamisel on kaks aspekti. Esimene on inimlik aspekt: ​​kui palju kaalute te vaimset pingutust, mis on vajalik, et välja selgitada kõik erinevad viisid, kuidas kollast tähte saab paigutada? Ei saa eitada, et roheliste roheliste roheliste roheliste roheliste roheliste rohkuse rohelate rohkuse rohkuse rohkuse rohkus rohkete roheliste rohkuse rohkuse rohkuse rohkuse rohel palju rohe rohke rohke rohkel rohkel hulgal palju rohketes rohkes suures rohkes rohketes rohketes sisaldudes palju tabades löö palju tabab tabab tabanud tabades sisesed palju sl. Infoteooria vaatenurgast tuleks iga vastussõna puhul läbi vaadata iga algussõna ja võrrelda, mitu pööret kuluks mõistatuse lahendamiseks, kui samad tähed olid rohelised, võrreldes siis, kui need olid igal juhul kollased.

Kuigi see on tohutu ülesanne, sain sellega hakkama parima võimaliku arvuti algussõna jaoks (hämar sõna "tarse", mis tähendab isast pistrikut, kelle täielik optimaalne lahenduspuu on olnud postitatud võrgus matemaatik Alex Selby). Vastus on üllatav. Esimeses pöördes ainult rohelisi andnud vastussõna kasutava arvutilahenduse keskmine pöörete arv oli 3.34, kollaste tähtede korral aga 3.51 pöörete arv, mis on vaid 5% tõus! Ilmselt saab arvutialgoritmi järgi kollaste tähtede paigutamine, mis meile, inimestele, tundub, nii hirmutav, saavutada ilma liigse karistuseta. Ma arvan, et inimlahendaja jaoks on erinevus suurem mitte ainult vajalike pöörete arvus, vaid ka lahendamiseks kuluvas vaimses pingutuses ja ajas.

Mõistatus 2

A) Kui saate oma esimesel käigul kõik viis kollast, siis kui palju pöördeid võib vastuse leidmiseks kuluda, eeldades parimat mängu?

As Rob Corlett ja Sam Rhoads õigesti öeldud, on teoreetiline vastus viis: täiesti kollane tähekombinatsioon, nagu ABCDE, võib avastamisele vastu seista veel neli pööret, kuna peate võib-olla läbima BCDEA, CDEAB ja DEABC, enne kui avastate, et vastuseks oli EABCD. Praktikas pole aga sellised tsüklilised "sõnad" võimalikud just seetõttu, et pärissõnadel on määratletud vokaali- ja kaashäälikumustrid, mida ei saa meelevaldselt venitada. Isegi paljude anagrammidega sõnu saab lahendada kõige rohkem kolme katsega, nagu Rob Corlett näitas sõnaga "parse".

B) Kas on kunagi nii, et teatud asendis oleva tähe kollaseks muutumine on väärtuslikum kui selle roheliseks muutumine? Kui jah, siis kas saate tuua näite ja selgitada, miks see nii peaks olema?

Jah, kollane ilmuv täht võib harvadel juhtudel olla väärtuslikum kui samasugune roheline, kui see on täht, mida muudes kohtades esineb harva. See juhtub sageli Y-ga, mida leidub valdavalt sõna lõpus. Oletame, et alustate sõnaga "kõht" ja nii B kui ka Y tulevad roheliseks. Teile jääb palju võimalusi: "kott, "kibe", "bobby", "saak", "põõsas" jne. Aga kui nii B kui ka Y ilmuvad kollaseks, on ainult üks võimalus: "sügis".

Küsimus 2

Kas inimesel, kellel on hea ebaselgete Scrabble sõnade sõnavara, on Wordle'i mängimisel eelis või puudus?

Endise Scrabble'i turniiri mängijana, kes kulutas üsna mitu tundi ebaselgete sõnade päheõppimisele, arvan, et see on nii eelis kui ka puudus. Kui ma esimest korda Wordle'i mängima hakkasin, avastasin end sageli nägemas võimalust ja püüdmas välistada ebatavalisi sõnu, mille õigsuseks sain hiljem aru. (Golfiterminoloogias, mida minu Wordle'i rühm sageli kasutab, viitame sellele kui kujuteldavast ohust.) Nagu ma mõistatuste veerus kirjeldasin, on Wordle'i vastused võetud lihtsate sõnade loendist, millest enamik on teada. kõigile USA inglise keelt emakeelena kõnelevatele inimestele. Wordle vastuste loendis pole isegi sõnu, mis on mõnevõrra haruldased, kuid mitte varjatud. Näiteks raiskasin hiljuti ühe pöörde, mängides "lateksit", mis on üsna levinud sõna, mis ei ole Wordle'i võimalik vastus. Niisiis, nagu kõik Wordle'i mängijad, olen ma pidanud looma vaimse mudeli sõnadest, mis võiksid olla Wordle'i vastused, ning ignoreerima haruldasi ja ebaselgeid sõnu, mida ma hea meelega kasutaksin Scrabble'is rohkemate punktide kogumiseks. Teisest küljest tuleb nende haruldaste sõnade tundmine kasuks "kaashäälikute pühkimisel", mida peate mõnikord tegema, et mitte kulutada palju pöördeid sarnaste sõnade ükshaaval äraarvamisele. Näiteks kui teil on _RA_E ja vaatate hulga võimalikke sõnu, mis sisaldavad D, G ja K, nagu "pidur", "drake", "drape", "gree" ja "grape", aitab see teada ja mängige sõna "kedge", mis võib garanteerida lahenduse leidmise veel kahe pöördega (kedge tähendab laeva liigutamist, visates selle ankru eemale ja tõmmates seda seejärel tugeva köiega).

Iga päev sama Wordle'i mõistatuse hankimine nagu kõik teised julgustab seltskondlikku mängimist. Kuid spoilereid on Internetis palju ja see on teada mõned inimesed petavad oma hinnete esitamisel. Järgmine mõistatus käsitleb küsimust, millal on Wordle'i rühmas petmise kahtlused õigustatud, lähtudes ainult isiku skoori ebatõenäosusest. Jällegi on see mõistatus raamitud golfipunktide terminites: Wordle'i kolme käiguga lahendust nimetatakse linnukeseks, selle kahe käiguga saamine on kotkas ja sõna saamine kohe esimesel pöördel on loomulikult hole-in-one. .)

Mõistatus 3

Traditsiooniline teaduslik kriteerium edasiseks uurimiseks on see, kui tõenäosus, et tulemus juhtub juhuslikult ( alfa väärtus) on olenevalt teadlaste eesmärkidest alla 5% või alla 1%. Seejärel loetakse tulemus statistiliselt oluliseks 5% või 1% tasemel. Kuna ei ole ilus kahtlustada inimesi petmises, kui nad seda ei tee, siis valime selles uurimises konservatiivsema 1% taseme.

Oletame, et kuulute Wordle 10-liikmelisse gruppi, kes on 200 päeva jooksul iga päev tulemusi jaganud. Oletame, et väga hea inimmängija võib eeldada, et saab linnukese iga 2.5 mängu järel, kotka iga 40 mängu järel ja hole-in-one'i iga 2,000 mängu järel (mis on mõistlikud reaalmaailma hinnangud).

A) Kui palju linnukesi järjest oleks teie rühmas selle aja jooksul oluline 1% tasemel?

B) Mitu kotkast on reas?

C) Mitu auku ühes reas?

Peamine on mõista, et teie rahvaarv on 2,000 inimese mängu. Nii et selle olulisuse taseme saavutamiseks peaksite nägema sündmust, mis juhtuks harvemini kui üks kord 200,000 XNUMX inimesemängus ainuüksi juhuslikult.

A) Birdie-or-better seeriad: Tõenäosus saada birdie või parem ühes mängus on 2/5 + 1/40 + 1/2,000 = 0.4255, mis on 1 umbes 2.35 mängu kohta. Nimetagem seda B. Väikseim võimsus B mis ületab 200,000 XNUMX on B15, mis on rohkem kui 368,000 XNUMX (B14 on umbes 157,000 15). Seega vastaks sellele rangele kriteeriumile 14-ne või-parem jada grupiliikme jaoks, kuid üks 20,000-st mitte. Kui kahtlustate üksikut mängijat, peaksite nägema sündmust, mis juhtub harvemini kui üks kord 12 1,850 mängu jooksul, mis juhtuks 188-ga. (Pange tähele, et seeriate tegelik arv on Need pikkused on veidi väiksemad: tegelikult on see grupi jaoks XNUMX mängu ja üksikmängija jaoks XNUMX mängu, kuid see ei muuda antud juhul).

Pange tähele, et need on asjatundlike mängijate sagedused ja enamiku rühmade ja üksikisikute kahtlased triibud on väiksemad. Selle kriteeriumi praktikas rakendamiseks peate määrama vastavad birdie-, eagle- ja hole-in-one-sagedused, mida näete, ning võtma arvesse ka teie grupis mängitud mängude arvu.

B) Kotkas või parem triibud: tõenäosus, et kotkas või parem on, on 1/40 + 1/2,000 = 0.0255 ehk umbes 1:39.2. Meie olulisuse taseme ületavad ribade pikkused on 4 rühma ja 3 kahtlustatava isiku puhul.

C) Hole-in-one triibud: triibu pikkus, mis ületab meie olulisuse taseme, on 2 nii rühma kui ka kahtlustatava isiku puhul.

Kahe viimase vastuse puhul on hoiatus: need on haruldased sündmused ja valimi suurus on väga väike, seega peate olema ettevaatlik. Enamik statistikuid ootavad üldiselt, kuni nad on näinud vähemalt viit või enamat kotka või holes-in-one juhtumit, mitte tingimata osana jaotusest, enne kui nad tunnevad end olulisuse testi rakendamisel.

Küsimus 3

On täiesti võimalik, et heade tulemuste sagedus teie rühmas on oluliselt kõrgem kui juhuslikult ennustatud sagedus, ilma et keegi petaks. Kuidas te seda seletaksite?

Selle üks võimalik põhjus, nagu Rob Corlett selgitab, et "mängijad peavad iga tulemuse kohta usinalt arvestust." Nagu ma 4. mõistatuse sissejuhatuses selgitasin, ei tule Wordle'i vastuseid praeguse seadistuse korral korrata umbes viis aastat. Nii et isegi kui keegi ei peta ega tea kõiki vastuste loendis olevaid sõnu, võib see teave aidata igal üksikisikul või rühmal järk-järgult paremini toimida.

Kuid on ka teine ​​põhjus: nimekiri ei pruugi olla hästi randomiseeritud. Wordle'i viimastel kuudel mängides märkasin, et kui oli valida kahe või enama sõna vahel, olid lihtsamad sõnad tõenäolisemalt õiged kui vähem levinud sõnad. Näiteks kui teil oleks A, N ja E ning valikuteks jäid sellised sõnad nagu "vargsi", "hüään" ja "klistiir", võiksite kõhklematult mängida kõige lihtsamat sõna (antud juhul "hiilima") ja oleksite parandage palju sagedamini, kui puhtjuhuslikult eeldaksite. Ma kasutasin ingliskeelset proosasõnade sagedusloendit, et kontrollida, kui tavalised olid vastused, mida kahe kuu jooksul kohtasin, võrreldes Wordle'i vastuste loendi keskmise sõnaga. Vastused, mida kohtasin, olid umbes 25% levinumad kui Wordle'i vastuste loendi keskmine sõna, ja mis veelgi olulisem, loendi kõige haruldasemate sõnade (alumine 10%) puhul oli vastuseid vaid kolmandik nii palju, kui arvati. juurde. Kotkad juhtusid sagedusega, mis oli lähemal 1/20-le kui 1/40, mis põhineb puhtal juhusel. Seega tundub, et Wordle'i vastuste jada ei ole hästi randomiseeritud ja see on kas algusest laaditud lihtsamate sõnadega või läbime loendi osa, mis koosneb lihtsamatest sõnadest.

Viimase aja oluline muudatus on see The New York Times määrati Wordle toimetajaks programmeerida päeva sõna alates 7. novembrist. Sellest ajast alates on raskete või solvavate sõnade eemaldamine eeljärjestusloendist muutunud tavalisemaks, sealhulgas selliste sõnade nagu "ombre", "oksendamine" ja "kulisside taga asendamine". fantastiline." Kuigi ma mõistan vajadust Times Wordle sõnade desinfitseerimiseks ja lihtsustamiseks, et vältida miljonite mängivate inimeste pahameelt, muudab see mängu vähem juhuslikuks ja palju prognoositavamaks. Veelgi hullem on toimetuse kahetsusväärne tendents viimastel nädalatel valida päevale sobiv sõna, näiteks "pidu" tänupühal ja "medal" veteranipäeval. See tähendab, et juba enne mängu algust antakse sõna kohta täiendav vihje, mis muudab mõistatuse lihtsamaks ja vähendab selle rikkalikku teabeteooria seost. Loodan, et see on ajutine kõrvalekalle, sest juhuslikkus on selle mängu oluline element. Enamik inimesi, kes andis tagasisidet et The New York Times nende toimetuse valikute kohta tundus sama.

Meie neljas mõistatus põhines asjaolul, et selle praeguse arhitektuuri kohaselt ei kordu Wordle'i lahendused kunagi enne, kui loend saab otsa umbes viie aasta pärast.

Mõistatus 4

Mõelge inimesele, kellel on täiuslik mälu mineviku lahendustest. Sellise inimese jaoks oleks vastus ilmne Wordle'i 2,309-sõnalise loendi viimasel päeval. Kas saate kiiresti hinnata, mitu auku see inimene ootaks kogu loendi kestuse jooksul ilma tegelikku arvutust tegemata? Seejärel proovige, kui saate, ja tehke tegelik arvutus.

Rob Corlett vastas sellele suurepäraselt, loogiliselt hinnates vastuseks 8.25 ja seejärel arvutades vastuseks 8.32. Corletti peamised arvutused on toodud allpool. Suurepärase hindamistehnika kohta saate vaadata kommentaari.

Kui teil on m sõnad ja sa arvad, siis on tõenäosus, et asi õigesti saad, 1/m. Kui teil on 1 sõna, on tõenäosus 1/1, 2 sõna 1/2, 3 sõna 1/3 jne. Kui liidate need kokku, saate oodatava holes-in-one arvu! …

[See] nõuab, et me arvutaksime kõigi arvude pöördarvude summa 2309-st 1-ni. Tegin seda arvutustabelis ja leidsin, et kogusumma on 8.32, mis on minu hinnangule rahuldavalt lähedane!

Meie viimane küsimus küsis, kuidas parandada Wordle'i sõnade randomiseerimist, säilitades samal ajal selle "kliendipoolse" kujunduse. Enne Wordle'i toimetaja ametisse nimetamist ei toimunud sõnade igapäevast randomiseerimist: sõnad pärinesid allalaaditud eeljärjestatud loendist, mis ei olnud väga hästi randomiseeritud, nagu ma eespool mainisin. Seejärel genereeriti kliendi (kasutaja) seadmes sõnaloendist olenevalt hetkekuupäevast Wordle lahendussõna ning kogu pusle otsustati ka kasutaja seadmes. Kood selle kõige tegemiseks laaditakse alla esimesel korral, kui kasutaja iga päev veebisaidiga ühenduse loob. Pärast seda ei pea kasutaja võrgus olema.

Küsimus 4

Kuidas kujundaksite Wordle'i nii, et see säilitaks kliendipoolse kujunduse, tagades, et kõik saavad antud päeval sama lahendussõna, kuid randomiseerib vastused mõistlikul viisil, ilma et oleks vaja koodi iga päev muuta?

Randomiseerimise küsimusele olid mõned head vastused. Paar lugejat soovitasid kasutada pseudojuhuslikku numbrit koos etteantud seemnega, et luua Wordle vastuste loendisse indeks. Mumintrollet kirjutas isegi programmi, mis segab juhuslikult viis Wordle'i vastuste loendit (32 aastat), tagades, et aasta jooksul ei korduks ükski sõna. Minu jaoks tuli kõige ahvatlevam protseduur BlindThemis, kes pakkus välja, et randomiseerimisprotseduuris kasutatav juhuslik seeme peaks olema teatud aja jooksul mängu mänginud inimeste arvu neli viimast numbrit. (Kuna Wordle'i saab mängida kõikjal maailmas, tuleks seda teha Vaikse ookeani idaosa ajavööndites, alates rahvusvahelisest kuupäevajoonest!) Suurepärane on see, et mitte keegi, isegi mitte New York Timesile Wordle'i toimetaja, teaks, mis sõna oli päev enne selle kasutamist.

Ühtegi neist mehhanismidest ei saa täielikult teha kliendi poolel, nagu Tim Ross välja toodud. Järgmise sõna peaks genereerima server ja see sõna või selle indeksi number tuleks alla laadida, võimalusel krüpteeritud kujul koos ülejäänud koodiga. Nagu Ross märkis, on praegu lähtekoodis selgelt nähtavad 2,309 vastussõna kuupäeva järjekorras, mida iga brauser võib paljastada. Üks võimalus võiks olla vastusesõnade loendi krüpteerimine ja selle salvestamine tähestikulises järjekorras, mitte kuupäeva järjekorras.

Kuigi soovitatud randomiseerimise täiustused aitaksid, pole krüpteerimisel mingit vahet, kuna Internetis on endiselt mitu spoilerit ja mitu võimalust petmiseks.

Aitäh kõigile, kes sellesse huvitavasse arutelusse kaasa aitasid. Selle pusle Insightsi auhinna saab Rob Corlett. Palju õnne! Meie järgmine pusle ilmub veebruaris. Seniks häid mõistatuslikke ja häid pühi!

Ajatempel:

Veel alates Kvantamagazin