Les mathématiques derrière Wordle devinent PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Les mathématiques derrière les suppositions Wordle

Introduction

Dans le jeu simple de Wordle, les joueurs doivent deviner un mot secret de cinq lettres en six tours ou moins en fonction d'indices sur la présence et l'emplacement des lettres révélés par leurs suppositions précédentes. Alors que des jeux quelque peu similaires sont apparus dans le passé, tous ceux qui jouent à Wordle un jour particulier doivent découvrir le même mot secret, ce qui facilite le partage de vos tentatives et la discussion du jeu entre amis. La structure et la présentation distinctives du jeu ont inspiré les questions de notre dernier Casse-tête. Les réponses sont discutées ci-dessous.

Une clé pour jouer à un bon jeu Wordle est de choisir un mot de départ fort. Analyses informatiques incorporant techniques de la théorie de l'information suggèrent que des mots de départ tels que "ardoise" et "grue" vous permettent (ou un algorithme informatique, en tout cas) de résoudre Wordles en un minimum de tours en moyenne. Cependant, de nombreux solveurs humains se sentent plus à l'aise de choisir un mot riche en voyelles comme «adieu», «audio» ou «augmenter». Ce sentiment a une base à la fois intuitive et rationnelle. Tout d'abord, les voyelles placées vous permettent de trouver une « colonne vertébrale » de voyelle qui peut limiter le nombre de consonnes que vous devez rechercher. Par exemple, si vous savez que le mot ressemble à _AI_E après avoir joué "raise", il ne reste que quelques mots possibles : "naïf", "renoncer" et "maïs". Deuxièmement, les voyelles maximisent une quantité qui peut être appelée "couverture" - entre seulement les cinq voyelles et Y, nous pouvons obtenir au moins une lettre positive dans chacune des 2,309 20 réponses. Pour obtenir ce genre de couverture parfaite avec des consonnes, vous devriez essayer les XNUMX d'entre elles, ce qui nécessiterait au moins cinq tours.

Notre premier casse-tête a mis les lecteurs au défi de déterminer lequel de ces trois mots riches en voyelles est la meilleure première estimation.

Puzzle 1 

Le tableau suivant donne la fréquence à laquelle les huit lettres des mots « adieu », « audio » et « raise » apparaissent dans chaque position sur l'ensemble de la liste de réponses Wordle de 2,309 XNUMX mots. Sur la base de ce tableau, déterminez combien de verts et de jaunes vous pouvez vous attendre à obtenir sur toute la liste de réponses Wordle pour chacun des trois mots de départ riches en voyelles : "adieu", "audio" et "raise". (Dans Wordle, une lettre est affichée avec un fond vert si elle est au bon endroit, et un fond jaune si elle est dans le mot mais au mauvais endroit.) Qu'est-ce que cela vous dit sur leurs performances attendues en tant que mots de départ ?

Reader Rob Corlet a montré comment calculer le nombre de verts et de jaunes attendus à partir de ce tableau. Pour "adieu", A est la première lettre correcte pour 140 mots, D est la deuxième lettre correcte pour 20 mots et ainsi de suite. Le nombre total de verts sur toutes les réponses Wordle possibles est la somme de ceux-ci. Donc "adieu" obtient un total de 140 + 20 + 266 + 318 + 1 = 745 verts. Pour les jaunes, il faut commencer par le nombre de fois où la lettre apparaît au moins une fois dans un mot (906 pour le A dans « adieu ») et soustraire les fois où elle est verte (140) pour obtenir le nombre de jaunes (766) . Additionnez les chiffres de chaque lettre du mot pour obtenir le nombre total de jaunes. Nous pouvons diviser ces nombres par le nombre total de réponses (2,309 XNUMX) pour obtenir l'attente des verts et des jaunes pour un seul tour, mais comme cette étape est commune à tous nos mots de départ, nous pouvons simplement travailler avec les totaux pour comparer les trois d'eux. Puisque nous avons choisi ces mots spécifiquement pour trouver une colonne vertébrale de voyelle, nous pouvons également calculer combien de verts proviennent de voyelles. Voici les résultats.

Comme vous pouvez le voir, il n'y a pas de comparaison ! "Raise" est supérieur à "adieu" dans toutes les mesures, donnant plus de verts et de jaunes et produisant plus de voyelles à leur place, sans parler du fait que vous attrapez ou excluez également deux des consonnes les plus courantes. "Audio" est un tiers éloigné sur toutes ces mesures. Notez que bien que vous puissiez obtenir des informations sur les lettres absentes même si vous n'obtenez pas de jaunes ou de verts, en tant que lecteur Max Davis souligné, vous obtenez certainement plus d'informations lorsque vous obtenez un ou plusieurs jaunes et verts. Alors, utilisateurs "adieu", il est peut-être temps de dire adieu.

Question 1

Il s'agissait d'une question sur la valeur que nous devrions accorder aux verts par rapport aux jaunes : combien de jaunes sont égaux à un seul vert ? La nature claire de nos résultats ci-dessus évite d'avoir à répondre à cette question pour la comparaison ci-dessus, mais c'est une question intéressante. Il y a deux aspects à cette valorisation. Le premier est l'aspect humain : quel poids accordez-vous à l'effort mental requis pour comprendre toutes les différentes façons dont une lettre jaune peut être placée ? Il est indéniable que frapper beaucoup de verts rend la vie plus facile et nous donne plus de boost de dopamine. Du point de vue de la théorie de l'information, vous auriez besoin de passer en revue chaque mot de départ pour chaque mot de réponse et de comparer le nombre de tours qu'il faudrait pour résoudre le puzzle lorsque les mêmes lettres étaient vertes par rapport au moment où elles étaient jaunes dans chaque cas.

Bien que ce soit une tâche énorme, j'ai réussi à le faire pour le meilleur mot de départ informatique possible (le mot obscur "tarse", qui signifie un faucon mâle, dont l'arbre de solution optimal complet a été posté en ligne par le mathématicien Alex Selby). La réponse est surprenante. Le nombre moyen de tours requis pour une solution informatique utilisant un mot de réponse qui ne produisait que des verts au premier tour était de 3.34, alors que le nombre de tours requis lorsqu'il n'y avait que des lettres jaunes était de 3.51, soit une augmentation de seulement 5 % ! De toute évidence, pour un algorithme informatique, placer les lettres jaunes, ce qui semble si intimidant pour nous, les humains, peut être réalisé sans trop de pénalité. Je suppose que la différence serait plus grande pour un solveur humain, non seulement dans le nombre de tours requis, mais aussi dans l'effort mental et le temps requis pour résoudre.

Puzzle 2

A) Si vous obtenez les cinq jaunes lors de votre premier tour, quel est le nombre maximum de tours qu'il faut pour trouver la réponse, en supposant le meilleur jeu ?

As Rob Corlet ainsi que le Sam Rhoads correctement énoncée, la réponse théorique est cinq : une combinaison entièrement jaune de lettres telle que ABCDE pourrait résister à la découverte pendant quatre tours supplémentaires, car vous devrez peut-être parcourir BCDEA, CDEAB et DEABC avant de découvrir que la réponse était EABCD. En pratique, cependant, de tels «mots» cycliques ne sont pas possibles précisément parce que les vrais mots ont défini des modèles de voyelles et de consonnes qui ne peuvent pas être étirés arbitrairement. Même les mots avec de nombreux anagrammes peuvent être résolus en trois essais au maximum, comme Rob Corlett l'a démontré avec "l'analyse".

B) Est-il jamais arrivé que le fait d'avoir une lettre dans une certaine position qui vire au jaune soit plus précieux que de la voir virer au vert ? Si oui, pouvez-vous donner un exemple et expliquer pourquoi cela devrait être le cas ?

Oui, une lettre apparaissant en jaune peut, dans de rares cas, avoir plus de valeur que la même lettre apparaissant en vert, s'il s'agit d'une lettre qui apparaît rarement dans les autres positions. Cela arrive souvent avec Y, qui se trouve majoritairement à la fin d'un mot. Supposons que vous commenciez par « ventre » et que B et Y apparaissent en vert. Il vous reste de nombreuses possibilités : "baggy", "bitty", "bobby", "booty", "bushy", etc. Mais si B et Y apparaissent tous les deux en jaune, il n'y a qu'une seule possibilité : "abyss".

Question 2

Une personne ayant un bon vocabulaire de mots obscurs du Scrabble a-t-elle un avantage ou un inconvénient à jouer à Wordle ?

En tant qu'ancien joueur de tournoi de Scrabble qui a passé pas mal d'heures à mémoriser des mots obscurs, je pense que c'est à la fois un avantage et un inconvénient. Lorsque j'ai commencé à jouer à Wordle, je me suis souvent retrouvé à voir la possibilité et à essayer d'exclure des mots inhabituels dont j'ai réalisé plus tard qu'ils n'avaient presque aucune chance d'être corrects. (Dans la terminologie du golf, que mon groupe Wordle utilise fréquemment, nous nous référons à cela comme étant bloqué par un danger imaginaire.) Comme je l'ai décrit dans la colonne de puzzle, les réponses Wordle sont tirées d'une liste de mots simples, dont la majorité sont connus. à tous les anglophones natifs américains. Même les mots peu courants mais pas obscurs ne figurent pas sur la liste de réponses de Wordle. Par exemple, j'ai récemment perdu un tour à jouer au "latex", un mot assez courant qui s'avère ne pas être une réponse Wordle possible. Ainsi, comme tous les joueurs de Wordle, j'ai dû construire un modèle mental du type de mot qui pourrait être une réponse Wordle et ignorer spécifiquement les types de mots rares et obscurs que j'utiliserais volontiers pour marquer plus de points au Scrabble. D'un autre côté, la connaissance de ces mots rares s'avère utile pour «balayer les consonnes», ce que vous devez parfois faire pour éviter de passer de nombreux tours à deviner un tas de mots similaires un par un. Par exemple, si vous avez _RA_E et que vous examinez un ensemble de mots possibles contenant D, G et K, tels que «brake», «drake», «drape», «grade» et «grape», il est utile de savoir et jouez le mot "kedge", qui peut garantir de trouver la solution en deux tours supplémentaires (kedge signifie déplacer un navire en jetant son ancre à distance puis en tirant dessus avec une corde solide).

Obtenir le même puzzle Wordle que tout le monde chaque jour encourage le jeu social. Mais les spoilers abondent sur internet, et on sait que certaines personnes trichent dans la communication de leurs scores. Le puzzle suivant traite de la question de savoir quand les soupçons de tricherie dans un groupe Wordle sont justifiés uniquement sur la base de l'improbabilité du score d'une personne. Encore une fois, ce puzzle est encadré en termes de score de golf : une solution Wordle en trois tours est appelée un birdie, l'obtenir en deux tours est un aigle et obtenir un mot au tout premier tour est, bien sûr, un trou en un. .)

Puzzle 3

Un critère scientifique traditionnel pour approfondir les recherches est de savoir si la probabilité qu'un résultat se produise par hasard (le valeur alpha) est inférieur à 5 % ou inférieur à 1 %, selon les objectifs des chercheurs. Le résultat est alors considéré comme statistiquement significatif au seuil de 5 % ou de 1 %. Puisqu'il n'est pas agréable de soupçonner les gens de tricherie alors qu'ils ne le sont pas, choisissons le niveau plus conservateur de 1 % dans cette enquête.

Supposons que vous appartenez à un groupe Wordle de 10 joueurs qui partagent des résultats entre eux tous les jours depuis 200 jours. Supposons qu'un très bon joueur humain puisse s'attendre à obtenir un birdie tous les 2.5 matchs, un eagle tous les 40 matchs et un trou d'un coup tous les 2,000 XNUMX matchs (qui sont des estimations raisonnables dans le monde réel).

A) Combien de birdies d'affilée seraient significatifs au seuil de 1 % dans votre groupe pendant cette période ?

B) Combien d'aigles d'affilée ?

C) Combien de trous en un d'affilée ?

La clé ici est de réaliser que vous avez une taille de population de 2,000 200,000 personnes-jeux. Ainsi, pour atteindre ce niveau d'importance, vous auriez besoin de voir un événement qui se produirait moins d'une fois sur XNUMX XNUMX parties par personne uniquement par hasard.

A) Séries de birdie ou mieux : La probabilité d'obtenir un birdie ou mieux dans une seule partie est de 2/5 + 1/40 + 1/2,000 0.4255 = 1, soit 2.35 sur environ XNUMX parties. Appelons ça B. La plus faible puissance de B qui dépasse 200,000 XNUMX est B15, soit plus de 368,000 XNUMX (B14 est d'environ 157,000 15). Ainsi, une séquence de birdie ou mieux de 14 ou plus pour n'importe qui dans le groupe satisferait à ce critère rigoureux, mais un sur 20,000 ne le ferait pas. Si vous soupçonniez un joueur individuel, vous auriez besoin de voir un événement qui se produit moins d'une fois sur 12 1,850 matchs, ce qui se produirait avec une séquence de 188 birdies ou mieux. (Notez que le nombre réel d'opportunités d'avoir des séquences de ces longueurs sont légèrement inférieures : il s'agit en fait de XNUMX XNUMX parties pour le groupe et de XNUMX parties pour le joueur individuel, mais cela ne fait aucune différence dans ce cas).

Notez que ce sont les fréquences pour les joueurs experts, et les séquences suspectes pour la plupart des groupes et des individus seraient plus petites. Pour appliquer ce critère dans la pratique, vous devez déterminer les fréquences de birdie, d'eagle et de trou d'un coup que vous voyez et également prendre en compte le nombre de matchs qui ont été joués dans votre groupe.

B) Séries Eagle ou mieux : La probabilité d'un aigle ou mieux est de 1/40 + 1/2,000 0.0255 = 1, soit environ 39.2 sur 4. Les longueurs de séquence qui dépassent notre niveau de signification sont de 3 pour le groupe et de XNUMX pour un individu suspecté.

C) Séries trou-en-un : La longueur de série qui dépasse notre niveau de signification est de 2 à la fois pour le groupe et pour un individu suspecté.

Il y a une mise en garde aux deux dernières réponses : ce sont des événements rares et la taille de l'échantillon est très petite, vous devez donc être prudent. La plupart des statisticiens attendraient généralement d'avoir vu au moins cinq cas ou plus d'aigles ou de trous d'un coup, pas nécessairement dans le cadre d'une série, avant de se sentir à l'aise d'appliquer un test de signification.

Question 3

Il est tout à fait possible que la fréquence des bons résultats dans votre groupe soit nettement supérieure à la fréquence prédite par hasard, sans que personne ne triche. Comment expliqueriez-vous cela ?

Une raison possible à cela, comme Rob Corlet explique, pourrait être que "les joueurs tiennent tous des registres assidus de chaque résultat". Comme je l'ai expliqué dans le prélude du puzzle 4, les réponses Wordle ne doivent pas être répétées pendant environ cinq ans dans la configuration actuelle. Ainsi, même si personne ne triche ou ne connaît tous les mots de la liste de réponses, ces informations peuvent toujours aider tout individu ou groupe à mieux performer progressivement.

Mais il y a aussi une autre raison : la liste peut ne pas être bien randomisée. En jouant à Wordle au cours des derniers mois, j'ai remarqué que chaque fois qu'il y avait un choix entre deux mots ou plus, les mots les plus simples étaient plus susceptibles d'être corrects que les mots les moins courants. Par exemple, si vous aviez A, N et E et que les choix restants étaient des mots comme « se faufiler », « hyène » et « lavement », vous pourriez sans hésiter jouer le mot le plus simple (« se faufiler » dans ce cas) et vous seriez corriger beaucoup plus souvent que vous ne le pensez par pur hasard. En fait, j'ai utilisé une liste de fréquences de mots en prose en anglais pour vérifier la fréquence des réponses que je rencontrais sur deux mois par rapport à un mot moyen dans la liste de réponses Wordle. Les réponses que j'ai rencontrées étaient environ 25 % plus fréquentes que le mot moyen sur la liste de réponses Wordle, et plus important encore, pour les mots les plus rares de la liste (les 10 % inférieurs), seulement un tiers du nombre de réponses apparaissant comme supposé à. Les Eagles se sont produits avec une fréquence plus proche de 1/20 plutôt que de 1/40 basée sur le pur hasard. Il semble donc que la séquence de réponses Wordle ne soit pas bien randomisée, et soit elle est chargée en amont avec des mots plus simples, soit nous parcourons une partie de la liste qui se compose de mots plus simples.

Un changement récent important est que The New York Times nommé éditeur Wordle pour programmer le mot du jour à partir du 7 novembre. Depuis, la suppression des mots difficiles ou offensants de la liste pré-séquencée est devenue plus courante, avec notamment le remplacement, en coulisses, de mots comme « ombre », « vomi » et « chatte." Même si je comprends la nécessité de Horaires pour assainir et simplifier les mots Wordle pour éviter l'indignation des millions de personnes qui jouent, cela rend le jeu moins aléatoire et d'autant plus prévisible. Pire encore, la tendance éditoriale malheureuse des dernières semaines à choisir un mot en fonction de la journée, comme «fête» le jour de Thanksgiving et «médaille» le jour des anciens combattants. Cela revient à donner un indice supplémentaire sur le mot avant même que le jeu ne commence, ce qui rend le puzzle plus facile et nuit à sa riche connexion à la théorie de l'information. J'espère que c'est une aberration temporaire car le hasard est un élément essentiel de ce jeu. La plupart des gens qui a donné des commentaires à The New York Times à propos de ces choix éditoriaux ressentait la même chose.

Notre quatrième puzzle était basé sur le fait que, dans son architecture actuelle, les solutions Wordle ne se répéteront jamais tant que la liste ne sera pas épuisée après environ cinq ans.

Puzzle 4

Considérez une personne avec une mémoire parfaite des solutions passées. Pour une telle personne, la réponse serait évidente le dernier jour de la liste de 2,309 XNUMX mots de Wordle. Pouvez-vous estimer rapidement le nombre de trous d'un coup que cette personne s'attendrait à obtenir sur la durée de toute la liste, sans faire le calcul proprement dit ? Ensuite, si vous le pouvez, essayez de faire le calcul réel.

Rob Corlet répondu parfaitement, estimant logiquement la réponse à 8.25, puis calculant la réponse à 8.32. Les principaux calculs de Corlett sont cités ci-dessous. Vous pouvez vérifier le commentaire pour l'excellente technique d'estimation.

Si vous avez m mots et que vous devinez, alors les chances de bien faire les choses sont 1/m. Si vous avez 1 mot, les chances sont de 1/1, 2 mots 1/2, 3 mots 1/3, etc. Si vous les additionnez, vous obtenez le nombre attendu de trous en un ! …

[Cela] nécessite que nous calculions la somme des inverses de tous les nombres de 2309 à 1. Je l'ai fait dans une feuille de calcul et j'ai trouvé que le total était de 8.32, ce qui est assez proche de mon estimation !

Notre dernière question demandait comment améliorer la randomisation des mots de Wordle tout en gardant sa conception « côté client ». Avant la nomination de l'éditeur Wordle, il n'y avait pas de randomisation des mots au jour le jour : les mots provenaient d'une liste pré-séquencée téléchargée qui n'était pas très bien randomisée, comme je l'ai mentionné ci-dessus. Ensuite, le mot de solution de Wordle a été généré sur l'appareil du client (utilisateur) à partir de la liste de mots en fonction de la date actuelle, et l'ensemble du puzzle a également été jugé sur l'appareil de l'utilisateur. Le code pour faire tout cela est téléchargé la toute première fois qu'un utilisateur se connecte au site Web chaque jour. L'utilisateur n'a pas besoin d'être en ligne par la suite.

Question 4

Comment concevriez-vous Wordle de manière à ce qu'il conserve la conception côté client, en veillant à ce que tout le monde reçoive le même mot de solution un jour donné, mais en randomisant les réponses de manière sensée sans nécessiter de modification du code tous les jours ?

Il y avait quelques bonnes réponses à la question de randomisation. Quelques lecteurs ont suggéré d'utiliser un nombre pseudo-aléatoire avec une graine prédéfinie pour créer un index dans la liste de réponses Wordle. Mumintrollet a même écrit un programme qui mélange au hasard cinq listes de réponses Wordle (d'une durée de 32 ans), en s'assurant qu'aucun mot ne se répète pendant un an. Pour moi, la procédure la plus attrayante est venue de AveugleThémis, qui a suggéré que la graine aléatoire utilisée pour la procédure de randomisation devrait être les quatre derniers chiffres du nombre de personnes qui ont joué au jeu à un certain moment. (Puisque Wordle peut être joué n'importe où dans le monde, cela devrait être fait dans les fuseaux horaires du Pacifique oriental, à partir de la ligne de changement de date internationale !) La grande chose à ce sujet est que personne, pas même le L'éditeur Wordle saura quel était le mot la veille de son utilisation.

Aucun de ces mécanismes ne peut être entièrement réalisé côté client, car Tim Ross souligné. Le mot suivant devrait être généré par le serveur, et ce mot ou son numéro d'index devrait être téléchargé, éventuellement sous forme chiffrée avec le reste du code. Comme l'a souligné Ross, actuellement les 2,309 XNUMX mots de réponse sont clairement visibles dans l'ordre des dates dans le code source, ce que n'importe quel navigateur peut révéler. Une approche pourrait consister à crypter la liste de mots de réponse et à l'enregistrer dans l'ordre alphabétique plutôt que dans l'ordre des dates.

Bien que les améliorations suggérées en matière de randomisation soient utiles, le cryptage ne fera aucune différence, car il y aura toujours plusieurs spoilers sur Internet et plusieurs façons de tricher.

Merci à tous ceux qui ont contribué à cette discussion intéressante. Le prix Insights pour ce puzzle revient à Rob Corlett. Toutes nos félicitations! Notre prochain puzzle apparaîtra en février. D'ici là, bonnes énigmes et bonnes vacances !

Horodatage:

Plus de Quantamamagazine