Las matemáticas detrás de Wordle adivinan la inteligencia de datos de PlatoBlockchain. Búsqueda vertical. Ai.

Las matemáticas detrás de Wordle Guesses

Introducción

En el sencillo juego de Wordle, los jugadores tienen que adivinar una palabra secreta de cinco letras en seis turnos o menos basándose en pistas sobre la presencia y ubicación de las letras reveladas por sus conjeturas anteriores. Si bien en el pasado aparecieron juegos algo similares, todos los que juegan Wordle en un día en particular tienen que descubrir la misma palabra secreta, lo que facilita compartir sus intentos y discutir el juego entre sus amigos. La estructura distintiva y la presentación del juego inspiraron las preguntas en nuestro último Rompecabezas de ideas. Las respuestas se discuten a continuación.

Una clave para jugar un buen juego de Wordle es elegir una palabra inicial fuerte. Análisis informáticos que incorporan tecnicas de teoria de la informacion sugiera que las palabras iniciales como "pizarra" y "grúa" le permitan (o un algoritmo de computadora, en cualquier caso) resolver Wordles en el menor número de vueltas en promedio. Sin embargo, muchos solucionadores humanos se sienten más cómodos eligiendo una palabra rica en vocales como "adieu", "audio" o "raise". Este sentimiento tiene una base tanto intuitiva como racional. Primero, las vocales colocadas le permiten encontrar una "columna vertebral" de vocales que puede restringir la cantidad de consonantes que necesita buscar. Por ejemplo, si sabe que la palabra se parece a _AI_E después de tocar "aumentar", solo quedan algunas palabras posibles: "ingenuo", "renunciar" y "maíz". En segundo lugar, las vocales maximizan una cantidad que se puede llamar "cobertura": entre solo las cinco vocales y la Y, podemos obtener al menos una letra positiva en cada una de las 2,309 respuestas. Para obtener este tipo de cobertura perfecta con consonantes, tendría que probar las 20, lo que requeriría al menos cinco vueltas.

Nuestro primer acertijo desafió a los lectores a descubrir cuál de estas tres palabras ricas en vocales es la mejor primera suposición.

Puzzle 1 

La siguiente tabla muestra la frecuencia con la que las ocho letras de las palabras "adieu", "audio" y "raise" aparecen en cada posición en toda la lista de respuestas de Wordle de 2,309 palabras. Con base en esta tabla, determine cuántos verdes y amarillos puede esperar obtener en toda la lista de respuestas de Wordle para cada una de las tres palabras iniciales ricas en vocales: "adieu", "audio" y "raise". (En Wordle, una letra se muestra con un fondo verde si está en el lugar correcto, y un fondo amarillo si está en la palabra pero en el lugar equivocado). ¿Qué le dice esto sobre su rendimiento esperado como palabras iniciales? ?

Testimoniales Rob Corlett mostró cómo calcular el número de verdes y amarillos esperados de esta tabla. Para “adieu”, A es la primera letra correcta para 140 palabras, D es la segunda letra correcta para 20 palabras y así sucesivamente. El número total de verdes sobre todas las posibles respuestas de Wordle es la suma de estas. Entonces “adieu” obtiene un total de 140 + 20 + 266 + 318 + 1 = 745 verdes. Para los amarillos, tenemos que empezar con el número de veces que la letra aparece al menos una vez en una palabra (906 para la A en “adieu”) y restar las veces que es verde (140) para obtener el número de amarillos (766) . Suma los números de cada letra de la palabra para obtener el número total de amarillos. Podemos dividir estos números por el número total de respuestas (2,309) para obtener la expectativa de verdes y amarillos para un solo turno, pero dado que este paso es común para todas nuestras palabras iniciales, podemos trabajar con los totales para comparar los tres de ellos. Dado que hemos elegido estas palabras específicamente para encontrar una columna vertebral de vocales, también podemos calcular cuántos de los verdes provienen de las vocales. Aquí están los resultados.

Como puedes ver, ¡no hay comparación! "Raise" es superior a "adieu" en todas las medidas, dando más verdes y amarillos y produciendo más vocales en los lugares correctos, por no hablar del hecho de que también estás captando o descartando dos de las consonantes más comunes. "Audio" es un distante tercero en todas estas medidas. Tenga en cuenta que, si bien puede obtener información sobre qué letras están ausentes, incluso si no obtiene amarillos o verdes, como lector max davies señaló, definitivamente obtiene más información cuando obtiene uno o más amarillos y verdes. Entonces, usuarios de "adieu", tal vez sea hora de decir adieu.

Pregunta 1

Esta era una pregunta sobre cuánto deberíamos valorar los verdes en relación con los amarillos: ¿cuántos amarillos equivalen a un solo verde? La naturaleza clara de nuestros resultados anteriores obvia la necesidad de responder esto para la comparación anterior, pero es una pregunta interesante. Hay dos aspectos en esta valoración. El primero es el aspecto humano: ¿Cuánto peso le das al esfuerzo mental requerido para descifrar las diferentes formas en que se puede colocar una letra amarilla? No se puede negar que golpear muchos greens hace la vida más fácil y nos da más dopamina. Desde el punto de vista de la teoría de la información, necesitaría repasar cada palabra inicial para cada palabra de respuesta y comparar cuántos turnos se necesitarían para resolver el acertijo cuando las mismas letras eran verdes en comparación con cuando eran amarillas en todos los casos.

Si bien esta es una tarea enorme, me las arreglé para hacerlo con la mejor palabra de inicio de computadora posible (la oscura palabra "tarse", que significa un halcón macho, cuyo árbol de solución óptima completo ha sido publicado en línea por el matemático Alex Selby). La respuesta es sorprendente. La cantidad promedio de vueltas requeridas para una solución de computadora usando una palabra de respuesta que produjo solo verdes en la primera vuelta fue 3.34, mientras que la cantidad de vueltas requeridas cuando solo hubo letras amarillas fue 3.51, ¡un aumento de solo 5%! Evidentemente, para un algoritmo de computadora, colocar las letras amarillas, que parece tan intimidante para nosotros los humanos, se puede lograr sin demasiada penalización. Supongo que la diferencia sería mayor para un solucionador humano no solo en la cantidad de vueltas requeridas, sino también en el esfuerzo mental y el tiempo requerido para resolver.

Puzzle 2

A) Si obtiene las cinco amarillas en su primer turno, ¿cuál es el número máximo de turnos que puede tomar para encontrar la respuesta, asumiendo la mejor jugada?

As Rob Corlett y sam rhoads dicho correctamente, la respuesta teórica es cinco: una combinación completamente amarilla de letras como ABCDE podría resistir el descubrimiento durante cuatro turnos más, ya que es posible que tengas que pasar por BCDEA, CDEAB y DEABC antes de descubrir que la respuesta era EABCD. En la práctica, sin embargo, tales "palabras" cíclicas no son posibles precisamente porque las palabras reales tienen patrones definidos de vocales y consonantes que no se pueden estirar arbitrariamente. Incluso las palabras con muchos anagramas se pueden resolver en no más de tres intentos, como lo demostró Rob Corlett con "parse".

B) ¿Sucede alguna vez que tener una letra en una determinada posición que se vuelve amarilla es más valioso que ver que se vuelve verde? Si es así, ¿puede dar un ejemplo y explicar por qué debería ser así?

Sí, una letra que sale amarilla puede, en casos excepcionales, ser más valiosa que la misma letra que sale verde, si es una letra que rara vez aparece en las otras posiciones. Esto sucede a menudo con Y, que se encuentra abrumadoramente al final de una palabra. Suponga que comienza con "vientre", y tanto B como Y aparecen en verde. Te quedan muchas posibilidades: "holgado", "pequeño", "bobby", "botín", "tupido", etc. Pero si tanto la B como la Y aparecen en amarillo, solo hay una posibilidad: "abismo".

Pregunta 2

¿Una persona con un buen vocabulario de palabras oscuras de Scrabble tiene una ventaja o una desventaja al jugar Wordle?

Como exjugador de torneos de Scrabble que pasó bastantes horas memorizando palabras oscuras, creo que es tanto una ventaja como una desventaja. Cuando comencé a jugar Wordle, me encontré con frecuencia viendo la posibilidad de descartar palabras poco comunes que luego me di cuenta de que casi no tenían posibilidades de ser correctas. (En la terminología del golf, que mi grupo de Wordle usa con frecuencia, nos referimos a esto como estar bloqueado por un peligro imaginario). Como describí en la columna del rompecabezas, las respuestas de Wordle se obtienen de una lista de palabras simples, la mayoría de las cuales son a todos los hablantes nativos de inglés de EE. UU. Incluso las palabras que son poco comunes pero no oscuras no están en la lista de respuestas de Wordle. Por ejemplo, hace poco desperdicié un turno jugando "látex", una palabra bastante común que resulta no ser una posible respuesta de Wordle. Entonces, como todos los jugadores de Wordle, tuve que construir un modelo mental del tipo de palabra que podría ser una respuesta de Wordle e ignorar específicamente los tipos de palabras raras y oscuras que felizmente usaría para ganar más puntos en Scrabble. Por otro lado, el conocimiento de estas palabras raras es útil en el "barrido de consonantes", que a veces tienes que hacer para evitar pasar muchos turnos adivinando un montón de palabras similares una por una. Por ejemplo, si tiene _RA_E y está buscando un montón de posibles palabras que contienen D, G y K, como "freno", "drake", "drape", "grade" y "grape", es útil saber y juegue la palabra "kedge", que puede garantizar encontrar la solución en dos turnos más (kedge significa mover un barco soltando su ancla a distancia y luego tirando de él con una cuerda resistente).

Obtener el mismo rompecabezas de Wordle que todos los demás todos los días fomenta el juego social. Pero los spoilers abundan en internet, y se sabe que algunas personas hacen trampa en el reporte de sus puntajes. El siguiente acertijo trata sobre la cuestión de cuándo se justifican las sospechas de hacer trampa en un grupo de Wordle basándose únicamente en la improbabilidad de la puntuación de una persona. Nuevamente, este acertijo se enmarca en términos de puntuación de golf: una solución de Wordle en tres turnos se denomina birdie, obtenerlo en dos turnos es un águila y obtener una palabra en el primer turno es, por supuesto, un hoyo en uno. .)

Puzzle 3

Un criterio científico tradicional para seguir investigando es si la probabilidad de que un resultado ocurra por casualidad (el valor alfa) es inferior al 5% o inferior al 1%, dependiendo de los objetivos de los investigadores. Entonces se considera que el resultado es estadísticamente significativo al nivel del 5% o del 1%. Dado que no es bueno sospechar que las personas hacen trampa cuando no lo hacen, elijamos el nivel más conservador del 1% en esta investigación.

Supongamos que pertenece a un grupo de Wordle de 10 jugadores que han estado compartiendo resultados todos los días durante 200 días. Suponga que un muy buen jugador humano puede esperar conseguir un birdie cada 2.5 juegos, un águila cada 40 juegos y un hoyo en uno cada 2,000 juegos (que son estimaciones razonables del mundo real).

A) ¿Cuántos birdies seguidos serían significativos al nivel del 1% en su grupo durante este tiempo?

B) ¿Cuántas águilas en fila?

C) ¿Cuántos hoyos en uno seguidos?

La clave aquí es darse cuenta de que tiene un tamaño de población de 2,000 juegos de personas. Por lo tanto, para alcanzar este nivel de significancia, necesitaría ver un evento que ocurriría menos de una vez en 200,000 juegos de personas únicamente por casualidad.

A) Rachas de birdie o mejor: la probabilidad de obtener un birdie o mejor en un solo juego es 2/5 + 1/40 + 1/2,000 = 0.4255, que es 1 en aproximadamente 2.35 juegos. llamemos a esto B. La potencia más baja de B que supera los 200,000 es B15, que es más de 368,000 (B14 es alrededor de 157,000). Entonces, una racha de birdie o mejor de 15 o más para cualquiera en el grupo cumpliría con este estricto criterio, pero una de 14 no lo haría. Si sospechaba de un jugador individual, necesitaría ver un evento que ocurra con menos frecuencia que una vez en 20,000 juegos, lo que sucedería con una racha de 12 birdie o mejor. (Tenga en cuenta que la cantidad real de oportunidades para tener rachas de estas duraciones es un poco menor: en realidad son 1,850 juegos para el grupo y 188 juegos para el jugador individual, pero eso no hace la diferencia en este caso).

Tenga en cuenta que estas son las frecuencias para jugadores expertos, y las rachas sospechosas para la mayoría de los grupos e individuos serían más pequeñas. Para aplicar este criterio en la práctica necesitarías determinar las frecuencias correspondientes de birdie, eagle y hoyo en uno que estás viendo y también tener en cuenta el número de juegos que se han jugado en tu grupo.

B) Rachas de águila o mejor: la probabilidad de que salga un águila o mejor es 1/40 + 1/2,000 = 0.0255, o aproximadamente 1 en 39.2. Las longitudes de racha que exceden nuestro nivel de significación son 4 para el grupo y 3 para un individuo sospechoso.

C) Rayas de hoyo en uno: La longitud de la racha que excede nuestro nivel de significación es 2 tanto para el grupo como para un individuo sospechoso.

Hay una advertencia para las últimas dos respuestas: estos son eventos raros y el tamaño de la muestra es muy pequeño, por lo que debe tener cuidado. La mayoría de los estadísticos generalmente esperarían hasta haber visto al menos cinco o más instancias de águilas o hoyos en uno, no necesariamente como parte de una racha, antes de sentirse cómodos aplicando una prueba de significancia.

Pregunta 3

Es muy posible que la frecuencia de buenos resultados en su grupo sea significativamente mayor que la frecuencia predicha por casualidad, sin que nadie haga trampa. ¿Cómo explicarías esto?

Una posible razón de esto, como Rob Corlett explica, podría ser que “todos los jugadores llevan un registro asiduo de cada resultado”. Como expliqué en el preludio del acertijo 4, las respuestas de Wordle no se repetirán durante aproximadamente cinco años con la configuración actual. Entonces, incluso si nadie hace trampa o sabe todas las palabras en la lista de respuestas, esta información aún puede ayudar a cualquier individuo o grupo a desempeñarse mejor gradualmente.

Pero también hay otra razón: es posible que la lista no esté bien aleatoria. Al jugar Wordle durante los últimos meses, noté que cada vez que había que elegir entre dos o más palabras, las palabras más simples tenían más probabilidades de ser correctas que las palabras menos comunes. Por ejemplo, si tuviera A, N y E y las opciones restantes fueran palabras como "furtivo", "hiena" y "enema", podría reproducir sin vacilar la palabra más simple ("furtivo" en este caso) y estaría corregir mucho más a menudo de lo que cabría esperar por pura casualidad. De hecho, utilicé una lista de frecuencia de palabras en prosa en inglés para comprobar qué tan comunes eran las respuestas que encontraba durante dos meses en comparación con una palabra promedio en la lista de respuestas de Wordle. Las respuestas que encontré fueron aproximadamente un 25 % más comunes que la palabra promedio en la lista de respuestas de Wordle y, lo que es más importante, para las palabras más raras de la lista (el 10 % inferior), solo apareció un tercio de las respuestas que se suponía a. Eagles sucedió con una frecuencia más cercana a 1/20 en lugar de 1/40 basada en pura casualidad. Por lo tanto, parece que la secuencia de respuestas de Wordle no está bien aleatorizada, y o está cargada al frente con palabras más simples o estamos revisando una parte de la lista que consta de palabras más simples.

Un cambio reciente significativo es que The New York Times nombrado editor de Wordle para programar la palabra del día a partir del 7 de noviembre. Desde entonces, la eliminación de palabras difíciles u ofensivas de la lista presecuenciada se ha vuelto más común, incluido el reemplazo, entre bastidores, de palabras como “ombre”, “vomit” y “ coño." Si bien entiendo la necesidad de la Equipos para desinfectar y simplificar las palabras de Wordle para evitar la indignación de los millones de personas que juegan, hace que el juego sea menos aleatorio y mucho más predecible. Peor aún es la desafortunada tendencia editorial de las últimas semanas de elegir una palabra que se adapte al día, como "fiesta" en el Día de Acción de Gracias y "medalla" en el Día de los Veteranos. Esto equivale a dar una pista adicional sobre la palabra incluso antes de que comience el juego, lo que facilita el rompecabezas y resta valor a su rica conexión teórica de información. Espero que esto sea una aberración temporal porque la aleatoriedad es un elemento esencial de este juego. La mayoría de las personas que dio retroalimentación a The New York Times acerca de estas elecciones editoriales sentía lo mismo.

Nuestro cuarto acertijo se basó en el hecho de que, bajo su arquitectura actual, las soluciones de Wordle nunca se repetirán hasta que la lista se agote después de cinco años más o menos.

Puzzle 4

Considere a una persona con una memoria perfecta de soluciones pasadas. Para esa persona, la respuesta sería obvia el último día de la lista de 2,309 palabras de Wordle. ¿Puedes estimar rápidamente cuántos hoyos en uno esperaría obtener esta persona durante la duración de la lista completa, sin hacer el cálculo real? Luego, si puede, intente hacer el cálculo real.

Rob Corlett Respondió esto perfectamente, estimando lógicamente que la respuesta era 8.25 y luego calculando que la respuesta era 8.32. Los cálculos clave de Corlett se citan a continuación. Puede consultar el comentario para conocer la excelente técnica de estimación.

Si tiene m palabras y adivinas, entonces las posibilidades de acertar son 1/m. Si tiene 1 palabra, las posibilidades son 1/1, 2 palabras 1/2, 3 palabras 1/3, etc. Si las suma, obtendrá el número esperado de hoyos en uno. …

[Esto] necesita que calculemos la suma de los recíprocos de todos los números desde 2309 hasta 1. Hice esto en una hoja de cálculo y encontré que el total es 8.32, ¡satisfactoriamente cerca de mi estimación!

Nuestra última pregunta se refería a cómo mejorar la aleatorización de palabras de Wordle manteniendo su diseño del "lado del cliente". Antes de que se nombrara al editor de Wordle, no había una aleatorización diaria de las palabras: las palabras procedían de una lista presecuenciada descargada que no estaba muy bien aleatorizada, como mencioné anteriormente. Luego, la palabra de solución de Wordle se generó en el dispositivo del cliente (usuario) a partir de la lista de palabras, según la fecha actual, y también se adjudicó todo el rompecabezas en el dispositivo del usuario. El código para hacer todo esto se descarga la primera vez que un usuario se conecta al sitio web todos los días. El usuario no tiene que estar en línea a partir de entonces.

Pregunta 4

¿Cómo diseñaría Wordle para que mantenga el diseño del lado del cliente, asegurándose de que todos obtengan la misma palabra de solución en un día determinado, pero aleatorice las respuestas de manera sensata sin requerir un cambio en el código todos los días?

Hubo algunas buenas respuestas a la pregunta de aleatorización. Un par de lectores sugirieron usar un número pseudoaleatorio con una semilla predefinida para crear un índice en la lista de respuestas de Wordle. mumintrollet incluso escribió un programa que baraja aleatoriamente cinco listas de respuestas de Wordle (que duran 32 años), asegurándose de que ninguna palabra se repita en un año. Para mí, el procedimiento más atractivo vino de CiegoThemis, quien sugirió que la semilla aleatoria utilizada para el procedimiento de aleatorización debería ser los últimos cuatro dígitos del número de personas que han jugado el juego en un tiempo determinado. (Dado que Wordle se puede jugar en cualquier parte del mundo, esto tendría que hacerse en zonas horarias sobre el Pacífico oriental, ¡comenzando desde la línea de fecha internacional!) Lo bueno de esto es que nadie, ni siquiera el New York Times Editor de Wordle, sabría cuál era la palabra el día antes de que se usara.

Ninguno de estos mecanismos se puede realizar completamente en el lado del cliente, ya que tim ross señaló El servidor tendría que generar la siguiente palabra, y esta palabra o su número de índice tendrían que descargarse, posiblemente en forma encriptada con el resto del código. Como señaló Ross, actualmente las 2,309 palabras de respuesta son claramente visibles en orden de fecha en el código fuente, que cualquier navegador puede revelar. Un enfoque podría ser cifrar la lista de palabras de respuesta y guardarla en orden alfabético en lugar de por fecha.

Si bien las mejoras sugeridas en la aleatorización ayudarían, el cifrado no hará ninguna diferencia, ya que aún habrá múltiples spoilers en Internet y múltiples formas de hacer trampa.

Gracias a todos los que contribuyeron a esta interesante discusión. El premio Insights para este rompecabezas es para Rob Corlett. ¡Felicidades! Nuestro próximo rompecabezas aparecerá en febrero. Hasta entonces, ¡feliz puzle y felices fiestas!

Sello de tiempo:

Mas de Revista Quanta