A matemática por trás das suposições do Wordle

Republicado por Platão

seguidores: 0

No jogo simples de Wordle, os jogadores precisam adivinhar uma palavra secreta de cinco letras em seis ou menos turnos com base em pistas sobre a presença e localização das letras reveladas por suas suposições anteriores. Embora jogos um tanto semelhantes tenham aparecido no passado, todos que jogam Wordle em um determinado dia precisam descobrir a mesma palavra secreta, facilitando o compartilhamento de suas tentativas e a discussão do jogo entre seus amigos. A estrutura distinta e a apresentação do jogo inspiraram as perguntas em nosso último Quebra-cabeça de insights. As respostas são discutidas abaixo.

Uma chave para jogar um bom jogo Wordle é escolher uma palavra inicial forte. Análises de computador incorporando técnicas de teoria da informação sugerem que palavras iniciais como “ardósia” e “guindaste” permitem que você (ou um algoritmo de computador, pelo menos) resolva Wordles no menor número de voltas em média. No entanto, muitos solucionadores humanos se sentem mais à vontade para escolher uma palavra rica em vogais, como “adieu”, “áudio” ou “aumento”. Esse sentimento tem uma base intuitiva e racional. Primeiro, as vogais colocadas permitem que você encontre uma “espinha dorsal” vogal que pode restringir o número de consoantes que você precisa procurar. Por exemplo, se você sabe que a palavra se parece com _AI_E depois de jogar “raise”, restam apenas algumas palavras possíveis: “naïve”, “waive” e “maize”. Em segundo lugar, as vogais maximizam uma quantidade que pode ser chamada de “cobertura” — entre apenas as cinco vogais e Y, podemos obter pelo menos uma letra positiva em cada uma das 2,309 respostas. Para obter esse tipo de cobertura perfeita com consoantes, você teria que tentar todas as 20 delas, o que exigiria pelo menos cinco voltas.

Nosso primeiro quebra-cabeça desafiou os leitores a descobrir qual dessas três palavras ricas em vogais é o melhor primeiro palpite.

Quebra-cabeça 1

A tabela a seguir mostra a frequência com que as oito letras das palavras “adieu”, “audio” e “raise” ocorrem em cada posição em toda a lista de respostas do Wordle de 2,309 palavras. Com base nesta tabela, determine quantos verdes e amarelos você pode esperar obter em toda a lista de respostas do Wordle para cada uma das três palavras iniciais ricas em vogais: “adieu”, “áudio” e “aumentar”. (No Wordle, uma letra é mostrada com um fundo verde se estiver no lugar certo e um fundo amarelo se estiver na palavra, mas no lugar errado.) O que isso lhe diz sobre o desempenho esperado como palavras iniciais ?

Leitor Rob Corlett mostrou como calcular o número de verdes e amarelos esperados nesta tabela. Para “adieu”, A é a primeira letra correta para 140 palavras, D é a segunda letra correta para 20 palavras e assim por diante. O número total de verdes em todas as respostas possíveis do Wordle é a soma destes. Então “adieu” obtém um total de 140 + 20 + 266 + 318 + 1 = 745 verdes. Para amarelos, temos que começar com o número de vezes que a letra ocorre pelo menos uma vez em uma palavra (906 para o A em “adieu”) e subtrair as vezes que ela é verde (140) para obter o número de amarelos (766) . Some os números de cada letra da palavra para obter o número total de amarelos. Podemos dividir esses números pelo número total de respostas (2,309) para obter a expectativa de verdes e amarelos para um único turno, mas como essa etapa é comum para todas as nossas palavras iniciais, podemos apenas trabalhar com os totais para comparar as três deles. Como escolhemos essas palavras especificamente para encontrar um backbone vocálico, também podemos calcular quantos verdes vêm de vogais. Aqui estão os resultados.

Como você pode ver, não há comparação! “Raise” é superior a “dieu” em todas as medidas, dando mais verdes e amarelos e produzindo mais vogais em seus devidos lugares, para não falar do fato de que você também está pegando ou descartando duas das consoantes mais comuns. “Áudio” é um distante terceiro lugar em todas essas medidas. Observe que, embora você possa obter algumas informações sobre quais letras estão ausentes, mesmo que não obtenha nenhum amarelo ou verde, conforme o leitor Max Davies apontou, você definitivamente obtém mais informações quando obtém um ou mais amarelos e verdes. Então, “adeus” usuários, talvez seja hora de dizer adeus.

Pergunta 1

Esta foi uma pergunta sobre o quanto devemos valorizar os verdes em relação aos amarelos: quantos amarelos são iguais a um único verde? A natureza clara de nossos resultados acima evita a necessidade de responder a isso para a comparação acima, mas é uma questão interessante. Há dois aspectos nessa avaliação. O primeiro é o aspecto humano: quanto peso você dá ao esforço mental necessário para descobrir todas as diferentes maneiras pelas quais uma letra amarela pode ser colocada? Não há como negar que comer muitos verdes torna a vida mais fácil e nos dá um aumento de dopamina. Do ponto de vista da teoria da informação, você precisaria revisar cada palavra inicial para cada palavra de resposta e comparar quantas voltas seriam necessárias para resolver o quebra-cabeça quando as mesmas letras fossem verdes em comparação com quando fossem amarelas em todas as instâncias.

Embora esta seja uma tarefa enorme, consegui fazê-la para a melhor palavra inicial de computador possível (a palavra obscura “tarse”, que significa um falcão macho, cuja árvore de solução ideal completa foi publicado on-line pelo matemático Alex Selby). A resposta é surpreendente. O número médio de voltas necessárias para uma solução de computador usando uma palavra de resposta que produziu apenas verdes na primeira volta foi de 3.34, enquanto o número de voltas necessárias quando havia apenas letras amarelas foi de 3.51, um aumento de apenas 5%! Evidentemente, para um algoritmo de computador, colocar as letras amarelas, que parecem tão intimidadoras para nós, humanos, pode ser feito sem muita penalidade. Eu imagino que a diferença seria maior para um solucionador humano não apenas no número de voltas necessárias, mas também no esforço mental e no tempo necessário para resolver.

Quebra-cabeça 2

A) Se você conseguir todos os cinco amarelos em seu primeiro turno, qual é o número máximo de turnos que pode levar para encontrar a resposta, assumindo a melhor jogada?

As Rob Corlett e Sam Rhoads declarada corretamente, a resposta teórica é cinco: Uma combinação totalmente amarela de letras, como ABCDE, poderia resistir à descoberta por mais quatro voltas, pois você pode ter que percorrer BCDEA, CDEAB e DEABC antes de descobrir que a resposta é EABCD. Na prática, porém, essas “palavras” cíclicas não são possíveis precisamente porque as palavras reais definiram padrões de vogais e consoantes que não podem ser esticados arbitrariamente. Mesmo palavras com muitos anagramas podem ser resolvidas em não mais do que três tentativas, como Rob Corlett demonstrou com “parse”.

B) É sempre o caso que ter uma letra em uma determinada posição ficar amarela é mais valioso do que vê-la ficar verde? Em caso afirmativo, você pode dar um exemplo e explicar por que isso deveria acontecer?

Sim, uma carta que sai amarela pode, em casos raros, ser mais valiosa do que a mesma carta que sai verde, se for uma carta que raramente aparece nas outras posições. Isso geralmente acontece com Y, que é predominantemente encontrado no final de uma palavra. Suponha que você comece com “barriga” e tanto B quanto Y apareçam verdes. Você fica com muitas possibilidades: “folgado”, “pequeno”, “bobby”, “booty”, “espesso” etc. Mas se B e Y aparecerem amarelos, só há uma possibilidade: “abismo”.

Pergunta 2

Uma pessoa com um bom vocabulário de palavras obscuras do Scrabble tem uma vantagem ou desvantagem em jogar Wordle?

Como um ex-jogador de torneios de Scrabble que passou algumas horas memorizando palavras obscuras, acho que é uma vantagem e uma desvantagem. Quando comecei a jogar Wordle, frequentemente via a possibilidade e tentava descartar palavras incomuns que mais tarde percebi que quase não tinham chance de serem corretas. (Na terminologia do golfe, que meu grupo do Wordle usa com frequência, nos referimos a isso como sendo impedido por um perigo imaginário.) Conforme descrevi na coluna do quebra-cabeça, as respostas do Wordle são extraídas de uma lista de palavras simples, a maioria das quais são conhecidas. para todos os falantes nativos de inglês americano. Mesmo palavras que são um tanto incomuns, mas não obscuras, não estão na lista de respostas do Wordle. Por exemplo, recentemente perdi uma vez jogando “látex”, uma palavra bastante comum que acabou não sendo uma possível resposta do Wordle. Então, como todos os jogadores do Wordle, tive que construir um modelo mental do tipo de palavra que poderia ser uma resposta do Wordle e ignorar especificamente os tipos de palavras raras e obscuras que eu usaria alegremente para marcar mais pontos no Scrabble. Por outro lado, o conhecimento dessas palavras raras é útil para “varrer consoantes”, o que às vezes você precisa fazer para evitar gastar muitas voltas adivinhando um monte de palavras semelhantes uma a uma. Por exemplo, se você tem _RA_E e está procurando várias palavras possíveis contendo D, G e K, como “brake”, “drake”, “drape”, “grade” e “grape”, ajuda saber e jogue a palavra “kedge”, que pode garantir encontrar a solução em mais duas voltas (kedge significa mover um navio lançando sua âncora à distância e puxando-a com uma corda forte).

Obter o mesmo quebra-cabeça do Wordle como todos os outros todos os dias incentiva o jogo social. Mas spoilers abundam na internet, e sabe-se que algumas pessoas enganam ao relatar suas pontuações. O próximo quebra-cabeça lida com a questão de quando as suspeitas de trapaça em um grupo Wordle são justificadas com base apenas na improbabilidade da pontuação de uma pessoa. Mais uma vez, esse quebra-cabeça é enquadrado em termos de pontuação no golfe: uma solução Wordle em três turnos é denominada birdie, obtê-lo em dois turnos é uma águia e obter uma palavra no primeiro turno é, obviamente, um hole-in-one. .)

Quebra-cabeça 3

Um critério científico tradicional para investigar mais é se a probabilidade de um resultado ocorrer por acaso (o valor alfa) é inferior a 5% ou inferior a 1%, dependendo dos objetivos dos pesquisadores. O resultado é então considerado estatisticamente significativo ao nível de 5% ou 1%. Como não é bom suspeitar que as pessoas trapaceiam quando não estão, vamos escolher o nível mais conservador de 1% nesta investigação.

Suponha que você pertença a um grupo Wordle de 10 jogadores que compartilham resultados todos os dias há 200 dias. Suponha que um jogador humano muito bom possa esperar obter um birdie a cada 2.5 jogos, uma águia a cada 40 jogos e um hole-in-one a cada 2,000 jogos (que são estimativas razoáveis do mundo real).

A) Quantos birdies seguidos seriam significativos ao nível de 1% em seu grupo durante esse período?

B) Quantas águias em fila?

C) Quantos buracos em um em uma fileira?

A chave aqui é perceber que você tem um tamanho de população de 2,000 pessoas-jogos. Portanto, para atingir esse nível de significância, você precisaria ver um evento que aconteceria com menos frequência do que uma vez em 200,000 jogos pessoais apenas por acaso.

A) Sequências de birdie ou melhor: A probabilidade de obter um birdie ou melhor em um único jogo é 2/5 + 1/40 + 1/2,000 = 0.4255, que é 1 em cerca de 2.35 jogos. Vamos chamar isso B. A menor potência de B que excede 200,000 é B¹⁵, que é mais de 368,000 (B¹⁴ é cerca de 157,000). Portanto, uma sequência de birdie ou melhor de 15 ou mais para qualquer um do grupo satisfaria esse critério rigoroso, mas uma de 14 não. Se você suspeitasse de um jogador individual, precisaria ver um evento que ocorre com menos frequência do que uma vez em 20,000 jogos, o que aconteceria com uma seqüência de birdie ou melhor de 12. (Observe que o número real de oportunidades para ter seqüências de esses comprimentos é um pouco menor: na verdade são 1,850 jogos para o grupo e 188 jogos para o jogador individual, mas isso não faz diferença neste caso).

Observe que essas são as frequências para jogadores experientes e as sequências suspeitas para a maioria dos grupos e indivíduos seriam menores. Para aplicar esse critério na prática, você precisaria determinar as frequências correspondentes de birdie, eagle e hole-in-one que está vendo e também levar em consideração o número de jogos que foram disputados em seu grupo.

B) Seqüências de águia ou melhor: A probabilidade de uma águia ou melhor é 1/40 + 1/2,000 = 0.0255, ou cerca de 1 em 39.2. Os comprimentos de sequência que excedem nosso nível de significância são 4 para o grupo e 3 para um indivíduo suspeito.

C) Sequências de Hole-in-one: O comprimento da sequência que excede nosso nível de significância é 2 tanto para o grupo quanto para um indivíduo suspeito.

Há uma ressalva para as duas últimas respostas: esses são eventos raros e o tamanho da amostra é muito pequeno, então você deve ter cuidado. A maioria dos estatísticos geralmente esperaria até ter visto pelo menos cinco ou mais instâncias de águias ou hole-in-one, não necessariamente como parte de uma sequência, antes de se sentir à vontade para aplicar um teste de significância.

Pergunta 3

É perfeitamente possível que a frequência de bons resultados em seu grupo seja significativamente maior do que a frequência prevista por acaso, sem que ninguém trapaceie. Como você explicaria isso?

Uma possível razão para isso, como Rob Corlett explica, pode ser que “todos os jogadores mantenham registros assíduos de cada resultado”. Como expliquei no prelúdio do quebra-cabeça 4, as respostas do Wordle não devem ser repetidas por cinco anos ou mais sob a configuração atual. Portanto, mesmo que ninguém trapaceie ou saiba todas as palavras da lista de respostas, essas informações ainda podem ajudar qualquer indivíduo ou grupo a ter um desempenho gradualmente melhor.

Mas também há outro motivo: a lista pode não ser bem aleatória. Ao jogar Wordle nos últimos meses, notei que sempre que havia uma escolha entre duas ou mais palavras, as palavras mais simples tinham mais probabilidade de estar corretas do que as palavras menos comuns. Por exemplo, se você tivesse A, N e E e as opções restantes fossem palavras como “esgueirar-se”, “hiena” e “enema”, você poderia tocar sem hesitação a palavra mais simples (“esgueirar-se” neste caso) e você seria corrija com muito mais frequência do que você esperaria por puro acaso. Na verdade, usei uma lista de frequência de palavras em prosa em inglês para verificar o quão comum as respostas que encontrei ao longo de dois meses foram comparadas a uma palavra média na lista de respostas do Wordle. As respostas que encontrei eram cerca de 25% mais comuns do que a palavra média na lista de respostas do Wordle e, mais importante, para as palavras mais raras da lista (os 10% inferiores), apenas um terço aparecia como respostas do que era suposto para. As águias aconteceram com uma frequência mais próxima de 1/20 do que de 1/40 com base no puro acaso. Portanto, parece que a sequência de respostas do Wordle não é bem aleatória e é carregada com palavras mais simples ou estamos passando por uma parte da lista que consiste em palavras mais simples.

Uma mudança recente significativa é que The New York Times nomeado editor do Wordle para programar a palavra do dia a partir de 7 de novembro. Desde então, tornou-se mais comum a retirada de palavras difíceis ou ofensivas da lista pré-sequenciada, incluindo a substituição, nos bastidores, de palavras como “ombre”, “vômito” e “ fanny.” Embora eu entenda a necessidade do vezes para higienizar e simplificar as palavras do Wordle para evitar a indignação de milhões de pessoas jogando, torna o jogo menos aleatório e muito mais previsível. Pior ainda é a infeliz tendência editorial nas últimas semanas de escolher uma palavra para se adequar ao dia, como “banquete” no Dia de Ação de Graças e “medalha” no Dia dos Veteranos. Isso equivale a dar uma pista extra sobre a palavra antes mesmo de o jogo começar, tornando o quebra-cabeça mais fácil e diminuindo sua rica conexão com a teoria da informação. Espero que seja uma aberração temporária porque a aleatoriedade é um elemento essencial deste jogo. A maioria das pessoas que deu feedback para The New York Times sobre essas escolhas editoriais senti o mesmo.

Nosso quarto quebra-cabeça foi baseado no fato de que, sob sua arquitetura atual, as soluções Wordle nunca serão repetidas até que a lista se esgote depois de cinco anos ou mais.

Quebra-cabeça 4

Considere uma pessoa com uma memória perfeita de soluções passadas. Para tal pessoa, a resposta seria óbvia no último dia da lista de 2,309 palavras de Wordle. Você pode estimar rapidamente quantos buracos em um essa pessoa esperaria obter ao longo de toda a lista, sem fazer o cálculo real? Então, se puder, tente fazer o cálculo real.

Rob Corlett respondeu perfeitamente, estimando logicamente a resposta como 8.25 e, em seguida, calculando a resposta como 8.32. Os principais cálculos de Corlett são citados abaixo. Você pode verificar o comentário para a excelente técnica de estimativa.

Se você tem m palavras e você adivinha, então as chances de acertar são 1/m. Se você tiver 1 palavra, as chances são de 1/1, 2 palavras 1/2, 3 palavras 1/3 etc. Se você somar essas palavras, obterá o número esperado de buracos em um! …

[Isso] exige que calculemos a soma dos recíprocos de todos os números de 2309 até 1. Fiz isso em uma planilha e descobri que o total é 8.32, satisfatoriamente próximo à minha estimativa!

Nossa última pergunta foi como melhorar a aleatoriedade de palavras do Wordle, mantendo seu design “do lado do cliente”. Antes de o editor do Wordle ser nomeado, não havia randomização diária de palavras: as palavras vinham de uma lista pré-sequenciada baixada que não era muito bem randomizada, como mencionei acima. Em seguida, a palavra de solução do Wordle foi gerada no dispositivo do cliente (usuário) a partir da lista de palavras, dependendo da data atual, e todo o quebra-cabeça também foi julgado no dispositivo do usuário. O código para fazer tudo isso é baixado na primeira vez que um usuário se conecta ao site todos os dias. O usuário não precisa estar online depois disso.

Pergunta 4

Como você projetaria o Wordle para que ele mantivesse o design do lado do cliente, garantindo que todos recebessem a mesma palavra de solução em um determinado dia, mas randomizasse as respostas de maneira sensata sem exigir uma alteração no código todos os dias?

Houve algumas boas respostas para a questão da randomização. Alguns leitores sugeriram o uso de um número pseudoaleatório com uma semente predefinida para criar um índice na lista de respostas do Wordle. Mumintrollet até escreveu um programa que embaralha aleatoriamente cinco listas de respostas do Wordle (com duração de 32 anos), garantindo que nenhuma palavra se repita dentro de um ano. Para mim, o procedimento mais atraente veio de Blind Themis, que sugeriu que a semente aleatória utilizada para o procedimento de randomização deveria ser os quatro últimos dígitos do número de pessoas que jogaram o jogo em um determinado período de tempo. (Como o Wordle pode ser jogado em qualquer lugar do mundo, isso teria que ser feito em fusos horários sobre o Pacífico oriental, começando na Linha Internacional de Data!) O melhor disso tudo é que ninguém, nem mesmo o New York Times Editor do Wordle, saberia qual era a palavra um dia antes de ser usada.

Nenhum desses mecanismos pode ser feito completamente no lado do cliente, como Tim Ross apontou. A próxima palavra teria que ser gerada pelo servidor, e essa palavra ou seu número de índice teria que ser baixado, possivelmente de forma criptografada com o restante do código. Como Ross apontou, atualmente as 2,309 palavras de resposta são claramente visíveis em ordem de data no código-fonte, que qualquer navegador pode revelar. Uma abordagem poderia ser criptografar a lista de palavras de resposta e salvá-la em ordem alfabética em vez de ordem de data.

Embora as melhorias sugeridas na randomização ajudem, a criptografia não fará nenhuma diferença, pois ainda haverá vários spoilers na Internet e várias maneiras de trapacear.

Obrigado a todos que contribuíram para esta discussão interessante. O prêmio Insights para este quebra-cabeça vai para Rob Corlett. Parabéns! Nosso próximo quebra-cabeça aparecerá em fevereiro. Até lá, bom quebra-cabeça e boas festas!

Carimbo de hora: 2 de dezembro de 20222 de dezembro de 2022

Carimbo de hora: 30 de maio de 2023

A matemática por trás das suposições do Wordle

Republicado por Platão

Quebra-cabeça 1

Pergunta 1

Quebra-cabeça 2

Pergunta 2

Quebra-cabeça 3

Pergunta 3

Quebra-cabeça 4

Pergunta 4

Mais de Quantagazine

O comportamento surpreendente das sequências recursivas | Revista Quanta

Em nossos relógios celulares, ela encontrou uma vida inteira de descobertas | Revista Quanta

As máquinas aprendem melhor se lhes ensinarmos o básico

Nono número de Dedekind encontrado por dois grupos independentes | Revista Quanta

Inovadores na construção de moléculas ganham o Prêmio Nobel de Química de 2022

Assimetria detectada na distribuição das galáxias

Robô recordista destaca como os animais se destacam no salto

Físicos finalmente encontram um problema que só computadores quânticos podem resolver | Revista Quanta

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta

Introdução

Quebra-cabeça 1

Pergunta 1

Quebra-cabeça 2

Pergunta 2

Quebra-cabeça 3

Pergunta 3

Quebra-cabeça 4

Pergunta 4

Mais de Quantagazine

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta