Wordle 猜测柏拉图区块链数据智能背后的数学原理。垂直搜索。人工智能。

Wordle 猜测背后的数学

介绍

在简单的 Wordle 游戏中,玩家必须根据之前猜测所揭示的字母的存在和位置的线索,在六轮或更少的时间内猜出一个秘密的五个字母的单词。 虽然过去出现过一些类似的游戏,但在特定的一天玩 Wordle 的每个人都必须发现相同的秘密单词,这样就可以轻松地在朋友之间分享您的尝试和讨论游戏。 游戏独特的结构和呈现激发了我们最新的问题 见解难题. 答案在下面讨论。

玩好 Wordle 游戏的一个关键是选择一个强有力的起始词。 计算机分析体现 信息论技术 建议使用诸如“slate”和“crane”之类的起始词使您(或计算机算法,无论如何)能够平均以最少的轮数解决 Wordles。 然而,许多人类求解器更愿意选择元音丰富的词,例如“再见”、“音频”或“提高”。 这种感觉既有直观的基础,也有理性的基础。 首先,放置的元音使您能够找到一个元音“骨干”,它可以限制您需要搜索的辅音数量。 例如,如果您在玩“raise”后知道这个词看起来像 _AI_E,那么只剩下几个可能的词:“naïve”、“waive”和“maize”。 其次,元音最大化了一个可以称为“覆盖率”的数量——仅在五个元音和 Y 之间,我们可以在 2,309 个答案中的每个答案中至少得到一个肯定字母。 要获得这种对辅音的完美覆盖,您必须尝试所有 20 个辅音,这至少需要五圈。

我们的第一个谜题要求读者找出这三个元音丰富的单词中哪一个是最好的第一个猜测。

拼图1 

下表给出了单词“adieu”、“audio”和“raise”中的八个字母在整个 2,309 个单词的 Wordle 答案列表中每个位置出现的频率。 根据此表,确定对于三个富含元音的起始词:“adieu”、“audio”和“raise”中的每一个,您可以预期在整个 Wordle 答案列表中获得多少绿色和黄色。 (在 Wordle 中,如果字母在正确的位置,则显示为绿色背景,如果在单词中但位置错误,则显示为黄色背景。)这告诉你他们作为起始词的预期表现是什么?

读者 罗布·科利特 展示了如何从该表中计算预期的绿色和黄色数量。 对于“adieu”,A 是 140 个单词的正确第一个字母,D 是 20 个单词的正确第二个字母,依此类推。 所有可能的 Wordle 答案的绿色总数是这些的总和。 所以“再见”总共得到 140 + 20 + 266 + 318 + 1 = 745 个果岭。 对于黄色,我们必须从字母在一个单词中至少出现一次的次数开始(“adieu”中的 A 为 906),然后减去它为绿色的次数 (140) 以获得黄色的次数 (766) . 将单词中每个字母的数字相加,得到黄色的总数。 我们可以将这些数字除以答案总数 (2,309) 以获得单轮对绿色和黄色的期望,但是由于这一步对于我们所有的起始词都是通用的,我们可以只用总数来比较这三个词他们中的。 由于我们专门选择这些词来寻找元音主干,因此我们还可以计算出有多少绿色来自元音。 这是结果。

如您所见,没有可比性! “Raise”在各个方面都优于“adieu”,它提供了更多的绿色和黄色,并在正确的位置产生了更多的元音,更不用说你还抓住或排除了两个最常见的辅音。 “音频”在所有这些指标上都远远排在第三位。 请注意,即使您没有得到任何黄色或绿色,您也可以获得一些关于缺少哪些字母的信息,因为读者 马克斯·戴维斯 指出,当您获得一个或多个黄色和绿色时,您肯定会获得更多信息。 所以,“再见”的用户们,也许是时候说再见了。

问题1

这是一个关于相对于黄色我们应该重视绿色多少的问题:有多少黄色等于一个绿色? 我们上述结果的明确性质避免了为上述比较回答这个问题的需要,但这是一个有趣的问题。 这种估值有两个方面。 首先是人的方面:你对找出黄色字母的所有不同放置方式所需的脑力劳动给予多少重视? 不可否认,打很多果岭会让生活更轻松,并给我们更多的多巴胺刺激。 从信息论的角度来看,您需要检查每个答案词的每个起始词,并比较在每种情况下,当相同的字母是绿色的和黄色的时候,解决这个谜题需要多少圈。

虽然这是一项艰巨的任务,但我确实设法找到了最好的计算机起始词(晦涩难懂的词“tarse”,意思是一只雄性猎鹰,其完整的最优解树已被 网上发布 由数学家亚历克斯塞尔比)。 答案令人惊讶。 使用第一轮仅产生绿色字母的答案词的计算机解决方案所需的平均轮数为 3.34,而只有黄色字母时所需的轮数为 3.51,仅增加了 5%! 显然,对于计算机算法来说,放置黄色字母,这对我们人类来说似乎很吓人,可以在没有太多惩罚的情况下实现。 我猜想对于人类求解器来说,不仅在所需的转数上,而且在求解所需的脑力和时间上,差异会更大。

拼图2

A) 如果你在第一回合得到所有五个黄牌,假设最佳打法,找到答案的最大回合数是多少?

As 罗布·科利特萨姆罗德斯 正确地陈述,理论上的答案是五个:一个完全黄色的字母组合,如 ABCDE 可以抵抗四轮以上的发现,因为你可能必须循环通过 BCDEA、CDEAB 和 DEABC,然后才能发现答案是 EABCD。 然而在实践中,这样的循环“词”是不可能的,因为真实的词已经定义了不能任意拉伸的元音和辅音模式。 正如 Rob Corlett 用“parse”所展示的那样,即使有很多字谜的单词也可以在不超过 XNUMX 次的尝试中解决。

B) 是否曾经有过让某个位置的字母变黄比看到它变绿更有价值的情况? 如果是这样,你能举个例子并解释为什么会这样吗?

是的,在极少数情况下,黄色字母可能比绿色字母更有价值,如果它是一个很少出现在其他位置的字母。 这种情况经常发生在 Y 上,它绝大多数出现在单词的末尾。 假设你从“肚皮”开始,B 和 Y 都变成绿色。 你有很多可能性:“宽松”、“小”、“波比”、“臀部”、“浓密”等。但如果 B 和 Y 都呈黄色,则只有一种可能性:“深渊”。

问题2

具有良好词汇量的晦涩拼字游戏单词的人在玩 Wordle 时有优势还是劣势?

作为一名前拼字游戏玩家,花了好几个小时来记住晦涩的单词,我认为这既是优势也是劣势。 当我第一次开始玩 Wordle 时,我发现自己经常看到不常见的单词的可能性,并试图排除这些不常见的单词,后来我意识到这些单词几乎没有正确的机会。 (在我的 Wordle 小组经常使用的高尔夫术语中,我们将此称为被假想的危险所阻碍。)正如我在难题专栏中所描述的那样,Wordle 的答案是从一系列简单的单词中得出的,其中大部分是已知的给所有以美国英语为母语的人。 即使是有些不常见但并不晦涩的单词也不在 Wordle 答案列表中。 例如,我最近在玩“latex”时浪费了一个回合,这是一个相当常见的词,结果证明它不是一个可能的 Wordle 答案。 所以,像所有 Wordle 玩家一样,我必须为可能是 Wordle 答案的那种单词建立一个心理模型,并特别忽略那些我很乐意用来在拼字游戏中获得更多分数的稀有和晦涩的单词。 另一方面,这些生僻词的知识在“清除辅音”中会派上用场,有时你必须这样做,以避免花很多轮来一个接一个地猜测一堆相似的词。 例如,如果你有 _RA_E 并且正在查看一堆可能包含 D、G 和 K 的词,例如“brake”、“drake”、“drape”、“grade”和“grape”,这有助于了解和玩“kedge”这个词,它可以保证在两轮后找到解决方案(kedge 意味着通过在远处放下锚然后用粗绳拉动船来移动船)。

每天获得与其他人相同的 Wordle 拼图可以鼓励社交游戏。 不过网上剧透很多,众所周知 有些人作弊 在报告他们的分数。 下一个难题处理的问题是,何时仅根据一个人得分的可能性就可以怀疑 Wordle 组中的作弊行为。 同样,这个谜题是用高尔夫得分术语来描述的:三轮中的 Wordle 解决方案被称为小鸟球,两轮中得到它是老鹰,而在第一轮中得到一个单词当然是一杆进洞.)

拼图3

进一步调查的传统科学标准是,结果是否偶然发生的概率( 阿尔法值) 小于 5% 或小于 1%,具体取决于研究人员的目标。 然后认为结果在 5% 或 1% 的水平上具有统计学意义。 既然怀疑人没有作弊是不好的,让我们在本次调查中选择更保守的 1% 水平。

假设您属于一个由 10 名玩家组成的 Wordle 组,他们每天都在互相分享结果,持续了 200 天。 假设一个非常优秀的人类球员可以期望每 2.5 场比赛获得一只小鸟,每 40 场比赛获得一只老鹰,每 2,000 场比赛获得一杆进洞(这是合理的现实估计)。

A) 在这段时间内,在你的小组中,在 1% 的水平上,连续抓到多少只小鸟是有意义的?

B) 一排有多少只老鹰?

C) 一排有多少个一杆进洞?

这里的关键是要意识到你有 2,000 人游戏的人口规模。 所以,为了达到这个显着性水平,你需要看到一个事件在 200,000 人的游戏中发生的频率少于一次,完全是偶然的。

A) 小鸟球或更好的连胜记录:在一场比赛中获得小鸟球或更好成绩的概率是 2/5 + 1/40 + 1/2,000 = 0.4255,即在大约 1 场比赛中有 2.35 次。 让我们称之为 B. 最低功率 B 超过 200,000 的是 B15, 超过 368,000 (B14 约为 157,000)。 因此,该组中任何人的 15 次或更多的小鸟或更好的连胜将满足这一严格标准,但 14 人中的一个则不满足。 如果你怀疑某个球员,你需要看到一个事件发生的频率低于每 20,000 场比赛一次,这将发生在 12 次小鸟球或更好的连胜中。(请注意,有连胜的实际机会数这些长度略小:团体实际上是 1,850 场比赛,个人球员是 188 场比赛,但在这种情况下并没有什么区别)。

请注意,这些是专家玩家的频率,大多数团体和个人的可疑条纹会更小。 要在实践中应用此标准,您需要确定您看到的相应小鸟球、老鹰球和一杆进洞频率,并且还要考虑您的团队中已经打过的比赛数量。

B) 老鹰或更好的条纹:老鹰或更好的概率是 1/40 + 1/2,000 = 0.0255,或大约 1 分之一。 超过我们显着性水平的条纹长度对于组是 39.2,对于可疑个体是 4。

C) 一杆进洞连胜:超过我们显着性水平的连胜长度对于组和可疑个体都是 2。

最后两个答案有一个警告:这些都是罕见的事件,样本量很小,所以你必须小心。 大多数统计学家通常会等到他们看到至少五个或更多老鹰或一杆进洞的实例,而不一定是连续的一部分,然后他们才会舒适地应用显着性检验。

问题3

完全有可能在你的小组中取得好成绩的频率明显高于偶然预测的频率,没有任何人作弊。 你会怎么解释这个?

一个可能的原因是 罗布·科利特 解释说,可能是因为“球员们都对每一个结果都认真记录了下来。” 正如我在谜题 4 的序言中所解释的那样,在当前设置下,Wordle 答案不会在五年左右的时间内重复出现。 所以即使没有人作弊或知道答案列表上的所有单词,这些信息仍然可以帮助任何个人或团体逐渐表现得更好。

但还有另一个原因:该列表可能没有很好地随机化。 在过去几个月玩 Wordle 的过程中,我注意到每当有两个或更多单词之间的选择时,较简单的单词比不太常见的单词更可能是正确的。 例如,如果你有 A、N 和 E,剩下的选择是“潜行”、“鬣狗”和“灌肠”等词,你可以毫不犹豫地弹出最简单的词(在本例中为“潜行”),然后你会纠正的次数比您纯属偶然所期望的要多得多。 我实际上使用了一个英语散文词频列表来检查我在两个月内遇到的答案与 Wordle 答案列表中的平均单词相比有多常见。 我遇到的答案比 Wordle 答案列表中的平均单词高出约 25%,更重要的是,对于列表中最罕见的单词(底部 10%),出现的答案只有预期的三分之一至。 老鹰的发生频率接近 1/20,而不是纯偶然的 1/40。 因此,Wordle 答案序列似乎并没有很好地随机化,它要么预先加载了更简单的单词,要么我们恰好正在浏览由更简单单词组成的列表的一部分。

最近的一个重大变化是 纽约时报 任命了一名 Wordle 编辑 从 7 月 XNUMX 日开始编写当天的单词。从那时起,从预排序列表中删除困难或冒犯性的单词变得更加普遍,包括在幕后替换“ombre”、“vomit”和“舳。” 虽然我明白需要 清理和简化 Wordle 单词以防止数百万玩家的愤怒,它使游戏的随机性降低,并且更具可预测性。 更糟糕的是,过去几周不幸的编辑倾向于选择适合当天的词,例如感恩节的“盛宴”和退伍军人节的“勋章”。 这相当于在游戏开始之前就提供了关于这个词的额外线索,使谜题变得更容易,并削弱了其丰富的信息理论联系。 我希望这是暂时的失常,因为随机性是这款游戏的基本要素。 大多数人谁 给了反馈纽约时报 关于这些编辑选择的感觉是一样的。

我们的第四个难题基于这样一个事实,即在其当前架构下,Wordle 解决方案将永远不会重复,直到列表在五年左右后用完。

拼图4

考虑一个对过去的解决方案有完美记忆的人。 对于这样的人,答案在 Wordle 的 2,309 个单词列表的最后一天就很明显了。 在不进行实际计算的情况下,您能否快速估算出此人在整个列表期间期望获得多少一杆进洞? 然后,如果可以,请尝试进行实际计算。

罗布·科利特 完美的回答了这个问题,逻辑上估计答案是8.25,然后计算出答案是8.32。 下面引用了 Corlett 的主要计算。 您可以查看有关优秀估算技术的评论。

如果你有 m 单词,然后您进行猜测,那么正确的机会是 1/m. 如果您有 1 个单词,则机会为 1/1,2 个单词为 1/2,3 个单词为 1/3,依此类推。如果将这些加在一起,您将获得预期的一杆进洞数! ……

[This] 需要我们计算从 2309 到 1 的所有数字的倒数之和。我在电子表格中做了这个,发现总数是 8.32,非常接近我的估计!

我们的最后一个问题是如何改进 Wordle 的单词随机化,同时保持其“客户端”设计。 在任命 Wordle 编辑器之前,没有日常的单词随机化:单词来自下载的预排序列表,该列表没有很好地随机化,正如我上面提到的。 然后 Wordle 的解决方案单词根据当前日期在客户端(用户)的设备上从单词列表中生成,整个拼图也在用户的设备上进行裁决。 执行所有这些操作的代码是在用户每天第一次连接到该网站时下载的。 此后用户不必在线。

问题4

您将如何设计 Wordle 以使其保持客户端设计,确保每个人在给定的一天获得相同的解决方案单词,但以合理的方式随机化答案而不需要每天更改代码?

随机化问题有一些很好的答案。 一些读者建议使用带有预定义种子的伪随机数来创建 Wordle 答案列表的索引。 木敏小车 甚至写了一个程序,随机打乱五个 Wordle 答案列表(持续 32 年),确保一年内没有单词重复。 对我来说,最吸引人的程序来自 盲目的Themis, 谁建议用于随机化程序的随机种子应该是在特定时间内玩过游戏的人数的最后四位数字。 (由于 Wordle 可以在世界任何地方播放,这必须在东太平洋的时区内完成,从国际日期变更线开始!) “纽约时报” Wordle 编辑器,会在使用前一天知道该词是什么。

这些机制都不能完全在客户端完成,因为 蒂姆·罗斯(Tim Ross) 指出。 下一个单词必须由服务器生成,并且必须下载这个单词或其索引号,可能以与其余代码一起加密的形式下载。 正如罗斯指出的那样,目前 2,309 个答案词在源代码中按日期顺序清晰可见,任何浏览器都可以显示。 一种方法可能是加密答案单词列表并按字母顺序而不是日期顺序保存它。

虽然建议的随机化改进会有所帮助,但加密根本没有任何区别,因为互联网上仍然会有多个剧透和多种作弊方式。

感谢所有为这次有趣的讨论做出贡献的人。 此谜题的洞察奖授予 Rob Corlett。 恭喜! 我们的下一个谜题将在二月出现。 在那之前,快乐的困惑和快乐的假期!

时间戳记:

更多来自 量子杂志