Wordle Guesses の背後にある数学

プラトン再発行

フォロワー： 0

Wordle の単純なゲームでは、プレーヤーは、以前の推測で明らかになった文字の存在と場所に関する手がかりに基づいて、XNUMX ターン以内に秘密の XNUMX 文字の単語を推測する必要があります。似たようなゲームは過去にもありましたが、Wordle をプレイした人は誰でも同じ秘密の言葉を発見する必要があるため、試したことを共有したり、友達とゲームについて話し合ったりするのが簡単になります。ゲームの独特の構造とプレゼンテーションは、最新の質問に影響を与えました。洞察パズル. 答えは以下で議論されます。

優れた Wordle ゲームをプレイするための鍵の XNUMX つは、強力な開始単語を選択することです。具現化するコンピュータ分析情報理論のテクニック「slate」や「crane」などの単語を開始すると、平均して最小ターン数で Wordles を解くことができるようになります (いずれにせよコンピュータアルゴリズム)。しかし、人間のソルバーの多くは、「adieu」、「audio」、「raise」などの母音が豊富な単語を選択する方が快適だと感じています。この感覚には、直感的な根拠と合理的な根拠の両方があります。まず、母音を配置すると、検索する必要がある子音の数を制限できる母音の「バックボーン」を見つけることができます。たとえば、「raise」をプレイした後に単語が _AI_E のように見えることがわかっている場合、残っている可能性のある単語は「naïve」、「waive」、「maize」のほんのわずかです。第二に、母音は「カバレッジ」と呼べる量を最大化します。2,309 つの母音と Y の間で、20 の回答のすべてで少なくとも XNUMX つの正の文字を取得できます。このように子音を完全にカバーするには、XNUMX 個すべてを試してみる必要があり、少なくとも XNUMX ターンは必要です。

私たちの最初のパズルは、これら XNUMX つの母音が豊富な単語のどれが最初の推測に最も適しているかを理解するよう読者に挑戦しました。

パズル1

次の表は、単語「adieu」、「audio」、および「raise」の 2,309 文字が、XNUMX 単語の Wordle 回答リスト全体の各位置に出現する頻度を示しています。この表に基づいて、「adieu」、「audio」、「raise」の XNUMX つの母音が豊富な開始単語のそれぞれについて、Wordle の回答リスト全体で予想される緑と黄色の数を決定します。 (Wordle では、文字が適切な場所にある場合は緑色の背景で表示され、単語内にあるが間違った場所にある場合は黄色の背景で表示されます。) これは、開始単語として期待されるパフォーマンスについて何を示していますか? ?

リーダーロブ・コレットは、この表から予想される緑と黄色の数を計算する方法を示しました。「adieu」の場合、A は 140 語の正しい最初の文字、D は 20 語の正しい 140 番目の文字などです。考えられるすべての Wordle 回答に対する緑の総数は、これらの合計です。したがって、「さようなら」は合計 20 + 266 + 318 + 1 + 745 = 906 グリーンになります。黄色の場合、文字が単語内で少なくとも 140 回出現する回数 (「adieu」の A の場合は 766) から開始し、緑色の回数 (2,309) を差し引いて、黄色の回数 (XNUMX) を取得する必要があります。 . 単語の各文字の数字を合計して、黄色の総数を取得します。これらの数字を回答の総数 (XNUMX) で割り、XNUMX ターンの緑と黄の期待値を得ることができますが、このステップはすべてのスターターワードで共通であるため、XNUMX つの単語を比較するために合計を使用することができます。そのうちの。母音のバックボーンを見つけるためにこれらの単語を特別に選択したため、母音に由来する緑の数を計算することもできます。これが結果です。

ご覧のとおり、比較対象がありません！「Raise」はあらゆる点で「adieu」よりも優れており、最も一般的な XNUMX つの子音をキャッチまたは除外しているという事実は言うまでもなく、適切な場所により多くの緑と黄色を与え、より多くの母音を生成します。「オーディオ」は、これらすべての測定値で XNUMX 番目に大きく離れています。黄色や緑色が得られなくても、欠落している文字に関する情報を得ることができますが、リーダーとしてマックス・デイビス指摘したように、XNUMX つ以上のイエローとグリーンを取得すると、間違いなくより多くの情報が得られます。ですから、「さようなら」のユーザーは、さよならを言う時が来たのかもしれません。

質問1

これは、黄色と比べて緑をどれだけ評価すべきかという問題でした。XNUMX つの緑に等しい黄色の数はいくつですか? 上記の結果の明確な性質により、上記の比較でこれに答える必要はありませんが、興味深い質問です。この評価には XNUMX つの側面があります。 XNUMX つ目は人間的な側面です。イエローレターを配置するさまざまな方法をすべて把握するために必要な精神的努力を、どのくらい重視しますか? たくさんのグリーンを打つと生活が楽になり、ドーパミンが増えることは否定できません. 情報理論の観点からは、すべての答えの単語のすべての開始単語を調べて、同じ文字が緑色の場合と、すべてのインスタンスで黄色の場合を比較して、パズルを解くのに何ターンかかるかを比較する必要があります。

これは膨大な作業ですが、可能な限り最良のコンピューターの開始語 (オスのハヤブサを意味するあいまいな単語「tarse」であり、その完全な最適解ツリーは、オンライン投稿数学者アレックス・セルビーによる）。答えは驚くべきものです。最初のターンに緑のみを生成する答えの単語を使用したコンピューターソリューションに必要な平均ターン数は 3.34 でしたが、黄色の文字のみの場合に必要なターン数は 3.51 で、わずか 5% の増加です! 明らかに、コンピューターアルゴリズムにとって、黄色の文字を配置することは、人間にとって非常に威圧的に見えますが、あまりペナルティを課すことなく達成できます。必要なターン数だけでなく、解決に必要な精神的労力と時間においても、人間のソルバーにとってはその差はより大きくなると思います。

パズル2

A) 最初のターンに XNUMX つすべての黄が出た場合、ベストプレイと仮定すると、答えを見つけるまでにかかる最大ターン数は?

As ロブ・コレットおよびサム・ローズ正しく言えば、理論上の答えは XNUMX です。ABCDE などの完全に黄色の文字の組み合わせは、答えが EABCD であることを発見する前に BCDEA、CDEAB、DEABC を繰り返さなければならない可能性があるため、さらに XNUMX ターンの間発見に抵抗する可能性があります。しかし、実際には、そのような循環的な「単語」は正確には不可能です。これは、実際の単語には、任意に引き延ばすことができない母音と子音のパターンが定義されているためです。 Rob Corlett が「パース」で示したように、多くのアナグラムを含む単語でさえ、XNUMX 回以内の試行で解決できます。

B) 特定の位置の文字が黄色に変わることは、緑色に変わることよりも価値があるということはありますか? もしそうなら、例を挙げて、なぜこれが必要なのか説明できますか?

はい、まれに、黄色で表示される文字が、他の位置にめったに表示されない文字である場合、緑色で表示される同じ文字よりも価値がある場合があります. これは、圧倒的に単語の末尾にある Y でよく発生します。「腹」から始めて、B と Y の両方が緑色になったとします。「だぶだぶ」、「ちっちゃい」、「ぼんやり」、「戦利品」、「ふさふさ」など、多くの可能性が残されています。しかし、B と Y の両方が黄色になった場合、可能性は XNUMX つだけです。それは「深淵」です。

質問2

あいまいなスクラブル語の語彙が豊富な人は、Wordle をプレイする上で有利または不利になりますか?

あいまいな単語を覚えるのにかなりの時間を費やした元トーナメント Scrabble プレーヤーとして、私はそれが長所と短所の両方であると思います。初めて Wordle をプレイし始めたとき、珍しい単語の可能性を頻繁に見て、それを除外しようとしていることに気づきました。 (私の Wordle グループが頻繁に使用するゴルフ用語では、これを想像上のハザードによって妨げられていると呼んでいます。) パズルのコラムで説明したように、Wordle の答えは単純な単語のリストから導き出され、その大部分は既知のものです。アメリカ英語を母国語とするすべての人へ。やや珍しいがあいまいではない単語でさえ、Wordle の回答リストには含まれていません。たとえば、私は最近「latex」をプレイして XNUMX ターンを無駄にしました。これはかなり一般的な単語で、Wordle の回答ではないことが判明しました。そのため、すべての Wordle プレイヤーと同様に、Wordle の回答である可能性のある種類の単語のメンタルモデルを構築し、Scrabble でより多くのポイントを獲得するために喜んで使用する種類のまれであいまいな単語を特に無視する必要がありました。一方、これらの珍しい単語の知識は、「子音を一掃する」のに役立ちます。これは、似たような単語をXNUMXつずつ推測するのに何ターンも費やすのを避けるために必要な場合があります. たとえば、_RA_E があり、「brake」、「drake」、「drape」、「grade」、「grape」など、D、G、K を含む可能性のある単語の束を見ている場合、「kedge」という単語を再生すると、あと XNUMX ターンで解決策を見つけることが保証されます (kedge とは、遠くに錨を下ろしてから頑丈なロープで引っ張って船を動かすことを意味します)。

毎日みんなと同じ Wordle パズルを手に入れることで、ソーシャルプレイが促進されます。しかし、ネット上にはネタバレがあふれており、騙す人もいます彼らのスコアを報告する際に。次のパズルは、Wordle グループでの不正行為の疑いが、個人のスコアのありそうもないことだけに基づいて正当化されるのはいつなのかという問題を扱います。繰り返しになりますが、このパズルはゴルフのスコアリング用語で構成されています。XNUMX ターンで Wordle のソリューションをバーディーと呼び、XNUMX ターンでそれを達成することをイーグル、最初のターンで単語を達成することをもちろんホールイン XNUMX と呼びます。 .)

パズル3

さらに調査するための従来の科学的基準は、結果が偶然に発生する確率 ( アルファ値) は、研究者の目標に応じて、5% 未満または 1% 未満です。結果は、5% または 1% レベルで統計的に有意であるとみなされます。浮気をしていないのに浮気をしていると疑うのは良くないので、この調査ではより保守的な 1% レベルを選択しましょう。

あなたが、10 日間毎日結果を共有している 200 人のプレーヤーからなる Wordle グループに属しているとします。非常に優れた人間のプレーヤーは、2.5 ゲームごとにバーディー、40 ゲームごとにイーグル、2,000 ゲームごとにホールインワンを獲得できると想定できます (これは現実世界での合理的な推定値です)。

A) この期間中、あなたのグループの 1% レベルで何回連続バーディーが有意でしたか?

B) 何羽のワシが一列に並んでいますか?

C) ホールインワンは連続で何回？

ここで重要なのは、人口規模が 2,000 パーソンゲームであることを認識することです。したがって、この重要度レベルに到達するには、200,000 人のゲームで XNUMX 回未満の頻度で発生するイベントを偶然に見る必要があります。

A) バーディー以上の連勝: 2 試合でバーディー以上を達成する確率は 5/1 + 40/1 + 2,000/0.4255 = 1 で、約 2.35 ゲームに XNUMX 回です。これを呼びましょう B. の最低電力 B 200,000万を超えるのは B¹⁵、これは 368,000 を超えます (B¹⁴ は約 157,000 です）。したがって、グループ内の誰かが 15 以上の連続バーディー以上を達成すれば、この厳しい基準を満たしますが、14 人のうちの 20,000 人はそうではありません。個々のプレーヤーを疑う場合は、12 ゲームに 1,850 回未満の頻度で発生するイベントを確認する必要があります。これは、188 のバーディーまたはベターストリークで発生します。これらの長さはわずかに短くなります: 実際には、グループの場合は XNUMX ゲーム、個々のプレーヤーの場合は XNUMX ゲームですが、この場合は違いはありません)。

これらはエキスパートプレーヤーの頻度であり、ほとんどのグループや個人の疑わしい筋はより少ないことに注意してください。この基準を実際に適用するには、対応するバーディー、イーグル、ホールインワンの頻度を判断し、グループでプレーしたゲームの数も考慮する必要があります。

B) イーグル以上のストリーク: イーグル以上のストリークの確率は、1/40 + 1/2,000 = 0.0255、つまり 1 分の 39.2 です。有意水準を超えるストリークの長さは、グループで 4、疑わしい個人で 3 です。

C) ホールインワンストリーク: 有意水準を超えるストリークの長さは、グループと疑わしい個人の両方で 2 です。

最後の XNUMX つの回答には注意点があります。これらはまれなイベントであり、サンプルサイズが非常に小さいため、注意が必要です。ほとんどの統計学者は一般に、イーグルまたはホールインワンのインスタンスが少なくとも XNUMX つ以上 (必ずしもストリークの一部としてではなく) 見られるまで待ってから、有意性検定を快適に適用できるようになります。

質問3

あなたのグループで良い結果が得られる頻度は、誰かが不正行為をしなくても、偶然に予測される頻度よりも大幅に高い可能性があります。これをどう説明しますか？

この理由として考えられるのは、ロブ・コレット「選手たちは全員、すべての結果を熱心に記録している」のかもしれません。パズル 4 の序文で説明したように、Wordle の回答は、現在の設定で XNUMX 年ほど繰り返される予定ではありません。したがって、回答リストのすべての単語をごまかしたり知ったりする人がいない場合でも、この情報は、個人またはグループのパフォーマンスを徐々に向上させるのに役立ちます.

しかし、別の理由もあります。リストが適切にランダム化されていない可能性があります。過去数か月にわたって Wordle をプレイしていて、25 つ以上の単語から選択する場合は常に、一般的ではない単語よりも単純な単語の方が正しい可能性が高いことに気付きました。たとえば、A、N、E があり、残りの選択肢が「こっそり」、「ハイエナ」、「浣腸」などの単語だった場合、ためらうことなく最も単純な単語 (この場合は「こっそり」) を再生できます。純粋な偶然によって予想されるよりもはるかに頻繁に修正します。実際に英語の散文頻度リストを使用して、Wordle の回答リストの平均的な単語と比較して、10 か月にわたって遭遇した回答がどの程度一般的であるかを確認しました。私が遭遇した回答は、Wordle 回答リストの平均的な単語よりも約 1% 多かったです。さらに重要なことは、リストの最もまれな単語 (下位 20%) については、想定されていた回答の 1 分の 40 しか表示されませんでした。に。イーグルスは、純粋な偶然に基づいて、XNUMX/XNUMX ではなく XNUMX/XNUMX に近い頻度で発生しました。そのため、Wordle の回答シーケンスは十分にランダム化されていないようであり、より単純な単語が前もってロードされているか、より単純な単語で構成されるリストの一部をたまたま通過しているようです。

最近の大きな変化は、 ニューヨークタイムズ Wordle編集者に就任 7 月 XNUMX 日から、その日の単語をプログラムするようにしました。それ以来、「オンブル」、「嘔吐」、「ファニー。の必要性は理解しているが、 タイムズ Wordle の単語をサニタイズして単純化して、何百万人もの人々の怒りを防ぐことで、ゲームのランダム性を減らし、より予測可能にします。さらに悪いことに、ここ数週間、感謝祭の「饗宴」や退役軍人の日の「メダル」など、その日に合わせて言葉を選ぶ不幸な編集傾向があります. これは、ゲームが始まる前であっても、単語に関する追加の手がかりを与えることになり、パズルがより簡単になり、豊富な情報理論のつながりが損なわれます。ランダム性はこのゲームの重要な要素であるため、これが一時的な異常であることを願っています. ほとんどの人はフィードバックをした〜へ ニューヨークタイムズ これらの編集上の選択については、同じように感じました。

私たちの XNUMX 番目のパズルは、現在のアーキテクチャでは、XNUMX 年ほど後にリストがなくなるまで、Wordle ソリューションが繰り返されることはないという事実に基づいていました。

パズル4

過去の解決策を完全に記憶している人物を考えてみましょう。そのような人にとって、答えは Wordle の 2,309 語リストの最終日に明らかです。実際の計算を行わずに、この人物がリスト全体の期間中に達成すると予想されるホールインワンの数を簡単に見積もることができますか? できれば、実際に計算してみてください。

ロブ・コレット論理的に答えを 8.25 と推定し、答えを 8.32 と計算して、これに完全に答えました。 Corlett の主要な計算を以下に引用します。優れた推定手法のコメントを確認できます。

あなたが持っている場合 m 言葉とあなたが推測すると、それが正しくなる可能性は1/m. 単語が 1 つの場合、確率は 1/1、2 つの単語で 1/2、3 つの単語で 1/3 などです。これらを合計すると、予想されるホールインワンの数が得られます。 …

[これ] では、2309 から 1 までのすべての数値の逆数の合計を計算する必要があります。これをスプレッドシートで行ったところ、合計が 8.32 であることがわかりました。

最後の質問では、「クライアント側」の設計を維持しながら Wordle の単語のランダム化を改善する方法を尋ねました。 Wordle の編集者が任命される前は、毎日の単語のランダム化はありませんでした。前述のように、単語はダウンロードされた事前に並べられたリストから取得されたもので、あまりランダム化されていませんでした。次に、現在の日付に応じて単語リストから Wordle の解決単語がクライアント (ユーザー) のデバイス上で生成され、パズル全体もユーザーのデバイス上で裁定されました。これらすべてを実行するためのコードは、ユーザーが毎日初めて Web サイトに接続したときにダウンロードされます。その後、ユーザーはオンラインである必要はありません。

質問4

クライアント側の設計を維持し、誰もが特定の日に同じ解決策の単語を取得できるようにする一方で、コードを毎日変更することなく適切な方法で回答をランダム化するには、どのように Wordle を設計しますか?

無作為化の質問にはいくつかの良い答えがありました。何人かの読者が、疑似乱数と事前定義されたシードを使用して、Wordle 回答リストへのインデックスを作成することを提案しました。ムーミントロレット 32 つの Wordle 回答リスト (XNUMX 年間続く) をランダムにシャッフルするプログラムを作成し、XNUMX 年以内に単語が繰り返されないようにします。私にとって、最も魅力的な手順はブラインドテミス、ランダム化手順に使用されるランダムシードは、特定の時間までにゲームをプレイした人の数の下XNUMX桁であるべきだと提案しました. (Wordle は世界中のどこでもプレイできるため、日付変更線から始まる東太平洋のタイムゾーンでプレイする必要があります!) ニューヨーク·タイムズ紙 Wordle編集者は、その単語が使用される前日にその単語が何であるかを知っている.

これらのメカニズムはいずれも、クライアント側で完全に実行することはできません。ティム・ロス指摘した。次の単語はサーバーによって生成される必要があり、この単語またはそのインデックス番号は、おそらく残りのコードと一緒に暗号化された形式でダウンロードされる必要があります。 Ross が指摘したように、現在 2,309 の回答語は、ソースコード内で日付順に明確に表示されており、どのブラウザーでも表示できます。 XNUMX つの方法として、回答単語リストを暗号化し、日付順ではなくアルファベット順に保存することが考えられます。

提案されたランダム化の改善は役に立ちますが、インターネットには複数のスポイラーが存在し、不正行為の方法が複数存在するため、暗号化はまったく違いはありません.

この興味深い議論に貢献してくれたすべての人に感謝します。このパズルの Insights 賞は、Rob Corlett に贈られます。おめでとう！次のパズルは XNUMX 月に登場します。それまでは、ハッピーパズルとハッピーホリデー！

タイムスタンプ： 2022 年 12 月 2 日2022 年 12 月 2 日

タイムスタンプ： 2023 年 5 月 30 日

Wordle Guesses の背後にある数学

プラトン再発行

パズル1

質問1

パズル2

質問2

パズル3

質問3

パズル4

質問4

より多くのクアンタマガジン

再帰シーケンスの驚くべき動作 | クアンタマガジン

私たちの携帯時計の中で、彼女は生涯にわたる発見を見つけました | クアンタマガジン

基本を教えれば、機械はよりよく学習する

XNUMX番目のデデキント数をXNUMXつの独立グループが発見 | クアンタマガジン

分子構築のイノベーターが 2022 年のノーベル化学賞を受賞

銀河の分布に見られる非対称性

記録破りのロボットは、動物の跳躍がどのように優れているかを浮き彫りにします

物理学者、ついに量子コンピューターにしかできない問題を発見 |クアンタマガジン

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

概要

パズル1

質問1

パズル2

質問2

パズル3

質問3

パズル4

質問4

より多くの クアンタマガジン

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

より多くのクアンタマガジン