Математика, що стоїть за Wordle, здогадується про інтелект даних PlatoBlockchain. Вертикальний пошук. Ai.

Математика, що стоїть за здогадками Wordle

Вступ

У простій грі Wordle гравці повинні вгадати секретне слово з п’яти літер за шість або менше ходів на основі підказок про наявність і розташування літер, виявлених їхніми попередніми відгадками. Хоча дещо подібні ігри з’являлися в минулому, кожен, хто грає в Wordle в певний день, повинен знайти одне таємне слово, що полегшує обмін своїми спробами та обговорення гри з друзями. Особлива структура та подача гри надихнули на запитання в нашому останньому Головоломка Insights. Відповіді обговорюються нижче.

Одним із ключів до хорошої гри Wordle є вибір сильного початкового слова. Комп'ютерні аналізи втілення методи теорії інформації Припустимо, що початкові слова, такі як «шифер» і «журавель», дозволять вам (або комп’ютерному алгоритму, у будь-якому випадку) розв’язати Wordles у середньому за найменшу кількість ходів. Однак багатьом людям-розв’язувачам зручніше вибрати слово з багатим голосним звуком, наприклад «adieu», «audio» або «raise». Це відчуття має як інтуїтивну, так і раціональну основу. По-перше, розміщені голосні дають змогу знайти «основу» голосних, яка може обмежити кількість приголосних, які потрібно шукати. Наприклад, якщо ви знаєте, що слово виглядає як _AI_E після того, як ви зіграли в «raise», залишилося лише кілька можливих слів: «naive», «waive» і «maize». По-друге, голосні максимізують кількість, яку можна назвати «охопленням» — між лише п’ятьма голосними та Y ми можемо отримати принаймні одну позитивну букву в кожній із 2,309 відповідей. Щоб отримати таке ідеальне покриття приголосними, вам доведеться спробувати всі 20 з них, для чого знадобиться щонайменше п’ять обертів.

Наша перша головоломка запропонувала читачам визначити, яке з цих трьох слів, багатих на голосні, є найкращим першим припущенням.

Головоломка 1 

У наведеній нижче таблиці подано частоту, з якою вісім букв у словах «adieu», «audio» та «raise» зустрічаються в кожній позиції в усьому списку відповідей Wordle із 2,309 слів. Базуючись на цій таблиці, визначте, скільки зелених і жовтих кольорів ви можете очікувати в усьому списку відповідей Wordle для кожного з трьох початкових слів, багатих на голосні: «adieu», «audio» і «raise». (У Wordle літера відображається із зеленим фоном, якщо вона розташована в правильному місці, і жовтим фоном, якщо вона є в слові, але знаходиться в неправильному місці.) Що це говорить про очікувану ефективність їх як початкових слів ?

читач Роб Корлетт показав, як обчислити кількість очікуваних зелених і жовтих кольорів за цією таблицею. Для «прощавай» A — правильна перша літера для 140 слів, D — правильна друга літера для 20 слів і так далі. Загальна кількість зелених над усіма можливими відповідями Wordle є їх сумою. Отже, «прощавай» отримує 140 + 20 + 266 + 318 + 1 = 745 зелених. Для жовтих ми маємо почати з кількості разів, коли літера зустрічається принаймні один раз у слові (906 для A в «adieu») і відняти кількість разів, коли вона зелена (140), щоб отримати кількість жовтих (766). . Додайте цифри для кожної літери в слові, щоб отримати загальну кількість жовтих. Ми можемо розділити ці числа на загальну кількість відповідей (2,309), щоб отримати очікування зелених і жовтих кольорів за один хід, але оскільки цей крок є загальним для всіх наших початкових слів, ми можемо просто працювати з загальними значеннями для порівняння трьох їх. Оскільки ми вибрали ці слова спеціально для пошуку голосної основи, ми також можемо підрахувати, скільки зелені походить від голосних. Ось результати.

Як бачите, порівняння не йде! «Raise» перевершує «adieu» в усіх відношеннях, надаючи більше зелених і жовтих тонів і даючи більше голосних у своїх правильних місцях, не кажучи вже про те, що ви також вловлюєте або виключаєте два найпоширеніші приголосні. «Аудіо» займає третє місце за всіма цими параметрами. Зауважте, що хоча ви можете отримати деяку інформацію про те, які літери відсутні, навіть якщо ви не отримуєте жовтих чи зелених, як читач Макс Девіс Зазначимо, ви точно отримаєте більше інформації, коли отримаєте один або кілька жовтих і зелених. Тож, «прощавайте», користувачі, можливо, настав час сказати «прощавайте».

Питання 1

Це було питання про те, наскільки ми повинні цінувати зелений колір відносно жовтого: скільки жовтих дорівнює одному зеленому? Чіткий характер наших результатів уникає необхідності відповідати на це для наведеного вище порівняння, але це цікаве запитання. Є два аспекти цієї оцінки. По-перше, це людський аспект: яку вагу ви надаєте розумовим зусиллям, необхідним для того, щоб з’ясувати всі різні способи розміщення жовтої літери? Не можна заперечувати, що вживання великої кількості зелені полегшує життя та дає нам більше дофаміну. З точки зору теорії інформації, вам потрібно було б переглянути кожне початкове слово для кожного слова-відповіді та порівняти, скільки ходів знадобилося б, щоб вирішити головоломку, коли ті самі літери були зеленими, порівняно з тими, коли вони були жовтими в кожному випадку.

Хоча це величезне завдання, мені вдалося виконати його для найкращого можливого початкового слова для комп’ютера (незрозуміле слово «tarse», що означає чоловічого сокола, чиє повне дерево оптимальних рішень було розміщено в Інтернеті математиком Алексом Селбі). Відповідь дивує. Середня кількість ходів, необхідна для комп’ютерного рішення з використанням слова-відповіді, яке давало лише зелені літери в першому ході, становила 3.34, тоді як кількість ходів, необхідна, коли були лише жовті літери, становила 3.51, тобто збільшення лише на 5%! Очевидно, що для комп’ютерного алгоритму розміщення жовтих літер, яке здається таким страхітливим для нас, людей, може бути виконане без зайвого штрафу. Я б припустив, що різниця була б більшою для людини-розв’язувача не лише в кількості необхідних ходів, але й у розумових зусиллях і часу, необхідних для вирішення.

Головоломка 2

A) Якщо ви отримуєте всі п’ять жовтих у свій перший хід, яка максимальна кількість ходів може знадобитися, щоб знайти відповідь, припускаючи найкращу гру?

As Роб Корлетт та Сем Роудс правильно сформульована, теоретична відповідь дорівнює п’яти: повністю жовта комбінація літер, наприклад ABCDE, може протистояти відкриттю протягом ще чотирьох ходів, оскільки вам, можливо, доведеться циклічно перейти між BCDEA, CDEAB і DEABC, перш ніж виявити, що відповідь EABCD. На практиці, однак, такі циклічні «слова» неможливі саме тому, що справжні слова мають певні шаблони голосних і приголосних, які не можна довільно розтягувати. Навіть слова з багатьма анаграмами можна розгадати не більше ніж за три спроби, як продемонстрував Роб Корлетт за допомогою «розбору».

Б) Чи буває так, що те, що літера в певному місці стає жовтою, є більш цінним, ніж те, що вона стає зеленою? Якщо так, чи можете ви навести приклад і пояснити, чому це має бути?

Так, буква жовтого кольору в окремих випадках може бути ціннішою, ніж та сама літера зеленого кольору, якщо це літера, яка рідко з’являється в інших позиціях. Це часто трапляється з Y, яке переважно зустрічається в кінці слова. Припустімо, ви починаєте з «живота», і B і Y виходять зеленими. У вас є багато можливостей: «мішкуватий», «невеликий», «боббі», «дупчастий», «кущистий» тощо. Але якщо і B, і Y будуть жовтими, є лише одна можливість: «прірва».

Питання 2

Людина з хорошим словниковим запасом незрозумілих слів Scrabble має перевагу чи недолік у грі в Wordle?

Як колишній гравець у турнірах Scrabble, який витратив чимало годин на запам’ятовування незрозумілих слів, я вважаю, що це як перевага, так і недолік. Коли я вперше почав грати в Wordle, я часто бачив можливість і намагався виключити незвичайні слова, які, як я пізніше зрозумів, майже не мали шансів бути правильними. (У термінології з гольфу, яку часто використовує моя група Wordle, ми називаємо це загрозою уявної небезпеки.) Як я описав у колонці головоломок, відповіді Wordle складаються зі списку простих слів, більшість із яких відомі. для всіх носіїв англійської мови США. Навіть слова, які є дещо незвичайними, але не незрозумілими, відсутні в списку відповідей Wordle. Наприклад, нещодавно я втратив час, граючи в «латекс», досить поширене слово, яке, як виявилося, не є можливою відповіддю Wordle. Тому, як і всім гравцям Wordle, мені довелося побудувати уявну модель типу слова, яке могло б бути відповіддю Wordle, і спеціально ігнорувати види рідкісних і незрозумілих слів, які я із задоволенням використовував би, щоб набрати більше балів у Scrabble. З іншого боку, знання цих рідкісних слів стане в нагоді під час «перебирання приголосних», що вам іноді доводиться робити, щоб не витрачати багато ходів на вгадування купи схожих слів одне за іншим. Наприклад, якщо у вас є _RA_E і ви дивитеся на купу можливих слів, що містять D, G і K, наприклад «гальмо», «селезень», «драп», «сорт» і «виноград», це допоможе знати і зіграйте слово «кедж», що може гарантувати пошук рішення ще за два оберти (кеджувати означає рухати корабель, кинувши його якір на відстані, а потім потягнувши його міцною мотузкою).

Щоденне отримання тієї ж головоломки Wordle, що й усі інші, заохочує до соціальних ігор. Але в Інтернеті повно спойлерів, і це відомо деякі люди обманюють повідомляючи свої бали. Наступна головоломка стосується питання про те, коли підозри в шахрайстві в групі Wordle виправдані виключно на основі неймовірності оцінки особи. Знову ж таки, ця головоломка сформульована в термінах підрахунку очок у гольфі: рішення Wordle у три ходи називається пташкою, отримати його в два ходу – це орел, а отримати слово в першому ході – це, звичайно, дірка в одному .)

Головоломка 3

Традиційний науковий критерій для подальшого дослідження полягає в тому, що ймовірність випадкового результату ( значення альфа) становить менше 5% або менше 1%, залежно від цілей дослідників. Тоді результат вважається статистично значущим на рівні 5% або 1%. Оскільки неприйнятно підозрювати людей у ​​зраді, коли це не так, давайте виберемо більш консервативний рівень 1% у цьому дослідженні.

Припустімо, ви належите до групи Wordle із 10 гравців, які щодня обмінюються результатами один з одним протягом 200 днів. Припустімо, що дуже хороший гравець-людина може розраховувати отримати пташку кожні 2.5 гри, орла кожні 40 ігор і дірку кожні 2,000 ігор (що є розумними оцінками реального світу).

A) Скільки пташок поспіль було б важливим на рівні 1% у вашій групі протягом цього часу?

Б) Скільки орлів у ряд?

В) Скільки отворів в одному ряду?

Ключовим тут є усвідомлення того, що ваша популяція становить 2,000 осіб-ігор. Отже, щоб досягти цього рівня значущості, вам потрібно було б побачити подію, яка відбувалася б рідше, ніж один раз на 200,000 XNUMX ігор для людей виключно випадково.

A) Смуги «пташка або краще»: ймовірність отримати пташку або краще в одній грі становить 2/5 + 1/40 + 1/2,000 = 0.4255, що дорівнює 1 приблизно в 2.35 ігор. Давайте назвемо це B. Найменша потужність B що перевищує 200,000 XNUMX є B15, що становить понад 368,000 тис. (B14 становить близько 157,000 15). Отже, пташина або краща смуга 14 або більше для будь-кого в групі задовольнила б цей суворий критерій, але один з 20,000 ні. Якщо ви підозрюєте окремого гравця, вам знадобиться побачити подію, яка трапляється рідше, ніж один раз на 12 1,850 ігор, що трапиться із серією «пташка чи краще» 188. (Зверніть увагу, що фактична кількість можливостей мати серії ця довжина трохи менша: насправді це XNUMX ігор для групи та XNUMX ігор для окремого гравця, але це не має значення в цьому випадку).

Зверніть увагу, що це частоти для досвідчених гравців, і підозрілі смуги для більшості груп і окремих осіб будуть меншими. Щоб застосувати цей критерій на практиці, вам потрібно буде визначити відповідні частоти пташки, орла та нори в одному, які ви бачите, а також врахувати кількість ігор, які були зіграні у вашій групі.

Б) Смуги орла або кращого: ймовірність орла або кращого становить 1/40 + 1/2,000 = 0.0255, або приблизно 1 до 39.2. Довжина смуги, яка перевищує наш рівень значущості, становить 4 для групи та 3 для підозрілої особи.

C) Смуги «діри в одній»: довжина смуги, яка перевищує наш рівень значущості, становить 2 як для групи, так і для підозрілої особи.

Є застереження щодо останніх двох відповідей: це рідкісні події, і розмір вибірки дуже малий, тому ви повинні бути обережними. Більшість статистиків, як правило, чекали б, доки вони не побачать принаймні п’ять або більше випадків орлів або дірок в одному, не обов’язково як частину смуги, перш ніж їм буде зручно застосовувати тест на значущість.

Питання 3

Цілком можливо, що частота хороших результатів у вашій групі значно вища, ніж частота, передбачена випадково, без жодних обманів. Як би ви це пояснили?

Одна з можливих причин цього, як Роб Корлетт пояснює, можливо, що «гравці ретельно ведуть записи про кожен результат». Як я пояснював у прелюдії до головоломки 4, відповіді Wordle не повинні повторюватися протягом п’яти років або близько того за поточних налаштувань. Отже, навіть якщо ніхто не обманює або не знає всіх слів у списку відповідей, ця інформація все одно може допомогти будь-якій людині чи групі поступово працювати краще.

Але є ще одна причина: список може бути неправильно рандомізованим. Граючи в Wordle протягом останніх кількох місяців, я помітив, що щоразу, коли був вибір між двома або кількома словами, прості слова з більшою вірогідністю були правильними, ніж менш поширені. Наприклад, якщо у вас були А, Н і Е, а на вибір залишилися такі слова, як «крастися», «гієна» та «клізма», ви можете без вагань зіграти найпростіше слово (у цьому випадку «крастися»), і ви б виправляйте набагато частіше, ніж ви очікували б випадково. Насправді я використовував список частот англійських прозових слів, щоб перевірити, наскільки поширеними були відповіді, які я зустрічав протягом двох місяців, порівняно із середнім словом у списку відповідей Wordle. Відповіді, які я зустрічав, були приблизно на 25% більш поширеними, ніж середнє слово в списку відповідей Wordle, і що важливіше, для найрідкісніших слів у списку (10%) у відповідях з’являлося лише на третину більше, ніж передбачалося. до. Орли відбувалися з частотою, ближчою до 1/20, а не до 1/40, виходячи з чистої випадковості. Тож здається, що послідовність відповідей Wordle не є належним чином рандомізована, і або вона завантажена наперед простішими словами, або ми випадково переглядаємо частину списку, яка складається з простіших слів.

Важливою нещодавньою зміною є те, що The New York Times призначений редактором Wordle щоб запрограмувати слово дня, починаючи з 7 листопада. Відтоді видалення важких або образливих слів із попереднього списку стало більш поширеним, включаючи заміну за лаштунками таких слів, як «омбре», «блювота» та « Фанні». Хоча я розумію необхідність Час очистити та спростити слова Wordle, щоб запобігти обуренню мільйонів людей, які грають, це робить гру менш випадковою та набагато більш передбачуваною. Ще гіршою є невдала редакційна тенденція за останні кілька тижнів обирати слово відповідно до дня, наприклад «бенкет» у День подяки та «медаль» у День ветеранів. Це означає надання додаткової підказки про слово ще до початку гри, полегшуючи головоломку та відволікаючи її від багатого зв’язку теорії інформації. Я сподіваюся, що це тимчасова аберація, тому що випадковість є важливим елементом цієї гри. Більшість людей, які дав відгук до The New York Times про ці редакційні вибори відчував те саме.

Наша четверта головоломка базувалася на тому факті, що за поточної архітектури рішення Wordle ніколи не повторюватимуться, доки список не закінчиться приблизно через п’ять років.

Головоломка 4

Розглянемо людину з ідеальною пам’яттю минулих рішень. Для такої людини відповідь буде очевидною в останній день списку Wordle із 2,309 слів. Чи можете ви швидко оцінити, скільки дірок в одній ця особа очікує отримати протягом усього списку, не виконуючи фактичних розрахунків? Потім, якщо можете, спробуйте зробити фактичний розрахунок.

Роб Корлетт відповів ідеально, логічно оцінивши відповідь 8.25, а потім обчисливши відповідь 8.32. Основні розрахунки Корлетта наведені нижче. Ви можете перевірити коментар щодо чудової техніки оцінювання.

Якщо у вас є m слова, і ви здогадуєтеся, то шанси зробити все правильно становлять 1/m. Якщо у вас є 1 слово, шанси 1/1, 2 слова 1/2, 3 слова 1/3 і т. д. Якщо ви додасте їх разом, ви отримаєте очікувану кількість дірок в одному! …

[Для цього] нам потрібно обчислити суму зворотних величин усіх чисел від 2309 до 1. Я зробив це в електронній таблиці та виявив, що загальна сума дорівнює 8.32, задовільно близько до моєї оцінки!

Наше останнє запитання стосувалося того, як покращити рандомізацію слів у Wordle, зберігаючи його «клієнтський» дизайн. До того, як було призначено редактора Wordle, не було щоденної рандомізації слів: слова надходили із завантаженого попереднього списку, який не був дуже добре рандомізований, як я вже згадував вище. Потім слово рішення Wordle генерувалося на пристрої клієнта (користувача) зі списку слів залежно від поточної дати, і вся головоломка також розглядалася на пристрої користувача. Код для виконання всього цього завантажується щодня під час першого підключення користувача до веб-сайту. Після цього користувачеві не потрібно бути онлайн.

Питання 4

Як би ви розробили Wordle так, щоб він зберіг дизайн на стороні клієнта, гарантуючи, що кожен отримає те саме слово рішення в певний день, але рандомізує відповіді в розумний спосіб, не вимагаючи щодня змінювати код?

Було кілька хороших відповідей на питання рандомізації. Кілька читачів запропонували використати псевдовипадкове число з попередньо визначеним початковим значенням для створення індексу в списку відповідей Wordle. Мумінтроль навіть написав програму, яка випадковим чином перемішує п’ять списків відповідей Wordle (тривалістю 32 роки), гарантуючи, що жодне слово не повторюється протягом року. Для мене найпривабливіша процедура вийшла з СліпаФеміда, який припустив, що випадкове насіння, яке використовується для процедури рандомізації, має бути останніми чотирма цифрами кількості людей, які грали в гру до певного часу. (Оскільки в Wordle можна грати в будь-якій точці світу, це потрібно робити в часових поясах над східною частиною Тихого океану, починаючи від міжнародної лінії зміни дат!) Чудова річ у цьому полягає в тому, що ніхто, навіть Нью-Йорк Таймс Редактор Wordle знав би слово за день до його використання.

Жоден із цих механізмів не може бути повністю виконаний на стороні клієнта, як Тім Росс вказано наголошено. Наступне слово має бути згенероване сервером, і це слово або його номер індексу має бути завантажено, можливо, у зашифрованому вигляді разом із рештою коду. Як зазначив Росс, на даний момент 2,309 слів-відповідей чітко видно у вихідному коді в порядку дати, який може відкрити будь-який браузер. Одним із підходів може бути шифрування списку слів відповіді та збереження його в алфавітному порядку, а не в порядку дати.

Хоча запропоновані покращення рандомізації допоможуть, шифрування не матиме жодного значення, оскільки в Інтернеті все одно буде багато спойлерів і багато способів шахрайства.

Дякуємо всім, хто долучився до цієї цікавої дискусії. Приз Insights за цю головоломку отримує Роб Корлетт. Щиро вітаю! Наш наступний пазл з'явиться в лютому. А поки бажаємо веселих загадок і веселих свят!

Часова мітка:

Більше від Квантамагазин