Тест Краскала Уоллиса для начинающих

Тест Крускала Уоллиса: цель, область применения, предположения, примеры, реализация на Python

Фото Роман Магер on Unsplash

Краскал Уоллис — это непараметрический метод оценки того, происходят ли выборки из одного и того же распределения. Он используется при сравнении более чем двух независимых или несвязанных выборок. Односторонний дисперсионный анализ (ANOVA) представляет собой параметрическую эквивалентность критерия Краскела-Уоллиса.

1.1 Каким будет хороший вариант использования в бизнесе?

Давайте измерим влияние кампании, развернутой фармацевтической компанией на недавно выпущенный препарат, где у нас есть 1,550 целей и 500 противников. Мы изучили распределение предписанного поведения и обнаружили, что оно ненормальное (перекошенное), но имеет одинаковую форму для каждой группы (целевых и несогласных). Мы не можем выполнить ANOVA; поэтому мы применяем непараметрический тест Крускала-Уоллиса.

Поскольку Краскал Уоллис является непараметрическим тестом, нет предположения, что данные нормально распределены (в отличие от ANOVA).

  1. Фактическая нулевая гипотеза заключается в том, что популяции, из которых происходят выборки, имеют одинаковую медиану.
  2. Критерий Крускала-Уоллиса чаще всего используется, когда имеется одна переменная-атрибут и одна переменная измерения, и переменная измерения не соответствует предположениям ANOVA (нормальность и гомоскедастичность).
  3. Как и большинство непараметрических тестов, он выполняется на ранжированных данных, поэтому результаты измерений преобразуются в их ранги с использованием общего набора данных: наименьшее или наименьшее значение получает ранг 1, следующее наименьшее значение получает ранг 2, следующий ранг 3 и так далее. В случае ничьей учитывается средний рейтинг.
  4. Потеря информации при замене исходных значений рангами делает этот тест менее мощным, чем ANOVA, поэтому ANOVA следует использовать, если данные соответствуют предположениям..

Иногда утверждается, что нулевая гипотеза теста Крускала-Уоллиса заключается в том, что медианы группы равны. Однако это верно только в том случае, если вы считаете, что характеристики распределения каждой группы одинаковы. Несмотря на то, что медианы одинаковы, тест Крускала-Уоллиса может отвергнуть нулевую гипотезу, если распределения различаются.

Группы разного размера можно исследовать с помощью статистики Краскала-Уоллиса. Критерий Краскела-Уоллиса, в отличие от сопоставимого одностороннего дисперсионного анализа, не предполагает нормального распределения, поскольку является непараметрической процедурой. Однако тест предполагает, что распределение в каждой группе имеет одинаковую форму и масштаб, за исключением каких-либо различий в медианах.

Крускала Уоллиса можно использовать для анализа того, выполняются ли тест и контроль по-разному. Когда данные искажены (ненормальное распределение), тест покажет, различаются ли две группы, не устанавливая никакой причинно-следственной связи. Это не укажет на причину разницы в поведении.

4.1 Как работает тест?

Краскал Уоллис ранжирует все наблюдения, начиная с 1 (самое незначительное). Ранжирование выполняется для всех точек данных, независимо от группы, к которой они принадлежат. Связанные значения получают средний ранг, который они получили бы, если бы они не были связаны.

Когда всем наблюдениям присвоен знаковый ранг на основе анализируемой переменной (количества назначенных назначений), они дифференцируются/разделяются на группы в зависимости от их целевого/неурегулированного статуса. После этого рассчитывается и сравнивается средний рейтинг каждой группы.

Ожидается, что цель будет иметь более высокий средний рейтинг, чем несогласные, поскольку инициатива или рекламная кампания распространяется на эту группу. При значительном значении p Target работает лучше, чем несогласные. Проблема здесь в том, что средний рейтинг целевой группы может быть выше при наличии выбросов, т.е. немногих врачей, написавших больше сценариев, чем других. Следовательно, мы всегда смотрим на арифметическую медиану и результирующее значение p, полученное Краскалом Уоллисом, чтобы подтвердить/опровергнуть нашу гипотезу.

Пусть Ni (i = 1, 2, 3, 4,…, g) представляет размеры выборки для каждой группы g (т. е. выборки или, в данном случае, количества врачей) в данных. ri — это сумма рангов группы i, где ri’ — средний ранг группы i. Тогда статистика теста Краскала Уоллиса рассчитывается как:

Формула 1. Иллюстрирует формулу расчета статистики теста. Изображение подготовлено автором с использованием Markdown и Latex.

Нулевая гипотеза о равных медианах совокупности отклоняется, если тестовая статистика превышает пороговое значение хи-квадрат. Когда нулевая гипотеза о равных популяциях верна, эта статистика имеет k-1 степени свободы и приближается к распределению хи-квадрат. Чтобы аппроксимация была точной, она должна иметь ni не менее 5 (т. е. не менее пяти наблюдений в группе).

Формула 2. Иллюстрирует формулу аппроксимации значения p для теста. Изображение подготовлено автором с использованием Markdown и Latex.

Используя таблицу распределения вероятностей хи-квадрат, мы можем получить решающее значение хи-квадрат при степенях свободы g-1 и желаемом уровне значимости. В качестве альтернативы мы могли бы изучить значение p, чтобы прокомментировать значимость результатов.

4.2 Запустите H-тест вручную

Предположим, фармацевтическая компания хочет понять, имеют ли три группы сегментов врачей разные объемы пациентов. (Стефани Глен, без даты) Например,

Ключевые лидеры мнений/KOL (объем пациентов в месяц): 23, 42, 55, 66, 78

Специалисты/SPE (объем пациентов в месяц): 45, 56, 60, 70, 72

Врачи общей практики/врачи общей практики (объем пациентов в месяц): 18, 30, 34, 41, 44

4.2.1 Расположите данные в порядке возрастания после объединения их в один набор

18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

4.2.2 Ранжируйте отсортированные точки данных. Используйте среднее значение в случае ничьей

Значения: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

Ранг: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 Подсчитайте сумму рангов для каждой группы

Рисунок 1. Иллюстрирует сумму рангов для каждой группы. Изображение предоставлено — подготовлено автором.

4.2.4 Рассчитайте H-статистику, используя формулу 1 и цифры из рисунка 1.

Формула 3. Иллюстрирует формулу для расчета статистики H для нашей группы, назначающей лекарства. Изображение подготовлено автором с использованием Markdown и Latex.

H = 6.72

4.2.5 Определить критическое значение хи-квадрат для степеней свободы g-1 с помощью
α=0.05, что для нашей задачи (3–1=2 степени свободы) должно составлять 5.99. См. таблицу ниже.

4.2.6 Сравните значение H из 4.2.4 с критическим значением из 4.2.5.

Нулевая гипотеза, утверждающая, что медианный объем пациентов в трех разных группах одинаков, должна быть отклонена, если критическое значение хи-квадрат меньше, чем статистика H. Поскольку 5.99 (критическое значение) <6.72, мы можем отвергнуть нулевую гипотезу.

Должно быть больше доказательств, чтобы сделать вывод о том, что медианы неравны, если значение хи-квадрат не ниже, чем статистика H, рассчитанная выше.

Нулевая гипотеза о том, что медианы населения всех групп равны, проверяется с помощью H-критерия Крускала-Уоллиса. Это непараметрический вариант ANOVA. В тесте используются две или более независимых выборки разного размера. Обратите внимание, что опровержение нулевой гипотезы не показывает, чем различаются группы. Чтобы определить, какие группы различаются, необходимы апостериорные сравнения между группами.

из статистики импорта
х = [1, 3, 5, 8, 9, 12, 17]
у = [2, 6, 6, 8, 10, 15, 20, 22]
stats.kruskal(x, y)
КрускалРезультат (статистика = 0.7560483870967752, pvalue = 0.3845680059797648)печать (np.median (x))
печать (np.median (y))
8.0
9.0
печать (np.mean (х))
печать (np.mean (y))
7.86
11.12

Вывод, сгенерированный Python, показан выше. Следует отметить, что, хотя в средних значениях двух категорий наблюдается заметная разница, эта разница с учетом медианы незначительна, поскольку значение p значительно превышает 5%.

Тест Крускала-Уоллиса полезен при работе с особенно искаженными выборками. Его можно широко использовать для контрольной группы тестирования во время развертывания кампании или даже при проведении A/B-тестирования. Это применимо для большинства случаев использования в отрасли, поскольку каждый клиент ведет себя по-разному при общении с покупателями в розничной торговле или с врачами в фармацевтической сфере. Когда мы смотрим на размер корзины или количество пациентов, немногие клиенты покупают больше, тогда как немногие врачи имеют больше пациентов. Следовательно, для такого асимметричного распределения крайне важно провести тест Краскала Уоллиса, чтобы проверить, похоже ли поведение.

Стефани Глен. «Тест Крускала Уоллиса H: определение, примеры, предположения, SPSS» Из СтатистикаHowTo.com: Элементарная статистика для всех нас! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

Тест Крускала Уоллиса для начинающих. Опубликовано из источника https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 через https://towardsdatascience.com/feed

<!–

->

Отметка времени:

Больше от Блокчейн-консультанты