Тест Крускала Уолліса для початківців

Тест Крускала Уолліса: мета, сфера застосування, припущення, приклади, реалізація Python

Фото Роман Магер on Unsplash

Kruskal Wallis — це непараметричний метод для оцінки того, чи походять зразки з того самого розподілу. Він використовується для порівняння більш ніж двох незалежних або непов’язаних зразків. Односторонній дисперсійний аналіз (ANOVA) є параметричною еквівалентністю тесту Крускала-Уолліса.

1.1 Який варіант використання для бізнесу?

Давайте виміряємо вплив кампанії, розгорнутої фармацевтичною компанією щодо нещодавно випущеного препарату, у якому ми маємо 1,550 цілей і 500 осіб, які відмовилися. Ми переглянули розподіл поведінки за рецептом і виявили, що він є ненормальним (зміщеним), але має однакову форму для кожної групи (цілі та утримувані). Ми не можемо виконувати ANOVA; отже ми застосовуємо непараметричний критерій Крускала-Уолліса.

Оскільки Kruskal Wallis є непараметричним тестом, немає припущення, що дані розподіляються нормально (на відміну від ANOVA).

  1. Фактична нульова гіпотеза полягає в тому, що популяції, з яких походять зразки, мають однакову медіану.
  2. Тест Краскела-Уолліса найчастіше використовується, коли є одна змінна атрибута та одна змінна вимірювання, і змінна вимірювання не відповідає припущенням ANOVA (нормальності та гомоскедастичності).
  3. Як і більшість непараметричних тестів, він виконується на ранжованих даних, тому вимірювальні спостереження перетворюються на їхні ранги за допомогою загального набору даних: найменше або найменше значення отримує ранг 1, наступне найменше отримує ранг 2, наступний ранг 3 і так далі. У разі нічиєї враховується середній рейтинг.
  4. Втрата інформації під час заміни рангів на початкові значення робить цей тест менш потужним, ніж ANOVA, тому ANOVA слід використовувати, якщо дані відповідають припущенням.

Іноді стверджують, що нульова гіпотеза тесту Краскела-Уолліса полягає в тому, що групові медіани рівні. Однак це точно, лише якщо ви вважаєте, що характеристики розподілу кожної групи однакові. Незважаючи на те, що медіани однакові, тест Крускала-Уолліса може відхилити нульову гіпотезу, якщо розподіли відрізняються.

Групи різного розміру можна досліджувати за допомогою статистики Крускала-Уолліса. Критерій Краскела-Уолліса, на відміну від порівнянного одностороннього дисперсійного аналізу, не передбачає нормального розподілу, оскільки це непараметрична процедура. Проте тест передбачає, що розподіл кожної групи має однакову форму та масштаб, за винятком будь-яких варіацій медіан.

За допомогою Kruskal Wallis можна проаналізувати, чи відрізняються тест і контроль. Якщо дані спотворені (ненормальний розподіл), тест покаже, чи відрізняються дві групи, не встановлюючи жодного причинного зв’язку. Це не підказує причину різниці в поведінці.

4.1 Як працює тест?

Kruskal Wallis працює, ранжуючи всі спостереження, починаючи з 1 (найменшого). Ранжування проводиться для всіх точок даних, незалежно від групи, до якої вони належать. Зв’язані значення отримують середній ранг, який вони отримали б, якби не були рівними.

Коли всім спостереженням присвоюється знаковий ранг на основі змінної аналізу (кількість призначених рецептів), вони диференціюються/поділяються на групи на основі їх цільового/недостатнього статусу. Після цього обчислюється та порівнюється середній рейтинг кожної групи.

Очікується, що ціль матиме вищий середній рейтинг, ніж ті, хто відмовився, оскільки ініціатива або рекламні зусилля розгортаються для цієї групи. Завдяки значному p-значенню, Target працює краще, ніж ті, хто відмовляється. Проблема тут полягає в тому, що середній рейтинг цільової групи може бути вищим за наявності викидів, тобто небагато лікарів пишуть більше сценаріїв, ніж інші. Тому ми завжди дивимось на арифметичну медіану та результуюче p-значення, отримане Крускалом Уоллісом, щоб підтвердити/спростувати нашу гіпотезу.

Нехай Ni (i = 1, 2, 3, 4,…, g) представляє розміри вибірки для кожної групи g (тобто вибірки або, у цьому випадку, кількість лікарів) у даних. ri є сумою рангів для групи i з ri’ як середнім рангом групи i. Тоді статистика тесту Крускала Уолліса обчислюється як:

Формула 1. Ілюструє формулу для обчислення тестової статистики. Зображення підготовлено автором за допомогою Markdown і Latex.

Нульова гіпотеза про рівні медіани населення відхиляється, якщо тестова статистика перевищує порогове значення хі-квадрат. Коли нульова гіпотеза рівних популяцій вірна, ця статистика має k-1 ступенів свободи та наближається до розподілу хі-квадрат. Для того, щоб наближення було точним, наближення повинно мати значення ni щонайменше 5 (тобто принаймні п’ять спостережень у групі).

Формула 2. Ілюструє формулу для наближення p-значення для тесту. Зображення підготовлено автором за допомогою Markdown і Latex.

Використовуючи таблицю розподілу ймовірностей хі-квадрат, ми можемо отримати вирішальне значення хі-квадрат при g-1 ступенях свободи та бажаному рівні значущості. Крім того, ми можемо перевірити значення p, щоб прокоментувати значущість результатів.

4.2 Виконайте тест H вручну

Припустімо, що фармацевтична компанія хоче зрозуміти, чи три групи сегментів лікарів мають різні обсяги пацієнтів (Стефані Глен, н.д.) Наприклад,

Ключові лідери громадської думки/KOL (кількість пацієнтів за місяць): 23, 42, 55, 66, 78

Спеціалісти/SPE (обсяг пацієнтів за місяць): 45, 56, 60, 70, 72

Лікарі загальної практики/загальної практики (кількість пацієнтів за місяць): 18, 30, 34, 41, 44

4.2.1 Розташуйте дані в порядку зростання після об’єднання їх в один набір

18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

4.2.2 Ранжування відсортованих точок даних. Використовуйте середнє значення у випадку нічиї

Значення: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

Місце: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 Обчисліть суму рангів для кожної групи

Малюнок 1. Ілюструє суму рангів для кожної групи. Автор зображення — підготовлено автором.

4.2.4 Обчисліть статистику H за допомогою формули 1 і чисел із рисунка 1

Формула 3. Ілюструє формулу для розрахунку статистики Н для нашої групи тих, хто призначає ліки. Зображення підготовлено автором за допомогою Markdown і Latex.

Н = 6.72

4.2.5 Визначте критичне значення хі-квадрат для ступенів свободи g-1 за допомогою
α=0.05, що для нашої задачі (3–1=2 ступені свободи) має становити 5.99. Зверніться до таблиці нижче.

4.2.6 Порівняйте значення H з 4.2.4 з критичним значенням з 4.2.5

Нульову гіпотезу про те, що середній об’єм пацієнтів у трьох різних групах є однаковим, слід відхилити, якщо критичне значення хі-квадрат менше, ніж H-статистика. Оскільки 5.99 (критичне значення) < 6.72, ми можемо відхилити нульову гіпотезу.

Необхідно мати більше доказів, щоб зробити висновок про те, що медіани нерівні, якщо значення хі-квадрат не нижче за розраховану вище статистику H.

Нульова гіпотеза про те, що медіана населення всіх груп однакова, перевіряється за допомогою H-критерію Крускала-Уолліса. Це варіант ANOVA, який не є параметричним. Тест використовує два або більше незалежних зразків різного розміру. Зверніть увагу, що спростування нульової гіпотези не показує, чим відрізняються групи. Щоб визначити, які групи відрізняються, необхідні пост-гок порівняння між групами.

зі статистики імпорту scipy
x = [1, 3, 5, 8, 9, 12, 17]
y = [2, 6, 6, 8, 10, 15, 20, 22]
stats.kruskal(x, y)
KruskalResult(статистика=0.7560483870967752, pvalue=0.3845680059797648)print(np.median(x))
print(np.median(y))
8.0
9.0
print(np.mean(x))
print(np.mean(y))
7.86
11.12

Результат, згенерований Python, показаний вище. Слід зазначити, що хоча спостерігається помітна різниця в середніх значеннях у двох категоріях, ця різниця, якщо взяти до уваги медіану, є незначущою, оскільки p-значення значно перевищує 5%.

Тест Крускала Уолліса є важливим при роботі з особливо перекошеними зразками. Його можна широко використовувати для тестової контрольної групи під час розгортання кампанії або навіть під час виконання A/B-тестування. Це стосується більшості галузевих випадків використання, оскільки кожен клієнт має різну поведінку, коли має справу з клієнтами в роздрібних приміщеннях або лікарями у фармацевтичному середовищі. Коли ми дивимося на розмір кошика або кількість пацієнтів, небагато клієнтів купують більше, тоді як небагато лікарів мають більше пацієнтів. Тому для такого спотвореного розподілу життєво важливо застосувати тест Крускала Уолліса, щоб перевірити, чи поведінка подібна.

Стефані Глен. «Тест Крускала Уолліса H: визначення, приклади, припущення, SPSS» З StatisticsHowTo.com: Елементарна статистика для всіх нас! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

Тест Крускала Уолліса для початківців Опубліковано з джерела https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 через https://towardsdatascience.com/feed

<!–

->

Часова мітка:

Більше від Консультанти з блокчейнів