Test Kruskala Wallisa dla początkujących

Test Kruskala Wallisa: cel, zakres, założenia, przykłady, implementacja w Pythonie

Photo by Romana Magera on Unsplash

Kruskal Wallis to nieparametryczna metoda oceny, czy próbki pochodzą z tego samego rozkładu. Stosuje się go przy porównywaniu więcej niż dwóch niezależnych lub niepowiązanych próbek. Jednokierunkowa analiza wariancji (ANOVA) jest parametryczną równoważnością testu Kruskala-Wallisa.

1.1 Jaki byłby dobry przypadek użycia biznesowego?

Zmierzmy wpływ kampanii prowadzonej przez firmę farmaceutyczną na temat nowo wprowadzonego leku, w przypadku której mamy 1,550 celów i 500 wstrzymanych. Przyjrzeliśmy się rozkładowi zachowań na receptę i stwierdziliśmy, że jest on nietypowy (wypaczony), ale ma podobny kształt dla każdej grupy (docelowej i powstrzymującej). Nie możemy wykonać ANOVA; stąd stosujemy test nieparametryczny Kruskala-Wallisa.

Ponieważ Kruskal Wallis jest testem nieparametrycznym, nie zakłada się, że dane mają rozkład normalny (w przeciwieństwie do ANOVA).

  1. Faktyczna hipoteza zerowa zakłada, że ​​populacje, z których pochodzą próbki, mają tę samą medianę.
  2. Test Kruskala-Wallisa stosuje się najczęściej, gdy istnieje jedna zmienna atrybutowa i jedna zmienna pomiarowa, a zmienna pomiarowa nie spełnia założeń ANOVA (normalność i homoskedastyczność)
  3. Podobnie jak większość testów nieparametrycznych, przeprowadza się go na danych rankingowych, zatem obserwacje pomiarowe przeliczane są na ich rangi na podstawie całego zbioru danych: najmniejsza lub najniższa wartość otrzymuje rangę 1, kolejna najmniejsza otrzymuje rangę 2, następna ranga 3 i tak dalej. W przypadku remisu pod uwagę brana jest średnia ranga.
  4. Utrata informacji podczas podstawienia rang w miejsce oryginalnych wartości sprawia, że ​​jest to test o mniejszej mocy niż ANOVA, dlatego należy zastosować ANOVA, jeśli dane spełniają założenia.

Czasami stwierdza się, że hipoteza zerowa testu Kruskala-Wallisa głosi, że mediany grup są równe. Jest to jednak dokładne tylko wtedy, gdy uważasz, że charakterystyka dystrybucji każdej grupy jest taka sama. Mimo że mediany są takie same, test Kruskala-Wallisa może odrzucić hipotezę zerową, jeśli rozkłady się różnią.

Grupy o różnej wielkości można badać za pomocą statystyki Kruskala-Wallisa. Test Kruskala-Wallisa w odróżnieniu od porównywalnej jednokierunkowej analizy wariancji nie zakłada rozkładu normalnego, gdyż jest procedurą nieparametryczną. Test zakłada jednak, że rozkład każdej grupy ma identyczny kształt i skalę, z wyjątkiem wszelkich różnic w medianach.

Kruskala Wallisa można wykorzystać do analizy, czy test i kontrola działały inaczej. Kiedy dane są wypaczone (rozkład inny niż normalny), test wykaże, czy obie grupy są różne, bez ustalania związku przyczynowego. Nie będzie sugerować przyczyny różnicy w zachowaniu.

4.1 Jak działa test?

Kruskal Wallis szereguje wszystkie obserwacje, zaczynając od 1 (większość mniejszych). Ranking dokonywany jest dla wszystkich punktów danych, niezależnie od grupy, do której należą. Remisowe wartości otrzymują średnią rangę, jaką otrzymaliby, gdyby nie były remisowe.

Kiedy wszystkim obserwacjom przypisano rangę ze znakiem na podstawie zmiennej analitycznej (liczby przepisanych recept), są one różnicowane/dzielone na grupy w oparciu o ich status docelowy/wstrzymany. Następnie obliczana jest i porównywana średnia pozycja każdej grupy.

Oczekuje się, że cel będzie miał wyższą średnią rangę niż grupa wstrzymana, ponieważ w przypadku tej grupy wdrożono inicjatywę lub działania promocyjne. Przy znacznej wartości p Target radzi sobie lepiej niż holdouts. Wyzwanie polega na tym, że średnia pozycja grupy docelowej może być wyższa w przypadku elementów odstających, tj. niewielu lekarzy pisze więcej scenariuszy niż inni. Dlatego zawsze patrzymy na medianę arytmetyczną i wynikającą z niej wartość p uzyskaną przez Kruskala Wallisa, aby potwierdzić/odrzucić naszą hipotezę.

Niech Ni (i = 1, 2, 3, 4,…, g) reprezentuje liczebność próbek dla każdej grupy g (tj. próbek lub, w tym przypadku, liczby lekarzy) w danych. ri jest sumą rang dla grupy i, gdzie ri' jest średnią rangą grupy i. Następnie statystykę testową Kruskala Wallisa oblicza się jako:

Formuła 1. Ilustruje wzór do obliczania statystyk testowych. Obraz przygotowany przez autora przy użyciu Markdown i Latex.

Hipotezę zerową o równych medianach populacji odrzuca się, jeśli statystyka testowa przekracza próg wartości chi-kwadrat. Gdy hipoteza zerowa o równych populacjach jest prawdziwa, statystyka ta ma k-1 stopni swobody i jest przybliżona do rozkładu chi-kwadrat. Aby przybliżenie było dokładne, musi mieć współczynnik ni wynoszący co najmniej 5 (tj. co najmniej pięć obserwacji w grupie).

Formuła 2. Ilustruje wzór na aproksymację wartości p dla testu. Obraz przygotowany przez autora przy użyciu Markdown i Latex.

Korzystając z tabeli rozkładu prawdopodobieństwa chi-kwadrat, możemy uzyskać kluczową wartość chi-kwadrat przy g-1 stopniach swobody i pożądanym poziomie istotności. Alternatywnie możemy zbadać wartość p, aby skomentować znaczenie wyników.

4.2 Ręcznie uruchom test H

Załóżmy, że firma farmaceutyczna chce zrozumieć, czy trzy grupy lekarzy mają różną liczbę pacjentów (Stephanie Glen, b) Na przykład,

Kluczowi Liderzy Opinii/KOL (liczba pacjentów w miesiącu): 23, 42, 55, 66, 78

Specjaliści/SPE (ilość pacjentów w miesiącu): 45, 56, 60, 70, 72

Lekarze ogólni/GP (liczba pacjentów w miesiącu): 18, 30, 34, 41, 44

4.2.1 Uporządkuj dane w kolejności rosnącej po połączeniu ich w jeden zbiór

18 23 24 30 41 42 44 45 55 56 60 66 70 72

4.2.2 Ranking posortowanych punktów danych. W przypadku remisów użyj średniej

Wartości: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

Ranga: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 Oblicz sumę rang dla każdej grupy

Rysunek 1. Ilustruje sumę rang dla każdej grupy. Źródło obrazu — przygotowane przez autora.

4.2.4 Oblicz statystykę H, korzystając ze wzoru 1 i liczb z rysunku 1

Formuła 3. Ilustruje wzór do obliczania statystyki H dla naszej grupy lekarzy. Obraz przygotowany przez autora przy użyciu Markdown i Latex.

H = 6.72

4.2.5 Zidentyfikować krytyczną wartość chi-kwadrat dla g-1 stopni swobody
α=0.05, które dla naszego problemu (3–1=2 stopnie swobody) powinno wynosić 5.99. Zapoznaj się z poniższą tabelą.

4.2.6 Porównaj wartość H z 4.2.4 z wartością krytyczną z 4.2.5

Hipotezę zerową stwierdzającą, że mediana objętości pacjentów w trzech różnych grupach jest równa, należy odrzucić, jeśli krytyczna wartość chi-kwadrat jest mniejsza niż statystyka H. Ponieważ 5.99 (wartość krytyczna) < 6.72, możemy odrzucić hipotezę zerową.

Potrzebnych jest więcej dowodów, aby wywnioskować, że mediany są nierówne, jeśli wartość chi-kwadrat nie jest niższa niż statystyka H obliczona powyżej.

Hipotezę zerową, że mediany populacji wszystkich grup są równe, testuje się za pomocą testu H Kruskala-Wallisa. Jest to wariant ANOVA, który nie jest parametryczny. W teście wykorzystuje się dwie lub więcej niezależnych próbek o różnej wielkości. Należy zauważyć, że obalenie hipotezy zerowej nie ujawnia różnic między grupami. Aby określić, które grupy się różnią, konieczne są porównania post hoc między grupami.

ze statystyk importu Scipy
x = [1, 3, 5, 8, 9, 12, 17]
y = [2, 6, 6, 8, 10, 15, 20, 22]
statystyki.kruskal(x, y)
KruskalResult(statystyka=0.7560483870967752, wartość p=0.3845680059797648)print(np.mediana(x))
print(np.mediana(y))
8.0
9.0
print(np.średnia(x))
print(np.średnia(y))
7.86
11.12

Dane wyjściowe wygenerowane przez Python pokazano powyżej. Należy zauważyć, że choć obserwuje się wyraźną różnicę w średnich wartości w obu kategoriach, to różnica ta, biorąc pod uwagę medianę, jest nieistotna, ponieważ wartość p jest znacznie większa niż 5%.

Test Kruskala Wallisa jest pomocny w przypadku szczególnie wypaczonych próbek. Może być szeroko stosowany w grupie kontrolnej testów podczas wdrażania kampanii lub nawet podczas przeprowadzania testów A/B. Ma to zastosowanie w większości zastosowań branżowych, ponieważ każdy klient zachowuje się inaczej w kontaktach z klientami w handlu detalicznym lub z lekarzami w środowisku farmaceutycznym. Kiedy spojrzymy na wielkość koszyka lub liczbę pacjentów, niewielu klientów kupuje więcej, podczas gdy niewielu lekarzy ma więcej pacjentów. Dlatego w przypadku tak skośnego rozkładu istotne jest zastosowanie testu Kruskala Wallisa w celu sprawdzenia, czy zachowania są podobne.

Stephanie Glen. „Test Kruskala Wallisa H: definicja, przykłady, założenia, SPSS” Od StatystykiHowTo.com: Podstawowe statystyki dla reszty z nas! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

Test Kruskala Wallisa dla początkujących Opublikowano ponownie ze źródła https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 przez https://towardsdatascience.com/feed

<!–

->

Znak czasu:

Więcej z Konsultanci Blockchain