Kruskal Wallis test för nybörjare

Kruskal Wallis-test: Syfte, omfattning, antaganden, exempel, Python-implementering

Foto: Roman Mager on Unsplash

Kruskal Wallis är en icke-parametrisk metod för att utvärdera om prover kommer från samma distribution. Den används vid jämförelse av mer än två oberoende eller orelaterade prover. Envägsvariansanalys (ANOVA) är den parametriska ekvivalensen för Kruskal-Wallis-testet.

1.1 Vad skulle vara ett bra affärsanvändningsfall?

Låt oss mäta effekten av en kampanj som lanserats av ett läkemedelsföretag på ett nyligen lanserat läkemedel, där vi har 1,550 500 mål och XNUMX hållouter. Vi tittade på fördelningen av receptbeteendet och fann att den inte var normal (skev) men utformad på samma sätt för varje grupp (mål och hållplatser). Vi kan inte utföra ANOVA; därför tillämpar vi ett icke-parametriskt test, Kruskal-Wallis.

Eftersom Kruskal Wallis är ett icke-parametriskt test, finns det inget antagande om att data är normalfördelad (till skillnad från ANOVA).

  1. Den faktiska nollhypotesen är att de populationer som proverna härstammar från har samma median.
  2. Kruskal-Wallis-testet används oftast när det finns en attributvariabel och en mätvariabel, och mätvariabeln inte uppfyller antagandena för ANOVA (normalitet och homoskedasticitet)
  3. Liksom de flesta icke-parametriska tester, utförs det på rankad data, så mätobservationerna konverteras till deras rangordningar med hjälp av den övergripande datamängden: det minsta eller det lägsta värdet får rankningen 1, den näst minsta får rankningen 2, följande en rang 3, och så vidare. Vid oavgjort räknas en genomsnittlig rangordning.
  4. Förlusten av information i att ersätta de ursprungliga värdena gör detta till ett mindre kraftfullt test än ANOVA, så ANOVA bör användas om data uppfyller antagandena.

Kruskal-Wallis-testets nollhypotes anges ibland vara att gruppmedianerna är lika. Detta är dock bara korrekt om du tror att varje grupps fördelningsegenskaper är desamma. Även om medianerna är desamma kan Kruskal-Wallis-testet förkasta nollhypotesen om fördelningarna skiljer sig åt.

Grupper av olika storlekar kan undersökas med hjälp av Kruskal-Wallis-statistiken. Kruskal-Wallis-testet, till skillnad från den jämförbara envägsvariansanalysen, antar inte en normalfördelning eftersom det är en icke-parametrisk procedur. Testet förutsätter dock att varje grupps fördelning är identiskt utformad och skalad, med undantag för eventuella variationer i median.

Kruskal Wallis kan användas för att analysera om testet och kontrollen fungerade annorlunda. När data är skeva (icke-normalfördelning) kommer testet att avgöra om de två grupperna är olika utan att fastställa något orsakssamband. Det kommer inte att antyda orsaken till skillnaden i beteende.

4.1 Hur fungerar testet?

Kruskal Wallis fungerar genom att rangordna alla observationer, med start från 1 (de flesta mindre). Rangordningen görs för alla datapunkter, oavsett vilken grupp de tillhör. Oavslutade värden får den genomsnittliga rangordning de skulle ha fått om de inte hade varit lika.

När alla observationer har tilldelats en signerad rankning baserat på analysvariabeln (antalet ordinerade ordinationer) differentieras/delas de in i grupper baserat på deras mål/holdout-status. Därefter beräknas och jämförs varje grupps medelrankning.

Target förväntas ha en högre medelranking än holdouts eftersom initiativet eller marknadsföringsinsatsen rullas ut för denna grupp. Med ett betydande p-värde presterar Target bättre än holdouts. Utmaningen här är att den genomsnittliga rangordningen för målgruppen kan vara högre i närvaro av extremvärden, dvs få läkare skriver fler manus än andra. Därför tittar vi alltid på den aritmetiska medianen och det resulterande p-värdet som erhållits av Kruskal Wallis för att validera/motbevisa vår hypotes.

Låt Ni (i = 1, 2, 3, 4,..., g) representera provstorlekarna för varje g-grupp (dvs. prover eller, i detta fall, antalet läkare) i data. ri är summan av rangorden för grupp i med ri' som genomsnittlig rang för grupp i. Därefter beräknas Kruskal Wallis teststatistik som:

Formel 1. Illustrerar formeln för beräkning av teststatistik. Bild framställd av författaren med Markdown och Latex.

Nollhypotesen om lika populationsmedianer förkastas om teststatistiken överskrider tröskelvärdet chi-kvadrat. När nollhypotesen om lika populationer är sann, har denna statistik k-1 frihetsgrader och approximerar en chi-kvadratfördelning. Approximationen måste ha ni på minst 5 (dvs minst fem observationer i en grupp) för att den ska vara korrekt.

Formel 2. Illustrerar formeln för p-värdesapproximation för testet. Bild framställd av författaren med Markdown och Latex.

Med hjälp av en chi-kvadrat sannolikhetsfördelningstabell kan vi få det avgörande chi-kvadratvärdet vid g-1 frihetsgrader och den önskade signifikansnivån. Alternativt kan vi undersöka p-värdet för att kommentera resultatens betydelse.

4.2 Kör H-testet för hand

Låt oss anta att ett läkemedelsföretag vill förstå om tre grupper av läkarsegment har olika patientvolymer (Stephanie Glen, nd) T.ex,

Key Opinion Leaders/KOL (Patient Volume in a Month): 23, 42, 55, 66, 78

Specialister/SPE (patientvolym i en månad): 45, 56, 60, 70, 72

Allmänläkare/läkare (patientvolym på en månad): 18, 30, 34, 41, 44

4.2.1 Ordna data i stigande ordning efter att ha kombinerat dem till en uppsättning

18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

4.2.2 Rangordna de sorterade datapunkterna. Använd medeltal vid oavgjort

Värden: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

Rank: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 Beräkna summan av rangordningar för varje grupp

Figur 1. Illustrerar summan av rangordningar för varje grupp. Bildkredit — Utarbetad av författaren.

4.2.4 Beräkna H-statistik med formel 1 och siffror från figur 1

Formel 3. Illustrerar formeln för beräkning av H-statistik för vår förskrivargrupp. Bild framställd av författaren med Markdown och Latex.

H = 6.72

4.2.5 Identifiera det kritiska chi-kvadratvärdet för g-1 frihetsgrader med
ett α=0.05 som för vårt problem (3–1=2 frihetsgrader) borde vara 5.99. Se tabellen nedan.

4.2.6 Jämför H-värdet från 4.2.4 med det kritiska värdet från 4.2.5

Nollhypotesen som säger att medianpatientvolymen över tre olika grupper är lika bör förkastas om det kritiska chi-kvadratvärdet är mindre än H-statistiken. Eftersom 5.99 (Kritiskt värde) < 6.72 kan vi förkasta nollhypotesen.

Det måste finnas mer bevis för att sluta sig till att medianerna är ojämlika om chi-kvadratvärdet inte är lägre än H-statistiken som beräknats ovan.

Nollhypotesen att alla gruppers befolkningsmedian är lika testas med Kruskal-Wallis H-test. Det är en ANOVA-variant som är icke-parametrisk. Testet använder två eller flera oberoende prover av varierande storlek. Observera att att motbevisa nollhypotesen inte avslöjar hur grupperna skiljer sig åt. För att identifiera vilka grupper som är olika krävs post hoc-jämförelser mellan grupperingarna.

från scipy importstatistik
x = [1, 3, 5, 8, 9, 12, 17]
y = [2, 6, 6, 8, 10, 15, 20, 22]
stats.kruskal(x, y)
KruskalResult(statistic=0.7560483870967752, pvalue=0.3845680059797648)print(np.median(x))
print(np.median(y))
8.0
9.0
print(np.mean(x))
print(np.mean(y))
7.86
11.12

Utdata som genereras av Python visas ovan. Det bör noteras att även om en markant skillnad observeras i medelvärdet av värden mellan de två kategorierna, är denna skillnad, när medianen beaktas, obetydlig eftersom p-värdet är mycket större än 5 %.

Kruskal Wallis test är avgörande när man hanterar särskilt skeva prover. Den kan användas i stor utsträckning för en testkontrollgrupp under en kampanjutrullning eller till och med när man utför A/B-tester. Detta är tillämpligt för de flesta fall inom industrin eftersom varje kund har olika beteende när de har att göra med kunder i en butik eller läkare i ett läkemedelslandskap. När vi tittar på korgstorlek eller patientvolym är det få kunder som köper mer, medan få läkare har fler patienter. För en sådan skev fördelning är det därför viktigt att göra ett Kruskal Wallis-test för att kontrollera om beteendet är liknande.

Stephanie Glen. "Kruskal Wallis H Test: Definition, Exempel, Antaganden, SPSS" Från StatisticsHowTo.com: Elementär statistik för oss andra! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

Kruskal Wallis Test for Beginners Återpublicerat från källan https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

->

Tidsstämpel:

Mer från Blockchain-konsulter