Kruskal Wallis test for begyndere

Kruskal Wallis Test: Formål, Omfang, Antagelser, Eksempler, Python Implementering

Photo by Roman Mager on Unsplash

Kruskal Wallis er en ikke-parametrisk metode til at vurdere, om prøver kommer fra samme fordeling. Det bruges til sammenligning af mere end to uafhængige eller ikke-relaterede prøver. Envejsvariansanalyse (ANOVA) er den parametriske ækvivalens af Kruskal-Wallis-testen.

1.1 Hvad ville være en god Business Use-case?

Lad os måle effekten af ​​en kampagne, der er udrullet af et lægemiddelfirma på et nyligt lanceret lægemiddel, hvor vi har 1,550 mål og 500 holdouts. Vi så på fordelingen af ​​receptadfærd og fandt, at den ikke var normal (skæv), men ensartet formet for hver gruppe (mål og holdouts). Vi kan ikke udføre ANOVA; derfor anvender vi en ikke-parametrisk test, Kruskal-Wallis.

Da Kruskal Wallis er en ikke-parametrisk test, er der ingen antagelse om, at dataene er normalfordelte (i modsætning til ANOVA).

  1. Den faktuelle nulhypotese er, at de populationer, som prøverne stammer fra, har samme median.
  2. Kruskal-Wallis-testen bruges mest, når der er én attributvariabel og én målevariabel, og målevariablen ikke opfylder antagelserne for ANOVA (normalitet og homoskedasticitet)
  3. Ligesom de fleste ikke-parametriske test udføres den på rangerede data, så måleobservationerne konverteres til deres rækker ved hjælp af det overordnede datasæt: den mindste eller den laveste værdi får en rang på 1, den næstmindste får en rang på 2, følgende en rang på 3, og så videre. I tilfælde af uafgjort tages der hensyn til en gennemsnitlig rang.
  4. Tabet af information ved at erstatte de oprindelige værdier med ranger gør dette til en mindre kraftfuld test end ANOVA, så ANOVA bør bruges, hvis dataene opfylder antagelserne.

Kruskal-Wallis testens nulhypotese angives nogle gange at være, at gruppemedianerne er lige store. Dette er dog kun korrekt, hvis du mener, at hver gruppes fordelingsegenskaber er de samme. Selvom medianerne er de samme, kan Kruskal-Wallis-testen afvise nulhypotesen, hvis fordelingerne er forskellige.

Grupper af forskellig størrelse kan undersøges ved hjælp af Kruskal-Wallis-statistikken. Kruskal-Wallis-testen antager, i modsætning til den sammenlignelige envejsvariansanalyse, ikke en normalfordeling, fordi det er en ikke-parametrisk procedure. Testen forudsætter dog, at hver gruppes fordeling er identisk formet og skaleret, bortset fra eventuelle variationer i medianer.

Kruskal Wallis kan bruges til at analysere, om testen og kontrollen fungerede forskelligt. Når dataene er skæve (ikke-normal fordeling), vil testen fortælle, om de to grupper er forskellige uden at fastslå nogen årsagssammenhæng. Det vil ikke foreslå årsagen til forskellen i adfærd.

4.1 Hvordan fungerer testen?

Kruskal Wallis arbejder ved at rangere alle observationer, startende fra 1 (mest mindre). Rangeringen foretages for alle datapunkter, uanset hvilken gruppe de tilhører. Bundne værdier får den gennemsnitlige rangering, de ville have modtaget, hvis de ikke havde været bundne.

Når alle observationerne er blevet tildelt en signeret rangering baseret på analysevariablen (antallet af foreskrevne ordinationer), differentieres/opdeles de i grupper baseret på deres mål/holdout-status. Derefter beregnes og sammenlignes hver gruppes gennemsnitlige rang.

Target forventes at have en højere gennemsnitlig rangering end holdouts, da initiativet eller den salgsfremmende indsats er udrullet for denne gruppe. Med en betydelig p-værdi klarer Target sig bedre end holdouts. Udfordringen her er, at den gennemsnitlige rangering af målgruppen kan være højere ved tilstedeværelse af outliers, dvs. få læger, der skriver flere manuskripter end andre. Derfor ser vi altid på den aritmetiske median og den resulterende p-værdi opnået af Kruskal Wallis for at validere/afkræfte vores hypotese.

Lad Ni (i = 1, 2, 3, 4,..., g) repræsentere prøvestørrelserne for hver g-gruppe (dvs. prøver eller, i dette tilfælde, antallet af læger) i dataene. ri er summen af ​​rækkerne for gruppe i med ri' som den gennemsnitlige rangering af gruppe i. Derefter beregnes Kruskal Wallis teststatistikken som:

Formel 1. Illustrerer formlen til beregning af teststatistik. Billede udarbejdet af forfatteren ved hjælp af Markdown og Latex.

Nulhypotesen om lige store populationsmedianer forkastes, hvis teststatistikken overstiger tærskelværdien for chi-kvadrat. Når nulhypotesen om lige store populationer er sand, har denne statistik k-1 frihedsgrader og tilnærmer en chi-kvadratfordeling. Tilnærmelsen skal have ni'er på mindst 5 (dvs. mindst fem observationer i en gruppe), for at den er nøjagtig.

Formel 2. Illustrerer formlen for p-værdi tilnærmelse for testen. Billede udarbejdet af forfatteren ved hjælp af Markdown og Latex.

Ved at bruge en chi-kvadrat-sandsynlighedsfordelingstabel kan vi få den afgørende chi-kvadratværdi ved g-1 frihedsgrader og det ønskede signifikansniveau. Alternativt kan vi undersøge p-værdien for at kommentere resultaternes betydning.

4.2 Kør H-testen i hånden

Lad os antage, at en Pharma-virksomhed ønsker at forstå, om tre grupper af lægesegmenter har forskellige patientvolumener (Stephanie Glen, nd) For eksempel,

Key Opinion Leaders/KOL (Patient Volume in a Month): 23, 42, 55, 66, 78

Specialister/SPE (patientvolumen i en måned): 45, 56, 60, 70, 72

Praktiserende læger/praktiserende læger (patientmængde på en måned): 18, 30, 34, 41, 44

4.2.1 Arranger dataene i stigende rækkefølge efter at have kombineret dem i ét sæt

18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

4.2.2 Rangér de sorterede datapunkter. Brug gennemsnit i tilfælde af uafgjort

Værdier: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

Placering: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 Beregn summen af ​​rækker for hver gruppe

Figur 1. Illustrerer summen af ​​rækker for hver gruppe. Billedkredit — Udarbejdet af forfatteren.

4.2.4 Beregn H-statistik ved hjælp af formel 1 og tal fra figur 1

Formel 3. Illustrerer formlen til beregning af H-statistik for vores ordinerende lægegruppe. Billede udarbejdet af forfatteren ved hjælp af Markdown og Latex.

H = 6.72

4.2.5 Identificer den kritiske chi-kvadratværdi for g-1 frihedsgrader med
en α=0.05 som for vores problem (3–1=2 frihedsgrader) burde være 5.99. Se tabellen nedenfor.

4.2.6 Sammenlign H-værdien fra 4.2.4 med den kritiske værdi fra 4.2.5

Nulhypotesen, der angiver, at median patientvolumen på tværs af tre forskellige grupper er ens, bør forkastes, hvis den kritiske chi-kvadratværdi er mindre end H-statistikken. Da 5.99 (Kritisk værdi) < 6.72, kan vi forkaste nulhypotesen.

Der skal være mere bevis for at udlede, at medianerne er ulige, hvis chi-kvadratværdien ikke er lavere end H-statistikken beregnet ovenfor.

Nulhypotesen om, at alle gruppers befolkningsmedianer er lige, testes ved hjælp af Kruskal-Wallis H-testen. Det er en ANOVA-variant, der er ikke-parametrisk. Testen anvender to eller flere uafhængige prøver af varierende størrelse. Bemærk, at afvisning af nulhypotesen ikke afslører, hvordan grupperne adskiller sig. For at identificere, hvilke grupper der er forskellige, er det nødvendigt med post hoc sammenligninger mellem grupperingerne.

fra scipy import statistik
x = [1, 3, 5, 8, 9, 12, 17]
y = [2, 6, 6, 8, 10, 15, 20, 22]
stats.kruskal(x, y)
KruskalResultat(statistik=0.7560483870967752, pværdi=0.3845680059797648)print(np.median(x))
print(np.median(y))
8.0
9.0
print(np.mean(x))
print(np.mean(y))
7.86
11.12

Output genereret af Python er vist ovenfor. Det skal bemærkes, at selvom der observeres en markant forskel i middelværdien af ​​værdier på tværs af de to kategorier, er denne forskel, når medianen tages i betragtning, ubetydelig, da p-værdien er meget større end 5 %.

Kruskal Wallis test er medvirkende til at håndtere særligt skæve prøver. Det kan bruges bredt til en testkontrolgruppe under en kampagneudrulning eller endda når der udføres A/B-test. Dette gælder for de fleste branchebrugssager, da hver kunde har forskellig adfærd, når de handler med kunder i et detailhandelsområde eller læger i et farmaceutisk landskab. Når vi ser på kurvstørrelse eller patientvolumen, er det få kunder, der køber mere, hvorimod få læger har flere patienter. For en sådan skæv fordeling er det derfor vigtigt at sætte en Kruskal Wallis-test for at kontrollere, om adfærden er ens.

Stephanie Glen. "Kruskal Wallis H Test: Definition, Eksempler, Antagelser, SPSS" Fra StatistikHowTo.com: Elementær statistik for os andre! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

Kruskal Wallis-test for begyndere Genudgivet fra kilde https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

->

Tidsstempel:

Mere fra Blockchain-konsulenter