Kruskal Wallis-test for nybegynnere

Kruskal Wallis-test: Formål, omfang, forutsetninger, eksempler, Python-implementering

Photo by Roman Mager on Unsplash

Kruskal Wallis er en ikke-parametrisk metode for å evaluere om prøver kommer fra samme fordeling. Den brukes i sammenligning av mer enn to uavhengige eller urelaterte prøver. Enveis variansanalyse (ANOVA) er den parametriske ekvivalensen til Kruskal-Wallis-testen.

1.1 Hva ville være et godt forretningsbruk?

La oss måle effekten av en kampanje rullet ut av et farmaselskap på et nylig lansert medikament, der vi har 1,550 mål og 500 holdouts. Vi så på reseptatferdsfordelingen og fant at den ikke var normal (skjev), men likt utformet for hver gruppe (mål og holdouts). Vi kan ikke utføre ANOVA; derfor bruker vi en ikke-parametrisk test, Kruskal-Wallis.

Siden Kruskal Wallis er en ikke-parametrisk test, er det ingen antagelse om at dataene er normalfordelt (i motsetning til ANOVA).

  1. Den faktiske nullhypotesen er at populasjonene som prøvene stammer fra har samme median.
  2. Kruskal-Wallis-testen er mest brukt når det er én attributtvariabel og én målevariabel, og målevariabelen ikke oppfyller forutsetningene til ANOVA (normalitet og homoskedastisitet)
  3. Som de fleste ikke-parametriske tester, utføres den på rangerte data, slik at måleobservasjonene konverteres til deres rangeringer ved å bruke det overordnede datasettet: den minste eller laveste verdien får en rangering på 1, den nest minste får en rangering på 2, følgende en rangering på 3, og så videre. Ved uavgjort vurderes en gjennomsnittlig rangering.
  4. Tapet av informasjon ved å erstatte ranger med de opprinnelige verdiene gjør dette til en mindre kraftig test enn ANOVA, så ANOVA bør brukes hvis dataene oppfyller forutsetningene.

Kruskal-Wallis-testens nullhypotese er noen ganger angitt å være at gruppemedianene er like. Dette er imidlertid bare nøyaktig hvis du tror at hver gruppes fordelingsegenskaper er de samme. Selv om medianene er de samme, kan Kruskal-Wallis-testen forkaste nullhypotesen dersom fordelingene er forskjellige.

Grupper av forskjellige størrelser kan undersøkes ved hjelp av Kruskal-Wallis-statistikken. Kruskal-Wallis-testen, i motsetning til den sammenlignbare enveis variansanalysen, antar ikke en normalfordeling fordi det er en ikke-parametrisk prosedyre. Testen forutsetter imidlertid at hver gruppes fordeling er identisk formet og skalert, bortsett fra eventuelle variasjoner i medianer.

Kruskal Wallis kan brukes til å analysere om testen og kontrollen utførte annerledes. Når dataene er skjeve (ikke-normalfordeling), vil testen fortelle om de to gruppene er forskjellige uten å fastslå noen årsakssammenheng. Det vil ikke antyde årsaken til forskjellen i oppførsel.

4.1 Hvordan fungerer testen?

Kruskal Wallis fungerer ved å rangere alle observasjoner, fra 1 (mest mindre). Rangeringen gjøres for alle datapunkter, uavhengig av gruppen de tilhører. Lignende verdier får den gjennomsnittlige rangeringen de ville ha fått hvis de ikke hadde vært uavgjort.

Når alle observasjonene har fått en signert rangering basert på analysevariabelen (antall resepter foreskrevet), blir de differensiert/delt inn i grupper basert på deres mål/holdout-status. Deretter beregnes og sammenlignes hver gruppes gjennomsnittlige rangering.

Target forventes å ha en høyere gjennomsnittlig rangering enn holdouts siden initiativet eller reklameinnsatsen rulles ut for denne gruppen. Med en betydelig p-verdi gir Target bedre resultater enn holdouts. Utfordringen her er at den gjennomsnittlige rangeringen av målgruppen kan være høyere i nærvær av uteliggere, dvs. få leger som skriver flere manus enn andre. Derfor ser vi alltid på den aritmetiske medianen og den resulterende p-verdien oppnådd av Kruskal Wallis for å validere/avkrefte hypotesen vår.

La Ni (i = 1, 2, 3, 4,..., g) representere prøvestørrelsene for hver g-gruppe (dvs. prøver eller, i dette tilfellet, antall leger) i dataene. ri er summen av rangeringene for gruppe i med ri' som gjennomsnittlig rangering av gruppe i. Deretter beregnes Kruskal Wallis-teststatistikken som:

Formel 1. Illustrerer formelen for beregning av teststatistikk. Bilde utarbeidet av forfatteren ved hjelp av Markdown og Latex.

Nullhypotesen om like populasjonsmedianer forkastes hvis teststatistikken overskrider terskel chi-kvadratverdien. Når nullhypotesen om like populasjoner er sann, har denne statistikken k-1 frihetsgrader og tilnærmer en kjikvadratfordeling. Tilnærmingen må ha ni-verdier på minst 5 (dvs. minst fem observasjoner i en gruppe) for at den skal være nøyaktig.

Formel 2. Illustrerer formelen for p-verditilnærming for testen. Bilde utarbeidet av forfatteren ved hjelp av Markdown og Latex.

Ved å bruke en kjikvadrat sannsynlighetsfordelingstabell kan vi få den avgjørende kjikvadratverdien ved g-1 frihetsgrader og ønsket signifikansnivå. Alternativt kan vi undersøke p-verdien for å kommentere resultatenes betydning.

4.2 Kjør H-testen for hånd

La oss anta at et farmaselskap ønsker å forstå om tre grupper av legesegmenter har forskjellige pasientvolum (Stephanie Glen, nd) Eg,

Key Opinion Leaders/KOL (pasientvolum i en måned): 23, 42, 55, 66, 78

Spesialister/SPE (pasientvolum i en måned): 45, 56, 60, 70, 72

Allmennleger/fastleger (pasientvolum i en måned): 18, 30, 34, 41, 44

4.2.1 Ordne dataene i stigende rekkefølge etter å ha kombinert dem til ett sett

18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

4.2.2 Ranger de sorterte datapunktene. Bruk gjennomsnitt ved uavgjort

Verdier: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

Rangering: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 Beregn summen av rangeringer for hver gruppe

Figur 1. Illustrerer summen av rangeringer for hver gruppe. Bildekreditt — Utarbeidet av forfatteren.

4.2.4 Beregn H-statistikk ved å bruke formel 1 og tall fra figur 1

Formel 3. Illustrerer formelen for beregning av H-statistikk for vår forskrivergruppe. Bilde utarbeidet av forfatteren ved hjelp av Markdown og Latex.

H = 6.72

4.2.5 Identifiser den kritiske kjikvadratverdien for g-1 frihetsgrader med
en α=0.05 som for vårt problem (3–1=2 frihetsgrader) skal være 5.99. Se tabellen nedenfor.

4.2.6 Sammenlign H-verdien fra 4.2.4 med den kritiske verdien fra 4.2.5

Nullhypotesen som sier at median pasientvolum over tre ulike grupper er lik, bør forkastes hvis den kritiske kjikvadratverdien er mindre enn H-statistikken. Siden 5.99 (Kritisk verdi) < 6.72, kan vi forkaste nullhypotesen.

Det må være mer bevis for å konkludere med at medianene er ulik hvis kjikvadratverdien ikke er lavere enn H-statistikken beregnet ovenfor.

Nullhypotesen om at alle gruppers befolkningsmedianer er like testes ved hjelp av Kruskal-Wallis H-test. Det er en ANOVA-variant som er ikke-parametrisk. Testen bruker to eller flere uavhengige prøver av varierende størrelse. Merk at det å avkrefte nullhypotesen ikke avslører hvordan gruppene er forskjellige. For å identifisere hvilke grupper som er forskjellige, er det nødvendig med post hoc sammenligninger mellom grupperingene.

fra scipy importstatistikk
x = [1, 3, 5, 8, 9, 12, 17]
y = [2, 6, 6, 8, 10, 15, 20, 22]
stats.kruskal(x, y)
KruskalResultat(statistikk=0.7560483870967752, pvalue=0.3845680059797648)print(np.median(x))
print(np.median(y))
8.0
9.0
print(np.mean(x))
print(np.mean(y))
7.86
11.12

Utdataene generert av Python er vist ovenfor. Det bør bemerkes at selv om det observeres en markant forskjell i gjennomsnittet av verdier på tvers av de to kategoriene, er denne forskjellen, når medianen tas i betraktning, ubetydelig ettersom p-verdien er mye større enn 5 %.

Kruskal Wallis-test er instrumentell når det gjelder spesielt skjeve prøver. Den kan brukes mye for en testkontrollgruppe under en kampanjeutrulling eller til og med når du utfører A/B-testing. Dette er aktuelt for de fleste brukstilfeller i industrien siden hver kunde har forskjellig oppførsel når de har å gjøre med kunder i et butikklokale eller leger i et farmasøytisk landskap. Når vi ser på kurvstørrelse eller pasientvolum er det få kunder som kjøper mer, mens få leger har flere pasienter. For en slik skjev fordeling er det derfor viktig å sette en Kruskal Wallis-test for å sjekke om atferden er lik.

Stephanie Glen. "Kruskal Wallis H Test: Definisjon, eksempler, antagelser, SPSS" Fra StatisticsHowTo.com: Elementær statistikk for resten av oss! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

Kruskal Wallis-test for nybegynnere publisert på nytt fra kilde https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

->

Tidstempel:

Mer fra Blockchain-konsulenter