Kruskal Wallis-test voor beginners

Kruskal Wallis-test: doel, reikwijdte, aannames, voorbeelden, Python-implementatie

Foto door Romeinse Mager on Unsplash

Kruskal Wallis is een niet-parametrische methode om te evalueren of steekproeven uit dezelfde verdeling komen. Het wordt gebruikt bij de vergelijking van meer dan twee onafhankelijke of niet-gerelateerde monsters. Eenzijdige variantieanalyse (ANOVA) is de parametrische gelijkwaardigheid van de Kruskal-Wallis-test.

1.1 Wat zou een goede zakelijke use case zijn?

Laten we de impact meten van een campagne die door een farmaceutisch bedrijf is uitgerold op een nieuw gelanceerd medicijn, waarbij we 1,550 Targets en 500 Holdouts hebben. We keken naar de verdeling van het voorschrijfgedrag en ontdekten dat deze niet-normaal (scheef) was, maar voor elke groep een vergelijkbare vorm had (doelen en holdouts). Wij kunnen geen ANOVA uitvoeren; daarom passen we een niet-parametrische test toe, Kruskal-Wallis.

Omdat Kruskal Wallis een niet-parametrische test is, wordt er niet van uitgegaan dat de gegevens normaal verdeeld zijn (in tegenstelling tot ANOVA).

  1. De feitelijke nulhypothese is dat de populaties waaruit de steekproeven afkomstig zijn dezelfde mediaan hebben.
  2. De Kruskal-Wallis-test wordt het meest gebruikt als er één attribuutvariabele en één meetvariabele is, en de meetvariabele niet voldoet aan de aannames van ANOVA (normaliteit en homoscedasticiteit).
  3. Zoals de meeste niet-parametrische tests wordt deze uitgevoerd op gerangschikte gegevens, dus de meetwaarnemingen worden omgezet naar hun rangorde met behulp van de algehele dataset: de kleinste of laagste waarde krijgt een rangorde van 1, de volgende kleinste krijgt een rangorde van 2, de volgende een rang van 3, enzovoort. Bij een gelijke stand wordt er gekeken naar een gemiddelde rang.
  4. Het verlies van informatie bij het vervangen van de oorspronkelijke waarden maakt dit een minder krachtige test dan ANOVA, dus ANOVA moet worden gebruikt als de gegevens aan de aannames voldoen.

Er wordt soms beweerd dat de nulhypothese van de Kruskal-Wallis-test is dat de groepsmedianen gelijk zijn. Dit is echter alleen juist als je gelooft dat de distributiekenmerken van elke groep hetzelfde zijn. Hoewel de medianen hetzelfde zijn, kan de Kruskal-Wallis-test de nulhypothese verwerpen als de verdelingen verschillen.

Groepen van verschillende grootte kunnen worden onderzocht met behulp van de Kruskal-Wallis-statistiek. De Kruskal-Wallis-test gaat, in tegenstelling tot de vergelijkbare eenrichtingsvariantieanalyse, niet uit van een normale verdeling, omdat het een niet-parametrische procedure is. De test gaat er echter van uit dat de verdeling van elke groep identiek is gevormd en geschaald, afgezien van eventuele variaties in de medianen.

Met Kruskal Wallis kan worden geanalyseerd of de test en de controle verschillend presteerden. Wanneer de gegevens scheef zijn (niet-normale verdeling), zal de test uitwijzen of de twee groepen verschillend zijn, zonder enig oorzakelijk verband vast te stellen. Het zal niet de reden voor het verschil in gedrag suggereren.

4.1 Hoe werkt de test?

Kruskal Wallis werkt door alle waarnemingen te rangschikken, beginnend bij 1 (meest kleine). De rangschikking wordt gedaan voor alle datapunten, ongeacht de groep waartoe ze behoren. Gebonden waarden krijgen de gemiddelde rang die ze zouden hebben gekregen als ze niet gebonden waren.

Wanneer aan alle waarnemingen een rangorde met teken is toegekend op basis van de analysevariabele (het aantal voorgeschreven voorschriften), worden ze gedifferentieerd/verdeeld in groepen op basis van hun doel-/uitstelstatus. Daarna wordt de gemiddelde rang van elke groep berekend en vergeleken.

Er wordt verwacht dat Target een hogere gemiddelde rang zal hebben dan holdouts, aangezien het initiatief of de promotie-inspanning voor deze groep wordt uitgerold. Met een aanzienlijke p-waarde presteert Target beter dan holdouts. De uitdaging hier is dat de gemiddelde rangorde van de doelgroep hoger kan zijn als er sprake is van uitschieters, dat wil zeggen dat weinig artsen meer scripts schrijven dan anderen. Daarom kijken we altijd naar de rekenkundige mediaan en de resulterende p-waarde verkregen door Kruskal Wallis om onze hypothese te valideren/weerleggen.

Laat Ni (i = 1, 2, 3, 4,…, g) de steekproefomvang vertegenwoordigen voor elke g-groep (dat wil zeggen monsters of, in dit geval, het aantal artsen) in de gegevens. ri is de som van de rangen voor groep i met ri’ als de gemiddelde rang van groep i. Vervolgens wordt de Kruskal Wallis-teststatistiek als volgt berekend:

Formule 1. Illustreert de formule voor het berekenen van teststatistieken. Afbeelding gemaakt door de auteur met behulp van Markdown en Latex.

De nulhypothese van gelijke populatiemedianen wordt verworpen als de teststatistiek de chi-kwadraatwaarde overschrijdt. Wanneer de nulhypothese van gelijke populaties waar is, heeft deze statistiek k-1 vrijheidsgraden en benadert deze een chikwadraatverdeling. Om accuraat te zijn, moet de benadering ni’s van minstens 5 hebben (d.w.z. minstens vijf waarnemingen in een groep).

Formule 2. Illustreert de formule voor p-waardebenadering voor de test. Afbeelding gemaakt door de auteur met behulp van Markdown en Latex.

Met behulp van een chikwadraat-kansverdelingstabel kunnen we de cruciale chikwadraatwaarde verkrijgen bij g-1 vrijheidsgraden en het gewenste significantieniveau. Als alternatief kunnen we de p-waarde onderzoeken om commentaar te geven op de betekenis van de resultaten.

4.2 Voer de H-test handmatig uit

Laten we aannemen dat een farmaceutisch bedrijf wil begrijpen of drie groepen artsensegmenten verschillende patiëntvolumes hebben (Stephanie Glen, z.d.) Bijv.

Belangrijkste opinieleiders/KOL (patiëntenvolume in een maand): 23, 42, 55, 66, 78

Specialisten/SPE (Patiëntvolume per maand): 45, 56, 60, 70, 72

Huisartsen/huisartsen (patiëntenvolume per maand): 18, 30, 34, 41, 44

4.2.1 Rangschik de gegevens in oplopende volgorde nadat u ze in één set hebt gecombineerd

18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

4.2.2 Rangschik de gesorteerde gegevenspunten. Gebruik het gemiddelde bij gelijkspel

Waarden: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

Rang: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 Bereken de som van de rangen voor elke groep

Figuur 1. Illustreert de som van de rangen voor elke groep. Beeldcredits — Opgesteld door de auteur.

4.2.4 Bereken H-statistieken met behulp van formule 1 en getallen uit figuur 1

Formule 3. Illustreert de formule voor het berekenen van H-statistieken voor onze voorschrijversgroep. Afbeelding gemaakt door de auteur met behulp van Markdown en Latex.

H = 6.72

4.2.5 Identificeer de kritische chikwadraatwaarde voor g-1 vrijheidsgraden met
een α=0.05 die voor ons probleem (3–1=2 vrijheidsgraden) 5.99 zou moeten zijn. Raadpleeg de onderstaande tabel.

4.2.6 Vergelijk de H-waarde uit 4.2.4 met de kritische waarde uit 4.2.5

De nulhypothese die stelt dat het mediane patiëntvolume over drie verschillende groepen gelijk is, moet worden verworpen als de kritische chikwadraatwaarde kleiner is dan de H-statistiek. Aangezien 5.99 (kritische waarde) < 6.72 kunnen we de nulhypothese verwerpen.

Er moet meer bewijs zijn om te concluderen dat de medianen ongelijk zijn als de chikwadraatwaarde niet lager is dan de hierboven berekende H-statistiek.

De nulhypothese dat de populatiemedianen van alle groepen gelijk zijn, wordt getest met behulp van de Kruskal-Wallis H-test. Het is een ANOVA-variant die niet-parametrisch is. Bij de test worden twee of meer onafhankelijke monsters van verschillende grootte gebruikt. Merk op dat het weerleggen van de nulhypothese niet onthult hoe de groepen verschillen. Om te identificeren welke groepen verschillend zijn, zijn post-hocvergelijkingen tussen de groeperingen noodzakelijk.

van scipy importstatistieken
x = [1, 3, 5, 8, 9, 12, 17]
j = [2, 6, 6, 8, 10, 15, 20, 22]
stats.kruskal(x, y)
KruskalResultaat(statistiek=0.7560483870967752, pwaarde=0.3845680059797648)print(np.mediaan(x))
print(np.mediaan(y))
8.0
9.0
print(np.mean(x))
print(np.mean(y))
7.86
11.12

De door Python gegenereerde uitvoer wordt hierboven weergegeven. Opgemerkt moet worden dat, hoewel er een duidelijk verschil wordt waargenomen in het gemiddelde van de waarden tussen de twee categorieën, dit verschil, wanneer rekening wordt gehouden met de mediaan, onbeduidend is, aangezien de p-waarde veel groter is dan 5%.

De Kruskal Wallis-test is van groot belang bij het omgaan met bijzonder scheve monsters. Het kan op grote schaal worden gebruikt voor een testcontrolegroep tijdens de uitrol van een campagne of zelfs bij het uitvoeren van A/B-tests. Dit is van toepassing op de meeste gebruiksscenario's in de sector, omdat elke klant zich anders gedraagt ​​in de omgang met klanten in een winkelruimte of met artsen in een farmaceutisch landschap. Als we kijken naar de omvang van de mand of het patiëntenvolume, kopen maar weinig klanten meer, terwijl maar weinig artsen meer patiënten hebben. Daarom is het voor een dergelijke scheve verdeling essentieel om een ​​Kruskal Wallis-test uit te voeren om te controleren of het gedrag vergelijkbaar is.

Stephanie Glen. "Kruskal Wallis H-test: definitie, voorbeelden, aannames, SPSS" uit StatistiekenHowTo.com: Elementaire statistieken voor de rest van ons! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

Kruskal Wallis-test voor beginners Heruitgegeven vanuit bron https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

->

Tijdstempel:

Meer van Blockchain-adviseurs