Kruskal Wallis 初学者测试

Kruskal Wallis 测试:目的、范围、假设、示例、Python 实现

照片由 罗曼·玛格 on Unsplash

Kruskal Wallis 是一种用于评估样本是否来自同一分布的非参数方法。它用于两个以上独立或不相关样本的比较。单向方差分析 (ANOVA) 是 Kruskal-Wallis 检验的参数等价性。

1.1 什么是好的业务用例?

让我们衡量一家制药公司针对新推出的药物推出的活动的影响,其中我们有 1,550 个目标和 500 个保留者。我们观察了处方行为分布,发现它是非正态的(倾斜的),但每个组(目标和坚持者)的形状相似。我们无法进行方差分析;因此我们应用非参数检验 Kruskal-Wallis。

由于 Kruskal Wallis 是非参数检验,因此不假设数据呈正态分布(与方差分析不同)。

  1. 事实零假设是样本来源的总体具有相同的中位数。
  2. 当有一个属性变量和一个测量变量,并且测量变量不满足 ANOVA(正态性和同方差性)的假设时,最常使用 Kruskal-Wallis 检验
  3. 与大多数非参数检验一样,它是对排名数据执行的,因此使用整个数据集将测量观察值转换为其排名:最小或最低值的排名为 1,下一个最小的排名为 2,以下为3级,依此类推。如果出现平局,则考虑平均排名。
  4. 用排名替换原始值时会丢失信息,这使得该测试的威力不如方差分析,因此如果数据满足假设,则应使用方差分析.

Kruskal-Wallis 检验的原假设有时被表述为组中位数相等。然而,只有当您相信每个组的分布特征相同时,这才是准确的。即使中位数相同,如果分布不同,Kruskal-Wallis 检验也可以拒绝原假设。

可以使用 Kruskal-Wallis 统计来检查不同规模的组。与可比较的单向方差分析不同,Kruskal-Wallis 检验不假设正态分布,因为它是一种非参数过程。然而,该检验确实假设每个组的分布形状和比例相同,但中位数有任何变化。

Kruskal Wallis 可用于分析测试和控制的表现是否不同。当数据倾斜(非正态分布)时,检验将判断两组是否不同,而无需建立任何因果关系。它不会表明行为差异的原因。

4.1 测试如何进行?

Kruskal Wallis 的工作原理是对所有观察结果进行排序,从 1(最次要的)开始。对所有数据点进行排名,无论它们属于哪个组。绑定值将获得它们在未绑定时应获得的平均排名。

当所有观察结果都根据分析变量(处方的数量)分配有符号的排名时,它们会根据其目标/坚持状态进行区分/分组。之后,计算并比较各组的平均排名。

由于针对该群体推出了倡议或促销活动,预计 Target 的平均排名将高于坚持者。塔吉特 (Target) 的 p 值显着,表现优于坚持不懈的公司。这里的挑战是,在存在异常值的情况下,目标群体的平均排名可能会更高,即很少有医生比其他人写更多的脚本。因此,我们总是查看算术中位数和 Kruskal Wallis 获得的结果 p 值来验证/反驳我们的假设。

让 Ni (i = 1, 2, 3, 4,…, g) 表示数据中每个 g 组的样本量(即样本或在本例中为医生数量)。 ri 是第 i 组的排名之和,其中 ri' 是第 i 组的平均排名。然后 Kruskal Wallis 检验统计量计算如下:

公式1。 说明计算检验统计量的公式。图片由作者使用 Markdown 和 Latex 准备。

如果检验统计量超过阈值卡方值,则拒绝相等总体中位数的原假设。当同等总体的零假设为真时,该统计量具有 k-1 自由度并近似卡方分布。近似值的 ni 值必须至少为 5(即,一组中至少有 XNUMX 个观测值)才能准确。

公式2。 说明检验的 p 值近似公式。图片由作者使用 Markdown 和 Latex 准备。

使用卡方概率分布表,我们可以获得 g-1 自由度处的关键卡方值和所需的显着性水平。或者,我们可以检查 p 值来评论结果的显着性。

4.2 手动运行 H 检验

假设一家制药公司想要了解三组医生细分是否具有不同的患者量 (斯蒂芬妮·格伦,ND) 例如,

关键意见领袖/KOL(每月患者量):23、42、55、66、78

专家/SPE(一个月患者量):45、56、60、70、72

全科医生/全科医生(一个月的患者量):18、30、34、41、44

4.2.1 将数据合并为一组后按升序排列

18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

4.2.2 对排序后的数据点进行排序。如果出现平局,则使用平均值

值:18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

排名:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 计算每组的排名总和

图1。 说明每个组的排名总和。图片来源 — 由作者准备。

4.2.4 使用公式 1 和图 1 中的数字计算 H 统计量

公式3。 说明了计算我们处方者组的 H 统计数据的公式。图片由作者使用 Markdown 和 Latex 准备。

高= 6.72

4.2.5 确定 g-1 自由度的临界卡方值
α=0.05 对于我们的问题(3–1=2 自由度)应该是 5.99。请参阅下表。

4.2.6 将 4.2.4 中的 H 值与 4.2.5 中的临界值进行比较

如果临界卡方值小于 H 统计量,则应拒绝表明三个不同组的中位患者体积相等的零假设。由于 5.99(临界值)< 6.72,我们可以拒绝原假设。

如果卡方值不低于上面计算的 H 统计量,则需要更多证据来推断中位数不相等。

使用 Kruskal-Wallis H 检验来检验所有群体的总体中位数相等的原假设。它是非参数方差分析变体。该测试使用两个或多个不同大小的独立样本。请注意,反驳零假设并不能揭示各组之间的差异。为了确定哪些组不同,有必要对分组之间进行事后比较。

从 scipy 导入统计数据
x = [1, 3, 5, 8, 9, 12, 17]
y = [2, 6, 6, 8, 10, 15, 20, 22]
统计数据.kruskal(x, y)
KruskalResult(统计=0.7560483870967752,p值=0.3845680059797648)打印(np.中位数(x))
打印(np.中位数(y))
8.0
9.0
打印(np.平均值(x))
打印(np.平均值(y))
7.86
11.12

Python 生成的输出如上所示。值得注意的是,尽管两个类别的平均值存在显着差异,但考虑到中位数时,这种差异并不显着,因为 p 值远大于 5%。

克鲁斯卡尔沃利斯检验在处理特别倾斜的样本时非常有用。它可以在活动推出期间甚至在执行 A/B 测试时广泛用于测试对照组。这适用于大多数行业用例,因为每个客户在与零售空间中的客户或制药领域中的医生打交道时都有不同的行为。当我们考虑购物篮大小或患者数量时,很少有顾客会购买更多的产品,而很少有医生会拥有更多的患者。因此,对于这种偏态分布,进行 Kruskal Wallis 测试来检查行为是否相似至关重要。

斯蒂芬妮·格伦。 “Kruskal Wallis H 检验:定义、示例、假设、SPSS”来自 统计HowTo.com:我们其他人的基本统计数据! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

克鲁斯卡尔沃利斯初学者测试从来源重新发布 https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 通过 https://towardsdatascience.com/feed

–>

时间戳记:

更多来自 区块链顾问