初心者向けクラスカル ウォリス テスト

Kruskal Wallis テスト: 目的、範囲、仮定、例、Python 実装

による写真 ローマの魔術師 on Unsplash

Kruskal Wallis は、サンプルが同じ分布に由来するかどうかを評価するためのノンパラメトリック手法です。 2 つ以上の独立したサンプルまたは無関係なサンプルの比較に使用されます。一元配置分散分析 (ANOVA) は、クラスカル-ウォリス検定のパラメトリック等価性です。

1.1 良いビジネスユースケースは何ですか?

1,550 のターゲットと 500 のホールドアウトがある製薬会社が新発売の医薬品に対して展開したキャンペーンの影響を測定してみましょう。処方行動の分布を調べたところ、正規ではない(歪んでいる)ものの、各グループ(目標とホールドアウト)で同様の形状であることがわかりました。 ANOVA を実行することはできません。したがって、ノンパラメトリック検定、Kruskal-Wallis を適用します。

クラスカル ウォリスはノンパラメトリック検定であるため、(ANOVA とは異なり) データが正規分布しているという前提はありません。

  1. 事実上の帰無仮説は、サンプルの元となった母集団の中央値が同じであるということです。
  2. クラスカル・ウォリス検定は、属性変数と測定変数が 1 つずつあり、測定変数が ANOVA の仮定 (正規性と等分散性) を満たさない場合に最も一般的に使用されます。
  3. ほとんどのノンパラメトリック テストと同様に、ランク付けされたデータに対して実行されるため、測定観測値はデータ セット全体を使用してランクに変換されます。最小値または最低値にはランク 1 が与えられ、次に小さい値にはランク 2 が与えられます。次は 3 のランクになります。同点の場合は平均順位を考慮します。
  4. 元の値の順位を置き換える際に情報が失われるため、この検定は ANOVA よりも強力ではなくなります。そのため、データが仮定を満たしている場合は ANOVA を使用する必要があります。.

クラスカル-ウォリス検定の帰無仮説は、グループの中央値が等しいと表現されることがあります。ただし、これが正確なのは、各グループの分布特性が同じであると考えられる場合に限られます。中央値が同じであっても、分布が異なる場合、クラスカル・ウォリス検定は帰無仮説を棄却する可能性があります。

クラスカル-ウォリス統計を使用して、さまざまなサイズのグループを調べることができます。クラスカル・ウォリス検定は、同等の一元配置分散分析とは異なり、ノンパラメトリックな手順であるため、正規分布を仮定しません。ただし、この検定では、中央値の変動を除いて、各グループの分布の形状とスケールが同一であると仮定しています。

Kruskal Wallis を使用すると、テストとコントロールのパフォーマンスが異なるかどうかを分析できます。データが歪んでいる (非正規分布) 場合、検定では因果関係を確立することなく 2 つのグループが異なるかどうかがわかります。動作の違いの理由は示唆されません。

4.1 テストの仕組みは?

Kruskal Wallis は、すべての観測値を 1 (最もマイナー) から順にランク付けすることによって機能します。ランキングは、データ ポイントが属するグループに関係なく、すべてのデータ ポイントに対して行われます。同順位の値には、同順位にならなかった場合に受け取られるであろう平均ランクが与えられます。

すべての観察結果に分析変数 (処方された処方箋の数) に基づいて符号付きランクが割り当てられると、それらの観察結果は、ターゲット/ホールドアウト ステータスに基づいて区別/グループに分割されます。その後、各グループの平均順位が計算され、比較されます。

このグループに対してイニシアティブまたはプロモーション活動が展開されるため、ターゲットはホールドアウトよりも高い平均ランクを持つことが予想されます。有意な p 値により、Target はホールドアウトよりも優れたパフォーマンスを示しています。ここでの課題は、外れ値が存在する場合、つまり、少数の医師が他の医師よりも多くのスクリプトを書いている場合に、ターゲット グループの平均ランクが高くなる可能性があることです。したがって、仮説を検証/反駁するために、クラスカル ウォリスによって得られた算術中央値とその結果の p 値を常に調べます。

Ni (i = 1、2、3、4、…、g) がデータ内の各 g グループのサンプル サイズ (つまり、サンプル、またはこの場合は医師の数) を表すものとします。 ri はグループ i のランクの合計であり、ri' はグループ i の平均ランクです。次に、クラスカル ウォリス検定統計量は次のように計算されます。

フォーミュラ1。 テスト統計を計算する式を示します。著者がMarkdownとLatexを使用して作成した画像。

検定統計量がカイ二乗閾値を超える場合、母集団中央値が等しいという帰無仮説は棄却されます。母集団が等しいという帰無仮説が真である場合、この統計量は k-1 の自由度を持ち、カイ二乗分布に近似します。近似を正確にするには、ni が少なくとも 5 (つまり、グループ内に少なくとも XNUMX つの観測値) が必要です。

フォーミュラ2。 検定の p 値近似の式を示します。著者がMarkdownとLatexを使用して作成した画像。

カイ二乗確率分布表を使用すると、自由度 g-1 および目的の有意水準で重要なカイ二乗値を取得できます。あるいは、p 値を調べて、結果の重要性についてコメントすることもできます。

4.2 H テストを手動で実行する

製薬会社が、医師セグメントの 3 つのグループの患者数が異なるかどうかを把握したいと仮定します。 (ステファニー・グレン、nd) 例えば、

主要オピニオンリーダー/KOL (月間患者数): 23、42、55、66、78

専門医/SPE (月間患者数): 45、56、60、70、72

一般開業医/GP (18 か月の患者数): 30、34、41、44、XNUMX

4.2.1 データをXNUMXつにまとめて昇順に並べる

18 23 24 30 41 42 44 45 55 56 60 66 70

4.2.2 ソートされたデータポイントをランク付けします。同点の場合は平均を使用する

値: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

ランク: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 各グループの順位の合計を計算する

図1。 各グループのランクの合計を示します。画像クレジット — 著者が作成。

4.2.4 式 1 と図 1 の数値を使用して H 統計を計算する

フォーミュラ3。 処方者グループの H 統計を計算する式を示します。著者がMarkdownとLatexを使用して作成した画像。

H = 6.72

4.2.5 g-1 自由度の臨界カイ XNUMX 乗値を次のように特定します。
α=0.05 ですが、この問題 (3–1=2 自由度) では 5.99 になるはずです。以下の表を参照してください。

4.2.6 4.2.4 の H 値と 4.2.5 の臨界値を比較します。

臨界カイ二乗値が H 統計量より小さい場合、5.99 つの異なるグループにわたる患者体積の中央値が等しいという帰無仮説は棄却される必要があります。 6.72 (臨界値) < XNUMX であるため、帰無仮説を棄却できます。

カイ二乗値が上記で計算された H 統計量よりも低くない場合、中央値が等しくないことを推測するには、さらに多くの証拠が必要です。

すべてのグループの母集団中央値が等しいという帰無仮説は、クラスカル・ウォリス H 検定を使用して検定されます。これは、ノンパラメトリックな ANOVA バリアントです。このテストでは、さまざまなサイズの 2 つ以上の独立したサンプルが使用されます。帰無仮説を反証しても、グループがどのように異なるかは明らかにならないことに注意してください。どのグループが異なっているかを特定するには、グループ間の事後比較が必要です。

scipyインポート統計より
x = [1、3、5、8、9、12、17]
y = [2、6、6、8、10、15、20、22]
stats.kruskal(x, y)
KruskalResult(統計=0.7560483870967752、p値=0.3845680059797648)print(np.median(x))
print(np.median(y))
8.0
9.0
print(np.mean(x))
print(np.mean(y))
7.86
11.12

Python によって生成された出力を上に示します。 5 つのカテゴリの値の平均には顕著な差が観察されますが、中央値を考慮すると、p 値が XNUMX% よりはるかに大きいため、この差は重要ではないことに注意してください。

クラスカル ウォリス テストは、特に偏ったサンプルを扱う場合に役立ちます。キャンペーンの展開中や A/B テストの実行時でも、テスト コントロール グループに広く使用できます。これは、小売業界の顧客や製薬業界の医師に対応する際の行動が顧客ごとに異なるため、ほとんどの業界のユースケースに当てはまります。バスケットのサイズや患者数に注目すると、より多くの患者を抱えている医師はほとんどいない一方で、より多くの商品を購入する顧客はほとんどいません。したがって、このような偏った分布の場合は、クラスカル ウォリス テストを実行して、動作が類似しているかどうかを確認することが重要です。

ステファニー・グレン。 「クラスカル ウォリス H テスト: 定義、例、仮定、SPSS」より 統計HowTo.com: 残りの人々のための初歩的な統計! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

初心者向けクラスカル ウォリス テスト ソース https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 経由 https://towardsdatascience.com/feed から再公開

<!–

–>

タイムスタンプ:

より多くの ブロックチェーンコンサルタント