تست Kruskal Wallis برای مبتدیان

تست کروسکال والیس: هدف، دامنه، مفروضات، مثال‌ها، پیاده‌سازی پایتون

عکس رومن میگر on می Unsplash

Kruskal Wallis یک روش ناپارامتریک برای ارزیابی اینکه آیا نمونه‌ها از یک توزیع آمده‌اند یا خیر است. در مقایسه بیش از دو نمونه مستقل یا غیرمرتبط استفاده می شود. آنالیز واریانس یک طرفه (ANOVA) معادل پارامتری آزمون کروسکال-والیس است.

1.1 یک مورد خوب برای استفاده تجاری چیست؟

بیایید تأثیر یک کمپین راه اندازی شده توسط یک شرکت داروسازی را بر روی یک داروی تازه راه اندازی شده، که در آن 1,550 هدف و 500 Holdout داریم، اندازه گیری کنیم. ما به توزیع رفتار نسخه نگاه کردیم و آن را غیرعادی (کج) یافتیم اما برای هر گروه (هدف‌ها و نگه‌دارنده‌ها) شکل مشابهی داشت. ما نمی توانیم ANOVA را انجام دهیم. از این رو ما یک آزمون ناپارامتریک، Kruskal-Wallis را اعمال می کنیم.

از آنجایی که Kruskal Wallis یک آزمون ناپارامتریک است، هیچ فرضی وجود ندارد که داده ها به طور معمول توزیع شده باشند (برخلاف ANOVA).

  1. فرضیه صفر واقعی این است که جمعیت هایی که نمونه ها از آنها سرچشمه می گیرند، میانه یکسانی دارند.
  2. آزمون کروسکال-والیس معمولاً زمانی استفاده می‌شود که یک متغیر ویژگی و یک متغیر اندازه‌گیری وجود داشته باشد، و متغیر اندازه‌گیری مفروضات ANOVA (طبیعی بودن و همسویی بودن) را برآورده نمی‌کند.
  3. مانند بسیاری از آزمون‌های ناپارامتریک، روی داده‌های رتبه‌بندی‌شده انجام می‌شود، بنابراین مشاهدات اندازه‌گیری با استفاده از مجموعه داده‌های کلی به رتبه‌های خود تبدیل می‌شوند: کوچک‌ترین یا پایین‌ترین مقدار، رتبه ۱، کوچک‌ترین مقدار بعدی، رتبه ۲، رتبه زیر 1 و غیره. در صورت تساوی یک رتبه متوسط ​​در نظر گرفته می شود.
  4. از دست دادن اطلاعات در جایگزینی رتبه‌ها به جای مقادیر اصلی، این آزمون را قوی‌تر از ANOVA می‌کند، بنابراین اگر داده‌ها با مفروضات مطابقت داشته باشند، باید از ANOVA استفاده شود..

فرضیه صفر آزمون کروسکال-والیس گاهی اوقات این است که میانه های گروه برابر هستند. با این حال، این تنها زمانی دقیق است که معتقد باشید ویژگی های توزیعی هر گروه یکسان است. حتی اگر میانه ها یکسان هستند، آزمون کروسکال-والیس می تواند فرضیه صفر را در صورت متفاوت بودن توزیع ها رد کند.

گروه هایی با اندازه های مختلف را می توان با استفاده از آماره کروسکال-والیس بررسی کرد. آزمون کروسکال-والیس، بر خلاف آنالیز واریانس یک طرفه قابل مقایسه، توزیع نرمال را در نظر نمی گیرد زیرا یک روش ناپارامتریک است. با این حال، آزمون فرض می‌کند که توزیع هر گروه به‌جز هر گونه تغییر در میانه‌ها، به طور یکسان شکل و مقیاس شده است.

Kruskal Wallis را می توان برای تجزیه و تحلیل اینکه آیا آزمون و کنترل متفاوت انجام شده اند استفاده کرد. هنگامی که داده ها دارای انحراف هستند (توزیع غیر نرمال)، آزمون نشان می دهد که آیا این دو گروه با هم تفاوت دارند یا خیر. دلیل تفاوت در رفتار را نشان نخواهد داد.

4.1 آزمون چگونه کار می کند؟

Kruskal Wallis با رتبه بندی همه مشاهدات، از 1 (کوچک ترین) کار می کند. رتبه بندی برای همه نقاط داده صرف نظر از گروهی که به آن تعلق دارند انجام می شود. ارزش‌های گره خورده میانگین رتبه‌ای را دریافت می‌کنند که اگر همسان نبودند، می‌گرفتند.

هنگامی که به همه مشاهدات بر اساس متغیر تجزیه و تحلیل (تعداد نسخه های تجویز شده) یک رتبه امضا شده اختصاص داده می شود، آنها بر اساس وضعیت هدف / توقف به گروه ها متمایز / تقسیم می شوند. پس از آن، میانگین رتبه هر گروه محاسبه و مقایسه می شود.

از آنجایی که ابتکار عمل یا تلاش تبلیغاتی برای این گروه انجام شده است، انتظار می‌رود که هدف دارای رتبه متوسط ​​بالاتری نسبت به هلدات باشد. با یک مقدار p قابل توجه، Target بهتر از Holdout عمل می کند. چالشی که در اینجا وجود دارد این است که میانگین رتبه گروه هدف در صورت وجود موارد پرت می تواند بالاتر باشد، یعنی تعداد کمی از پزشکان نسبت به سایرین نسخه های بیشتری را می نویسند. از این رو، ما همیشه به میانه حسابی و مقدار p حاصل به دست آمده توسط کروسکال والیس برای تایید/رد فرضیه خود نگاه می کنیم.

اجازه دهید Ni (i = 1، 2، 3، 4،...، g) اندازه نمونه برای هر گروه g (یعنی نمونه ها یا در این مورد، تعداد پزشکان) را در داده ها نشان دهد. ri مجموع رتبه های گروه i با ri' به عنوان میانگین رتبه گروه i است. سپس آماره آزمون کروسکال والیس به صورت زیر محاسبه می شود:

فرمول 1 فرمول محاسبه آمار آزمون را نشان می دهد. تصویر تهیه شده توسط نویسنده با استفاده از Markdown و Latex.

در صورتی که آمار آزمون از آستانه مقدار مجذور کای فراتر رود، فرضیه صفر میانه های جمعیت برابر رد می شود. هنگامی که فرضیه صفر جمعیت های مساوی درست باشد، این آمار دارای درجه آزادی k-1 است و توزیع خی دو را تقریب می زند. تقریب باید حداقل 5 عدد (یعنی حداقل پنج مشاهده در یک گروه) داشته باشد تا دقیق باشد.

فرمول 2 فرمول تقریب p-value را برای آزمون نشان می دهد. تصویر تهیه شده توسط نویسنده با استفاده از Markdown و Latex.

با استفاده از جدول توزیع احتمال کای دو، ممکن است مقدار خی دو مهم را در درجه آزادی g-1 و سطح معناداری مورد نظر بدست آوریم. متناوبا، ممکن است برای اظهار نظر در مورد اهمیت نتایج، مقدار p را بررسی کنیم.

4.2 تست H را با دست اجرا کنید

بیایید فرض کنیم که یک شرکت داروسازی می‌خواهد بفهمد که آیا سه گروه از بخش‌های پزشک حجم بیمار متفاوتی دارند یا خیر (استفانی گلن، دوم) به عنوان مثال،

رهبران نظرات کلیدی/KOL (حجم بیمار در ماه): 23، 42، 55، 66، 78

متخصصان/SPE (حجم بیمار در یک ماه): 45، 56، 60، 70، 72

پزشکان عمومی/پزشکان عمومی (حجم بیمار در ماه): 18، 30، 34، 41، 44

4.2.1 داده ها را پس از ترکیب آنها در یک مجموعه به ترتیب صعودی مرتب کنید

18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

4.2.2 نقاط داده مرتب شده را رتبه بندی کنید. در صورت کراوات از میانگین استفاده کنید

مقادیر: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

رتبه: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 مجموع رتبه های هر گروه را محاسبه کنید

شکل 1. مجموع رتبه های هر گروه را نشان می دهد. اعتبار تصویر - تهیه شده توسط نویسنده.

4.2.4 محاسبه آمار H با استفاده از فرمول 1 و اعداد از شکل 1

فرمول 3 فرمول محاسبه آمار H را برای گروه تجویز کننده ما نشان می دهد. تصویر تهیه شده توسط نویسنده با استفاده از Markdown و Latex.

H = 6.72

4.2.5 مقدار خی دو بحرانی برای درجه آزادی g-1 را با
a=0.05 که برای مشکل ما (3–1=2 درجه آزادی) باید 5.99 باشد. به جدول زیر مراجعه کنید.

4.2.6 مقدار H را از 4.2.4 با مقدار بحرانی از 4.2.5 مقایسه کنید

اگر مقدار بحرانی chi-square کوچکتر از آماره H باشد، فرضیه صفر مبنی بر اینکه حجم متوسط ​​بیمار در سه گروه مختلف برابر است باید رد شود. از آنجایی که 5.99 (مقدار بحرانی) < 6.72 است، می توانیم فرضیه صفر را رد کنیم.

برای استنباط اینکه اگر مقدار کای اسکوئر کمتر از آماره H محاسبه شده در بالا نباشد، باید شواهد بیشتری وجود داشته باشد تا نتیجه گیری شود که میانه ها نابرابر هستند.

فرضیه صفر مبنی بر برابری میانگین جمعیت همه گروه ها با استفاده از آزمون H Kruskal-Wallis مورد آزمایش قرار می گیرد. این یک نوع ANOVA است که ناپارامتریک است. این آزمایش از دو یا چند نمونه مستقل در اندازه های مختلف استفاده می کند. توجه داشته باشید که رد فرضیه صفر تفاوت گروه ها را نشان نمی دهد. برای تشخیص اینکه کدام گروه‌ها متفاوت هستند، مقایسه‌های post hoc بین گروه‌ها ضروری است.

از آمار واردات اسکیپی
x = [1، 3، 5، 8، 9، 12، 17]
y = [2، 6، 6، 8، 10، 15، 20، 22]
stats.kruskal(x, y)
KruskalResult(statistic=0.7560483870967752، pvalue=0.3845680059797648)چاپ (np.median(x))
چاپ (np.median(y))
8.0
9.0
چاپ (np.mean(x))
چاپ (np.mean(y))
7.86
11.12

خروجی تولید شده توسط پایتون در بالا نشان داده شده است. لازم به ذکر است که اگرچه تفاوت مشخصی در میانگین مقادیر در بین دو دسته مشاهده می شود، اما این تفاوت با در نظر گرفتن میانه، ناچیز است زیرا مقدار p بسیار بیشتر از 5٪ است.

تست کروسکال والیس در هنگام برخورد با نمونه‌های کج‌شده بسیار مفید است. این می تواند به طور گسترده برای یک گروه کنترل آزمایشی در طول یک کمپین یا حتی هنگام انجام تست A/B استفاده شود. این برای اکثر موارد استفاده در صنعت کاربرد دارد، زیرا هر مشتری هنگام برخورد با مشتریان در یک فضای خرده فروشی یا پزشکان در یک چشم انداز دارویی رفتار متفاوتی دارد. وقتی به اندازه سبد یا حجم بیمار نگاه می کنیم، تعداد کمی از مشتریان بیشتر خرید می کنند، در حالی که تعداد کمی از پزشکان بیماران بیشتری دارند. از این رو برای چنین توزیع اریب، بسیار مهم است که یک تست Kruskal Wallis برای بررسی مشابه بودن رفتارها انجام دهیم.

استفانی گلن. "تست Kruskal Wallis H: تعریف، مثال ها، فرضیات، SPSS" از StatisticsHowTo.com: آمار ابتدایی برای بقیه ما! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

تست Kruskal Wallis برای مبتدیان بازنشر شده از منبع https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 از طریق https://towardsdatascience.com/feed

<!–

->

تمبر زمان:

بیشتر از مشاوران بلاک چین