تست کروسکال والیس: هدف، دامنه، مفروضات، مثالها، پیادهسازی پایتون
Kruskal Wallis یک روش ناپارامتریک برای ارزیابی اینکه آیا نمونهها از یک توزیع آمدهاند یا خیر است. در مقایسه بیش از دو نمونه مستقل یا غیرمرتبط استفاده می شود. آنالیز واریانس یک طرفه (ANOVA) معادل پارامتری آزمون کروسکال-والیس است.
1.1 یک مورد خوب برای استفاده تجاری چیست؟
بیایید تأثیر یک کمپین راه اندازی شده توسط یک شرکت داروسازی را بر روی یک داروی تازه راه اندازی شده، که در آن 1,550 هدف و 500 Holdout داریم، اندازه گیری کنیم. ما به توزیع رفتار نسخه نگاه کردیم و آن را غیرعادی (کج) یافتیم اما برای هر گروه (هدفها و نگهدارندهها) شکل مشابهی داشت. ما نمی توانیم ANOVA را انجام دهیم. از این رو ما یک آزمون ناپارامتریک، Kruskal-Wallis را اعمال می کنیم.
از آنجایی که Kruskal Wallis یک آزمون ناپارامتریک است، هیچ فرضی وجود ندارد که داده ها به طور معمول توزیع شده باشند (برخلاف ANOVA).
- فرضیه صفر واقعی این است که جمعیت هایی که نمونه ها از آنها سرچشمه می گیرند، میانه یکسانی دارند.
- آزمون کروسکال-والیس معمولاً زمانی استفاده میشود که یک متغیر ویژگی و یک متغیر اندازهگیری وجود داشته باشد، و متغیر اندازهگیری مفروضات ANOVA (طبیعی بودن و همسویی بودن) را برآورده نمیکند.
- مانند بسیاری از آزمونهای ناپارامتریک، روی دادههای رتبهبندیشده انجام میشود، بنابراین مشاهدات اندازهگیری با استفاده از مجموعه دادههای کلی به رتبههای خود تبدیل میشوند: کوچکترین یا پایینترین مقدار، رتبه ۱، کوچکترین مقدار بعدی، رتبه ۲، رتبه زیر 1 و غیره. در صورت تساوی یک رتبه متوسط در نظر گرفته می شود.
- از دست دادن اطلاعات در جایگزینی رتبهها به جای مقادیر اصلی، این آزمون را قویتر از ANOVA میکند، بنابراین اگر دادهها با مفروضات مطابقت داشته باشند، باید از ANOVA استفاده شود..
فرضیه صفر آزمون کروسکال-والیس گاهی اوقات این است که میانه های گروه برابر هستند. با این حال، این تنها زمانی دقیق است که معتقد باشید ویژگی های توزیعی هر گروه یکسان است. حتی اگر میانه ها یکسان هستند، آزمون کروسکال-والیس می تواند فرضیه صفر را در صورت متفاوت بودن توزیع ها رد کند.
گروه هایی با اندازه های مختلف را می توان با استفاده از آماره کروسکال-والیس بررسی کرد. آزمون کروسکال-والیس، بر خلاف آنالیز واریانس یک طرفه قابل مقایسه، توزیع نرمال را در نظر نمی گیرد زیرا یک روش ناپارامتریک است. با این حال، آزمون فرض میکند که توزیع هر گروه بهجز هر گونه تغییر در میانهها، به طور یکسان شکل و مقیاس شده است.
Kruskal Wallis را می توان برای تجزیه و تحلیل اینکه آیا آزمون و کنترل متفاوت انجام شده اند استفاده کرد. هنگامی که داده ها دارای انحراف هستند (توزیع غیر نرمال)، آزمون نشان می دهد که آیا این دو گروه با هم تفاوت دارند یا خیر. دلیل تفاوت در رفتار را نشان نخواهد داد.
4.1 آزمون چگونه کار می کند؟
Kruskal Wallis با رتبه بندی همه مشاهدات، از 1 (کوچک ترین) کار می کند. رتبه بندی برای همه نقاط داده صرف نظر از گروهی که به آن تعلق دارند انجام می شود. ارزشهای گره خورده میانگین رتبهای را دریافت میکنند که اگر همسان نبودند، میگرفتند.
هنگامی که به همه مشاهدات بر اساس متغیر تجزیه و تحلیل (تعداد نسخه های تجویز شده) یک رتبه امضا شده اختصاص داده می شود، آنها بر اساس وضعیت هدف / توقف به گروه ها متمایز / تقسیم می شوند. پس از آن، میانگین رتبه هر گروه محاسبه و مقایسه می شود.
از آنجایی که ابتکار عمل یا تلاش تبلیغاتی برای این گروه انجام شده است، انتظار میرود که هدف دارای رتبه متوسط بالاتری نسبت به هلدات باشد. با یک مقدار p قابل توجه، Target بهتر از Holdout عمل می کند. چالشی که در اینجا وجود دارد این است که میانگین رتبه گروه هدف در صورت وجود موارد پرت می تواند بالاتر باشد، یعنی تعداد کمی از پزشکان نسبت به سایرین نسخه های بیشتری را می نویسند. از این رو، ما همیشه به میانه حسابی و مقدار p حاصل به دست آمده توسط کروسکال والیس برای تایید/رد فرضیه خود نگاه می کنیم.
اجازه دهید Ni (i = 1، 2، 3، 4،...، g) اندازه نمونه برای هر گروه g (یعنی نمونه ها یا در این مورد، تعداد پزشکان) را در داده ها نشان دهد. ri مجموع رتبه های گروه i با ri' به عنوان میانگین رتبه گروه i است. سپس آماره آزمون کروسکال والیس به صورت زیر محاسبه می شود:
در صورتی که آمار آزمون از آستانه مقدار مجذور کای فراتر رود، فرضیه صفر میانه های جمعیت برابر رد می شود. هنگامی که فرضیه صفر جمعیت های مساوی درست باشد، این آمار دارای درجه آزادی k-1 است و توزیع خی دو را تقریب می زند. تقریب باید حداقل 5 عدد (یعنی حداقل پنج مشاهده در یک گروه) داشته باشد تا دقیق باشد.
با استفاده از جدول توزیع احتمال کای دو، ممکن است مقدار خی دو مهم را در درجه آزادی g-1 و سطح معناداری مورد نظر بدست آوریم. متناوبا، ممکن است برای اظهار نظر در مورد اهمیت نتایج، مقدار p را بررسی کنیم.
4.2 تست H را با دست اجرا کنید
بیایید فرض کنیم که یک شرکت داروسازی میخواهد بفهمد که آیا سه گروه از بخشهای پزشک حجم بیمار متفاوتی دارند یا خیر (استفانی گلن، دوم) به عنوان مثال،
رهبران نظرات کلیدی/KOL (حجم بیمار در ماه): 23، 42، 55، 66، 78
متخصصان/SPE (حجم بیمار در یک ماه): 45، 56، 60، 70، 72
پزشکان عمومی/پزشکان عمومی (حجم بیمار در ماه): 18، 30، 34، 41، 44
4.2.1 داده ها را پس از ترکیب آنها در یک مجموعه به ترتیب صعودی مرتب کنید
18 23 24 30 41 42 44 45 55 56 60 66 70 72 78
4.2.2 نقاط داده مرتب شده را رتبه بندی کنید. در صورت کراوات از میانگین استفاده کنید
مقادیر: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78
رتبه: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
4.2.3 مجموع رتبه های هر گروه را محاسبه کنید
4.2.4 محاسبه آمار H با استفاده از فرمول 1 و اعداد از شکل 1
H = 6.72
4.2.5 مقدار خی دو بحرانی برای درجه آزادی g-1 را با
a=0.05 که برای مشکل ما (3–1=2 درجه آزادی) باید 5.99 باشد. به جدول زیر مراجعه کنید.
4.2.6 مقدار H را از 4.2.4 با مقدار بحرانی از 4.2.5 مقایسه کنید
اگر مقدار بحرانی chi-square کوچکتر از آماره H باشد، فرضیه صفر مبنی بر اینکه حجم متوسط بیمار در سه گروه مختلف برابر است باید رد شود. از آنجایی که 5.99 (مقدار بحرانی) < 6.72 است، می توانیم فرضیه صفر را رد کنیم.
برای استنباط اینکه اگر مقدار کای اسکوئر کمتر از آماره H محاسبه شده در بالا نباشد، باید شواهد بیشتری وجود داشته باشد تا نتیجه گیری شود که میانه ها نابرابر هستند.
فرضیه صفر مبنی بر برابری میانگین جمعیت همه گروه ها با استفاده از آزمون H Kruskal-Wallis مورد آزمایش قرار می گیرد. این یک نوع ANOVA است که ناپارامتریک است. این آزمایش از دو یا چند نمونه مستقل در اندازه های مختلف استفاده می کند. توجه داشته باشید که رد فرضیه صفر تفاوت گروه ها را نشان نمی دهد. برای تشخیص اینکه کدام گروهها متفاوت هستند، مقایسههای post hoc بین گروهها ضروری است.
از آمار واردات اسکیپی
x = [1، 3، 5، 8، 9، 12، 17]
y = [2، 6، 6، 8، 10، 15، 20، 22]
stats.kruskal(x, y)KruskalResult(statistic=0.7560483870967752، pvalue=0.3845680059797648)چاپ (np.median(x))
چاپ (np.median(y))8.0
9.0چاپ (np.mean(x))
چاپ (np.mean(y))7.86
11.12
خروجی تولید شده توسط پایتون در بالا نشان داده شده است. لازم به ذکر است که اگرچه تفاوت مشخصی در میانگین مقادیر در بین دو دسته مشاهده می شود، اما این تفاوت با در نظر گرفتن میانه، ناچیز است زیرا مقدار p بسیار بیشتر از 5٪ است.
تست کروسکال والیس در هنگام برخورد با نمونههای کجشده بسیار مفید است. این می تواند به طور گسترده برای یک گروه کنترل آزمایشی در طول یک کمپین یا حتی هنگام انجام تست A/B استفاده شود. این برای اکثر موارد استفاده در صنعت کاربرد دارد، زیرا هر مشتری هنگام برخورد با مشتریان در یک فضای خرده فروشی یا پزشکان در یک چشم انداز دارویی رفتار متفاوتی دارد. وقتی به اندازه سبد یا حجم بیمار نگاه می کنیم، تعداد کمی از مشتریان بیشتر خرید می کنند، در حالی که تعداد کمی از پزشکان بیماران بیشتری دارند. از این رو برای چنین توزیع اریب، بسیار مهم است که یک تست Kruskal Wallis برای بررسی مشابه بودن رفتارها انجام دهیم.
استفانی گلن. "تست Kruskal Wallis H: تعریف، مثال ها، فرضیات، SPSS" از StatisticsHowTo.com: آمار ابتدایی برای بقیه ما! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/
تست Kruskal Wallis برای مبتدیان بازنشر شده از منبع https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 از طریق https://towardsdatascience.com/feed
<!–
->
- بیت کوین
- bizbuildermike
- بلاکچین
- انطباق با بلاک چین
- کنفرانس بلاکچین
- مشاوران بلاک چین
- coinbase
- coingenius
- اجماع
- کنفرانس رمزنگاری
- معدنکاری رمز گشایی
- کریپتو کارنسی (رمز ارزها )
- غیر متمرکز
- DEFI
- دارایی های دیجیتال
- ethereum
- فراگیری ماشین
- رمز غیر قابل شستشو
- افلاطون
- افلاطون آی
- هوش داده افلاطون
- پلاتوبلاک چین
- PlatoData
- بازی پلاتو
- چند ضلعی
- اثبات سهام
- W3
- زفیرنت