اختبار كروسكال واليس للمبتدئين

اختبار كروسكال واليس: الغرض، النطاق، الافتراضات، الأمثلة، تنفيذ بايثون

تصوير رومان ماجر on Unsplash

كروسكال واليس هي طريقة غير حدودية لتقييم ما إذا كانت العينات تأتي من نفس التوزيع. يتم استخدامه في مقارنة أكثر من عينتين مستقلتين أو غير مرتبطتين. تحليل التباين أحادي الاتجاه (ANOVA) هو التكافؤ البارامترى لاختبار كروسكال واليس.

1.1 ما هي حالة الاستخدام التجاري الجيدة؟

دعونا نقيس تأثير الحملة التي أطلقتها إحدى شركات الأدوية على دواء تم إطلاقه حديثًا، حيث لدينا 1,550 هدفًا و500 حالة رفض. لقد نظرنا إلى توزيع سلوكيات الوصفات الطبية ووجدناها غير طبيعية (منحرفة) ولكنها تتشكل بشكل مماثل لكل مجموعة (الأهداف والمقاومات). لا يمكننا إجراء ANOVA؛ ومن هنا قمنا بتطبيق اختبار كروسكال واليس غير البارامترى.

نظرًا لأن اختبار كروسكال واليس هو اختبار غير حدودي، فلا يوجد افتراض بأن البيانات يتم توزيعها بشكل طبيعي (على عكس ANOVA).

  1. الفرضية الصفرية الواقعية هي أن المجموعات السكانية التي تنشأ منها العينات لها نفس الوسيط.
  2. يُستخدم اختبار كروسكال-واليس بشكل شائع عندما يكون هناك متغير سمة واحد ومتغير قياس واحد، ولا يلبي متغير القياس افتراضات ANOVA (الحالة الطبيعية والتجانس)
  3. مثل معظم الاختبارات غير البارامترية، يتم إجراؤها على بيانات مرتبة، لذلك يتم تحويل ملاحظات القياس إلى رتبها باستخدام مجموعة البيانات الإجمالية: أصغر أو أدنى قيمة تحصل على رتبة 1، والقيمة الأصغر التالية تحصل على رتبة 2، التالية مرتبة 3، وهكذا. في حالة التعادل، يتم أخذ متوسط ​​الرتبة في الاعتبار.
  4. إن فقدان المعلومات عند استبدال الرتب بالقيم الأصلية يجعل هذا الاختبار أقل قوة من تحليل التباين (ANOVA)، لذلك يجب استخدام تحليل التباين (ANOVA) إذا كانت البيانات تفي بالافتراضات.

يُذكر أحيانًا أن فرضية العدم لاختبار كروسكال-واليس هي أن متوسطات المجموعة متساوية. ومع ذلك، يكون هذا دقيقًا فقط إذا كنت تعتقد أن الخصائص التوزيعية لكل مجموعة هي نفسها. على الرغم من أن المتوسطات هي نفسها، فإن اختبار كروسكال واليس يمكن أن يرفض فرضية العدم إذا اختلفت التوزيعات.

يمكن فحص مجموعات ذات أحجام مختلفة باستخدام إحصائية كروسكال واليس. اختبار كروسكال واليس، على عكس تحليل التباين أحادي الاتجاه المقارن، لا يفترض توزيعًا طبيعيًا لأنه إجراء غير معلمي. ومع ذلك، يفترض الاختبار أن توزيع كل مجموعة له شكل وحجم متطابقان، باستثناء أي اختلافات في المتوسطات.

يمكن استخدام Kruskal Wallis لتحليل ما إذا كان أداء الاختبار والتحكم مختلفًا. عندما تكون البيانات منحرفة (التوزيع غير الطبيعي)، سيحدد الاختبار ما إذا كانت المجموعتان مختلفتان دون إثبات أي سببية. ولن يقترح سبب الاختلاف في السلوك.

4.1 كيف يعمل الاختبار؟

يعمل كروسكال واليس على ترتيب جميع الملاحظات، بدءاً من 1 (الأكثر ثانوية). يتم التصنيف لجميع نقاط البيانات، بغض النظر عن المجموعة التي تنتمي إليها. تحصل القيم المقيدة على متوسط ​​الترتيب الذي كانت ستحصل عليه لو لم يتم ربطها.

عندما يتم تعيين رتبة موقعة لجميع الملاحظات بناءً على متغير التحليل (عدد الوصفات الموصوفة)، يتم تمييزها/تقسيمها إلى مجموعات بناءً على حالة الهدف/الرفض. بعد ذلك، يتم حساب ومقارنة متوسط ​​رتبة كل مجموعة.

من المتوقع أن يكون للهدف متوسط ​​تصنيف أعلى من الرافضين منذ إطلاق المبادرة أو الجهد الترويجي لهذه المجموعة. مع وجود قيمة p كبيرة، يكون أداء الهدف أفضل من الممتنعين. التحدي هنا هو أن متوسط ​​رتبة المجموعة المستهدفة يمكن أن يكون أعلى في وجود القيم المتطرفة، أي أن عدد قليل من الأطباء يكتبون نصوصًا أكثر من غيرهم. ومن ثم، فإننا ننظر دائمًا إلى الوسيط الحسابي والقيمة الاحتمالية الناتجة التي حصل عليها كروسكال واليس للتحقق من صحة/دحض فرضيتنا.

دع Ni (i = 1، 2، 3، 4،...، g) يمثل أحجام العينات لكل مجموعة g (أي العينات أو، في هذه الحالة، عدد الأطباء) في البيانات. ri هو مجموع رتب المجموعة i مع ri' كمتوسط ​​رتبة المجموعة i. ثم يتم حساب إحصائية اختبار كروسكال واليس على النحو التالي:

الصيغة شنومكس. يوضح صيغة حساب إحصائيات الاختبار. الصورة من إعداد المؤلف باستخدام Markdown وLatex.

يتم رفض الفرضية الصفرية لمتوسطات السكان المتساوية إذا تجاوزت إحصائية الاختبار قيمة عتبة مربع كاي. عندما تكون الفرضية الصفرية لعدد متساوٍ من السكان صحيحة، فإن هذه الإحصائية تتمتع بدرجات حرية k-1 وتقترب من توزيع مربع كاي. يجب أن يحتوي التقريب على ني لا يقل عن 5 (أي خمس ملاحظات على الأقل في مجموعة) لكي يكون دقيقًا.

الصيغة شنومكس. يوضح صيغة تقريب القيمة p للاختبار. الصورة من إعداد المؤلف باستخدام Markdown وLatex.

باستخدام جدول التوزيع الاحتمالي لمربع كاي، قد نحصل على قيمة مربع كاي الحاسمة عند درجات الحرية g-1 ومستوى الأهمية المطلوب. وبدلاً من ذلك، قد نقوم بفحص القيمة p للتعليق على أهمية النتائج.

4.2 قم بإجراء اختبار H يدويًا

لنفترض أن إحدى شركات الأدوية تريد معرفة ما إذا كانت ثلاث مجموعات من شرائح الأطباء لديها أعداد مختلفة من المرضى (ستيفاني جلين، و) على سبيل المثال

قادة الرأي الرئيسيون/KOL (حجم المرضى في الشهر): 23، 42، 55، 66، 78

المتخصصين/SPE (عدد المرضى في الشهر): 45، 56، 60، 70، 72

الممارسين العامين/الأطباء العامين (حجم المرضى في الشهر): 18، 30، 34، 41، 44

4.2.1 ترتيب البيانات تصاعدياً بعد دمجها في مجموعة واحدة

شنومكس شنومكس شنومكس شنومكس شنومكس شنومكس شنومكس شنومكس شنومكس شنومكس شنومكس شنومكس شنومكس شنومكس شنومكس

4.2.2 رتب نقاط البيانات التي تم فرزها. استخدم المتوسط ​​في حالة العلاقات

القيم: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

المرتبة: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 حساب مجموع الرتب لكل مجموعة

الرقم 1. يوضح مجموع الرتب لكل مجموعة. حقوق الصورة - من إعداد المؤلف.

4.2.4 حساب إحصائيات H باستخدام الصيغة 1 والأرقام من الشكل 1

الصيغة شنومكس. يوضح صيغة حساب إحصائيات H لمجموعة الواصفين لدينا. الصورة من إعداد المؤلف باستخدام Markdown وLatex.

ح = 6.72

4.2.5 حدد قيمة مربع كاي الحرجة لدرجات الحرية g-1 باستخدام
α=0.05 والتي بالنسبة لمشكلتنا (3–1=2 درجة حرية) يجب أن تكون 5.99. الرجوع إلى الجدول أدناه.

4.2.6 قارن قيمة H من 4.2.4 إلى القيمة الحرجة من 4.2.5

يجب رفض الفرضية الصفرية التي تنص على أن متوسط ​​حجم المريض عبر ثلاث مجموعات مختلفة متساوٍ إذا كانت قيمة مربع كاي الحرجة أصغر من إحصائية H. وبما أن 5.99 (القيمة الحرجة) <6.72 فيمكننا رفض فرضية العدم.

يجب أن يكون هناك المزيد من الأدلة لاستنتاج أن المتوسطات غير متساوية إذا كانت قيمة مربع كاي ليست أقل من إحصائية H المحسوبة أعلاه.

يتم اختبار الفرضية الصفرية القائلة بأن متوسطات السكان لدى جميع المجموعات متساوية باستخدام اختبار Kruskal-Wallis H. إنه متغير ANOVA غير معلمي. يستخدم الاختبار عينتين مستقلتين أو أكثر بأحجام مختلفة. لاحظ أن دحض فرضية العدم لا يكشف عن مدى اختلاف المجموعات. لتحديد المجموعات المختلفة، من الضروري إجراء مقارنات لاحقة بين المجموعات.

من احصائيات الاستيراد scipy
س = [1، 3، 5، 8، 9، 12، 17]
ص = [2، 6، 6، 8، 10، 15، 20، 22]
إحصائيات.kruskal(x, y)
KruskalResult(إحصائية=0.7560483870967752، قيمة p=0.3845680059797648)طباعة (np.median(x))
طباعة (np.median(y))
8.0
9.0
طباعة (np.mean(x))
طباعة (np.mean (ص))
7.86
11.12

يظهر الإخراج الذي تم إنشاؤه بواسطة Python أعلاه. وتجدر الإشارة إلى أنه على الرغم من ملاحظة اختلاف ملحوظ في متوسط ​​القيم بين الفئتين، فإن هذا الاختلاف، عند أخذ المتوسط ​​في الاعتبار، غير مهم لأن القيمة الاحتمالية أكبر بكثير من 5%.

يعد اختبار كروسكال واليس مفيدًا عند التعامل مع العينات المنحرفة بشكل خاص. ويمكن استخدامه على نطاق واسع لمجموعة مراقبة الاختبار أثناء إطلاق الحملة أو حتى عند إجراء اختبار أ/ب. ينطبق هذا على معظم حالات الاستخدام في الصناعة نظرًا لأن كل عميل لديه سلوك مختلف عند التعامل مع العملاء في مساحات البيع بالتجزئة أو الأطباء في مجال الأدوية. عندما ننظر إلى حجم السلة أو حجم المرضى، نجد أن عددًا قليلاً من العملاء يشترون المزيد، في حين أن عددًا قليلاً من الأطباء لديهم عدد أكبر من المرضى. وبالتالي، بالنسبة لمثل هذا التوزيع المنحرف، من الضروري إجراء اختبار كروسكال واليس للتحقق مما إذا كانت السلوكيات متشابهة.

ستيفاني جلين. "اختبار كروسكال واليس H: التعريف، الأمثلة، الافتراضات، SPSS" من إحصائيات HowTo.com: الإحصائيات الأولية لبقيتنا! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

اختبار كروسكال واليس للمبتدئين أعيد نشره من المصدر https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 عبر https://towardsdatascience.com/feed

<!–

->

الطابع الزمني:

اكثر من مستشارو Blockchain