کرسکل والس ٹیسٹ برائے ابتدائیہ

کرسکل والس ٹیسٹ: مقصد، دائرہ کار، مفروضے، مثالیں، ازگر کا نفاذ

کی طرف سے تصویر رومن میجر on Unsplash سے

کرسکل والس ایک غیر پیرامیٹرک طریقہ ہے جس کا اندازہ لگایا جاسکتا ہے کہ آیا نمونے ایک ہی تقسیم سے آتے ہیں۔ یہ دو سے زیادہ آزاد یا غیر متعلقہ نمونوں کے مقابلے میں استعمال ہوتا ہے۔ تغیر کا یک طرفہ تجزیہ (ANOVA) کرسکل والس ٹیسٹ کا پیرامیٹرک مساوات ہے۔

1.1 کاروباری استعمال کا ایک اچھا کیس کیا ہوگا؟

آئیے ایک فارما کمپنی کی جانب سے ایک نئی شروع کی گئی دوا پر شروع کی گئی مہم کے اثرات کی پیمائش کریں، جہاں ہمارے پاس 1,550 ٹارگٹ اور 500 ہولڈ آؤٹ ہیں۔ ہم نے نسخے کے رویے کی تقسیم کو دیکھا اور اسے غیر نارمل (ترچھا) پایا لیکن ہر گروپ (اہداف اور ہولڈ آؤٹ) کے لیے اسی طرح کی شکل دی گئی۔ ہم انووا انجام نہیں دے سکتے۔ اس لیے ہم ایک نان پیرامیٹرک ٹیسٹ، کرسکل والس کا اطلاق کرتے ہیں۔

چونکہ کرسکل والس ایک نان پیرامیٹرک ٹیسٹ ہے، اس لیے کوئی مفروضہ نہیں ہے کہ ڈیٹا عام طور پر تقسیم کیا جاتا ہے (اونووا کے برعکس)۔

  1. حقائق پر مبنی مفروضہ یہ ہے کہ جن آبادیوں سے نمونے نکلتے ہیں ان کا ایک ہی میڈین ہوتا ہے۔
  2. Kruskal-Wallis ٹیسٹ عام طور پر اس وقت استعمال ہوتا ہے جب ایک انتساب متغیر اور ایک پیمائش کا متغیر ہو، اور پیمائش کا متغیر انووا (معمولی اور ہم جنس پرستی) کے مفروضوں کو پورا نہیں کرتا ہے۔
  3. زیادہ تر غیر پیرامیٹرک ٹیسٹوں کی طرح، یہ درجہ بندی والے ڈیٹا پر کیا جاتا ہے، لہذا پیمائش کے مشاہدات کو مجموعی ڈیٹا سیٹ کا استعمال کرتے ہوئے ان کی صفوں میں تبدیل کر دیا جاتا ہے: سب سے چھوٹی یا سب سے کم قدر کو 1 کا درجہ ملتا ہے، اگلے سب سے چھوٹے کو 2 کا درجہ ملتا ہے، مندرجہ ذیل 3 کا درجہ، اور اسی طرح. ٹائی کی صورت میں، اوسط درجے پر غور کیا جاتا ہے۔
  4. اصل اقدار کے بدلے درجات میں معلومات کا نقصان اسے انووا کے مقابلے میں کم طاقتور ٹیسٹ بناتا ہے، لہذا اگر ڈیٹا مفروضوں پر پورا اترتا ہے تو انووا کا استعمال کیا جانا چاہیے۔.

Kruskal-Wallis ٹیسٹ کے null hypothesis کو بعض اوقات یہ کہا جاتا ہے کہ گروپ میڈین برابر ہیں۔ تاہم، یہ صرف اس صورت میں درست ہے جب آپ کو یقین ہے کہ ہر گروپ کی تقسیم کی خصوصیات ایک جیسی ہیں۔ اگرچہ میڈین ایک جیسے ہیں، اگر تقسیم میں فرق ہو تو کرسکل والس ٹیسٹ کالعدم مفروضے کو مسترد کر سکتا ہے۔

کرسکل والس کے اعدادوشمار کا استعمال کرتے ہوئے مختلف سائز کے گروپوں کی جانچ کی جا سکتی ہے۔ Kruskal-Wallis ٹیسٹ، تغیر کے تقابلی یک طرفہ تجزیہ کے برعکس، ایک عام تقسیم کو فرض نہیں کرتا کیونکہ یہ ایک غیر پیرامیٹرک طریقہ کار ہے۔ تاہم، ٹیسٹ میں یہ خیال کیا جاتا ہے کہ ہر گروپ کی تقسیم یکساں شکل اور اسکیل کی گئی ہے، ماسوائے میڈین میں کسی قسم کے تغیرات کے۔

کرسکل والس کا استعمال اس بات کا تجزیہ کرنے کے لیے کیا جا سکتا ہے کہ آیا ٹیسٹ اور کنٹرول نے مختلف طریقے سے کارکردگی کا مظاہرہ کیا۔ جب ڈیٹا متزلزل ہوتا ہے (غیر معمولی تقسیم)، ٹیسٹ بتائے گا کہ آیا دونوں گروپس بغیر کسی وجہ کے قائم کیے مختلف ہیں۔ یہ رویے میں فرق کی وجہ نہیں بتائے گا۔

4.1 ٹیسٹ کیسے کام کرتا ہے؟

Kruskal Wallis تمام مشاہدات کی درجہ بندی کرکے کام کرتا ہے، 1 (سب سے زیادہ معمولی) سے شروع ہوتا ہے۔ درجہ بندی تمام ڈیٹا پوائنٹس کے لیے کی جاتی ہے، چاہے وہ کسی بھی گروپ سے تعلق رکھتے ہوں۔ بندھے ہوئے اقدار کو وہ اوسط درجہ ملتا ہے جو انہیں ملا ہوتا اگر وہ بندھے نہ ہوتے۔

جب تمام مشاہدات کو تجزیہ متغیر (مقرر کردہ نسخوں کی تعداد) کی بنیاد پر ایک دستخط شدہ درجہ تفویض کیا جاتا ہے، تو انہیں ان کے ہدف/ہولڈ آؤٹ کی حیثیت کی بنیاد پر گروپوں میں تقسیم/تقسیم کیا جاتا ہے۔ اس کے بعد، ہر گروپ کے اوسط درجے کا حساب اور موازنہ کیا جاتا ہے۔

اس گروپ کے لیے پہل یا پروموشنل کوشش شروع ہونے کے بعد سے ہدف کی توقع کی جاتی ہے کہ ہولڈ آؤٹس کے مقابلے میں اس کا اوسط درجہ زیادہ ہوگا۔ ایک اہم پی-ویلیو کے ساتھ، ہدف ہولڈ آؤٹس سے بہتر کارکردگی کا مظاہرہ کر رہا ہے۔ یہاں چیلنج یہ ہے کہ ٹارگٹ گروپ کا اوسط درجہ آؤٹ لیرز کی موجودگی میں زیادہ ہو سکتا ہے، یعنی چند ڈاکٹر دوسروں سے زیادہ اسکرپٹ لکھتے ہیں۔ لہٰذا، ہم ہمیشہ اپنے مفروضے کی توثیق/تردید کرنے کے لیے کرسکل والیس کے ذریعہ حاصل کردہ ریاضی کے درمیانی اور نتیجہ خیز پی-ویلیو کو دیکھتے ہیں۔

Ni (i = 1, 2, 3, 4,…, g) کو اعداد و شمار میں ہر جی گروپ (یعنی نمونے یا، اس معاملے میں، ڈاکٹروں کی تعداد) کے نمونے کے سائز کی نمائندگی کرنے دیں۔ ri گروپ i کے لیے ri' کے ساتھ گروپ i کے اوسط درجے کے طور پر درجات کا مجموعہ ہے۔ پھر کرسکل والس ٹیسٹ کے اعدادوشمار کو اس طرح شمار کیا جاتا ہے:

فارمولا 1. ٹیسٹ کے اعدادوشمار کا حساب لگانے کے فارمولے کی وضاحت کرتا ہے۔ مارک ڈاؤن اور لیٹیکس کا استعمال کرتے ہوئے مصنف کی طرف سے تیار کردہ تصویر۔

مساوی آبادی کے درمیانے درجے کے null مفروضے کو مسترد کر دیا جاتا ہے اگر ٹیسٹ کے اعدادوشمار کی حد chi-squared قدر سے زیادہ ہو جاتی ہے۔ جب مساوی آبادی کا کالعدم مفروضہ درست ہے، تو اس اعدادوشمار میں آزادی کی k-1 ڈگری ہوتی ہے اور یہ تقریباً chi-square کی تقسیم کا اندازہ لگاتا ہے۔ اس کے درست ہونے کے لیے قربت میں کم از کم 5 (یعنی ایک گروپ میں کم از کم پانچ مشاہدات) کا ہونا ضروری ہے۔

فارمولا 2. ٹیسٹ کے لیے p-value approximation کے فارمولے کی وضاحت کرتا ہے۔ مارک ڈاؤن اور لیٹیکس کا استعمال کرتے ہوئے مصنف کی طرف سے تیار کردہ تصویر۔

chi-squared امکانی تقسیم کے جدول کا استعمال کرتے ہوئے، ہم آزادی کی G-1 ڈگری اور مطلوبہ اہمیت کی سطح پر اہم chi-squared قدر حاصل کر سکتے ہیں۔ متبادل طور پر، ہم نتائج کی اہمیت پر تبصرہ کرنے کے لیے p-value کا جائزہ لے سکتے ہیں۔

4.2 ہاتھ سے H ٹیسٹ چلائیں۔

آئیے فرض کریں کہ ایک فارما کمپنی یہ سمجھنا چاہتی ہے کہ آیا ڈاکٹر طبقہ کے تین گروپوں میں مریض کی مقدار مختلف ہے۔ (سٹیفنی گلین، این ڈی) جیسے ،

کلیدی رائے قائدین/KOL (ایک ماہ میں مریض کا حجم): 23, 42, 55, 66, 78

ماہرین/ایس پی ای (ایک ماہ میں مریض کا حجم): 45، 56، 60، 70، 72

جنرل پریکٹیشنرز/جی پی (ایک ماہ میں مریض کا حجم): 18، 30، 34، 41، 44

4.2.1 ڈیٹا کو ایک سیٹ میں ملانے کے بعد صعودی ترتیب میں ترتیب دیں۔

18 23 24 30 41 42 44 45 55 56 60 66 70 72

4.2.2 ترتیب شدہ ڈیٹا پوائنٹس کی درجہ بندی کریں۔ تعلقات کے معاملے میں اوسط استعمال کریں۔

قدریں: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

درجہ بندی: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 ہر گروپ کے لیے رینک کے مجموعے کا حساب لگائیں۔

چترا 1 ہے. ہر گروپ کے لیے صفوں کے مجموعے کی وضاحت کرتا ہے۔ تصویری کریڈٹ — مصنف کے ذریعہ تیار کردہ۔

4.2.4 فارمولہ 1 کا استعمال کرتے ہوئے H اعداد و شمار کا حساب لگائیں اور شکل 1 سے اعداد

فارمولا 3. ہمارے تجویز کنندہ گروپ کے لیے H کے اعداد و شمار کا حساب لگانے کے فارمولے کی وضاحت کرتا ہے۔ مارک ڈاؤن اور لیٹیکس کا استعمال کرتے ہوئے مصنف کی طرف سے تیار کردہ تصویر۔

H = 6.72

4.2.5 آزادی کے G-1 ڈگری کے لیے اہم chi-square قدر کی شناخت کریں
ایک α=0.05 جو ہمارے مسئلے کے لیے (3–1=2 آزادی کی ڈگری) 5.99 ہونا چاہیے۔ نیچے دیے گئے جدول سے رجوع کریں۔

4.2.6 H قدر کا 4.2.4 سے 4.2.5 سے اہم قدر سے موازنہ کریں

کالعدم مفروضہ یہ بتاتا ہے کہ تین مختلف گروپوں میں درمیانی مریض کا حجم برابر ہے اگر اہم chi-square قدر H اعدادوشمار سے کم ہے تو اسے مسترد کر دیا جانا چاہیے۔ چونکہ 5.99 (تنقیدی قدر) <6.72، ہم کالعدم مفروضے کو رد کر سکتے ہیں۔

یہ اندازہ لگانے کے لیے مزید شواہد کی ضرورت ہے کہ اگر chi-square قدر اوپر شمار کیے گئے H کے اعدادوشمار سے کم نہ ہو تو میڈین غیر مساوی ہیں۔

اس کالعدم مفروضے کو کہ تمام گروپوں کی آبادی کے درمیانی برابر ہیں کرسکل والس ایچ ٹیسٹ کے ذریعے جانچا جاتا ہے۔ یہ ایک ANOVA ویرینٹ ہے جو نان پیرامیٹرک ہے۔ ٹیسٹ میں مختلف سائز کے دو یا زیادہ آزاد نمونوں کا استعمال کیا جاتا ہے۔ نوٹ کریں کہ کالعدم مفروضے کو غلط ثابت کرنے سے یہ ظاہر نہیں ہوتا ہے کہ گروہ کس طرح مختلف ہیں۔ یہ شناخت کرنے کے لیے کہ کون سے گروپ مختلف ہیں، گروپوں کے درمیان پوسٹ ہاک موازنہ ضروری ہے۔

اسکائی درآمدی اعدادوشمار سے
x = [1، 3، 5، 8، 9، 12، 17]
y = [2، 6، 6، 8، 10، 15، 20، 22]
stats.kruskal(x, y)
KruskalResult(statistic=0.7560483870967752, pvalue=0.3845680059797648)پرنٹ(np.median(x))
پرنٹ(np.median(y))
8.0
9.0
پرنٹ(np.mean(x))
پرنٹ(np.mean(y))
7.86
11.12

Python کے ذریعہ تیار کردہ آؤٹ پٹ اوپر دکھایا گیا ہے۔ واضح رہے کہ اگرچہ دونوں زمروں میں قدروں کے وسط میں ایک واضح فرق دیکھا جاتا ہے، لیکن یہ فرق، درمیانی کو مدنظر رکھتے ہوئے، معمولی نہیں ہے کیونکہ p-value 5% سے بہت زیادہ ہے۔

کرسکل والس ٹیسٹ خاص طور پر ترچھے نمونوں سے نمٹنے کے لیے اہم ہے۔ مہم کے رول آؤٹ کے دوران یا A/B ٹیسٹنگ کے دوران بھی اسے ٹیسٹ کنٹرول گروپ کے لیے وسیع پیمانے پر استعمال کیا جا سکتا ہے۔ یہ صنعت کے استعمال کے زیادہ تر معاملات پر لاگو ہوتا ہے کیونکہ خوردہ جگہ میں گاہکوں یا فارماسیوٹیکل لینڈ اسکیپ میں ڈاکٹروں کے ساتھ معاملہ کرتے وقت ہر صارف کا رویہ مختلف ہوتا ہے۔ جب ہم ٹوکری کے سائز یا مریضوں کے حجم کو دیکھتے ہیں، تو چند گاہک زیادہ خریدتے ہیں، جب کہ چند ڈاکٹروں کے پاس زیادہ مریض ہوتے ہیں۔ لہٰذا اس طرح کی ترچھی تقسیم کے لیے، یہ جانچنے کے لیے کرسکل والس ٹیسٹ کرنا ضروری ہے کہ آیا رویے ایک جیسے ہیں۔

سٹیفنی گلین. "کرسکل والس ایچ ٹیسٹ: تعریف، مثالیں، مفروضے، SPSS" منجانب StatisticsHowTo.com: ہم میں سے باقی لوگوں کے لیے ابتدائی شماریات! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

کرسکل والس ٹیسٹ برائے مبتدیوں کا دوبارہ شائع کردہ ماخذ https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 بذریعہ https://towardsdatascience.com/feed

<!–

->

ٹائم اسٹیمپ:

سے زیادہ بلاکچین کنسلٹنٹس