নতুনদের জন্য ক্রুস্কাল ওয়ালিস পরীক্ষা

ক্রুস্কাল ওয়ালিস পরীক্ষা: উদ্দেশ্য, সুযোগ, অনুমান, উদাহরণ, পাইথন বাস্তবায়ন

দ্বারা ফোটো রোমান ম্যাগার on Unsplash

ক্রুস্কাল ওয়ালিস নমুনা একই বিতরণ থেকে এসেছে কিনা তা মূল্যায়নের জন্য একটি নন-প্যারামেট্রিক পদ্ধতি। এটি দুটির বেশি স্বাধীন বা সম্পর্কহীন নমুনার তুলনায় ব্যবহার করা হয়। বৈচিত্র্যের একমুখী বিশ্লেষণ (ANOVA) হল ক্রুস্কাল-ওয়ালিস পরীক্ষার প্যারামেট্রিক সমতা।

1.1 একটি ভাল ব্যবসায়িক ব্যবহারের ক্ষেত্রে কি হবে?

আসুন একটি ফার্মা কোম্পানির দ্বারা একটি নতুন লঞ্চ করা ওষুধের উপর প্রচারাভিযানের প্রভাব পরিমাপ করা যাক, যেখানে আমাদের 1,550টি লক্ষ্য এবং 500টি হোল্ডআউট রয়েছে৷ আমরা প্রেসক্রিপশন আচরণের বন্টন দেখেছি এবং এটিকে অ-স্বাভাবিক (বিচ্ছিন্ন) তবে একইভাবে প্রতিটি গ্রুপের জন্য আকৃতির (লক্ষ্য এবং হোল্ডআউট) পেয়েছি। আমরা ANOVA সম্পাদন করতে পারি না; তাই আমরা একটি নন-প্যারামেট্রিক পরীক্ষা, ক্রুস্কাল-ওয়ালিস প্রয়োগ করি।

যেহেতু ক্রুস্কাল ওয়ালিস একটি নন-প্যারামেট্রিক পরীক্ষা, তাই কোনো ধারণা নেই যে ডেটা সাধারণত বিতরণ করা হয় (ANOVA থেকে ভিন্ন)।

  1. বাস্তবিক নাল অনুমান হল যে জনসংখ্যা থেকে নমুনাগুলি উৎপন্ন হয় তাদের একই মধ্যম থাকে।
  2. ক্রুসকাল-ওয়ালিস পরীক্ষাটি সাধারণত ব্যবহৃত হয় যখন একটি বৈশিষ্ট্য পরিবর্তনশীল এবং একটি পরিমাপ পরিবর্তনশীল থাকে এবং পরিমাপ পরিবর্তনশীল ANOVA (স্বাভাবিকতা এবং সমজাতীয়তা) এর অনুমান পূরণ করে না।
  3. বেশিরভাগ নন-প্যারামেট্রিক পরীক্ষার মতো, এটি র‍্যাঙ্ক করা ডেটাতে সঞ্চালিত হয়, তাই পরিমাপ পর্যবেক্ষণগুলি সামগ্রিক ডেটা সেট ব্যবহার করে তাদের র‍্যাঙ্কে রূপান্তরিত হয়: সবচেয়ে ছোট বা সর্বনিম্ন মান 1 এর র্যাঙ্ক পায়, পরবর্তী ক্ষুদ্রতমটি 2 এর র্যাঙ্ক পায়, নিম্নলিখিত একটি 3 র্যাঙ্ক, এবং তাই. টাইয়ের ক্ষেত্রে, একটি গড় র‌্যাঙ্ক বিবেচনা করা হয়।
  4. মূল মানগুলির জন্য প্রতিস্থাপনের র‌্যাঙ্কে তথ্যের ক্ষতি এটিকে ANOVA-এর তুলনায় কম শক্তিশালী পরীক্ষা করে তোলে, তাই যদি ডেটা অনুমানগুলি পূরণ করে তবে ANOVA ব্যবহার করা উচিত.

ক্রুস্কাল-ওয়ালিস পরীক্ষার নাল হাইপোথিসিস কখনও কখনও বলা হয় যে গ্রুপ মিডিয়ান সমান। যাইহোক, এটি শুধুমাত্র সঠিক যদি আপনি বিশ্বাস করেন যে প্রতিটি গ্রুপের বন্টনগত বৈশিষ্ট্য একই। যদিও মিডিয়ান একই, ক্রুস্কাল-ওয়ালিস পরীক্ষা শূন্য অনুমানকে প্রত্যাখ্যান করতে পারে যদি বন্টনগুলি ভিন্ন হয়।

ক্রুস্কাল-ওয়ালিস পরিসংখ্যান ব্যবহার করে বিভিন্ন আকারের গোষ্ঠী পরীক্ষা করা যেতে পারে। ক্রুস্কাল-ওয়ালিস পরীক্ষা, বৈষম্যের তুলনীয় একমুখী বিশ্লেষণের বিপরীতে, একটি স্বাভাবিক বন্টন ধরে নেয় না কারণ এটি একটি অ-প্যারামেট্রিক পদ্ধতি। পরীক্ষাটি অবশ্য অনুমান করে যে প্রতিটি গোষ্ঠীর বন্টন অভিন্ন আকারের এবং স্কেল করা হয়েছে, মধ্যকগুলির মধ্যে কোনো পরিবর্তন ছাড়া।

পরীক্ষা এবং নিয়ন্ত্রণ ভিন্নভাবে সঞ্চালিত কিনা তা বিশ্লেষণ করতে ক্রুস্কাল ওয়ালিস ব্যবহার করা যেতে পারে। যখন ডেটা তির্যক হয় (অ-স্বাভাবিক বন্টন), পরীক্ষাটি বলে দেবে যে দুটি গ্রুপ আলাদা কিনা কোন কারণ স্থাপন না করে। এটি আচরণের পার্থক্যের কারণ নির্দেশ করবে না।

4.1 কিভাবে পরীক্ষা কাজ করে?

ক্রুস্কাল ওয়ালিস 1 (সবচেয়ে ছোট) থেকে শুরু করে সমস্ত পর্যবেক্ষণকে র‌্যাঙ্ক করে কাজ করে। র‌্যাঙ্কিংটি সমস্ত ডেটা পয়েন্টের জন্য করা হয়, তারা যে গ্রুপেরই হোক না কেন। বাঁধা মানগুলি গড় র‌্যাঙ্ক পায় যদি তারা বাঁধা না থাকে।

যখন সমস্ত পর্যবেক্ষণকে বিশ্লেষণ ভেরিয়েবলের (নির্ধারিত প্রেসক্রিপশনের সংখ্যা) উপর ভিত্তি করে একটি স্বাক্ষরিত র্যাঙ্ক বরাদ্দ করা হয়, তখন তাদের লক্ষ্য/হোল্ডআউট অবস্থার উপর ভিত্তি করে তাদের আলাদা/বিভক্ত করা হয়। এর পরে, প্রতিটি গ্রুপের গড় র্যাঙ্ক গণনা করা হয় এবং তুলনা করা হয়।

এই গোষ্ঠীর জন্য উদ্যোগ বা প্রচারমূলক প্রচেষ্টা চালু হওয়ার পর থেকে লক্ষ্যে হোল্ডআউটের তুলনায় উচ্চতর গড় র্যাঙ্ক হবে বলে আশা করা হচ্ছে। একটি উল্লেখযোগ্য p-মান সহ, টার্গেট হোল্ডআউটের চেয়ে ভাল পারফর্ম করছে। এখানে চ্যালেঞ্জ হল টার্গেট গোষ্ঠীর গড় র্যাঙ্ক আউটলিয়ারদের উপস্থিতিতে উচ্চতর হতে পারে, অর্থাত্, কিছু ডাক্তার অন্যদের তুলনায় বেশি স্ক্রিপ্ট লেখেন। তাই, আমরা সবসময় আমাদের অনুমানকে যাচাই/খণ্ডন করার জন্য ক্রুস্কাল ওয়ালিস দ্বারা প্রাপ্ত পাটিগণিত মধ্যমা এবং ফলত p-মান দেখি।

তথ্যে Ni (i = 1, 2, 3, 4,…, g) প্রতিটি জি গ্রুপের (অর্থাৎ, নমুনা বা, এই ক্ষেত্রে, ডাক্তারের সংখ্যা) জন্য নমুনার আকার উপস্থাপন করুন। ri হল গ্রুপ i এর জন্য ri' এর সাথে গ্রুপ i এর গড় র্যাঙ্কের সমষ্টি। তারপর Kruskal ওয়ালিস পরীক্ষার পরিসংখ্যান হিসাবে গণনা করা হয়:

সূত্র 1। পরীক্ষার পরিসংখ্যান গণনার সূত্রটি চিত্রিত করে। মার্কডাউন এবং ল্যাটেক্স ব্যবহার করে লেখক দ্বারা প্রস্তুত করা ছবি।

পরীক্ষার পরিসংখ্যান থ্রেশহোল্ড চি-স্কোয়ার মান অতিক্রম করলে সমান জনসংখ্যার মধ্যকার শূন্য অনুমান প্রত্যাখ্যান করা হয়। যখন সমান জনসংখ্যার শূন্য অনুমান সত্য হয়, তখন এই পরিসংখ্যানে স্বাধীনতার k-1 ডিগ্রী থাকে এবং এটি আনুমানিক একটি চি-স্কোয়ার বন্টন করে। আনুমানিকতা নির্ভুল হওয়ার জন্য কমপক্ষে 5 এর ni থাকতে হবে (অর্থাৎ, একটি গ্রুপে কমপক্ষে পাঁচটি পর্যবেক্ষণ)।

সূত্র 2। পরীক্ষার জন্য p-মানের আনুমানিক সূত্রটি চিত্রিত করে। মার্কডাউন এবং ল্যাটেক্স ব্যবহার করে লেখক দ্বারা প্রস্তুত করা ছবি।

একটি chi-squared সম্ভাব্যতা বন্টন সারণী ব্যবহার করে, আমরা স্বাধীনতার g-1 ডিগ্রি এবং কাঙ্খিত তাৎপর্য স্তরে গুরুত্বপূর্ণ চি-স্কোয়ার মান পেতে পারি। বিকল্পভাবে, আমরা ফলাফলের তাৎপর্য সম্পর্কে মন্তব্য করতে p-মান পরীক্ষা করতে পারি।

4.2 হাত দিয়ে H পরীক্ষা চালান

ধরা যাক যে একটি ফার্মা কোম্পানি বুঝতে চায় যে ডাক্তারের তিনটি গ্রুপের রোগীর সংখ্যা ভিন্ন (স্টেফানি গ্লেন, এনডি) যেমন,

মূল মতামত নেতা/কেওএল (এক মাসে রোগীর পরিমাণ): 23, 42, 55, 66, 78

বিশেষজ্ঞ/এসপিই (এক মাসে রোগীর সংখ্যা): 45, 56, 60, 70, 72

সাধারণ অনুশীলনকারী/জিপি (এক মাসে রোগীর পরিমাণ): 18, 30, 34, 41, 44

4.2.1 এক সেটে একত্রিত করার পর ঊর্ধ্বক্রম অনুসারে ডেটা সাজান

18 23 24 30 41 42 44 45 55 56 এক্সএক্সএক্স এক্সজেকশন 60 66 70

4.2.2 সাজানো ডেটা পয়েন্টগুলিকে র‌্যাঙ্ক করুন। বন্ধনের ক্ষেত্রে গড় ব্যবহার করুন

মান: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

র্যাঙ্ক: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 প্রতিটি গ্রুপের জন্য র‌্যাঙ্কের যোগফল গণনা করুন

চিত্র 1 প্রতিটি গ্রুপের জন্য র‌্যাঙ্কের যোগফলকে চিত্রিত করে। ইমেজ ক্রেডিট — লেখক দ্বারা প্রস্তুত.

4.2.4 চিত্র 1 থেকে সূত্র 1 এবং সংখ্যাগুলি ব্যবহার করে H পরিসংখ্যান গণনা করুন

সূত্র 3। আমাদের প্রেসক্রাইবার গ্রুপের জন্য H পরিসংখ্যান গণনা করার সূত্রটি চিত্রিত করে। মার্কডাউন এবং ল্যাটেক্স ব্যবহার করে লেখক দ্বারা প্রস্তুত করা ছবি।

H=6.72

4.2.5 স্বাধীনতার g-1 ডিগ্রির জন্য গুরুত্বপূর্ণ চি-স্কয়ার মান চিহ্নিত করুন
একটি α=0.05 যা আমাদের সমস্যার জন্য (3–1=2 ডিগ্রী স্বাধীনতা) 5.99 হওয়া উচিত। নীচের টেবিল পড়ুন।

4.2.6 4.2.4 থেকে 4.2.5 থেকে গুরুত্বপূর্ণ মানের সাথে H মান তুলনা করুন

নাল হাইপোথিসিস যে তিনটি ভিন্ন গোষ্ঠী জুড়ে মাঝারি রোগীর আয়তন সমান তা প্রত্যাখ্যান করা উচিত যদি সমালোচনামূলক চি-বর্গ মান H পরিসংখ্যানের চেয়ে ছোট হয়। যেহেতু 5.99 (গুরুত্বপূর্ণ মান) <6.72, আমরা শূন্য অনুমান প্রত্যাখ্যান করতে পারি।

চি-বর্গ মান উপরে গণনা করা H পরিসংখ্যানের চেয়ে কম না হলে মধ্যমা অসম হয় তা অনুমান করার জন্য আরও প্রমাণ থাকা দরকার।

ক্রুস্কাল-ওয়ালিস এইচ-টেস্ট ব্যবহার করে সমস্ত গোষ্ঠীর জনসংখ্যার মধ্যকার সমান যে শূন্য অনুমান পরীক্ষা করা হয়। এটি একটি ANOVA বৈকল্পিক যা অ-প্যারামেট্রিক। পরীক্ষাটি বিভিন্ন আকারের দুই বা ততোধিক স্বাধীন নমুনা ব্যবহার করে। মনে রাখবেন যে শূন্য অনুমানকে অপ্রমাণিত করা প্রকাশ করে না কিভাবে গ্রুপগুলি আলাদা। কোন গোষ্ঠীগুলি আলাদা তা শনাক্ত করতে, গ্রুপগুলির মধ্যে পোস্ট-হক তুলনা করা প্রয়োজন৷

স্কিপি আমদানি পরিসংখ্যান থেকে
x = [১, ৩, ৫, ৮, ৯, ১২, ১৭]
y = [2, 6, 6, 8, 10, 15, 20, 22]
stats.kruskal(x, y)
ক্রুস্কাল রেজাল্ট(পরিসংখ্যান=0.7560483870967752, pvalue=0.3845680059797648)মুদ্রণ(np.মিডিয়ান(x))
মুদ্রণ(np.মিডিয়ান(y))
8.0
9.0
মুদ্রণ(np.mean(x))
মুদ্রণ(np.mean(y))
7.86
11.12

পাইথন দ্বারা উত্পন্ন আউটপুট উপরে দেখানো হয়েছে। এটি লক্ষ করা উচিত যে যদিও দুটি শ্রেণীতে মানের গড়তে একটি চিহ্নিত পার্থক্য পরিলক্ষিত হয়, এই পার্থক্যটি, যখন মধ্যমাকে বিবেচনায় নেওয়া হয়, তখন তা নগণ্য কারণ p-মানটি 5% এর চেয়ে অনেক বেশি।

বিশেষ করে তির্যক নমুনাগুলির সাথে ডিল করার সময় ক্রুস্কাল ওয়ালিস পরীক্ষা সহায়ক। এটি একটি প্রচারাভিযান রোলআউটের সময় বা এমনকি A/B পরীক্ষা করার সময় পরীক্ষা নিয়ন্ত্রণ গোষ্ঠীর জন্য ব্যাপকভাবে ব্যবহার করা যেতে পারে। এটি বেশিরভাগ শিল্প ব্যবহারের ক্ষেত্রে প্রযোজ্য কারণ খুচরা জায়গায় গ্রাহকদের সাথে বা ফার্মাসিউটিক্যাল ল্যান্ডস্কেপে ডাক্তারদের সাথে ডিল করার সময় প্রতিটি গ্রাহকের আচরণ আলাদা। আমরা যখন ঝুড়ির আকার বা রোগীর পরিমাণ দেখি, তখন অল্পসংখ্যক গ্রাহক বেশি ক্রয় করেন, যেখানে অল্প কয়েকজন ডাক্তারের কাছে বেশি রোগী থাকে। তাই এই ধরনের তির্যক বিতরণের জন্য, আচরণগুলি একই রকম কিনা তা পরীক্ষা করার জন্য ক্রুস্কাল ওয়ালিস পরীক্ষা করা অত্যাবশ্যক।

স্টেফানি গ্লেন. "ক্রুস্কাল ওয়ালিস এইচ টেস্ট: সংজ্ঞা, উদাহরণ, অনুমান, SPSS" থেকে StatisticsHowTo.com: আমাদের বাকিদের জন্য প্রাথমিক পরিসংখ্যান! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

নতুনদের জন্য ক্রুস্কাল ওয়ালিস পরীক্ষা উৎস https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 https://towardsdatascience.com/feed এর মাধ্যমে পুনঃপ্রকাশিত

<!–

->

সময় স্ট্যাম্প:

থেকে আরো ব্লকচেইন পরামর্শদাতা

সিঙ্গাপুর খুচরা ক্রিপ্টো বিনিয়োগকারীদের জন্য কঠোর নিয়ম বিবেচনা করে - নিয়ন্ত্রক বলেছেন ক্রিপ্টোকারেন্সিগুলি 'অত্যন্ত বিপজ্জনক'

উত্স নোড: 1646764
সময় স্ট্যাম্প: আগস্ট 30, 2022