Bài kiểm tra Kruskal Wallis dành cho người mới bắt đầu

Kiểm tra Kruskal Wallis: Mục đích, Phạm vi, Giả định, Ví dụ, Triển khai Python

Photo by La Mã on Unsplash

Kruskal Wallis là một phương pháp phi tham số để đánh giá xem các mẫu có đến từ cùng một phân phối hay không. Nó được sử dụng để so sánh nhiều hơn hai mẫu độc lập hoặc không liên quan. Phân tích phương sai một chiều (ANOVA) là sự tương đương tham số của thử nghiệm Kruskal-Wallis.

1.1 Trường hợp sử dụng kinh doanh tốt là gì?

Hãy đo lường tác động của một chiến dịch do Công ty Dược phẩm triển khai đối với một loại thuốc mới ra mắt, trong đó chúng tôi có 1,550 Mục tiêu và 500 Mục tiêu. Chúng tôi đã xem xét sự phân bổ hành vi theo quy định và nhận thấy nó không bình thường (bị lệch) nhưng có hình dạng tương tự đối với từng nhóm (mục tiêu và nhóm nắm giữ). Chúng tôi không thể thực hiện ANOVA; do đó chúng tôi áp dụng thử nghiệm phi tham số, Kruskal-Wallis.

Vì Kruskal Wallis là một thử nghiệm phi tham số nên không có giả định rằng dữ liệu có phân phối chuẩn (không giống như ANOVA).

  1. Giả thuyết không thực tế là các quần thể mà mẫu bắt nguồn có cùng mức trung vị.
  2. Thử nghiệm Kruskal-Wallis được sử dụng phổ biến nhất khi có một biến thuộc tính và một biến đo lường và biến đo lường không đáp ứng các giả định của ANOVA (tính chuẩn tắc và tính đồng nhất)
  3. Giống như hầu hết các thử nghiệm phi tham số, nó được thực hiện trên dữ liệu được xếp hạng, do đó, các quan sát đo lường được chuyển đổi thành thứ hạng của chúng bằng cách sử dụng tập dữ liệu tổng thể: giá trị nhỏ nhất hoặc thấp nhất có thứ hạng 1, giá trị nhỏ nhất tiếp theo có thứ hạng 2, tiếp theo là thứ hạng 3, v.v. Trong trường hợp hòa, thứ hạng trung bình sẽ được xem xét.
  4. Việc mất thông tin trong việc thay thế thứ hạng cho các giá trị ban đầu khiến thử nghiệm này kém hiệu quả hơn ANOVA, vì vậy nên sử dụng ANOVA nếu dữ liệu đáp ứng các giả định.

Giả thuyết không của thử nghiệm Kruskal-Wallis đôi khi được cho là các trung vị của nhóm bằng nhau. Tuy nhiên, điều này chỉ chính xác nếu bạn tin rằng đặc điểm phân bổ của mỗi nhóm là giống nhau. Mặc dù các số trung vị là như nhau nhưng kiểm định Kruskal-Wallis có thể bác bỏ giả thuyết không nếu các phân bố khác nhau.

Các nhóm có quy mô khác nhau có thể được kiểm tra bằng thống kê Kruskal-Wallis. Thử nghiệm Kruskal-Wallis, không giống như phân tích phương sai một chiều có thể so sánh được, không giả định phân phối chuẩn vì đây là một quy trình phi tham số. Tuy nhiên, thử nghiệm giả định rằng sự phân bố của mỗi nhóm có hình dạng và tỷ lệ giống hệt nhau, ngoại trừ bất kỳ sự thay đổi nào về số trung vị.

Kruskal Wallis có thể được sử dụng để phân tích xem thử nghiệm và kiểm soát có thực hiện khác nhau hay không. Khi dữ liệu bị sai lệch (phân phối không chuẩn), thử nghiệm sẽ cho biết liệu hai nhóm có khác nhau hay không mà không thiết lập bất kỳ mối quan hệ nhân quả nào. Nó sẽ không gợi ý lý do cho sự khác biệt trong hành vi.

4.1 Quá trình kiểm tra diễn ra như thế nào?

Kruskal Wallis hoạt động bằng cách xếp hạng tất cả các quan sát, bắt đầu từ 1 (thứ yếu nhất). Việc xếp hạng được thực hiện cho tất cả các điểm dữ liệu, bất kể chúng thuộc nhóm nào. Các giá trị bị ràng buộc sẽ nhận được thứ hạng trung bình mà lẽ ra chúng sẽ nhận được nếu không bị ràng buộc.

Khi tất cả các quan sát đã được xếp hạng có dấu dựa trên biến phân tích (số lượng đơn thuốc được quy định), chúng sẽ được phân biệt/chia thành các nhóm dựa trên trạng thái mục tiêu/nắm giữ của chúng. Sau đó, thứ hạng trung bình của mỗi nhóm được tính toán và so sánh.

Mục tiêu dự kiến ​​sẽ có thứ hạng trung bình cao hơn so với các mục tiêu bị nắm giữ vì sáng kiến ​​hoặc nỗ lực quảng cáo được triển khai cho nhóm này. Với giá trị p đáng kể, Target đang hoạt động tốt hơn so với các nhóm nắm giữ. Thách thức ở đây là thứ hạng trung bình của nhóm mục tiêu có thể cao hơn khi có những ngoại lệ, tức là ít bác sĩ viết nhiều kịch bản hơn những người khác. Do đó, chúng tôi luôn xem xét trung vị số học và giá trị p tổng hợp mà Kruskal Wallis thu được để xác thực/bác bỏ giả thuyết của chúng tôi.

Đặt Ni (i = 1, 2, 3, 4,…, g) đại diện cho cỡ mẫu cho mỗi g nhóm (tức là mẫu hoặc trong trường hợp này là số lượng bác sĩ) trong dữ liệu. ri là tổng các thứ hạng của nhóm i với ri' là thứ hạng trung bình của nhóm i. Sau đó, thống kê kiểm tra Kruskal Wallis được tính như sau:

Công thức 1. Minh họa công thức tính toán thống kê kiểm tra. Hình ảnh được tác giả chuẩn bị bằng Markdown và Latex.

Giả thuyết không về các trung vị tổng thể bằng nhau sẽ bị bác bỏ nếu thống kê kiểm tra vượt quá giá trị chi bình phương ngưỡng. Khi giả thuyết khống về các quần thể bằng nhau là đúng, thống kê này có k-1 bậc tự do và xấp xỉ phân bố chi bình phương. Phép tính gần đúng phải có ít nhất 5 ni (tức là ít nhất XNUMX quan sát trong một nhóm) để nó chính xác.

Công thức 2. Minh họa công thức xấp xỉ giá trị p cho bài kiểm tra. Hình ảnh được tác giả chuẩn bị bằng Markdown và Latex.

Sử dụng bảng phân phối xác suất chi bình phương, chúng ta có thể nhận được giá trị chi bình phương quan trọng ở g-1 bậc tự do và mức ý nghĩa mong muốn. Ngoài ra, chúng tôi có thể kiểm tra giá trị p để nhận xét về tầm quan trọng của kết quả.

4.2 Chạy thử nghiệm H bằng tay

Giả sử một Công ty Dược phẩm muốn tìm hiểu xem liệu ba nhóm phân khúc bác sĩ có số lượng bệnh nhân khác nhau hay không (Stephanie Glen, thứ) Ví dụ,

Người dẫn đầu ý kiến ​​chính/KOL (Số lượng bệnh nhân trong một tháng): 23, 42, 55, 66, 78

Bác sĩ chuyên khoa/SPE (Số lượng bệnh nhân trong một tháng): 45, 56, 60, 70, 72

Bác sĩ đa khoa/GP (Số lượng bệnh nhân trong một tháng): 18, 30, 34, 41, 44

4.2.1 Sắp xếp dữ liệu theo thứ tự tăng dần sau khi gộp thành một bộ

18 23 24 30 41 42 44 45 55 56 60 66 70 72

4.2.2 Xếp hạng các điểm dữ liệu đã được sắp xếp. Sử dụng mức trung bình trong trường hợp hòa

Giá trị: 18 23 24 30 41 42 44 45 55 56 60 66 70 72 78

Xếp hạng: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4.2.3 Tính tổng thứ hạng của mỗi nhóm

Hình 1. Minh họa tổng thứ hạng của mỗi nhóm. Tín dụng hình ảnh - Được chuẩn bị bởi tác giả.

4.2.4 Tính H Thống kê theo Công thức 1 và các số từ Hình 1

Công thức 3. Minh họa công thức tính thống kê H cho nhóm người kê đơn của chúng ta. Hình ảnh được tác giả chuẩn bị bằng Markdown và Latex.

H = 6.72

4.2.5 Xác định giá trị chi bình phương tới hạn của g-1 bậc tự do với
α=0.05 mà đối với bài toán của chúng ta (3–1=2 bậc tự do) phải là 5.99. Tham khảo bảng dưới đây.

4.2.6 So sánh giá trị H từ 4.2.4 với giá trị tới hạn từ 4.2.5

Giả thuyết không cho rằng số lượng bệnh nhân trung bình ở ba nhóm khác nhau là bằng nhau sẽ bị bác bỏ nếu giá trị chi bình phương tới hạn nhỏ hơn thống kê H. Vì 5.99 (Giá trị tới hạn) < 6.72, chúng ta có thể bác bỏ giả thuyết khống.

Cần có thêm bằng chứng để suy luận rằng các trung vị không bằng nhau nếu giá trị chi bình phương không thấp hơn thống kê H tính toán ở trên.

Giả thuyết không cho rằng trung vị dân số của tất cả các nhóm đều bằng nhau được kiểm tra bằng phép thử Kruskal-Wallis H. Nó là một biến thể ANOVA không tham số. Thử nghiệm sử dụng hai hoặc nhiều mẫu độc lập có kích thước khác nhau. Lưu ý rằng việc bác bỏ giả thuyết không không tiết lộ các nhóm khác nhau như thế nào. Để xác định nhóm nào khác nhau, việc so sánh hậu kỳ giữa các nhóm là cần thiết.

từ số liệu thống kê nhập scipy
x = [1, 3, 5, 8, 9, 12, 17]
y = [2, 6, 6, 8, 10, 15, 20, 22]
stats.kruskal(x, y)
KruskalResult(thống kê=0.7560483870967752, pvalue=0.3845680059797648)print(np.median(x))
print(np.median(y))
8.0
9.0
in(np.mean(x))
in(np.mean(y))
7.86
11.12

Đầu ra do Python tạo ra được hiển thị ở trên. Cần lưu ý rằng mặc dù có sự khác biệt rõ rệt về giá trị trung bình của hai loại, nhưng sự khác biệt này, khi tính đến giá trị trung bình, là không đáng kể vì giá trị p lớn hơn 5%.

Kiểm tra Kruskal Wallis là công cụ khi xử lý các mẫu có độ lệch đặc biệt. Nó có thể được sử dụng rộng rãi cho nhóm kiểm soát thử nghiệm trong quá trình triển khai chiến dịch hoặc thậm chí khi thực hiện thử nghiệm A/B. Điều này có thể áp dụng cho hầu hết các trường hợp sử dụng trong ngành vì mỗi khách hàng có hành vi khác nhau khi giao dịch với khách hàng trong lĩnh vực bán lẻ hoặc với bác sĩ trong lĩnh vực dược phẩm. Khi chúng ta nhìn vào quy mô giỏ hàng hoặc số lượng bệnh nhân, ít khách hàng mua nhiều hơn, trong khi ít bác sĩ có nhiều bệnh nhân hơn. Do đó, đối với sự phân bổ sai lệch như vậy, điều quan trọng là phải thực hiện kiểm tra Kruskal Wallis để kiểm tra xem các hành vi có giống nhau hay không.

Stephanie Glen. “Kiểm tra Kruskal Wallis H: Định nghĩa, ví dụ, giả định, SPSS” Từ Thống kêHowTo.com: Thống kê cơ bản cho phần còn lại của chúng tôi! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/kruskal-wallis/

Bài kiểm tra Kruskal Wallis dành cho người mới bắt đầu được xuất bản lại từ nguồn https://towardsdatascience.com/kruskal-wallis-test-for-beginners-4fe9b0333b31?source=rss—-7f60cf5620c9—4 qua https://towardsdatascience.com/feed

<!–

->

Dấu thời gian:

Thêm từ Tư vấn chuỗi khối