Kiểm định Anderson-Darling

Kiểm Định Tính Phù Hợp

Phép kiểm định tính phù hợp (Goodness of Fit) được sử dụng để kiểm tra độ phù hợp của dữ liệu mẫu với một phân phối của tập tổng thể. Tập tổng thể có thể có phân phối chuẩn hoặc phân phối Weibull. Nói một cách đơn giản, nó khẳng định rằng dữ liệu mẫu thể hiện độ chính xác của dữ liệu mà chúng ta đang kỳ vọng tìm ra từ tập dữ liệu tổng thể thực tế. Các kiểm thử sau thường được sử dụng bởi các nhà thống kê:

  • Chi-bình phương (Chi-square)
  • Kolmogorov-Smirov
  • Anderson-Darling
  • Shipiro-Wilk

Phép thử Chi bình phương

Phép thử Chi bình phương là phép thử hay được sử dụng nhất trong phép kiểm định tính phù hợp và cũng được dùng cho các phân phối rời rạc như phân phối nhị thức và phân phối Poisson, trong khi đó phép thử Kolmogorov-Smirnov và Anderson-Darling dùng để kiểm định tính phù hợp trong trường hợp phân phối liên tục.

Công thức

\({ X^2 = \sum {[ \frac{(O_i - E_i)^2}{E_i}]} }\)

Với

  • \({O_i} \)= Giá trị quan sát được tại mức thứ i của biến
  • \({E_i}\) = Giá trị kỳ vọng tại mức thứ I của biến.
  • \({X^2}\) = Biến ngẫu nhiên Chi bình phương

Ví dụ

Một công ty đồ chơi làm ra các đồ chơi bóng đá. Công ty đưa ra thông tin rằng 30% lá bài là cầu thủ trung tâm, 60% là cầu thủ phòng ngự và 10% là cầu thủ tấn công. Xét ngẫu nhiên 100 đồ chơi có 50 cầu thủ trung tâm, 45 cầu thủ phòng ngủ và 5 cầu thủ tấn công. Mức ý nghĩa là 0.05, hãy đánh giá thông tin công ty đưa ra.

Lời giải:

Xác định giả thiết

  • Giả thiết rỗng \(H_0\) Tỉ lệ cầu thủ trung tâm, phòng ngự và tấn công lần lượt là 30%, 60% và 10%.
  • Giả thiết đối \(H_1\) Ít nhất một tỉ lệ trong giả thiết rỗng là sai.

Xác định bậc tự do

Bậc tự do, DF sẽ bằng với số lượng mức của các biến phạm trù trừ đi 1: DF = k 1. Mức trong ví dụ là 3. Vì vậy\({ DF = k - 1 \\[7pt] \, = 3 -1 = 2 }\)

Xác định thống kê của phép thử Chi bình phương

\({ X^2 = \sum {[ \frac{(O_i - E_i)^2}{E_i}]} \\[7pt] \, = [\frac{(50-30)^2}{30}] + [\frac{(45-60)^2}{60}] + [\frac{(5-10)^2}{10}] \\[7pt] \, = \frac{400}{30} + \frac{225}{60} + \frac{25}{10} \\[7pt] \, = 13.33 + 3.75 + 2.50 \\[7pt] \, = 19.58 }\)

Xác định giá trị p

Giá trị P là xác suất một thống kê Chi bình phương,\( X^2\)có hai bậc tự do nhiều hơn 19.58. Sử dụng phép tính phân phối Chi bình phương để tìm ra \({ P(X^2 \gt 19.58) = 0.0001 }\).

Phân tích kết quả

Với giá trị P (0.0001) nhỏ hơn rất nhiều mức ý nghĩa(0.05), giả thiết rỗng không thể được chấp nhận. vì vậy thông tin công ty đưa ra là không chính xác.