Kiểm Định Tính Phù HợpPhép kiểm định tính phù hợp (Goodness of Fit) được sử dụng để kiểm tra độ phù hợp của dữ liệu mẫu với một phân phối của tập tổng thể. Tập tổng thể có thể có phân phối chuẩn hoặc phân phối Weibull. Nói một cách đơn giản, nó khẳng định rằng dữ liệu mẫu thể hiện độ chính xác của dữ liệu mà chúng ta đang kỳ vọng tìm ra từ tập dữ liệu tổng thể thực tế. Các kiểm thử sau thường được sử dụng bởi các nhà thống kê:
Phép thử Chi bình phương Phép thử Chi bình phương là phép thử hay được sử dụng nhất trong phép kiểm định tính phù hợp và cũng được dùng cho các phân phối rời rạc như phân phối nhị thức và phân phối Poisson, trong khi đó phép thử Kolmogorov-Smirnov và Anderson-Darling dùng để kiểm định tính phù hợp trong trường hợp phân phối liên tục. Công thức \({ X^2 = \sum {[ \frac{(O_i - E_i)^2}{E_i}]} }\) Với
Ví dụ Một công ty đồ chơi làm ra các đồ chơi bóng đá. Công ty đưa ra thông tin rằng 30% lá bài là cầu thủ trung tâm, 60% là cầu thủ phòng ngự và 10% là cầu thủ tấn công. Xét ngẫu nhiên 100 đồ chơi có 50 cầu thủ trung tâm, 45 cầu thủ phòng ngủ và 5 cầu thủ tấn công. Mức ý nghĩa là 0.05, hãy đánh giá thông tin công ty đưa ra. Lời giải: Xác định giả thiết
Xác định bậc tự do Bậc tự do, DF sẽ bằng với số lượng mức của các biến phạm trù trừ đi 1: DF = k 1. Mức trong ví dụ là 3. Vì vậy\({ DF = k - 1 \\[7pt] \, = 3 -1 = 2 }\) Xác định thống kê của phép thử Chi bình phương \({ X^2 = \sum {[ \frac{(O_i - E_i)^2}{E_i}]} \\[7pt] \, = [\frac{(50-30)^2}{30}] + [\frac{(45-60)^2}{60}] + [\frac{(5-10)^2}{10}] \\[7pt] \, = \frac{400}{30} + \frac{225}{60} + \frac{25}{10} \\[7pt] \, = 13.33 + 3.75 + 2.50 \\[7pt] \, = 19.58 }\) Xác định giá trị p Giá trị P là xác suất một thống kê Chi bình phương,\( X^2\)có hai bậc tự do nhiều hơn 19.58. Sử dụng phép tính phân phối Chi bình phương để tìm ra \({ P(X^2 \gt 19.58) = 0.0001 }\). Phân tích kết quả Với giá trị P (0.0001) nhỏ hơn rất nhiều mức ý nghĩa(0.05), giả thiết rỗng không thể được chấp nhận. vì vậy thông tin công ty đưa ra là không chính xác. |