Kiểm định giả thuyết về so sánh 2 trung bình

Công thức : Kiểm định giả thuyết thống kê.I – Kiểm định tham số:1/ Kiểm định giả thiết về giá trị trung bình:a) Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối theo quyluật chuẩn N (µ,δ2) khi đã biết phương sai DX = δ2.H0 : µ = µ0 (EX = µ0)Kiểm định với giá trị cho trước của α:Giả thiếtH0 : (µ = µ0)Miền bác bỏ khi δ2 đã biết=H : (µ < µ0)H0 : (µ = µ0)=H : (µ > µ0)H0 : (µ = µ0)=H : (µ ≠ µ0)So sánh u với S kết luận:- Nếu u thuộc S thì bác bỏ H0, thừa nhận H.- Nếu u không thuộc S thì chưa có cơ sở để bác bỏ H0.1b) Kiểm định giả thiết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn khichưa biết phương sai.H0 : µ = µ0 (EX = µ0)T=Giả thiếtH0 : (µ = µ0)Miền bác bỏ khi δ2 chưa biết=H : (µ < µ0)H0 : (µ = µ0)=H : (µ > µ0)H0 : (µ = µ0)=H : (µ ≠ µ0)So sánh T với S kết luận:- Nếu T thuộc S thì bác bỏ H0, thừa nhận H.- Nếu T không thuộc S thì chưa có cơ sở để bác bỏ H0.c) Nếu DX chưa biết, giả thiết X chuẩn không có, nhưng n > 30:H0 : µ = µ02Miền bác bỏ khi δ2 chưa biết, giảGiả thiếtthiết chuẩn không có, n > 30=H0 : (µ = µ0)H : (µ < µ0)H0 : (µ = µ0)=H : (µ > µ0)H0 : (µ = µ0)=H : (µ ≠ µ0)Bài tập tham khảo:Để xác định chiều cao của các em lứa tuổi lên 10 ở nông thôn vùng đồng bằngBắc Bộ người ta lấy ra một mẫu đại diện với các kết quả như sau:Khoảng chiều< 130[130;135) [135;140)[140;145)cao X (cm)Số em5153020Giả sử chiều cao X tuân theo luật phân phối chuẩn với DX = 9.≥ 1455Từ ước lượng điểm nhận được, có thể kết luận chiều cao trung bình của các emlứa tuổi lên 10 ở nông thôn ĐBBB cao hơn 137cm; cao hơn 137,5cm được không(xét với mức ý nghĩa α = 0,05).Giải:Với DX = 9= δ2. Bài toán quan tâm đến chiều cao trung bình. Nên đây là bài toánkiểm định về giá trị trung bình EXGọi X là chiều cao trung bình của các em lứa tuổi lên 10 ở ĐBBB: X ~ N(µ,δ2).Từ số liệu đã cho ta tính được: n = 75 ; =137,83;3Theo yêu cầu bài toán ta phải kiểm định cặp giả thiết sau đây:H0 : µ = 137 / H : µ > 137Khi đó miền bác bỏ để kiểm định cặp giả thiết trên là:=vớiTa có : U ==2,396Tra bảng ta được u (0,05) = 1,65Vì U > u (0,05), suy ra U thuộc S2. Bác bỏ giả thiết H0, chấp nhận đối thiết H.Theo yêu cầu bài toán ta phải kiểm định cặp giả thiết sau đây:H0 : µ = 137 / H : µ > 137,5Khi đó miền bác bỏ để kiểm định cặp giả thiết trên là:=vớiTa có U = 0.953 < u (0.05) = 1.65. suy ra U không thuộc S2. Chưa có cơ cở để bácbỏ giả thiết H0.Vậy …2/ Kiểm định giả thuyết về hai kỳ vọng toán của hai biến ngẫu nhiên phânphối chuẩn. ( so sánh 2 giá trị trung bình).;4a) Nếu đã biết các phương saicủa các biến ngẫu nhiên góc trong tổng thểvà từ hai tổng thể trên có thể rút ra hai mẫu độc lập kích thướcU=Giả thiếtMiền bác bỏ khichưa biết==b) Nếu chưa biết các phương saicủa các biến ngẫu nhiên gốc trong tổngthể song giả định rằng chúng bằng nhau ().T =5Giả thiếtMiền bác bỏ khichưa biếtnhưng giả định=c) Nếu chưa biết các phương saichúng bằng nhauU=của các tổng thể và không thể cho rằngvà.hay U =Giả thiếtMiền bác bỏ khichưa biếtVà=6Bài tập tham khảo:Để đánh giá kết quả học tập môn Văn và Toán của hai trường A, B khối lớp 9,người ta lấy ra 2 mẫu đại diện từ kết quả thi kiểm tra chất lượng do Huyện tổchức:Trường A: n1 = 80;Trường B:= 100;= 6,5;= 7,0;= 10= 1,2Giả sử điểm thi X,Y của 2 trường đều có phân phối chuẩn và DX = DYa)Với mức ý nghĩa α = 0.05 có thể kết luận trường B có kết quả thi tốt hơn trườngA hay không?b)Với độ tin cậy 95% có thể nói điểm trung bình trường A cao nhất là bao nhiêu,trường B thấp nhất là bao nhiêu?Giảia) Gọi X là điểm thi của trường A: X ~ N.Y là điểm thi của trường B:;là điểm trung bình của 2 trường tương ứng.;là độ biến động của điểm thi.7Vì giả thiết cho điểm thi X,Y của 2 trường đều có phân phối chuẩn và DX =DY./Nên ta có miền tiêu chuẩn là:Với: T =Tính giá trị:T== -2,97Tra bảng ta được t( 80 +100 -2)(0,05) = t178(0,05) =1,66 hay -t178(0,05) = -1,66.Vì T < -t178(0,05), nên bác bỏ giả thiết H0.Vậy có thể kết luận trường B có kết quả thi tốt hơn trường A.b) Vì DX, DY chưa biết; X,Y có phân phối chuẩn.\Tra bảng ta được:t(80-1)(0,05/2) = t79(0,025) = 1,99; t99(0,025) = 1,98.Khoảng tin cậy tối đa:8µA ==6,724Khoảng tin cậy tối thiểu:µB = 7 – 1,98.= 6,7615/ Kiểm định giả thiết về tỷ lệ:Kiểm định giả thiết về tham số p của biến ngẫu nhiên phân phối chuẩn không –một.:p=HayGiả thiết:p=Miền bác bỏ=:p=:p=9- Chú ý : Xong để tính trường hợp này thì n và p phải thỏa mãn điều kiện:6/ Kiểm định giả thiết về hai tham số p của hai biến ngẫu nhiên phân phối(so sánh hai tỷ lệ - hai xác suất):Với;Giả thiếtMiền bác bỏ với n1,n2 > 30=7/ Tiêu chuẩn phù hợp X2:Cho trước k tỷ lệ : p1,p2,…pk.Thực hiện n quan sát về bnn X10H0 : số liệu mẫu phù hợp với k tỷ lệ cho trướcH1 : số liệu mẫu không phù hợp với k tỷ lệ cho trước.-Xác định các tần số m1, m2,…mk tương ứng với các tỷ lệ p1,p2,…pk.-Tính giá trịMiền tiêu chuẩn :II – Kiểm định phi tham số:( kiểm tra tính độc lập)1/ Kiểm định khi bình phương:a) Kiểm định giả thuyết về tính độc lập của hai dấu hiệu định tính:H0 : A và B độc lập với nhauH: A và B phụ thuộc lẫn nhauVới mức ý nghĩa α miền bác bỏ của H0 là:b) So sánh nhiều tỷ lệ (H0: p1=p2=…=ps (s ≥ 2)H : Các tỷ lệ không như nhauVới mức ý nghĩa α miền bác bỏ của H0 là:1112

Trong phần này, chúng ta sẽ kiểm tra xem trung bình điểm toán của học sinh nữ và nam có khác nhau không, nam hay nữ học giỏi toán hơn ?

Phát biểu giả thuyết thống kê: 

Kiểm định giả thuyết về so sánh 2 trung bình
 trong đó 
Kiểm định giả thuyết về so sánh 2 trung bình
  lần lượt là trung bình điểm toán cho tổng thể nữ và nam.

Bước 1:  Trên thanh công cụ, chọn Analyze > Compare Means > Independent-Sample T Test...

Bước 2: Đưa biến T1 vào ô Test Variable(s), và đưa biến GT vào ô Grouping Variable, điều chỉnh độ tin cậy trong phần Options

Bước 3: Nhấn nút Define Groups. Vì biến GT ta ghi nhận hai giá trị là F cho nữ và M cho nam, nên để phân biệt hai tổng thể nam và nữ ta sẽ nhập vào ô Group 1 là F Group 2 là M (ta cũng có thể đặt Group 1 là M và Group 2 là F). Sau đó bấm Continue.

Cuối cùng bấm Ok, và kết quả như sau:


Giá trị p-value cho cả hai trường hợp phương sai hai tổng thể bằng nhau và không bằng nhau đều là 0.15 < 0.05, nên ta sẽ bác bỏ giả thiết 

Kiểm định giả thuyết về so sánh 2 trung bình
 tại mức ý nghĩa 5%

Bây giờ ta kiểm định giả thuyết 

Kiểm định giả thuyết về so sánh 2 trung bình

SPSS không hỗ trợ kiểm định giả thuyết 1 phía, nhưng chúng ta vẫn có tra bảng để tìm giá trị t tới hạn và so sánh với giá trị t để xem chúng ta sẽ chấp nhận hay bác bỏ giả thuyết nào.

* Trường hợp phương sai bằng nhau: df=98

Ta có giá trị tới hạn 

Kiểm định giả thuyết về so sánh 2 trung bình
=1.660551 > t = 1.451 nên ta bác bỏ giả thuyết 
Kiểm định giả thuyết về so sánh 2 trung bình
 tại mức ý nghĩa 5%. 

(Giá trị tới hạn được tính bằng lệnh  qt(df=98,0.95) trong phần mềm R, hoặc dùng bảng tra)

*Trường hợp phương sai khác nhau: df= 97.105

Ta có giá trị tới hạn 

Kiểm định giả thuyết về so sánh 2 trung bình
=1.660697 > t = 1.450 nên ta bác bỏ giả thuyết 
Kiểm định giả thuyết về so sánh 2 trung bình
 tại mức ý nghĩa 5%. 

(Giá trị tới hạn được tính bằng lệnh qt(df=97.105,0.95) trong phần mềm R, hoặc dùng bảng tra với độ tin cậy 97)

Kiểm định giả thuyết 

Kiểm định giả thuyết về so sánh 2 trung bình

* Trường hợp phương sai bằng nhau: df=98

Ta có giá trị tới hạn -

Kiểm định giả thuyết về so sánh 2 trung bình
=-1.660551 < t = 1.451 nên ta chấp nhận giả thuyết 
Kiểm định giả thuyết về so sánh 2 trung bình
 tại mức ý nghĩa 5%. 

(Giá trị tới hạn được tính bằng lệnh  qt(df=98,0.95) trong phần mềm R, hoặc dùng bảng tra)

*Trường hợp phương sai khác nhaudf= 97.105

Ta có giá trị tới hạn -

Kiểm định giả thuyết về so sánh 2 trung bình
=-1.660697 < t = 1.450 nên ta chấp nhận giả thuyết 
Kiểm định giả thuyết về so sánh 2 trung bình
 tại mức ý nghĩa 5%. 

(Giá trị tới hạn được tính bằng lệnh qt(df=97.105,0.95)trong phần mềm R, hoặc dùng bảng tra với độ tin cậy 97)