Tham số tổng thể là gì

(Nội dung phần này được trích từ giáo trình XSTK của Dự án Đào tạo giáo viên THCS tác giả Nguyễn Đình Hiển NXB Đại học Sư Phạm Hà Nội)

Sau khi lấy mẫu và tính một số thống kê ta phải dùng các thống kê để ước lượng các tham số của tổng thể. Có 2 cách tiếp cận:

1. Ước lượng điểm: Giả sử tổng thể có tham số Θ, sau khi khảo sát mẫu ta tính được các thống kê, dựa vào các thống kê để đưa ra 1 số T thay thế Θ gọi là ước lượng điểm của Θ.

  • Không chệch: hiểu 1 cách đơn giản là ước lượng không chứa sai số hệ thống, tức là không thiên về phía đưa ra các giá trị bé hơn Θ hoặc không thiên về phía đưa ra các giá trị lớn hơn Θ.
  • Hiệu quả: trong các ước lượng có cùng tính chất, chọn ước lượng có phương sai nhỏ nhất.
  • Vững: khi tăng dung lượng mẫu n lên vô hạn thì ước lượng sẽ dần đến Θ (dần đến theo xác suất).
  • Chắc hay bền: không thay đổi nhiều khi trong mẫu có các số liệu quá nhỏ hay quá lớn.

Nếu không thể chọn ước lượng tốt trên mọi phương diện thì, tùy theo mục đích, có thể chọn ước lượng thỏa mãn 1 số tiêu chuẩn trong rất nhiều tiêu chuẩn đưa ra.

Ví dụ:

  • Khi có phân phối chuẩn N(μ;σ2) thì ước lượng trên nhiều mặt là trung bình cộng và phương sai mẫu σ2
  • Khi có phân phối nhị thức B(n,p) thì ước lượng tốt của tham số p là tần suất.

2. Ước lượng khoảng: Đây là cách tiếp cận có nhiều ứng dụng trong các ngành khoa học đòi hỏi phải thường xuyên xử lí số liệu như sinh học, y học, hóa học, kinh tế Theo cách tiếp cận này sau khi tính các thống kê của mẫu quan sát, ta đưa ra khoảng [a;b] chứa tham số Θ . Cận dưới a và cận trên b tính theo 1 quy tắc cụ thể dựa trên các thống kê và dựa trên mức độ tin cậy P.

Sau khi chọn mẫu, ta đưa ra khoảng tin cậy [a; b], nếu Θ ở trong [a; b] thì khoảng tin cậy đưa ra đúng, nếu Θ ở ngoài khoảng [a; b], thì khoảng tin cậy đưa ra sai. Như vậy mỗi khoảng tin cậy chỉ có thể đúng hoặc sai, xác suất đúng là P, xác suất sai a = 1 P, hiểu đơn giản là nếu tính khoảng tin cậy theo quy tắc đã đưa ra thì trung bình trong 100 trường hợp, P.100 trường hợp có khoảng tin cậy đúng.

Không đi sâu vào lý thuyết, ta đưa ra quy tắc ước lượng tham số cho ba trường hợp:

2.1. Ước lượng kỳ vọngμ của phân phối chuẩn khi biết phương sai σ2

Các bước cần làm để ước lượng μ:

+ Chọn mẫu kích thước n, tính trung bình cộng . Chọn mức tin cậyγ (α = 1 γ gọi là mức sai cho phép hay mức ý nghĩa).

+ Dùng bảng tích phân hàm Laplace để tính giá trị tới hạn , tức là giá trị u sao cho:

+ Ước lượng m theo bất đẳng thức kép:

(1)

Lưu ý: nếu hàm phân phối chuẩn là thì tính , tức là giá trị u sao cho: . Giá trị này ở 1 số sách còn được cho bởi bảng phân vị chuẩn

Ví dụ: Cân 36 con gà được trọng lượng trung bình . Hãy ước lượng kỳ vọngμ ở mức tin cậy 99% nếu trọng lượng gà phân phối chuẩn N(μ; 0,09)

Giải:

Với mức tin cậy 99%:

(Hoặc: Tra bảng phân vị chuẩn

Ta có khoảng ước lượng trung bình:

Hay:

Ví dụ 2: Phân tích vitamin C của 17 mẫu được . Với mức tin cậy 95%, hạy ước lượng kỳ vọngμ nếu lượng vitamin phân phối chuẩn N(μ;σ2) vớiσ = 3,98 mg

Với mức tin cậy 95%:

(Hoặc: Tra bảng phân vị chuẩn

Khi đó khoảng ước lượng hàm lượng vitamin trung bình là:

Hay:

2. Ước lượng kỳ vọng của phân phối chuẩn khi không biết phương sai:

TH1: Khi n đủ lớn (n > 30): thayσ ở công thức (1) bằng độ lệch chuẩn hiệu chỉnh s.

TH2: Khi n < 30

Các bước cần làm để ước lượng m:

+ Chọn mẫu kích thước n, tính trung bình cộng . Tính phương sai mẫu

+ Dùng bảng phân phối Student, tính giá trị tới hạn , tức là giá trị t ở cột α, dòng n 1

+ Ước lượng m theo bất đẳng thức kép:

(2)

Ví dụ: Để ước lượng năng suất một giống ngô, người ta theo dõi 25 mảnh ruộng. Sau khi thu hoạch được (đơn vị tạ/ha). Giả thiết năng suất ngô phân phối chuẩn. Mức tin cậy P = 0,95.

Ta có: . Tra bảng phân phối Student ta được: t(24; 0,05) = 2,064

Vậy khoảng ước lượng năng suất trung bình của giống ngô:

Hay:

3. Ước lượng xác suất p của phân phối nhị thức:

Một tổng thể gồm 2 loại cá thể với số lượng rất lớn, tỉ lệ loại A là p (chưa biết). Lấy ngẫu nhiên 1 cá thể, có thể coi xác suất được các thể loại A là p. Lấy ngẫu nhiên n cá thể, trong đó có m cá thể loại A.

Nếu n lớn (n > 100):

+ Lấy mẫu kích thước n, đếm tần số (m) xuất hiện cá thể loại A, tính tần suất

+ Dùng bảng tích phân hàm Laplace để tính giá trị tới hạn , tức là giá trị u sao cho:

+ Ước lượng m theo bất đẳng thức kép:

(3)

4. Tính kích thước mẫu khi ước lượng trung bình:

Theo (1), nửa chiều dài khoảng ước lượng:. Nếu muốn ước lượng đạt độ chính xácε thì phải lấy L ε. Từ đó:

5. Tính kích thước mẫu khi ước lượng xác suất p:

Theo (3), nửa chiều dài khoảng ước lượng . Từ đó: . Hay: do