Sd là gì trong thống kê

Độ lệch tiêu chuẩn (standard deviation) là đại lượng thường được sử dụng để phản ánh mức độ phân tán của một biến số xung quanh số bình quân. Nói cách khác, độ lệch chuẩn dùng để đo mức độ phân tán của một tập dữ liệu đã được lập thành bảng tần số. Có thể tính ra độ lệch chuẩn bằng cách lấy căn bậc hai của phương sai. Nó được tính toán từ một mẫu các kết quả quan sát theo công thức:

S = √(∑((Xi - X)²/N-1)

Trong đó Xi là kết quả quan sát thứ i của mẫu, là số bình quân mẫu và N là số các kết quả quan sát. Số bình quân của độ lệch tiêu chuẩn (S2) được gọi là phương sai mẫu.

(Tài liệu tham khảo: Nguyễn Văn Ngọc, Từ điển Kinh tế học, Đại học Kinh tế Quốc dân)

Ý nghĩa của độ lệch tiêu chuẩn

Độ lệch chuẩn đo tính biến động của giá trị mang tính thống kê. Nó cho thấy sự chênh lệch về giá trị của từng thời điểm đánh giá so với giá trị trung bình. Tính biến động cũng như độ lệch chuẩn sẽ cao hơn nếu giá đóng cửa và giá đóng cửa trên trung bình khác nhau đáng kể.

Nếu sự chênh lệch không đáng kể thì độ lệch chuẩn và tính biến động ở mức thấp. Sự đảo chiều xu thế tạo các vùng đáy hoặc đỉnh của thị trường được xác định thời cơ bằng các mức độ biến động cao. Những xu thế mới của giá sau thời kỳ thoái trào của thị trường (tức là giai đoạn điều chỉnh) thường được xác định thời cơ bằng những mức độ biến động thấp. Sự thay đổi đáng kể về dữ liệu giá đem lại giá trị độ lệch chuẩn cao và dữ liệu giá ổn định hình thành độ lệch chuẩn ở mức thấp.

  • Ngày đăng: 8/14/2020
  • |
  • Chuyên mục: SPSS

Bài viết được đăng tải duy nhất và thuộc bản quyền của Phạm Lộc Blog. Việc chia sẻ lại nội dung lên website khác vui lòng dẫn nguồn link bài viết gốc này. Xin cảm ơn!

Độ lệch chuẩn (Standard Deviation) hay độ lệch tiêu chuẩn là một chỉ số dùng để đo mức độ phân tán của một tập dữ liệu quanh giá trị trung bình (Mean). Trong các phần mềm thống kê, độ lệch chuẩn thường được ký hiệu là hoặc S.D hoặc Std. Deviation. 

Sd là gì trong thống kê

Khi thực hiện thống kê mô tả, chúng ta thường thấy xuất hiện giá trị độ lệch chuẩn ở phần bảng output. Vậy thì độ lệch chuẩn ở mức bao nhiêu thì chấp nhận, bao nhiêu thì không chấp nhận? Trước tiên, chúng ta cần hiểu được bản chất của độ lệch chuẩn. Độ lệch chuẩn được tính bằng cách lấy căn bậc hai của phương sai, nó biểu thị sự dao động của dữ liệu quanh giá trị trung bình là rộng hay hẹp. Nếu độ lệch chuẩn cao, đồ thị scatter biểu diễn các điểm giá trị sẽ phân tán ra xa; nếu độ lệch chuẩn thấp, các điểm giá trị sẽ phân bố tập trung quanh đường trung bình.

Sd là gì trong thống kê

Lúc này chúng ta có đại lượng CV là hệ số dao động dữ liệu (Coefficient of Variation). 

CV = (S.D/Mean)

- Nếu CV > 1, độ lệch chuẩn lớn hơn trung bình, điều này chỉ ra rằng dữ liệu dao động rất mạnh, con số trả lời của đáp viên ở biến đó chênh lệch nhau rất nhiều. Ví dụ: một câu hỏi được đo bằng Likert 1-5, thì cùng một câu hỏi đó nhiều người chọn 1,2 và nhiều người chọn 4,5. Chênh lệch điểm trả lời khá lớn, dẫn đến độ lệch chuẩn cao.

- Nếu CV < 1, độ lệch chuẩn nhỏ hơn trung bình, dữ liệu dao động trung bình yếu, con số trả lời của đáp viên chênh lệch thấp. Ví dụ: một câu hỏi được đo bằng Likert 1-5, thì cùng một câu hỏi đó phần lớn đáp viên đều chọn xoay quanh 1,2,3 hoặc xoay quanh 4,5 hoặc xoay quanh 3,4. Sự chênh lệch điểm đánh giá là không cao.

Quay lại với câu hỏi: Độ lệch chuẩn ở mức bao nhiêu thì chấp nhận được? Câu trả lời là không có ngưỡng nào là chấp nhận hay không chấp nhận. Hay nói cách khác, độ lệch chuẩn không có khái niệm là tốt hay xấu. Giá trị này chỉ chỉ ra cho bạn thấy mức độ dàn trải của dữ liệu là ít hay nhiều. Còn đánh giá là tốt hay xấu nó sẽ phụ thuộc vào sự kỳ vọng của bạn. Lấy ví dụ một câu hỏi đo theo Likert 5 mức độ đồng ý.

  • Với câu hỏi đó, bạn kỳ vọng sự ổn định từ đáp án người trả lời, bạn hy vọng rằng đáp viên sẽ cho điểm rơi nhiều vào 3,4,5 (nhánh đồng ý) thay vì tỷ lệ chọn 1,2,3,4,5 ngang nhau không rõ ràng. Lúc này cùng 1 câu hỏi, cùng một nhóm đối tượng, các thông tin nhân khẩu học khá tương đồng nhau, nhưng người A cho điểm rất cao, người B lại cho điểm rất thấp. Điều này dẫn đến độ lệch chuẩn của câu hỏi cao, khác xa với kỳ vọng của bạn hoặc lý thuyết bạn nghiên cứu, do đó độ lệch chuẩn cao trong trường hợp này là xấu.
  • Cũng với câu hỏi đó, bạn muốn xem xét sự khác nhau về hành vi của đáp viên do họ có đặc điểm nhân khẩu học khác nhau. Bạn kỳ vọng đáp án sẽ có sự chênh lệch mạnh (sự kỳ vọng này đến từ lý thuyết hoặc nghiên cứu định tính bạn đã làm trước đó) để có sự khác biệt hành vi của đáp viên với các đặc điểm nhân khẩu học khác nhau dựa trên các thông tin bạn đã thu thập được. Nhưng lúc này đáp viên chỉ trả lời thiên về một nhánh toàn 3,4,5, mức điểm đều đều. Trường hợp này, độ lệch chuẩn thấp khác xa với kỳ vọng, nó là xấu.

Nếu bạn đang gặp khó khăn trong xử lý dữ liệu trên SPSS do dữ liệu xấu, vi phạm các ngưỡng kiểm định. Bạn có thể tham khảo dịch vụ hỗ trợ SPSS của Phạm Lộc Blog để có được kết quả tốt nhất và tối ưu về thời gian nhất.

Phương sai và độ lệch chuẩn là những kiến thức toán học đại số khá quan trọng và thú vị, được ứng dụng nhiều trong công việc thống kê các con số. Vậy Phương sai và độ lệch chuẩn là gì? Tính toán phương sai và độ lệch chuẩn như thế nào? Hãy cùng DINHNGHIA.VN tìm hiểu và tổng hợp kiến thức nhé!

Phương sai là gì? Cách tính phương sai

Phương sai là gì?

Phương sai của một bảng số liệu là số đặc trưng cho độ phân tán của các số liệu trong tập dữ liệu so với giá trị trung bình. Bộ số liệu có giá trị phương sai nhỏ là bộ số liệu có các giá trị gần với giá trị trung bình.

Cách tính phương sai

Phương sai của bảng thống kê dấu hiệu x, kí hiệu là \(s_{{x}^{2}}\). Công thức tính phương sai như sau:

  • Đối với bảng phân bố rời rạc

\(n_{1}+n_{2}+…+n_{n}=n\)

\(S_{x}^{2}=\frac{1}{n}[n_{1}(x_{1}-\bar{x})^{2}+n_{2}((x_{2}-\bar{x})^{2}+…+n_{k}((x_{k}-\bar{x})^{2}]\)

 =\(\frac{1}{n}(n_{1}x_{1}^{2}+n_{2}x_{2}^{2}+…+n_{k}x_{1}^{2})-(\bar{x})^{2}\)

Với \(\bar{x}\) là số trung bình của bảng số liệu.

      n là số các số liệu thống kê

  • Đối với phân bố tần số ghép lớp

\(S_{x}^{2}=\frac{1}{n}[n_{1}(C_{1}-\bar{x})^{2}+n_{2}((C_{2}-\bar{x})^{2}+…+n_{k}((C_{k}-\bar{x})^{2}]\)

Với \(C_{i}(i=1,2,…,k)\) là giá trị trung tâm của lớp thứ i

      \(\bar{x}\) là số trung bình của bảng số liệu.

Nhận xét:

Có thể viết gọn các công thức về phương sai nhờ ký hiệu \(\sum\) như dưới đây:

\(S_{x}^{2}=\frac{1}{n}\sum_{i=1}^{k}n_{i}(x_{i}-\bar{x})^{2}=\sum_{i=1}^{n}f_{i}(x_{i}-\bar{x})^{2}=\frac{1}{n}\sum_{i=1}^{k}n_{i}x_{i}^{2}-(\bar{x})^{2}=\sum_{i=1}^{k}f_{i}x_{i}^{2}-(\bar{x})^{2}\)

Độ lệch chuẩn là gì? Các bước tính độ lệch chuẩn

Độ lệch chuẩn hay độ lệch tiêu chuẩn (Standard Deviation)

Là giá trị chênh lệch trong tập dữ liệu so với giá trị trung bình đã tính ra .

Căn bậc hai của phương sai một bảng số liệu được gọi là độ lệch chuẩn của bảng số liệu đó.

Độ lệch chuẩn của dấu hiệu x, ký hiệu: \(S_{x}\)

  • Nếu độ lệch chuẩn bằng 0, suy ra phương sai bằng 0, suy ra các giá trị quan sát cũng chính là giá trị trung bình. Nói cách khác là không có sự biến thiên.
  • Nếu độ lệch chuẩn càng lớn, suy ra  sự biến thiên xung quanh giá trị trung bình càng lớn.

Phương sai cùng độ lệch chuẩn đều dùng để đánh giá mức độ phân tán của các số liệu thống kê (so với giá trị trung bình). Nhưng khi cần chú ý đến đơn vị đo, ta dùng độ lệch chuẩn vì độ lệch chuẩn cùng đơn vị đo với dấu hiệu được nghiên cứu.

Sd là gì trong thống kê

Công thức tính phương sai và độ lệch chuẩn

Công thức tính:

\(S_{x}=\sqrt{S_{x}^{2}}\)

Để tính độ lệch chuẩn ta cần xác định giá trị sau:

– Giá trị trung bình

– Phương sai của tập số liệu.

Suy ra

Các bước tính độ lệch chuẩn:

Bước 1: Tính giá trị trung bình của bộ số liệu:

Giá trị trung bình bằng trung bình cộng các giá trị của tất cả bộ số liệu hay chính bằng tổng các giá trị trong bộ số liệu chia cho tổng số các giá trị có trong bộ số liệu.

Bước 2: Tính phương sai của bộ số liệu:

Phương sai là giá trị đặc trưng cho độ phân tán (biến thiên) của các số liệu trong bộ số  liệu so với giá trị trung bình của bộ số liệu.

Công thức tính phương sai

\(S^{2}=\frac{\sum_{i}^{n}(X_{i}-\bar{X})^{2}}{n-1}\)

Trong đó:

n là số phần tử của tập số liệu

\(\bar{X}\) là giá trị trung bình của bộ số liệu

\(x_{i}\) là các giá trị của bộ số liệu.

Bước 3: Tính độ lệch chuẩn

Sử dụng công thức Độ lệch chuẩn bằng căn bậc hai của giá trị phương sai để tính được ở bước 2

Tính phương sai và độ lệch chuẩn bằng máy tính

Để giải quyết các bài toán về phương sai cũng như độ lệch chuẩn một cách dễ dàng và hiệu quả hơn, ta có thể sử dụng máy tính bỏ túi để hỗ trợ tính toán:

Sd là gì trong thống kê

Ứng dụng của phương sai và độ lệch chuẩn

Độ lệch chuẩn có ứng dụng khá hay đó là giúp chuẩn hóa giá trị của hai dãy số khác nhau về cùng một miền dữ liệu.

Ngoài ra, phương sai cùng độ lệch chuẩn còn được áp dụng nhiều trong giải quyết các công việc thực tế như: phương sai cùng độ lệch chuẩn trong xác suất thống kê, phương sai hay độ lệch chuẩn trong thống kê, phương sai cùng độ lệch chuẩn trong tài chính…

Trên đây là tổng hợp kiến thức về chuyên đề phương sai với độ lệch chuẩn, hy vọng hữu ích với bạn trong quá trình tìm tòi và học tập của bản thân. Nếu có bất cứ thắc mắc hay đóng góp gì cho bài viết phương sai và độ lệch chuẩn, mời bạn để lại ở nhận xét bên dưới. Chúc bạn luôn học tập tốt!

Xem chi tiết qua bài giảng dưới đây nhé:


(Nguồn: www.youtube.com)

Xem thêm:

Please follow and like us:

Sd là gì trong thống kê

Sd là gì trong thống kê