Như chúng ta đều đã biết, phân tích hệ số tương quan pearson là một trong những bước quan trọng trong phân tích định lượng. Ngay sau bước phân tích nhân tố khám phá EFA, việc cần làm tiếp theo chính là tạo biến đại diện cho mỗi nhóm nhân tố và tiến hành phân tích tương quan Pearson. Và để bạn đọc hiểu rõ hơn về khái niệm này, Luận Văn 2S xin gửi đến bạn bài viết về lý thuyết cũng như cách tiến hành phân tích tương quan pearson trong SPSS.
Hệ số tương quan pearson là gì?
Hệ số tương quan Pearson (Pearson correlation coefficient, ký hiệu r) là số liệu thống kê kiểm tra đo lường mối quan hệ thống kê hoặc liên kết giữa các biến phụ thuộc với các biến liên tục. Hệ số tương quan sẽ trả lời cho các câu hỏi chẳng hạn như: Có mối quan hệ tương quan giữa nhiệt độ và doanh thu bán kem?; Có mối quan hệ tương quan giữa sự hài lòng công việc, năng suất và thu nhập? hay Hai biến nào có mối liên hệ chặt chẽ nhất giữa tuổi, chiều cao, cân nặng, quy mô gia đình và thu nhập gia đình?...
Tương quan pearson được biết đến như là phương pháp tốt nhất để đo lường mối liên hệ giữa các biến quan tâm bởi vì nó dựa trên phương pháp hiệp phương sai. Nó cung cấp thông tin về mức độ quan trọng của mối liên hệ, hoặc mối tương quan, cũng như hướng của mối quan hệ. Ngoài ra, việc kiểm tra hệ số tương quan pearson còn giúp chúng ta sớm nhận diễn được sự xảy ra của vấn đề đa cộng tuyến khi các biến độc lập có sự tương quan mạnh với nhau.
Ý nghĩa hệ số tương quan pearson
Hệ số tương quan Pearson (r) có giá trị giao động trong khoảng liên tục từ -1 đến +1:
- r = 0: Hai biến không có tương quan tuyến tính
- r = 1; r = -1: Hai biến có mối tương quan tuyến tính tuyệt đối.
- r < 0: Hệ số tương quan âm. Nghĩa là giá trị biến x tăng thì giá trị biến y giảm và ngược lại, giá trị biến y tăng thì giá trị biến x giảm.
- r > 0: Hệ số tương quan dương. Nghĩa là giá trị biến x tăng thì giá trị biến y tăng và ngược lại, giá trị biến y tăng thì giá trị biến x cũng tăng.
Lưu ý:
- Hệ số tương quan pearson (r) chỉ có ý nghĩa khi và chỉ khi mức ý nghĩa quan sát (sig.) nhỏ hơn mức ý nghĩa α = 5%.
- Nếu r nằm trong khoảng từ 0,50 đến ± 1, thì nó được cho là tương quan mạnh.
- Nếu r nằm trong khoảng từ 0,30 đến ± 0,49, thì nó được gọi là tương quan trung bình.
- Nếu r nằm dưới ± .29, thì nó được gọi là một mối tương quan yếu.
- Trên đồ thị phân tán Scatter, nếu r = -1 dữ liệu sẽ phân bổ trên một đường thẳng với độ dốc âm, r = 1 dữ liệu sẽ phân bổ trên một đường thẳng với độ dốc dương.
Hệ số tương quan biểu thị trên đồ thị phân tán Scatter
Thực hành phân tích hệ số tương quan pearson trong SPSS
Để kiểm định hệ số tương quan pearson trong SPSS. Đầu tiên, tại thanh công cụ ta nhấp chọn: Analyze > Correlate > Bivariate.
Cửa sổ Bivariate Correlations mở ra, nơi bạn sẽ chỉ định các biến được sử dụng trong phân tích. Tất cả các biến trong tập dữ liệu của bạn xuất hiện trong danh sách ở phía bên trái. Để chọn các biến cho phân tích, chọn các biến trong danh sách bên trái và nhấp vào nút mũi tên để di chuyển chúng sang phải, trong trường Variables.
(A) Variables: Các biến được sử dụng trong Tương quan Pearson bivariate. Bạn phải chọn ít nhất hai biến liên tục, nhưng có thể chọn nhiều hơn hai biến. Thử nghiệm sẽ tạo ra các hệ số tương quan cho từng cặp biến trong danh sách này. Lưu ý: Bạn nên sắp xếp biến phụ thuộc nằm trên cùng trong bảng Variables.
(B) Correlation Coefficients: Có nhiều loại hệ số tương quan. Theo mặc định, Pearson được chọn.
(C) Test of Significance: Nhấp vào Two-tailed hoặc One-tailed , tùy thuộc vào thử nghiệm ý nghĩa mong muốn của bạn. SPSS sử dụng thử nghiệm two-tailed theo mặc định.
(D) Flag significant correlations: Kiểm tra tùy chọn này sẽ bao gồm các dấu sao (**) bên cạnh các tương quan có ý nghĩa thống kê trong đầu ra.
Cuối cùng là nhấp OK để xuất kết quả ra output.
Đọc ý nghĩa hệ số tương quan pearson trong SPSS
Đầu tiên, khi nhìn vào bảng kết quả Correlations, chúng ta cần quan tâm đến giá trị sig.
Sig. phải nhỏ hơn α = 0.05 thì tương quan r mới có ý nghĩa.
- Đối với dòng giá trị sig. được tô màu cam: Giá trị nào < 0.05 thì ta kết luận rằng biến độc lập có tương quan tuyến tính với biến phụ thuộc và ngược lại (giá trị nào > 0.05 thì không có sự tương quan giữa biến độc lập và biến phụ thuộc). Lưu ý, chúng ta sẽ dựa trên sự so sánh giá trị sig. với mức ý nghĩa 0.05 để đánh giá sự tương quan giữa cặp biến chứ không loại biến không đạt và chạy lần 2 nhé.
Sau khi đánh giá xong sự tương quan giữa cặp biến, ta sẽ dựa vào giá trị r để đánh giá mức độ tương quan mạnh/ yếu giữa biến phụ thuộc và các biến độc lập theo ý nghĩa hệ số tương quan pearson đã nêu ở phần trên.
- Đối với dòng giá trị sig. được tô màu hồng: Giá trị ở dòng này thể hiện cho sự tương quan giữa các biến độc lập với nhau. Chúng ta cũng xét tương tự như đối với đánh giá sự tương quan giữa biến độc lập và biến phụ thuộc. Tuy nhiên, nếu như r > 0.4 và sig. < 0.05 thì bạn cần lưu ý đến việc xảy ra đa cộng tuyến.
Trên đây là những kiến thức về lý thuyết cũng như cách thực hiện, đọc ý nghĩa hệ số tương quan pearson. Trong quá trình thực hiện, nếu bạn gặp phải khó khăn cần hỗ trợ, hãy liên hệ dịch vụ xử lý số liệu SPSS nhé!
Bài viết cùng chuyên mục:
Cronbach’s Alpha là gì? Phân tích độ tin cậy Cronbach’s Alpha trong SPSS
Bài viết được đăng tải duy nhất và thuộc bản quyền của Phạm Lộc Blog. Việc chia sẻ lại nội dung lên website khác vui lòng dẫn nguồn link bài viết gốc này. Xin cảm ơn!
Việc dịch Tiếng Việt các bảng kết quả trong SPSS đối với một số anh chị/ các bạn làm luận văn là không cần thiết bởi vì có khá nhiều khái niệm, thuật ngữ trong SPSS khi chuyển sang Tiếng Việt khá khó hiểu hoặc không có từ ngữ giải thích chính xác. Đa phần chúng ta đều giữ nguyên ngôn ngữ gốc trong bảng kết quả output để đưa vào bài làm vì nó phổ biến hơn, quen mắt hơn, nhìn vào sẽ nắm được đây là bảng biểu giải thích cho giá trị nào hơn.
Tuy nhiên, đối với một số trường hợp, giảng viên cần một sự thống nhất về ngôn ngữ trong bài nghiên cứu nên chúng ta buộc phải dịch các bảng kết quả SPSS sang Tiếng Viêt. Chính vì vậy, trong bài viết này, mình sẽ gởi tới các bạn phần dịch Tiếng Việt của một số thuật ngữ trong phần kết quả SPSS. Nguồn dịch mình tham khảo từ 2 tài liệu chính và một số bài viết trên Internet:
- Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2
- Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008), Phân tích dữ liệu nghiên cứu với SPSS, NXB Hồng Đức
1. Cronbach Alpha
Reliability Statistics | |
Cronbach's Alpha | N of Items |
.834 | 5 |
- Cronbach's Alpha: Giá trị Cronbach Alpha
- N of Items: Số biến quan sát
Item-Total Statistics | ||||
Scale Mean if Item Deleted | Scale Variance if Item Deleted | Corrected Item-Total Correlation | Cronbach's Alpha if Item Deleted | |
TC1 | 14.33 | 13.228 | .614 | .806 |
TC2 | 14.38 | 13.097 | .645 | .798 |
TC3 | 14.34 | 12.456 | .688 | .785 |
TC4 | 14.39 | 13.396 | .601 | .810 |
TC5 | 14.33 | 12.933 | .622 | .804 |
- Scale Mean if Item Deleted: Trung bình thang đo nếu biến này bị loại bỏ
- Scale Variance if Item Deleted: Phương sai thang đo nếu biến này bị loại bỏ
- Corrected Item-Total Correlation: Tương quan biến - tổng hiệu chỉnh
- Cronbach's Alpha if Item Deleted: Giá trị Cronbach Alpha nếu biến này bị loại bỏ
2. EFA
KMO and Bartlett's Test | ||
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. | .788 | |
Bartlett's Test of Sphericity | Approx. Chi-Square | 3837.226 |
df | 406 | |
Sig. | .000 |
- Kaiser-Meyer-Olkin Measure of Sampling Adequacy: Hệ số KMO
- Bartlett's Test of Sphericity: Kiểm định Barlett
- Approx. Chi-Square: Giá trị Chi bình phương xấp xỉ
Total Variance Explained | |||||||||
Component | Initial Eigenvalues | Extraction Sums of Squared Loadings | Rotation Sums of Squared Loadings | ||||||
Total | % of Variance | Cumulative % | Total | % of Variance | Cumulative % | Total | % of Variance | Cumulative % | |
1 | 3.843 | 16.012 | 16.012 | 3.843 | 16.012 | 16.012 | 2.982 | 12.424 | 12.424 |
2 | 3.226 | 13.441 | 29.452 | 3.226 | 13.441 | 29.452 | 2.782 | 11.594 | 24.018 |
3 | 2.832 | 11.800 | 41.252 | 2.832 | 11.800 | 41.252 | 2.663 | 11.094 | 35.112 |
4 | 1.998 | 8.324 | 49.576 | 1.998 | 8.324 | 49.576 | 2.577 | 10.736 | 45.849 |
5 | 1.694 | 7.058 | 56.634 | 1.694 | 7.058 | 56.634 | 2.299 | 9.580 | 55.428 |
6 | 1.428 | 5.952 | 62.586 | 1.428 | 5.952 | 62.586 | 1.718 | 7.158 | 62.586 |
7 | .844 | 3.515 | 66.101 | ||||||
8 | .806 | 3.360 | 69.461 | ||||||
9 | .752 | 3.133 | 72.594 | ||||||
10 | .698 | 2.909 | 75.502 | ||||||
11 | .641 | 2.670 | 78.172 | ||||||
12 | .574 | 2.391 | 80.563 | ||||||
13 | .524 | 2.185 | 82.748 | ||||||
14 | .511 | 2.128 | 84.875 | ||||||
15 | .497 | 2.069 | 86.944 | ||||||
16 | .449 | 1.872 | 88.816 | ||||||
17 | .432 | 1.800 | 90.617 | ||||||
18 | .423 | 1.763 | 92.379 | ||||||
19 | .398 | 1.658 | 94.037 | ||||||
20 | .341 | 1.419 | 95.456 | ||||||
21 | .314 | 1.308 | 96.764 | ||||||
22 | .281 | 1.171 | 97.935 | ||||||
23 | .257 | 1.072 | 99.006 | ||||||
24 | .238 | .994 | 100.000 | ||||||
Extraction Method: Principal Component Analysis. |
- Total Variance Explained: Tổng phương sai trích
- Component: Nhân tố
- Initial Eigenvalues: Eigenvalues khởi tạo
- Extraction Sums of Squared Loadings:
- Rotation Sums of Squared Loadings:
- Total: Tổng cộng
- % of Variance: Phần trăm của phương sai
- Cumulative %: Phần trăm tích lũy
- Component Matrix: Ma trận nhân tố
- Rotated Component Matrix: Ma trận xoay nhân tố
3. Tương quan Pearson
Correlations | ||||||||
HL | TN | CV | LD | DN | MT | DT | ||
HL | Pearson Correlation | 1 | .439** | .353** | .551** | -.015 | .172* | .611** |
Sig. (2-tailed) | .000 | .000 | .000 | .822 | .011 | .000 | ||
N | 220 | 220 | 220 | 220 | 220 | 220 | 220 | |
TN | Pearson Correlation | .439** | 1 | -.002 | -.008 | .046 | .090 | .180** |
Sig. (2-tailed) | .000 | .978 | .908 | .493 | .184 | .007 | ||
N | 220 | 220 | 220 | 220 | 220 | 220 | 220 | |
CV | Pearson Correlation | .353** | -.002 | 1 | .013 | -.048 | .195** | .028 |
Sig. (2-tailed) | .000 | .978 | .846 | .475 | .004 | .676 | ||
N | 220 | 220 | 220 | 220 | 220 | 220 | 220 | |
LD | Pearson Correlation | .551** | -.008 | .013 | 1 | -.041 | .002 | .422** |
Sig. (2-tailed) | .000 | .908 | .846 | .542 | .978 | .000 | ||
N | 220 | 220 | 220 | 220 | 220 | 220 | 220 | |
DN | Pearson Correlation | -.015 | .046 | -.048 | -.041 | 1 | -.009 | -.012 |
Sig. (2-tailed) | .822 | .493 | .475 | .542 | .894 | .857 | ||
N | 220 | 220 | 220 | 220 | 220 | 220 | 220 | |
MT | Pearson Correlation | .172* | .090 | .195** | .002 | -.009 | 1 | -.010 |
Sig. (2-tailed) | .011 | .184 | .004 | .978 | .894 | .879 | ||
N | 220 | 220 | 220 | 220 | 220 | 220 | 220 | |
DT | Pearson Correlation | .611** | .180** | .028 | .422** | -.012 | -.010 | 1 |
Sig. (2-tailed) | .000 | .007 | .676 | .000 | .857 | .879 | ||
N | 220 | 220 | 220 | 220 | 220 | 220 | 220 | |
**. Correlation is significant at the 0.01 level (2-tailed). | ||||||||
*. Correlation is significant at the 0.05 level (2-tailed). |
- Correlations: Các mối tương quan
- Pearson Correlation: Hệ số tương quan Pearson
- Sig. (2-tailed): Giá trị sig
- N: Số quan sát
4. Hồi quy
Model Summaryb | |||||
Model | R | R Square | Adjusted R Square | Std. Error of the Estimate | Durbin-Watson |
1 | .856a | .733 | .725 | .28801 | 1.999 |
a. Predictors: (Constant), DT, MT, DN, CV, TN, LD | |||||
b. Dependent Variable: HL |
- Model Summary: Tóm tắt mô hình
- Model: Mô hình
- R, R Square, Adjusted R Square: Giá trị R, R bình phương, R bình phương hiệu chỉnh
- Std. Error of the Estimate: Sai số chuẩn của ước lượng
- Durbin-Watson: Giá trị Durbin-Watson
ANOVAa | ||||||
Model | Sum of Squares | df | Mean Square | F | Sig. | |
1 | Regression | 48.443 | 6 | 8.074 | 97.335 | .000b |
Residual | 17.668 | 213 | .083 | |||
Total | 66.111 | 219 | ||||
a. Dependent Variable: HL | ||||||
b. Predictors: (Constant), DT, MT, DN, CV, TN, LD |
- Regression: Hồi quy
- Residual: Phần dư
- Sum of Squares: Tổng các bình phương
- Mean Square: Trung bình bình phương
Coefficientsa | ||||||||
Model | Unstandardized Coefficients | Standardized Coefficients | t | Sig. | Collinearity Statistics | |||
B | Std. Error | Beta | Tolerance | VIF | ||||
1 | (Constant) | -.197 | .195 | -1.010 | .314 | |||
TN | .268 | .026 | .368 | 10.122 | .000 | .948 | 1.055 | |
CV | .225 | .025 | .323 | 8.936 | .000 | .958 | 1.043 | |
LD | .264 | .026 | .394 | 10.031 | .000 | .814 | 1.229 | |
DN | .004 | .027 | .005 | .135 | .893 | .994 | 1.006 | |
MT | .052 | .024 | .079 | 2.164 | .032 | .953 | 1.050 | |
DT | .252 | .027 | .370 | 9.272 | .000 | .787 | 1.271 | |
a. Dependent Variable: HL |
- Constant: Hằng số
- Coefficients: Hệ số hồi quy
- Unstandardized Coefficients: Hệ số hồi quy chưa chuẩn hóa
- Standardized Coefficients: Hệ số hồi quy chuẩn hóa
- Collinearity Statistics: Thống kê đa cộng tuyến
- Std. Error: Sai số chuẩn
- Tolerance: Độ chấp nhận
- VIF: Hệ số phóng đại phương sai