Hồi quy đa biến trong SPSS là chỉ số cực kỳ quan trọng khi kiểm định mô hình nghiên cứu trong các bài luận văn, nghiên cứu,… Hãy cùng chúng tôi tìm hiểu khái niệm và cách phân tích hồi quy đa biến trong SPSS đơn giản và dễ áp dụng thực hành nhất.
Phân tích hồi quy đa biến trong SPSS đơn giản nhất
1. Hồi quy đa biến là gì?
1.1. Định nghĩa hồi quy đa biến
Mô hình hồi quy tuyến tính đơn biến dùng để xem xét mối quan hệ tuyến tính giữa biến phụ thuộc y (biến kết cục) và biến độc lập x (biến dự đoán).
Hồi quy đa biến là một phần mở rộng của hồi quy tuyến tính đơn giản. Nó được sử dụng khi chúng ta muốn dự đoán giá trị của một biến dựa trên giá trị của hai hoặc nhiều biến khác.
Xem thêm: Review giá phần mềm quản lý bán hàng tốt nhất hiện nay
1.2. Mô hình hồi quy đa biến trong SPSS
Hàm hồi quy tổng thể ngẫu nhiên với k biến có thể được biểu diễn như sau:
Yt = β1 + β2X2t +…+ βkXkt + ut t=1,2,3,…,n
Trong đó:
β1: Hệ số cắt
β2,…,βk: Hệ số quy hồi riêng
ut: Hạng nhiễu ngẫu nhiên
t: quan sát thứ t
n: Quy mô toàn bộ của tổng thể
Ta thấy phương trình (2.26) gồm hai thành phần. Một là, thành phần xác định E(Yt / X2t,X3t,…,Xkt), thành phần này cho biết giá trị trung bình có điều kiện của Y theo các giá trị cho trước của các X. Hai là, thành phần ngẫu nhiên ut, đây là thành phần đại diện cho tất cả các yếu tố khác có ảnh hưởng lên Yt ngoài các biến X2t,X3t,…,Xkt.
1.3. Chỉ số hồi quy đa biến
-
Hệ số tương quan R (coefficient of correlation): yếu tố nào có R càng lớn thì ảnh hưởng càng nhiều
-
Bình phương của R (R square): yếu tố nào có R2 càng lớn thì mối quan hệ giữa yếu tố đó và biến y càng chặt chẽ.
-
Hệ số hồi quy (regression coefficient): yếu tố nào có cao thì ảnh hưởng nhiều hơn, tuy nhiên các yếu tố có đơn vị khác nhau (tuổi, mmol/L, mmHg….) nên không thể so sánh mức ảnh hưởng giữa các yếu tố.
-
Trị số p (p value): càng nhỏ mức ảnh hưởng càng mạnh.
SPSS là một trong những phần mềm ưu việt được sinh viên đại học ưa chuộng nhất khi thực hiện kiểm định mô hình trong các bài luận văn. Nếu bạn cũng đang gặp tình trạng khó khăn khi tự chạy SPSS, thì hãy tham khảo ngay dịch vụ chạy SPSS thuê để được chúng tôi hỗ trợ tận tình và chu đáo.
2.Các bước chi tiết chạy hồi quy đa biến trong SPSS
Bước 1: Analyze > Regression > Linear…
Bước 2: Đưa biến phụ thuộc vào ô Dependent, các biến độc lập vào ô Independents.
Bước 3: Vào mục Statistics, tích chọn các mục như trong ảnh và chọn Continue.
Bước 4: Vào mục Plots, tích chọn vào Histogram và Normal probability plot, kéo biến ZRESID thả vào ô Y, kéo biến ZPRED thả vào ô X như hình bên dưới. Tiếp tục chọn Continue.
Bước 5: Các mục còn lại chúng ta sẽ để mặc định. Quay lại giao diện ban đầu, mục Method là các phương pháp đưa biến vào, tùy vào dạng nghiên cứu mà chúng ta sẽ chọn Enter hoặc Stepwise sau đó chọn OK.
3. Cách đọc kết quả trong SPSS
3.1. Bảng ANOVA
Bảng ANOVA đánh giá độ phù hợp mô hình thông qua kiểm định giả thuyết.
Đầu tiên, đặt giả thuyết H0: R2 = 0. Phép kiểm định F được sử dụng để kiểm định giả thuyết này. Kết quả kiểm định:
-
Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là R2 ≠ 0 một cách có ý nghĩa thống kê, mô hình hồi quy là phù hợp.
-
Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là R2 = 0 một cách có ý nghĩa thống kê, mô hình hồi quy không phù hợp.
Trong SPSS, các số liệu của kiểm định F được lấy từ bảng phân tích phương sai ANOVA.
Bảng ANOVA
Bảng ANOVA cho chúng ta kết quả kiểm định F để đánh giá giả thuyết sự phù hợp của mô hình hồi quy. Giá trị sig kiểm định F bằng 0.000 < 0.05, do đó, mô hình hồi quy là phù hợp.
Nếu bạn đang vật lộn khi tìm hiểu quy trình thực hiện phân tích SPSS từ A-Z chuyên nghiệp nhất cho bài luận của mình thì hãy tham khảo bài tổng hợp hướng dẫn cách phân tích SPSS đầy đủ và dễ hiểu nhất của chúng tôi.
3.2. Bảng Model summary
Một thước đo sự phù hợp của mô hình hồi quy tuyến tính thường dùng là hệ số xác định R2 (R square) trong bảng Model Summary. Trong SPSS, bên cạnh chỉ số R2, chúng ta còn có thêm chỉ số R2 Adjusted (R2 hiệu chỉnh). Chỉ số R2 hiệu chỉnh không nhất thiết tăng lên khi nhiều biến độc lập được thêm vào hồi quy, do đó R2 hiệu chỉnh phản ánh độ phù hợp của mô hình chính xác hơn hệ số R2.
R2 hay R2 hiệu chỉnh đều có mức dao động trong đoạn từ 0 đến 1. Nếu R2 càng tiến về 1, các biến độc lập giải thích càng nhiều cho biến phụ thuộc, và ngược lại, R2 càng tiến về 0, các biến độc lập giải thích càng ít cho biến phụ thuộc.
Bảng Model Summary
Ví dụ
Bảng Model Summary cho chúng ta kết quả R bình phương (R Square) và R bình phương hiệu chỉnh (Adjusted R Square) để đánh giá mức độ phù hợp của mô hình. Giá trị R bình phương hiệu chỉnh bằng 0.393 cho thấy các biến độc lập đưa vào phân tích hồi quy ảnh hưởng 39.3% sự biến thiên của biến phụ thuộc, còn lại 60.7% là do các biến ngoài mô hình và sai số ngẫu nhiên.
3.3. Bảng coefficients
Kiểm định T (student)
Trong SPSS đánh giá hệ số hồi quy của mỗi biến độc lập có ý nghĩa dựa vào kiểm định t (student) với giả thuyết H0: Hệ số hồi quy của biến độc lập Xi bằng 0.
Kết quả kiểm định:
-
Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi khác 0 một cách có ý nghĩa thống kê, biến X1 có tác động lên biến phụ thuộc.
-
Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi bằng 0 một cách có ý nghĩa thống kê, biến Xi không tác động lên biến phụ thuộc.
Trong hồi quy, thường chúng ta sẽ có hai hệ số hồi quy: chưa chuẩn hóa (trong SPSS gọi là B) và đã chuẩn hóa (trong SPSS gọi là Beta). Nếu hệ số hồi quy (B hoặc Beta) mang dấu âm, nghĩa là biến độc lập đó tác động nghịch chiều lên biến phụ thuộc.
Nếu hệ số hồi quy (B hoặc Beta) mang dấu âm, nghĩa là biến độc lập đó tác động nghịch chiều lên biến phụ thuộc. Khi xem xét mức độ tác động giữa các biến độc lập lên biến phụ thuộc, chúng ta sẽ dựa vào trị tuyệt đối hệ số Beta, trị tuyệt đối Beta càng lớn, biến độc lập tác động càng mạnh lên biến phụ thuộc.
Ví dụ
Các biến gồm ATT1, ATT2, ATT3, ATT4, ATT5 đều có sig kiểm định t nhỏ hơn 0.05, do đó các biến này đều có ý nghĩa thống kê, đều tác động lên biến phụ thuộc IN.
Bảng Coefficients
Chỉ số VIF
Bên cạnh đánh giá giả thuyết ý nghĩa hệ số hồi quy qua kiểm định t, chỉ số VIF trong bảng Coefficients còn dùng để đánh giá đa cộng tuyến và các hệ số hồi quy.
Tính chất VIF:
VIF càng nhỏ, càng ít khả năng xảy ra đa cộng tuyến. Hair và cộng sự (2009) cho rằng, ngưỡng VIF từ 10 trở lên sẽ xảy ra đa cộng tuyến mạnh. Nhà nghiên cứu nên cố gắng để VIF ở mức thấp nhất có thể, bởi thậm chí ở mức VIF bằng 5, bằng 3 đã có thể xảy ra đa cộng tuyến nghiêm trọng.
Ví dụ
Hệ số VIF của các biến độc lập đều nhỏ hơn 10 nên không xảy ra đa cộng tuyến.
Trên đây là bài tổng hợp cách phân tích hồi quy đa biến trong SPSS đơn giản với những ví dụ dễ hiểu nhất giúp bạn có thể nhanh chóng nắm bắt được nội dung chính và thực hiện theo dễ dàng nhất. Chúc bạn thực hiện phân tích thành công!