So sánh hồi quy nhị phân và hồi quy thứ bậc trong nghiên cứu giáo dục và hành vi người học
Tóm tắt:
Nghiên cứu so sánh hiệu quả của hồi quy nhị phân và hồi quy thứ bậc trong phân tích mức độ sẵn sàng học sau đại học của nhân viên văn phòng. Dữ liệu khảo sát giả lập bởi ChatGPT gồm 400 quan sát với các yếu tố động lực, rào cản và hỗ trợ. Hai mô hình được áp dụng: hồi quy nhị phân (gom mức 4–5 thành “sẵn sàng”, mức 1–3 thành “không sẵn sàng”) và hồi quy thứ bậc (giữ nguyên 5 mức). Kết quả cho thấy hồi quy thứ bậc phát hiện rào cản gia đình có ảnh hưởng giảm mức độ sẵn sàng (β = -0,468, OR = 0,63, p = 0,021), trong khi mô hình nhị phân không phát hiện được. Độ phù hợp của cả hai mô hình còn thấp (Pseudo R2 < 3%). Kết quả chỉ ra rằng hồi quy thứ bậc giúp khai thác đầy đủ thông tin thứ bậc, trong khi hồi quy nhị phân đơn giản và trực quan hơn. Nghiên cứu cũng khuyến nghị khảo sát thực địa để kiểm định kết quả.
Abstract:
This study compares the effectiveness of binary logistic regression and ordered logistic regression in analyzing office workers’ readiness to pursue postgraduate education. A simulated survey dataset generated by ChatGPT includes 400 observations encompassing motivational, barrier, and support factors. Two models were applied: binary logistic regression (combining levels 4–5 as "ready" and levels 1–3 as "not ready") and ordered logistic regression (retaining all five ordinal levels). The ordered model identified a significant negative effect of family- related barriers on readiness (β = -0.468, OR = 0.63, p = 0.021), which was not detected in the binary model. Both models showed low overall fit (Pseudo R2 < 3%). The findings suggest that ordered logistic regression better utilizes ordinal information, while binary regression offers a simpler, more intuitive approach. The study recommends field surveys to validate these results.

