Kính thưa đọc giả. Bữa nay, Webtaichinh sẽ đưa ra đánh giá khách quan về các tips, tricks hữu ích phải biết khi tham gia vào thị trường tài chính với nội dung Đa cộng tuyến (Multicollinearity) trong mô hình hồi qui là gì? Hậu quả
Phần nhiều nguồn đều được lấy ý tưởng từ các nguồn website lớn khác nên sẽ có vài phần khó hiểu.
Mong mỗi cá nhân thông cảm, xin nhận góp ý & gạch đá bên dưới bình luận
Xin quý khách đọc bài viết này trong phòng cá nhân để đạt hiệu quả cao nhất
Tránh xa tất cả các dòng thiết bị gây xao nhoãng trong việc đọc bài
Bookmark lại bài viết vì mình sẽ cập nhật liên tục
Đa cộng tuyến (tiếng Anh: Multicollinearity) là hiện tượng các biến độc lập trong mô hình hồi quy phụ thuộc tuyến tính vào nhau, được biểu thị dưới dạng một hàm (vi phạm giả thiết 5 của mô hình hồi quy tuyến tính).
Hình minh họa. Nguồn: Xử lý dữ liệu SPSS
Hiện tượng đa cộng tuyến
![]() Đáp ứng nhu cầu của độc giả về FOREX. Webtaichinh xin chia sẽ với các bạn lộ trình A-Z cho người mới khi tham gia vào thị trường này Danh sách bài viết nên đọc bao gồm: |
✅ 14 Sàn Forex Tốt Và Uy Tín Nhất Việt Nam, Thế Giới 2021 |
✅ 9 Kinh Nghiệm Đầu Tư Forex Từ Số 0 Giúp Nhiều Người Đổi Đời |
✅ Cách Tạo Lập Và Đăng Ký Tài Khoản Forex Chi Tiết Từ A-Z Cho Newbie |
✅ Tất Cả Mọi Thứ Về Trading Forex, Có Hợp Pháp, Có Nên Tìm Hiểu Hay Đầu Tư ? |
♻️ Ghi rõ nguồn Webtaichinh.vn trước khi share |
🛑 Lưu ý: TUYÊN BỐ MIỄN TRỪ TRÁCH NHIỆM |
Ý tưởng
Đa cộng tuyến trong tiếng anh là Đa cộng tuyến.
Đa cộng tuyến là hiện tượng các biến độc lập trong mô hình hồi quy phụ thuộc tuyến tính vào nhau, được biểu diễn dưới dạng một hàm (vi phạm giả thiết 5 của mô hình hồi quy tuyến tính).
Hậu quả của đa cộng tuyến
Mặc dù sự hiện diện của đa cộng tuyến không ảnh hưởng đến tính nhất quán của các ước lượng OLS của các hệ số hồi quy. Tuy nhiên, các ước tính sẽ trở nên không chính xác và không đáng tin cậy.
Hơn nữa, trên thực tế không thể phân biệt các tác động riêng lẻ của các biến độc lập lên biến phụ thuộc. Kết quả là, sai số tiêu chuẩn của tham số hồi quy tăng lên. Điều này dẫn đến kiểm định t trên các hệ số ít có khả năng bị loại bỏ giả thuyết vô hiệu.
Trong đó, OLS (Bình phương nhỏ nhất thông thường) là phương pháp bình phương nhỏ nhất. Đây là phương pháp ước lượng dựa trên tiêu chí tối thiểu hóa tổng bình phương phần dư của hồi quy.
Phát hiện đa cộng tuyến
Một dấu hiệu nổi bật của đa cộng tuyến là hệ số xác định R2 là cao mặc dù thống kê t của các hệ số của độ dốc được ước tính là không đáng kể, thể hiện sai số tiêu chuẩn cao. Mặc dù các hệ số có thể được ước lượng không chính xác, nhưng các biến độc lập đóng một vai trò trong việc giải thích biến phụ thuộc, điều này được thể hiện qua thực tế rằng R2 cao.
Hãy xem xét một ví dụ minh họa: Đa cộng tuyến trong phần giải thích về lợi nhuận của Danh mục Công nghệ Lựa chọn Trung thực (FSPTX).
Dưới đây là kết quả hồi quy của lợi nhuận cổ phiếu này dựa trên chỉ số tăng trưởng S&P 500 và chỉ số giá trị S&P 500.
Thời gian nghiên cứu: 1/2009 – 12/2013
Một thống kê t bằng 5,9286 của chỉ số tăng trưởng (lớn hơn 2) chỉ ra rằng mức tăng trưởng khác biệt đáng kể so với mức tiêu chuẩn (giá trị 0). Mặt khác, thống kê t của chỉ số giá trị là −0,9012 mà không có ý nghĩa thống kê.
Kết quả này cho thấy khả năng sinh lời của FSPTX có liên quan đến chỉ số tăng trưởng và không liên quan chặt chẽ đến chỉ số giá trị. Tuy nhiên, hệ số 1.4697 của chỉ số tăng trưởng cho thấy lợi nhuận của FSPTX biến động nhiều hơn lợi nhuận của chỉ số tăng trưởng.
Lưu ý rằng hồi quy này giải thích phương sai của lợi nhuận FSPTX. Cụ thể là RẺ2 của hồi quy này là 0,7996. Do đó, khoảng 80% phương sai của lợi nhuận FSPTX được giải thích bởi lợi nhuận của chỉ số tăng trưởng và chỉ số giá trị S&P 500. Giả sử chúng ta chạy một mô hình hồi quy tuyến tính khác có thêm chỉ số S&P 500. Đây là kết quả của mô hình:
Thời gian nghiên cứu: 1/2009 – 12/2013
Lưu ý rằng RẺ2 trong hồi quy này không thay đổi đáng kể so với R2 trong hồi quy trước (tăng từ 0,7996 lên 0,8084), nhưng sai số chuẩn của các hệ số của các biến độc lập lớn hơn nhiều.
Việc thêm chỉ số S&P 500 vào mô hình hồi quy không giải thích thêm bất kỳ phương sai nào của lợi nhuận FSPTX so với trước đó, nhưng cả hai hệ số đều không có ý nghĩa thống kê. Đây là trường hợp kinh điển của đa cộng tuyến.
Làm thế nào để khắc phục đa cộng tuyến?
Giải pháp trực tiếp nhất cho đa cộng tuyến là loại trừ một hoặc nhiều biến hồi quy.
Trong ví dụ trên, chúng ta có thể thấy rằng chỉ số S&P 500 không nên được đưa vào mô hình hồi quy nếu bao gồm cả chỉ số tăng trưởng và giá trị S&P 500, vì lợi nhuận của chỉ số S&P 500 là một trung bình có trọng số. tăng trưởng cổ phiếu và giá trị cổ phiếu.
Tuy nhiên, trong nhiều trường hợp không dễ có lời giải cho đa cộng tuyến, chúng ta cần kiểm định thêm hoặc loại trừ các biến độc lập khác nhau để xác định nguồn gốc của đa cộng tuyến.
(Người giới thiệu: CFA cấp II, 2020, Phương pháp định lượng)
Nguồn tổng hợp