Mối quan hệ Tương quan chuỗi/Tự tương quan (Serial Correlation/Autocorrelation) trong thống kê là gì? Hậu quả

Tương quan chuỗi/Tự tương quan (tiếng Anh: Serial Correlation/Autocorrelation) là mối quan hệ giữa một biến và phiên bản trễ của nó trong các khoảng thời gian khác nhau.

Mối quan hệ Tương quan chuỗi/Tự tương quan (Serial Correlation/Autocorrelation) trong thống kê là gì? Hậu quả

[external_link_head]

Hình minh họa. Nguồn: statisticshowto.datasciencecentral.com

Tương quan chuỗi/Tự tương quan

Khái niệm

Tương quan chuỗi/Tự tương quan trong tiếng Anh là Serial Correlation/Autocorrelation.

Tương quan chuỗi/Tự tương quan là mối quan hệ giữa một biến và phiên bản trễ của nó trong các khoảng thời gian khác nhau.

Hậu quả của tương quan chuỗi

Giống như phương sai thay đổi , vấn đề chính gây ra bởi tương quan chuỗi trong hồi qui tuyến tính là việc ước tính không chính xác về sai số chuẩn của hệ số hồi qui được tính toán bởi các phần mềm thống kê.

[external_link offset=1]

Nếu không có biến độc lập nào là giá trị trễ (lagged value) của biến phụ thuộc (giá trị của biến phụ thuộc từ giai đoạn trước), thì các tham số ước tính sẽ nhất quán và không cần điều chỉnh các ảnh hưởng của tương quan chuỗi.

Tuy nhiên, nếu một trong các biến độc lập là giá trị bị trễ của biến phụ thuộc, thì tương quan chuỗi sẽ gây ra tính không nhất quán và ước tính giá trị không hợp lệ của các tham số thực. Ví dụ: Lợi nhuận của tín phiếu kho bạc của tháng trước là một biến độc lập trong mô hình hồi qui Fisher.

Kiểm tra tính tương quan chuỗi

Có nhiều cách kiểm tra về tương quan chuỗi trong mô hình hồi qui, nhưng cách phổ biến nhất là dựa trên thống kê được phát triển bởi Durbin và Watson (1951):

Mối quan hệ Tương quan chuỗi/Tự tương quan (Serial Correlation/Autocorrelation) trong thống kê là gì? Hậu quả

Công thức của mô hình Durbin–Watson. Trong đó, εt là số dư (sai số) của giai đoạn t trong mô hình hồi qui

Nếu phương sai của sai số không đổi theo thời gian và các sai số cũng không tương quan chuỗi thì ta có công thức thống kê Durbin–Watson sẽ xấp xỉ bằng 2:

Mối quan hệ Tương quan chuỗi/Tự tương quan (Serial Correlation/Autocorrelation) trong thống kê là gì? Hậu quả

Công thức

Nếu mẫu rất lớn, thống kê của Durbin–Watson sẽ xấp xỉ bằng 2 x (1 – r), Trong đó r là mối tương quan giữa sai số của một khoảng thời gian với khoảng thời gian trước đó.

Phép tính gần đúng này rất hữu ích vì nó cho thấy giá trị của các mức độ tương quan chuỗi. Thống kê Durbin–Watson có giá trị từ 0 (trong trường hợp tương quan chuỗi của +1) đến 4 (trong trường hợp tương quan chuỗi của −1):

– Nếu hồi qui không có tương quan chuỗi, thì sai số sẽ không tương quan theo thời gian và giá trị của thống kê Durbin–Watson sẽ bằng 2 x (1 – 0) = 2.

[external_link offset=2]

– Nếu sai số có tương quan dương, thì thống kê Durbin–Watson sẽ nhỏ hơn 2. Ví dụ: Nếu tương quan chuỗi của sai số là 1, thì giá trị của thống kê Durbin–Watson sẽ là 0.

– Nếu sai số có tương quan âm, thì thống kê Durbin–Watson sẽ lớn hơn 2. Ví dụ: Nếu tương quan chuỗi của sai số -1, thì giá trị của thống kê Durbin–Watson sẽ là 4.

Cách khắc phục lỗi tương quan chuỗi

Có hai phương pháp khắc phục lỗi tương quan chuỗi:

– Phương pháp thứ nhất: Chúng ta có thể điều chỉnh các lỗi tiêu chuẩn cho các tham số hồi qui tuyến tính để tính toán tương quan chuỗi.

– Phương pháp thứ hai: Chúng ta có thể tự sửa đổi phương trình hồi qui để loại bỏ tương quan chuỗi.

Phương pháp thứ nhất tối ưu hơn vì phương pháp thứ hai có thể dẫn đến ước tính tham số không nhất quán. Hai phương pháp phổ biến này đều được phát triển bởi Hansen (1982) và Newey và West (1987). Chúng là tiêu chuẩn trong nhiều phần mềm thống kê. Ưu điểm khác của các phương pháp này là chúng đồng thời sửa lỗi cho tính phương sai thay đổi .

(Tài liệu tham khảo: CFA level II, 2020, Quantitative methods) [external_footer]

Viết một bình luận