1 / 40

CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH

CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH. CHƯƠNG 9. CHỌN MÔ HÌNH. Biết c ách tiếp cận để lựa chọn mô hình Biết cách k iểm định việc chọn mô hình. MỤC TIÊU. NỘI DUNG. Chọn mô hình- Các sai lầm khi chọn mô hình. 1. 2. Cách tiếp cận để l ự a chọn mô hình. 3. Kiểm định việc chọn mô hình.

anaya
Download Presentation

CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN MÔ HÌNH CHƯƠNG 9

  2. CHỌN MÔ HÌNH • Biết cách tiếp cận để lựa chọn mô hình • Biếtcách kiểm định việc chọn mô hình MỤC TIÊU

  3. NỘI DUNG Chọn mô hình- Các sai lầm khi chọn mô hình 1 2 Cách tiếp cận để lựa chọn mô hình 3 Kiểm định việc chọn mô hình 4

  4. Chọn mô hình và kiểm định chọn mô hình • 1. Chọn mô hình • - Tiết kiệm: Mô hình đơn giản nhưng phải chứa các biến chủ yếu ảnh hưởng đến biến phụ thuộc nhằm giải thích bản chất của vấn đề nghiên cứu. • - Tính đồng nhất: Với một tập dữ liệu đã cho, các tham số ước lượng phải duy nhất. • Tính thích hợp (R2): Mô hình có R2 ( hoặc • càng gần 1 được coi càng thích hợp. • - Tính bền vững về mặt lý thuyết: mô hình phải phù hợp với lý thuyết nền tảng. • - Khả năng dự báo cao

  5. 2. Các sai lầm khi chọn mô hình- Hậuquả • Bỏsótbiếnthíchhợp: dẫnđếnmộtsốhậuquảnhư • Cácthamsốướclượngsẽbịchệchvàkhôngvững. • Khoảng tin cậyvàcáckiểmđịnhkhôngchínhxác. • Dựbáodựatrênmôhìnhsaisẽkhôngđáng tin cậy.

  6. 2. Các sai lầm khi chọn mô hình- Hậuquả • Đưa vào mô hình những biến không phù hợp: • các ước lượng thu được từ mô hình thừa biến không hiệu quả, khoảng tin cậy rộng.

  7. 2. Các sai lầm khi chọn mô hình- Hậuquả • Lựachọnmôhìnhkhôngchínhxác: • Ướclượngchệchcáchệsốhồiquy, thậmchídấucủahệsốhồiquycóthểsai. • Cóíthệsốhồiquyướclượngđượccó ý nghĩathốngkê • R2khôngcao • Phầndưcácquansátlớnvàbiểuthịsựbiếnthiêncótínhhệthống.

  8. Ví dụ • Về hàm chi phí của doanh nghiệp, dạng hàm đúng Yi = b1 + b2Xi + b3Xi2 + b4Xi3 + u1i • Bỏ sót biến quan trọng (Xi3): Yi = a1 + a2Xi + a3Xi2 + u2i • Đưa biến không liên quan vào mô hình (Xi4): Yi = l1 + l2Xi + l3Xi2 + l4Xi3 + l5Xi4 +  u3i • Dạng hàm sai. lnY = g1 + g2Xi + g3Xi2 + g4Xi3 + u4i

  9. Cáchtiếpcậnđểlưachọnmôhình • Xác định số biến độc lập: có hai hướng tiếp cận: • Từ đơn giản đến tổng quát: bổ sung biến độc lập từ từ vào mô hình • Từ tổng quát đến đơn giản: Xét mô hình hồi quy có đầy đủ các biến độc lập đã được xác định, sau đó loại trừ những biến không quan trọng ra khỏi mô hình • 2. Kiểm định mô hình có vi phạm giả thiết như đa cộng tuyến, phương sai thay đổi, tự tương quan. Nếu mô hình vi phạm thì cần có biện pháp khắc phục. • 3. Chọn dạng hàm; dựa vào • Các lý thuyết kinh tế • Các kết quả nghiên cứu thực nghiệm • 4. Sử dụng các tiêu chuẩn thông dụng để chọn mô hình

  10. Kiểm định việc chọn mô hình a. Kiểmđịnhthừabiến (kiểmđịnh Wald) Xéthaimôhình: (U): mô hình không bị ràng buộc (Unrestricted model) (R): mô hình bị ràng buộc (Restricted model). Điều kiện ràng buộc là các hệ số hồi quy của các biến Xm , Xm+1 , Xk đồng thời bằng 0

  11. a. Kiểm định Wald Xâydựnggiảthiếtđểkiểmđịnhđkràngbuộc H1: có ít nhất một khác 0 B1: Hồi quy mô hình (U) có k tham số, tính RSSU có n-k bậc tự do B2: Hồi quy mô hình (R) có m tham số, tính RSSR có n-m bậc tự do B3: Tính F

  12. a. Kiểm định Wald • B4: Trabảng F vớimức ý nghĩaαcógiátrị Fα (k-m, n-k) • Quytắcquyếtđịnh: • Nếu F> Fα (k-m, n-k): bácbỏ Ho, tứcmôhình (U) khôngthừabiến. • Nếudùngkếtquả p-value thìquytắcquyếtđịnhnhưsau: • Nếu p ≤  : Bácbỏ H0 • Nếu p > : Chấpnhận H0

  13. b. Kiểm định bỏ sót biến giải thích Để kiểm định các biến giải thích bỏ sót, ta dùng kiểm định Reset của Ramsey, gồm các bước: Bước 1: Dùng OLS để ước lượng mô hình Yi = 1 + 2X2i + ui Từ đó ta tính và R2old Bước 2: dùng OLS để ước lượng mô hình Tính R2new Kiểm định giả thiết H0: 3 = 4 =… = k = 0

  14. b. Kiểm định bỏ sót biến giải thích Bước 3: Tính n: sốquansát, k: sốthamsốtrongmôhìnhmới; m: sốbiếnđưathêmvào. Bước 4: Nếu F > F(m,n-k): Bácbỏ H0, tứccáchệsố3,4,…kkhôngđồngthờibằng 0, môhìnhcũđãbỏsótbiến. Nếudùngkếtquả p-value thìquytắcquyếtđịnhnhưsau: Nếu p ≤  : Bácbỏ H0 Nếu p > : Chấpnhận H0

  15. c. Kiểmđịnhgiảthiếtphânphốichuẩncủaui Để kiểm định phân phối chuẩn của Ui, ta dùng kiểm định χ2, hay kiểm định Jarque-Bera: Kiểm định giả thiết H0: ui có phân phối chuẩn Nếu JB > χ2, Bác bỏ H0, ngược lại, chấp nhận H0

  16. Tiêu chuẩn lựa chọn mô hình • R2, • R2 điều chỉnh, • Giá trị của hàm hợp lý log-likelihood (L), • Tiêu chuẩn thông tin Akaike (AIC), • Tiêu chuẩn thông tin Schwarz (SIC)

  17. Tiêu chuẩn R2 • R2 đo lường % biến động của Y được giải thích bởi các Xi trong mô hình. • R2 càng gần 1, mô hình càng phù hợp. • Lưu ý: • Nó chỉ đo lường sự phù hợp “trong mẫu” • Khi so sánh R2 giữa các mô hình khác nhau, các biến phụ thuộc phải giống nhau. • R2 không giảm khi tăng thêm biến độc lập.

  18. Tiêu chuẩn R2 điều chỉnh (R2) • Ta thấyR2  R2.R2 chỉ tăng khi giá trị tuyệt đối của giá trị t của biến được thêm vào mô hình lớn hơn 1. • Do vậy,R2 là tiêu chuẩn tốt hơn R2. • Lưu ý, các biến phụ thuộc cũng phải giống nhau.

  19. Giá trị của hàm hợp lý log-likelihood (L) • Giá trị L càng lớn chứng tỏ mô hình càng phù hợp

  20. Tiêu chuẩn thông tin Akaike (AIC) • Trong đó k là số biến được ước lượng (gồm cả hệ số tự do) và n là cỡ mẫu. • Giá trị AIC càng nhỏ chứng tỏ mô hình càng phù hợp. hay

  21. Tiêu chuẩn thông tin Schwarz (SC) • SC còn khắt khe hơn AIC. • SC càng nhỏ, mô hình càng tốt. hay

  22. 6. Cácchỉtiêuđánhgiámôhìnhdựbáo • Sai số dự báo • Mẫu chia thành hai phần Mẫu khởi động: gồm các quan sát t=1,2,3...S-1 Mẫu kiểm tra: gồm các quan sát t=S, S+1,…S+h

  23. 6.1 Trung bình sai số bình phương Mean Squared Error

  24. 6.2 Căn bậc hai của trung bình sai số bình phương • Root Mean Squared Error

  25. 6.3 Trung bình sai số tuyệt đối • Mean Absolute Error • Các chỉ tiêu MSE, RMSE, MAE phụ thuộc đơn vị đo của biến dự báo.

  26. 6.4 Trungbìnhcủaphầntrămsaisốtuyệtđối • Mean Absolute Percentage Error

  27. 6.5 Hệ số bất đẳng thức Theil • Mean Absolute Error • TIC thuộc [0;1] • TIC =0: hàm hồi quy dự báo chính xác

  28. 6.6 Tỷ lệ độ chệch • Bias Proportion: trung bình của giá trị dự báo khác so với trung bình giá trị thực tế

  29. 6.7 Tỷ lệ phương sai • Variance Proportion: cho biết mức độ biến thiên của giá trị dự báo khác mức độ biến thiên của giá trị thiực tế

  30. 6.8 Tỷ lệ hiệp phương sai • Covariance Proportion: cho biết tỷ lệ phần sai số của dự báo không mang tính hệ thống • BP+VP+CP=1 • Mô hình dự báo tốt: BP và VP nhỏ

  31. Ví dụ 1 • Cho Y: lượng hàng bán được của mặt hàng A (kg/tháng) • X2: giá bán mặt hàng A (ngàn đồng/kg) • X3: giá bán của mặt hàng B (ngàn đồng/kg) • Z= 0 nếu khu vực khảo sát ở nông thôn, Z=1 nếu kv khảo sát ở thành phố Sử dụng Eviews, hãy kiểm định Wald để phát hiện thừa biến

  32. B1. Chạymôhình U

  33. B2 Chạymôhình R

  34. B3 Tính F • B4 Tra bảng F (α, k-m, n-k) và quyết định bác bỏ hoặc chấp nhận Ho. Ho: Thừa biến H1: Không thừa biến

  35. Ví dụ 1 Giả sử mô hình hồi quy B1: Chạy mô hình hồi quy mẫu B2: Xác định hệ số hồi quy không có ý nghĩa thống kê (có p>α). Lập giả thuyết Ho B3: Chạy kiểm định Wald, xem giá trị F và p của F để quyết định bác bỏ hay chấp nhận Ho

  36. B1: Chạy hồi quy

  37. Giả sử α=5%, ta thấy hệ số hồi quy của biến X3 và Z có p > α nên biến X3 và Z khác 0 không có ý nghĩa. • B2: Chạy kiểm định Wald cho giả thiết H0: β3=β4 =0 , ta có kết quả

  38. Ta có F= 0.082219, p=0.9215> α nên ta chấp nhận giả thuyết H0: β3=β4 =0. Tức biến X3, Z không cần thiết đưa vào mô hình. • Kết luận: Lượng hàng trung bình bán được của mặt hàng A chỉ phụ thuộc vào giá bán của mặt hàng A, không phụ thuộc vào giá bán mặt hàng B và khu vực bán.

More Related