1 / 21

Ανάλυση Πολλαπλής Παλινδρόμησης

Ανάλυση Πολλαπλής Παλινδρόμησης. y = b 0 + b 1 x 1 + b 2 x 2 + . . . b k x k + u 9. Προβλήματα Προσδιορισμού και Δεδομένων. Συναρτησιακή Μορφή . Μπορούμε να δούμε ότι μία γραμμική παλινδρόμηση μπορεί να μοντελοποιήσει μη-γραμμικές σχέσεις.

leena
Download Presentation

Ανάλυση Πολλαπλής Παλινδρόμησης

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Ανάλυση Πολλαπλής Παλινδρόμησης y = b0 + b1x1 + b2x2 + . . . bkxk + u 9. Προβλήματα Προσδιορισμού και Δεδομένων

  2. Συναρτησιακή Μορφή • Μπορούμε να δούμε ότι μία γραμμική παλινδρόμηση μπορεί να μοντελοποιήσει μη-γραμμικές σχέσεις. • Μπορούμε να χρησιμοποιήσουμε logs στην y ή στις x μεταβλητές ή και στις δύο • Μπορούμε να χρησιμοποιήσουμε δευτεροβάθμιους όρους για τιςx’s μεταβλητές • Μπορούμε να χρησιμοποιήσουμε αλληλοεπιδράσεις μεταξύ τωνxμεταβλητών • Πως γνωρίζουμε εάν έχουμε επιλέξει την σωστή συναρτησιακή μορφή για το μοντέλο μας;

  3. Συναρτησιακή Μορφή (συνέχεια) • Πρώτον, η χρήση οικονομικής θεωρίας μπορεί να μας καθοδηγήσει • Σκεφτόμαστε σχετικά με την ερμηνεία των αποτελεσμάτων • Κάνει περισσότερο νόημα ότιxεπηρεάζει τηνyποσοστιαία (χρησιμοποίησε logs) ή σε απόλυτους όρους; • Κάνει περισσότερο νόημα ότι η παράγωγος τουx1επηρεάζει τηνx1 (δευτεροβάθμια) ή τηνx2 (αλληλεπίδραση) ή είναι σταθερή;

  4. Συναρτησιακή Μορφή (συνέχεια) • Ήδη γνωρίζουμε πώς να ελέγξουμε τους συνδυασμένους περιορισμούς αποκλεισμού για να δούμε εάν όροι υψηλότερης τάξης ή αλληλοεπιδράσεις ανήκουν στο μοντέλο. • Γενικάμπορεί να είναι βαρετό να προσθέτουμε και να ελέγχουμε επιπρόσθετους όρους, συν ότι μπορούμε να βρούμε έναν δευτεροβάθμιο όρο να συμβάλει στο μοντέλο καλύτερα όταν χρησιμοποιούμε logs. • Ένα τεστ της συναρτησιακής μορφής είναι το RESET (Ramsey’s regression specification error test), τεστ για το σφάλμα προσδιορισμού της παλινδρόμησης.

  5. Ramsey’s RESET • Το RESET βασίζεται σε ένα τέχνασμα παρόμοιο με αυτό στην ειδική μορφή του White τεστ • Αντί να προσθέσουμε συναρτήσεις τωνxάμεσα, μπορούμε να προσθέσουμε και να ελέγξουμε συναρτήσεις τουŷ. • Έτσι, εκτιμούμεy = b0 + b1x1 + … + bkxk + d1ŷ2 + d2ŷ3 +errorκαι ελέγχουμε • H0: d1 = 0, d2 = 0 χρησιμοποιώντας F~F2,n-k-3ήLM~χ22

  6. Εναλλακτικοί Μη Ένθετοι Έλεγχοι • Εάν δύο μοντέλα έχουν τις ίδιες εξαρτημένες, αλλάμη-ένθετες (non-nested)xμπορούμε ακόμα να εκτελέσουμε το μοντέλο που περιέχει όλες τιςxμεταβλητές, και από τα δύο μοντέλα, και να ελέγξουμε τους συνδυασμένους περιορισμούς αποκλεισμού που οδηγούν στο ένα ή στο άλλο μοντέλο • Ένα εναλλακτικό τεστ, το Davidson-MacKinnon τεστ, χρησιμοποιεί ŷαπό το ένα μοντέλο ως παλινδρομούσα μεταβλητή στο δεύτερο μοντέλο και ελέγχει την σημαντικότητα

  7. Εναλλακτικοί Μη Ένθετοι Έλεγχοι (συνέχεια) • Είναι πιο δύσκολο εάν το ένα μοντέλο χρησιμοποιεί τηνyκαι το άλλο μοντέλο χρησιμοποιεί ln(y) • Μπορούμε να ακολουθήσουμε κάποια κοινή λογική και να μετασχηματίσουμε τις προβλεπόμενες τιμέςτης ln(y) και να πάρουμεŷγια το δεύτερο βήμα • Σε κάθε περίπτωση, το Davidson-MacKinnon τεστ ενδέχεται να μην απορρίψει κανένα μοντέλο ή να απορρίψει και τα δύο μοντέλα χωρίς να προτιμήσει ξεκάθαρα κάποιον προσδιορισμό

  8. Αντιπροσωπευτικές Μεταβλητές • Τι γίνετε αν το μοντέλο δεν είναι καλά προσδιορισμένο επειδή δεν υπάρχουν δεδομένα για μία σημαντικήxμεταβλητή; • Ενδέχεται να είναι εφικτή η αποφυγή της μεροληψίας, λόγω μιας παραλειπόμενης μεταβλητής, με την χρήση μιας αντιπροσωπευτικής μεταβλητής. • Μία αντιπροσωπευτική μεταβλητή πρέπει να συσχετίζεται με την παραλειπόμενη μεταβλητή – για παράδειγμα:x3* = d0 + d3x3 + v3, όπου * σημαίνει παραλειπόμενη. • Τώρα υποθέστε ότι απλά αντικαθιστούμε τηνx3για τηνx3* .

  9. Αντιπροσωπευτικές Μεταβλητές (συνέχεια) • Τι χρειαζόμαστε για αυτή τη λύση να δίνει συνεπή εκτιμητές γιαb1καιb2; • E(x3* | x1, x2, x3) = E(x3* | x3) = d0 + d3x3 • Δηλαδή,το uδεν συσχετίζεται με τιςx1, x2καιx3*,καιv3δεν συσχετίζεται με τιςx1, x2καιx3 • Δηλαδή τρέχουμε στην πραγματικότητα το y = (b0 + b3d0) + b1x1+ b2x2 + b3d3x3 + (u + b3v3) ορίζοντας εκ-νέου την τεταγμένη της αρχής, το σφάλμα, και τον συντελεστή τηςx3

  10. Αντιπροσωπευτικές Μεταβλητές (συνέχεια) • Χωρίς υποθέσεις, μπορεί να καταλήξουμε με μεροληπτικούς εκτιμητές • Ας ορίσουμεx3* = d0 + d1x1 + d2x2 + d3x3 + v3 • Δηλαδή τρέχουμε στην πραγματικότητα το y = (b0 + b3d0) + (b1 + b3d1) x1+ (b2 + b3d2) x2 + b3d3x3 + (u + b3v3) • Η μεροληψία θα εξαρτάται από τα πρόσημα των b3καιdj • Αυτή η μεροληψία ενδέχεται να είναι μικρότερη από αυτή που παίρνουμε αν παραλείψουμε μια μεταβλητή, παρόλα αυτά.

  11. Εξαρτημένες Μεταβλητές με Χρονική Υστέρηση • Τι μπορούμε να κάνουμε αν υπάρχουν παραλειπόμενες μεταβλητές, και δεν μπορούμε να βρούμε αντιπροσωπευτικές μεταβλητές; • Ενδέχεται να είναι δυνατόν να περιλάβουμε μία εξαρτημένη μεταβλητή με υστέρηση για λογαριασμό των παραλειπόμενων μεταβλητών οι οποίες συμβάλουν στις τιμές τουyστο παρόν αλλά και στο παρελθόν. • Φυσικά, πρέπει να σκεφτούμε αν οι τιμές τουyαπό το παρόν και το παρελθόν συσχετίζονται και αν κάνει αυτό νόημα.

  12. Σφάλμα Μέτρησης • Κάποιες φορές έχουμε την μεταβλητή την οποία χρειαζόμαστε, αλλά νομίζουμε ότι την μετράμε με σφάλμα • Παραδείγματα: Σε μία καταγραφή ρωτάμε πόσες ώρες δουλέψατε τον τελευταίο χρόνο, ή πόσες εβδομάδες φροντίσατε το παιδί σας όταν ήταν μικρό • Ένα σφάλμα στηνyέχει διαφορετική επίπτωση από ότι ένα σφάλμα στηνx

  13. Σφάλμα Μέτρησης στην Εξαρτημένη Μεταβλητή • Ορίζουμε το σφάλμα μέτρησηςως e0 = y – y* • Έτσι, στην πραγματικότητα εκτιμούμε y = b0 + b1x1 + …+ bkxk + u + e0 • Πότε ο OLS θα παράγει αμερόληπτα αποτελέσματα; • Εάν e0με ταxjκαιuείναι ασυσχέτιστα τότε ο OLS είναι αμερόληπτος. • Εάν E(e0) ≠ 0 τότεο b0θα είναι μεροληπτικός, παρόλα αυτά • Παρόλο που είναι αμερόληπτος, έχουμε μεγαλύτερες διακυμάνσεις από ότι χωρίς σφάλμα μέτρησης

  14. Σφάλμα Μέτρησης σε μία Ερμηνευτική Μεταβλητή • Ορίζουμε το σφάλμα μέτρησηςωςe1 = x1 – x1* • Υποθέστε E(e1) = 0 , E(y| x1*, x1) = E(y| x1*) • Στην πραγματικότητα εκτιμούμε y = b0 + b1x1 + (u – b1e1) • Η επίδραση του σφάλματος μέτρησης των OLS εκτιμητών εξαρτάται από την υπόθεση σχετικά με την συσχέτιση μεταξύ τωνe1καιx1 • Υποθέστε ότι Cov(x1, e1) = 0 • OLS παραμένει αμερόληπτος, αλλά με μεγαλύτερη διακύμανση

  15. Σφάλμα Μέτρησης σε μία Ερμηνευτική Μεταβλητή (συνεχ) • Υποθέστε Cov(x1*, e1) = 0, γνωστή ως η κλασική υπόθεση για τα σφάλματα μέτρησης, τότε • Cov(x1, e1) = E(x1e1) = E(x1*e1) + E(e12) = 0 + se2 • x1συσχετίζεται με το σφάλμα έτσι ο εκτιμητής είναι μεροληπτικός

  16. Σφάλμα Μέτρησης σε μία Ερμηνευτική Μεταβλητή (συνεχ) • Σημειώστε ότι το σφάλμα είναιανάλογο του Var(x1*)/Var(x1) • Αφού Var(x1*)/Var(x1) < 1, ο εκτιμητής είναι μεροληπτικός προς το 0 – καλούμενο σφάλμα μετριασμού • Το παρόν θέμα είναι πιο πολύπλοκο στην πολλαπλή παλινδρόμηση, αλλά μπορεί να αναμένεται ακόμα σφάλμα μετριασμού με κλασικά λάθη στις μεταβλητές

  17. Ελλιπή Δεδομένα – Υπάρχει Πρόβλημα; • Εάν κάθε παρατήρηση σε μία μεταβλητή είναι ελλιπής, δεν μπορεί να χρησιμοποιηθεί στο μοντέλο • Εάν τα δεδομένα είναι τυχαία ελλιπή, μπορούμε να περιορίσουμε το δείγμα με μεταβλητές χωρίς ελλιπή δεδομένα, αλλά μειώνεται ο αριθμός του δείγματος. • Πρόβλημα υπάρχει όταν τα δεδομένα είναι ελλιπή με κάποιο συστηματικό τρόπο – π.χ. άτομα με πολύ υψηλά εισοδήματα αρνούνται να αποκαλύψουν τα εισοδήματα τους

  18. Μη Τυχαία Δεδομένα • Εάν το δείγμα επιλέγεται βάση μιαςxμεταβλητής, τότε οι εκτιμητές είναι αμερόληπτοι. • Εάν το δείγμα επιλέγεται βάση τηςyμεταβλητής, τότε έχουμε μεροληψία με την επιλογή του δείγματος. • Η επιλογή του δείγματος μπορεί να είναι πιο περίπλοκο • Π.χ. Μελετώντας τους μισθούς των εργαζομένων – αφού οι εργαζόμενοι επέλεξαν να εργασθούν δεν είναι το ίδιο όπως προσφορά μισθών. Για όσους δεν εργάζονται δεν μπορούμε να προσδιορίσουμε την προσφορά μισθού

  19. Απομονωμένες Παρατηρήσεις ή Παρατηρήσεις που Ασκούν Επιρροή • Κάποιες φορές μία παρατήρηση ενός ατόμου μπορεί να είναι πολύ διαφορετική από τις υπόλοιπες, και μπορεί να έχει μία μεγάλη επίδραση στα αποτελέσματα • Κάποιες φορές αυτή η ακραία παρατήρηση μπορεί και να είναι απλά ένα λάθος στα δεδομένα – ένας λόγος για τον οποίο η μελέτη μερικών στατιστικών στοιχείων (summary statistics) είναι σημαντική • Κάποιες φορές αυτή η απομονωμένη παρατήρηση μπορεί και να είναι πραγματικά πολύ διαφορετική από τις άλλες

  20. Απομονωμένες Παρατηρήσεις ή Παρατηρήσεις που Ασκούν Επιρροή (συνέχεια) • Δεν είναι παράλογο να διορθώσεις παρατηρήσεις για τις οποίες είναι προφανές ότι υπάρχει ένα επιπλέον 0 ή ότι έχει παραληφθεί, κ.λ.π. • Δεν είναι παράλογο να παραλήψεις παρατηρήσεις οι οποίες εμφανίζονται να είναι πολύ ακραίες τιμές, αν και οι αναγνώστες επιθυμούν να βλέπουν εκτιμητές με και χωρίς απομονωμένες τιμές • Μία ανθεκτική μέθοδο για απομονομένες παρατηρήσεις είναι η εκτίμηση με ελάχιστες απόλυτες αποκλίσεις. • Μπορούμε να χρησιμοποιήσουμε στατιστικά πακέτα π.χ. Stata για τον έλεγχο απομονωμένων τιμών.

  21. Eview Commands • RESET -> Αφού κανετε παλινδρόμηση επιλεξτε στο νέο παράθυρο, Equation: …. View/Stability Tests/Ramsey RESET Test… • Quick/Estimate Equation… επιλέξτε μέθοδο εκτίμησης: QREG - Quantile Regression (including LAD) ..... και εκτελέστε την παλινδρόμηση

More Related