220 likes | 422 Views
Ανάλυση Πολλαπλής Παλινδρόμησης. y = b 0 + b 1 x 1 + b 2 x 2 + . . . b k x k + u 9. Προβλήματα Προσδιορισμού και Δεδομένων. Συναρτησιακή Μορφή . Μπορούμε να δούμε ότι μία γραμμική παλινδρόμηση μπορεί να μοντελοποιήσει μη-γραμμικές σχέσεις.
E N D
Ανάλυση Πολλαπλής Παλινδρόμησης y = b0 + b1x1 + b2x2 + . . . bkxk + u 9. Προβλήματα Προσδιορισμού και Δεδομένων
Συναρτησιακή Μορφή • Μπορούμε να δούμε ότι μία γραμμική παλινδρόμηση μπορεί να μοντελοποιήσει μη-γραμμικές σχέσεις. • Μπορούμε να χρησιμοποιήσουμε logs στην y ή στις x μεταβλητές ή και στις δύο • Μπορούμε να χρησιμοποιήσουμε δευτεροβάθμιους όρους για τιςx’s μεταβλητές • Μπορούμε να χρησιμοποιήσουμε αλληλοεπιδράσεις μεταξύ τωνxμεταβλητών • Πως γνωρίζουμε εάν έχουμε επιλέξει την σωστή συναρτησιακή μορφή για το μοντέλο μας;
Συναρτησιακή Μορφή (συνέχεια) • Πρώτον, η χρήση οικονομικής θεωρίας μπορεί να μας καθοδηγήσει • Σκεφτόμαστε σχετικά με την ερμηνεία των αποτελεσμάτων • Κάνει περισσότερο νόημα ότιxεπηρεάζει τηνyποσοστιαία (χρησιμοποίησε logs) ή σε απόλυτους όρους; • Κάνει περισσότερο νόημα ότι η παράγωγος τουx1επηρεάζει τηνx1 (δευτεροβάθμια) ή τηνx2 (αλληλεπίδραση) ή είναι σταθερή;
Συναρτησιακή Μορφή (συνέχεια) • Ήδη γνωρίζουμε πώς να ελέγξουμε τους συνδυασμένους περιορισμούς αποκλεισμού για να δούμε εάν όροι υψηλότερης τάξης ή αλληλοεπιδράσεις ανήκουν στο μοντέλο. • Γενικάμπορεί να είναι βαρετό να προσθέτουμε και να ελέγχουμε επιπρόσθετους όρους, συν ότι μπορούμε να βρούμε έναν δευτεροβάθμιο όρο να συμβάλει στο μοντέλο καλύτερα όταν χρησιμοποιούμε logs. • Ένα τεστ της συναρτησιακής μορφής είναι το RESET (Ramsey’s regression specification error test), τεστ για το σφάλμα προσδιορισμού της παλινδρόμησης.
Ramsey’s RESET • Το RESET βασίζεται σε ένα τέχνασμα παρόμοιο με αυτό στην ειδική μορφή του White τεστ • Αντί να προσθέσουμε συναρτήσεις τωνxάμεσα, μπορούμε να προσθέσουμε και να ελέγξουμε συναρτήσεις τουŷ. • Έτσι, εκτιμούμεy = b0 + b1x1 + … + bkxk + d1ŷ2 + d2ŷ3 +errorκαι ελέγχουμε • H0: d1 = 0, d2 = 0 χρησιμοποιώντας F~F2,n-k-3ήLM~χ22
Εναλλακτικοί Μη Ένθετοι Έλεγχοι • Εάν δύο μοντέλα έχουν τις ίδιες εξαρτημένες, αλλάμη-ένθετες (non-nested)xμπορούμε ακόμα να εκτελέσουμε το μοντέλο που περιέχει όλες τιςxμεταβλητές, και από τα δύο μοντέλα, και να ελέγξουμε τους συνδυασμένους περιορισμούς αποκλεισμού που οδηγούν στο ένα ή στο άλλο μοντέλο • Ένα εναλλακτικό τεστ, το Davidson-MacKinnon τεστ, χρησιμοποιεί ŷαπό το ένα μοντέλο ως παλινδρομούσα μεταβλητή στο δεύτερο μοντέλο και ελέγχει την σημαντικότητα
Εναλλακτικοί Μη Ένθετοι Έλεγχοι (συνέχεια) • Είναι πιο δύσκολο εάν το ένα μοντέλο χρησιμοποιεί τηνyκαι το άλλο μοντέλο χρησιμοποιεί ln(y) • Μπορούμε να ακολουθήσουμε κάποια κοινή λογική και να μετασχηματίσουμε τις προβλεπόμενες τιμέςτης ln(y) και να πάρουμεŷγια το δεύτερο βήμα • Σε κάθε περίπτωση, το Davidson-MacKinnon τεστ ενδέχεται να μην απορρίψει κανένα μοντέλο ή να απορρίψει και τα δύο μοντέλα χωρίς να προτιμήσει ξεκάθαρα κάποιον προσδιορισμό
Αντιπροσωπευτικές Μεταβλητές • Τι γίνετε αν το μοντέλο δεν είναι καλά προσδιορισμένο επειδή δεν υπάρχουν δεδομένα για μία σημαντικήxμεταβλητή; • Ενδέχεται να είναι εφικτή η αποφυγή της μεροληψίας, λόγω μιας παραλειπόμενης μεταβλητής, με την χρήση μιας αντιπροσωπευτικής μεταβλητής. • Μία αντιπροσωπευτική μεταβλητή πρέπει να συσχετίζεται με την παραλειπόμενη μεταβλητή – για παράδειγμα:x3* = d0 + d3x3 + v3, όπου * σημαίνει παραλειπόμενη. • Τώρα υποθέστε ότι απλά αντικαθιστούμε τηνx3για τηνx3* .
Αντιπροσωπευτικές Μεταβλητές (συνέχεια) • Τι χρειαζόμαστε για αυτή τη λύση να δίνει συνεπή εκτιμητές γιαb1καιb2; • E(x3* | x1, x2, x3) = E(x3* | x3) = d0 + d3x3 • Δηλαδή,το uδεν συσχετίζεται με τιςx1, x2καιx3*,καιv3δεν συσχετίζεται με τιςx1, x2καιx3 • Δηλαδή τρέχουμε στην πραγματικότητα το y = (b0 + b3d0) + b1x1+ b2x2 + b3d3x3 + (u + b3v3) ορίζοντας εκ-νέου την τεταγμένη της αρχής, το σφάλμα, και τον συντελεστή τηςx3
Αντιπροσωπευτικές Μεταβλητές (συνέχεια) • Χωρίς υποθέσεις, μπορεί να καταλήξουμε με μεροληπτικούς εκτιμητές • Ας ορίσουμεx3* = d0 + d1x1 + d2x2 + d3x3 + v3 • Δηλαδή τρέχουμε στην πραγματικότητα το y = (b0 + b3d0) + (b1 + b3d1) x1+ (b2 + b3d2) x2 + b3d3x3 + (u + b3v3) • Η μεροληψία θα εξαρτάται από τα πρόσημα των b3καιdj • Αυτή η μεροληψία ενδέχεται να είναι μικρότερη από αυτή που παίρνουμε αν παραλείψουμε μια μεταβλητή, παρόλα αυτά.
Εξαρτημένες Μεταβλητές με Χρονική Υστέρηση • Τι μπορούμε να κάνουμε αν υπάρχουν παραλειπόμενες μεταβλητές, και δεν μπορούμε να βρούμε αντιπροσωπευτικές μεταβλητές; • Ενδέχεται να είναι δυνατόν να περιλάβουμε μία εξαρτημένη μεταβλητή με υστέρηση για λογαριασμό των παραλειπόμενων μεταβλητών οι οποίες συμβάλουν στις τιμές τουyστο παρόν αλλά και στο παρελθόν. • Φυσικά, πρέπει να σκεφτούμε αν οι τιμές τουyαπό το παρόν και το παρελθόν συσχετίζονται και αν κάνει αυτό νόημα.
Σφάλμα Μέτρησης • Κάποιες φορές έχουμε την μεταβλητή την οποία χρειαζόμαστε, αλλά νομίζουμε ότι την μετράμε με σφάλμα • Παραδείγματα: Σε μία καταγραφή ρωτάμε πόσες ώρες δουλέψατε τον τελευταίο χρόνο, ή πόσες εβδομάδες φροντίσατε το παιδί σας όταν ήταν μικρό • Ένα σφάλμα στηνyέχει διαφορετική επίπτωση από ότι ένα σφάλμα στηνx
Σφάλμα Μέτρησης στην Εξαρτημένη Μεταβλητή • Ορίζουμε το σφάλμα μέτρησηςως e0 = y – y* • Έτσι, στην πραγματικότητα εκτιμούμε y = b0 + b1x1 + …+ bkxk + u + e0 • Πότε ο OLS θα παράγει αμερόληπτα αποτελέσματα; • Εάν e0με ταxjκαιuείναι ασυσχέτιστα τότε ο OLS είναι αμερόληπτος. • Εάν E(e0) ≠ 0 τότεο b0θα είναι μεροληπτικός, παρόλα αυτά • Παρόλο που είναι αμερόληπτος, έχουμε μεγαλύτερες διακυμάνσεις από ότι χωρίς σφάλμα μέτρησης
Σφάλμα Μέτρησης σε μία Ερμηνευτική Μεταβλητή • Ορίζουμε το σφάλμα μέτρησηςωςe1 = x1 – x1* • Υποθέστε E(e1) = 0 , E(y| x1*, x1) = E(y| x1*) • Στην πραγματικότητα εκτιμούμε y = b0 + b1x1 + (u – b1e1) • Η επίδραση του σφάλματος μέτρησης των OLS εκτιμητών εξαρτάται από την υπόθεση σχετικά με την συσχέτιση μεταξύ τωνe1καιx1 • Υποθέστε ότι Cov(x1, e1) = 0 • OLS παραμένει αμερόληπτος, αλλά με μεγαλύτερη διακύμανση
Σφάλμα Μέτρησης σε μία Ερμηνευτική Μεταβλητή (συνεχ) • Υποθέστε Cov(x1*, e1) = 0, γνωστή ως η κλασική υπόθεση για τα σφάλματα μέτρησης, τότε • Cov(x1, e1) = E(x1e1) = E(x1*e1) + E(e12) = 0 + se2 • x1συσχετίζεται με το σφάλμα έτσι ο εκτιμητής είναι μεροληπτικός
Σφάλμα Μέτρησης σε μία Ερμηνευτική Μεταβλητή (συνεχ) • Σημειώστε ότι το σφάλμα είναιανάλογο του Var(x1*)/Var(x1) • Αφού Var(x1*)/Var(x1) < 1, ο εκτιμητής είναι μεροληπτικός προς το 0 – καλούμενο σφάλμα μετριασμού • Το παρόν θέμα είναι πιο πολύπλοκο στην πολλαπλή παλινδρόμηση, αλλά μπορεί να αναμένεται ακόμα σφάλμα μετριασμού με κλασικά λάθη στις μεταβλητές
Ελλιπή Δεδομένα – Υπάρχει Πρόβλημα; • Εάν κάθε παρατήρηση σε μία μεταβλητή είναι ελλιπής, δεν μπορεί να χρησιμοποιηθεί στο μοντέλο • Εάν τα δεδομένα είναι τυχαία ελλιπή, μπορούμε να περιορίσουμε το δείγμα με μεταβλητές χωρίς ελλιπή δεδομένα, αλλά μειώνεται ο αριθμός του δείγματος. • Πρόβλημα υπάρχει όταν τα δεδομένα είναι ελλιπή με κάποιο συστηματικό τρόπο – π.χ. άτομα με πολύ υψηλά εισοδήματα αρνούνται να αποκαλύψουν τα εισοδήματα τους
Μη Τυχαία Δεδομένα • Εάν το δείγμα επιλέγεται βάση μιαςxμεταβλητής, τότε οι εκτιμητές είναι αμερόληπτοι. • Εάν το δείγμα επιλέγεται βάση τηςyμεταβλητής, τότε έχουμε μεροληψία με την επιλογή του δείγματος. • Η επιλογή του δείγματος μπορεί να είναι πιο περίπλοκο • Π.χ. Μελετώντας τους μισθούς των εργαζομένων – αφού οι εργαζόμενοι επέλεξαν να εργασθούν δεν είναι το ίδιο όπως προσφορά μισθών. Για όσους δεν εργάζονται δεν μπορούμε να προσδιορίσουμε την προσφορά μισθού
Απομονωμένες Παρατηρήσεις ή Παρατηρήσεις που Ασκούν Επιρροή • Κάποιες φορές μία παρατήρηση ενός ατόμου μπορεί να είναι πολύ διαφορετική από τις υπόλοιπες, και μπορεί να έχει μία μεγάλη επίδραση στα αποτελέσματα • Κάποιες φορές αυτή η ακραία παρατήρηση μπορεί και να είναι απλά ένα λάθος στα δεδομένα – ένας λόγος για τον οποίο η μελέτη μερικών στατιστικών στοιχείων (summary statistics) είναι σημαντική • Κάποιες φορές αυτή η απομονωμένη παρατήρηση μπορεί και να είναι πραγματικά πολύ διαφορετική από τις άλλες
Απομονωμένες Παρατηρήσεις ή Παρατηρήσεις που Ασκούν Επιρροή (συνέχεια) • Δεν είναι παράλογο να διορθώσεις παρατηρήσεις για τις οποίες είναι προφανές ότι υπάρχει ένα επιπλέον 0 ή ότι έχει παραληφθεί, κ.λ.π. • Δεν είναι παράλογο να παραλήψεις παρατηρήσεις οι οποίες εμφανίζονται να είναι πολύ ακραίες τιμές, αν και οι αναγνώστες επιθυμούν να βλέπουν εκτιμητές με και χωρίς απομονωμένες τιμές • Μία ανθεκτική μέθοδο για απομονομένες παρατηρήσεις είναι η εκτίμηση με ελάχιστες απόλυτες αποκλίσεις. • Μπορούμε να χρησιμοποιήσουμε στατιστικά πακέτα π.χ. Stata για τον έλεγχο απομονωμένων τιμών.
Eview Commands • RESET -> Αφού κανετε παλινδρόμηση επιλεξτε στο νέο παράθυρο, Equation: …. View/Stability Tests/Ramsey RESET Test… • Quick/Estimate Equation… επιλέξτε μέθοδο εκτίμησης: QREG - Quantile Regression (including LAD) ..... και εκτελέστε την παλινδρόμηση