Ανάλυση Πολλαπλής Παλινδρόμησης
This presentation is the property of its rightful owner.
Sponsored Links
1 / 21

Ανάλυση Πολλαπλής Παλινδρόμησης PowerPoint PPT Presentation


  • 95 Views
  • Uploaded on
  • Presentation posted in: General

Ανάλυση Πολλαπλής Παλινδρόμησης. y = b 0 + b 1 x 1 + b 2 x 2 + . . . b k x k + u 9. Προβλήματα Προσδιορισμού και Δεδομένων. Συναρτησιακή Μορφή . Μπορούμε να δούμε ότι μία γραμμική παλινδρόμηση μπορεί να μοντελοποιήσει μη-γραμμικές σχέσεις.

Download Presentation

Ανάλυση Πολλαπλής Παλινδρόμησης

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


S ap ad s

Ανάλυση Πολλαπλής Παλινδρόμησης

y = b0 + b1x1 + b2x2 + . . . bkxk + u

9. Προβλήματα Προσδιορισμού και Δεδομένων


S ap ad s

Συναρτησιακή Μορφή

  • Μπορούμε να δούμε ότι μία γραμμική παλινδρόμηση μπορεί να μοντελοποιήσει μη-γραμμικές σχέσεις.

  • Μπορούμε να χρησιμοποιήσουμε logs στην y ή στις x μεταβλητές ή και στις δύο

  • Μπορούμε να χρησιμοποιήσουμε δευτεροβάθμιους όρους για τιςx’s μεταβλητές

  • Μπορούμε να χρησιμοποιήσουμε αλληλοεπιδράσεις μεταξύ τωνxμεταβλητών

  • Πως γνωρίζουμε εάν έχουμε επιλέξει την σωστή συναρτησιακή μορφή για το μοντέλο μας;


S ap ad s

Συναρτησιακή Μορφή (συνέχεια)

  • Πρώτον, η χρήση οικονομικής θεωρίας μπορεί να μας καθοδηγήσει

  • Σκεφτόμαστε σχετικά με την ερμηνεία των αποτελεσμάτων

  • Κάνει περισσότερο νόημα ότιxεπηρεάζει τηνyποσοστιαία (χρησιμοποίησε logs) ή σε απόλυτους όρους;

  • Κάνει περισσότερο νόημα ότι η παράγωγος τουx1επηρεάζει τηνx1 (δευτεροβάθμια) ή τηνx2 (αλληλεπίδραση) ή είναι σταθερή;


S ap ad s

Συναρτησιακή Μορφή (συνέχεια)

  • Ήδη γνωρίζουμε πώς να ελέγξουμε τους συνδυασμένους περιορισμούς αποκλεισμού για να δούμε εάν όροι υψηλότερης τάξης ή αλληλοεπιδράσεις ανήκουν στο μοντέλο.

  • Γενικάμπορεί να είναι βαρετό να προσθέτουμε και να ελέγχουμε επιπρόσθετους όρους, συν ότι μπορούμε να βρούμε έναν δευτεροβάθμιο όρο να συμβάλει στο μοντέλο καλύτερα όταν χρησιμοποιούμε logs.

  • Ένα τεστ της συναρτησιακής μορφής είναι το RESET (Ramsey’s regression specification error test), τεστ για το σφάλμα προσδιορισμού της παλινδρόμησης.


Ramsey s reset

Ramsey’s RESET

  • Το RESET βασίζεται σε ένα τέχνασμα παρόμοιο με αυτό στην ειδική μορφή του White τεστ

  • Αντί να προσθέσουμε συναρτήσεις τωνxάμεσα, μπορούμε να προσθέσουμε και να ελέγξουμε συναρτήσεις τουŷ.

  • Έτσι, εκτιμούμεy = b0 + b1x1 + … + bkxk + d1ŷ2 + d2ŷ3 +errorκαι ελέγχουμε

  • H0: d1 = 0, d2 = 0 χρησιμοποιώντας

    F~F2,n-k-3ήLM~χ22


S ap ad s

Εναλλακτικοί Μη Ένθετοι Έλεγχοι

  • Εάν δύο μοντέλα έχουν τις ίδιες εξαρτημένες, αλλάμη-ένθετες (non-nested)xμπορούμε ακόμα να εκτελέσουμε το μοντέλο που περιέχει όλες τιςxμεταβλητές, και από τα δύο μοντέλα, και να ελέγξουμε τους συνδυασμένους περιορισμούς αποκλεισμού που οδηγούν στο ένα ή στο άλλο μοντέλο

  • Ένα εναλλακτικό τεστ, το Davidson-MacKinnon τεστ, χρησιμοποιεί ŷαπό το ένα μοντέλο ως παλινδρομούσα μεταβλητή στο δεύτερο μοντέλο και ελέγχει την σημαντικότητα


S ap ad s

Εναλλακτικοί Μη Ένθετοι Έλεγχοι (συνέχεια)

  • Είναι πιο δύσκολο εάν το ένα μοντέλο χρησιμοποιεί τηνyκαι το άλλο μοντέλο χρησιμοποιεί ln(y)

  • Μπορούμε να ακολουθήσουμε κάποια κοινή λογική και να μετασχηματίσουμε τις προβλεπόμενες τιμέςτης ln(y) και να πάρουμεŷγια το δεύτερο βήμα

  • Σε κάθε περίπτωση, το Davidson-MacKinnon τεστ ενδέχεται να μην απορρίψει κανένα μοντέλο ή να απορρίψει και τα δύο μοντέλα χωρίς να προτιμήσει ξεκάθαρα κάποιον προσδιορισμό


S ap ad s

Αντιπροσωπευτικές Μεταβλητές

  • Τι γίνετε αν το μοντέλο δεν είναι καλά προσδιορισμένο επειδή δεν υπάρχουν δεδομένα για μία σημαντικήxμεταβλητή;

  • Ενδέχεται να είναι εφικτή η αποφυγή της μεροληψίας, λόγω μιας παραλειπόμενης μεταβλητής, με την χρήση μιας αντιπροσωπευτικής μεταβλητής.

  • Μία αντιπροσωπευτική μεταβλητή πρέπει να συσχετίζεται με την παραλειπόμενη μεταβλητή – για παράδειγμα:x3* = d0 + d3x3 + v3, όπου * σημαίνει παραλειπόμενη.

  • Τώρα υποθέστε ότι απλά αντικαθιστούμε τηνx3για τηνx3* .


S ap ad s

Αντιπροσωπευτικές Μεταβλητές (συνέχεια)

  • Τι χρειαζόμαστε για αυτή τη λύση να δίνει συνεπή εκτιμητές γιαb1καιb2;

  • E(x3* | x1, x2, x3) = E(x3* | x3) = d0 + d3x3

  • Δηλαδή,το uδεν συσχετίζεται με τιςx1, x2καιx3*,καιv3δεν συσχετίζεται με τιςx1, x2καιx3

  • Δηλαδή τρέχουμε στην πραγματικότητα το

    y = (b0 + b3d0) + b1x1+ b2x2 + b3d3x3 + (u + b3v3)

    ορίζοντας εκ-νέου την τεταγμένη της αρχής, το σφάλμα, και τον συντελεστή τηςx3


S ap ad s

Αντιπροσωπευτικές Μεταβλητές (συνέχεια)

  • Χωρίς υποθέσεις, μπορεί να καταλήξουμε με μεροληπτικούς εκτιμητές

  • Ας ορίσουμεx3* = d0 + d1x1 + d2x2 + d3x3 + v3

  • Δηλαδή τρέχουμε στην πραγματικότητα το

    y = (b0 + b3d0) + (b1 + b3d1) x1+ (b2 + b3d2) x2 + b3d3x3 + (u + b3v3)

  • Η μεροληψία θα εξαρτάται από τα πρόσημα των b3καιdj

  • Αυτή η μεροληψία ενδέχεται να είναι μικρότερη από αυτή που παίρνουμε αν παραλείψουμε μια μεταβλητή, παρόλα αυτά.


S ap ad s

Εξαρτημένες Μεταβλητές με Χρονική Υστέρηση

  • Τι μπορούμε να κάνουμε αν υπάρχουν παραλειπόμενες μεταβλητές, και δεν μπορούμε να βρούμε αντιπροσωπευτικές μεταβλητές;

  • Ενδέχεται να είναι δυνατόν να περιλάβουμε μία εξαρτημένη μεταβλητή με υστέρηση για λογαριασμό των παραλειπόμενων μεταβλητών οι οποίες συμβάλουν στις τιμές τουyστο παρόν αλλά και στο παρελθόν.

  • Φυσικά, πρέπει να σκεφτούμε αν οι τιμές τουyαπό το παρόν και το παρελθόν συσχετίζονται και αν κάνει αυτό νόημα.


S ap ad s

Σφάλμα Μέτρησης

  • Κάποιες φορές έχουμε την μεταβλητή την οποία χρειαζόμαστε, αλλά νομίζουμε ότι την μετράμε με σφάλμα

  • Παραδείγματα: Σε μία καταγραφή ρωτάμε πόσες ώρες δουλέψατε τον τελευταίο χρόνο, ή πόσες εβδομάδες φροντίσατε το παιδί σας όταν ήταν μικρό

  • Ένα σφάλμα στηνyέχει διαφορετική επίπτωση από ότι ένα σφάλμα στηνx


S ap ad s

Σφάλμα Μέτρησης στην Εξαρτημένη Μεταβλητή

  • Ορίζουμε το σφάλμα μέτρησηςως e0 = y – y*

  • Έτσι, στην πραγματικότητα εκτιμούμε

    y = b0 + b1x1 + …+ bkxk + u + e0

  • Πότε ο OLS θα παράγει αμερόληπτα αποτελέσματα;

  • Εάν e0με ταxjκαιuείναι ασυσχέτιστα τότε ο OLS είναι αμερόληπτος.

  • Εάν E(e0) ≠ 0 τότεο b0θα είναι μεροληπτικός, παρόλα αυτά

  • Παρόλο που είναι αμερόληπτος, έχουμε μεγαλύτερες διακυμάνσεις από ότι χωρίς σφάλμα μέτρησης


S ap ad s

Σφάλμα Μέτρησης σε μία Ερμηνευτική Μεταβλητή

  • Ορίζουμε το σφάλμα μέτρησηςωςe1 = x1 – x1*

  • Υποθέστε E(e1) = 0 , E(y| x1*, x1) = E(y| x1*)

  • Στην πραγματικότητα εκτιμούμε

    y = b0 + b1x1 + (u – b1e1)

  • Η επίδραση του σφάλματος μέτρησης των OLS εκτιμητών εξαρτάται από την υπόθεση σχετικά με την συσχέτιση μεταξύ τωνe1καιx1

  • Υποθέστε ότι Cov(x1, e1) = 0

  • OLS παραμένει αμερόληπτος, αλλά με μεγαλύτερη διακύμανση


S ap ad s

Σφάλμα Μέτρησης σε μία Ερμηνευτική Μεταβλητή (συνεχ)

  • Υποθέστε Cov(x1*, e1) = 0, γνωστή ως η κλασική υπόθεση για τα σφάλματα μέτρησης, τότε

  • Cov(x1, e1) = E(x1e1) = E(x1*e1) + E(e12) = 0 + se2

  • x1συσχετίζεται με το σφάλμα έτσι ο εκτιμητής είναι μεροληπτικός


S ap ad s

Σφάλμα Μέτρησης σε μία Ερμηνευτική Μεταβλητή (συνεχ)

  • Σημειώστε ότι το σφάλμα είναιανάλογο του Var(x1*)/Var(x1)

  • Αφού Var(x1*)/Var(x1) < 1, ο εκτιμητής είναι μεροληπτικός προς το 0 – καλούμενο σφάλμα μετριασμού

  • Το παρόν θέμα είναι πιο πολύπλοκο στην πολλαπλή παλινδρόμηση, αλλά μπορεί να αναμένεται ακόμα σφάλμα μετριασμού με κλασικά λάθη στις μεταβλητές


S ap ad s

Ελλιπή Δεδομένα – Υπάρχει Πρόβλημα;

  • Εάν κάθε παρατήρηση σε μία μεταβλητή είναι ελλιπής, δεν μπορεί να χρησιμοποιηθεί στο μοντέλο

  • Εάν τα δεδομένα είναι τυχαία ελλιπή, μπορούμε να περιορίσουμε το δείγμα με μεταβλητές χωρίς ελλιπή δεδομένα, αλλά μειώνεται ο αριθμός του δείγματος.

  • Πρόβλημα υπάρχει όταν τα δεδομένα είναι ελλιπή με κάποιο συστηματικό τρόπο – π.χ. άτομα με πολύ υψηλά εισοδήματα αρνούνται να αποκαλύψουν τα εισοδήματα τους


S ap ad s

Μη Τυχαία Δεδομένα

  • Εάν το δείγμα επιλέγεται βάση μιαςxμεταβλητής, τότε οι εκτιμητές είναι αμερόληπτοι.

  • Εάν το δείγμα επιλέγεται βάση τηςyμεταβλητής, τότε έχουμε μεροληψία με την επιλογή του δείγματος.

  • Η επιλογή του δείγματος μπορεί να είναι πιο περίπλοκο

  • Π.χ. Μελετώντας τους μισθούς των εργαζομένων – αφού οι εργαζόμενοι επέλεξαν να εργασθούν δεν είναι το ίδιο όπως προσφορά μισθών. Για όσους δεν εργάζονται δεν μπορούμε να προσδιορίσουμε την προσφορά μισθού


S ap ad s

Απομονωμένες Παρατηρήσεις ή Παρατηρήσεις που Ασκούν Επιρροή

  • Κάποιες φορές μία παρατήρηση ενός ατόμου μπορεί να είναι πολύ διαφορετική από τις υπόλοιπες, και μπορεί να έχει μία μεγάλη επίδραση στα αποτελέσματα

  • Κάποιες φορές αυτή η ακραία παρατήρηση μπορεί και να είναι απλά ένα λάθος στα δεδομένα – ένας λόγος για τον οποίο η μελέτη μερικών στατιστικών στοιχείων (summary statistics) είναι σημαντική

  • Κάποιες φορές αυτή η απομονωμένη παρατήρηση μπορεί και να είναι πραγματικά πολύ διαφορετική από τις άλλες


S ap ad s

Απομονωμένες Παρατηρήσεις ή Παρατηρήσεις που Ασκούν Επιρροή (συνέχεια)

  • Δεν είναι παράλογο να διορθώσεις παρατηρήσεις για τις οποίες είναι προφανές ότι υπάρχει ένα επιπλέον 0 ή ότι έχει παραληφθεί, κ.λ.π.

  • Δεν είναι παράλογο να παραλήψεις παρατηρήσεις οι οποίες εμφανίζονται να είναι πολύ ακραίες τιμές, αν και οι αναγνώστες επιθυμούν να βλέπουν εκτιμητές με και χωρίς απομονωμένες τιμές

  • Μία ανθεκτική μέθοδο για απομονομένες παρατηρήσεις είναι η εκτίμηση με ελάχιστες απόλυτες αποκλίσεις.

  • Μπορούμε να χρησιμοποιήσουμε στατιστικά πακέτα π.χ. Stata για τον έλεγχο απομονωμένων τιμών.


Eview commands

Eview Commands

  • RESET -> Αφού κανετε παλινδρόμηση επιλεξτε στο νέο παράθυρο, Equation: ….

    View/Stability Tests/Ramsey RESET Test…

  • Quick/Estimate Equation… επιλέξτε μέθοδο εκτίμησης: QREG - Quantile Regression (including LAD) ..... και εκτελέστε την παλινδρόμηση


  • Login