ГЕТЕРОСКЕДАСТИЧНОСТЬ
Download
1 / 37

ГЕТЕРОСКЕДАСТИЧНОСТЬ - PowerPoint PPT Presentation


  • 125 Views
  • Uploaded on

ГЕТЕРОСКЕДАСТИЧНОСТЬ. случайного члена. Нарушение 2-го условия Гаусса-Маркова: σ 2 u i =  2 = const для всех i . В случае ГСК: σ 2 u i =  2 i. Т. е. дисперсия случайного члена оказывается различной в разных наблюдениях.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' ГЕТЕРОСКЕДАСТИЧНОСТЬ' - harvey


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

ГЕТЕРОСКЕДАСТИЧНОСТЬ

случайного члена


Нарушение 2-го условия Гаусса-Маркова:

σ2ui = 2 = const для всех i.

В случае ГСК:

σ2ui= 2i.


Т. е. дисперсия случайного члена оказывается различной в разных наблюдениях.

ГСК – неоднородность дисперсии случайного члена модели регрессии.



E(Y|X) = β1 + β2*X форм.

Есть гетероскедастичность


E(Y|X) = β1 + β2*X форм.

Есть гетероскедастичность


Наиболее часто ГСК встречается в случае использования в уравнении регрессии перекрестных данных.


ГСК становится проблемой, когда значения переменных значительно различаются в различных наблюдениях.


Пусть, например, значения переменных значительно различаются в различных наблюдениях.

EEi =  + *GNPi + ui (*)

где

EEi– государственные расходы на образованиев i-й стране;

GNPi – ВНП i-й страны.


В среднем государства тратят на образование где-то 6% от ВНП, т.е. 0,06.

В то же время отклонения от этой нормы в ту или другую сторону для разных стран может быть от 1% до 3%. Но если для Уругвая, например, этот разброс вокруг среднего составит до 0,03*5,87 млрд. $ = 0,18 млрд $, то для США 0,03*2586,4 млрд.$ =77,6 млрд.$.


ГСК может встречаться в уравнениях регрессии, использующих временные ряды, если, например, при увеличении X и Y со временем, σ2uiтакже будет расти.


Следствия ГСК уравнениях регрессии, использующих временные ряды, если, например, при увеличении


  • МНК-оценки коэффициентов регрессии, полученные по МНК, остаются несмещенными и состоятельными.

  • Оценки коэффициентов перестают быть наилучшими, т.е. наиболее эффективными. Можно указать другой метод, который будет давать более эффективные несмещенные, линейные оценки.


  • Полученные по МНК с.о. коэффициентов уравнения регрессии оказываются смещенными (чаще всего – заниженными). Поэтому t- и F–тесты становятся некорректными.


Чаще всего, коэффициентов уравнения регрессии оказываются смещенными (чаще всего – заниженными). Поэтому t-статистики оказываются завышенными, а поэтому незначимые коэффициенты могут оказаться значимыми.


Обнаружение ГСК коэффициентов уравнения регрессии оказываются смещенными (чаще всего – заниженными). Поэтому


ГСК имеет множество разных форм. Конкретная ее форма в данном уравнении регрессии почти никогда неизвестна.

Поэтому нет универсального, общепризнанного формального теста для обнаружения ГСК.

Поэтому же большинство тестов на ГСК предполагают и обнаруживают только некоторую ее форму.


Часто предполагается, что Конкретная ее форма в данном уравнении регрессии почти никогда неизвестна.σ2uiпропорциональны квадрату какой-то переменной (фактору пропорциональности - фп) Zi:

σ2ui= 2i = 2*Z2i, для всех наблюдений i.


В качестве фп Конкретная ее форма в данном уравнении регрессии почти никогда неизвестна.Z могут выступать :

  • одна из независимых переменных регрессии;

  • комбинация из нескольких регрессоров модели;

  • фактор (или комбинация факторов), не входящих в модель.


  • Графический метод выявления ГСК. Конкретная ее форма в данном уравнении регрессии почти никогда неизвестна.

    Строится точечная диаграмма значений e2iили lne2iпо фактору пропорциональности Z.

    (e2iиспользуется как оценка для 2i = σ2ui.

    lne2i используется для уменьшения масштаба точечной диаграммы.)


Чаще всего точечная диаграмма значений e2i или lne2i строится по очереди по каждой из независимых переменных модели.

Визуально по диаграмме пытаются определить наличие ГСК. При ГСК точки не будут идти «ровно» вдоль горизонтальной оси (оси OZ).


  • Тест Голдфелда-Квандта. значений

    Предположения теста:

  • σ2ui, т.е. 2i пропорциональна Z2i, где Z - какая-то переменная.

  • ui ~ N(0, 2i) и не подвержена автокорреляции.


Выполнение теста: значений

  • выборку упорядочивают по возрастанию Z;

  • упорядоченную выборку размера n делят на три части размеров n1, n2, n3 ( обычно n1= n3=3*n/8); среднюю часть далее не рассматривают;

  • оценивают уравнения регрессии (1) и (3) отдельно для 1-й и 3-й частей и получают соответствующие им RSS1и RSS3;



  • при уровне значимости значений αнаходят

    Fкр(n3-k; n1-k; α)

    (или Fкр(n1-k; n3-k; α));

  • если Fстат >Fкр, гипотеза о гомоскедастичности отвергается при уровне значимости α, т. е. имеет место ГСК.



  • Пусть в модели значений

    Yi = 1+ 2*X2i + … + kXki + ui

    имеется ГСК, т.е.

    σ2ui= 2i

    и значения 2iнам известны.

    Тогда переходим к модели

    vi = ui / i .


В этой модели дисперсия случайного члена

Дисперсия(vi) = Дисперсия(ui / i) = Дисперсия(ui )/ i2= 1 =const,

т.е. проблема ГСК снята.

Т.о., при известных 2i

для преодоления ГСК мы вводим веса wi = 1/ i, «взвешиваем» переменные:

Y/i = Yi*wi, X/ji = Xji*wi,

вводим новую переменную q/i = 1/ i, и оцениваем модель без свободного члена:


Y случайного члена/i =β1*q/i + 2*X/2i + … + k*X/ki + ui (*)

Тогда в уравнении

= b1*q/i + b2*X/2i + … + bk*X/ki (**)

Оценки b1,…,bkсвободны от последствий ГСК, т.е. не только несмещенные, но и эффективные. Их с.о. также несмещенные.


Важное замечание. случайного члена

В уравнении (**) оценки b1,…,bk получены не по МНК, а по методу взвешенных наименьших квадратов (МВНК), который является частным случаем так называемого обобщенного МНК (ОМНК).

При МВНК минимизируется взвешенная сумма квадратов


Второе важное замечание. случайного члена

В (*) наименьшие веса wi = 1/ i получают точки выборки, которые далеки от линии регрессии. И, наоборот, точки, близкие к этой линии получают наибольшие веса.


К сожалению, на практике значения 2i

почти никогда неизвестны.


2) Случай, когда известен фактор пропорциональности Z.

σ2ui = 2i = 2*Z2i, т.е.

i= * Zi

(а значит, Zi= i/ ).

Вводят веса wi = 1/Ziи взвешивают обе части модели:

Yi/Zi = 1/ Zi + 2*X2i / Zi + … + kXki / Zi + ui / i (***)


При этом пропорциональности

Дисперсия(ui /Zi) = Дисперсия(ui /(i / )) =Дисперсия(ui )* 2/ 2i = 2=const,

т.е. проблема ГСК снята.

Т.о. в случае известного фп Z от исходной модели переходят к модели (***).

Очень часто в качестве известного фп Z выступает какая-то из независимых переменных модели.


3) Оценки с.о. по методу Уайта. пропорциональности

Сами оценки коэффициентов рассчитываются по МНК, а с.о. – по методу, который позволяет избежать их смещения.

С такими с.о. можно работать, они корректны, с ними можно считать t-статистики и проводить t-тесты.


4 пропорциональности ) Существуют методы, относящиеся к МВНК, в которых устраняются ГСК вида:

2i = 0 + 1*Z1i +…+ p*Zpi + vi.

где

Z1,…,Zp- известные переменные,

0,…,p - параметры,

vi - удовлетворяет условиям Г-М.


ad