Фиктивные переменные
Download
1 / 11

Фиктивные переменные - PowerPoint PPT Presentation


  • 152 Views
  • Uploaded on

Фиктивные переменные. Опр. Фиктивная переменная – сконструированная количественная переменная, описывающая качественные факторы. Примеры качественных факторов: пол профессия образование климатические условия принадлежность к какой-либо группе

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Фиктивные переменные' - mariam-david


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

Опр. Фиктивная переменная – сконструированная количественная переменная, описывающая качественные факторы

  • Примеры качественных факторов:

    • пол

    • профессия

    • образование

    • климатические условия

    • принадлежность к какой-либо группе

  • Возможные пути учета качественного фактора:

    • оценивание отдельных регрессий для каждой категории с последующим выяснением значимо ли отличаются коэффициенты;

    • оценивание единой регрессии с введенной фиктивной переменной и измерением степени влияния качественного фактора.


Пример 1.Анализ зависимости урожайности пшеницы от вида вспашки и количества внесенного органического удобрения

  • Пусть y – урожайность пшеницы,

    x – количество внесенного удобрения,

    z – вид вспашки.

    z=1 – для зяблевой вспашки,

    z=0 – для весенней вспашки.

  • Результаты регрессионного анализа без учета вида вспашки

    F=8,7 ta=11,9 tb=2,95 rxy=0,5246

    Вывод: уравнение регрессии статистически значимо.


2) Результаты регрессионного анализапо отдельным видам вспашки

3)Результаты регрессионного анализа с учетом вида вспашки путем введения фиктивной переменной z

F=15,6R=0,766 ta=11,8tb=3,9 td=4,1rxz=-0,016


Общий случай

  • Пусть качественный фактор имеет число градаций больше двух:

    • тогда в модель вводим несколько фиктивных переменных, число которых меньше числа качественных градаций;

    • одна из градаций выбирается как эталонная (для нее значения фиктивных переменных равны 0) и определяются значения фиктивных переменных для всех остальных градаций.

      Пример 2. Анализ зависимости цены двухкомнатной квартиры от полезной площади с учетом качества (типа) дома.

      Тип дома: «хрущевка», панельный, кирпичный.

      Решение. Введем две фиктивные переменные: z1 и z2.

      Эталонная категория – «хрущевка».


Замечание 1: параметры при фиктивных переменных представляют собой разность между средними уровнями результативного признака для соответствующей группы и эталонной группы.

Замечание 2: целью включения фиктивной переменной может быть желание отразить в модели неоднородность данных.

Замечание 3: рассмотренный метод фиктивной переменной предполагает равенство коэффициентов регрессии при x по частным совокупностям и возможность их замены общим коэффициентом регрессии.


Множественные совокупности фиктивных переменных

  • Если имеются данные, собранные как по ряду количественных факторов, так и по ряду качественных факторов, то в уравнение регрессии включаются более одной совокупности фиктивных переменных.

    Пример 3. Исследуется зависимость веса новорожденного от интенсивности курения матери с учетом семейного положения и рожала ли ранее или нет.

    y - вес новорожденного

    x - количество сигарет, выкуриваемых в день будущей матерью

    d - рожала ли в прошлом

    s - семейное положение


  • 1) Замужняя мать, первые роды фиктивных переменныхs=0, d=0

  • 2) Одинокая мать, первые роды s=1, d=0

  • 3) Замужняя мать, не первые роды s=0, d=1

  • 4) Одинокая мать, не первые роды s=1, d=1

    Эталонная категория – первая.

    Результат исследования данных (США):


Фиктивные переменные для коэффициента наклона

  • Пример 4. Исследуется зависимость веса новорожденного от интенсивности курения матери и фиктивной переменной числа родов в прошлом.

    Рассмотрим две модели:

    а)

    воздействие курения матери на вес новорожденного не зависит от номера родов;

    б)

    воздействие курения матери на вес новорожденного зависит от того, рожала раньше или нет

    d=0

    d=1


Взаимодействие между фиктивными переменными

  • Вернемся к примеру 3.

    Введем фиктивную переменную взаимодействия (sd), которую определим как произведение s и d.

    (sd)=1 для одиноких матерей, рожавших ранее

    (sd)=0 в остальных случаях

    Модель

    или

    Результат

    с.о. (18) (28) (52) (115) (2,1)


Тест Чоу переменными

  • Пусть имеется выборка, состоящая из двух подвыборок.

    Вопрос:следует ли их объединить для оценивания общей регрессии P или оценить отдельные регрессии A и B?

    Обозначим: UA– сумма квадратов остатков выборки A

    UB– сумма квадратов остатков выборки B

    UP– сумма квадратов остатков объединенной выборки

    F-статистика:

    Вывод: если F>Fтабл - не следует оценивать объединенную выборку

    Что делать?

    Ввести фиктивные переменные, позволяющие не задавать заранее какой-либо коэффициент одинаковым для обеих подвыборок.