520 likes | 667 Views
ПодобрÑване на качеÑтвото на модела. КачеÑтво на модела Включване и изключване на променливи ТеÑтване на Ð¾Ð³Ñ€Ð°Ð½Ð¸Ñ‡ÐµÐ½Ð¸Ñ Ð·Ð° коефициентите СтабилноÑÑ‚ на модела. ВъпроÑи на качеÑтвото Ñ Ð¿Ñ€Ð°ÐºÑ‚Ð¸Ñ‡ÐµÑко значение. Кои Ñа характериÑтиките на Ð´Ð¾Ð±Ñ€Ð¸Ñ Ð¼Ð¾Ð´ÐµÐ»
E N D
Подобряване на качеството на модела • Качество на модела • Включване и изключване на променливи • Тестване на ограничения за коефициентите • Стабилност на модела
Въпроси на качеството с практическо значение • Кои са характеристиките на добрия модел • Какви са възможните грешки, ако разработения модел се отличава от “идеалния” – грешки на спецификацията на модела • Какви са последиците от тях • Как да се открият грешките от лоша спецификация на модела
Добрият модел е: (по Харви) • Достатъчно опростен, но запазващ характеристиките на процеса • Еднозначно решен спрямо дадена извадка • С възможно най-висок коефициент на детерминация • Верифициран с икономическата теория • Направената прогноза и действителната реализация са близки
Възможните грешки -спецификация на модела • Некоректна спецификация • Има пропусната ключова праменлива • Има включена излишна променлива • Избрана е некоректна функционална форма
Грешки на спецификацията • Пропуснат съществен фактор – лоша спецификация • Няма специализирани тестове • Индиректно – коефициента на детерминация • Тестове за добавяне на променлива
Пропуснат фактор - последици • Пропуснатия фактор се корелира с включени в модела фактори • Некоректна оценка на коефициентите –коректния коефициент ще бъде по-голям от оценката при позитивна корелация и обратно • Некоректен свободен член (дори и ако пропуснатия фактор не се корелира с фактор от модела) • Некоректно оценена стандартна грешка на модела • Намаляване силете на тестовете – некоректни заключения
2-Apr-2002 10:02:02 Ordinary Least Squares Estimation ****************************************************************************** Dependent variable is Q12105 50 observations used for estimation from 1995M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C .22785 .052291 2.5552[.000] T -.3225E-3 .2771E-3 -.57589[.502] P12105 -.2913E-3 .5808E-3 -.82592[.001] P12102 -.7579E-3 .2930E-3 -1.5577[.125] P12103 -.8552E-3 .2350E-3 -3.5287[.001] P12104 .0012251 .5052E-3 2.8525[.005] ****************************************************************************** R-Squared .62522 R-Bar-Squared .58089 S.E. of Regression .234218 F-Stat. F( 5, 53) 30.5201[.000] Mean of Dependent Variable .31225 S.D. of Dependent Variable .170551 Residual Sum of Squares .055735 Equation Log-likelihood 119.3572 Akaike Info. Criterion 112.3572 Schwarz Bayesian Criterion 105.0272 DW-statistic 1.5925 ******************************************************************************
2-Apr-2002 10:02:02 Ordinary Least Squares Estimation ****************************************************************************** Dependent variable is Q12105 50 observations used for estimation from 1995M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C .22785 .052291 2.5552[.000] T -.1275 .1012771 -.57589[.002] P12105 -.2913 .0075808 -.82592[.035] P12102 -.3254 .0562930 -1.5577[.075] P12103 -.1236 .0092350 -3.5287[.001] P12104 .0875 .0245052 2.8525[.002] INCOME .2150 .1002592 8.2892[.000] ****************************************************************************** R-Squared .77522 R-Bar-Squared .75089 S.E. of Regression .035218 F-Stat. F( 5, 53) 30.5201[.000] Mean of Dependent Variable .31225 S.D. of Dependent Variable .010551 Residual Sum of Squares .055735 Equation Log-likelihood 119.3572 Akaike Info. Criterion 112.3572 Schwarz Bayesian Criterion 105.0272 DW-statistic 1.6225 ******************************************************************************
“Излишна” променлива • Включена е “излишна” променлива • “Излишна” – няма теоретични основания за включването й • Може да се установи само индиректно – логически • На практика се случва когато: • Теоретично неизяснени проблеми • Няма практически разработки • Теорията не е достатъчно формализирана
“Излишна” променлива - последици • Не променя или увеличава R2 • Оценките са коректни, но • с голяма стандартна грешка • некоректни заключения за статистическата значимост • Води до изключване от модела на статистически значима променлива
“Излишна” променлива - последици • Тестовете за модела като цяло – коректни • Необходима по-голяма извадка за “добри” оценки Извод По-добре да се включи излишна обясняваща променлива, отколкото да се изпусне съществен фактор
Некоректна функционална форма • Икономическата теория не се интерисува от функционална форма на модела • От практическа гледна точка – това е от съществено значение • Индикация за некоректна форма – диагностичния тест • Правила за правилно определяне на функционална форма – няма • Памага – натрупания опит
Препоръчителни функционални форми • Определяне на теоретични еластичности – двойно логаритмична функция • Обуславя се от същността на логаритмичната функция – процентно изменение
Препоръчителни функционални .... • Анализ на темпа – полу-логаритмична функция от номиналното изменение на факторите • Позволява да се определи % изменение на зависимата променлива при определено номинално изменение на факторите
Препоръчителни функционални .... • Анализ на абсолютното нарастване – полу-логаритмична функция от релативнато изменение на факторите • Позволява да се определи номиналното изменение на зависимата променлива при определено релативно изменение на факторите
Препоръчителни функционални .... • Анализ и определяне на абсолютното нарастване в зависимост от времето (във финансовите анализи) – модели на линейния тренд • Позволява да се определи абсолютното изменение на зависимата променлива спрямо началото на периода
Препоръчителни функционални .... • Анализ и определяне на постоянните разходи за 1-ца продукция – реципрочна функция • От теорията – постоянните разходи намаляват асимптотично да определено равнище
Препоръчителни функционални .... • Анализ и определяне на относителния дял на разходите за потребление на даден продукт – реципрочна функция (крива на Енджел) • Практически установено
Препоръчителни функционални .... • Анализ и определяне на средния доход от безработицата – реципрочна функция (крива на Филипс) • Практически установено- има допълнителни ограничения а0 <0 и а1 >0
Препоръчителни функционални .... • Анализ и определяне на маржиналните и средни разходи за производство – полином от 3-та степен • Практически установено- има допълнителни ограничения: • а0, а1 и a3>0 ; • а2<0 и • a22<3a1 a3 • 8a3
Показатели за оценка • Основен показател - R2 • Изискване за директно сравняване – зависимата променлива да е една и съща • Един и същи показател • В една и съща функционална зависимост • Причина – не могат да се сравняват величини с различни измерения
При необходимост от промени в модела • Могат да се използват резултати получени за други периоди • Пример Q = a0 + a1P + a2Income – проблем при оценката от друг анализ - еластичността на дохода - 0.7 Трансформация Q* = Q – 0,7*Income Q* = a0 + a1P
Друг тип трансформации • При агрегирани данни • Преизчисляването им на база на човек от населението – анализ на вноса от изменението на ценовото равнище и БВП • Разделяне на двете страни на единият от факторите Q = a0 + a1P + a2Income /Income (Q/Income) = b0 + b1(P/Income)
Друг тип трансформации • Използване на първите разлики вместо самите показатели Q = a0 + a1P + a2Income ΔQ = a0 + a1 ΔP + a2 ΔIncome • Използване на някаква функция от показателите (логаритмична)
Добавяне на променлива • Използва се за проверка дали включването на даден показател ще подобри модела • Докога продължава процеса –преизчисления R2 се увеличава: • ItI – по-голяма от 1 • От следрегресионното меню • H0: ak = am = al = =0 • Приемането на H0- добавените променливи не подобряват модела • Отхвърлянето на H0- факторите трябва да бъдат включени в модела
10-May-2003 0:54:33 Variable Addition Test (OLS case) ****************************************************************************** Dependent variable is Q12102 List of the variables added to the regression: P12101 60 observations used for estimation from 1996M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C -.064037 .066828 -.95823[.342] T .6945E-3 .5623E-3 1.2350[.222] P12102 -.0011191 .4795E-3 -2.3340[.023] P12106 .0015867 .9152E-3 1.7337[.089] P12104 -.6497E-5 .2326E-3 -.027930[.978] P12105 -.1219E-3 .5165E-3 -.23590[.814] INCOME .6038E-5 .2523E-5 2.3927[.020] P12101 -.5055E-4 .4424E-3 -.11427[.909] ****************************************************************************** Joint test of zero restrictions on the coefficients of additional variables: Lagrange Multiplier Statistic CHSQ( 1)= .015063[.902] Likelihood Ratio Statistic CHSQ( 1)= .015065[.902] F Statistic F( 1, 52)= .013058[.909] ******************************************************************************
Изключване на променлива • Използва се за проверка дали изключването на даден показател ще подобри модела • От следрегресионното меню • H0: ak = am = al = =0 • Приемането на H0- изключването на променливите не влошава модела • Отхвърлянето на H0- факторите не могат да бъдат изключени от модела
10-May-2003 0:53:26 Variable Deletion Test (OLS case) ****************************************************************************** Dependent variable is Q12102 List of the variables deleted from the regression: C T P12105 60 observations used for estimation from 1996M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] P12102 -.9239E-3 .3828E-3 -2.4134[.019] P12106 .8964E-3 .3135E-3 2.8589[.006] P12104 -.8165E-4 .1930E-3 -.42307[.674] INCOME .6801E-5 .1478E-5 4.6017[.000] ****************************************************************************** Joint test of zero restrictions on the coefficients of deleted variables: Lagrange Multiplier Statistic CHSQ( 3)= 2.4861[.478] Likelihood Ratio Statistic CHSQ( 3)= 2.5391[.468] F Statistic F( 3, 53)= .76366[.519] ******************************************************************************
Икономическа адекватност на модела • Проверка на знаците на регресионните коефициенти • Проверка на други детерминирани връзки между коефициентите • За еластичностите на заместване – сумата от еластичностите = 0 • За проверка на ефекта от инвестиции – сбора от коефициентите пред разходите за труд и капитал = 1
Сравняване на модели • Позволяват да се провери степента на годност на даден модел, спрямо степента на годност на друг модел • Моделите – една и съща зависима променлива • Тестове за непокриващи се хипотези • Две хипотези се наричат непокриващи се, ако независимите променливи включени в първата хипотеза не се явяват независими променливи по отношение на втората хипотеза.
Тестове за непокриващи се хипотези • Обхващащ или заграждащ тест. • Той работи с 2 модела, като позволява част от независимите променливи на първия модел да се включват и като независими променливи и във втория модел • Анализира комбинирания модел
Обхващащ тест • Параметрите на този обобщен модел се тестват за следните ограничения: • с=0 • b=0 • Ако ограничението с=0 се приема, това практически означава отхвърляне на хипотезата Н1, спрямо хипотезата Н0 • Ако ограничението с=0 се отхвърли - отхвърляне на хипотезата Н0 в полза на хипотеза Н1
Обхващащ тест ... • Ако ограничението b=0 се приеме - приемане на хипотезата Н1, спрямо хипотезата Н0 • Ако ограничението b=0 се отхвърли - приемане на хипотезата Н0 спрямо хипотеза Н1
Обхващащ тест ... • Недостатъци • 2 проблема • в комбинирания модел остават общите за двата първоначални модела променливи и тестването на ограниченията b=0 или c=0 не дава никаква информация за тези общи независими променливи • че броят на независимите променливи във хибридния модел може да се окаже твърде голям и да възникне проблем с колинеарността между независимите променливи
Обхващащ тест ... • Решение на проблемите • Z* е вектор, включващ тези променливи на Z, които не принадлежат на Х • В този случай приемането на ограничението с=0, позволява да се направи заключение в полза на хипотезата Н0 срещу хипотезата Н1
J тест • Използва следната комбинация от двата начални модела • Тества се ограничението = 0 - тест срещу хипотезата Н1 • Проблем - не може да бъде оценен директно – разработен 3-етапен метод
Група тестове • Извеждат се едновременно • J тест, N тест, NT тест, W тест, JA тест, AIC тест и SBC тест • Възможни са 4 случая • И двете хипотези да се отхвърлят, • Да се отхвърли първата хипотеза, • Да се отхвърли втората хипотеза, • Да се приемат и двете хипотези.
Икономическа адекватност на модела ... • При определяне на маржиналните и средните разходи за производство: а0, а1 и a3>0 ; а2<0 и a22<3a1 a3 • Проверката на различните ограничения от тип равенство чрез Валд теста
Валд тест • Тест за налагане на ограничения на параметрите на модела • При наличие на специфични изисквания наложени от теорията • При проверка на причините за динамиката: произтича от детерминираната част на модела или е стохастична (при авторегресионните модели с разпределен лаг)
Валд тест • Ограниченията: линейни и нелинейни • Н0: всички поставени ограничения са едновременно изпълнени
Валд тест • Wald test of restriction(s) imposed on parameters • ****************************************************************************** • Based on OLS regression of LNQ101 on: • C T LNP101 LNP106 LNP107 • LNINCOME S12 • 48 observations used for estimation from 1997M1 to 2000M12 • ****************************************************************************** • Coefficients A1 to A7 are assigned to the above regressors respectively. • List of restriction(s) for the Wald test: • a3+a4+a5=1 • ****************************************************************************** • Wald Statistic CHSQ( 3)= 46.8390[.000] • ******************************************************************************
Интерпретация на резултата • Валд теста нормализира поставеното ограничение и го проверява при • Н0: нормализирано ограничение = 0 • за конкретния случай: a(3) + a(4) +a(5) -1 = 0 • Като резултат извежда 2 вида статистики: F статистика и Chi-square със вероятността за приемане на Н0 • F статистика – валидна само при линейни ограничения • Резултатите от Валд теста зависят от начина на задаване на ограниченията (при нелинейни ограничения)
Икономическа адекватност на модела ... • Когато трябва да се провери ограничение от типа “по-голямо”/”по-малко” – няма автоматизиран тест – t-теста • Сравнява се получената стойност за t и критичната стойност (равнище на статистическа значимост и степените на свобода) • За целта изходния модел се преобразува така, че ограничението да бъде сравнение с 0 и да се явява параметър в преобразувания модел
Икономическа адекватност на модела ... • От преобразувания модел могат да бъдат тествани и хипотезите: • В първия случай, Н0 се приема - получената стойност на t е по-малка от критичната стойност на t при едностранния t тест, отчетен със знак минус. • Във втория случай,Н0 се приема - получената стойност на t е по-голяма от критичната стойност на t при едностранния t тест.
Стабилност и устойчивост на модела • Показват доколко разработеният модел може да направи коректна прогноза • Тестове – Браун, Дърбин и Ивънс- базирани на рекурсивните остатъци • Графични тестове
Стабилност и устойчивост на модела ... • Рекурсивни остатъци: • Определяне на регресионните коефициенти при използване на n+1 набюдения • Определяне на грешката при n+2-то наблюдение – първи остатък • Определяне на регресионните коефициенти при използване на n+2 набюдения • Определяне на грешката при n+3-то наблюдение – втори остатък • .... До изчерпране на всички наблюдения
Стабилност и устойчивост на модела ... • 2 теста • QUSUM – анализира директно получените рекурсивни остатъци • QSUMSQ – анализира квадратите на рекурсивните остатъци • QUSUM • Н0: редът на рекурсивните остатъци има средно равно на 0 и вариация ≈ на броя на остатъците • На графиката – нормализираните рекурсивни остатйци