1 / 52

Подобряване на качеството на модела

Подобряване на качеството на модела. Качество на модела Включване и изключване на променливи Тестване на ограничения за коефициентите Стабилност на модела. Въпроси на качеството с практическо значение. Кои са характеристиките на добрия модел

burton
Download Presentation

Подобряване на качеството на модела

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Подобряване на качеството на модела • Качество на модела • Включване и изключване на променливи • Тестване на ограничения за коефициентите • Стабилност на модела

  2. Въпроси на качеството с практическо значение • Кои са характеристиките на добрия модел • Какви са възможните грешки, ако разработения модел се отличава от “идеалния” – грешки на спецификацията на модела • Какви са последиците от тях • Как да се открият грешките от лоша спецификация на модела

  3. Добрият модел е: (по Харви) • Достатъчно опростен, но запазващ характеристиките на процеса • Еднозначно решен спрямо дадена извадка • С възможно най-висок коефициент на детерминация • Верифициран с икономическата теория • Направената прогноза и действителната реализация са близки

  4. Възможните грешки -спецификация на модела • Некоректна спецификация • Има пропусната ключова праменлива • Има включена излишна променлива • Избрана е некоректна функционална форма

  5. Грешки на спецификацията • Пропуснат съществен фактор – лоша спецификация • Няма специализирани тестове • Индиректно – коефициента на детерминация • Тестове за добавяне на променлива

  6. Пропуснат фактор - последици • Пропуснатия фактор се корелира с включени в модела фактори • Некоректна оценка на коефициентите –коректния коефициент ще бъде по-голям от оценката при позитивна корелация и обратно • Некоректен свободен член (дори и ако пропуснатия фактор не се корелира с фактор от модела) • Некоректно оценена стандартна грешка на модела • Намаляване силете на тестовете – некоректни заключения

  7. 2-Apr-2002 10:02:02 Ordinary Least Squares Estimation ****************************************************************************** Dependent variable is Q12105 50 observations used for estimation from 1995M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C .22785 .052291 2.5552[.000] T -.3225E-3 .2771E-3 -.57589[.502] P12105 -.2913E-3 .5808E-3 -.82592[.001] P12102 -.7579E-3 .2930E-3 -1.5577[.125] P12103 -.8552E-3 .2350E-3 -3.5287[.001] P12104 .0012251 .5052E-3 2.8525[.005] ****************************************************************************** R-Squared .62522 R-Bar-Squared .58089 S.E. of Regression .234218 F-Stat. F( 5, 53) 30.5201[.000] Mean of Dependent Variable .31225 S.D. of Dependent Variable .170551 Residual Sum of Squares .055735 Equation Log-likelihood 119.3572 Akaike Info. Criterion 112.3572 Schwarz Bayesian Criterion 105.0272 DW-statistic 1.5925 ******************************************************************************

  8. 2-Apr-2002 10:02:02 Ordinary Least Squares Estimation ****************************************************************************** Dependent variable is Q12105 50 observations used for estimation from 1995M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C .22785 .052291 2.5552[.000] T -.1275 .1012771 -.57589[.002] P12105 -.2913 .0075808 -.82592[.035] P12102 -.3254 .0562930 -1.5577[.075] P12103 -.1236 .0092350 -3.5287[.001] P12104 .0875 .0245052 2.8525[.002] INCOME .2150 .1002592 8.2892[.000] ****************************************************************************** R-Squared .77522 R-Bar-Squared .75089 S.E. of Regression .035218 F-Stat. F( 5, 53) 30.5201[.000] Mean of Dependent Variable .31225 S.D. of Dependent Variable .010551 Residual Sum of Squares .055735 Equation Log-likelihood 119.3572 Akaike Info. Criterion 112.3572 Schwarz Bayesian Criterion 105.0272 DW-statistic 1.6225 ******************************************************************************

  9. “Излишна” променлива • Включена е “излишна” променлива • “Излишна” – няма теоретични основания за включването й • Може да се установи само индиректно – логически • На практика се случва когато: • Теоретично неизяснени проблеми • Няма практически разработки • Теорията не е достатъчно формализирана

  10. “Излишна” променлива - последици • Не променя или увеличава R2 • Оценките са коректни, но • с голяма стандартна грешка • некоректни заключения за статистическата значимост • Води до изключване от модела на статистически значима променлива

  11. “Излишна” променлива - последици • Тестовете за модела като цяло – коректни • Необходима по-голяма извадка за “добри” оценки Извод По-добре да се включи излишна обясняваща променлива, отколкото да се изпусне съществен фактор

  12. Некоректна функционална форма • Икономическата теория не се интерисува от функционална форма на модела • От практическа гледна точка – това е от съществено значение • Индикация за некоректна форма – диагностичния тест • Правила за правилно определяне на функционална форма – няма • Памага – натрупания опит

  13. Препоръчителни функционални форми • Определяне на теоретични еластичности – двойно логаритмична функция • Обуславя се от същността на логаритмичната функция – процентно изменение

  14. Препоръчителни функционални .... • Анализ на темпа – полу-логаритмична функция от номиналното изменение на факторите • Позволява да се определи % изменение на зависимата променлива при определено номинално изменение на факторите

  15. Препоръчителни функционални .... • Анализ на абсолютното нарастване – полу-логаритмична функция от релативнато изменение на факторите • Позволява да се определи номиналното изменение на зависимата променлива при определено релативно изменение на факторите

  16. Препоръчителни функционални .... • Анализ и определяне на абсолютното нарастване в зависимост от времето (във финансовите анализи) – модели на линейния тренд • Позволява да се определи абсолютното изменение на зависимата променлива спрямо началото на периода

  17. Препоръчителни функционални .... • Анализ и определяне на постоянните разходи за 1-ца продукция – реципрочна функция • От теорията – постоянните разходи намаляват асимптотично да определено равнище

  18. Препоръчителни функционални .... • Анализ и определяне на относителния дял на разходите за потребление на даден продукт – реципрочна функция (крива на Енджел) • Практически установено

  19. Препоръчителни функционални .... • Анализ и определяне на средния доход от безработицата – реципрочна функция (крива на Филипс) • Практически установено- има допълнителни ограничения а0 <0 и а1 >0

  20. Препоръчителни функционални .... • Анализ и определяне на маржиналните и средни разходи за производство – полином от 3-та степен • Практически установено- има допълнителни ограничения: • а0, а1 и a3>0 ; • а2<0 и • a22<3a1 a3 • 8a3

  21. Показатели за оценка • Основен показател - R2 • Изискване за директно сравняване – зависимата променлива да е една и съща • Един и същи показател • В една и съща функционална зависимост • Причина – не могат да се сравняват величини с различни измерения

  22. При необходимост от промени в модела • Могат да се използват резултати получени за други периоди • Пример Q = a0 + a1P + a2Income – проблем при оценката от друг анализ - еластичността на дохода - 0.7 Трансформация Q* = Q – 0,7*Income Q* = a0 + a1P

  23. Друг тип трансформации • При агрегирани данни • Преизчисляването им на база на човек от населението – анализ на вноса от изменението на ценовото равнище и БВП • Разделяне на двете страни на единият от факторите Q = a0 + a1P + a2Income /Income (Q/Income) = b0 + b1(P/Income)

  24. Друг тип трансформации • Използване на първите разлики вместо самите показатели Q = a0 + a1P + a2Income ΔQ = a0 + a1 ΔP + a2 ΔIncome • Използване на някаква функция от показателите (логаритмична)

  25. Добавяне на променлива • Използва се за проверка дали включването на даден показател ще подобри модела • Докога продължава процеса –преизчисления R2 се увеличава: • ItI – по-голяма от 1 • От следрегресионното меню • H0: ak = am = al = =0 • Приемането на H0- добавените променливи не подобряват модела • Отхвърлянето на H0- факторите трябва да бъдат включени в модела

  26. 10-May-2003 0:54:33 Variable Addition Test (OLS case) ****************************************************************************** Dependent variable is Q12102 List of the variables added to the regression: P12101 60 observations used for estimation from 1996M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C -.064037 .066828 -.95823[.342] T .6945E-3 .5623E-3 1.2350[.222] P12102 -.0011191 .4795E-3 -2.3340[.023] P12106 .0015867 .9152E-3 1.7337[.089] P12104 -.6497E-5 .2326E-3 -.027930[.978] P12105 -.1219E-3 .5165E-3 -.23590[.814] INCOME .6038E-5 .2523E-5 2.3927[.020] P12101 -.5055E-4 .4424E-3 -.11427[.909] ****************************************************************************** Joint test of zero restrictions on the coefficients of additional variables: Lagrange Multiplier Statistic CHSQ( 1)= .015063[.902] Likelihood Ratio Statistic CHSQ( 1)= .015065[.902] F Statistic F( 1, 52)= .013058[.909] ******************************************************************************

  27. Изключване на променлива • Използва се за проверка дали изключването на даден показател ще подобри модела • От следрегресионното меню • H0: ak = am = al = =0 • Приемането на H0- изключването на променливите не влошава модела • Отхвърлянето на H0- факторите не могат да бъдат изключени от модела

  28. 10-May-2003 0:53:26 Variable Deletion Test (OLS case) ****************************************************************************** Dependent variable is Q12102 List of the variables deleted from the regression: C T P12105 60 observations used for estimation from 1996M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] P12102 -.9239E-3 .3828E-3 -2.4134[.019] P12106 .8964E-3 .3135E-3 2.8589[.006] P12104 -.8165E-4 .1930E-3 -.42307[.674] INCOME .6801E-5 .1478E-5 4.6017[.000] ****************************************************************************** Joint test of zero restrictions on the coefficients of deleted variables: Lagrange Multiplier Statistic CHSQ( 3)= 2.4861[.478] Likelihood Ratio Statistic CHSQ( 3)= 2.5391[.468] F Statistic F( 3, 53)= .76366[.519] ******************************************************************************

  29. Икономическа адекватност на модела • Проверка на знаците на регресионните коефициенти • Проверка на други детерминирани връзки между коефициентите • За еластичностите на заместване – сумата от еластичностите = 0 • За проверка на ефекта от инвестиции – сбора от коефициентите пред разходите за труд и капитал = 1

  30. Сравняване на модели • Позволяват да се провери степента на годност на даден модел, спрямо степента на годност на друг модел • Моделите – една и съща зависима променлива • Тестове за непокриващи се хипотези • Две хипотези се наричат непокриващи се, ако независимите променливи включени в първата хипотеза не се явяват независими променливи по отношение на втората хипотеза.

  31. Непокриващи се хипотези

  32. Тестове за непокриващи се хипотези • Обхващащ или заграждащ тест. • Той работи с 2 модела, като позволява част от независимите променливи на първия модел да се включват и като независими променливи и във втория модел • Анализира комбинирания модел

  33. Обхващащ тест • Параметрите на този обобщен модел се тестват за следните ограничения: • с=0 • b=0 • Ако ограничението с=0 се приема, това практически означава отхвърляне на хипотезата Н1, спрямо хипотезата Н0 • Ако ограничението с=0 се отхвърли - отхвърляне на хипотезата Н0 в полза на хипотеза Н1

  34. Обхващащ тест ... • Ако ограничението b=0 се приеме - приемане на хипотезата Н1, спрямо хипотезата Н0 • Ако ограничението b=0 се отхвърли - приемане на хипотезата Н0 спрямо хипотеза Н1

  35. Обхващащ тест ... • Недостатъци • 2 проблема • в комбинирания модел остават общите за двата първоначални модела променливи и тестването на ограниченията b=0 или c=0 не дава никаква информация за тези общи независими променливи • че броят на независимите променливи във хибридния модел може да се окаже твърде голям и да възникне проблем с колинеарността между независимите променливи

  36. Обхващащ тест ... • Решение на проблемите • Z* е вектор, включващ тези променливи на Z, които не принадлежат на Х • В този случай приемането на ограничението с=0, позволява да се направи заключение в полза на хипотезата Н0 срещу хипотезата Н1

  37. J тест • Използва следната комбинация от двата начални модела • Тества се ограничението  = 0 - тест срещу хипотезата Н1 • Проблем -  не може да бъде оценен директно – разработен 3-етапен метод

  38. Група тестове • Извеждат се едновременно • J тест, N тест, NT тест, W тест, JA тест, AIC тест и SBC тест • Възможни са 4 случая • И двете хипотези да се отхвърлят, • Да се отхвърли първата хипотеза, • Да се отхвърли втората хипотеза, • Да се приемат и двете хипотези.

  39. Икономическа адекватност на модела ... • При определяне на маржиналните и средните разходи за производство: а0, а1 и a3>0 ; а2<0 и a22<3a1 a3 • Проверката на различните ограничения от тип равенство чрез Валд теста

  40. Валд тест • Тест за налагане на ограничения на параметрите на модела • При наличие на специфични изисквания наложени от теорията • При проверка на причините за динамиката: произтича от детерминираната част на модела или е стохастична (при авторегресионните модели с разпределен лаг)

  41. Валд тест • Ограниченията: линейни и нелинейни • Н0: всички поставени ограничения са едновременно изпълнени

  42. Валд тест • Wald test of restriction(s) imposed on parameters • ****************************************************************************** • Based on OLS regression of LNQ101 on: • C T LNP101 LNP106 LNP107 • LNINCOME S12 • 48 observations used for estimation from 1997M1 to 2000M12 • ****************************************************************************** • Coefficients A1 to A7 are assigned to the above regressors respectively. • List of restriction(s) for the Wald test: • a3+a4+a5=1 • ****************************************************************************** • Wald Statistic CHSQ( 3)= 46.8390[.000] • ******************************************************************************

  43. Интерпретация на резултата • Валд теста нормализира поставеното ограничение и го проверява при • Н0: нормализирано ограничение = 0 • за конкретния случай: a(3) + a(4) +a(5) -1 = 0 • Като резултат извежда 2 вида статистики: F статистика и Chi-square със вероятността за приемане на Н0 • F статистика – валидна само при линейни ограничения • Резултатите от Валд теста зависят от начина на задаване на ограниченията (при нелинейни ограничения)

  44. Икономическа адекватност на модела ... • Когато трябва да се провери ограничение от типа “по-голямо”/”по-малко” – няма автоматизиран тест – t-теста • Сравнява се получената стойност за t и критичната стойност (равнище на статистическа значимост и степените на свобода) • За целта изходния модел се преобразува така, че ограничението да бъде сравнение с 0 и да се явява параметър в преобразувания модел

  45. Икономическа адекватност на модела ... • От преобразувания модел могат да бъдат тествани и хипотезите: • В първия случай, Н0 се приема - получената стойност на t е по-малка от критичната стойност на t при едностранния t тест, отчетен със знак минус. • Във втория случай,Н0 се приема - получената стойност на t е по-голяма от критичната стойност на t при едностранния t тест.

  46. Стабилност и устойчивост на модела • Показват доколко разработеният модел може да направи коректна прогноза • Тестове – Браун, Дърбин и Ивънс- базирани на рекурсивните остатъци • Графични тестове

  47. Стабилност и устойчивост на модела ... • Рекурсивни остатъци: • Определяне на регресионните коефициенти при използване на n+1 набюдения • Определяне на грешката при n+2-то наблюдение – първи остатък • Определяне на регресионните коефициенти при използване на n+2 набюдения • Определяне на грешката при n+3-то наблюдение – втори остатък • .... До изчерпране на всички наблюдения

  48. Стабилност и устойчивост на модела ... • 2 теста • QUSUM – анализира директно получените рекурсивни остатъци • QSUMSQ – анализира квадратите на рекурсивните остатъци • QUSUM • Н0: редът на рекурсивните остатъци има средно равно на 0 и вариация ≈ на броя на остатъците • На графиката – нормализираните рекурсивни остатйци

  49. Тестове за стабилност

More Related