1 / 18

Kon š truovanie predpoved í

Kon š truovanie predpoved í.

avak
Download Presentation

Kon š truovanie predpoved í

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Konštruovanie predpovedí Jeden z hlavných dôvodov analýzy časových radov – predpovedanie budúcich hodnôt časového radu. Predpovedná technika spočíva v rozšírení minulých skúseností do budúcnosti. Predpokladom je, že vonkajšie podmienky pôsobiace na vývoj časového radu ostanú nezmenené - princíp ceteris paribus. Predpoveď bude presná do tej miery, do akej je splnená táto podmienka (pokiaľ nie je predpoveď modifikovaná rozhodnutím prognostika). Pretože predpovedné techniky pracujú s údajmi, ktoré vznikli v minulosti, predpovedný proces pozostáva z nasledujúcich krokov: • zber údajov a ich redukcia • zostavenie modelu • vyhodnotenie modelu • prognóza. Jednou z najdôležitejších častí predpovedného procesu je získavanie vhodných a overených údajov. Ak sú údaje nevhodné alebo nesprávne, prognóza bude nepresná.

  2. Typická stratégia vyhodnocovania rôznych predpovedných metód obsahuje nasledujúce kroky: 1: Na základe analýzy modelu minulých dát sa vyberie predpovedná metóda 2: Súbor dát sa rozdelí do dvoch častí: vstupná (inicializačná, testovacia) a skúšobná časť 3: Zvolená predpovedná metóda sa overí na údajoch vstupnej časti 4: Model sa použije na predpovedanie hodnôt skúšobnej časti; vypočítajú a vyhodnotia sa chyby predpovedí 5: Urobí sa rozhodnutie o modele (prijatie modelu v jeho súčasnej podobe, modifikácia modelu, použitie iného modelu a porovnanie výsledkov, zamietnutie modelu) 6: Použitie vybraného predpovedného modelu na prognózu budúcich hodnôt časového radu. Skutočná prognóza by mala byť kvantitatívna aj kvalitatívna. Predpovedný model poskytne kvantitatívnu hodnotu; posúdenie inžiniera poskytne príslušné kvalitatívne ohodnotenie.

  3. Symbolom budeme označovať predpoveď hodnoty xt+k kon-štruovanú v čase t, ktorú nazývamepredpoveď v čase t o k krokov dopredu(k-kroková predpoveď v čase t). Hodnotu budeme konštruovať ako lineárnu predpoveď, ktorá bu-de lineárnou funkciou hodnôt xt, xt-1, ... alebo ekvivalentne (predpokladáme stacionárny a invertibilný stochastický proces ARMA(p, q) ) lineárnou funkciou hodnôt zt, zt-1 ... Konštruovanie bodových predpovedí Predpokladajme, že máme časový rad {x1, x2, …, xn} ako realizáciu stochastického procesu {Xt, t = 1, 2, ...}. Ďalej predpokladajme, že sme našli vhodný lineárny model ARMA(p, q): Xt - 1 Xt-1 - ... - p Xt-p = Zt + 1 Zt-1 + ... + q Zt-q Chceme zostrojiť predpoveď, ktorá má v triede všetkých lineárnych predpovedí najmenšiu strednú kvadratickú chybu (MSE – Mean Square Error) definovanú:

  4. Ak budeme hľadať predpoveďv tvare: hľadáme vlastne koeficienty , ktoré minimalizujú výraz: Tento výraz nadobúda minimálnu hodnotu pre : Odvodili sme: resp. Platí: t. j. ako podmienenú strednú hodnotu Xt + k pri daných hodnotách Xt = xt, Xt – 1 = xt – 1, ... .

  5. Špeciálne: Platí: xt + k = 1 xt + k - 1 + ... + p xt + k - p + zt + k + 1 zt + k - 1 + ... + q zt + k - q Chyba predpovedi: Platí: Praktický výpočet:

  6. Zásady pre praktický výpočet: 1. Postupujeme rekurentne, t. j. najprv vypočítame predpovede 2. V každom kroku dosadíme do vzorca (1) vzťahy (2a) a (2b). 3. Pred začiatkom rekurentného výpočtu položíme z1 = z2 = ... = zq = 0. (2a) (2b) Potom: (1) kde:

  7. V systéme Mathematica:BestLinearPredictor[dáta, model, k] Výstupom jek jednokrokových predpovedí a im odpovedajúce MSE v tvare:

  8. Konštruovanie intervalových predpovedí 95%-ný predpovedný interval konštruovaný v čase t pre predpoveď o k krokov dopredu (ak uvažujeme stacionárny a invertibilný ARMA model): Keď dosadíme za smerodajnú odchýlku (et+k(t)): Pri výpočte bodových aj intervalových predpovedí dosadzujeme do príslušných vzorcov odhadnuté hodnoty parametrov. Tieto vzorce však nie sú veľmi citlivé na chyby, ktoré vznikli pri výpočte odhadov parametrov.

  9. Meranie chýb predpovedí Metódy na meranie chýb, ktorých sa dopustíme použitím príslušného predpovedného modelu, sa v podstate skladajú z výpočtu predpove-dí pre skúšobnú časť údajov a porovnania týchto predpovedaných hodnôt so skutočnými hodnotami. Rozdiel medzi predpovedanou (odhadovanou) a pozorovanou hodnotou je podobný reziduálnemu členu v regresnej analýze. Na výpočet chyby pre každé predpovedné obdobie sa používa nasledujúca rovnica: eT = xT - FT kde eT chyba predpovede v časovom období T xT skutočná hodnota v časovom období T FT predpovedaná hodnota v časovom období T. Označme P počet časových úsekov, na ktoré robíme prognózu

  10. Aritmetický priemer druhých mocnín odchýliek (mean squared error) MSE: • Druhá odmocnina z aritmetického priemeru druhých mocnín odchýliek (root mean squared error) RMSE: • MAE (mean absolute error):

  11. Hodnota predpovedanej premennej , t = M, …, n, je genero-vaná pomocou parametrického modelu g( ), ktorý treba najskôr odhadnúť. Metódy na výpočet predpovedí v časových radoch Uvažujme časový rad xt,  t = 1, …, n + 1. Dáta sa rozdelia na dve časti: 1. testovaciačasť vzorky(rozsah 1 až M, M < n) 2. skúšobná časť vzorky(P je počet hodnôt jednokrokovej pred-povede, n + 1= M + P)

  12. 1. rekurzívna metóda: predpovede sa generujú na základe modelu, ktorého parametre sa upravujú a odhadujú postupne pomocou všetkých hodnôt časového radu pribúdajúcich s jednotli-vými krokmi predpovede Prvá predpovedaná hodnota gM+1( ) sa vypočíta na základe parametrov modelu odhadnutých pomocou členov radu x1 až xM, druhá predpoveď gM+2( ) sa vypočíta na základe paramet-rov odhadnutých pomocou členov x1 až xM+1, atď. Všeobecne pre t = M, …, n, predpoveď gt+1( ) hodnoty xt+1 sa vyčísli na základe parametrov modelu odhadnutých pomocou členov x1 až xt . West a McCracken navrhli tri schémy pre výpočet predpovede

  13. Prvá predpovedaná hodnota gM+1( ) sa vypočíta na základe parametrov modelu odhadnutých pomocou členov radu x1 až xM, druhá predpoveď gM+2( ) sa vypočíta na základe paramet-rov odhadnutých pomocou členov x2 až xM+1, atď. Všeobecne pre t = M, …, n, predpoveď gt+1( ) hodnoty xt+1 sa vyčísli na základe parametrov modelu odhadnutých pomocou členov xt M +1 až xt. West a McCracken navrhli tri schémy pre výpočet predpovede 2.Metóda rolujúceho horizontu : predpovede sa generujú na základe modelu, ktorého parametre sa odhadujú postupne vždy pomocou posledných M hodnôt časového radu

  14. Odtiaľ vyplýva, že pre každú predpoveď hodnoty xt+1 sú parametre modelu rovnaké gt+1( ) = gt+1( ), pre t = M, …, n. Predpoveď sa vyčísli na základe toho istého modelu s parametrami=odhadnutými pomocou členovx1 až xM . West a McCracken navrhli tri schémy pre výpočet predpovede 3.fixná metóda: všetky predpovede sa generujú na základe jedného modelu, ktorého parametre sa odhadnú pomocou prvých M členov časového radu

  15. Uvažujme dve h-krokové predpovede časového radu xt, označené ako počítané pre t = M + h, …, M + P + h - 1 (t. j. celkovo P predpovedí), kdeMje počet dát v testovacej časti vzorky. Nulová hypotéza je, že obidva modely dávajú rovnako presné predpovede. • Diebold - Marianov test Diebold a Mariano (1995) sa zaoberali rôznymi štatistikami, ktoré je možné použiť na porovnanie, či chyby MSE dvoch alternatívnych schém sú navzájom štatisticky významne odlišné. Tento test sa v súčasnosti všeobecne používa na vyhodnotenie bodových predpovedí dvoch porovnávaných modelov a je hodnotený ako jedna z najlepších diagnostických mier.

  16. Určí sa „stratová“ (loos) funkcia g , kde je odpo-vedajúca chyba pre h-krokovú predpoveď, t. j. , i = 1, 2. Vypočíta sa rozdiel dt , pre ktorý pri rov-nakej presnosti predpovedí platí E[ dt ] = 0. Za predpokladu kovariančnej stacionarity časového radu dt je asymptotické rozdelenie výberového priemeru dané vzťahom , kde Postup pri testovaní:

  17. Testovacia štatistika DM pre H0: E[ dt ] = 0 má za predpokladu platnosti H0 asymptoticky normálne rozdelenie N(0, 1). Definovaná je vzťahom: DM = kde je konzistentný odhad založený na výberových autokovarianciách Výsledky testu sa zapisujú do tabuľky, ktorá má v riadkoch aj stĺpcoch uvažované modely. Prvok v i-tom riadku a j-tom stĺpci tejto tabuľky je rovný a)1 b)-1 c)0 ak je kvalita predikcie modelu v riadku i v porovnaní s modelom v stĺpci j a)štatistickyvýznamne lepšía b)štatistickyvýznamne horšía c)nie je medzi nimi štatisticky významný rozdiel.

  18. H0: H1: Diebold - Mariano dvojstranny test (a = 0.05) test[d1_, d2_, d3_, P_, h_]:= Module[{E1, E2, d, dp, V, DM, nr, qh, qd}, g[x_]:=x^2; E1 = d1 - d2; E2 = d1 - d3; d = g[E1] - g[E2]; dp = Mean[d]; g[i_]:=1/P*Sum[(d[[t - (h - 1)]] - dp) (d[[t -(h - 1) - i]] - dp), {t, h + i, P + h -1}]; V = g[0] + 2*Sum[g[i], {i, h - 1}]; DM = dp/Sqrt[Abs[V/P]]; nr =NormalDistribution[0,1]; qh=Quantile[nr,0.975]; qd=Quantile[nr,0.025]; TS = Which[DM<qd,1,qd  DM qh, 0, True, -1]] k=h; Ma[1]=model1[k];Ma[2]=model2[k]; ...; Ma[pocet]=modelx[k]; Apom={}; Do[If[I == j, Apom = Append[Apom, "x"], Apom = Append[Apom,test[sv,Ma[i],Ma[j],Np,k]]],{i, pocet},{j, pocet}]; A = Partition[Apom, pocet];TableForm[A, TableHeadingsAutomatic] pocet – počet modelov, h – krok predpovede, sv – skúšobná vzorka, Np - početpredpovedí

More Related