An lise de regress o
This presentation is the property of its rightful owner.
Sponsored Links
1 / 29

ANÁLISE DE REGRESSÃO PowerPoint PPT Presentation


  • 77 Views
  • Uploaded on
  • Presentation posted in: General

ANÁLISE DE REGRESSÃO. UM GUIA PRÁTICO. O QUE É “REGRESSÃO”?.

Download Presentation

ANÁLISE DE REGRESSÃO

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


An lise de regress o

ANLISE DE REGRESSO

UM GUIA PRTICO


O que regress o

O QUE REGRESSO?

  • Na anlise bidimensional de variveis, foi introduzida a noo de condicionalidade: a proporo da populao que fazia parte de um determinado grupo, condicional ao fato de ter uma caracterstica. No exemplo, calculou-se a freqncia de mulheres que so chefes de famlia dada a informao que trabalham.

  • Regresso o clculo do valor esperado de uma varivel Y, dado o conjunto de informaes fornecido por um conjunto de caractersticas X. Ou seja, a mdia de Y, condicional s informaes de X (E[Y|X]).


O modelo linear de regress o

O MODELO LINEAR DE REGRESSO

  • O modelo linear de regresso a forma utilizada para calcular mdias condicionais de uma varivel a partir de dados disponveis sobre variveis supostamente relacionadas.

  • O modelo assume o seguinte formato:

    Y= + b1X1 + 2X2 + ... +

    • A varivel Y chamada de varivel dependente ou explicada.

    • As variveis X1, X2, X3, ... so chamadas de explicativas.

    • O termo chamado de erro ou distrbio.


Hip teses b sicas

HIPTESES BSICAS:

  • Relacionamento linear entre as variveis

  • E() = 0

  • E(2) = 2 (constante)

  • Os resduos so independentes entre si: E(i j) = 0, i,j = 1, 2, 3...

  • Os resduos e as variveis so independentes: E(X) = 0

  • As variveis Xn no podem ser combinaes lineares entre si


O ajuste da regress o

O AJUSTE DA REGRESSO

  • Graficamente, a anlise de regresso implica no ajuste de uma reta que represente de uma boa forma a estrutura dos dados.


An lise de regress o

  • Mas o que boa forma de ajuste da reta?

  • Note que a diferena entre a reta ajustada (que produto do valor esperado condicional) e a observao realizada corresponde ao resduo.

  • Logo, o ajuste ideal da reta deve respeitar a condio de menor distncia possvel em relao aos valores observados.


An lise de regress o

  • Logo, a idia de ajuste dos parmetros do valor esperado condicional passa por Minimizar a Soma dos Quadrados dos Resduos.

  • O estimador de Mnimos Quadrados Ordinrios possui propriedades interessantes, quando as hipteses bsicas no so violadas: ele no-viesado e o mais eficiente entre os estimadores lineares.

  • O estimador de mnimos quadrados, escrito na forma matricial, :

    = (XX)-1(XY)


Estat sticas de avalia o

ESTATSTICAS DE AVALIAO

  • R2 busca decompor a variao total de Y entre variao prevista e variao no explicada pelo modelo (variao dos resduos). Fazendo a separao, temos:

    SQT = SQE + SQR

    onde SQT = Soma dos quadrados total (S(Y-Y)2), SQE = Soma dos quadrados explicada (S(Y*-Y)2) e SQR = Soma dos quadrados dos resduos (Se2), Y a mdia de Y e Y* o valor previsto de Y


An lise de regress o

Logo, temos:

1 = (SQE/SQT) + (SQR/SQT)

O R2 busca verificar o quanto de Y foi explicado pelo modelo. Logo:

R2 = SQE/SQT = 1 - (SQR/SQT)

Note que, por definio, 0 < R2 < 1.

  • R2 ajustado: o problema da estatstica de R2 o seu comportamento diante do acrscimo de variveis no modelo. Qualquer varivel adicionada, por menor que seja o seu poder de explicao, gera um crescimento no R2 normal. Logo, o R2 ajustado busca penalizar a estatstica pelo acrscimo de variveis irrelevantes.


Estat sticas dos par metros

ESTATSTICAS DOS PARMETROS

  • Toda estimativa de mnimos quadrados ordinrios gerada de b possui mdia igual ao valor esperado para a populao e uma varincia constante. Logo, qualquer inferncia pode ser feita atravs da estatstica t sobre os seus valores.

  • Para a estimativa conjunta dos parmetros estimados, necessrio fazer a decomposio da varincia, de tal forma que se separe a poro da variao de Y que explicada pelo conjunto de parmetros em questo. Tendo como hiptese nula a ausncia de influncia (por conseqncia, hiptese alternativa a presena de influncia das variveis), temos:


An lise de regress o

F = [(SQE)/SQR][(n-k-1)/k]

onde SQE e SQR foram definidos acima, e n = tamanho da amostra, k = nmero de coeficientes angulares.


An lise de regress o

ESTIMAO DE MODELOS: POR QUE USAR O LOGARITMO NATURAL?

  • O logaritmo natural enquanto expresso de taxa mdia de crescimento: uma varivel qualquer no tempo pode ser expressa como uma progresso do seu valor no instante zero

    Yt = A.et.g.Y0.t

    Aplicando o logaritmo natural em ambos os lados da equao:

    Ln(Yt) = (Ln(A) + Ln(Y0)) + t.g + t


An lise de regress o

  • O logaritmo natural como expresso da elasticidade:

    Ln(Yt) = A + B Ln(Xt)

    Ln(Yt) = B Ln(Xt)

    Ln(Yt)/Ln(Xt) = B

    Mas: Ln(Yt) = Ln(Yt) - Ln(Yt-1) = Ln(Yt / Yt-1)

    (Yt - Yt-1)/Yt-1

    Ento:

    Ln(Yt)/Ln(Xt) = [(Yt - Yt-1)/Yt-1]/[(Xt - Xt-1)/Xt-1]

    = elasticidade = B


Exerc cio pr tico

Exerccio Prtico:

CAPM - calculando o Beta de uma ao


Viola es das hip teses heterocedasticidade

VIOLAES DAS HIPTESES - HETEROCEDASTICIDADE

  • Se E(2) 2 (constante) E(2) = 2i

    Este problema conhecido como:

    heteroscedasticidade

    Esta violao normalmente verificada em questes como:

    • Lucro X Tamanho da empresa: empresas maiores tendem a ter maior disperso nos seus lucros.

    • Consumo de um Bem X Renda: pessoas ricas podem escolher melhor a proporo da renda consumida em determinado bem.


Exemplo rela o entre renda e gastos com cart o de cr dito

Exemplo: Relao entre Renda e Gastos com Carto de Crdito


Teste para detectar heteroscedasticidade

Teste para Detectar Heteroscedasticidade

  • A hiptese nula para qualquer teste varincia constante. Hiptese alternativa varincia inconstante na amostra.

  • Teste de White:

    o mais popular dos testes e consiste em efetuar uma regresso dos resduos elevados ao quadrado contra o as variveis explicativas usadas na regresso, seus quadrados e os produtos cruzados. A estatstica F de significncia de todos os parmetros o valor do teste.

    Testes semelhantes, como o de Breush-Pagan, so variaes sobre os termos acrescentados na regresso de teste.


Viola es das hip teses autocorrela o serial

VIOLAES DAS HIPTESES - AUTOCORRELAO SERIAL

  • Se E(i j) 0, para i,j = 1, 2, 3... temos que o valor de um resduo passa a influenciar os resultados futuros da mdia condicional estimada para Y.

    Problema: Autocorrelao Serial

  • Fontes de autocorrelao serial:

    • Omisso de varivel relevante;

    • M especificao da forma funcional;

    • M especificao dinmica do modelo.


An lise de regress o

  • A idia da autocorrelao serial que os resduos contm mais informao sobre a varivel dependente do que aquilo que foi filtrado pelas variveis explicativas. Em termos tcnicos, o resduo ainda pode ser sistematizado.

  • Exemplos de autocorrelao so normalmente encontrados em trabalhos que utilizam sries de tempo como dados de anlise.


Teste para detectar autocorrela o serial

Teste para Detectar Autocorrelao Serial

  • A hiptese nula do teste de autocorrelao a ausncia do problema. Hiptese alternativa, sua presena.

  • Teste de Durbin-Watson:

    Talvez o mais popular dos testes para detectar o problema, consiste em computar uma soma ponderada dos resduos, de tal forma que seja possvel detectar algum padro no seu comportamento. Possui o problema de captar apenas a autocorrelao de primeira ordem.


An lise de regress o

  • Teste de Breush-Godfrey:

    Teste de certa forma semelhante ao teste de White, consiste em efetuar uma regresso do resduo como varivel explicada tendo como explicativas o prprio resduo defasado no tempo e as variveis explicativas do modelo original. Usa-se a estatstica F de significncia conjunta dos parmetros da equao de teste.

    Este teste talvez seja o mais indicado para verificar autocorrelao, pois considera a possibilidade de resduos correlacionados com valores defasados acima de um perodo e pode ser usada com variveis explicativas defasadas.


Conseq ncia das viola es das hip teses

CONSEQNCIA DAS VIOLAES DAS HIPTESES

  • No caso da heteroscedasticidade, a presena do problema tende a no viesar as estimativas dos parmetros. Todavia, as suas varincias estimadas no sero as corretas. Logo, inferncias sobre os parmetros estaro m especificadas.

  • No caso da autocorrelao serial, alm do problema da varincia, temos a possibilidade de vis nas estimativas se o problema for decorrente de ausncia de variveis relevantes no modelo.


Quebras estruturais e vari veis dummies

QUEBRAS ESTRUTURAIS E VARIVEIS DUMMIES

  • Algumas vezes queremos incluir no modelo de regresso variveis qualitativas ou categricas, como planos econmicos, regio, etc...

  • Inclusive porque fenmenos pouco usuais podem determinar vis nas estimativas se no forem controlados. Este tipo de fenmeno conhecido na literatura como quebra estrutural.

  • Para controlar este tipo de fenmeno e modelar as variveis qualitativas, so utilizadas variveis binrias, ou dummies


An lise de regress o

  • As variveis recebem este nome por assumirem apenas dois valores ao longo de toda a amostra: zero ou um. O funcionamento da varivel o seguinte:

    • Perodo sem a quebra: D = 0

      Yt = a + dD + bXt + et

      Portanto: Yt = a + bXt + et

    • Perodo da quebra: D = 1

      Yt = (a + d)+ bXt + et


An lise de regress o

  • Outro formato possvel que a varivel dummy pode assumir refere-se a mudanas na inclinao. A varivel, assim, assume o valor zero para o perodo sem a mudana e o valor igual ao da varivel cuja inclinao mudou para o perodo com mudana.

  • O modelo passa a funcionar da seguinte forma:

    • Perodo sem a quebra: D = 0

      Yt = a + dXt+ bXt + et

      Portanto: Yt = a + bXt + et

    • Perodo da quebra: D = Xt

      Yt = a + (b + d)Xt + et


Exemplo de quebra estrutural demanda por importa es brasil 1980 2001

Exemplo de Quebra Estrutural: Demanda por Importaes - Brasil 1980 - 2001


An lise de regress o

  • Uma funo de demanda por importaes assume o seguinte formato:

    lnMt = a + b1t + b2lnYt + b3lnRERt + et

    onde: Mt = importaes; t = tendncia linear; Yt = PIB real; RERt = taxa de cmbio real. O uso de uma tendncia justifica-se por no existir com freqncia mensal uma medida de utilizao da capacidade instalada da economia. Todas as variveis, pelos motivos j conhecidos, encontram-se transformadas para o seu logaritmo natural.

  • Estimando-se a regresso por OLS, temos o seguinte grfico dos resduos:


Res duos modelo para demanda por importa es brasil

Resduos: Modelo para demanda por importaes - Brasil


An lise de regress o

  • Note como o resduo exibe, aparentemente, um padro sazonal, alm de uma quebra estrutural localizada no incio dos anos 90. Como o resduo corresponde a tudo aquilo que no foi explicado pelo modelo, temos aqui o problema de especificao por no termos considerado a quebra estrutural indicado pela mudana de tendncia dos resduos.

  • Lembre-se: devem existir motivos relevantes para a quebra!!! A presena de outliers por si s no quer dizer que existam quebras. No nosso caso, devemos lembrar a mudana ocorrida na economia com a sua abertura comercial no incio dos anos 90. Logo, justifica-se uma correo no modelo.


  • Login