Vari veis instrumentais e estima o gmm
This presentation is the property of its rightful owner.
Sponsored Links
1 / 97

Variáveis instrumentais e estimação GMM PowerPoint PPT Presentation


  • 42 Views
  • Uploaded on
  • Presentation posted in: General

Variáveis instrumentais e estimação GMM. Henrique Dantas Neder Universidade Federal de Uberlândia. Variáveis Instrumentais.

Download Presentation

Variáveis instrumentais e estimação GMM

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Vari veis instrumentais e estima o gmm

Variáveis instrumentais e estimação GMM

Henrique Dantas Neder

Universidade Federal de Uberlândia


Vari veis instrumentais

Variáveis Instrumentais

  • O que são métodos de variáveis instrumentais (IV)? Mais conhecidos como uma solução para regressores endógenos: variáveis explicativas correlacionadas com o termo de erro da regressão, os métodos de variáveis instrumentais são uma maneira de obter estimativas de parâmetros consistentes.

  • A hipótese fundamental para a consistência dos estimadores OLS é que o termo de erro do modelo é não correlacionado com os regressores.


Vari veis instrumentais1

Variáveis Instrumentais

  • Esta hipótese, também conhecida como hipótese da esperança condicional nula, pode ser expressa por E[u|x] = 0

  • Podemos entender isto de uma forma concreta: quando quisermos regredir rendimentos com anos de estudo e soubermos que uma variável latente (não observada) também determina os rendimentos. Neste caso, esta variável latente, por exemplo a habilidade do trabalhador não deve ter sua esperança condicionada ao número de anos de estudo igual a zero. Para cada valor de anos de estudo (por exemplo, 3 anos de estudo e 5 anos de estudo) temos um valor médio da variável latente diferente.

  • Esta condição também pode ser representada pela independência entre u e X, ou seja, covariância(u,x)=0


Vari veis instrumentais e estima o gmm

Vamosprimeiro considerar um diagrama de causalidade para ilustrar o problema colocado por variáveis instrumentais. Podemos usar mínimos quadrados ordinários (MQO) para estimar consistentemente o seguinte modelo:

regressão: y = xb + u(1)

Nenhuma associação entre x e u; MQO é consistente.

y

X

u


Vari veis instrumentais e estima o gmm

Entretanto, a regressão falha na seguinte circunstancia:

Endogeneidade: y = xb + u

Correlação entre x e u; MQO não é consistente.

x

y

u

A correlação entre x e u (ou a falha na hipótese de média condicional nula E[u|x] = 0) pode ser causada por muitos fatores.


Vari veis instrumentais e estima o gmm

  • Podemos nos referir ao problema da endogeneidade como duas ou mais variáveis determinadas conjuntamente em um modelo comportamental. Um exemplo é o modelo de equações simultâneas tal como o conhecido sistema de oferta e demanda em economia, no qual o preço e a quantidade são conjuntamente determinados no mercado.

  • Um choque ou perturbação tanto na oferta como na demanda afetará tanto o preço como a quantidade no mercado de forma que ambas as variáveis estão correlacionadas com uma perturbação no sistema. Regressão por MQO resultará em estimativas inconsistentes de qualquer regressão incluindo preço

  • e quantidade.


Vari veis instrumentais e estima o gmm

  • Uma outra situação em que temos que utilizar variáveis instrumentais é quando temos que levar em conta fatores não observáveis relevantes e que são omitidos da equação de regressão. Tanto y como x podem ser afetados por estes fatores latentes, como por exemplo a habilidade.

  • Considere a regressão de (ln) rendimentos (y) sobre anos de estudo (x). O termo de erro u engloba todos os outros fatores que afetam os rendimentos tais como habilidade inata dos indivíduos ou inteligência.

  • Mas a habilidade é certamente correlacionada com o grau de escolaridade alcançado, causando uma correlação entre o regressor e o erro, Matematicamente, este é o mesmo problema que aquele causado pela endogeneidade ou erros de medida.


Vari veis instrumentais e estima o gmm

A solução deste problema por variáveis instrumentais

pode ser vista como:

Regressão de variáveis instrumentais: y = xb + u

z não correlacionado com u, correlacionado com x

z

x

y

u

A variável adicional z é chamada de instrumento para x. Em geral, temos muitas variáveis em x, e mais de uma destas variáveis correlacionada com u. Neste caso, necessitamos no mínimo tantas variáveis em z, quantas forem as variáveis em x correlacionadas com u.


Vari veis instrumentais e estima o gmm

  • Para tratar do problema de endogeneidade em um sistema de oferta e demanda, um candidato z deve afetar a quantidade ofertada, mas não deve impactar diretamente a demanda do produto. Um exemplo para um produto agrícola pode ser a temperatura ou a precipitação pluviométrica: estes fatores são claramente exógenos ao mercado, mas provavelmente importantes no processo de produção.

  • Consideremos o seguinte sistema de equações de “equilíbrio” de mercado:

  • (2)


Vari veis instrumentais e estima o gmm

  • Se considerarmos a solução algébrica deste sistema de equações estruturais para as variáveis p e q, teremos as equações na forma reduzida, nas quais os fatores exógenos aparecerão em seus lados direitos.

  • No caso dos fatores latentes da equação de rendimentos, podemos escolher o instrumento z como o número de anos de estudo do pai ou da mãe. Pais com maior escolaridade provavelmente têm filhos com maior escolaridade; ao mesmo tempo, fatores não observáveis que influenciam simultaneamente a renda e o nível educacional dos indivíduos não podem influenciar variáveis cujos valores são definidos no passado, como a escolaridade dos pais.


Mas porque n o utilizar sempre vari veis instrumentais

Mas porque não utilizar sempre variáveis instrumentais?

  • Pode ser difícil achar variáveis que servem como instrumentos válidos. Muitas variáveis que têm um efeito sobre as variáveis endógenas incluídas, também têm um efeito direto sobre a variável dependente.

  • Estimadores IV são viesados para pequenas amostras e suas propriedades para amostras finitas são freqüentemente problemáticas. Estes estimadores podem ter resultado ruim em pequenas amostras.

  • A precisão de estimadores IV é menor do que a de estimadores OLS. Na presença de instrumentos fracos (instrumentos incluídos com baixa correlação com os regressores endógenos) a perda de precisão é muito grande e as estimativas IV podem não compensar a inconsistência dos estimadores OLS. Isto sugere a necessidade de um método para determinar se um dado regressor pode ser tratado como endógeno.


Como saber se os instrumentos s o fortes

Como saber se os instrumentos são fortes?

  • Instrumentos podem ser fracos: satisfatoriamente exógenos mas fracamente correlacionados com os regressores endógenos. Neste caso, “a cura pode ser pior do que a doença”.

  • Alguns autores (ver citação em Baum, 2008), formalizaram a definição de instrumentos fracos: concluem que a estatística F da equação de primeiro estágio deve exceder 10 para que os instrumentos sejam considerados fortes. Mas este critério não é suficiente para considerar que um instrumento não seja fraco.

  • Outros autores (Stock e Yogo, 2005) estabelecem uma regra de bolso para avaliar a fraqueza de instrumentos. Os comandos STATA ivreg2 e ivregress incorporam tabulações referentes a esta regra.


Simula o de uma vari vel end gena

Simulação de uma variável endógena


Simula o de uma vari vel end gena1

Simulação de uma variável endógena


Simula o de uma vari vel end gena uma nova era no ensino da econometria

Simulação de uma variável endógena – uma nova era no ensino da econometria

  • O viés para este exemplo com variável endógena, com tamanho de amostra n = 150 e 1000 replicações é de aproximadamente 20% para (Cameron e Trivedi, 2009, pg 143), o erro padrão é cerca de 17 vezes menor e sempre rejeitamos a hipótese nula verdadeira de que .

  • O erro padrão (parâmetro) de x = raiz(1+.52x1) = 1.1180. 1.1180/0.06580 = 17. Ou seja, a estimativa OLS é também inconsistente para a variância do coeficiente (subestima o valor do parâmetro)

  • Outros exemplos podem ser testados. Esta possibilidade de simulação computacional do DGP (“data generation process”) nos coloca em uma nova era do ensino da econometria.


Um primeiro exemplo de uso de iv

Um primeiro exemplo de uso de iv

  • Utilizaremos um exemplo de Cameron e Trivedi(2009): gastos médicos com um regressor endógeno.

  • A variável dependente ldrugexp é o logaritmo dos gastos totais em medicamentos.

  • Os regressores são: um indicador (dummy) se os indivíduos tem seguro por empresa ou por sindicato (hi_empunion), número de condições crônicas (totchr), idade em anos (age), indicador de gênero (female), se é negro ou hispânico (blhisp) e o logaritmo natural da renda domiciliar anual em milhares de dólares (linc).


Um primeiro exemplo de uso de iv1

Um primeiro exemplo de uso de iv

  • Vamos considerar que a variável hi_empunion é endógena. A justificativa é que os indivíduos escolhem uma ou outra condição baseados na sua expectativa de gasto.

  • Os instrumentos selecionados são: a relação da rendimentos de seguridade social – rendimentos de todas as fontes (ssiratio), uma variável indicadora qualitativa (dummy) do status de renda reduzida (lowincome), o tamanho da força de trabalho empregada na firma (firmsz) e uma variável dummy indicando se a firma é uma grande operadora com localizações múltiplas.


Um primeiro exemplo de uso de iv2

Um primeiro exemplo de uso de iv

  • Os primeiros dois instrumentos são relevantes porque espera-se que sejam negativamente correlacionados com ter seguro suplementar.

  • Para serem instrumentos válidos (sem correlação com o termo de erro da equação de segundo estágio) – vamos admitir que se eles podem ser omitidos desta equação dado que o efeito dos rendimentos já é inteiramente capturado pela variável linc.

  • Os últimos dois instrumentos podem ser irrelevantes porque muitos indivíduos podem estar aposentados, serem autônomos ou estarem em sistemas de seguro de saúde privados.


Um primeiro exemplo de uso de iv estima o de um modelo exatamente identificado

um primeiro exemplo de uso de iv – estimação de um modelo exatamente identificado

use "C:\cameron stata data files\mus06data.dta", clear

global x2list totchr age female blhisp linc

ivregress 2sls ldrugexp (hi_empunion = ssiratio) $x2list, vce(robust) first

Em modelos com mais de um regressor endógeno, mais de uma regressão de primeiro estágio é mostrada se a opção first é usada.

Indivíduos com seguro suplementar tem despesas com remédios que são 90% mais baixas do que as pessoas com este suplemento.


Um primeiro exemplo de uso de iv estima o de um modelo sobre identificado

um primeiro exemplo de uso de iv – estimação de um modelo sobre identificado

global ivmodel “ldrugexp (hi_empunion=ssiratio multlc) $x2list”

quietly ivregress 2sls $ivmodel, vce(robust)

estimates store TwoSLS

quietly ivregress gmm $ivmodel, wmatrix(robust)

estimates store GMM_hat

quietly ivregress gmm $ivmodel, wmatrix(robust) igmm

estimates store GMM_igmm

quietly ivregress gmm $ivmodel, wmatrix(cluster age)

estimates store GMM_clu

quietly ivregress 2sls $ivmodel

estimates store TwoSLS_def

estimates table TwoSLS GMM_hat GMM_igmm GMM_clu TwoSLS_def, b(%9.5f) se


F rmulas derivadas para os estimadores

Fórmulas derivadas para os estimadores


F rmulas derivadas para os estimadores1

Fórmulas derivadas para os estimadores


Teste para endogeneidade do regressor

Teste para endogeneidade do regressor

  • Se o regressor hi_empunion for exógeno, os estimadores IV (IV, 2SLS ou GMM) são ainda consistentes, mas eles serão muito menos eficientes do que o estimador OLS.

  • Hausman test: se há pequena diferença entre as estimativas IV e OLS, concluímos que o regressor é exógeno.


Vari veis instrumentais e estima o gmm

H0:ρ=0


Coment rios sobre o teste hausman

Comentários sobre o teste Hausman

  • O comando estat endogenous implementa o teste Durbin-Wu-Hausman (DWH).

  • É baseado em uma estatística de teste robusta.

  • Considere o modelo:

    Podemos re-escrever esta equação estrutural adicionando uma variável v1 que é o erro da equação de primeiro estágio para y2:


Coment rios sobre o teste hausman1

Comentários sobre o teste Hausman

  • Sob a hipótese nula de que y2i é éxógena

  • O teste de exogeneidade é o teste de H0:ρ=0 na regressão de y1 sobre y2, x1 e v1. Como v1 não é diretamente observado utiliza-se o vetor de resíduos ajustados da equação de primeiro estágio.

  • Para erros homocedásticos e independentes, o teste é assintoticamente equivalente ao primeiro teste Hausman. No caso mais realista de erros heterocedáticos, o teste H0:ρ=0 pode ser ainda implementado desde que utilizemos estimativas robustas de variâncias.


Testes de restri es de sobre identifica o

Testes de restrições de sobre identificação

  • a validade de um instrumento não pode ser testada em um modelo exatamente identificado.

  • mas é possível testar a validade de instrumentos em um modelo sobre identificado desde que os parâmetros do modelo são estimados usando o GMM ótimo.

  • o mesmo teste tem diversos nomes, incluindo teste de restrições de sobre identificação (OIR), teste de sobre identificação (OID), Teste de Hansen, teste de Sargent e teste Hansen-Sargent.


Testes de restri es de sobre identifica o1

Testes de restrições de sobre identificação

  • Consideremos o valor da função de critério para o estimador GMM ótimo:

  • Se as condições de momento da população estão corretas, então e .

  • Sob a hipótese nula de que todos os instrumentos são válidos, pode ser demonstrado que tem uma distribuição assintoticamente qui-quadrado com numero de graus de liberdade igual ao número de restrições sobre identificação.


Nota o vetorial matricial utilizada

Notação vetorial (matricial) utilizada

Portanto: a matriz Z será formada por vetores-coluna constituídos

dos instrumentos excluídos e dos instrumentos incluídos.


O m todo das vari veis instrumentais

O método das variáveis instrumentais

  • Seja . O estimador de variáveis instrumentais de β é:

    (3)

  • Apesar deste estimador ser chamado de estimador de variáveis instrumentais em dois estágios, ele pode ser calculado em duas etapas como em apenas uma através da expressão anterior.


O m todo das vari veis instrumentais1

O método das variáveis instrumentais

  • Equação de primeiro estágio:

  • Equação de segundo estágio:


O m todo das vari veis instrumentais2

O método das variáveis instrumentais


O m todo das vari veis instrumentais3

O método das variáveis instrumentais


O m todo das vari veis instrumentais4

O método das variáveis instrumentais

  • O estimador IV em dois estágios:


O m todo das vari veis instrumentais5

O método das variáveis instrumentais


O m todo das vari veis instrumentais a estimativa da vari ncia

O método das variáveis instrumentais: a estimativa da variância

  • O estimador da variância dos parâmetros estimados pelo método 2SLS é:


O m todo das vari veis instrumentais estimativa da vari ncia

O método das variáveis instrumentais – estimativa da variância


O m todo das vari veis instrumentais estimativa da vari ncia1

O método das variáveis instrumentais – estimativa da variância


Propriedades da iv com uma variavel instrumental pobre estima o com apenas uma vari vel end gena

PROPRIEDADES DA IV COM UMA VARIAVEL INSTRUMENTAL POBRE: estimação com apenas uma variável endógena

  • O viés assintótico de um estimador IV é dado pela seguinte equação:

Mesmo se corr(z,u) for pequena, a inconsistência no estimador IV pode ser muito grande se corr(z,x) também for pequena.


Propriedades da iv com uma variavel instrumental pobre estima o com apenas uma vari vel end gena1

PROPRIEDADES DA IV COM UMA VARIAVEL INSTRUMENTAL POBRE: estimação com apenas uma variável endógena

  • Outra expressão para representar o viés assintótico é dada por:

    IV é preferível a OLS em termos de viés assintótico quando corr(z,u)/corr(z,x) < corr(x,u)


Estima o iv s ntese

Estimação IV: “síntese”

  • Quando temos certeza de que os regressores da nossa equação não estão correlacionados com os erros podemos aplicar o método convencional de OLS. No entanto, mesmo nesse caso temos que verificar se os resíduos da regressão são homocedásticos. Então temos que realizar o teste heterocedasticidade. Caso os resíduos sejam heterocedásticos temos que realizar a regressão robusta. Isto pode ser feito utilizando a opção robust (após a vírgula) no comando regress.


Estima o iv s ntese1

Estimação IV: “síntese”

  • Caso tenhamos motivos para acreditar que um ou mais regressores sejam endógenos (tenham correlação não nula com termo de erro da equação) temos que aplicar o método das variáveis instrumentais. Então nesse caso utilizaremos o comando ivreg (ou através do menu endogenous covariates) ao invés do comando regress.


Estima o iv s ntese2

Estimação IV: “síntese”

  • Mas mesmo nesse caso podemos ter uma complicação. Pode acontecer que aplicando o método das variáveis instrumentais os resíduos do modelo não sejam homocedásticos. Nesse caso temos que aplicar o método das variáveis instrumentais articulado com o método dos momentos generalizados (GMM).


Quais s o as implica es da heterocedasticidade para o estimador iv

Quais são as implicações da heterocedasticidade para o estimador IV?

Os resíduos da regressão OLS são homocedásticos?

  • Os regressores

  • são todos exógenos?

Sim

Sim

Utilizar estimação OLS

Não

Não

Utilizar estimação OLS com opção robust

Os resíduos da regressão IV são homocedásticos?

Sim

Utilizar estimação IV

Não

Utilizar estimação GMM


O m todo dos momentos generalizados gmm

O Método dos Momentos Generalizados (GMM)

  • Os economistas consideram que o GMM foi uma invenção de Lars Hansen em seu paper de 1982 na revista Econometrica.

  • Mas o método tem seus antecedentes nos trabalhos de Karl Pearson sobre o método dos momentos datados em 1895 e mais a frente (1928) nos trabalhos de Neyman e Egon Pearson sobre o método MCE que supera a dificuldade do método dos momentos quando temos mais condições de momentos do que parâmetros a serem estimados.

  • O método tem portanto, como qualquer descoberta cientifica, uma história bem definida.


O m todo dos momentos generalizados

O Método dos Momentos Generalizados

  • O GMM foi introduzido por Lars Hansen em 1982.

  • A equação a ser estimada, em notação matricial é:

    com uma linha típica:


O m todo dos momentos generalizados1

O Método dos Momentos Generalizados

  • A matriz de regressores X tem dimensão n x K, onde n é o número de observações.

  • Alguns dos regressores são endógenos, de forma que E(Xiui) ≠0.

  • Fazemos uma partição do conjunto de regressores em [X1 X2], com K1 regressores X1que de acordo com a hipótese nula são endógenos e K2=(K-K1)

    regressores X2 que são considerados exógenos.


O m todo dos momentos generalizados2

O Método dos Momentos Generalizados

  • Temos então a seguinte equação:

    (4)

  • O conjunto de variáveis instrumentais é Z e tem dimensão n x L.

  • Este é o conjunto completo de variáveis que são exógenas - E(Ziui) =0.

  • Fazemos uma partição dos instrumentos em [Z1-Z2], com L1 instrumentos Z1que são instrumentos excluídos e L2=(L- L1)instrumentos Z2 =X2 que são os instrumentos incluídos / regressores exógenos.


O m todo dos momentos generalizados3

O Método dos Momentos Generalizados

  • A condição de ordem para identificação da equação é: L ≥ K

  • Isto implica que precisamos ter no mínimo tantos instrumentos excluídos (L1)quantos forem os regressores endógenos (K1).

  • Se L = K a equação é exatamente identificada.

  • Se L > K a equação é sobre-identificada.


O estimador iv gmm

O Estimador IV-GMM

  • Os L instrumentos nos dão um conjunto de L momentos:

    (5)

  • Temos um vetor gi que é L x 1 (resultado de uma multiplicação de uma matriz que é

    L x n por outra matriz que é n x 1.

  • Dado que os L instrumentos são todos exógenos - E(Ziui) =0, temos L momentos nulos:

    (6)


O estimador iv gmm1

O Estimador IV-GMM

  • Cada uma das L equações de momento corresponde a um momento amostral. Para um dado estimador , podemos escrever estes L momentos amostrais como:

    (7)


O estimador iv gmm2

O Estimador IV-GMM


O estimador iv gmm3

O Estimador IV-GMM

  • O que está por trás da estimação GMM? Temos que escolher um estimador para o vetor de parâmetros que torne tão próximo de zero quanto possível.

  • No caso de L = K (equação exatamente identificada) temos L condições (equações) iguais a K coeficientes (incógnitas) em . Neste caso, é possível achar uma matriz que soluciona o sistema .


O estimador iv gmm4

O Estimador IV-GMM

  • Quando L = K a equação é exatamente identificada e uma solução única existe equivalente ao estimador padrão de variáveis instrumentais:

    (9)

  • No caso de sobre-identificação (L > K), podemos definir um conjunto de K instrumentos:

    (10)

    que é o estimador de mínimos quadrados em dois estágios (2SLS) que a despeito do seu nome é calculado por esta simples equação matricial.


O estimador iv gmm5

O Estimador IV-GMM

  • Se a equação é sobre-identificada (L ≥ K) temos mais equações do que incógnitas e neste caso não é possível achar uma matriz

    que iguale exatamente todo o conjunto de L momentos a zero.

  • Neste caso, temos que tomar uma matriz de ponderação W (L x L) e utilizá-la para construir uma forma quadrática nas condições de momento.


O estimador iv gmm6

O Estimador IV-GMM

  • No método 2SLS com sobre-identificação os L instrumentos disponíveis são reduzidos aos K necessários para definir a matriz Pz.

  • De acordo com Baum(2008), na abordagem IV-GMM esta redução não é necessária e todos os L instrumentos são usados no estimador.

  • Uma matriz de ponderação é empregada de forma que podemos determinar de forma que os elementos de são tão próximos de zero quanto possível.

  • Com L > K nem todas as L condições de momento podem ser satisfeitas e um critério de função que pondere estas condições apropriadamente é utilizado para aumentar a eficiência do estimador.


O estimador iv gmm7

O Estimador IV-GMM

  • O estimador GMM minimiza o critério (função objetivo):

    (11)

    onde W é uma matriz de ponderação simétrica LxL.

  • Resolvendo através deste critério de minimização obtemos o estimador IV-GMM de uma equação sobre-identificada:

    (12)

    que será idêntico para todas as matrizes W que diferem por um fator de proporcionalidade.


O estimador iv gmm8

O Estimador IV-GMM

  • A consistência é garantida por qualquer matriz de ponderação W simétrica positiva e portanto há tantos estimadores GMM como há escolhas da matriz de ponderação W.

  • Mas a eficiência não é garantida por uma W arbitrária. Então, o último estimador será referido como estimador GMM possivelmente ineficiente.

  • Estamos interessados em obter estimadores GMM eficientes: estimadores com mínima variância assintótica.


Qual a escolha tima da matriz de pondera o w que minimiza a vari ncia do estimador gmm

Qual é a escolha ótima da matriz de ponderação W que minimiza a variância do estimador GMM?

  • Seja S a matriz de covariância assintótica das condições de momento :

    (13)

    onde S é uma matriz L x L ,

    e Ω é a matriz de variância-covariância dos resíduos.


Qual a escolha tima da matriz de pondera o w que minimiza a vari ncia do estimador gmm1

Qual é a escolha ótima da matriz de ponderação W que minimiza a variância do estimador GMM?

  • A fórmula geral para a distribuição do estimador GMM é:

    (14)

  • O estimador GMM eficiente é o estimador GMM com uma matriz de ponderação ótima que minimiza a variância assintótica do estimador. Isto é obtido pela escolha de W = S-1


Qual a escolha tima da matriz de pondera o w que minimiza a vari ncia do estimador gmm2

Qual é a escolha ótima da matriz de ponderação W que minimiza a variância do estimador GMM?

  • Substituindo W por S-1 na expressão anterior do estimador GMM, temos:

    (15)

    com variância assintótica:

    (16)

  • A matriz S é obtida em um primeiro estágio através da estimativa ineficiente de uma matriz diagonal que é posteriormente introduzida na expressão:

    (17)


Qual a escolha tima da matriz de pondera o w que minimiza a vari ncia do estimador gmm3

Qual é a escolha ótima da matriz de ponderação W que minimiza a variância do estimador GMM?

  • onde é uma matriz diagonal de resíduos ao quadrado de , que é o estimador GMM de primeiro estágio consistente mas não necessariamente eficiente. No comando Stata ivreg2, este estimador de primeiro estágio é ,

    o estimador de variáveis instrumentais.


Como utilizar o comando ivreg2 para estimar gmm

Como utilizar o comando ivreg2 para estimar gmm

use MROZ, clear

ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6)

ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), robust

ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), gmm2s robust

ivreg2 lwage exper expersq (educ=age kidslt6 kidsge6), gmm2s

  • No primeiro comando (acima) temos um estimador padrão IV/2SLS

    (estamos assumindo da matriz de variância- covariância que os erros são condicionalmente homocedásticos e independentes (i.i.d.).

  • No segundo comando temos um estimador IV/ 2SLS com estimador da matriz de variância-covariância que é robusto a heterocedasticidade.


Gmm e erros heteroced sticos

GMM e erros heterocedásticos

  • é a matriz diagonal de quadrados dos resíduos.

    onde é uma estimativa consistente de . Então, um estimador consistente de S é

    (18)


Gmm e erros heteroced sticos1

GMM e erros heterocedásticos

  • Estimar uma equação usando IV.

  • Calcule os resíduos . Use estes resíduos para calcular a matriz de ponderação ótima:

    • (19)

  • Calcule o estimador GMM eficiente e sua matriz de variância-covariância usando a matriz de ponderação ótima estimada.


  • Quais s o as implica es da heterocedasticidade para o estimador iv1

    Quais são as implicações da heterocedasticidade para o estimador IV?

    • Na presença de heterocedasticidade, o estimador IV é ineficiente mas consistente, enquanto que a matriz padrão estimada de covariância é inconsistente.

    • A vantagem do GMM sobre IV é clara: se a heterocedasticidade está presente, o estimador GMM é mais eficiente que o estimador simples IV, enquanto que se não existe heterocedasticidade o estimador GMM não é pior assintoticamente que o estimador IV.

    • No entanto, o uso do GMM tem um preço. A matriz de ponderação ótima é uma função dos quartos momentos e a obtenção de uma estimativa razoável para estes requer amostras muito grandes.

    • Se o erro é homocedástico, IV é preferível ao GMM eficiente (ver Slide 30).


    Testes de heterocedasticidade

    Testes de Heterocedasticidade

    • Estatísticas de Breusch-Pagan/Godfrey/Cook-Weisberg e White/Koenker são testes de heterocedasticidade em regressão OLS.

    • Testa-se a relação entre os resíduos da regressão e p variáveis indicadores que são relacionadas a heterocedasticidade (por hipótese).

    • A estatística é distribuída como uma com p graus de liberdade sob a nula de não heterocedasticidade e de que o erro da regressão é normalmente distribuído.

    • O poder deste teste é muito sensível a hipótese de normalidade dos resíduos: Koenker proposum teste que relaxa esta hipótese.

    • Estes testes estão no Stata após a estimação com o comando regress, com ivhettest, hettest e whitetst.


    Testes de heterocedasticidade1

    Testes de Heterocedasticidade

    • Pagan e Hall mostraram que estes testes são válidos na regressão IV somente se há heterocedasticidade naquela equação e em nenhuma outra mais no sistema.

    • As outras equações estruturais no sistema (correspondentes aos regressores endógenos X1) precisam ser homocedásticas mesmo que elas não sejam explicitamente estimadas.

    • Este teste está disponível no Stata através do comando ivhettest após a estimação com ivreg, ivreg2 ou ivgmm0


    Testando a relev ncia e validade dos instrumentos

    Testando a relevância e validade dos instrumentos

    • Como vimos as variáveis instrumentais tem que satisfazer duas condições: precisam ser correlacionadas com os regressores endógenos e devem ser ortogonais ao processo de erro.

    • A primeira condição pode ser testada examinando o grau de ajuste das regressões de primeiro estágio, ou o que é o mesmo, verificar o poder explicativo dos instrumentos excluídos nestas regressões.

    • A estatística comumente usada é o R2 da regressão de primeiro estágio: a correlação parcial ao quadrado entre os instrumentos excluídos Z1 e o regressor endógeno (Bound).


    Testando a relev ncia e validade dos instrumentos1

    Testando a relevância e validade dos instrumentos

    • Um exemplo: o pesquisador tem um modelo com dois regressores endógenos e dois instrumentos excluídos. Um dos instrumentos excluídos é altamente correlacionado com os dois regressores endógenos mas o outro instrumento excluído tem uma correlação nula (representa um processo de ruído).

    • O modelo está, portanto, sub-identificado: há um instrumento bom mas dois regressores endógenos. Mas a estatística F e o R2 não revelam esta fraqueza.

    • A solução é encontrar mais instrumentos relevantes ou eliminar o regressor endógeno da equação.

    • A estatística de Bound só e válida quando temos apenas um regressor endógeno.


    Testando a relev ncia e validade dos instrumentos2

    Testando a relevância e validade dos instrumentos

    • Para levar em conta diversos regressores endógenos Shea(1997) propôs “uma medida de R2 parcial que leva em conta as inter-correlações entre os instrumentos”. Para um modelo contendo um único regressor endógeno, as duas medidas de R2 são equivalentes.

    • Se uma equação gera um grande valor do R2 parcial (Bound) e pequeno valor da medida de Shea, podemos concluir que os instrumentos tem pouca relevância para explicar os regressores endógenos e o modelo pode estar sub-especificado.


    Conseq ncias de instrumentos fracos

    Conseqüências de instrumentos fracos

    • Aumento do viés dos coeficientes IV estimados.

    • O modelo não fica identificado com relação as variáveis endógenas.

    • Neste caso, o viés do estimador IV é o mesmo do estimador OLS – a estimação IV é inconsistente e nada se ganha com isto.

    • Para equação com um único regressor endógeno uma estatística F com valor menor do que 10 significa que os instrumentos são fracos.

    • Deve-se ser parcimonioso na escolha dos instrumentos, dado que o viés por IV é crescente com o numero de instrumentos.

    • O problema de instrumentos fracos pode aparecer mesmo quando os testes de primeiro estágio são significativos aos níveis de 5 e 1 % e se dispõe de uma amostra grande.


    Testando a endogeneidade de uma vari vel explicativa wooldridge pg 473

    Testando a endogeneidade de uma variável explicativa (Wooldridgepg 473)

    • Suponha a seguinte equação de regressão:

      (20)

      onde y2 é a variável que suspeita-se que seja endógena e z1 e z2 são exógenas.

    • Temos a equação de y2 na forma reduzida:

      (21)

    • Como as variáveis z são não correlacionadas com u1, y2 será não correlacionado com u1 se, e somente se v2 for não correlacionada com u1.


    Testando a endogeneidade de uma vari vel explicativa

    Testando a endogeneidade de uma variável explicativa

    • Existem duas maneiras de testar isto:

      1) Regredir u1 contra em v2 um modelo

      onde e1 é não correlacionado com v2 e tem média 0. Então u1 e v2 serão não correlacionados se, e somente se .

      2) Incluir v2 como um regressor adicional na primeira equação e fazer um teste t para :

      (22)


    Testando a endogeneidade de uma vari vel explicativa1

    Testando a endogeneidade de uma variável explicativa

    • Se a estimativa for significativa (através de um teste t) concluímos que y2 é endógena na equação (20).

    • Podemos também testar a endogeneidade de múltiplas variáveis explicativas. Para cada variável suspeita de ser endógena obtemos os resíduos da equação da forma reduzida e verificamos a significância conjunta da forma estrutural usando um teste F. Se rejeitarmos a nula concluímos que pelo menos uma das variáveis explicativas é endógena (Wooldridge pg. 477).


    Testando a endogeneidade de uma vari vel explicativa2

    Testando a endogeneidade de uma variável explicativa

    * TESTE DE ENDOGENEIDADE DE UMA UNICA VARIAVEL EXPLICATIVA

    use "c:\textos download\wooldridge data files\mroz.dta", clear

    regress educ exper expersq motheduc fatheduc if hours > 0

    test motheduc fatheduc

    predict v2,residuals

    regress lwage educ exper expersq v2

    regress lwage educ exper expersq

    ivregress 2sls lwage exper expersq (educ = motheduc fatheduc)


    Modelos de equa o simult nea e o problema da identifica o

    Modelos de equação simultânea e o problema da identificação

    • Vamos supor um modelo Keynesiano simples de determinação de renda:

      Função consumo: (23)

      Identidade da renda: (24)

      onde:

      C = despesas de consumo

      Y = renda

      I = investimento (considerado exógeno)

      S = poupança

      t = tempo

      u = termo de erro estocástico


    Modelos de equa o simult nea e o problema da identifica o1

    Modelos de equação simultânea e o problema da identificação

    • No modelo de equações simultâneas (equações 23 e 24) nota-se que C e Y são variáveis interdependentes. Quando o termo aleatório ut muda, o valor de C varia (pela equação 23) e isto faz variar Y (pela equação 24) tornando Yt e ut correlacionados em (23).

    • Isto faz com que o estimador OLS de em (23) seja viesado e inconsistente. Podemos demonstrar isto também (ver Gujarati, pg 582) substituindo (23) em (24) e teremos:

      (25)


    O problema da identifica o

    O Problema da Identificação

    • Problema da identificação = possibilidade de obter, ou não, os parâmetros de uma equação estrutural a partir dos coeficientes estimados na forma reduzida. Em caso afirmativo, dizemos que a equação é identificada. Em caso negativo, dizemos que a equação é sub-identificada.

    • Uma equação é exatamente identificada quando podemos obter valores numéricos exatos para seus parâmetros.

    • Uma equação é sobre-identificada quando mais de um valor numérico podem ser obtidos para alguns dos parâmetros das equações estruturais.


    Regras para identifica o a condi o de ordem

    Regras para identificação: a condição de ordem

    • No caso de um modelo com M equações simultâneas, para que a equação possa ser identificada, é preciso que exclua no mínimo M-1 das variáveis (tanto endógenas quanto exógenas) que aparecem no modelo.

    • Para que uma equação seja identificada, em um modelo de M equações simultâneas, o número de variáveis exógenas excluídas da equação não poderá ser menor do que o número de variáveis endógenas incluídas nesta equação menos 1.


    Regras para identifica o a condi o de ordem1

    Regras para identificação: a condição de ordem

    Exemplo 1:

    Função de demanda: Função de oferta:

    modelo com duas variáveis endógenas, P e Q e nenhuma variável exógena. Para serem identificadas, cada uma destas equações devem excluir M-1 = 2-1 = 1 variável. Como isto não ocorre nenhuma das equações é identificada.


    Regras para identifica o a condi o de ordem2

    Regras para identificação: a condição de ordem

    Exemplo 2:

    Função de demanda: Função de oferta:

    modelo com duas variáveis endógenas, P e Q e l é exógena. Para serem identificadas, cada uma destas equações devem excluir M-1 = 2-1 = 1 variável. A função de demanda não é identificada, mas a função de oferta é exatamente identificada.


    Regras para identifica o a condi o de ordem3

    Regras para identificação: a condição de ordem

    Exemplo 3:

    Função de demanda: Função de oferta:

    modelo com duas variáveis endógenas, Pt e Qt e l e Pt-1 são exógenas. Para serem identificadas, cada uma destas equações devem excluir M-1 = 2-1 = 1 variável. Tanto a função de demanda como a função de oferta são exatamente identificadas. Portanto, o modelo como um todo é identificado.


    Regras para identifica o a condi o de posto

    Regras para identificação: a condição de posto

    • Ver Gujarati e Baum.


    Testes realizados atrav s do comando ivreg2 teste hansen sargan

    Testes realizados através do comando ivreg2: Teste Hansen-Sargan

    • Teste de restrições de sobre-identificação.

    • A hipótese nula conjunta é que os instrumentos são instrumentos válidos, isto é, não correlacionados com o termo de erro e que os instrumentos excluídos são corretamente excluídos da equação estimada.

    • Sob a nula, a estatística de teste é distribuída como qui-quadrado no número de restrições de sobre-identificação.

    • Uma rejeição coloca em dúvida a validade dos instrumentos.


    Testes realizados atrav s do comando ivreg2 teste hansen sargan1

    Testes realizados através do comando ivreg2: Teste Hansen-Sargan

    • Para o estimador eficiente GMM, a estatística de teste é a estatística J de Hansen, que é o valor minimizado da função objetivo GMM.

    • Para os estimador 2SLS, a estatística de teste é a estatística de Sargan, calculada como N*R2 de uma regressão dos resíduos de IV sobre o conjunto completo de instrumentos.

      .


    Testes realizados atrav s do comando ivreg2 estat stica c

    Testes realizados através do comando ivreg2: Estatística C

    • A estatística C, ou estatística “diferença-em-Sargan” é obtida através da opção orthog do comando ivreg2.

    • Permite o teste de um subconjunto de condições de ortogonalidade, ou seja, é o teste de exogeneidade de um ou mais instrumentos.

    • É definida como a diferença da estatística Hansen-Sargan da equação com o conjunto menor de instrumentos e a equação com o conjunto completo de instrumentos (incluindo os instrumentos suspeitos).

    • Sob a nula de que todos os instrumentos são válidos a estatística C tem distribuição qui-quadrado no número de instrumentos testados.

    • A falha em rejeitar a nula significa que o conjunto total de condições de ortogonalidade é válido.


    Vari veis instrumentais e estima o gmm

    Testes realizados através do comando ivreg2: Teste de razão de verossimilhança de correlação canônica de Anderson

    • Testa se a equação é identificada, ou seja, se os instrumentos excluídos são válidos.

    • A hipótese nula é que a equação é sub-especificada.

    • Sob a nula de sub-identificação, a estatística é distribuída como qui-quadrado com L-K+1 graus de liberdade (L= número de instrumentos excluídos e incluídos).

    • A estatística fornece uma medida da relevância dos instrumentos e a rejeição da nula indica que o modelo é identificado.

    • Importante: uma rejeição da nula deve ser interpretada com cautela, já que problemas de instrumentos fracos podem ainda estar presentes.


    O comando ivreg2

    O comando ivreg2


    O comando ivreg2 e complementares

    O comando ivreg2 e complementares

    Uma importante referencia a ser pesquisada é:

    Baum, Christopher F. Instrumental variables: Overview and advances. Boston College and DIW BerlinUKSUG 13, London, September 2007.


    Referencias

    Referencias

    • Baum, C. F., M. E. Schaffer, and S. Stillman. 2003. Instrumental variables and GMM: Estimation and testing. Stata Journal 3: 1–31.

    • Baum, C. F. 2006. An Introduction to Modern Econometrics Using Stata. College Station, TX: Stata Press.

    • Baum, C. F. Schaffer M.E. e Stillman, S. 2006. Enhanced routines for instrumental variables/GMM estimation and testing, 2007.

    • Wooldridge, J. M.. 2003. Introductory Econometrics: A Modern Approach. 2nd ed. New York: Thomson Learning.


    Referencias1

    Referencias

    • Cameron, A.C. e Trivedi, P.K., 2009. Microeconometrics using Stata, StataCorp LP., College Station, Texas.


  • Login