ME715 - Econometria

Dados em painel

Prof. Carlos Trucíos
ctrucios@unicamp.br

Instituto de Matemática, Estatística e Computação Científica (IMECC),
Universidade Estadual de Campinas (UNICAMP).

Introdução

Introdução

  • Nesta seção, discutimos técnicas para análisar dados em painel.
  • Dados em painel são \(n\) unidades de corte transversal que são acompanhadas ao longo de \(T\) períodos de tempo.
  • Em particular, note que:
    • se \(n = 1\) e \(T > 1\), estamos em um problema de séries temporais.
    • se \(T = 1\) e \(n > 1\), estamos em um problema de corte transversal.
  • Dados em painel referem-se a casos em que \(n > 1\) e \(T > 1\).
  • Discutiremos técnicas para paineis balanceados (o mesmo número de observações de corte transversal, \(n\), é acompanhado em todos os instantes de tempo, \(T\). Totalizando \(n \times T\) observações) em que \(n >> T\).
  • A teoría asintótica que justifica os resultados assume que \(n \rightarrow \infty\) e \(T\) é fixo

Notação

A forma mais comum de organizar os dados é

\[\textbf{y}_i = \begin{bmatrix} y_{i1} \\ \vdots \\ y_{iT} \end{bmatrix}; \quad \textbf{X}_{i} = \begin{bmatrix} X_{i1}^1 & X_{i1}^2 & \cdots & X_{i1}^K\\ \vdots & \cdots & \ddots & \vdots \\ X_{iT}^1 & X_{iT}^2 & \cdots & X_{iT}^K\\ \end{bmatrix}; \quad \boldsymbol{\epsilon}_i = \begin{bmatrix} \epsilon_{i1} \\ \vdots \\ \epsilon_{iT} \end{bmatrix}\]

em que

  • \(y_{it}\) é o valor da variável dependente para a unidade \(i\) no tempo \(t\) (\(i = 1, \cdots, n\) e \(t = 1, \cdots, T\)),
  • \(X_{it}^j\) a valor da \(j\)-éssima variável para a unidade \(i\) no tempo \(t\) (\(j = 1, \cdots, K\)) e
  • \(\epsilon_{it}\) é a perturbação aleatótia para a unidade \(i\) no tempo \(t\).

Notação

Empilhando os dados temos:

\[\textbf{y} = \begin{bmatrix} \textbf{y}_{1} \\ \vdots \\ \textbf{y}_{n} \end{bmatrix}_{nT \times 1}; \quad \textbf{X} = \begin{bmatrix} \textbf{X}_{1} \\ \vdots \\ \textbf{X}_{n} \end{bmatrix}_{nT \times K};\quad \boldsymbol{\epsilon} = \begin{bmatrix} \boldsymbol{\epsilon}_1 \\ \vdots \\ \boldsymbol{\epsilon}_n \end{bmatrix}_{nT \times 1}\]

e na sua forma matricial \[\textbf{y} = \textbf{X}\boldsymbol{\beta} + \boldsymbol{\epsilon}, \quad \text{em que } \boldsymbol{\beta} = [\beta_1, \cdots, \beta_K]'\]

As origens

O Estimador agrupado

  • O método de estimação mais simples

  • Consiste em ignorar a estrutura de painel e empilhar os dados da forma \[\textbf{y} = \begin{bmatrix} \textbf{y}_{1} \\ \vdots \\ \textbf{y}_{n} \end{bmatrix}; \quad \textbf{X} = \begin{bmatrix} \textbf{X}_{1} \\ \vdots \\ \textbf{X}_{n} \end{bmatrix};\quad \boldsymbol{\epsilon} = \begin{bmatrix} \boldsymbol{\epsilon}_1 \\ \vdots \\ \boldsymbol{\epsilon}_n \end{bmatrix}\]

  • Assume que \(\epsilon_{it} \sim IID(0, \sigma^2)\).

  • Este método é o mais simples e produz estimadores eficientes sob a suposição de que \(\epsilon_{it} \sim IID(0, \sigma^2)\) (para um dado indivíduo \(i\) os erros são serialmente não correlacionados e entre individuos e tempo, os erros são homocedasticos).

  • Este modelo é inapropriado se \(\epsilon_{it} \sim IID(0, \sigma^2)\) não for verdade.

Duas extensões

Seja o modelo \[y_{it} = X_{it} \boldsymbol{\beta} + \underbrace{\epsilon_{it}}_{\alpha_i + \eta_{it}}\]

  • \(\alpha_i\) é chamado efeito individual (varia entre individuos mas não ao longo do tempo).
  • \(\eta_{it}\) varia independentemente entre indivíduos e ao longo do tempo.
  • Assumimos que \(\eta_{it}\) e \(X_{it}\) são não correlacionados.
  • Dois modelos tem surgido dependendo da suposição feita sobre \(\alpha_i\):
    • se \(\alpha_i\) é não correlacionado com \(X_{it}\) \(\rightarrow\) Modelo de Efeitos Aleatórios
    • se \(\alpha_i\) é correlacionado com \(X_{it}\) \(\rightarrow\) Modelo de Efeitos Fixos

Modelo de Efeitos Aleatórios

Modelo de Efeitos Aleatórios

Seja o modelo \[y_{it} = X_{it} \boldsymbol{\beta} + \epsilon_{it}, \quad \text{em que } \quad \epsilon_{it} = \alpha_i + \eta_{it},\] com \(\alpha_i\) e \(X_{it}\), bem como \(\eta_{it}\) e \(X_{it}\), sendo não correlacionados

  • As suposições acerca de \(\alpha_i\) e \(\eta_{it}\), implicam que \(\epsilon_{it}\) e \(X_{it}\) são não correlacionados.
  • Ou seja, \(\hat{\boldsymbol{\beta}}_{MQO}\) é não viesado
Então, utilizamos MQO e pronto?

Modelo de Efeitos Aleatórios

Então, utilizamos MQO e pronto?
  • A variância de \(\hat{\boldsymbol{\beta}}_{MQO}\) não está corretamente estimada.
  • \(\hat{\boldsymbol{\beta}}_{MQO}\) não é um estimador eficiente.
O modelo de efeitos aleatórios é uma forma de lidar com o fato de que \(T\) observações de \(n\) indivíduos não é a mesma coisa que \(nT\) indivíduos diferentes.

Para contornar o problema, podemos derivar um estimador que leve em consideração a variância do erro e utilizar esta estrutura no estimador de \(\boldsymbol{\beta}\).

Qual método conhecemos para estimar \(\boldsymbol{\beta}\) quando a variância do erro não é da forma \(\sigma^2 I\)?

🏄‍♀️ MQG(F) 🏄

Modelo de Efeitos Aleatórios

Consideremos as seguintes suposições acerca do termo de erro:

  • \(\mathbb{E}[\boldsymbol{\eta} | \textbf{X}] = 0\)
  • \(\mathbb{E}[\boldsymbol{\eta}\boldsymbol{\eta}' | \textbf{X}] = \sigma_{\eta}^2 I_{nT}\)
  • \(\mathbb{E}[\alpha_i \alpha_j | \textbf{X}] = 0\), \(i \neq j\)
  • \(\mathbb{E}[\alpha_i \alpha_i | \textbf{X}] = \sigma_{\alpha}^2\)
  • \(\mathbb{E}[\alpha_i | \textbf{X}] = 0\)
  • \(\mathbb{E}[\alpha_1 \eta_{jt} | \textbf{X}] = 0\)

Agora, com todas estas suposições, podemos escrever a covariância do termo de erro 😄

Modelo de Efeitos Aleatórios

\[\mathbb{E}[\epsilon_i \epsilon_i'] = \sigma_{\alpha}^2\boldsymbol{i}\boldsymbol{i}' + \sigma_{\eta}^2 I_T = \begin{bmatrix} \sigma_{\eta}^2 + \sigma_{\alpha}^2 & \cdots & \cdots &\sigma_{\alpha}^2 \\ \sigma_{\alpha}^2 & \sigma_{\eta}^2 + \sigma_{\alpha}^2 & \cdots & \sigma_{\alpha}^2 \\ \vdots & \ddots & \cdots & \vdots \\ \sigma_{\alpha}^2 & \sigma_{\alpha}^2 & \cdots & \sigma_{\eta}^2 + \sigma_{\alpha}^2 \end{bmatrix}\]

E então

\[\Omega = \mathbb{E}[\boldsymbol{\epsilon}\boldsymbol{\epsilon}'] = \begin{bmatrix} \Sigma & 0 & \cdots & 0 \\ 0 & \Sigma & \cdots & 0 \\ \vdots & \ddots & \ddots & \vdots \\ 0 & \cdots & 0 & \Sigma \end{bmatrix} = I_n \otimes \Sigma, \quad \text{em que } \Sigma = \mathbb{E}[\epsilon_i \epsilon_i'].\]

Modelo de Efeitos Aleatórios

Produto de Kronecker

Se A é uma marix \(m \times n\) e B uma matrix \(p \times q\), então o produto de Kronecker, \(A \otimes B\) é uma matriz por blocos \(pm \times qn\):

\[A \otimes B = \begin{bmatrix} a_{11}B & \cdots & a_{1n}B \\ \vdots & \ddots & \vdots \\ a_{m1}B & \cdots & a_{mn}B \end{bmatrix}\]

A estrutura bloco diagonal de \(\Omega = \mathbb{E}[\boldsymbol{\epsilon}\boldsymbol{\epsilon}']\) faz com que calcular sua inversa seja apenas um problema de calcular \(\Sigma^{-1}\)

Após longas contas, pode-se provar que:

\[\Sigma^{-1/2} = \dfrac{1}{\sigma_{\eta}} \Big [ I_T - \Big ( \dfrac{1 - \theta}{T} \boldsymbol{i}\boldsymbol{i}' \Big) \Big], \quad \text{em que} \quad \theta = \sqrt{\dfrac{\sigma_{\eta}^2}{T\sigma^2_{\alpha} + \sigma^2_{\eta}}}.\]

Modelo de Efeitos Aleatórios

O lado bom!

Conhecida a forma de \(\Omega\), podemos aplicar MQG

O lado ruim!

Ainda precisamos estimar \(\sigma^2_{\eta}\) e \(\sigma^2_{\alpha}\) para podermos utilizar MQG(F)
Para estimar \(\sigma^2_{\eta}\) e \(\sigma^2_{\alpha}\), recorreremos a dois estimadores que, apesar de serem consistentes, não são eficientes.

Modelo de Efeitos Aleatórios

Pense no seguinte modelo: em lugar de termos \(T\) observações para cada um dos \(n\) indivíduos, transformamos os dados em médias específicas do individuo e aplicamos MQO nos dados transformados.

\[\bar{y}_{i\cdot} = \bar{X}_{i\cdot}\boldsymbol{\beta} + error,\] em que \(\bar{y}_{i\cdot} = T^{-1} \sum_{t = 1}^Ty_{it}\) e \(\bar{X}_{i\cdot}\) é definido de forma análoga.

Para escrever isto na forma matricial:

  • Utilizamos os dados originais empilhados.
  • Definimos uma matrix \(\textbf{D}_{nT \times n}\) formada por \(n\) variáveis dummy representando cada unidade de \(i\).
  • Definimos a matriz \(\textbf{P}_D = \textbf{D}(\textbf{D}'\textbf{D})^{-1}\textbf{D}'\) que é simétrica e idempotente.
  • Premultiplicamos os dados empilhados por \(\textbf{P}_D\)

Modelo de Efeitos Aleatórios

\[\textbf{P}_D\textbf{y} = \textbf{P}_D\textbf{X}\boldsymbol{\beta} + \textbf{P}_D\boldsymbol{\epsilon}\]

  • \(\hat{\boldsymbol{\beta}}_{B} = (\textbf{X}' \textbf{P}_D' \textbf{P}_D\textbf{X} )^{-1} \textbf{X}' \textbf{P}_D' \textbf{P}_D\textbf{y} = (\textbf{X}' \textbf{P}_D\textbf{X} )^{-1} \textbf{X}' \textbf{P}_D\textbf{y}\)
  • Premultiplicar \(\textbf{P}_D\) nos dados originais, nos leva a \(\bar{y}_{i\cdot} = \bar{X}_{i\cdot}\boldsymbol{\beta} + error.\)
  • \(\hat{\boldsymbol{\beta}}_B\) é equivalente a ajustar por MQO \(\bar{y}_{i\cdot} = \bar{X}_{i\cdot}\boldsymbol{\beta} + error.\)

Importante

\(\hat{\boldsymbol{\beta}}_B\) é chamado between estimator, isto pois o estimador utiliza a informação entre indivíduos.

Modelo de Efeitos Aleatórios

Por outro lado, em lugar de utilizarmos \(\textbf{P}_D\), podemos utilizar \(\textbf{M}_D = I_{nT} - \textbf{P}_D\) que também é simétrica e idempotente.

Premultiplicando os dados originais por \(\textbf{M}_D\) e aplicando MQO, nos leva a \[\hat{\boldsymbol{\beta}}_W = (\textbf{X}' \textbf{M}_D\textbf{X} )^{-1} \textbf{X}' \textbf{M}_D\textbf{y}.\]

Este estimador é equivalente ao que obteriamos se aplicarmos MQO na seguinte equação:

\[y_{it} - \bar{y}_{i\cdot} = (X_{it} - \bar{X}_{i\cdot}) \boldsymbol{\beta} + error.\]

Ademais, o estimador é o mesmo que obteriamos se aplicasemos MQO nos dados originais mas incluinddo variáveis dummy para cada indivíduo \(i\) (ver Teorema FWL).

Importante

\(\hat{\boldsymbol{\beta}}_W\) é chamado within estimator, isto pois o estimador utiliza a variação dentro de cada indivíduo.

Modelo de Efeitos Aleatórios

Note que o estimador MQO é uma soma ponderada de \(\hat{\boldsymbol{\beta}}_B\) e \(\hat{\boldsymbol{\beta}}_W\):

  • \(\hat{\boldsymbol{\beta}} = (X'X)^{-1}X'Y = (X'X)^{-1} X'(\textbf{M}_DY + \textbf{P}_DY) = (X'X)^{-1} \underbrace{X'\textbf{M}_DY}_{(X' \textbf{M}_D X) \hat{\boldsymbol{\beta}}_W} + (X'X)^{-1} \underbrace{X'\textbf{P}_DY}_{(X' \textbf{P}_D X) \hat{\boldsymbol{\beta}}_B}\)
  • Isso significa que não podemos utilizar a variância fornecida pelos softwares, pois ela não leva em consideração a verdadeira estrutura de \(\Omega\).
  • Assim, MQG(F) vem ao rescate fornecendo um melhor estimador do que MQO
  • Os estimadores de \(\sigma_{\eta}^2\) e \(\sigma_{\alpha}^2\) necessários para poder utilizar MQGF são obtidos como: \[\hat{\sigma}_{\eta}^2 = \dfrac{\hat{u}_W' \hat{u}_W}{nT - nk - n} \quad e \quad \hat{\sigma}_{\alpha}^2 = \underbrace{\dfrac{\hat{u}_B'\hat{u}_B}{n - k}}_{\hat{\sigma}_B^2} - \dfrac{\hat{\sigma}_{\eta}^2}{T},\]em que \(\hat{u}_W\) são os resíduos da regressão dentro (within) e \(\hat{u}_B\) são os resíduos da regresão entre (between).

Modelo de efeitos fixos

Modelo de efeitos fixos

Considere o seguinte modelo com apenas dois períodos de tempo (\(t = 1, 2\)):

\[y_{it} = X_{it} \boldsymbol{\beta} + Z_i \gamma + \epsilon_{it},\] em que

  • \(X\) é a matriz de variáveis explicativas que varia entre indivíduos e ao longo do tempo.
  • \(Z\) variáveis que mudam entre indivíduos mas não ao longo do tempo.
  • Como no caso anterior, consideramos \(\epsilon_{it} = \alpha_i + \eta_{it}\)
  • Consideremos tambem as seguintes suposições
  • \(\mathbb{E}[\boldsymbol{\eta} | \textbf{X}, \textbf{Z}] = 0\)
  • \(\mathbb{E}[\boldsymbol{\eta}\boldsymbol{\eta}' | \textbf{X}, \textbf{Z}] = \sigma_{\eta}^2 I_{nT}\)
  • \(\mathbb{E}[\alpha_i \alpha_j | \textbf{X}, \textbf{Z}] = 0\), \(i \neq j\)
  • \(\mathbb{E}[\alpha_i \alpha_i | \textbf{X}, \textbf{Z}] = \sigma_{\alpha}^2\)
  • \(\mathbb{E}[\alpha_i | \textbf{X}, \textbf{Z}] = 0\)
  • \(\mathbb{E}[\alpha_1 \eta_{jt} | \textbf{X}, \textbf{Z}] = 0\)

Modelo de efeitos fixos

Seja \(\textbf{W}_{it} = [\textbf{X}_{it}, \textbf{Z}_{i}]\), vamos assumir adicionalmente que \[\mathbb{E}[\textbf{W}_{it}' \epsilon_{it}] \neq 0.\]

(estamos interessados em que as v. independentes estejam correlacionadas com \(\alpha\))

Esta ausência de ortogonalidade tem consequências importantes a serem levadas em consideração. Pense no caso da estimação por MQO considerando apenas o primeiro período dos dados:

\[y_{i1} = X_{i1} \boldsymbol{\beta} + Z_i \gamma + \epsilon_{i1}\]

Diferente do modelo de efeitos aletarórios, MQO produzira estimadores viesados (cujo vies depende da relação entre \(\alpha_i\) e as outras variáveis explicativas)

Modelo de efeitos fixos

Pode-se provar que, por exemplo, se \(\beta_2\) é o coeficiente associado à segunda variável explicativa, \[\hat{\beta}_2 \overset{p}{\to} \beta_2 + \pi_2,\] em que \(\pi_2\) é o coeficiente associado à mesma variável explicativa na regressão \[\alpha_i = \textbf{W}_{2t} \pi + error.\]

Se escolhermos o outros período, teremos um efeito semelhante.

Modelo de efeitos fixos

A riqueza dos modelos para dados em painel residem no fato de que dado que ambas as representações (considerando os períodos 1 ou 2) são representações válidas, então qualquer combinação linear delas será também válida!

\[\begin{align} y_{i1} &= X_{i1} \boldsymbol{\beta} + Z_i \gamma + \epsilon_{i1} \\ y_{i2} &= X_{i2} \boldsymbol{\beta} + Z_i \gamma + \epsilon_{i2} \\ y_{i2} - y_{i1} &= (X_{i2} - X_{i1}) \boldsymbol{\beta} + (\epsilon_{i2} - \epsilon_{i1}) \\ \Delta y &= \Delta X \boldsymbol{\beta} + \Delta \eta \end{align}\]

A vantagem desta última representação é que agora \(\mathbb{E}[\Delta X'\Delta \eta] = 0\) e com isso MQO nos dados transformados não produzira estimadores viesados (para os \(\beta\)s associados a \(\textbf{X}\))

Modelo de efeitos fixos

  • Com dados em painel é possível obter estimadores não viesados de parâmetros de interesse mesmo diante do efeito omitido correlacionado. Coisa que MQO no corte transversal de individuos não consegue!
  • Com um estimador de efeitos fixos, não podemos recuperar estimadores de variáveis explicataivas invariantes no tempo.
  • O estimador de efeitos fixos é robusto à omissão de regressores (relevantes) que sejam invariantes no tempo.
  • Quando o efeito aleatório é valido, o estimador de efeitos fixos ainda produz estimadores consistentes (mas não eficiente) dos parâmetros de interesse.

Modelo de efeitos fixos com mais de dois períodos

Modelo de efeitos fixos com mais de dois períodos

O modelo de efeitos fixos assume que \(\mathbb{C}ov(X_{it}, \alpha_i) \neq 0\). Assim, devemos estimar o modelo condicional na presença destes efeitos fixos \[y_{it} = \textbf{X}_{it}\boldsymbol{\beta} + \alpha_i + \eta_{it},\] em que \(\alpha_i\) devem ser tratados como parâmetros a serem estimados.

Observação

No contexto atual (\(T\) pequeno e fixo e \(n \rightarrow \infty\)), não podemos obter estimadores consistentes para os parâmetros adicionais no modelo (\(\alpha_i\)) pois este número de parâmetros cresce junto com \(n\). Contudo, apesar de não poder estimar \(\alpha_i\) consistentemente, podemos estimar os outros parâmetros de forma consistente! 🏄‍♀️.

Para se fazer isto, basta ajustar por MQO o modelo \[\textbf{y} = \textbf{X}\boldsymbol{\beta} + \textbf{D} \boldsymbol{\alpha} + \boldsymbol{\eta},\] em que \(\textbf{D}\) são o conjunto de dummies (uma para cada indivíduo \(i\)).

Modelo de efeitos fixos com mais de dois períodos

Utilizando o Teorema FWL,

\[\hat{\boldsymbol{\beta}} = (\textbf{X}' M_D \textbf{X})^{-1} \textbf{X}'M_D \textbf{y},\] em que \(M_D = I - D(D'D)^{-1}D'.\)

Observação

Note que \(\hat{\boldsymbol{\beta}} = (\textbf{X}' M_D \textbf{X})^{-1} \textbf{X}'M_D \textbf{y} = \hat{\boldsymbol{\beta}}_W\) é uma opção (das muitas opções) de estimador de efeitos fixos.

Efeito fixo ou efeito aleatório?

Efeito fixo ou aleatório?

  • Partindo da definição, a diferença entre efeito fixo e aleatório está na relação existente entre \(\alpha_i\) e \(\textbf{X}_{it}\).
  • Se \(\mathbb{C}or(\alpha_i, \textbf{X}_{it}) = 0\) (efeito aleatório), mas se \(\mathbb{C}or(\alpha_i, \textbf{X}_{it}) \neq 0\) (efeito fixo).
  • Quando o efeito aleatório é valido, o estimador de efeito fixo produz estimadores consistentes dos parâmetros de interesse.
  • Alguns pesquisadores acreditam que, tirando os casos (quase)experimentais, é pouco plausível que \(\alpha_i\) seja não correlacionado com as variáveis explicativas.
  • Em algumas situações o estimador de efeitos fixos pode não ser uma boa ideia (erros de medida em X, X endogenos).
  • Um test que pode ajudar nessa escolha é o teste de Wu-Hausman

Teste de Wu-Hausman

  • Se \(\mathbb{C}or(\alpha_i, \textbf{X}_{it}) = 0\), o estimador de efeitos aleatórios é consistente e eficiente, mas o estimador de efeito fixo é consistente mas não eficiente.
  • Se \(\mathbb{C}or(\alpha_i, \textbf{X}_{it}) \neq 0\) o estimador de efeito fixo é consistente e eficiente, mas o estimador de efeito aleatório é inconsistente

Seja \(H_0:\) “o efeito é aleatório” e seja a estatística de teste \[H = (\hat{\beta}_{RE} - \hat{\beta}_{FE})'(\Sigma_{FE} - \Sigma_{RE})^{-1} (\hat{\beta}_{RE} - \hat{\beta}_{FE}) \stackrel{H_0}{\sim} \chi^2_{k}\]