Propensity score em modelos de regressão
Instituto de Matemática, Estatística e Computação Científica (IMECC),
Universidade Estadual de Campinas (UNICAMP).
Anteriormente, vimos que se ignorabilidade acontece (condicionada em \(X\)), também acontece condicionada em \(e(X)\). Ou seja, \[Z \perp\!\!\!\perp \{ Y(1), Y(0)\} | e(X).\]
Ademais, \[\begin{align} \tau & = \mathbb{E}[Y(1) - Y(0)], \\ & = \mathbb{E}[Y(1)] - \mathbb{E}[Y(1)], \\ & = \mathbb{E}[\mathbb{E} \{ Y(1)| Z = 1, e(X) \}] - \mathbb{E}[\mathbb{E} \{ Y(0)| Z = 0, e(X) \}], \\ & = \mathbb{E}[\mathbb{E} \{ Y| Z = 1, e(X) \} - \mathbb{E} \{ Y| Z = 0, e(X) \}]. \end{align}\]
Teorema
Se \(Z \perp\!\!\!\perp \{ Y(1), Y(0)\} | X\), então o coeficiente associado a \(Z\) na regressão (populacional) por MQO de \(Y\) sob \((1, Z, e(X))\) é igual a:
\[\tau_e = \tau_O = \dfrac{\mathbb{E}[h_O(X)\tau(X)]}{\mathbb{E}[h_O(X)]},\] em que \(h_O(X) = e(X)(1 - e(X))\) e \(\tau(X) = \mathbb{E}[Y(1) - Y(0)|X].\)
Corolário
Se \(Z \perp\!\!\!\perp \{ Y(1), Y(0)\} | X\), então:
Os resultados teóricos anunciados anteriormente, motivam os seguines estimadores:
Lembremos do estimador de Hajek para \(\tau\):
\[\hat{\tau}^{Hajek} = \dfrac{\displaystyle \sum_{i = 1}^n \dfrac{Z_iY_i}{\hat{e}(X_i)}}{\displaystyle \sum_{i = 1}^n \dfrac{Z_i}{\hat{e}(X_i)}} - \dfrac{\displaystyle \sum_{i = 1}^n \dfrac{(1 - Z_i)Y_i}{(1 - \hat{e}(X_i))}}{\displaystyle \sum_{i = 1}^n \dfrac{(1 - Z_i)}{(1 - \hat{e}(X_i))}}.\]
Proposição
\(\hat{\tau}^{Hajek}\) é igual ao \(\hat{\beta}\) da regressão por MQP, i.e, \[(\hat{\alpha}, \hat{\beta}) = arg\min_{\alpha, \beta} \displaystyle \sum_{i = 1}^n w_i (Y_i - \alpha - \beta Z_i)^2,\] em que \(w_i = \dfrac{Z_i}{\hat{e}(X_i)} + \dfrac{1 - Z_i}{1 - \hat{e}(X_i)} = \left\{ \begin{array}{ll} \dfrac{1}{\hat{e}(X_i)} & \text{se } Z_i = 1,\\ \dfrac{1}{1 - \hat{e}(X_i)} & \text{se } Z_i = 0. \end{array}\right.\)
Teorema
Se \(\bar{X} = 0\) e \((\mu_1(X, \hat{\beta}_1), \mu_0(X, \hat{\beta}_0)) = (\hat{\beta}_{10} + X \hat{\beta}_{11}, \hat{\beta}_{00} + X \hat{\beta}_{01})\) baseado na regressão por MQP de \(Y\) sob \((1, Z, X, Z \times X)\) com \[w_{i} = \left\{ \begin{array}{ll} \dfrac{1}{\hat{e}(X_i)} & \text{se } Z_i = 1,\\ \dfrac{1}{1 - \hat{e}(X_i)} & \text{se } Z_i = 0. \end{array}\right.\] Então \[\hat{\tau}_{MQP}^{DR} = \hat{\tau}_{MQP}^{Reg} = \hat{\beta}_{10} - \hat{\beta}_{00},\] que é o coeficiente associado a \(Z\) na regressão por MQP
Estimadores
CRE | Estudos Observacionais | |
---|---|---|
Sem \(X\) | \(Y \sim (1, Z)\) | \(Y \sim (1, Z)\) com pesos \(w_i\) |
Com \(X\) | \(Y \sim (1, Z, X, Z \times X)\) | \(Y \sim (1, Z, X, Z \times X)\) com pesos \(w_i\) |
O estimador de Hajek para \(\tau_T\) é dado por
\[\hat{\tau}_T^{Hajek} = \hat{\bar{Y}}(1) - \dfrac{\sum_{i = 1}^n \hat{o}(X_i)(1 - Z_i) Y_i}{\sum_{i = 1}^n \hat{o}(X_i)(1 - Z_i)},\] com \(\hat{o}(X_i) = \hat{e}(X_i) /(1 - \hat{e}(X_i))\).
De forma semelhante ao desenvolvido para \(\tau\), se \(\bar{X}(1) = 0\) podemos estimar \(\tau_T\) como o coeficiente associado a \(Z\) da regressão por MQP de \(Y\) sob \((1, Z, X, Z \times X)\) com pesos \(w_{Ti} = \left\{ \begin{array}{ll} 1& \text{se } Z_i = 1,\\ \hat{o}(X_i) & \text{se } Z_i = 0. \end{array}\right.\)
Este estimador é igual ao estimador de regressão \[\hat{\tau}_{T, MQP}^{Reg} = \hat{\bar{Y}}(1) - \dfrac{1}{n_1} \sum_{i = 1}^n Z_i \mu_0(X_i, \hat{\beta}_0),\] que por sua vez, é igual ao estimador DR
\[\hat{\tau}_{T, MQP}^{DR} = \hat{\tau}_{T, MQP}^{Reg} - \dfrac{1}{n_1}\sum_{i = 1}^n\hat{o}(X_i)(1 - Z_i)(Y_i - \mu_0(X_i, \hat{\beta}_0)).\]
Teorema
Se \(\bar{X}(1) = 0\) e \(\mu_0(X_i, \hat{\beta}_0) = \hat{\beta}_{00} + X_i \hat{\beta}_{01}\) baseado na regressão por MQP de \(Y\) sob \((1, Z, X, Z \times X)\) com pesos \[w_{Ti} = \left\{ \begin{array}{ll} 1& \text{se } Z_i = 1,\\ \hat{o}(X_i) & \text{se } Z_i = 0. \end{array}\right.\] Então,
\[\hat{\tau}_{T, MQP}^{DR} = \hat{\tau}_{T, MQP}^{Reg} = \hat{\beta}_{10} - \hat{\beta}_{00},\] que é o coeficiente associado a \(Z\) na regressão por MQP.
Carlos Trucíos (IMECC/UNICAMP) | ME920/MI628 - Inferência Causal | ctruciosm.github.io