Ignorabilidade e sobreposição
Instituto de Matemática, Estatística e Computação Científica (IMECC),
Universidade Estadual de Campinas (UNICAMP).
\(U\) é uma variável de confusão não medida.
A suposição de ignorabilidade (também conhecida, inconfundibilidade) é dada por \[Z \perp\!\!\!\perp Y(1) | X \quad e \quad Z \perp\!\!\!\perp Y(0) | X,\] o que implica que \[\begin{align} P(Y(1) | Z = 1, X) & = P(Y(1) | Z = 0, X), \\ P(Y(0) | Z = 1, X) & = P(Y(0) | Z = 0, X). \end{align}\]
Ou seja, que as distribuições dos contrafactuais \(P(Y(1) | Z = 0, X)\) e \(P(Y(0) | Z = 1, X)\) sejam as mesmas do que as distribuições dos factuais \(P(Y(1) | Z = 1, X)\) e \(P(Y(0) | Z = 0, X)\)!.
Negative outcomes é uma estratégia interessante. Contudo, encontrar \(Yn\) não é trivial e precisa de um amplo conhecimento do problema em estudo.
Nas aulas anteriores discutimos como estimar efeitos causais sob e suposição de inconfundibilidade ou ignorabilidade:
\[Z \perp\!\!\!\perp \{ Y(1), Y(0) \} | X\]
M-vies aparece no seguinte DAG (com forma de “M”).
em que \(X\) é observado mas \(U1\) e \(U2\) não são.
Note que se mudarmos o valor de \(Z\), o valor de \(Y\) não muda. Ou seja, o verdadeiro efeito causal de de \(Z\) sob \(Y\) é zero.
Ademais, \[\tau_{PF} = \mathbb{E}[Y | Z = 1] - \mathbb{E}[Y | Z = 0] = 0\]
Isto significa que, sem ajustar por covariáveis, teremos um estimador não viesado para o verdadeiro valor do parâmetro.
Suponha que:
\[\mathbb{C}ov(Z, Y) = \mathbb{C}ov(cU_1 + \epsilon_Z, dU_2 + \epsilon_Y) = 0\]
Contudo, \[\rho_{ZY|X} = \dfrac{\rho_{ZY} - \rho_{ZX}\rho_{YX}}{\sqrt{1 - \rho^2_{ZX}} \sqrt{1 - \rho^2_{YX}}} \propto -\mathbb{C}ov(Z, X) \mathbb{C}ov(Y, X) \propto -abdc\]
[1] 0.001 -0.199
Ou seja, neste caso, condicionar por todas as covariáveis pre-tratamento não é benéfico 😢.
Em geral, quando o PGD é da forma do diagrama apresentado anteriormente (com forma de “M”), condicionar por todas as covariáveis pre-tratamento causará um vies.
Consideremos o seguinte diagrama causal:
Suponha que:
\[\tau_{unAdj} = \dfrac{\mathbb{C}ov(Z, Y)}{\mathbb{V}(Z)} = \tau + \dfrac{bc}{a^2 + b^2 + 1}\]
\[\tau_{Adj} = \tau + \dfrac{bc}{b^2 + 1}\]
[1] 0.333 0.499
[1] 0.037 0.499
[1] 0.010 0.498
Ou seja, neste caso, condicionar por todas as covariáveis pre-tratamento não é benéfico 😭.
Carlos Trucíos (IMECC/UNICAMP) | ME920/MI628 - Inferência Causal | ctruciosm.github.io