Ignorabilidade e sobreposição
Instituto de Matemática, Estatística e Computação Científica (IMECC),
Universidade Estadual de Campinas (UNICAMP).
Exemplo 1
Se tivermos o diagrama ao lado e o foco for o efeito causal de \(Z\) sob \(Y\), estamos dizendo que o processo gerador de dados é da forma:
\[\begin{align} &X \sim F_X(x), \\ &Z = f_Z(X, \epsilon_Z), \\ &Y(z) = f_Y(X, z, \epsilon_y(z)), \end{align}\] em que \(\epsilon_Z \perp\!\!\!\perp \epsilon_Y(z)\). Ademais, é fácil ver \(Z \perp\!\!\!\perp Y(z) | X\)
Exemplo 2
\[\begin{align} &X \sim F_X(x), \\ &U \sim F_U(u), \\ &Z = f_Z(X, U, \epsilon_Z), \\ &Y(z) = f_Y(X, U, z, \epsilon_y(z)), \end{align}\] em que \(\epsilon_Z \perp\!\!\!\perp \epsilon_Y(z)\). Ademais, é fácil ver \(Z \perp\!\!\!\perp Y(z) | (X, U)\) (ignorabilidade acontece condicionado em \((X, U)\) mas não condicionado apenas em \(X\)).
\(U\) é uma variável de confusão não medida.
A suposição de ignorabilidade (também conhecida, inconfundibilidade) é dada por \[Z \perp\!\!\!\perp Y(1) | X \quad e \quad Z \perp\!\!\!\perp Y(0) | X,\] o que implica que \[\begin{align} P(Y(1) | Z = 1, X) & = P(Y(1) | Z = 0, X), \\ P(Y(0) | Z = 1, X) & = P(Y(0) | Z = 0, X). \end{align}\]
Ou seja, que as distribuições dos contrafactuais \(P(Y(1) | Z = 0, X)\) e \(P(Y(0) | Z = 1, X)\) sejam as mesmas do que as distribuições dos factuais \(P(Y(1) | Z = 1, X)\) e \(P(Y(0) | Z = 0, X)\)!.
Exemplo 1
Cornfield et al. (1959) estudaram o efeito de fumar cigarros no câncer de pulmão através de um estudo observacional. Os autores incluiram diversar covariáveis mas ainda existe a possibilidade de termos uma variável de confusão não medida que pode causar vies no efeito observado.
Para fortalecer as evidências de causalidade, os autores também reportaram o efeito de fumar cigarros sob accidentes de auto (que foi perto de zero, como esperado). Assim, as análises baseadas no negative outcomes fazem com que a evidência de causalidade entre fumar cigarros no câncer de pulmão de torne-se mais forte.
Exemplo 2
Imbens e Rubin (2015) sugerem utilizar o resultado defasado como negative outcome.
Em muitos casos, é razoável acreditar que o resultado defasado e o resultado tem a mesma estrutura de confusão.
Como o resultado defasado acontece antes do tratamento, o efeito causal médio deve ser 0.
Exemplo 3
Um estudo observacional com pessoas idosas mostrou que vacina contra a influenza reduz o risco de pneumonia/hospitalização por influenza, bem como mortalidade (por todas as causas) na temporarada seguinte.
Jackson et al. (2006), duvidando das conclusões, realizam uma análise suplementar com negative outcomes.
Vacinação começa outono e a transmisão da influenza é minima até o inverno. Assim, o efeito da vacinação deve ser mais proominente durante a época de influenza. Contudo, Jackson et al. (2006) encontram um efeito maior antes do período de influenza, sugerindo que o efeito observado é, na verdade, devido a variáveis de confusão não observadas.
Negative outcomes é uma estratégia interessante. Contudo, encontrar \(Yn\) não é trivial e precisa de um amplo conhecimento do problema em estudo.
Exemplo 4
Sanderson et al. (2017) dão muitos exemplos de negative expousures na determinação do efeito da exposição intrauterina nos resultados posteriores. Eles comparam a associação da exposição materna durante a gravidez com o resultado de interesse, com a associação da exposição paterna com o mesmo resultado. Eles revisam estudos sobre o efeito do tabagismo materno e paterno nos resultados dos filhos, e estudos sobre o efeito do IMC materno e paterno no IMC dos filhos e no transtorno do espectro autista. Nestes exemplos, esperamos que a associação da exposição materna (\(Z\)) com o resultado seja maior do que a da exposição paterna (\(Zn\)) com resultado.
Nas aulas anteriores discutimos como estimar efeitos causais sob e suposição de inconfundibilidade ou ignorabilidade:
\[Z \perp\!\!\!\perp \{ Y(1), Y(0) \} | X\]
M-vies aparece no seguinte DAG (com forma de “M”).
em que \(X\) é observado mas \(U1\) e \(U2\) não são.
Note que se mudarmos o valor de \(Z\), o valor de \(Y\) não muda. Ou seja, o verdadeiro efeito causal de de \(Z\) sob \(Y\) é zero.
Ademais, \[\tau_{PF} = \mathbb{E}[Y | Z = 1] - \mathbb{E}[Y | Z = 0] = 0\]
Isto significa que, sem ajustar por covariáveis, teremos um estimador não viesado para o verdadeiro valor do parâmetro.
Suponha que:
\[\mathbb{C}ov(Z, Y) = \mathbb{C}ov(cU_1 + \epsilon_Z, dU_2 + \epsilon_Y) = 0\]
Contudo, \[\rho_{ZY|X} = \dfrac{\rho_{ZY} - \rho_{ZX}\rho_{YX}}{\sqrt{1 - \rho^2_{ZX}} \sqrt{1 - \rho^2_{YX}}} \propto -\mathbb{C}ov(Z, X) \mathbb{C}ov(Y, X) \propto -abdc\]
[1] 0.001 -0.199
Ou seja, neste caso, condicionar por todas as covariáveis pre-tratamento não é benéfico 😢.
Em geral, quando o PGD é da forma do diagrama apresentado anteriormente (com forma de “M”), condicionar por todas as covariáveis pre-tratamento causará um vies.
Consideremos o seguinte diagrama causal:
Suponha que:
\[\tau_{unAdj} = \dfrac{\mathbb{C}ov(Z, Y)}{\mathbb{V}(Z)} = \tau + \dfrac{bc}{a^2 + b^2 + 1}\]
\[\tau_{Adj} = \tau + \dfrac{bc}{b^2 + 1}\]
[1] 0.333 0.499
[1] 0.037 0.499
[1] 0.010 0.498
Ou seja, neste caso, condicionar por todas as covariáveis pre-tratamento não é benéfico 😭.
Carlos Trucíos (IMECC/UNICAMP) | ME920/MI628 - Inferência Causal | ctruciosm.github.io