Introdução
Instituto de Matemática, Estatística e Computação Científica (IMECC),
Universidade Estadual de Campinas (UNICAMP).
Correlação e causalidade podem co-existir, mas correlação não implica (necesariamente) causalidade.
Algumas vezes, correlação pode implicar causalidade, mas outras….
Suponha agora que conhecemos um fato adicional: Estrogêneo tem um efeito negativo na recuperação.
Consideremos \(X\) uma variável binária (1: caso leve, 0: caso grave).
Será que, dependendo do caso (\(X = 1\) ou \(0\)), pacientes preferem algum tipo de tratamento?
\[\begin{align*} & \hat{P}(Z = 1 | X = 1) - \hat{P}(Z = 1 | X = 0) \\ & = \dfrac{81 + 6}{81 + 6 + 234 + 36} - \dfrac{192 + 71}{ 192 + 71 + 55 + 25} \\ & \approx -0.52 \end{align*}\]
\[\begin{align*} & \hat{P}(Z = 0 | X = 1) - \hat{P}(Z = 0 | X = 0) \\ & = \dfrac{234 + 36}{81 + 6 + 234 + 36} - \dfrac{55 + 25}{ 192 + 71 + 55 + 25} \\ & \approx 0.52 \end{align*}\]
Pacientes com casos graves (\(X = 0\)) tendem a tomar o tratamento 1 (\(Z = 1\)) com mais frequência. Já pacientes com casos leves (\(X = 1\)) tendem a tomar o tratamento 0 (\(Z = 0\)) com mais frequência.
\[\begin{align*} & \hat{P}(Y = 1 | Z = 1, X = 1) - \hat{P}(Y = 1 | Z = 1, X = 0) \\ & = \dfrac{81}{81 + 6} - \dfrac{192}{192 + 71} \\ & \approx 0.20 \end{align*}\]
\[\begin{align*} & \hat{P}(Y = 1 | Z = 0, X = 1) - \hat{P}(Y = 1 | Z = 0, X = 0) \\ & = \dfrac{234}{234 + 36} - \dfrac{55}{55 + 25} \\ & \approx 0.18 \end{align*}\]
Independente do tratamento (\(Z\)), paciêntes com casos leves (\(X = 1\)) tem maiores probabilidades de sucesso do que pacientes com casos graves (\(X = 0\)).
Se aplicarmos o tratamento menos efetivo (\(Z = 0\)) de forma mais frequente para os casos mais leves (\(X = 1\)) pode parecer que o tratamento é mais efetivo. Assim, para eliminar o efeito “severidade do caso”, devemos olhar para os dados desagregados (por severidade do caso).
Usualmente, comparamos o resultado quando uma determinada ação A é realizada versus o resultado quando a ação A não é realizada. Se o resultado muda, dizemos que a ação A tem um efeito causal sobre o resultado. Caso contrario, dizemos que ação A não tem um efeito causal sobre o resultado. A ação A é geralmente chamada de intervenção, política ou tratamento.
\(Y_i(1)\) e \(Y_i(0)\) são conhecidas como potential outcomes ou counterfactual outcomes para a \(i\)-éssima unidade. Aquela que corresponde ao valor da intervenção que o indivíduo de fato recebeu é chamada de factual e a outra de contrafactual.
O efeito causal médio é comumente chamado apenas de efeito causal e a hipótese nula de não efeito médio causal é chamada simplesmente de hipótese causal nula.
Se o resultado de interesse for dicotomico, a ausência do efeito causal médio também pode ser medido através de:
Em que \(Pr(\cdot)\) é a proporção de individuos na população.
A | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Y | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 |
Quando a proporção de indivíduos que \(Y = 1\) no grupo de tratamento e no de controle são iguais, ou seja, \[Pr(Y = 1 | A = 1) = Pr(Y = 1 | A = 0),\] dizemos que \(A\) e \(Y\) são independentes (\(A \perp\!\!\!\perp Y\)), não associados ou que A não predize \(Y\). Caso contrário dizemos que \(A\) e \(Y\) são dependentes ou associadas.
Outras definições equivalentes:
Se \(Y\) for contínua, definimos a independência média entre \(A\) e \(Y\) como \[\mathbb{E}(Y | A = 1) = \mathbb{E}(Y | A = 0)\]
Voltando a exemplo, são \(A\) e \(Y\) associados?
A | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Y | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 |
Sim, pois
\[P(Y = 1 | A = 1) = 7/13 \neq P(Y = 1 | A = 0) = 3/7\]
Carlos Trucíos (IMECC/UNICAMP) | ME920/MI628 - Inferência Causal | ctruciosm.github.io