Instituto de Matemática, Estatística e Computação Científica (IMECC), Universidade Estadual de Campinas (UNICAMP).
Introdução
Introdução
As técnicas para estudos observacionais discutidas anteriormente baseiam-se em duas suposições: ignorabilidade (\(Z \perp\!\!\!\perp \{ Y(1), Y(0)\} | X\)) e sobreposição (\(0 < e(X) < 1\)).
Já discutimos como agir quando a hipótese de ignorabilidade não parece apropriada.
Hoje discutiremos o que fazer quando a hipótese de sobreposição não parece apropriada.
Implicações
Implicações
Se algumas unidades tem \(e(X) = 0\) ou \(e(X) = 1\) é dificil pensarmos na existência do contrafactual.
Mesmo se \(e(X)\) não for exatamente 0 nem 1, \(\hat{e}(X)\) pode estar muito perto de 0 ou 1, causando instabilidade nos estimadores.
Uma alternativa disso é assumimos sobreposição forte, ou seja que \[\eta \leq e(X) \leq 1 - \eta, \quad, \eta \in (0, 1/2).\] Contudo, essa suposição tem consequências não triviais (ver Teorema 20.1 do livro texto).
Quando sobreposição forte não acontece, uma prática commum é o Trimming do \(\hat{e}(X),\) mas esta alternativa está longe de ser ótima.
Uma outra alternativa é a regressão descontinuada.
Regressão descontinuada
Regressão descontinuada
Seja \(X \in \mathbb{R}\), um mecanismno (extremo) de atribuição de tratamento pode ser dado por \[Z = \mathbb{I}(X \geq x_0),\] para algum valor \(x_0\) pre-determinado.
Isto garante, automaticamente, que ignorabilidade aconteça.
Contudo, a suposição de sobreposição é violada pois \[e(X) = P(Z = 1 | X) = \mathbb{I}(X \geq x_0).\]
Será que o mecanismo de aribuição de tratamento definido acima é algo irreal?
Regressão descontinuada: exemplos
Exemplo 1
Thistlethwaite e Campbell (1960), estudam o efeito dos estudantes obterem um certificado de mérito sob o plano de carreira. A obtenção ou não do certificado depende de se pontuação no teste de qualificação está acima de um determinado valor de corte.
Exemplo 2
Bor et al. (2014) utilizaram regressão descontinuidade para estudar o efeito de iniciar pacientes com HIV com antirretrovirais sob a sua mortalidade. O tratamento é iniciado quando contagem de globulos brancos é menor do que 200/μL.
Exemplo 3
Carpenter e Dobkin (2009) estudaram o efeito do consumo de álcool sobre mortalidade e utilizam a idade minima legal para beber como uma descontinuidade para o consumo de álcool.
Regressão descontinuada: Formulação
Regressão descontinuada pode identificar o efeito causal médio local para um determinado valor de corte \(x_0\): \[\tau(x_0) = \mathbb{E} [Y(1) - Y(0) | X = x_0],\] em que \(X\) é a variável que determina o tratamento e é conhecida como running variable.
Regressão descontinuada: Formulação
Se \(\mathbb{E}[Y(1) | X = x]\) for contínua pela direita em \(x_0\), temos que \[\begin{align}
\mathbb{E}[Y(1) | X = x_0] &= \lim_{\epsilon \rightarrow 0^{+}} \mathbb{E}[Y(1) | X = x_0 + \epsilon] \\
& = \lim_{\epsilon \rightarrow 0^{+}} \mathbb{E}[Y(1) | Z = 1, X = x_0 + \epsilon] \\
& = \lim_{\epsilon \rightarrow 0^{+}} \mathbb{E}[Y | Z = 1, X = x_0 + \epsilon].
\end{align}\]
De forma semelhante, se \(\mathbb{E}[Y(0) | X = x]\) for contínuo pela esquerda em \(x_0\), \[\mathbb{E}[Y(1) | X = x_0] = \lim_{\epsilon \rightarrow 0^{+}} \mathbb{E}[Y | Z = 0, X = x_0 - \epsilon].\]
Regressão descontinuada: Formulação
Teorema
Asuma que o mecanismo de atribuicao de tratamento é dado por \(Z = \mathbb{I}(X \geq x_0),\) em que \(x_0\) é um ponto de corte pre-definido. Assuma também que \(\mathbb{E}[Y(1) | X = x]\) é contínuo pela direita em \(x_0\) e \(\mathbb{E}[Y(0) | X = x]\) é contínuo pela esquerda em \(x_0\). Então, o efeito causal médio (local em \(X = x_0\)) é dado por \[\tau(x_0) = \lim_{\epsilon \rightarrow 0^{+}} \mathbb{E}[Y | Z = 1, X = x_0 + \epsilon] - \lim_{\epsilon \rightarrow 0^{+}} \mathbb{E}[Y | Z = 0, X = x_0 - \epsilon].\]
Note que o parâmetro \(\tau(x_0)\) envolve apenas a distribuição dos observáveis e então é identificável não parametricamente.
Regressão perto da fronteira
Regressão perto da fronteira
Se tivermos sorte, uma análise gráfica nos ajudará a enxergar o efeito causal para um determinado ponto de corte \(x_0\). Contudo, isto não sempre é possível na prática.
Ilustração
Simularemos quatro conjunto de dados.
Todos os datasets serão com discontinuidade em \(x_0 = 0\).
Veremos se a inspeção gráfica é suficiente por si só.
Suponhamos que \[\mathbb{E}(Y | Z = 1, X = x) = \gamma_1 + \beta_1 x\quad e \quad \mathbb{E}(Y | Z = 0, X = x) = \gamma_0 + \beta_0 x.\]
Através de MQO podemos ajustar ambas as retas de regressão e obtermos \[\hat{\gamma}_1 + \hat{\beta}_1 x \quad e \quad \hat{\gamma}_0 + \hat{\beta}_0 x.\]
Então, o efeito causal no ponto \(X = x_0\) é dado por \[\hat{\tau}(x_0) = (\hat{\gamma}_1 - \hat{\gamma}_0) + (\hat{\beta}_1 - \hat{\beta}_0) x_0\]
Regressão perto da fronteira
\(\hat{\tau} (x_0)\) pode também ser obtido como o coeficiente associado a \(Z\) da regressão \(Y \sim \{1, Z, X - x_0, Z(X-x_0) \}\).
Equivalentemente, \(\hat{\tau} (x_0)\) pode também ser obtido como o coeficiente associado a \(Z\) da regressão \(Y \sim \{1, Z, R, L \}\), em que \(R = max(X-x_0, 0)\) e \(L = min(X-x_0, 0)\).
A recomendação é ajustar a regressão considerando apenas s observações locais perto do ponto de corte.
Como a escolha dos pontos locais é fundamental na regressão descontinuada, o commum é reportar intervalos de confiança para várias escolhas dos pontos locais (pode até servir como una análise de sensibilidade).
Exemplo
Exemplo
Exemplo
Lee (2008) estuda a vantagem de já serem previamente eleitos no congresso dos Estados Unidos. “Eleitos são aqueles políticos que tiveram sucesso na eleição prévia. Se aquilo que os torna bem sucedidos é persistente ao longo do tempo, deve-se esperar que tenham um pouco mais de sucesso quando concorrerem à reeleição.”
Este é um problema de inferência causal no qual regressão descontinuada é uma estratégia interessante.
A variável \(X\) (running variable) é o voto obtido nas eleições anteriores (centrado no 0) e o resultado (\(Y\)) é o voto na eleição atual com unidades sendo os distritos eleitorais. O tratamento (\(Z\)) é uma binária indicando se foi eleito na eleição anterior no distrito.
Utilizaremos a função rdrobust() do pacote rdrobust que nos ajudará na nossa escolha dos pontos locais. A função implementa vários métodos de pontos locais.
Coeff CI Lower CI Upper
Conventional 0.06372533 0.04224798 0.08520269
Bias-Corrected 0.05937028 0.03789292 0.08084763
Robust 0.05937028 0.03481238 0.08392818
Também é possível fazer a regressão local por MQO:
Code
house$z <- (house$x >=0)hh <-seq(0.05, 1, 0.01)local_regression <-sapply(hh, function(h) { modelo <-lm(y ~ z + x + z*x, data = house, subset =abs(x) <= h)cbind(modelo$coef[2], confint(modelo, 'zTRUE'))})local_regression <-t(local_regression)
Exemplo
Code
library(ggplot2)dados <-data.frame(h = hh, point = local_regression[, 1], int_inf = local_regression[, 2], int_sup = local_regression[, 3])ggplot(data = dados) +geom_point(aes(x = h, y = point)) +geom_point(aes(x = h, y = int_inf), color ="red") +geom_point(aes(x = h, y = int_sup), color ="red")
Comentários Finais
Escolha dos vizinhos perto de \(x_0\)
Regressão discontinuada assume que \(\mathbb{E}(Y(1) | Z = x)\) é continuo pela direita e \(\mathbb{E}(Y(0) | Z = x)\) é contínuo pela esquerda.
Essa suposição pode algumas vezes ser violada. Por exemplo:
Se a taxa de mortalidade sofrer um “pulo” aos 18 anos, não poderiamos atribuir esse pulo à mudança do comportamento devido a que agora o cidadão pode beber.
Na prática, é dificil verificar se a suposição é valida ou não.
Existe um teste proposto por McCrary (2008) para testar a validez da regressão descontinuada.
Referências
Peng Ding (2023). A First Course in Causal Inference. Capítulo 20.