ME715 - Econometria

Introdução

Prof. Carlos Trucíos
ctrucios@unicamp.br

Instituto de Matemática, Estatística e Computação Científica (IMECC),
Universidade Estadual de Campinas (UNICAMP).

O que é econometria?

O que é econometria?

“Ask a half dozen econometricians what econometrics is, and you could get a half dozen different answers”. James H. Stock and Mark W. Watson (2020)

O que é econometria?

Econometria:

  • Ciência de testar teorias econômicas.
  • Conjunto de ferramentas utilizadas para fazer previsão de variáveis econômicas.
  • Processo de ajustar modelos econômico-matemáticos em conjuntos de dados reais.
  • Ciência e arte de utilizar dados históricos para fazer recomendações (baseadas em resultados quantitativos) em governos e empresas.
  • etc

Minha definição favorita:

É a ciência que combina teoria econômica, estatística e ciência da computação para responder perguntas de tipo causa-efeito e/ou fazer previsões. Hill, Judge e Griffiths (2010)

Material e Software

Material

Existem muitos bons livros de econometria:

Material

Eu pretendo utilizar:

Os autores de Using R/Python/Julia for Introductory Econometrics disponibilizaram o PDF dos livros gratuitamente aqui

O Software

A matéria será ministrada utilizando, principalmente, R e algumas vezes Julia. Contudo, os alunos são “encorajados” a utilizarem as três linguagens e compararem os resultados (parte da sua nota depende disso).

Introdução

Introdução

Quando a modelagem Econométrica entra em cena?

  • Temos uma teoria econômica para testar
  • Temos em mente uma relação que apresenta alguma importância na tomada de decisão
  • Queremos saber como o aumento/diminuição em uma variável influencia em outra.
  • Queremos fazer previsão
  • Queremos avaliar/implementar políticas de governos e de negócios.

Introdução

Suponha que estamos interessados em entender/explicar/prever \(Y\) em função de um conjunto de \(p\) características (variáveis) \(X_1, X_2, \ldots,X_p\).

Vamos supor também que a relação entre \(Y\) e \(X_1, X_2, \ldots, X_p\) é da forma \[Y = f(X_1, X_2, \ldots, X_p) + u\] em que \(u\) é um termo de erro (que contém fatores não observados e termos aleatórios), com \(\mathbb{E}(u|\textbf{X}) = 0\).

  • Na prática, nunca conhecemos \(f(\cdot)\),
  • Utilizando os dados estimamos \(f(\cdot)\) por \(\widehat{f}(\cdot)\)
  • Assim, o valor estimado de \(Y\), \(\widehat{Y}\), é dado por \(\widehat{Y}= \mathbb{E}(Y|\textbf{X}) = \widehat{f}(X_1, X_2, \ldots, X_p)\)
  • Focaremos no caso em que \(Y = \underbrace{\beta_0 + \beta_1X_1 + \cdots + \beta_p X_p}_{f(X_1, \ldots, X_p)} + u\)

Dados: experimentais vs. observacionais

Dados

Dados experimentais

  • São frequentemente coletados em ambiente de laboratório.
  • Vêm de experimentos controlados e são desenhados para estudar problemas de causa-efeito (ensaios randomizados).
  • Embora sejam possíveis nas ciências sociais (quando aprovados por algum comitê de ética), são extremamente caros.
  • Em geral, é impossível conduzir os tipos de experimentos controlados necessários para avaliar questões econômicas, não apenas por serem muito caros, mas por serem considerados moralmente ofensivos.

Dados

Dados observacionais

  • Não são obtidos por meio de experimentos controlados de indivíduos*
  • Obtidos através da observação do atual comportamento do grupo de estudo.
  • Geralmente obtidos utilizando enquetes.
  • São os dados que usualmente chegam até nós.
  • Dados observacionais possuem um desafio ainda maior para estimar relaçcões de causa-efeito e as ferramentas desenvolvidas em econometria são desenhadas para lidar com esses desafios.

Dados

Independentemente de termos dados experimentais ou observacionais, os conjuntos de dados aos quais nos enfrentamos podem ser classificados em:

  • Corte transversal
  • Séries temporais
  • Corte transversal agrupados
  • Painel (ou longitudinais)

As características inerentes a cada tipo de dados devem ser levadas em consideração no processo da modelagem para podermos extrair a maior informação possível contida nos dados.

Dados

Corte transversal

Consiste em uma amostra de indivíduos* (consumidores, empresas, cidades, paises, etc) tomadas em determinado período no tempo. Podemos pensar nesse conjunto de dados como quando tiramos uma foto (panorâmica).

Séries temporais

Consiste em observações sobre uma (ou várias) variáveis ao longo do tempo. A diferença dos dados e corte transversal, dados de séries temporais são ordenados de forma cronológica.

Corte transversal agrupados

Agrupar várias amostras de corte transversal (cada uma tomada em diferentes períodos de tempo)

Painel (ou longitudinais)

Consiste em uma série temporal para cada observação de corte transversal. A diferença dos dados de corte transversal agrupados, nos dados de painel as mesmas unidades são acompanhadas ao longo do tempo

Dados

X: aleatório ou não aleatório?

Dados

Mas, e quando X incluir elementos não aleatórios, como um termo constante, uma variável dummy ou uma tendência temporal?

Greene (2003)

“…vamos permitir que X seja uma mistura de variáveis aleatórias e não aleatórias, e que a média e a variância de \(u_i\) sejam independentes de todos os elementos de X

Ceteris paribus

Ceteris paribus

  • O interesse da análise econométrica está em encontrar relações de causa-efeito (queremos inferir que uma variável tem efeito causal sobre outra).
  • A noção de ceteris paribus desempenha um papel importante nesta análise de causalidade.
  • Ceteris paribus significa “outros fatores (relevantes) permanecendo iguais/fixos/constantes”.
  • Se outros fatores não são mantidos fixos, não podemos conhecer o efeito causal que uma variável exerce sobre outra.
  • Embora pareça simples, é muito difícil manter todos os outros fatores fixos.
  • Então, a questão fundamental é se foram mantidos fixos um número suficiente de fatores para que possamos inferir causalide.

Exemplos (Wooldridge, 2023)

Efeitos dos fertilizantes sobre a produção agricola

  • Estamos interessados em analisar os efeitos da quantidade de fertilizante sobre a produção de soja.

  • Como a quantidade de fertilizante é apenas um fator que afeta a produção (outros fatores são chuva, qualidade da terra, presença de pragas, etc), essa questão deve ser levantada como uma questão ceteris paribus.

  • Uma maneira de determinar o efeito causal é conduzir um experimento em que se delimite várias áreas de um hectare de terra, se aplique diferentes quantidades de fertilizante em cada área e, finalmente, se avalie a produção.
  • Observe que nada foi dito acerca de delimitar áreas cuja qualidade da terra sejam idênticas. Como então sabemos que os resultados do experimento podem ser usados para medir o efeito ceteris paribus dos fertilizantes?

Efeitos dos fertilizantes sobre a produção agricola (Wooldridge, 2023)

Se os níveis de fertilizante são atribuidos independentemente de outras características da área (i.e. se ignorarmos as outras características quando são decididas as quantidades de fertilizante), então é possível 😄.

Retorno da educação

  • Pense na seguinte pergunta: “se uma pessoa é escolhida ao acaso de uma população e esta recebe um ano a mais de educação, em quanto terá seu salário aumentado?”
  • Esta é uma questão ceteris paribus (implica que todos os outros fatores permanecem fixos).
  • Suponha que selecionamos um grupo de pessoas e atribuímos aleatoriamente uma quantidade (em anos) de educação que terão ao longo da vida.
  • Se atribuirmos estes anos de forma aleatória e independente de outras características (experiência, aptidão, etc), basta coletar o salário de cada uma das pessoas e analisar se os anos de educação tiveram algum efeito no salário.

Retorno da educação

  • Obviamente, este tipo de experimento é inviável (e de fato, anti-ético e imoral) e não é realizado na prática.
  • O que temos na prática são dados não experimentais (uma a.a. de trabalhadores em que, entre outras coisas, temos informação do salário e anos de educação). Contudo, nestes casos, são as próprias pessoas que escolhem os anos de educação e isto não independe de outros fatores, o que torna difícil estimar o efeito ceteris paribus da educação 😿.
  • Ao longo da matéria aprenderemos a lidar com este tipo de problemas.

Lei e criminalidade

A presença de mais policiais nas ruas detém a criminalidade?
  • Se uma cidade fosse escolhida ao acaso e recebese 100 policiais a mais, em quanto suas taxas de criminalidade cairiam?
  • Se duas cidades, A e B, forem idênticas em tudo, exceto que A tem 100 policiais a mais do que B. em quanto difeririaim as taxas de criminalidade entre as cidades?
  • Novamente, é uma questão ceteris paribus

Lei e criminalidade

O problema? . . . é impossível encontrar duas cidades idênticas em todos os aspectos, o que torna difícil estimar o efeito ceteris paribus

Felizmente, não precisamos disso. O que precisamos é saber se os dados que podemos coletar sobre os níveis de criminalidade e o tamanho da sua força policial podem ser vistos como sendo relativos a um experimento. Veremos isto mais adiante na matéria.

Comentários finais

  • Ao longo da disciplina aprenderemos a teoria e prática para lidar com estes e outros tipos de problemas.
  • Sua participação é muito importante, necessária e faz parte da sua avaliação constante.
  • Toda semana terão exercícios para entregar (e discutirmos em sala de aula).
  • A seguir, veremos algumas questões referentes ao plano de desenvolvimento da disciplina.