Introdução
Instituto de Matemática, Estatística e Computação Científica (IMECC),
Universidade Estadual de Campinas (UNICAMP).
Econometria:
Minha definição favorita:
É a ciência que combina teoria econômica, estatística e ciência da computação para responder perguntas de tipo causa-efeito e/ou fazer previsões. Hill, Judge e Griffiths (2010)
Existem muitos bons livros de econometria:
Eu pretendo utilizar:
Os autores de Using R/Python/Julia for Introductory Econometrics disponibilizaram o PDF dos livros gratuitamente aqui
A matéria será ministrada utilizando, principalmente, R e algumas vezes Julia. Contudo, os alunos são “encorajados” a utilizarem as três linguagens e compararem os resultados (parte da sua nota depende disso).
Suponha que estamos interessados em entender/explicar/prever \(Y\) em função de um conjunto de \(p\) características (variáveis) \(X_1, X_2, \ldots,X_p\).
Vamos supor também que a relação entre \(Y\) e \(X_1, X_2, \ldots, X_p\) é da forma \[Y = f(X_1, X_2, \ldots, X_p) + u\] em que \(u\) é um termo de erro (que contém fatores não observados e termos aleatórios), com \(\mathbb{E}(u|\textbf{X}) = 0\).
Independentemente de termos dados experimentais ou observacionais, os conjuntos de dados aos quais nos enfrentamos podem ser classificados em:
As características inerentes a cada tipo de dados devem ser levadas em consideração no processo da modelagem para podermos extrair a maior informação possível contida nos dados.
Corte transversal
Consiste em uma amostra de indivíduos* (consumidores, empresas, cidades, paises, etc) tomadas em determinado período no tempo. Podemos pensar nesse conjunto de dados como quando tiramos uma foto (panorâmica).
Séries temporais
Consiste em observações sobre uma (ou várias) variáveis ao longo do tempo. A diferença dos dados e corte transversal, dados de séries temporais são ordenados de forma cronológica.
Corte transversal agrupados
Agrupar várias amostras de corte transversal (cada uma tomada em diferentes períodos de tempo)
Painel (ou longitudinais)
Consiste em uma série temporal para cada observação de corte transversal. A diferença dos dados de corte transversal agrupados, nos dados de painel as mesmas unidades são acompanhadas ao longo do tempo
X: aleatório ou não aleatório?
Mas, e quando X incluir elementos não aleatórios, como um termo constante, uma variável dummy ou uma tendência temporal?
Greene (2003)
“…vamos permitir que X seja uma mistura de variáveis aleatórias e não aleatórias, e que a média e a variância de \(u_i\) sejam independentes de todos os elementos de X”
Estamos interessados em analisar os efeitos da quantidade de fertilizante sobre a produção de soja.
Como a quantidade de fertilizante é apenas um fator que afeta a produção (outros fatores são chuva, qualidade da terra, presença de pragas, etc), essa questão deve ser levantada como uma questão ceteris paribus.
Se os níveis de fertilizante são atribuidos independentemente de outras características da área (i.e. se ignorarmos as outras características quando são decididas as quantidades de fertilizante), então é possível 😄.
O problema? . . . é impossível encontrar duas cidades idênticas em todos os aspectos, o que torna difícil estimar o efeito ceteris paribus
Felizmente, não precisamos disso. O que precisamos é saber se os dados que podemos coletar sobre os níveis de criminalidade e o tamanho da sua força policial podem ser vistos como sendo relativos a um experimento. Veremos isto mais adiante na matéria.
Carlos Trucíos (IMECC/UNICAMP) | ME715 - Econometria | ctruciosm.github.io