Introdução e conceitos básicos

ME607 - Séries Temporais

Prof. Carlos Trucíos
ctrucios@unicamp.br

Instituto de Matemática, Estatística e Computação Científica (IMECC),
Universidade Estadual de Campinas (UNICAMP).

Introdução

Introdução

Se pudéssemos saber primeiro onde estamos e para onde vamos, poderíamos julgar melhor o que fazer e como fazê-lo. Abraham Lincoln

O interesse em fazer previsão existe em muitas situações: prever a demanda de um produto, prever a quantidade de megas que serão utilizados nos próximos dias, prever o preço/volatilidade das ações, prever a velocidade do vento, etc.

A previsibilidade de um evento depende de vários fatores, entre eles:

  • Quantos dados estão disponíveis.
  • Que tanto conhecemos os fatores que contribuen para fazer a previsão.
  • Que tão semelhante é o futuro do passado.
  • Se a previsão afeta o que estamos tentanto prever.

Poderia dar algum exemplo em que todos/alguns desses fatores são satisfeitos?

Introdução

Previsão pode ser feita utilizando métodos ingênuos (como repetir a última observação ou apenas utilizar a média histórica) ou métodos mais complexos (como métodos estatísticos avançados, aprendizado de máquina e redes neurais).

Previsão ajuda às organizações a tomarem melhores decisões e fornece uma guia para o planejamento de médio e longo prazo. É por isso que saber lidar com séries temporais é de vital importância.

Observação:

\[\text{Previsão} \neq \text{Metas} \neq \text{Planejamento}\]

Introdução

\[\text{Previsão} \neq \text{Metas} \neq \text{Planejamento}\]

  • Previsão: dadas todas as informações disponíveis (historico, outras variáveis, conhecimento sobre eventos futuro que possam afetar a previsão), queremos prever o futuro com a maior acurácia possível.
  • Metas: aquilo que gostariamos que aconteça (mas não necessáriamente acontece)
  • Planejamento: ações necessárias para que as previsões alcancem às metas.

Estamos interessados em previsões a curto, médio e longo prazo.

Embora existam métodos qualitativos para fazer previsão quando não temos historico de dados (ver Cap 6 de Hyndman e Athanasopoulos (2021)), focaremos no caso em que possuimos um conjunto de dados históricos e é razoável pensar que algums padrões aprendidos do passado continurão acontecendo.

Introdução

Em qualquer projeto envolvendo previsão precisamos determinar qual é nosso interesse:

  • Estamos interessados nas vendas de uma loja ou de todas as lojas de uma região?
  • Estamos interessados em dados diários, semanais, mensais, anuais?
  • Estamos interessados na demanda de um produto ou um grupo de produtos?
  • Qual é o horizonte de previsão?
  • Com que frequência precisaremos fazer a previsão?

Responder corretamente a essas perguntas nos ajudará na escolha da abordagem a ser utilizada.

Séries temporais: Overview

Séries temporais: Overview

Séries temporal: a grosso modo, todo processo que é observado sequencialmente ao longo do tempo é uma série temporal.

Exemplos

  • Produto interno bruto (anual) do Brasil.
  • Preço diário do Bitcoin.
  • Vendas semanais de um produto.
  • Temperatura diária em Campinas.
  • Consumo mensal de energia/agua.
  • Gasto mensal familiar com futilidades.
  • etc

Séries temporais: Overview

Quando falamos em previsão, o objetivo é estimar como a sequência de observações (observadas cronologicamente) continuará no futuro.

\[y_t = f(X_{1}, \cdots, X_{k}, u)\]

\[y_t = f(y_{t-1}, \cdots, y_{t-r}, u)\]

\[y_t = f(y_{t-1}, \cdots, y_{t-r}, X_1, \cdots, X_k, u)\]

Séries temporais: Overview

Após da definição do problema (que não é algo trivial), o processo de modelagem de séries temporais apresenta o seguinte fluxo.

Fonte: Livro ‘Forecasting: Principles and Practice’

  1. Tidy: Precisamos coletar e preparar os dados para podermos utilizar os diversos modelos implementados.
  2. Visualise: Fazer o gráfico da série temporal é muito importante e da os primeiros insights do que deve ser feito.
  3. Especificar, estimar e avaliar o modelo. (Modelagem)
  4. Fazer previsões.

Conceitos básicos

Conceitos básicos

Processo Estocástico

Uma coleção de variáveis aleatórias \(\{ Y_t \}\) indexada pelo tempo \(t\) é chamado de processo estocástico.

Série Temporal

Uma realização (\(\{y_t\}\)) de um processo estocástico é chamado de série temporal.

Na prática nunca observamos o processo estocástico, mas apenas uma realização do processo.

É muito comum chamar de série temporal tanto ao processo estocástico quando à realização do processo.

Ruido branco

Coleção de variáveis aleatórias com médias zero, variância constante e que além disso são não correlacionadas.

Conceitos básicos

Na Figure 1 temos um exemplo da realização de um processo estocástico. Consegue identificar/explicar o conceito de processo estocástico na mesma figura?

Figure 1: Exemplo de série temporal e processo estocástico.

Conceitos básicos:

  • Função de médias: para cada instante \(t\), \(\mu_t = \mathbb{E}(Y_t).\)
  • Função de variâncias: para cada instante \(t\), \(\sigma_t^2 = \mathbb{V}(Y_t).\)
  • Função de autocovariância e autocorrelação: para dois instantes quaquer (\(t\) e \(t+h\)), as funções de autocovariância e autocorrelação são dadas por: \[\gamma(t,t+h) = \mathbb{Cov}(Y_t, Y_{t+h}) = \mathbb{E}[(Y_t - \mu_t)(Y_{t+h}-\mu_{t+h})] \quad \text{e}\] \[\rho(t,t+h) = \mathbb{Cor}(Y_t, Y_{t+h}) = \dfrac{\mathbb{Cov}(Y_t, Y_{t+h})}{\sigma_t \sigma_{t+h}}\]

Obs: como o processo estocástico é uma coleção de variáveis aleatórias \(\{Y_t \}\) indexadas pelo tempo \(t\), para cada \(t\) temos que \(Y_t\) tem sua própria distribuição (e então faz sentido pensar na esperança, variância, …).

Conceitos básicos

Processo estritamente estacionário

Um processo estocástico \(\{Y_t\}_{t = -\infty}^{\infty}\) é dito estritamente estacionário se todas as distribuições finito dimensionais permanecem as mesmas sob translações do tempo, ou seja, \[F_{y_{t_1}, \cdots, y_{t_k}}(x_1, \cdots, x_k) = F_{y_{t_1 + h}, \cdots, y_{t_k + h}}(x_1, \cdots, x_k), \quad \forall h\]

Processo (fracamente) estacionário

Um proceso estocástico \(\{Y_t\}_{t = -\infty}^{\infty}\) é dito fracamente estacionário (estacionário de segunda ordem ou simplesmente estacionário) se:

  • \(\mathbb{E}(Y_t^2) < \infty, \quad \forall t\)
  • \(\mathbb{E}(Y_t) = \mu_t = \mu, \quad \forall t\)
  • \(\mathbb{Cov}(Y_t, Y_{t+h})\) depende somente de \(h\) e não de \(t\).

Conceitos básicos

  • Note que a primeira condição dos processos estacionários afirma que o segundo momento deve ser finito (mesmo que diferente em diferentes períodos do tempo).
  • A segunda condição afirma que a média é igual para todo o período.
  • A terceira condição estabelece que variância é constante para todo o período e que a autocovariância depende apenas de \(h\) e não do tempo (\(t\)).

Se a série satisfaz essas condições é dita de estacionária, caso contrário é dita de não estacionária.

Visualmente, observa-se estacionaridade se uma série flutua em torno de uma média fixa e se a variância da série é constante ao longo do tempo. Contudo, são necessários testes de hipóteses para verificar ou não a estacionaridade da série.

Conceitos básicos

Qual das seguintes séries parece ser estacionária?

Referências