ME607 - Séries Temporais
Instituto de Matemática, Estatística e Computação Científica (IMECC),
Universidade Estadual de Campinas (UNICAMP).
Se pudéssemos saber primeiro onde estamos e para onde vamos, poderíamos julgar melhor o que fazer e como fazê-lo. Abraham Lincoln
O interesse em fazer previsão existe em muitas situações: prever a demanda de um produto, prever a quantidade de megas que serão utilizados nos próximos dias, prever o preço/volatilidade das ações, prever a velocidade do vento, etc.
A previsibilidade de um evento depende de vários fatores, entre eles:
Poderia dar algum exemplo em que todos/alguns desses fatores são satisfeitos?
Previsão pode ser feita utilizando métodos ingênuos (como repetir a última observação ou apenas utilizar a média histórica) ou métodos mais complexos (como métodos estatísticos avançados, aprendizado de máquina e redes neurais).
Previsão ajuda às organizações a tomarem melhores decisões e fornece uma guia para o planejamento de médio e longo prazo. É por isso que saber lidar com séries temporais é de vital importância.
Observação:
\[\text{Previsão} \neq \text{Metas} \neq \text{Planejamento}\]
\[\text{Previsão} \neq \text{Metas} \neq \text{Planejamento}\]
Estamos interessados em previsões a curto, médio e longo prazo.
Embora existam métodos qualitativos para fazer previsão quando não temos historico de dados (ver Cap 6 de Hyndman e Athanasopoulos (2021)), focaremos no caso em que possuimos um conjunto de dados históricos e é razoável pensar que algums padrões aprendidos do passado continurão acontecendo.
Em qualquer projeto envolvendo previsão precisamos determinar qual é nosso interesse:
Responder corretamente a essas perguntas nos ajudará na escolha da abordagem a ser utilizada.
Séries temporal: a grosso modo, todo processo que é observado sequencialmente ao longo do tempo é uma série temporal.
Quando falamos em previsão, o objetivo é estimar como a sequência de observações (observadas cronologicamente) continuará no futuro.
\[y_t = f(X_{1}, \cdots, X_{k}, u)\]
\[y_t = f(y_{t-1}, \cdots, y_{t-r}, u)\]
\[y_t = f(y_{t-1}, \cdots, y_{t-r}, X_1, \cdots, X_k, u)\]
Após da definição do problema (que não é algo trivial), o processo de modelagem de séries temporais apresenta o seguinte fluxo.
Uma coleção de variáveis aleatórias \(\{ Y_t \}\) indexada pelo tempo \(t\) é chamado de processo estocástico.
Uma realização (\(\{y_t\}\)) de um processo estocástico é chamado de série temporal.
Na prática nunca observamos o processo estocástico, mas apenas uma realização do processo.
É muito comum chamar de série temporal tanto ao processo estocástico quando à realização do processo.
Coleção de variáveis aleatórias com médias zero, variância constante e que além disso são não correlacionadas.
Na Figure 1 temos um exemplo da realização de um processo estocástico. Consegue identificar/explicar o conceito de processo estocástico na mesma figura?
Obs: como o processo estocástico é uma coleção de variáveis aleatórias \(\{Y_t \}\) indexadas pelo tempo \(t\), para cada \(t\) temos que \(Y_t\) tem sua própria distribuição (e então faz sentido pensar na esperança, variância, …).
Um processo estocástico \(\{Y_t\}_{t = -\infty}^{\infty}\) é dito estritamente estacionário se todas as distribuições finito dimensionais permanecem as mesmas sob translações do tempo, ou seja, \[F_{y_{t_1}, \cdots, y_{t_k}}(x_1, \cdots, x_k) = F_{y_{t_1 + h}, \cdots, y_{t_k + h}}(x_1, \cdots, x_k), \quad \forall h\]
Um proceso estocástico \(\{Y_t\}_{t = -\infty}^{\infty}\) é dito fracamente estacionário (estacionário de segunda ordem ou simplesmente estacionário) se:
Se a série satisfaz essas condições é dita de estacionária, caso contrário é dita de não estacionária.
Visualmente, observa-se estacionaridade se uma série flutua em torno de uma média fixa e se a variância da série é constante ao longo do tempo. Contudo, são necessários testes de hipóteses para verificar ou não a estacionaridade da série.
Qual das seguintes séries parece ser estacionária?
Carlos Trucíos (IMECC/UNICAMP) | ME607 - Séries Temporais | ctruciosm.github.io