ME607 - Séries Temporais
Instituto de Matemática, Estatística e Computação Científica (IMECC),
Universidade Estadual de Campinas (UNICAMP).
Se pudéssemos saber primeiro onde estamos e para onde vamos, poderíamos julgar melhor o que fazer e como fazê-lo. Abraham Lincoln
O interesse em fazer previsão existe em muitas situações: prever a demanda de um produto, prever a quantidade de megas que serão utilizados nos próximos dias, prever o preço/volatilidade das ações, prever a velocidade do vento, etc.
A previsibilidade de um evento depende de vários fatores, entre eles:
Poderia dar algum exemplo em que todos/alguns desses fatores são satisfeitos?
Previsão pode ser feita utilizando métodos ingênuos (como repetir a última observação ou apenas utilizar a média histórica) ou métodos mais complexos (como métodos estatísticos avançados, aprendizado de máquina e redes neurais).
Previsão ajuda às organizações a tomarem melhores decisões e fornece uma guia para o planejamento de médio e longo prazo. É por isso que saber lidar com séries temporais é de vital importância.
Observação:
\[\text{Previsão} \neq \text{Metas} \neq \text{Planejamento}\]
\[\text{Previsão} \neq \text{Metas} \neq \text{Planejamento}\]
Estamos interessados em previsões a curto, médio e longo prazo.
Embora existam métodos qualitativos para fazer previsão quando não temos historico de dados (ver Cap 6 de Hyndman e Athanasopoulos (2021)), focaremos no caso em que possuimos um conjunto de dados históricos e é razoável pensar que algums padrões aprendidos do passado continurão acontecendo.
Em qualquer projeto envolvendo previsão precisamos determinar qual é nosso interesse:
Responder corretamente a essas perguntas nos ajudará na escolha da abordagem a ser utilizada.
Séries temporal: a grosso modo, todo processo que é observado sequencialmente ao longo do tempo é uma série temporal.
Quando as observações são igualmente espaçadas (diário, semanal, mensal, etc) dizemos que a série temporal é regular. Caso contrário, é chamada de irregular.
Análise de Séries Temporais
É o processo de extrair insights (relevantes) a partir de dados de séries temporais, explorando a estrutura e as características da série, bem como identificando padrões que podem ser utilizados para prever valores/eventos futuros da série.
Este processo, pode ser resumido nos seguintes 4 passos:
Observação
Alguns autores também incluem na preparação de dados os métodos para lidar com dados faltantes e outliers. Contudo, nos dias de hoje existem métodos mais complexos que lidam com estes problemas sem precisar preencher dados faltantes ou remover outliers. Ver, por exemplo:
Quando falamos em previsão, o objetivo é estimar como a sequência de observações (observadas cronologicamente) continuará no futuro.
\[y_t = f(X_{1}, \cdots, X_{k}, u)\]
\[y_t = f(y_{t-1}, \cdots, y_{t-r}, u)\]
\[y_t = f(y_{t-1}, \cdots, y_{t-r}, X_1, \cdots, X_k, u)\]
Após da definição do problema (que não é algo trivial), o processo de modelagem de séries temporais apresenta o seguinte fluxo.
Fonte: Livro ‘Forecasting: Principles and Practice’
Uma coleção de variáveis aleatórias \(\{ Y_t \}\) indexada pelo tempo \(t\) é chamado de processo estocástico.
Uma realização (\(\{y_t\}\)) de um processo estocástico é chamado de série temporal.
Na prática nunca observamos o processo estocástico, mas apenas uma realização do processo.
É muito comum chamar de série temporal tanto ao processo estocástico quando à realização do processo.
Coleção de variáveis aleatórias com médias zero, variância constante e que além disso são não correlacionadas.
Na Figura 1 temos um exemplo da realização de um processo estocástico. Consegue identificar/explicar o conceito de processo estocástico na mesma figura?
Figura 1: Exemplo de série temporal e processo estocástico.
Obs: como o processo estocástico é uma coleção de variáveis aleatórias \(\{Y_t \}\) indexadas pelo tempo \(t\), para cada \(t\) temos que \(Y_t\) tem sua própria distribuição (e então faz sentido pensar na esperança, variância, …).
Um processo estocástico \(\{Y_t\}_{t = -\infty}^{\infty}\) é dito estritamente estacionário se todas as distribuições finito dimensionais permanecem as mesmas sob translações do tempo, ou seja, \[F_{y_{t_1}, \cdots, y_{t_k}}(x_1, \cdots, x_k) = F_{y_{t_1 + h}, \cdots, y_{t_k + h}}(x_1, \cdots, x_k), \quad \forall h\]
Um proceso estocástico \(\{Y_t\}_{t = -\infty}^{\infty}\) é dito fracamente estacionário (estacionário de segunda ordem ou simplesmente estacionário) se:
Se a série satisfaz essas condições é dita de estacionária, caso contrário é dita de não estacionária.
Visualmente, observa-se estacionaridade se uma série flutua em torno de uma média fixa e se a variância da série é constante ao longo do tempo. Contudo, são necessários testes de hipóteses para verificar ou não a estacionaridade da série.
Qual das seguintes séries parece ser estacionária?
O trabalho do curso consiste em analisar uma série temporal, aplicar os conhecimentos adquiridos ao longo da disciplina é, se for preciso, recorrer a métodos mais avançados para melhorrar o ajuste e previsão.
Carlos Trucíos (IMECC/UNICAMP) | ME607 - Séries Temporais | ctruciosm.github.io