Os modelos ARIMA são, em teoria, a classe mais geral de modelos para prever uma série de tempo que pode ser feita para ser estacionária por diferenciação se necessário, talvez em conjunto com transformações não-lineares Tais como registrar ou desinflar, se necessário Uma variável aleatória que é uma série temporal é estacionária se suas propriedades estatísticas são todas constantes ao longo do tempo Uma série estacionária não tem tendência, suas variações em torno de sua média têm uma amplitude constante, e ele se move de forma consistente Ou seja, seus padrões de tempo aleatórios de curto prazo sempre se parecem em um sentido estatístico. A última condição significa que suas correlações de autocorrelações com seus próprios desvios anteriores da média permanecem constantes ao longo do tempo ou, de forma equivalente, que seu espectro de poder permanece constante ao longo do tempo. Variável desta forma pode ser vista como usual como uma combinação de sinal e ruído, eo sinal se um é aparente poderia ser um patt De reversão média rápida ou lenta, ou oscilação sinusoidal, ou alternância rápida no sinal, e também poderia ter uma componente sazonal Um modelo ARIMA pode ser visto como um filtro que tenta separar o sinal do ruído, eo sinal é então Extrapolada para o futuro para obter previsões. A equação de previsão de ARIMA para uma série de tempo estacionária é uma equação de tipo linear de regressão linear, na qual os preditores consistem em atrasos da variável dependente e ou atrasos dos erros de previsão. Isto é. Valor estimado de Y Uma soma constante e ou ponderada de um ou mais valores recentes de Y e / ou uma soma ponderada de um ou mais valores recentes dos erros. Se os preditores consistem apenas em valores defasados de Y é um modelo autoregressivo auto-regredido puro, Que é apenas um caso especial de um modelo de regressão e que poderia ser equipado com software de regressão padrão. Por exemplo, um modelo AR 1 auto-regressivo de primeira ordem para Y é um modelo de regressão simples no qual a variável independente i Se apenas alguns dos preditores são defasagens dos erros, um modelo ARIMA não é um modelo de regressão linear, porque não há como especificar o erro do último período s Como uma variável independente, os erros devem ser calculados periodicamente quando o modelo é ajustado aos dados. Do ponto de vista técnico, o problema com o uso de erros retardados como preditores é que as previsões do modelo não são funções lineares do Assim, os coeficientes em modelos ARIMA que incluem erros retardados devem ser estimados por métodos de otimização não-linear escalada em vez de simplesmente resolver um sistema de equações. A sigla ARIMA significa Auto-Regressive Integrated Média Móvel As baixas das séries estacionalizadas na equação de previsão são chamadas de termos autorregressivos, os atrasos dos erros de previsão são chamados de termos de média móvel e uma série de tempo que precisa ser Ser diferenciado para ser feito estacionário é dito ser uma versão integrada de uma série estacionária Random-pé e modelos de tendência aleatória, modelos autorregressivos e modelos de suavização exponencial são todos os casos especiais de modelos ARIMA. Um modelo ARIMA não sazonal é classificado como um ARIMA P, d, q modelo, where. p é o número de termos autorregressivos. d é o número de diferenças não sazonais necessárias para a estacionariedade, e. q é o número de erros de previsão defasados na equação de previsão. A equação de previsão é construída da seguinte forma Notemos que a segunda diferença de Y o caso d 2 não é a diferença de dois períodos atrás. Em vez disso, é a diferença de primeira diferença da primeira diferença que é O análogo discreto de uma segunda derivada, ou seja, a aceleração local da série em vez de sua tendência local. Em termos de y, a equação de previsão geral é. Aqui os parâmetros de média móvel s são definidos de modo que seus sinais sejam negativos na equação Seguindo a convenção introduzida por Box e Jenkins Alguns autores e softwares, incluindo a linguagem de programação R, definem-nos de modo que eles tenham mais sinais ao invés. Quando os números reais são conectados à equação, não há ambigüidade, mas é importante saber qual convenção O software usa quando você está lendo a saída Muitas vezes os parâmetros são indicados por AR 1, AR 2,, e MA 1, MA 2, etc Para identificar o modelo ARIMA apropriado para Y você começa por determinar a ordem de diferenciação d que necessitam Para estacionarizar a série e remover as características brutas da sazonalidade, talvez em conjunto com uma transformação de estabilização de variância, como logging ou deflação Se você parar neste ponto e prever que a série diferenciada é constante, você apenas montou uma caminhada aleatória ou aleatória No entanto, a série estacionária pode ainda ter erros autocorrelacionados, sugerindo que algum número de termos AR p 1 e ou algum número de termos MA q 1 também são necessários Na equação de previsão. O processo de determinar os valores de p, d e q que são melhores para uma dada série de tempo será discutido em seções posteriores das notas cujos links estão no topo desta página, mas uma prévia de alguns Dos tipos de modelos não-temporais ARIMA que são comumente encontrados é dado abaixo. ARIMA 1,0,0 modelo auto-regressivo de primeira ordem se a série é estacionária e autocorrelacionada, talvez ele pode ser previsto como um múltiplo de seu próprio valor anterior, mais um Constante A equação de previsão neste caso é a que é Y regressa sobre si mesma retardada por um período. Este é um modelo de constante ARIMA 1,0,0 Se a média de Y for zero, então o termo constante não seria incluído. Se a inclinação O coeficiente 1 é positivo e menor que 1 em magnitude deve ser menor que 1 em magnitude se Y estiver parado, o modelo descreve o comportamento de reversão de média no qual o valor do próximo período deve ser predito como sendo 1 vezes mais distante da média como Valor do período s Se 1 for negativo, Prediz comportamento de reversão de média com alternância de sinais, ou seja, também prevê que Y estará abaixo do próximo período médio se estiver acima da média desse período. Em um modelo autorregressivo de segunda ordem ARIMA 2,0,0, haveria um Y t-2 termo à direita também, e assim por diante Dependendo dos sinais e magnitudes dos coeficientes, um modelo ARIMA 2,0,0 poderia descrever um sistema cuja reversão média ocorre de forma sinusoidal oscilante, como o movimento De uma massa em uma mola que é sujeita a choques aleatórios. ARIMA 0,1,0 passeio aleatório Se a série Y não é estacionário, o modelo mais simples possível para ele é um modelo de caminhada aleatória, que pode ser considerado como um caso limitativo de Um modelo AR 1 em que o coeficiente autorregressivo é igual a 1, ie uma série com reversão média infinitamente lenta. A equação de predição para este modelo pode ser escrita como. qual o termo constante é a variação média período-período, ou seja, a longo prazo Este modelo pode ser montado como uma interceptação sem Em que a primeira diferença de Y é a variável dependente Uma vez que inclui apenas uma diferença não sazonal e um termo constante, é classificada como modelo ARIMA 0,1,0 com constante O modelo randômico-sem-desvio seria Um modelo ARIMA 0,1,0 sem constante. ARIMA 1,1,0 modelo auto-regressivo de primeira ordem diferenciado Se os erros de um modelo randômico randômico são autocorrelacionados, talvez o problema possa ser corrigido adicionando um atraso da variável dependente ao Isto é, regressando a primeira diferença de Y sobre si mesma retardada por um período Isto resultaria na seguinte equação de previsão que pode ser rearranjada para. Este é um modelo autorregressivo de primeira ordem com uma ordem de diferenciamento não sazonal e um termo constante --em um modelo ARIMA 1,1,0.ARIMA 0,1,1 sem alisamento exponencial simples constante Outra estratégia para corrigir erros autocorrelacionados em um modelo de caminhada aleatória é sugerida pelo modelo de suavização exponencial simples. Por exemplo, aqueles que exibem flutuações barulhentas em torno de uma média de variação lenta, o modelo de caminhada aleatória não funciona tão bem quanto uma média móvel de valores passados. Em outras palavras, ao invés de tomar a observação mais recente como a previsão da próxima observação , É melhor usar uma média das últimas observações para filtrar o ruído e estimar com mais precisão a média local O modelo de suavização exponencial simples usa uma média móvel exponencialmente ponderada de valores passados para alcançar este efeito A equação de previsão para a O modelo de suavização exponencial simples pode ser escrito em um número de formas matematicamente equivalentes, uma das quais é a chamada forma de correção de erro, na qual a previsão anterior é ajustada na direção do erro que ela cometeu. Porque e t-1 Y t - 1 - t-1 por definição, isso pode ser reescrito como. que é uma equação de previsão ARIMA 0,1,1-sem-constante com 1 1 - Isso significa que você pode ajustar um smoo exponencial simples Coisa, especificando-o como um modelo ARIMA 0,1,1 sem constante, eo coeficiente MA 1 estimado corresponde a 1-menos-alfa na fórmula SES Lembre-se que no modelo SES, a idade média dos dados no 1- As previsões de período antecipado é de 1, o que significa que tenderão a ficar para trás em relação a tendências ou pontos de viragem em cerca de 1 períodos. Consequentemente, a idade média dos dados nas previsões de um período de 1 período de um ARIMA 0,1,1 - 1 1 - 1 Assim, por exemplo, se 1 0 8, a idade média é 5 Como 1 se aproxima de 1, o modelo ARIMA 0,1,1-sem constante se torna uma média móvel de muito longo prazo e Quando 1 se aproxima de 0, torna-se um modelo randômico-sem-deriva. Qual é a melhor maneira de corrigir a autocorrelação adicionando termos AR ou adicionando termos MA Nos dois modelos anteriores discutidos acima, o problema de erros autocorrelacionados em um modelo de caminhada aleatória Foi fixado de duas maneiras diferentes adicionando um valor defasado da série diferenciada à equação ou adicionando um valor defasado do foreca St erro Qual abordagem é a melhor Uma regra para esta situação, que será discutida em mais detalhes mais adiante, é que a autocorrelação positiva geralmente é melhor tratada pela adição de um termo AR para o modelo e autocorrelação negativa é geralmente melhor tratada por Adicionando um termo MA Na série econômica e de negócios, a autocorrelação negativa surge frequentemente como um artefato de diferenciação. Em geral, a diferenciação reduz a autocorrelação positiva e pode até causar uma mudança de autocorrelação positiva para negativa. Assim, o modelo ARIMA 0,1,1, em Cuja diferenciação é acompanhada por um termo MA, é mais freqüentemente usado do que um modelo ARIMA 1,1,0. ARIMA 0,1,1 com suavização exponencial simples constante com crescimento Ao implementar o modelo SES como um modelo ARIMA, você realmente ganha alguns Flexibilidade Em primeiro lugar, permite-se que o coeficiente de MA 1 estimado seja negativo, isto corresponde a um factor de alisamento maior do que 1 num modelo SES, o que normalmente não é permitido pelo procedimento de ajustamento do modelo SES Sec Você tem a opção de incluir um termo constante no modelo ARIMA se desejar, para estimar uma tendência média não-zero. O modelo ARIMA 0,1,1 com constante tem a equação de previsão. As previsões deste modelo são qualitativamente semelhantes às do modelo SES, exceto que a trajetória das previsões de longo prazo é tipicamente uma linha inclinada cuja inclinação é igual a mu ao invés de uma linha horizontal. ARIMA 0,2,1 ou 0, 2,2 sem suavização exponencial linear constante Modelos lineares de suavização exponencial são modelos ARIMA que usam duas diferenças não sazonais em conjunção com os termos MA A segunda diferença de uma série Y não é simplesmente a diferença entre Y e ela mesma retardada por dois períodos, mas sim A primeira diferença da primeira diferença - ou seja, a mudança na mudança de Y no período t Assim, a segunda diferença de Y no período t é igual a Y t - Y t-1 - Y t-1 - Y T-2 Y t-2Y t-1 Y t-2 Uma segunda diferença de uma função discreta é analogou S para uma segunda derivada de uma função contínua mede a aceleração ou curvatura na função em um determinado ponto no tempo. O modelo ARIMA 0,2,2 sem constante prediz que a segunda diferença da série é igual a uma função linear da última Dois erros de previsão. que podem ser rearranjados como. quando 1 e 2 são os coeficientes MA 1 e MA 2 Este é um modelo de alisamento exponencial linear geral essencialmente o mesmo que o modelo de Holt s eo modelo de Brown s um caso especial Ele usa ponderação exponencial Médias móveis para estimar um nível local e uma tendência local na série As previsões de longo prazo deste modelo convergem para uma linha reta cuja inclinação depende da tendência média observada no final da série. ARIMA 1,1,2 sem Este modelo é ilustrado nos slides acompanhantes em modelos ARIMA extrapola a tendência local no final da série, mas aplaina-lo em horizontes de previsão mais longos para introduzir um Ote do conservadorismo, uma prática que tem suporte empírico Veja o artigo sobre Por que a Tendência de Damped trabalha por Gardner e McKenzie eo artigo da regra de ouro por Armstrong et al para detalhes. É geralmente aconselhável ficar com modelos em que pelo menos um de p E q não é maior do que 1, ou seja, não tente encaixar um modelo como o ARIMA 2,1,2, uma vez que isso é susceptível de levar a problemas de overfitting e de fatores comuns que são discutidos com mais detalhes nas notas sobre a matemática Estrutura de modelos ARIMA. Implementação de folha de cálculo Modelos ARIMA como os descritos acima são fáceis de implementar em uma planilha A equação de predição é simplesmente uma equação linear que se refere a valores passados de séries de tempo originais e valores passados dos erros Assim, você pode configurar Uma planilha de previsões ARIMA armazenando os dados na coluna A, a fórmula de previsão na coluna B e os dados de erros menos as previsões na coluna C A fórmula de previsão em uma célula típica na coluna B seria simplesmente um expressio linear N referindo-se a valores nas linhas precedentes das colunas A e C, multiplicados pelos coeficientes AR ou MA apropriados armazenados em células noutro local da planilha. STAT 497 LECTURA NOTAS 2 1 A AUTOCOVARIÇÃO E AS FUNÇÕES DE AUTOCORRELAÇÃO Para um processo estacionário, a autocovariância entre Y T e Y. Apresentação sobre o tema STAT 497 LECTURA NOTAS 2 1 A AUTOCOVARIÊNCIA E AS FUNÇÕES DE AUTOCORRELAÇÃO Para um processo estacionário, a autocovariância entre Y t e Y Transcrição da apresentação.1 STAT 497 LECTURA NOTAS 2 1.2 A AUTOCOVALÊNCIA E AS FUNÇÕES DE AUTOCORRELAÇÃO Para uma função estacionária , A autocovariância entre Y t e Y tk é ea função de autocorrelação é a condição necessária k e k são positivas semi-definidas para qualquer conjunto de pontos de tempo t 1, t 2, , Tn e quaisquer números reais 1, 2,, n 3.4 A FUNÇÃO DE AUTOCORRELAÇÃO PARCIAL PACF PACF é a correlação entre Y t e Y tk após sua lin A dependência de orelha nas variáveis intervenientes Y t-1, Y t-2,, Y tk 1 foi removida A correlação condicional é usualmente referida como a autocorrelação parcial em séries temporais 4.5 CÁLCULO DA ABORDAGEM DE REGRESSÃO PACF 1 Considere um modelo a partir de uma média zero Onde ki denota os coeficientes de Y tki e etk é o termo de erro médio zero que não está correlacionado com Y tki, i 0,1,, k Multiplica ambos os lados por Y tkj 5.6 CÁLCULO DE PACF e tendo as expectativas de mergulho ambos os lados por 0 PACF 6.7 CÁLCULO DE PACF Para j 1,2, k, temos o seguinte sistema de equações 7.8 CÁLCULO DE PACF Usando Cramer s regra sucessivamente para k 1,2, 8,9 CÁLCULO DE PACF 9,10 2 Levinson e Durbin s Fórmula Recursiva 10,11 PROCESSO WN DE RUÍDO BRANCO Um processo é chamado de processo WN de ruído branco, se for uma seqüência de variáveis aleatórias não correlacionadas de uma distribuição fixa com variância constante média, constante e Cov Y t, Y tk 0 para todo k 0 11.12 RUÍDO BRANCO Processo WN É um Processo estático com função de autocovariância 12 Fenômeno Básico ACF PACF 0, k 0,13 BRANCO BRANCO Processo WN Ruído branco na análise espectral é produzida luz branca em que todas as freqüências, ou seja, cores estão presentes em quantidade igual Processo sem memória Bloco de construção a partir do qual podemos construir modelos mais complicados Ele desempenha o papel de uma base ortogonal na análise geral do vetor e da função 13.14 ESTIMAÇÃO DO MEIO, AUTOCOVARIÇÃO E AUTOCORRELAÇÃO 14 A AMOSTRA MEAN.15 A ERGODICIDADE A lei de Kolmogorov de grande número LLN diz que se X iiid, 2 para i 1 n, Então temos o seguinte limite para a média do conjunto Em séries temporais, temos a média das séries temporais, não a média do conjunto Por conseguinte, a média é calculada pela média ao longo do tempo A média da série temporal converge para o mesmo limite que a média do conjunto A resposta é Sim, se Y t é estacionária e ergódica 15.16 ERGODICIDADE Um processo estacionário de covariância é dito ergódico para a média, se a média de séries temporais conver Assim, se a média da amostra fornece uma estimativa consistente para o segundo momento, então o processo é dito ergódico para o segundo momento. 16.17 ERGODICIDADE Uma condição suficiente para que um processo estacionário de covariância seja ergódico para a média é que Além disso, se o processo é Gaussiano, as autocovariâncias absolutas absolutas também garantem que o processo seja ergódico para todos os momentos. 17.18 A FUNÇÃO DE AUTOCOVARIÇÃO DA AMOSTRA ou 18.m classe imagelink uk-texto-grande uk-margin-small-left uk-margin-small - right 19 A FUNÇÃO DA AUTOCORRELAÇÃO DA AMOSTRA Um gráfico correlativo da amostra versus ka Para tamanhos de amostra grande, é normalmente distribuído com média k ea variância é aproximada pela aproximação de Bartlett para processos em que k 0 para km 19 m título 19.20 A FUNÇÃO DE AUTOCORRELAÇÃO DA AMOSTRA Na prática , São são desconhecidos e substituídos por suas estimativas de amostra. Portanto, temos o seguinte erro padrão de grande lag de 20.21 A FUNÇÃO DE AUTOCORRELAÇÃO DA AMOSTRA Para um WN pr , Temos o intervalo de confiança 95 para k Portanto, para testar o processo é WN ou não, desenhe um 2 n 1 2 linhas no correlograma amostra Se todos estão dentro dos limites, o processo poderia ser WN, precisamos verificar a Exemplo PACF, também 21 Para um processo WN, ele deve estar próximo de zero.22 A FUNÇÃO DE AUTOCORRELAÇÃO PARCIAL DA AMOSTRA Para um processo WN, 2 n 1 2 pode ser usado como limites críticos em kk para testar a hipótese de um processo WN 22.23 BACKSHIFT OU OPERADORES DE LAG Operador de retrocesso, B é definido como, por exemplo, Processo de Choque Aleatório 23.24 REPRESENTAÇÃO MÉDIA MOVENTE DE UMA SÉRIE DE TEMPO Também conhecida como Forma de Choque Aleatório ou Wold 1938 Representação Seja uma série de tempo Para um processo estacionário, podemos escrever como uma combinação linear de Seqüência de WN rvs não-correlacionados A PROCESSO LINEAR GERAL 24 onde 0 I, é um processo WN médio 0 e.25 MOVER A REPRESENTAÇÃO MÉDIA DE UMA SÉRIE TEMPORAL 25.26 MOVER A REPRESENTAÇÃO MÉDIA DE UMA SÉRIE TEMPORAL 26.27 MOVER A REPRESENTAÇÃO MÉDIA DE UMA SÉRIE TEMPORAL Porque envolvem infin , É a condição necessária para que o processo seja estacionário É um processo não-determinístico Um processo não contém componentes deterministas nenhuma aleatoriedade nos estados futuros do sistema que pode ser prontamente calculada a partir de seu próprio passado 27,28 FUNÇÃO DE GERENCIAMENTO DE AUTOCOVARIÇÃO Para uma dada sequência de autocovariâncias k, k 0, 1, 2, a função de geração de autocovariância é definida como onde a variância de um dado processo 0 é o coeficiente de B 0 ea autocovariância de lag k, k é o coeficiente De ambos B k e B k 28 2 2 1 1.29 FUNÇÃO GENERADORA DE AUTOCOVARIÇÃO Usando e estacionária 29 onde j 0 para j.30 FUNÇÃO GERADORA DE AUTOCORRELAÇÃO 30.31 EXEMPLO a Escreva a equação acima em forma de choque aleatório b Encontre a função geradora de autocovariância 31.32 REPRESENTAÇÃO AUTOREGRESSIVA DE UMA SÉRIE DE TEMPO Esta representação também é conhecida como FORMA INVERTIDA Regressar o valor de Y t no tempo t em seu próprio passado mais um choque aleatório 32.33 AUTOREGRESSIVO REPRESENTADO Ação de uma série de tempo É um processo inversível é importante para a previsão Nem todo processo estacionário é invertido Box e Jenkins, 1978 Invertibilidade fornece singularidade da função de autocorrelação Significa que diferentes modelos de séries temporais podem ser reexpressos uns aos outros 33.34 INVERTIBILIDADE Para um processo linear, para ser inversível, as raízes de B 0 em função de B devem situar-se fora do círculo unitário Se for uma raiz de B, então 1 número real é o valor absoluto do número complexo é 34 1 número real é o valor absoluto do número complexo é 34.35 REGRA DE INVERTIBILIDADE UTILIZANDO A FORMA DE CHOQUE ALEATÓRIO Pode ser estacionário se o processo puder ser reescrito num RSF, isto é, 35.36 REGRA DE ESTATUTARIA UTILIZANDO A FORMA INVERTIDA Para um processo linear, Ser inversível, as raízes de B 0 em função de B devem estar fora do círculo unitário Se for uma raiz de B, então 1 36 1 36.37 FORMA DE CHOQUE ALEATÓRIO E FORMA INVERTIDA As representações AR e MA não são a forma modelo Bec 37.38 MODELOS DE SÉRIES DE TEMPO Na Forma Invertida de um processo, se apenas o número finito de pesos for não-zero, ou seja, o processo é chamado AR p processo 38.39 MODELOS DE SÉRIE DE TEMPO Na forma de choque aleatório de um processo, se apenas o número finito de pesos não for zero, ou seja, o processo é chamado de processo MA q 39.40 MODELOS DE SÉRIE DE TEMPO AR p Processo MA q Processo 40.41 MODELOS DE SÉRIE TEMPORAL O número de parâmetros em Um modelo pode ser grande Um alternativo natural é o processo AR e MA misturado ARMA Processo p, q Para um número fixo de observações, quanto mais parâmetros num modelo, menos eficiente é a estimativa dos parâmetros Escolha um modelo mais simples para descrever o Fenômeno 41.Download ppt STAT 497 LECTURA NOTAS 2 1 A AUTOCOVARIÇÃO E AS FUNÇÕES DE AUTOCORRELAÇÃO Para um processo estacionário, a autocovariância entre Y t e Y. Time Series Analysis O processo de ajuste sazonal. O que São as duas principais filosofias de ajuste sazonal. O que é um filtro. Qual é o problema do ponto final. Como podemos decidir qual filtro usar. Que é uma função de ganho. Qual é uma mudança de fase. Que são médias móveis Henderson. Como fazer Nós lidamos com o problema do ponto final. O que são médias móveis sazonais. Por que as estimativas de tendência são revisadas. Quantos dados são necessários para obter estimativas ajustadas sazonalmente aceitáveis. Como se comparam as duas filosofias de ajuste sazonal. Quais são as duas principais filosofias de ajuste estacional . As duas principais filosofias para ajuste sazonal são o método baseado em modelo eo método baseado em filtro. Métodos baseados em filtros. Este método aplica um conjunto de filtros fixos que movem médias para decompor as séries temporais em uma componente tendencial, sazonal e irregular. É que os dados econômicos é composto de uma série de ciclos, incluindo os ciclos de negócios a tendência, sazonalidade sazonal ciclos e ruído a componente irregular Um filtro essencialmente remove ou reduz o s Para produzir uma série ajustada sazonalmente a partir dos dados coletados mensalmente, os eventos que ocorrem a cada 12, 6, 4, 3, 2 4 e 2 meses precisam ser removidos. Correspondem a freqüências sazonais de 1, 2 , 3, 4, 5 e 6 ciclos por ano Os ciclos não sazonais mais longos são considerados parte da tendência e os ciclos não sazonais mais curtos formam a irregularidade. No entanto, a fronteira entre a tendência e os ciclos irregulares pode variar com a duração de O filtro utilizado para obter a tendência no ABS ajuste sazonal, os ciclos que contribuem significativamente para a tendência são tipicamente maiores do que cerca de 8 meses para as séries mensais e 4 trimestres para as séries trimestrais. A tendência, sazonal e irregular componentes não precisam de modelos explícitos individuais Componente irregular é definido como o que permanece após a tendência e os componentes sazonais foram removidos por filtros Irregulars não exibem características de ruído branco. Métodos baseados em filtro são freqüentemente conhecidos como estilo X11 Métodos Estes incluem X11 desenvolvido pelo US Census Bureau, X11ARIMA desenvolvido pela Estatística Canadá, X12ARIMA desenvolvido pelo US Census Bureau, STL, SABL e SEASABS o pacote utilizado pelo ABSputational diferenças entre vários métodos na família X11 são principalmente o resultado de diferentes técnicas utilizadas em Por exemplo, alguns métodos usam filtros assimétricos nas extremidades, enquanto outros métodos extrapolam as séries temporais e aplicam filtros simétricos à série estendida. Métodos baseados em modelos. Esta abordagem requer a tendência, as componentes sazonais e irregulares da série temporal. Série temporal a ser modelada separadamente Assume que o componente irregular é ruído branco - isto é, todos os comprimentos de ciclo são igualmente representados Os irregulares têm média zero e uma variância constante O componente sazonal tem seu próprio elemento de ruído. Dois pacotes de software amplamente utilizados que se aplicam baseados em modelo São os métodos STAMP e SEATS TRAMO desenvolvidos pelo Banco de Espanha. As principais diferenças computacionais Em alguns casos, os componentes são modelados diretamente. Outros métodos exigem que a série de tempo original seja modelada primeiro e os modelos de componentes decompostos a partir daquele. Para uma comparação das duas filosofias a um nível mais Nível avançado, consulte Como se comparam as duas filosofias de ajuste sazonal. O QUE É UM FILTRO Os filtros podem ser usados para decompor uma série de tempo em uma tendência, componente sazonal e irregular As médias móveis são um tipo de filtro que sucessivamente mede um intervalo de tempo variável de dados De modo a produzir uma estimativa suavizada de uma série de tempo. Esta série suavizada pode ser considerada derivada pela execução de uma série de entradas através de um processo que filtra certos ciclos. Consequentemente, uma média móvel é frequentemente referida como um filtro. O processo envolve a definição de um conjunto de pesos de comprimento m 1 m 2 1 as. Note um conjunto simétrico de pesos tem m 1 m 2 e wjw - j Um valor filtrado no tempo t pode ser calculado Onde Y t descreve o valor da série temporal no instante t. Por exemplo, considere a seguinte série. Usando um filtro simétrico de 3 termos simples iem 1 m 2 1 e todos os pesos são 1 3, o primeiro termo do filtro suavizado Série é obtida aplicando os pesos aos três primeiros termos da série original. O segundo valor suavizado é produzido aplicando os pesos ao segundo, terceiro e quarto termos na série original. QUAL O PROBLEMA DO PONTO FINAL. Considere a série. Esta série contém 8 termos No entanto, a série suavizada obtida aplicando filtro simétrico para os dados originais contém apenas 6 terms. This é porque não há dados suficientes nas extremidades da série para aplicar um filtro simétrico O primeiro termo da série suavizada É uma média ponderada de três termos, centrada no segundo termo da série original A média ponderada centrada no primeiro termo da série original não pode ser obtida como dados antes que este ponto não esteja disponível Igualmente, não é É possível calcular uma média ponderada centrada no último termo da série, pois não há dados após este ponto. Por esta razão, os filtros simétricos não podem ser usados em qualquer final de uma série Isso é conhecido como o problema do ponto final Analisadores de séries temporais Pode usar filtros assimétricos para produzir estimativas suavizadas nessas regiões. Neste caso, o valor alisado é calculado fora do centro, sendo a média determinada usando mais dados de um lado do ponto do que o outro de acordo com o que está disponível. Ser usado para extrapolar as séries temporais e, em seguida, aplicar filtros simétricos para a série estendida. Como decimos qual FILTRO PARA USAR. O analista de séries temporais escolhe um filtro apropriado com base em suas propriedades, tais como ciclos que o filtro remove quando aplicado As propriedades De um filtro pode ser investigado usando uma função de ganho. Funções de ganho são usadas para examinar o efeito de um filtro em uma dada freqüência na amplitude de um ciclo para ap Articular Para mais detalhes sobre a matemática associada às funções de ganho, você pode fazer o download das Notas de Curso das Séries de Tempo, um guia introdutório para a análise de séries de tempo publicada pela Seção de Análise de Séries Temporais do ABS. A função de ganho para o filtro de 3 termos simétricos que estudamos anteriormente. Figura 1 Função de ganho para o filtro de 3 períodos simétrico. O eixo horizontal representa o comprimento de um ciclo de entrada em relação ao período entre pontos de observação na série temporal original. O comprimento 2 é completado em 2 períodos, o que representa 2 meses para uma série mensal e 2 trimestres para uma série trimestral. O eixo vertical mostra a amplitude do ciclo de saída em relação a um ciclo de entrada. Este filtro reduz a resistência de 3 ciclos de período a Zero Isto é, ele remove completamente ciclos de aproximadamente este comprimento Isso significa que para uma série de tempo onde os dados são coletados mensalmente, quaisquer efeitos sazonais que ocorrem Trimestralmente será eliminado aplicando este filtro à série original. Desvio de fase é o deslocamento de tempo entre o ciclo filtrado e o ciclo não filtrado Um deslocamento de fase positivo significa que o ciclo filtrado é deslocado para trás e um desvio de fase negativo é deslocado para a frente em Time. Phase deslocamento ocorre quando o tempo de pontos de viragem é distorcida, por exemplo, quando a média móvel é colocado fora do centro pelos filtros assimétricos Isso é que eles vão ocorrer mais cedo ou mais tarde na série filtrada, do que no original Odd comprimento simétrico em movimento Médias como usado pelo ABS, onde o resultado é colocado centralmente, não causam deslocamento de fase do tempo É importante para os filtros usados derivar a tendência para reter a fase do tempo, e daqui o sincronismo de alguns pontos de giro. As figuras 2 e 3 mostram Os efeitos da aplicação de uma média móvel simétrica 2x12 que está fora do centro As curvas contínuas representam os ciclos iniciais e as curvas quebradas representam os ciclos de saída após a aplicação de t Figura 2 Ciclo de 24 meses, Fase -5 5 meses Amplitude 63.Figura 3 Ciclo de 8 meses, Fase -1 5 meses Amplitude 22. QUAIS SÃO HENDERSON MOVING AVERAGES. Henderson médias móveis são filtros que foram derivados por Robert Henderson Em 1916 para uso em aplicações atuariais. São filtros de tendência, comumente usados em análise de séries temporais para suavizar estimativas ajustadas sazonalmente, a fim de gerar uma estimativa de tendência. Eles são usados em preferência a médias móveis mais simples porque podem reproduzir polinômios de até grau 3, Capturando pontos de viragem de tendência. O ABS usa médias móveis Henderson para produzir estimativas de tendência de uma série ajustada sazonalmente As estimativas de tendência publicadas pelo ABS são normalmente derivadas usando um filtro de Henderson de 13 termos para séries mensais e um filtro de Henderson de 7 períodos para séries trimestrais. Henderson filters can be either symmetric or asymmetric Symmetric moving averages can be applied at points which are sufficiently far away from the end s of a time series In this case, the smoothed value for a given point in the time series is calculated from an equal number of values on either side of the data point. To obtain the weights, a compromise is struck between the two characteristics generally expected of a trend series These are that the trend should be able to represent a wide range of curvatures and that it should also be as smooth as possible For the mathematical derivation of the weights, refer to section 5 3 of the Time Series Course Notes which can be downloaded free from the ABS web site. The weighting patterns for a range of symmetric Henderson moving averages are given in the following table. Symmetric Weighting Pattern for Henderson Moving Average. In general, the longer the trend filter, the smoother the resulting trend, as is evident from a comparison of the gain functions above A 5 term Henderson reduces cycles of about 2 4 periods or less by at least 80 , while a 23 term Henderson reduces cycles of about 8 period s or less by at least 90 In fact a 23 term Henderson filter completely removes cycles of less than 4 periods. Henderson moving averages also dampen the seasonal cycles to varying degrees However the gain functions in Figures 4-8 show that annual cycles in monthly and quarterly series are not dampened significantly enough to justify applying a Henderson filter directly to original estimates This is why they are only applied to a seasonally adjusted series, where the calendar related effects have already been removed with specifically designed filters. Figure 9 shows the smoothing effects of applying a Henderson filter to a series. Figure 9 23-Term Henderson Filter - Value of Non-residential Building Approvals. HOW DO WE DEAL WITH THE END POINT PROBLEM. The symmetric Henderson filter can only be applied to regions of data that are sufficiently far away from the ends of the series For example the standard 13 term Henderson can only be applied to monthly data that is at least 6 observations fro m the start or end of the data This is because the filter smoothness the series by taking a weighted average of the 6 terms on either side of the data point as well as the point itself If we attempt to apply it to a point that is less than 6 observations from the end of the data, then there is not enough data available on one side of the point to calculate the average. To provide trend estimates of these data points, a modified or asymmetric moving average is used Calculation of asymmetric Henderson filters can be generated by a number of different methods which produce similar, but not identical results The four main methods are the Musgrave method, the Minimisation of the Mean Square Revision method, the Best Linear Unbiased Estimates BLUE method, and the Kenny and Durbin method Shiskin et al 1967 derived the original asymmetric weights for the Henderson moving average which are used within the X11 packages For information on the derivation of the asymmetric weights, see section 5 3 o f the Time Series Course Notes. Consider a time series where the last observed data point occurs at time N Then a 13 term symmetric Henderson filter cannot be applied to data points which are measured at any time after and including time N-5 For all these points, an asymmetric set of weights must be used The following table gives the asymmetric weighting pattern for a standard 13 term Henderson moving average. The asymmetric 13 term Henderson filters do not remove or dampen the same cycles as the symmetric 13 term Henderson filter In fact the asymmetric weighting pattern used to estimate the trend at the last observation amplifies the strength of 12 period cycles Also asymmetric filters produce some time phase shifting. WHAT ARE SEASONAL MOVING AVERAGES. Almost all of the data investigated by the ABS have seasonal characteristics Since the Henderson moving averages used to estimate the trend series do not eliminate seasonality, the data must be seasonally adjusted first using seasonal filt ers. A seasonal filter has weights which are applied to same period over time An example of the weighting pattern for a seasonal filter would be. 1 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1 3.where, for instance, a weight of one third is applied to three consecutive Januarys. Within X11, a range of seasonal filters are available to choose from These are a weighted 3-term moving average ma S 3x1 weighted 5-term ma S 3x3 weighted 7-term ma S 3x5 and a weighted 11-term ma S 3x9.The weighting structure of weighted moving averages of the form, S nxm is that a simple average of m terms calculated, and then a moving average of n of these averages is determined This means that n m-1 terms are used to calculate each final smoothed value. For example, to calculate an 11-term S 3x9 a weight of 1 9 is applied to the same period in 9 consecutive years Then a simple 3 term moving average is applied across the averaged values. This gives a final weighting pattern of 1 27, 2 27, 1 9, 1 9, 1 9, 1 9, 1 9, 1 9, 1 9, 2 27, 1 27.The gain function for an 11 term seasonal filter, S 3x9 looks like. Figure 10 Gain Function for 11 Term S 3x9 Seasonal Filter. Applying a seasonal filter to data will generate an estimate of the seasonal component of the time series, as it preserves the strength of seasonal harmonics and dampens cycles of non-seasonal lengths. Asymmetric seasonal filters are used at the ends of the series The asymmetric weights for each of the seasonal filters used in X11 can be found in section 5 4 of the Time Series Course Notes. WHY ARE TREND ESTIMATES REVISED. At the current end of a time series, it is not possible to use symmetric filters to estimate the trend because of the end point problem Instead, asymmetric filters are used to produce provisional trend estimates However, as more data becomes available, it is possible to recalculate the trend using symmetric filters and improve the initial estimates This is known as a trend revision. HOW MUCH DATA IS REQUIRED TO OBTAIN ACCEPTABLE SEASONALLY ADJUSTED ESTIMATES. If a time series exhibits relatively stable seasonality and is not dominated by the irregular component, then 5 years of data can be considered an acceptable length to derive seasonally adjusted estimates from For a series that shows particularly strong and stable seasonality, a crude adjustment can be made with 3 years of data It is generally preferable to have at least 7 years of data for a normal time series, to precisely identify seasonal patterns, trading day and moving holiday effects, trend and seasonal breaks, as well as outliers. ADVANCED HOW DO THE TWO SEASONAL ADJUSTMENT PHILOSOPHIES COMPARE. Model based approaches allow for the stochastic properties randomness of the series under analysis, in the sense that they tailor the filter weights based on the nature of the series The model s capability for accurately describing the behaviour of the series can be evaluated, and statistical inferences for the estimates are available based on the assumption that the irregular component is white noise. Filter based methods are less dependent on the stochastic properti es of the time series It is the time series analyst s responsibility to select the most appropriate filter from a limited collection for a particular series It is not possible to perform rigorous checks on the adequacy of the implied model and exact measures of precision and statistical inference are not available Therefore, a confidence interval cannot be built around the estimate. The following diagrams compare the presence of each of the model components at the seasonal frequencies for the two seasonal adjustment philosophies The x axis is the period length of the cycle and the y axis represents the strength of the cycles which comprise each component. Figure 11 Comparison of the two seasonal adjustment philosophies. Filter based methods assume that the each component exists only a certain cycle lengths The longer cycles form the trend, the seasonal component is present at seasonal frequencies and the irregular component is defined as cycles of any other length. Under a model based phil osophy, the trend, seasonal and irregular component are present at all cycle lengths The irregular component is of constant strength, the seasonal component peaks at seasonal frequencies and the trend component is strongest in the longer cycles. This page first published 14 November 2005, last updated 25 July 2008.
No comments:
Post a Comment