Moving average autocovariance
Objetivo: verificar os gráficos de autocorrelação de aleatoriedade (Box e Jenkins, pp. 28-32) são uma ferramenta comumente usada para verificar a aleatoriedade em um conjunto de dados. Esta aleatoriedade é determinada por computar autocorrelações para valores de dados em diferentes intervalos de tempo. Se for aleatória, tais autocorrelações devem ser próximas de zero para qualquer e todas as separações de intervalo de tempo. Se não for aleatório, então uma ou mais das autocorrelações serão significativamente não-zero. Além disso, as parcelas de autocorrelação são usadas na fase de identificação do modelo para os modelos auto-regressivos, modelos de séries temporais móveis de Box-Jenkins. Autocorrelação é apenas uma medida de aleatoriedade Observe que não correlacionado não significa necessariamente aleatório. Os dados que possuem autocorrelação significativa não são aleatórios. No entanto, os dados que não mostram autocorrelação significativa ainda podem exibir não-aleatoriedade de outras maneiras. Autocorrelação é apenas uma medida de aleatoriedade. No contexto da validação do modelo (que é o tipo primário de aleatoriedade que discutimos no Manual), a verificação da autocorrelação é tipicamente um teste suficiente de aleatoriedade, uma vez que os resíduos de um modelo de ajuste inadequado tendem a exibir aleatoriedade não sutil. No entanto, algumas aplicações requerem uma determinação mais rigorosa da aleatoriedade. Nestes casos, uma bateria de testes, que podem incluir verificação de autocorrelação, são aplicados desde que os dados podem ser não-aleatórios de muitas maneiras diferentes e muitas vezes sutis. Um exemplo de onde uma verificação mais rigorosa para aleatoriedade é necessária seria testando geradores de números aleatórios. Amostra Plot: autocorrelações devem ser perto de zero para aleatoriedade. Tal não é o caso neste exemplo e, assim, a suposição de aleatoriedade falha. Este gráfico de autocorrelação de amostra mostra que a série de tempo não é aleatória, mas tem um alto grau de autocorrelação entre observações adjacentes e quase adjacentes. Definição: r (h) versus h As parcelas de autocorrelação são formadas por Eixo vertical: Coeficiente de autocorrelação onde C h é a função de autocovariância e C 0 é a função de variância Note que R h está entre -1 e 1. Note que algumas fontes podem usar o Seguinte fórmula para a função autocovariância Embora esta definição tenha menos viés, a formulação (1 / N) tem algumas propriedades estatísticas desejáveis e é a forma mais comumente utilizada na literatura estatística. Consulte as páginas 20 e 49-50 em Chatfield para obter detalhes. Eixo horizontal: Time lag h (h 1, 2, 3.) A linha acima também contém várias linhas de referência horizontais. A linha do meio está em zero. As outras quatro linhas são 95 e 99 faixas de confiança. Observe que existem duas fórmulas distintas para gerar as bandas de confiança. Se o gráfico de autocorrelação estiver sendo usado para testar a aleatoriedade (ou seja, não há dependência temporal nos dados), recomenda-se a seguinte fórmula: onde N é o tamanho da amostra, z é a função de distribuição cumulativa da distribuição normal padrão e (alfa ) É o nível de significância. Neste caso, as bandas de confiança têm uma largura fixa que depende do tamanho da amostra. Esta é a fórmula que foi usada para gerar as faixas de confiança no gráfico acima. Os gráficos de autocorrelação também são usados na fase de identificação do modelo para a montagem de modelos ARIMA. Neste caso, um modelo de média móvel é assumido para os dados e devem ser geradas as seguintes faixas de confiança: onde k é o atraso, N é o tamanho da amostra, z é a função de distribuição cumulativa da distribuição normal padrão e (alfa) é O nível de significância. Neste caso, as faixas de confiança aumentam à medida que o atraso aumenta. O gráfico de autocorrelação pode fornecer respostas para as seguintes perguntas: Os dados são aleatórios É uma observação relacionada a uma observação adjacente É uma observação relacionada a uma observação duas vezes removido (etc.) É a série de tempo observada ruído branco A série temporal observada é sinusoidal As séries temporais observadas são autorregressivas O que é um modelo apropriado para as séries temporais observadas O modelo é válido e suficiente A fórmula ss / sqrt é válida Importância: Garanta a validade das conclusões de engenharia Aleatoriedade (juntamente com modelo fixo, variação fixa e distribuição fixa) É uma das quatro suposições que tipicamente estão subjacentes a todos os processos de medição. A hipótese de aleatoriedade é extremamente importante pelas três razões a seguir: A maioria dos testes estatísticos padrão depende da aleatoriedade. A validade das conclusões do teste está diretamente ligada à validade do pressuposto aleatório. Muitas fórmulas estatísticas comumente usadas dependem da suposição aleatória, sendo a fórmula mais comum a fórmula para determinar o desvio padrão da média da amostra: onde s é o desvio padrão dos dados. Embora fortemente usados, os resultados de usar esta fórmula são de nenhum valor a menos que a suposição de aleatoriedade se mantenha. Para dados univariados, o modelo padrão é Se os dados não são aleatórios, este modelo é incorreto e inválido, e as estimativas para os parâmetros (como a constante) tornam-se absurdas e inválidas. Em suma, se o analista não verificar a aleatoriedade, então a validade de muitas das conclusões estatísticas torna-se suspeito. O gráfico de autocorrelação é uma excelente maneira de verificar essa aleatoriedade.12.1: Estimativa da Densidade Espectral Discutimos anteriormente o periodograma, uma função / gráfico que exibe informações sobre os componentes periódicos de uma série temporal. Qualquer série temporal pode ser expressa como uma soma de ondas de coseno e seno que oscilam nas frequências fundamentais (harmónicas) j / n. Com j 1, 2,, n / 2. O periodograma fornece informações sobre as forças relativas das várias freqüências para explicar a variação nas séries temporais. O periodograma é uma estimativa de amostra de uma função populacional denominada densidade espectral, que é uma caracterização do domínio da freqüência de uma série temporal estacionária da população. A densidade espectral é uma representação de domínio de freqüência de uma série de tempo que está diretamente relacionada à representação do domínio do tempo de autocovariância. Em essência, a densidade espectral ea função de autocovariância contêm a mesma informação, mas expressam-na de diferentes maneiras. Nota de revisão. A autocovariância é o numerador da autocorrelação. A autocorrelação é a autocovariância dividida pela variância. Suponha que (h) é a função de autocovariância de um processo estacionário e que f () é a densidade espectral para o mesmo processo. Na notação da sentença anterior, h tempo lag e freqüência. A autocovariância ea densidade espectral têm as seguintes relações: Na linguagem do cálculo avançado, a autocovariância ea densidade espectral são pares de transformada de Fourier. Nós não vamos nos preocupar com o cálculo da situação. Bem, focar na estimação da densidade espectral a caracterização do domínio da freqüência de uma série. As equações de transformada de Fourier são dadas aqui somente para estabelecer que há uma ligação direta entre a representação do domínio do tempo ea representação do domínio da freqüência de uma série. Matematicamente, a densidade espectral é definida para freqüências negativas e positivas. No entanto, devido à simetria da função e seu padrão de repetição para freqüências fora da faixa -1/2 a 1/2, só precisamos nos preocupar com freqüências entre 0 e 1/2. A densidade espectral total integrada é igual à variância da série. Assim, a densidade espectral dentro de um intervalo particular de frequências pode ser vista como a quantidade da variância explicada por essas frequências. Métodos para Estimativa da Densidade Espectral O periodograma bruto é uma estimativa aproximada da densidade espectral da população. A estimativa é áspera, em parte, porque nós usamos somente as freqüências harmônicas fundamentais discretas para o periodograma quando a densidade espectral é definida sobre um continuum das freqüências. Uma possível melhoria da estimativa do periodograma da densidade espectral é alisá-la usando médias móveis centradas. Uma suavização adicional pode ser criada usando métodos de afilamento que ponderam as extremidades (em tempo) da série menos do que o centro dos dados. Bem, não cobrir afunilamento nesta lição. Os interessados podem ver a Seção 4.5 no livro e várias fontes da Internet. Uma abordagem alternativa para suavizar o periodograma é uma abordagem de estimação paramétrica baseada no fato de que qualquer série de tempo estacionária pode ser aproximada por um modelo de AR de alguma ordem (embora possa ser uma ordem alta). Nesta abordagem é encontrado um modelo de AR adequado e, em seguida, a densidade espectral é estimada como a densidade espectral para aquele modelo de AR estimado. Método de Alisamento (Estimação Não-paramétrica da Densidade Espectral) O método usual para suavizar um periodograma tem um nome tão extravagante que soa difícil. Na verdade, é apenas um centrado processo de média móvel com algumas modificações possíveis. Para uma série de tempo, o kernel de Daniell com parâmetro m é uma média móvel centrada que cria um valor suavizado no tempo t, fazendo a média de todos os valores entre os tempos t m e t m (inclusive). Por exemplo, a fórmula de suavização para um kernel Daniell com m 2 é In R, os coeficientes de ponderação para um kernel Daniell com m 2 podem ser gerados com o kernel de comando (daniell, 2). O resultado é coef-2 0,2 coef-1 0,2 coef 0 0,2 coef 1 0,2 coef 2 0,2 Os subscritos para coef referem-se à diferença de tempo a partir do centro da média no tempo t. Assim, a fórmula de suavização neste caso é a mesma que a fórmula dada acima. O kernel Daniell modificado é tal que os dois pontos finais na média recebem metade do peso que os pontos internos fazem. Para um kernel Daniell modificado com m 2, a suavização é In R, o kernel de comando (modified. daniell, 2) listará os coeficientes de ponderação usados. O kernel Daniell ou o kernel Daniell modificado pode ser enrolado (repetido) de modo que o alisamento seja aplicado novamente aos valores suavizados. Isto produz uma suavização mais extensa, calculando a média num intervalo de tempo mais largo. Por exemplo, para repetir um kernel Daniell com m 2 sobre os valores suavizados que resultaram de um kernel Daniell com m 2, a fórmula seria Esta é a média dos valores suavizados dentro de dois períodos de tempo t. Em qualquer direção. Em R, o kernel de comando (daniell, c (2,2)) fornecerá os coeficientes que seriam aplicados como pesos na média dos valores de dados originais para um kernel de Daniell com m 2 em ambas as suavizações. O resultado é gt kernel (daniell, c (2,2)) coef-4 0,04 coef-3 0,08 coef-2 0,12 coef-1 0,16 coef 0 0,20 coef 1 0,16 coef 2 0,12 coef 3 0,08 coef 4 0,04 Isso gera a suavização Fórmula A convolução do método modificado no qual os pontos finais têm menos peso também é possível. O kernel de comando (modified. daniell, c (2,2)) dá estes coeficientes: coef-4 0,01563 coef-3 0,06250 coef-2 0,12500 coef-1 0,18750 coef 0 0,21875 coef 1 0,18750 coef 2 0,12500 coef 3 0,06250 coef 4 0,01563 Assim, os valores centrais são ligeiramente mais pesados do que no núcleo Daniell não modificado. Quando suavizamos um periodograma, estamos suavizando um intervalo de freqüência em vez de um intervalo de tempo. Lembre-se que o periodograma é determinado nas frequências fundamentais j j / n para j 1, 2,, n / 2. Seja I (j) o valor do periodograma na frequência j j / n. Quando usamos um kernel Daniell com parâmetro m para suavizar um periodograma, o valor suavizado (hat (omegaj)) é uma média ponderada de valores de periodograma para as freqüências na faixa (j-m) / n até (jm) / n. Existem valores de freqüência fundamental L 2 m 1 na faixa (j-m) / n para (jm) / n. A gama de valores utilizados para suavização. A largura de banda para o periodograma suavizado é definida como A largura de banda é uma medida da largura do intervalo de freqüência usado para alisar o periodograma. Quando pesos diferentes são usados no alisamento, a definição de largura de banda é modificada. Denote o valor do periodograma alisado em j j / n como hat (omegaj) soma hk I esquerda (omegaj frac direito). Os hk são os pesos possivelmente desiguais utilizados no alisamento. A fórmula de largura de banda é então modificada para Realmente, esta fórmula funciona para pesos iguais também. A largura de banda deve ser suficiente para suavizar a nossa estimativa, mas se usamos uma largura de banda que é muito grande, bem suavizar o periodograma muito e perder ver picos importantes. Na prática, geralmente leva alguma experimentação para encontrar a largura de banda que dá um alisamento adequado. A largura de banda é predominantemente controlada pelo número de valores que são calculados com média na suavização. Em outras palavras, o parâmetro m para o kernel Daniell e se o kernel é enrolado (repetido) afeta a largura de banda. Nota: As relações de largura de banda R com suas plotagens não correspondem aos valores que seriam calculados usando as fórmulas acima. Por favor, veja a nota de rodapé na p. 197 do seu texto para uma explicação. A média / suavização do periodograma com um kernel Daniell pode ser realizada em R usando uma seqüência de dois comandos. O primeiro define um kernel Daniell eo segundo cria o periodograma suavizado. Como exemplo, suponha que a série observada chama-se x e queremos suavizar o periodograma usando um kernel de Daniell com m 4. Os comandos são k kernel (daniell, 4) spec. pgram (x, k, taper0, log no) O primeiro comando cria os coeficientes de ponderação necessários para o alisamento e os armazena em um vetor chamado k. (Sua arbitrária para chamá-lo k. Pode ser chamado qualquer coisa.) O segundo comando pede uma estimativa de densidade espectral com base no periodograma para a série x. Usando os coeficientes de ponderação armazenados em k, sem conicidade, eo gráfico será em uma escala comum, não uma escala logarítmica. Se uma convolução é desejada, o comando kernel pode ser modificado para algo como k kernel (daniell, c (4,4)). Há duas maneiras possíveis de conseguir um kernel Daniell modificado. Você pode alterar o comando kernel para referir-se ao modified. daniell em vez de daniell ou pode ignorar usando o comando kernel e usar um parâmetro spans no comando spec. pgram. O parâmetro spans fornece o comprimento (2 m 1) do kernel Daniell modificado desejado. Por exemplo, um kernel Daniell modificado com m 4 tem comprimento L 2 m 1 9 assim que poderíamos usar o comando spec. pgram (x, spans9, taper 0, logno) Duas passagens de um kernel Daniell modificado com m 4 em cada passe Pode ser feito usando spec. pgram (x, spansc (9,9), conicidade 0, logno) Exemplo. Este exemplo utilizará a série de recrutamento de peixes utilizada em vários locais do texto, incluindo vários locais no capítulo 4. A série consiste em 453 valores mensais de uma medida de uma população de peixes num local do hemisfério sul. Os dados estão no arquivo recruit. dat. O periodograma bruto pode ser criado usando o comando (ou poderia ser criado usando o método dado na Lição 6). Spec. pgram (x, taper0, logno) Observe que no comando dado apenas omitimos o parâmetro que fornece pesos para suavização. O periodograma em bruto segue: O próximo gráfico é um periodograma suavizado usando um kernel Daniell com m 4. Observe que um efeito da suavização é que o pico dominante na versão não alisada é agora o segundo pico mais alto. Isso ocorreu porque o pico é tão acentuadamente definido na versão não alisada que quando a média é com alguns valores circundantes a altura é reduzida. O próximo gráfico é um periodograma suavizado usando duas passagens de um kernel Daniell com m 4 em cada passagem. Observe como ele é ainda mais suavizado do que anteriormente. Para saber onde os dois picos dominantes estão localizados, atribua um nome à saída spec. pgram e, em seguida, você pode listá-lo. Por exemplo, specvalues spec. pgram (x, k, taper0, logno) specvalues Você pode passar através da saída para encontrar as freqüências nas quais os picos ocorrem. As freqüências e estimativas de densidade espectral são listadas separadamente, mas na mesma ordem. Identificar as densidades espectrais máximas e depois encontrar as frequências correspondentes. Aqui, o primeiro pico está na freqüência .0229. O período (número de meses) associado a este ciclo 1 / .0229 43,7 meses, ou cerca de 44 meses. O segundo pico ocorre com uma frequência de 0,083333. O período associado 1 / .08333 12 meses. O primeiro pico está associado a um efeito climático El Nino. O segundo é o habitual efeito sazonal de 12 meses. Estes dois comandos colocarão linhas pontilhadas verticais no gráfico de densidade espectral (estimado) nas localizações aproximadas das densidades de pico. Abline (v1 / 44, ltydotted) abline (v1 / 12, lty pontilhado) Heres a parcela resultante: Weve alisado o suficiente, mas para fins de demonstração, o próximo enredo é o resultado de spec. pgram (x, spansc (13,13) , Taper0, logno) Isto usa duas passagens de um kernel Daniell modificado com comprimento L 13 (assim m 6) cada vez. O enredo é um pouco mais suave, mas não por muito. Os picos, pelo caminho, estão exatamente nos mesmos lugares que na trama imediatamente acima. É definitivamente possível alisar demais. Suponhamos que devemos usar um kernel Daniell modificado de comprimento total 73 (m 36). O comando é spec. pgram (x, spans73, taper0, logno) O resultado segue. Os picos se foram Estimativa Paramétrica da Densidade Espectral O método de suavização da estimativa da densidade espectral é chamado de método não paramétrico porque não usa qualquer modelo paramétrico para o processo da série cronológica subjacente. Um método alternativo é um método paramétrico que implica encontrar o melhor modelo de AR de encaixe para a série e depois traçar a densidade espectral desse modelo. Este método é suportado por um teorema que diz que a densidade espectral de qualquer processo de séries temporais pode ser aproximada pela densidade espectral de um modelo AR (de alguma ordem, possivelmente alta). Em R, a estimação paramétrica da densidade espectral é feita facilmente com o comando / função spec. ar. Um comando como spec. ar (x, logno) fará com que R faça todo o trabalho. Novamente, para identificar os picos, podemos atribuir um nome aos resultados spec. ar fazendo algo como specvaluesspec. ar (x, log no). Para o exemplo de recrutamento de peixes, o seguinte gráfico é o resultado. Observe que a densidade plotada é a de um modelo AR (13). Podemos certamente encontrar mais parcimonioso ARIMA modelos para esses dados. Estavam apenas usando a densidade espectral desse modelo para aproximar a densidade espectral da série observada. A aparência da densidade espectral estimada é aproximadamente a mesma que antes. O pico estimado de El Niño está localizado num local ligeiramente diferente, a frequência é de cerca de 0,024 para um ciclo de cerca de 1 / .024 cerca de 42 meses. Uma série deve ser de-tendência antes de uma análise espectral. Uma tendência causará uma densidade espectral tão dominante a uma baixa frequência que outros picos não serão vistos. Por padrão, o comando spec. pgram R executa um desvio usando um modelo de tendência linear. Isto é, a densidade espectral é estimada usando os resíduos de uma regressão feita onde os dados observados da variável y e a variável x t. Se um tipo diferente de tendência estiver presente, um quadrático por exemplo, então uma regressão polinomial poderia ser usada para de-tendência dos dados antes da densidade espectral estimada ser explorada. Note, no entanto, que o comando R spec. ar. No entanto, não realiza um desvio por padrão. Aplicação de Smoothers a dados brutos Observe que os smoothers descritos aqui também podem ser aplicados a dados brutos. O kernel Daniell e suas modificações são simplesmente alavancadores de média móvel (ou média móvel ponderada). Navegação2.1 Modelos de média móvel (modelos MA) Modelos de séries temporais conhecidos como modelos ARIMA podem incluir termos autorregressivos e / ou termos de média móvel. Na Semana 1, aprendemos um termo autorregressivo em um modelo de série temporal para a variável x t é um valor retardado de x t. Por exemplo, um termo autorregressivo de atraso 1 é x t-1 (multiplicado por um coeficiente). Esta lição define termos de média móvel. Um termo de média móvel num modelo de séries temporais é um erro passado (multiplicado por um coeficiente). Vamos (wt overset N (0, sigma2w)), significando que os w t são identicamente, distribuídos independentemente, cada um com uma distribuição normal com média 0 e a mesma variância. O modelo de média móvel da 1ª ordem, denotado por MA (1) é (xt mu wt theta1w) O modelo de média móvel de 2ª ordem, denotado por MA (2) é (xt mu wt theta1w theta2w) , Denotado por MA (q) é (xt mu wt theta1w theta2w pontos thetaqw) Nota. Muitos livros didáticos e programas de software definem o modelo com sinais negativos antes dos termos. Isso não altera as propriedades teóricas gerais do modelo, embora ele inverta os sinais algébricos de valores de coeficientes estimados e de termos (não-quadrados) nas fórmulas para ACFs e variâncias. Você precisa verificar o software para verificar se sinais negativos ou positivos foram utilizados para escrever corretamente o modelo estimado. R usa sinais positivos em seu modelo subjacente, como fazemos aqui. Propriedades Teóricas de uma Série de Tempo com um Modelo MA (1) Observe que o único valor não nulo na ACF teórica é para o atraso 1. Todas as outras autocorrelações são 0. Assim, uma ACF de amostra com uma autocorrelação significativa apenas no intervalo 1 é um indicador de um possível modelo MA (1). Para os estudantes interessados, provas destas propriedades são um apêndice a este folheto. Exemplo 1 Suponha que um modelo MA (1) seja x t 10 w t .7 w t-1. Onde (wt overset N (0,1)). Assim, o coeficiente 1 0,7. O ACF teórico é dado por Um gráfico deste ACF segue. O gráfico apenas mostrado é o ACF teórico para um MA (1) com 1 0,7. Na prática, uma amostra normalmente não proporciona um padrão tão claro. Usando R, simulamos n 100 valores de amostra usando o modelo x t 10 w t .7 w t-1 onde w t iid N (0,1). Para esta simulação, segue-se um gráfico de séries temporais dos dados da amostra. Não podemos dizer muito desse enredo. A ACF de amostra para os dados simulados segue. Observa-se que a amostra ACF não corresponde ao padrão teórico do MA subjacente (1), ou seja, que todas as autocorrelações para os atrasos de 1 serão 0 Uma amostra diferente teria uma ACF de amostra ligeiramente diferente mostrada abaixo, mas provavelmente teria as mesmas características gerais. Propriedades teóricas de uma série temporal com um modelo MA (2) Para o modelo MA (2), as propriedades teóricas são as seguintes: Note que os únicos valores não nulos na ACF teórica são para os retornos 1 e 2. As autocorrelações para atrasos maiores são 0 . Assim, uma ACF de amostra com autocorrelações significativas nos intervalos 1 e 2, mas autocorrelações não significativas para atrasos maiores indica um possível modelo MA (2). Iid N (0,1). Os coeficientes são 1 0,5 e 2 0,3. Como este é um MA (2), o ACF teórico terá valores não nulos apenas nos intervalos 1 e 2. Valores das duas autocorrelações não nulas são Um gráfico do ACF teórico segue. Como quase sempre é o caso, dados de exemplo não vai se comportar tão perfeitamente como a teoria. Foram simulados n 150 valores de amostra para o modelo x t 10 w t .5 w t-1 .3 w t-2. Onde w t iid N (0,1). O gráfico da série de tempo dos dados segue. Como com o gráfico de série de tempo para os dados de amostra de MA (1), você não pode dizer muito dele. A ACF de amostra para os dados simulados segue. O padrão é típico para situações em que um modelo MA (2) pode ser útil. Existem dois picos estatisticamente significativos nos intervalos 1 e 2, seguidos por valores não significativos para outros desfasamentos. Note que devido ao erro de amostragem, o ACF de amostra não corresponde exactamente ao padrão teórico. ACF para modelos MA (q) gerais Uma propriedade dos modelos MA (q) em geral é que existem autocorrelações não nulas para os primeiros q lags e autocorrelações 0 para todos os retornos gt q. Não-unicidade de conexão entre os valores de 1 e (rho1) no modelo MA (1). No modelo MA (1), para qualquer valor de 1. O 1/1 recíproco dá o mesmo valor para Como exemplo, use 0,5 para 1. E então use 1 / (0,5) 2 para 1. Você obterá (rho1) 0,4 em ambas as instâncias. Para satisfazer uma restrição teórica chamada invertibilidade. Nós restringimos os modelos MA (1) para ter valores com valor absoluto menor que 1. No exemplo dado, 1 0,5 será um valor de parâmetro permitido, enquanto que 1 1 / 0,5 2 não. Invertibilidade de modelos MA Um modelo MA é dito ser inversível se for algébrica equivalente a um modelo de ordem infinita convergente. Por convergência, queremos dizer que os coeficientes de AR diminuem para 0 à medida que avançamos no tempo. Invertibilidade é uma restrição programada em séries temporais de software utilizado para estimar os coeficientes de modelos com MA termos. Não é algo que verificamos na análise de dados. Informações adicionais sobre a restrição de invertibilidade para modelos MA (1) são fornecidas no apêndice. Teoria Avançada Nota. Para um modelo MA (q) com um ACF especificado, existe apenas um modelo invertible. A condição necessária para a invertibilidade é que os coeficientes têm valores tais que a equação 1- 1 y-. - q y q 0 tem soluções para y que caem fora do círculo unitário. Código R para os Exemplos No Exemplo 1, traçamos o ACF teórico do modelo x t 10w t. 7w t-1. E depois simularam n 150 valores deste modelo e traçaram a série temporal da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados para traçar o ACF teórico foram: acfma1ARMAacf (mac (0,7), lag. max10) 10 atrasos de ACF para MA (1) com theta1 0,7 lags0: 10 cria uma variável chamada atrasos que varia de 0 a 10. trama (Hg) adiciona um eixo horizontal ao gráfico O primeiro comando determina o ACF e o armazena em um objeto (a0) Chamado acfma1 (nossa escolha de nome). O comando de plotagem (o terceiro comando) traça defasagens em relação aos valores de ACF para os retornos 1 a 10. O parâmetro ylab rotula o eixo y eo parâmetro principal coloca um título no gráfico. Para ver os valores numéricos do ACF basta usar o comando acfma1. A simulação e as parcelas foram feitas com os seguintes comandos. Xcarima. sim (n150, lista (mac (0.7))) Simula n 150 valores de MA (1) xxc10 adiciona 10 para fazer média 10. Padrão de simulação significa 0. plot (x, typeb, mainSimulated MA (1) dados) Acf (x, xlimc (1,10), mainACF para dados de amostras simulados) No Exemplo 2, traçamos o ACF teórico do modelo xt 10 wt. 5 w t-1 .3 w t-2. E depois simularam n 150 valores deste modelo e traçaram a série temporal da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados foram acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 parcela (atrasos, acfma2, xlimc (1,10), ylabr, tipoh, ACF principal para MA (2) com theta1 0,5, (X, typeb, principal série MA (2) simulada) acf (x, xlimc (1,10), x2) MainACF para dados simulados de MA (2) Apêndice: Prova de Propriedades de MA (1) Para estudantes interessados, aqui estão as provas para propriedades teóricas do modelo MA (1). Quando h 1, a expressão anterior 1 w 2. Para qualquer h 2, a expressão anterior 0 (x) é a expressão anterior x (x) A razão é que, por definição de independência do wt. E (w k w j) 0 para qualquer k j. Além disso, porque w t tem média 0, E (w j w j) E (w j 2) w 2. Para uma série de tempo, aplique este resultado para obter o ACF fornecido acima. Um modelo inversível MA é aquele que pode ser escrito como um modelo de ordem infinita AR que converge para que os coeficientes AR convergem para 0 como nos movemos infinitamente no tempo. Bem demonstrar invertibilidade para o modelo MA (1). Em seguida, substituimos a relação (2) para wt-1 na equação (1) (3) (zt wt theta1 (z-theta1w) wt theta1z-theta2w) No tempo t-2. A equação (2) torna-se Então substituimos a relação (4) para wt-2 na equação (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z-theta12z theta31w) Se continuássemos Infinitamente), obteríamos o modelo AR de ordem infinita (zt wt theta1 z - theta21z theta31z - theta41z dots) Observe, no entanto, que se 1 1, os coeficientes multiplicando os desfasamentos de z aumentarão (infinitamente) em tamanho à medida que retrocedermos Tempo. Para evitar isso, precisamos de 1 lt1. Esta é a condição para um modelo MA (1) invertido. Infinite Order MA model Na semana 3, bem ver que um modelo AR (1) pode ser convertido em um modelo de ordem infinita MA: (xt - mu wt phi1w phi21w pontos phik1 w dots sum phij1w) Esta soma de termos de ruído branco passado é conhecido Como a representação causal de um AR (1). Em outras palavras, x t é um tipo especial de MA com um número infinito de termos remontando no tempo. Isso é chamado de ordem infinita MA ou MA (). Uma ordem finita MA é uma ordem infinita AR e qualquer ordem finita AR é uma ordem infinita MA. Lembre-se na Semana 1, observamos que uma exigência para um AR estacionário (1) é que 1 lt1. Vamos calcular o Var (x t) usando a representação causal. Esta última etapa usa um fato básico sobre séries geométricas que requer (phi1lt1) caso contrário, a série diverge. Navegação
Comments
Post a Comment