Wednesday 29 November 2017

Variante variância média


Explorando A Volatilidade Médica Mover Ponderada Exponencialmente é a medida mais comum de risco, mas vem em vários sabores. Em um artigo anterior, mostramos como calcular a volatilidade histórica simples. (Para ler este artigo, consulte Usando a volatilidade para avaliar o risco futuro.) Usamos os dados atuais do preço das ações da Googles para calcular a volatilidade diária com base em 30 dias de estoque de dados. Neste artigo, melhoraremos a volatilidade simples e discutiremos a média móvel ponderada exponencialmente (EWMA). Vs históricos. Volatilidade implícita Primeiro, colocamos essa métrica em um pouco de perspectiva. Existem duas abordagens amplas: volatilidade histórica e implícita (ou implícita). A abordagem histórica pressupõe que o passado é o prólogo que medimos a história na esperança de que seja preditivo. A volatilidade implícita, por outro lado, ignora o histórico que resolve para a volatilidade implícita nos preços de mercado. Espera que o mercado conheça melhor e que o preço de mercado contenha, mesmo que de forma implícita, uma estimativa consensual da volatilidade. (Para leitura relacionada, veja Os Usos e Limites da Volatilidade.) Se nos concentrarmos apenas nas três abordagens históricas (à esquerda acima), eles têm dois passos em comum: Calcule a série de retornos periódicos Aplicar um esquema de ponderação Primeiro, nós Calcule o retorno periódico. Isso geralmente é uma série de retornos diários, em que cada retorno é expresso em termos compostos continuamente. Para cada dia, tomamos o log natural da proporção dos preços das ações (ou seja, preço hoje dividido por preço ontem e assim por diante). Isso produz uma série de retornos diários, de u i to u i-m. Dependendo de quantos dias (m dias) estamos medindo. Isso nos leva ao segundo passo: é aqui que as três abordagens diferem. No artigo anterior (Usando o Volatility To Gauge Future Risk), mostramos que sob um par de simplificações aceitáveis, a variância simples é a média dos retornos quadrados: Observe que isso resume cada um dos retornos periódicos, então divide esse total pelo Número de dias ou observações (m). Então, é realmente apenas uma média dos retornos periódicos quadrados. Dito de outra forma, cada retorno quadrado recebe um peso igual. Então, se o alfa (a) é um fator de ponderação (especificamente, um 1m), então uma variância simples parece algo assim: O EWMA melhora a diferença simples. A fraqueza dessa abordagem é que todos os retornos ganham o mesmo peso. O retorno de Yesterdays (muito recente) não tem mais influência na variação do que o retorno dos últimos meses. Esse problema é corrigido usando a média móvel ponderada exponencialmente (EWMA), na qual os retornos mais recentes têm maior peso na variância. A média móvel ponderada exponencialmente (EWMA) apresenta lambda. Que é chamado de parâmetro de suavização. Lambda deve ser inferior a um. Sob essa condição, em vez de pesos iguais, cada retorno quadrado é ponderado por um multiplicador da seguinte forma: por exemplo, RiskMetrics TM, uma empresa de gerenciamento de risco financeiro, tende a usar uma lambda de 0,94 ou 94. Neste caso, o primeiro ( Mais recente) o retorno periódico ao quadrado é ponderado por (1-0,94) (94) 0 6. O próximo retorno ao quadrado é simplesmente um múltiplo lambda do peso anterior neste caso 6 multiplicado por 94 5,64. E o peso do terceiro dia anterior é igual (1-0,94) (0,94) 2 5,30. Esse é o significado de exponencial em EWMA: cada peso é um multiplicador constante (isto é, lambda, que deve ser inferior a um) do peso dos dias anteriores. Isso garante uma variação ponderada ou tendenciosa em relação a dados mais recentes. (Para saber mais, confira a Planilha do Excel para a Volatilidade dos Googles.) A diferença entre a simples volatilidade e o EWMA para o Google é mostrada abaixo. A volatilidade simples efetivamente pesa cada retorno periódico em 0.196 como mostrado na Coluna O (tivemos dois anos de dados diários sobre o preço das ações. Isso é 509 devoluções diárias e 1509 0.196). Mas observe que a coluna P atribui um peso de 6, então 5.64, depois 5.3 e assim por diante. Essa é a única diferença entre variância simples e EWMA. Lembre-se: depois de somar toda a série (na coluna Q), temos a variância, que é o quadrado do desvio padrão. Se queremos volatilidade, precisamos lembrar de tomar a raiz quadrada dessa variância. Qual é a diferença na volatilidade diária entre a variância e EWMA no caso do Googles. É significativo: a variância simples nos deu uma volatilidade diária de 2,4, mas a EWMA deu uma volatilidade diária de apenas 1,4 (veja a planilha para obter detalhes). Aparentemente, a volatilidade de Googles estabeleceu-se mais recentemente, portanto, uma variação simples pode ser artificialmente alta. A diferença de hoje é uma função da diferença de dias de Pior. Você notará que precisamos calcular uma série longa de pesos exponencialmente decrescentes. Nós não vamos fazer a matemática aqui, mas uma das melhores características do EWMA é que toda a série se reduz convenientemente a uma fórmula recursiva: Recursiva significa que as referências de variância de hoje (ou seja, são uma função da variância dos dias anteriores). Você também pode encontrar esta fórmula na planilha e produz exatamente o mesmo resultado que o cálculo de longo prazo. A variação de hoje (sob EWMA) é igual a variância de ontem (ponderada por lambda) mais retorno quadrado de ontem (pesado por menos a lambda). Observe como estamos apenas adicionando dois termos em conjunto: variância ponderada de ontem e atraso de ontem, retorno quadrado. Mesmo assim, lambda é o nosso parâmetro de suavização. Um lambda mais alto (por exemplo, como RiskMetrics 94) indica decadência mais lenta na série - em termos relativos, teremos mais pontos de dados na série e eles vão cair mais devagar. Por outro lado, se reduzirmos a lambda, indicamos maior deterioração: os pesos caem mais rapidamente e, como resultado direto da rápida deterioração, são usados ​​menos pontos de dados. (Na planilha, lambda é uma entrada, para que você possa experimentar sua sensibilidade). Resumo A volatilidade é o desvio padrão instantâneo de um estoque e a métrica de risco mais comum. É também a raiz quadrada da variância. Podemos medir a variação historicamente ou implicitamente (volatilidade implícita). Ao medir historicamente, o método mais fácil é a variância simples. Mas a fraqueza com variância simples é que todos os retornos recebem o mesmo peso. Então, enfrentamos um trade-off clássico: sempre queremos mais dados, mas quanto mais dados temos, mais nosso cálculo será diluído por dados distantes (menos relevantes). A média móvel ponderada exponencialmente (EWMA) melhora a variação simples ao atribuir pesos aos retornos periódicos. Ao fazer isso, podemos usar um grande tamanho de amostra, mas também dar maior peso aos retornos mais recentes. (Para ver um tutorial de filme sobre este tópico, visite a Tartaruga Bionica.) O DAX inclui algumas funções de agregação estatística, como média, variância e desvio padrão. Outros cálculos estatísticos típicos exigem que você escreva expressões DAX mais longas. Excel, deste ponto de vista, tem uma linguagem muito mais rica. Os padrões estatísticos são uma coleção de cálculos estatísticos comuns: mediana, modo, média móvel, percentil e quartil. Gostaríamos de agradecer a Colin Banfield, Gerard Brueckl e Javier Guilln, cujos blogs inspiraram alguns dos seguintes padrões. Exemplo de padrão básico As fórmulas neste padrão são as soluções para cálculos estatísticos específicos. Você pode usar as funções DAX padrão para calcular a média (média aritmética) de um conjunto de valores. MÉDIA . Retorna a média de todos os números em uma coluna numérica. AVERAGEA. Retorna a média de todos os números em uma coluna, manipulando texto e valores não-numéricos (valores de texto não-numéricos e vazios como 0). AVERAGEX. Calcule a média em uma expressão avaliada em uma tabela. Média móvel A média móvel é um cálculo para analisar pontos de dados criando uma série de médias de diferentes subconjuntos do conjunto de dados completo. Você pode usar muitas técnicas DAX para implementar esse cálculo. A técnica mais simples é usar AVERAGEX, iterando uma tabela da granularidade desejada e calculando para cada iteração a expressão que gera o único ponto de dados para usar na média. Por exemplo, a seguinte fórmula calcula a média móvel nos últimos 7 dias, assumindo que você está usando uma tabela de data em seu modelo de dados. Usando AVERAGEX, você calcula automaticamente a medida em cada nível de granularidade. Ao usar uma medida que pode ser agregada (como SUM), então outra abordagem baseada em CALCULATE pode ser mais rápida. Você pode encontrar essa abordagem alternativa no padrão completo de média móvel. Você pode usar as funções DAX padrão para calcular a variância de um conjunto de valores. VAR. S. Retorna a variância de valores em uma coluna que representa uma amostra de população. VAR. P. Retorna a variância dos valores em uma coluna que representa a população inteira. VARX. S. Retorna a variância de uma expressão avaliada em uma tabela que representa uma amostra de população. VARX. P. Retorna a variância de uma expressão avaliada em uma tabela que representa toda a população. Desvio padrão Você pode usar as funções DAX padrão para calcular o desvio padrão de um conjunto de valores. STDEV. S. Retorna o desvio padrão de valores em uma coluna que representa uma amostra de população. STDEV. P. Retorna o desvio padrão de valores em uma coluna que representa toda a população. STDEVX. S. Retorna o desvio padrão de uma expressão avaliada em uma tabela que representa uma amostra de população. STDEVX. P. Retorna o desvio padrão de uma expressão avaliada em uma tabela que representa toda a população. A mediana é o valor numérico que separa a metade mais alta de uma população da metade inferior. Se houver um número ímpar de linhas, a mediana é o valor do meio (classificando as linhas do valor mais baixo para o valor mais alto). Se houver um número par de linhas, é a média dos dois valores médios. A fórmula ignora os valores em branco, que não são considerados parte da população. O resultado é idêntico à função MEDIAN no Excel. A Figura 1 mostra uma comparação entre o resultado retornado pelo Excel e a fórmula DAX correspondente para o cálculo médio. Figura 1 Exemplo de cálculo mediano no Excel e DAX. O modo é o valor que aparece mais frequentemente em um conjunto de dados. A fórmula ignora os valores em branco, que não são considerados parte da população. O resultado é idêntico às funções MODE e MODE. SNGL no Excel, que retornam apenas o valor mínimo quando existem vários modos no conjunto de valores considerados. A função Excel MODE. MULT retornaria todos os modos, mas você não pode implementá-lo como uma medida no DAX. A Figura 2 compara o resultado retornado pelo Excel com a fórmula DAX correspondente para o cálculo do modo. Figura 2 Exemplo de cálculo de modo no Excel e no DAX. Percentile O percentil é o valor abaixo do qual uma determinada porcentagem de valores em um grupo cai. A fórmula ignora os valores em branco, que não são considerados parte da população. O cálculo no DAX requer várias etapas, descritas na seção Padrão Completo, que mostra como obter os mesmos resultados das funções do Excel PERCENTILE, PERCENTILE. INC e PERCENTILE. EXC. Os quartis são três pontos que dividem um conjunto de valores em quatro grupos iguais, cada grupo compreendendo um quarto dos dados. Você pode calcular os quartis usando o padrão de Percentile, seguindo estas correspondências: Primeiro quartil quartil inferior 25º percentil Segunda quartil mediana 50º percentil Terceiro quartil quartil superior 75º percentil Padrão completo Alguns cálculos estatísticos têm uma descrição mais longa do padrão completo, porque Você pode ter implementações diferentes dependendo de modelos de dados e outros requisitos. Média móvel Normalmente, você avalia a média móvel fazendo referência ao nível de granularidade do dia. O modelo geral da seguinte fórmula possui esses marcadores: ltnumberofdaysgt é o número de dias para a média móvel. Ltdatecolumngt é a coluna de data da tabela de datas se você tiver uma ou a coluna de data da tabela contendo valores se não houver uma tabela de datas separada. Ltmeasuregt é a medida para calcular como a média móvel. O padrão mais simples usa a função AVERAGEX no DAX, que automaticamente considera apenas os dias para os quais há um valor. Como alternativa, você pode usar o seguinte modelo em modelos de dados sem uma tabela de datas e com uma medida que pode ser agregada (como SUM) durante todo o período considerado. A fórmula anterior considera um dia sem dados correspondentes como uma medida que possui 0 valor. Isso pode acontecer apenas quando você possui uma tabela de datas separada, que pode conter dias para os quais não há transações correspondentes. Você pode corrigir o denominador para a média usando apenas o número de dias para os quais há transações usando o seguinte padrão, onde: ltfacttablegt é a tabela relacionada à tabela de datas e contendo valores calculados pela medida. Você pode usar as funções DATESBETWEEN ou DATESINPERIOD em vez de FILTER, mas elas funcionam apenas em uma tabela de data normal, enquanto você pode aplicar o padrão descrito acima também a tabelas de datas não regulares e a modelos que não possuem tabela de data. Por exemplo, considere os diferentes resultados produzidos pelas duas medidas a seguir. Na Figura 3, você pode ver que não há vendas em 11 de setembro de 2005. No entanto, esta data está incluída na tabela de datas, portanto, há 7 dias (de 11 de setembro a 17 de setembro) com apenas 6 dias com dados. Figura 3 Exemplo de um cálculo da Média Mover considerando e ignorando datas sem vendas. A medida Média móvel 7 dias tem um número menor entre 11 de setembro e 17 de setembro, porque considera o 11 de setembro como um dia com 0 vendas. Se quiser ignorar dias sem vendas, use a medida Média móvel 7 dias sem zero. Esta pode ser a abordagem certa quando você possui uma tabela de data completa, mas deseja ignorar dias sem transações. Usando a fórmula Mover média 7 dias, o resultado é correto porque AVERAGEX considera automaticamente apenas valores não em branco. Tenha em mente que você pode melhorar o desempenho de uma média móvel, persistiendo o valor em uma coluna calculada de uma tabela com a granularidade desejada, como data, data ou produto. No entanto, a abordagem de cálculo dinâmico com uma medida oferece a capacidade de usar um parâmetro para o número de dias da média móvel (por exemplo, substituir ltnumberofdaysgt por uma medida que implementa o padrão da Tabela de Parâmetros). A mediana corresponde ao percentil 50, que você pode calcular usando o padrão Percentile. No entanto, o padrão Mediano permite otimizar e simplificar o cálculo mediano usando uma única medida, em vez das diversas medidas exigidas pelo padrão Percentile. Você pode usar essa abordagem quando você calcula a mediana para os valores incluídos no ltvaluecolumngt, conforme mostrado abaixo: Para melhorar o desempenho, você pode querer persistir o valor de uma medida em uma coluna calculada, se desejar obter a mediana para os resultados de Uma medida no modelo de dados. No entanto, antes de fazer essa otimização, você deve implementar o cálculo MedianX com base no seguinte modelo, usando esses marcadores: ltgranularitytablegt é a tabela que define a granularidade do cálculo. Por exemplo, pode ser a tabela Data se você deseja calcular a mediana de uma medida calculada no nível do dia, ou pode ser VALORES (8216DateYearMonth) se você deseja calcular a mediana de uma medida calculada no nível do mês. Ltmeasuregt é a medida para calcular para cada linha de ltgranularitytablegt para o cálculo mediano. Ltmeasuretablegt é a tabela contendo dados usados ​​pelo ltmeasuregt. Por exemplo, se o ltgranularitytablegt for uma dimensão como 8216Date8217, então o ltmeasuretablegt será 8216Internet Sales8217 contendo a coluna de Quantidade de Vendas da Internet somada pela medida Internet Total Sales. Por exemplo, você pode escrever a mediana de Internet Total Sales para todos os Clientes em Adventure Works da seguinte maneira: Dica O seguinte padrão: é usado para remover linhas do ltgranularitytablegt que não possuem dados correspondentes na seleção atual. É uma maneira mais rápida do que usar a seguinte expressão: No entanto, você pode substituir toda a expressão CALCULATETÁVEL com apenas ltgranularitytablegt se você quiser considerar os valores em branco do ltmeasuregt como 0. O desempenho da fórmula MedianX depende do número de linhas no Mesa iterada e sobre a complexidade da medida. Se o desempenho for ruim, você pode persistir o resultado do ltmeasuregt em uma coluna calculada do lttablegt, mas isso eliminará a capacidade de aplicar filtros ao cálculo mediano no horário da consulta. O Percentile Excel possui duas implementações diferentes do cálculo percentil com três funções: PERCENTILE, PERCENTILE. INC e PERCENTILE. EXC. Todos retornam o percentil K dos valores, onde K está no intervalo de 0 a 1. A diferença é que PERCENTILE e PERCENTILE. INC consideram K como um intervalo inclusivo, enquanto o PERCENTILE. EXC considera o intervalo K de 0 a 1 como exclusivo . Todas essas funções e suas implementações DAX recebem um valor percentil como parâmetro, que chamamos de valor do percentil K. ltKgt está no intervalo 0 a 1. As duas implementações DAX do percentil requerem algumas medidas semelhantes, mas diferentes o suficiente para exigir Dois conjuntos diferentes de fórmulas. As medidas definidas em cada padrão são: KPerc. O valor percentil corresponde a ltKgt. PercPos. A posição do percentil no conjunto de valores ordenados. ValueLow. O valor abaixo da posição percentil. ValueHigh. O valor acima da posição percentil. Percentile. O cálculo final do percentil. Você precisa das medidas ValueLow e ValueHigh caso o PercPos contenha uma parte decimal, pois então você deve interpolar entre ValueLow e ValueHigh para retornar o valor do percentil correto. A Figura 4 mostra um exemplo dos cálculos feitos com fórmulas de Excel e DAX, usando ambos os algoritmos do percentil (inclusivo e exclusivo). Figura 4 Cálculos de percentil usando fórmulas do Excel e o cálculo equivalente do DAX. Nas seções a seguir, as fórmulas Percentile executam o cálculo em valores armazenados em uma coluna de tabela, DataValue, enquanto as fórmulas PercentileX executam o cálculo em valores retornados por uma medida calculada em uma granularidade dada. Percentile Inclusive The Percentile A implementação inclusiva é a seguinte. Percentile Exclusive The Percentile A implementação exclusiva é a seguinte. PercentileX Inclusive A implementação PercentileX Inclusive é baseada no seguinte modelo, usando estes marcadores: ltgranularitytablegt é a tabela que define a granularidade do cálculo. Por exemplo, pode ser a tabela Data se você deseja calcular o percentil de uma medida no nível do dia, ou pode ser VALORES (8216DateYearMonth) se você deseja calcular o percentil de uma medida no nível do mês. Ltmeasuregt é a medida para calcular para cada linha de ltgranularitytablegt para cálculos percentis. Ltmeasuretablegt é a tabela contendo dados usados ​​pelo ltmeasuregt. Por exemplo, se o ltgranularitytablegt for uma dimensão tal como 8216Date, 8217, o ltmeasuretablegt será 8216Sales8217 contendo a coluna Montante somada pela medida Total Montante. Por exemplo, você pode escrever o PercentileXInc da quantidade total de vendas para todas as datas na tabela de data da seguinte forma: PercentileX Exclusive A implementação exclusiva do PercentileX é baseada no modelo a seguir, usando os mesmos marcadores usados ​​no PercentileX Inclusive: por exemplo, você Pode escrever o PercentileXExc do valor total das vendas para todas as datas na tabela de data da seguinte forma: Mantenha-me informado sobre os próximos padrões (boletim informativo). Desmarque para baixar livremente o arquivo. Publicado em 17 de março de 2017 por 2.1 Modelos em média móvel (modelos MA) Os modelos de séries temporais conhecidos como modelos ARIMA podem incluir termos autorregressivos e termos móveis em média. Na semana 1, aprendemos um termo autorregressivo em um modelo de séries temporais para a variável x t é um valor remanescente de x t. Por exemplo, um termo autorregressivo de lag 1 é x t-1 (multiplicado por um coeficiente). Esta lição define os termos médios móveis. Um termo médio móvel em um modelo de séries temporais é um erro passado (multiplicado por um coeficiente). Deixe (wt overset N (0, sigma2w)), o que significa que o w t é idêntico, distribuído independentemente, cada um com uma distribuição normal com média 0 e a mesma variância. O modelo de média móvel de 1ª ordem, denotado por MA (1) é (xt mu wt theta1w) O modelo de média móvel de 2ª ordem, denotado por MA (2) é (xt mu wt theta1w theta2w) O modelo de média móvel da ordem q , Denotado por MA (q) é (xt mu wt theta1w theta2w dots thetaqw) Nota. Muitos livros didáticos e programas de software definem o modelo com sinais negativos antes dos termos. Isso não altera as propriedades teóricas gerais do modelo, embora ele flip os signos algébricos de valores de coeficientes estimados e termos (desactuados) em fórmulas para ACFs e variâncias. Você precisa verificar seu software para verificar se os sinais negativos ou positivos foram usados ​​para escrever corretamente o modelo estimado. R usa sinais positivos em seu modelo subjacente, como fazemos aqui. Propriedades teóricas de uma série de tempo com um modelo MA (1) Observe que o único valor diferente de zero na ACF teórica é para o atraso 1. Todas as outras autocorrelações são 0. Assim, uma amostra ACF com autocorrelação significativa apenas no intervalo 1 é um indicador de um possível modelo MA (1). Para estudantes interessados, as provas dessas propriedades são um apêndice para este folheto. Exemplo 1 Suponha que um modelo de MA (1) seja x t 10 w t .7 w t-1. Onde (com o excesso de N (0,1)). Assim, o coeficiente 1 0,7. O ACF teórico é dado por um gráfico deste ACF segue. O enredo que acabamos de mostrar é o ACF teórico para um MA (1) com 1 0,7. Na prática, uma amostra geralmente não fornece um padrão tão claro. Usando R, simulamos n 100 valores de amostra usando o modelo x t 10 w t .7 w t-1 onde w t iid N (0,1). Para esta simulação, segue-se um gráfico de séries temporais dos dados da amostra. Não podemos dizer muito dessa trama. A amostra ACF para os dados simulados segue. Vemos um pico no intervalo 1 seguido de valores geralmente não significativos para atrasos após 1. Observe que o ACF de amostra não corresponde ao padrão teórico da MA subjacente (1), que é que todas as autocorrelações por atrasos após 1 serão 0 . Uma amostra diferente teria uma ACF de amostra ligeiramente diferente mostrada abaixo, mas provavelmente teria os mesmos recursos amplos. Propriedades terapêuticas de uma série de tempo com um modelo MA (2) Para o modelo MA (2), as propriedades teóricas são as seguintes: Observe que os únicos valores não nulos no ACF teórico são para atrasos 1 e 2. As autocorrelações para atrasos superiores são 0 . Assim, uma amostra de ACF com autocorrelações significativas nos intervalos 1 e 2, mas as autocorrelações não significativas para atrasos maiores indicam um possível modelo de MA (2). Iid N (0,1). Os coeficientes são de 1 0,5 e 2 0,3. Uma vez que este é um MA (2), o ACF teórico terá valores diferentes de zero apenas nos intervalos 1 e 2. Os valores das duas autocorrelações não-zero são A Um gráfico do ACF teórico segue. Como quase sempre é o caso, os dados da amostra não se comportam tão perfeitamente quanto a teoria. Nós simulamos n 150 valores de amostra para o modelo x t 10 w t .5 w t-1 .3 w t-2. Onde w t iid N (0,1). A série de séries temporais dos dados segue. Tal como acontece com a série de séries temporais para os dados da amostra MA (1), você não pode contar muito com isso. A amostra ACF para os dados simulados segue. O padrão é típico para situações em que um modelo de MA (2) pode ser útil. Existem dois picos estatisticamente significativos nos intervalos 1 e 2 seguidos de valores não significativos para outros atrasos. Observe que, devido ao erro de amostragem, a amostra ACF não corresponde exatamente ao padrão teórico. ACF para General MA (q) Modelos Uma propriedade de modelos de MA (q) em geral é que existem autocorrelações diferentes de zero para os primeiros intervalos de q e autocorrelações 0 para todos os atrasos gt q. Não singularidade de conexão entre valores de 1 e (rho1) em MA (1) Modelo. No modelo MA (1), para qualquer valor de 1. O recíproco 1 1 dá o mesmo valor para Como exemplo, use 0,5 para 1. E depois use 1 (0,5) 2 para 1. Você obterá (rho1) 0.4 em ambos os casos. Para satisfazer uma restrição teórica chamada invertibilidade. Nós restringimos os modelos de MA (1) para ter valores com valor absoluto inferior a 1. No exemplo que acabamos de dar, 1 0.5 será um valor de parâmetro permitido, enquanto que 1 10.5 2 não irá. Invertibilidade de modelos de MA Um modelo de MA é considerado inversível se for algébricamente equivalente a um modelo de AR de ordem infinita convergente. Ao convergir, queremos dizer que os coeficientes de AR diminuem para 0, enquanto nos movemos para trás no tempo. Invertibilidade é uma restrição programada em software de série temporal usado para estimar os coeficientes de modelos com termos MA. Não é algo que buscamos na análise de dados. Informações adicionais sobre a restrição de invertibilidade para modelos MA (1) são apresentadas no apêndice. Nota de teoria avançada. Para um modelo MA (q) com um ACF especificado, existe apenas um modelo inversível. A condição necessária para a invertibilidade é que os coeficientes possuem valores tais que a equação 1- 1 y-. - q e q 0 possui soluções para y que se encontram fora do círculo da unidade. Código R para os Exemplos No Exemplo 1, traçamos o ACF teórico do modelo x t 10 w t. 7w t-1. E depois simulou n 150 valores desse modelo e traçou as séries temporais da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados para traçar o ACF teórico foram: acfma1ARMAacf (mac (0,7), lag. max10) 10 lags de ACF para MA (1) com theta1 0,7 lags0: 10 cria uma variável chamada atrasos que varia de 0 a 10. trama (Lag, acfma1, xlimc (1,10), ylabr, typeh, ACF principal para MA (1) com theta1 0,7) abline (h0) adiciona um eixo horizontal ao gráfico O primeiro comando determina o ACF e o armazena em um objeto Nomeado acfma1 (nossa escolha de nome). O comando de parcela (o comando 3) representa atrasos em relação aos valores ACF para os atrasos 1 a 10. O parâmetro ylab rotula o eixo y e o parâmetro principal coloca um título no gráfico. Para ver os valores numéricos do ACF, use simplesmente o comando acfma1. A simulação e os gráficos foram feitos com os seguintes comandos. Xcarima. sim (n150, list (mac (0.7))) Simula n 150 valores de MA (1) xxc10 acrescenta 10 para fazer a média 10. Padrões de simulação significa 0. plot (x, typeb, mainSimulated MA (1) dados) Acf (x, xlimc (1,10), mainACF para dados de amostra simulados) No Exemplo 2, traçamos o ACF teórico do modelo xt 10 wt .5 w t-1 .3 w t-2. E depois simulou n 150 valores desse modelo e traçou as séries temporais da amostra e a amostra ACF para os dados simulados. Os comandos R utilizados foram acfma2ARMAacf (mac (0.5,0.3), lag. max10) acfma2 lags0: 10 plot (lags, acfma2, xlimc (1,10), ylabr, typeh, ACF principal para MA (2) com theta1 0,5, Theta20.3) abline (h0) xcarima. sim (n150, list (mac (0.5, 0.3))) xxc10 plot (x, typeb, principal Simulated MA (2) Series) acf (x, xlimc (1,10), MainACF para dados simulados de MA (2) Apêndice: Prova de propriedades de MA (1) Para estudantes interessados, aqui estão as provas para propriedades teóricas do modelo MA (1). Variance: (texto (texto) (mu wt theta1 w) Texto de 0 texto (wt) (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Quando h 1, a expressão anterior 1 w 2. Para qualquer h 2, a expressão anterior 0 . A razão é que, por definição de independência do peso. E (w k w j) 0 para qualquer k j. Além disso, porque o w t tem 0, E (w j w j) E (w j 2) w 2. Para uma série de tempo, aplique este resultado para obter o ACF fornecido acima. Um modelo de MA reversível é aquele que pode ser escrito como um modelo de AR de ordem infinita que converge para que os coeficientes de AR convergem para 0 à medida que nos movemos infinitamente de volta no tempo. Bem, demonstre invertibilidade para o modelo MA (1). Em seguida, substituímos a relação (2) para w t-1 na equação (1) (3) (zt wt theta1 (z - theta1w) wt theta1z - theta2w) No momento t-2. A equação (2) torna-se então substituímos a relação (4) para w t-2 na equação (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Se continuássemos ( Infinitamente), obteríamos o modelo de AR de ordem infinita (zt wt theta1 z - theta21z theta31z - theta41z dots) Note, no entanto, que se 1 1, os coeficientes que multiplicam os atrasos de z aumentarão (infinitamente) de tamanho à medida que avançarmos Tempo. Para evitar isso, precisamos de 1 lt1. Esta é a condição para um modelo de MA reversível (1). Modelo de ordem infinita MA Na semana 3, veja que um modelo de AR (1) pode ser convertido em um modelo de MA de ordem infinita: (xt - mu wt phi1w phi21w dots phik1 w dots sum phij1w) Este somatório de termos de ruído branco passados ​​é conhecido Como a representação causal de um AR (1). Em outras palavras, x t é um tipo especial de MA com um número infinito de termos que retornam no tempo. Isso é chamado de uma ordem infinita MA ou MA (). Uma ordem finita MA é uma ordem infinita AR e qualquer ordem finita AR é uma ordem infinita MA. Recorde na Semana 1, observamos que um requisito para um AR estacionário (1) é aquele 1 lt1. Vamos calcular o Var (x t) usando a representação causal. Este último passo usa um fato básico sobre séries geométricas que requerem (phi1lt1) caso contrário a série diverge. Navegação

No comments:

Post a Comment