Monday, November 28, 2016

Término Medio Móvil De Arima

Esta pregunta ya tiene una respuesta aquí: Para un modelo ARIMA (0,0,1), entiendo que R sigue la ecuación: xt mu e (t) thetae (t-1) (Por favor corrija si estoy equivocado) I Suponga que e (t-1) es igual que el residuo de la última observación. Por ejemplo, aquí están las primeras cuatro observaciones en una muestra de datos: 526 658 624 611 Estos son los parámetros Arima (0,0,1) modelo dio: intercepto 246,1848 ma1 0,9893 Y el primer valor que R ajustando usando el modelo es: 327.0773 ¿Cómo consigo el segundo valor que utilicé: 246.1848 (0.9893 (526-327.0773)) 442.979 Pero el 2do valor cabido dado por R es. 434.7928 Supongo que la diferencia se debe al término e (t). Pero no sé cómo calcular el término e (t). Pidió Jul 28 14 a las 16:12 marcado como duplicado por Glenb 9830. Nick Stauner. Whuber 9830 Jul 29 14 at 1:24 Esta pregunta se ha hecho antes y ya tiene una respuesta. Si esas respuestas no responden completamente a su pregunta, haga una nueva pregunta. Usted podría obtener los valores ajustados como pronósticos de un solo paso utilizando el algoritmo de innovaciones. Véase por ejemplo la proposición 5.5.2 en Brockwell y Davis downloable de Internet encontré estas diapositivas. Es mucho más fácil obtener los valores ajustados como la diferencia entre los valores observados y los residuos. En este caso, su pregunta se reduce a la obtención de los residuos. Por ejemplo, podemos obtener el residuo en el punto de tiempo 140 como el valor observado en t140 menos la media estimada menos Hat veces el residuo anterior, t139): El filtro de función se puede utilizar para hacer estos cálculos: Usted puede ver que el resultado es muy cercano a los residuos devueltos por los residuos. La diferencia en los primeros residuos es más probable debido a alguna inicialización que puede haber omitido. Los valores ajustados son sólo los valores observados menos los residuos: En la práctica se deben utilizar las funciones residuales y ajustadas pero para fines pedagógicos se puede probar la ecuación recursiva utilizada anteriormente. Puede comenzar haciendo algunos ejemplos a mano como se muestra arriba. Te recomiendo que leas también la documentación del filtro de funciones y comparas algunos de tus cálculos con él. Una vez que entienda las operaciones involucradas en el cálculo de los valores residuales y ajustados podrá hacer un uso bien informado de las funciones más prácticas residuales y montadas. Usted puede encontrar alguna otra información relacionada con su pregunta en este post. Un RIMA significa Autoregressive Integrated Moving Average. Univariante (vector único) ARIMA es una técnica de previsión que proyecta los valores futuros de una serie basada enteramente en su propia inercia. Su aplicación principal es en el área de pronósticos a corto plazo que requieren al menos 40 puntos de datos históricos. Funciona mejor cuando los datos muestran un patrón estable o consistente en el tiempo con una cantidad mínima de valores atípicos. A veces llamado Box-Jenkins (después de los autores originales), ARIMA suele ser superior a las técnicas de suavización exponencial cuando los datos son razonablemente largos y la correlación entre las observaciones pasadas es estable. Si los datos son cortos o muy volátiles, entonces algún método de suavizado puede funcionar mejor. Si usted no tiene por lo menos 38 puntos de datos, debe considerar algún otro método que ARIMA. El primer paso para aplicar la metodología ARIMA es verificar la estacionariedad. La estacionariedad implica que la serie permanece a un nivel bastante constante en el tiempo. Si existe una tendencia, como en la mayoría de las aplicaciones económicas o de negocios, sus datos NO son estacionarios. Los datos también deben mostrar una variación constante en sus fluctuaciones en el tiempo. Esto se ve fácilmente con una serie que es muy estacional y que crece a un ritmo más rápido. En tal caso, los altibajos en la estacionalidad se harán más dramáticos con el tiempo. Si no se cumplen estas condiciones de estacionariedad, no se pueden calcular muchos de los cálculos asociados con el proceso. Si un gráfico gráfico de los datos indica nonstationarity, entonces usted debe diferenciar la serie. La diferenciación es una excelente forma de transformar una serie no estacionaria en una serie estacionaria. Esto se hace restando la observación en el período actual a la anterior. Si esta transformación se realiza sólo una vez en una serie, se dice que los datos se han diferenciado primero. Este proceso esencialmente elimina la tendencia si su serie está creciendo a una tasa bastante constante. Si está creciendo a un ritmo creciente, puede aplicar el mismo procedimiento y diferenciar los datos de nuevo. Sus datos entonces serían segundos diferenciados. Las autocorrelaciones son valores numéricos que indican cómo una serie de datos se relaciona a sí misma con el tiempo. Más precisamente, mide cuán fuertemente están correlacionados los valores de datos en un número específico de períodos separados entre sí a lo largo del tiempo. El número de períodos separados se llama generalmente el retraso. Por ejemplo, una autocorrelación en el retardo 1 mide cómo los valores 1 período aparte están correlacionados entre sí a lo largo de la serie. Una autocorrelación en el retraso 2 mide cómo los datos dos períodos aparte están correlacionados a lo largo de la serie. Las autocorrelaciones pueden variar de 1 a -1. Un valor próximo a 1 indica una alta correlación positiva, mientras que un valor cercano a -1 implica una correlación negativa alta. Estas medidas se evalúan con mayor frecuencia a través de tramas gráficas llamadas correlagramas. Un correlagrama traza los valores de autocorrelación para una serie dada con diferentes retardos. Esto se conoce como la función de autocorrelación y es muy importante en el método ARIMA. La metodología ARIMA intenta describir los movimientos en una serie temporal estacionaria como una función de lo que se llaman parámetros de media móvil y autorregresiva. Estos parámetros se denominan parámetros AR (autoregessivos) y MA (medias móviles). Un modelo de AR con un solo parámetro se puede escribir como. X (t) A (1) X (t-1) E (t) donde X (t) serie temporal bajo investigación A (1) el parámetro autorregresivo de orden 1 X (t-1) (T) el término de error del modelo Esto simplemente significa que cualquier valor dado X (t) puede explicarse por alguna función de su valor anterior, X (t-1), más algún error aleatorio inexplicable, E (t). Si el valor estimado de A (1) fue de 0,30, entonces el valor actual de la serie estaría relacionado con 30 de su valor hace 1 período. Por supuesto, la serie podría estar relacionada con más de un valor pasado. Por ejemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Esto indica que el valor actual de la serie es una combinación de los dos valores inmediatamente anteriores, X (t-1) y X (t-2), más algún error aleatorio E (t). Nuestro modelo es ahora un modelo autorregresivo de orden 2. Modelos de media móvil: Un segundo tipo de modelo de Box-Jenkins se denomina modelo de media móvil. Aunque estos modelos parecen muy similares al modelo de AR, el concepto detrás de ellos es muy diferente. Los parámetros de la media móvil relacionan lo que sucede en el período t sólo con los errores aleatorios que ocurrieron en períodos de tiempo pasados, es decir, E (t-1), E (t-2), etc., en lugar de X (t-1), X T-2), (Xt-3) como en los enfoques autorregresivos. Un modelo de media móvil con un término MA puede escribirse como sigue. El término B (1) se denomina un MA de orden 1. El signo negativo delante del parámetro se utiliza para la convención solamente y se imprime generalmente La mayoría de los programas de ordenador. El modelo anterior simplemente dice que cualquier valor dado de X (t) está directamente relacionado solamente al error aleatorio en el período anterior, E (t-1), y al término de error actual, E (t). Como en el caso de los modelos autorregresivos, los modelos de media móvil pueden extenderse a estructuras de orden superior que abarcan diferentes combinaciones y longitudes móviles. La metodología ARIMA también permite la construcción de modelos que incorporen parámetros tanto de autorregresión como de media móvil. Estos modelos se refieren a menudo como modelos mixtos. Aunque esto hace que sea una herramienta de pronóstico más complicada, la estructura puede simular mejor la serie y producir un pronóstico más preciso. Los modelos puros implican que la estructura consiste solamente en los parámetros AR o MA - no ambos. Los modelos desarrollados por este enfoque usualmente se llaman modelos ARIMA porque usan una combinación de autoregresión (AR), integración (I), que se refiere al proceso inverso de diferenciación para producir las operaciones de predicción y de media móvil (MA). Un modelo de ARIMA se indica generalmente como ARIMA (p, d, q). Esto representa el orden de los componentes autorregresivos (p), el número de operadores de diferenciación (d) y el orden más alto del término medio móvil. Por ejemplo, ARIMA (2,1,1) significa que usted tiene un modelo autorregresivo de segundo orden con un componente de media móvil de primer orden cuya serie se ha diferenciado una vez para inducir la estacionariedad. Elegir la especificación correcta: El principal problema en el clásico Box-Jenkins es tratar de decidir qué especificación ARIMA utilizar-i. e. Cuántos AR y / o MA parámetros para incluir. Esto es lo que gran parte de Box-Jenkings 1976 se dedicó al proceso de identificación. Dependía de la eva - luación gráfica y numérica de las funciones de autocorrelación de la muestra y de autocorrelación parcial. Bueno, para sus modelos básicos, la tarea no es demasiado difícil. Cada uno tiene funciones de autocorrelación que se ven de cierta manera. Sin embargo, cuando se sube en complejidad, los patrones no se detectan tan fácilmente. Para hacer las cosas más difíciles, sus datos representan sólo una muestra del proceso subyacente. Esto significa que los errores de muestreo (valores atípicos, errores de medición, etc.) pueden distorsionar el proceso teórico de identificación. Es por eso que el modelado ARIMA tradicional es un arte más que una ciencia. Modelos ARIMA de mínimos cuadrados lineales versus no lineales que incluyen sólo términos AR son casos especiales de modelos de regresión lineal, por lo que pueden ser ajustados por mínimos cuadrados ordinarios. Los pronósticos AR son una función lineal de los coeficientes, así como una función lineal de datos pasados. En principio, las estimaciones por mínimos cuadrados de los coeficientes de AR pueden calcularse exactamente a partir de autocorrelaciones en una sola quotiteración. En la práctica, se puede ajustar un modelo de AR en el procedimiento de regresión múltiple - sólo regresar DIFF (Y) (o lo que sea) en los rezagos de sí mismo. Los modelos ARIMA que incluyen términos MA son similares a los modelos de regresión, pero no pueden ser ajustados por mínimos cuadrados ordinarios: Los pronósticos son una función lineal de datos pasados, pero son Funciones no lineales de los coeficientes - por ejemplo, Un modelo ARIMA (0,1,1) sin constante es una media móvil exponencialmente ponderada: en la que los pronósticos son una función no lineal del parámetro MA (1) (quotthetaquot). Otra forma de ver el problema: no se puede ajustar a los modelos de MA usando la regresión múltiple ordinaria porque no hay manera de especificar ERRORES como una variable independiente - los errores no se conocen hasta que el modelo se instala Deben calcularse secuencialmente. Periodo por período, dados los estimados de parámetros actuales. Por lo tanto, los modelos de MA requieren un algoritmo de estimación no lineal, similar al algoritmo quotSolverquot en Excel. El algoritmo utiliza un proceso de búsqueda que normalmente requiere de 5 a 10 iteraciones y ocasionalmente puede no converger. Puede ajustar las tolerancias para determinar los tamaños de paso y los criterios de detención para la búsqueda (aunque los valores por defecto normalmente son correctos). QuotMeanquot versus quotconstantquot El quotmeanquot y el quotconstantquot en los resultados de ajuste de modelo ARIMA son números diferentes siempre que el modelo incluye términos AR. Supongamos que se ajusta un modelo ARIMA a Y en el que p es el número de términos autorregresivos. (Supongamos por conveniencia que no hay términos MA). Sea y la versión diferenciada (estacionalizada) de Y, p. Y t Y t - Y t-1 si se utilizó una diferencia no estacional. Entonces la ecuación de pronóstico AR (p) para y es: Este es sólo un modelo de regresión múltiple ordinario en el que 956 es el término constante, 981 1 es el coeficiente del primer retraso de y. y así. Ahora, internamente, el software convierte esta forma de intersección de pendiente de la ecuación de regresión a una forma equivalente en términos de desviaciones de la media. Sea m la media de la serie estacionalizada y. Entonces la ecuación autorregresiva de orden p se puede escribir en términos de desviaciones de la media como: Recopilando todos los términos constantes en esta ecuación, vemos que es equivalente a la forma original de la ecuación si: CONSTANTE MEDIANO x (1 - suma De los coeficientes AR) El software calcula realmente m (junto con los otros parámetros del modelo) e informa de esto como el MEAN en los resultados del ajuste del modelo, junto con su error estándar y el estadístico t, etc. Se calcula entonces el CONSTANTE (956) De acuerdo con la fórmula anterior. Si el modelo no contiene ningún término AR, el MEAN y el CONSTANT son idénticos. En un modelo con un orden de diferenciación no estacional (sólo), el MEAN es el factor de tendencia (período medio a cambio de período). En un modelo con un orden de diferenciación estacional (sólo), el MEAN es el factor de tendencia anual (cambio medio año a año). El problema básico: un modelo ARIMA (u otro modelo de series temporales) predice los valores futuros de las series temporales a partir de los valores pasados, pero ¿cómo debería inicializarse la ecuación de pronóstico para hacer una predicción para la primera observación? Inicializado por la caída de las primeras observaciones - aunque esto es ineficiente y los datos de residuos -, pero los modelos de MA requieren una estimación de un error anterior antes de que puedan hacer el primer pronóstico.) Extraño, pero cierto. Por lo tanto, una serie temporal estacionaria se ve igual en adelante o hacia atrás en el tiempo. El mismo modelo que predice el futuro de una serie también puede usarse para predecir su pasado. La solución: para extraer la mayor cantidad de información de los datos disponibles, la mejor manera de inicializar un modelo ARIMA (o cualquier modelo de predicción de series temporales) es utilizar la previsión hacia atrás (quotbackforecastingquot) para obtener estimaciones de los valores de datos antes del período 1. Cuando Usted utiliza la opción backforecasting en la estimación de ARIMA, el algoritmo de búsqueda en realidad hace dos pases a través de los datos en cada iteración: primero se hace un pase hacia atrás para estimar los valores de datos anteriores usando las estimaciones de parámetros actuales, La ecuación de pronóstico para un paso hacia adelante a través de los datos. Si NO UTILIZA la opción backforecasting, la ecuación de predicción se inicializará suponiendo que los valores anteriores de la serie estacionalizada fueron iguales a la media. Si utiliza la opción backforecasting, los pronósticos que se utilizan para inicializar el modelo son parámetros implícitos del modelo, que deben estimarse junto con los coeficientes AR y MA. El número de parámetros implícitos adicionales es aproximadamente igual al retardo más alto del modelo, usualmente 2 o 3 para un modelo no estacional y s1 o 2s1 para un modelo estacional con estacionalidad. (Si el modelo incluye tanto una diferencia estacional como un término estacional AR o MA, necesita dos temporadas de valores previos para poner en marcha). Obsérvese que con la opción backforecasting, un modelo AR se estima de una manera diferente a la que se estimaría En el procedimiento de Regresión Múltiple (los valores perdidos no son meramente ignorados - son reemplazados con una estimación de la media o con pronósticos), por lo tanto, un modelo AR ajustado en el procedimiento ARIMA nunca producirá exactamente los mismos parámetros estimados que un modelo AR Ajustado en el procedimiento de regresión múltiple. Sabiduría convencional: DESACTIVAR la retroprovisionamiento cuando no está seguro de si el modelo actual es válido, enciéndalo para obtener estimaciones de parámetros finales una vez que esté razonablemente seguro de que el modelo es válido. Si el modelo se especifica erróneamente, la retrotratamiento puede conducir a fallos de las estimaciones de parámetros para converger y / oa problemas de raíz unitaria.


No comments:

Post a Comment