Tuesday, 7 November 2017

Diferencia Entre El Promedio Móvil Y El Modelo Autorregresivo


A RIMA significa Autoregressive Integrated Moving Average modelos. Univariante (vector único) ARIMA es una técnica de previsión que proyecta los valores futuros de una serie basada enteramente en su propia inercia. Su aplicación principal es en el área de pronósticos a corto plazo que requieren al menos 40 puntos de datos históricos. Funciona mejor cuando los datos muestran un patrón estable o consistente en el tiempo con una cantidad mínima de valores atípicos. A veces llamado Box-Jenkins (después de los autores originales), ARIMA suele ser superior a las técnicas de suavización exponencial cuando los datos son razonablemente largos y la correlación entre las observaciones pasadas es estable. Si los datos son cortos o muy volátiles, entonces algún método de suavizado puede funcionar mejor. Si usted no tiene por lo menos 38 puntos de datos, debe considerar algún otro método que ARIMA. El primer paso para aplicar la metodología ARIMA es verificar la estacionariedad. La estacionariedad implica que la serie permanece a un nivel bastante constante en el tiempo. Si existe una tendencia, como en la mayoría de las aplicaciones económicas o de negocios, sus datos NO son estacionarios. Los datos también deben mostrar una variación constante en sus fluctuaciones en el tiempo. Esto se ve fácilmente con una serie que es muy estacional y que crece a un ritmo más rápido. En tal caso, los altibajos en la estacionalidad se harán más dramáticos con el tiempo. Si no se cumplen estas condiciones de estacionariedad, no se pueden calcular muchos de los cálculos asociados con el proceso. Si un gráfico gráfico de los datos indica nonstationarity, entonces usted debe diferenciar la serie. La diferenciación es una excelente forma de transformar una serie no estacionaria en una serie estacionaria. Esto se hace restando la observación en el período actual a la anterior. Si esta transformación se realiza sólo una vez en una serie, se dice que los datos se han diferenciado primero. Este proceso esencialmente elimina la tendencia si su serie está creciendo a una tasa bastante constante. Si está creciendo a un ritmo creciente, puede aplicar el mismo procedimiento y diferenciar los datos de nuevo. Sus datos entonces serían segundos diferenciados. Las autocorrelaciones son valores numéricos que indican cómo una serie de datos se relaciona a sí misma con el tiempo. Más precisamente, mide cuán fuertemente están correlacionados los valores de datos en un número específico de períodos separados entre sí a lo largo del tiempo. El número de períodos separados se llama generalmente el retraso. Por ejemplo, una autocorrelación en el retardo 1 mide cómo los valores 1 período aparte están correlacionados entre sí a lo largo de la serie. Una autocorrelación en el retraso 2 mide cómo los datos dos períodos aparte están correlacionados a lo largo de la serie. Las autocorrelaciones pueden variar de 1 a -1. Un valor próximo a 1 indica una alta correlación positiva, mientras que un valor cercano a -1 implica una correlación negativa alta. Estas medidas se evalúan con mayor frecuencia a través de tramas gráficas llamadas correlagramas. Un correlagrama traza los valores de autocorrelación para una serie dada con diferentes retardos. Esto se conoce como la función de autocorrelación y es muy importante en el método ARIMA. La metodología ARIMA intenta describir los movimientos en una serie temporal estacionaria como una función de lo que se llaman parámetros de media móvil y autorregresiva. Estos parámetros se denominan parámetros AR (autoregessivos) y MA (medias móviles). Un modelo de AR con un solo parámetro se puede escribir como. X (t) A (1) X (t-1) E (t) donde X (t) serie temporal bajo investigación A (1) el parámetro autorregresivo de orden 1 X (t-1) (T) el término de error del modelo Esto simplemente significa que cualquier valor dado X (t) puede explicarse por alguna función de su valor anterior, X (t-1), más algún error aleatorio inexplicable, E (t). Si el valor estimado de A (1) fue de 0,30, entonces el valor actual de la serie estaría relacionado con 30 de su valor hace 1 período. Por supuesto, la serie podría estar relacionada con más de un valor pasado. Por ejemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Esto indica que el valor actual de la serie es una combinación de los dos valores inmediatamente anteriores, X (t-1) y X (t-2), más algún error aleatorio E (t). Nuestro modelo es ahora un modelo autorregresivo de orden 2. Modelos de media móvil: Un segundo tipo de modelo de Box-Jenkins se denomina modelo de media móvil. Aunque estos modelos parecen muy similares al modelo de AR, el concepto detrás de ellos es muy diferente. Los parámetros de la media móvil relacionan lo que sucede en el período t sólo con los errores aleatorios que ocurrieron en períodos de tiempo pasados, es decir, E (t-1), E (t-2), etc., en lugar de X (t-1), X T-2), (Xt-3) como en los enfoques autorregresivos. Un modelo de media móvil con un término MA puede escribirse como sigue. El término B (1) se denomina un MA de orden 1. El signo negativo delante del parámetro se utiliza para la convención solamente y se imprime generalmente La mayoría de los programas de ordenador. El modelo anterior simplemente dice que cualquier valor dado de X (t) está directamente relacionado solamente al error aleatorio en el período anterior, E (t-1), y al término de error actual, E (t). Como en el caso de los modelos autorregresivos, los modelos de media móvil pueden extenderse a estructuras de orden superior que abarcan diferentes combinaciones y longitudes móviles. La metodología ARIMA también permite la construcción de modelos que incorporen parámetros tanto de autorregresión como de media móvil. Estos modelos se refieren a menudo como modelos mixtos. Aunque esto hace que sea una herramienta de pronóstico más complicada, la estructura puede simular mejor la serie y producir un pronóstico más preciso. Los modelos puros implican que la estructura consiste solamente en los parámetros AR o MA - no ambos. Los modelos desarrollados por este enfoque usualmente se llaman modelos ARIMA porque usan una combinación de autoregresión (AR), integración (I), que se refiere al proceso inverso de diferenciación para producir las operaciones de predicción y de media móvil (MA). Un modelo de ARIMA se indica generalmente como ARIMA (p, d, q). Esto representa el orden de los componentes autorregresivos (p), el número de operadores de diferenciación (d) y el orden más alto del término medio móvil. Por ejemplo, ARIMA (2,1,1) significa que usted tiene un modelo autorregresivo de segundo orden con un componente de media móvil de primer orden cuya serie se ha diferenciado una vez para inducir la estacionariedad. Elegir la especificación correcta: El principal problema en el clásico Box-Jenkins es tratar de decidir qué especificación ARIMA utilizar-i. e. Cuántos AR y / o MA parámetros para incluir. Esto es lo que gran parte de Box-Jenkings 1976 se dedicó al proceso de identificación. Dependía de la eva - luación gráfica y numérica de las funciones de autocorrelación de la muestra y de autocorrelación parcial. Bueno, para sus modelos básicos, la tarea no es demasiado difícil. Cada uno tiene funciones de autocorrelación que se ven de cierta manera. Sin embargo, cuando se sube en complejidad, los patrones no se detectan tan fácilmente. Para hacer las cosas más difíciles, sus datos representan sólo una muestra del proceso subyacente. Esto significa que los errores de muestreo (valores atípicos, errores de medición, etc.) pueden distorsionar el proceso teórico de identificación. Es por eso que el modelado ARIMA tradicional es un arte más que una ciencia. Hay una serie de enfoques para modelar las series temporales. Describimos algunos de los enfoques más comunes a continuación. Tendencia, Descomposiciones Estacionales, Residuales Un enfoque consiste en descomponer las series temporales en un componente de tendencia, estacional y residual. El triple alisado exponencial es un ejemplo de este enfoque. Otro ejemplo, denominado loess estacional, se basa en mínimos cuadrados ponderados localmente y es discutido por Cleveland (1993). No discutimos el loess estacional en este manual. Métodos basados ​​en la frecuencia Otro enfoque, comúnmente utilizado en aplicaciones científicas y de ingeniería, es analizar las series en el dominio de la frecuencia. Un ejemplo de este enfoque en el modelado de un conjunto de datos de tipo sinusoidal se muestra en el estudio de caso de deflexión de haz. La gráfica espectral es la principal herramienta para el análisis de frecuencia de series temporales. Modelos autoregresivos (AR) Un modelo común para el modelado de series temporales univariadas es el modelo autorregresivo (AR): Xt delta phi1 X phi2 X cdots phip X En, donde (Xt) es la serie temporal, (At) es ruido blanco y delta Izquierda (1 - sum p phii derecha) mu. Con (mu) denotando la media del proceso. Un modelo autorregresivo es simplemente una regresión lineal del valor actual de la serie contra uno o más valores previos de la serie. El valor de (p) se denomina el orden del modelo AR. Los modelos AR pueden ser analizados con uno de varios métodos, incluyendo técnicas lineales lineales por mínimos cuadrados. También tienen una interpretación directa. Modelos de media móvil (MA) Otro enfoque común para el modelado de modelos de series de tiempo univariados es el modelo de media móvil (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, donde (Xt) es la serie temporal ) Es la media de la serie, (A) son términos de ruido blanco, y (theta1,, ldots,, thetaq) son los parámetros del modelo. El valor de (q) se llama el orden del modelo MA. Es decir, un modelo de media móvil es conceptualmente una regresión lineal del valor actual de la serie contra el ruido blanco o choques aleatorios de uno o más valores anteriores de la serie. Se supone que los choques aleatorios en cada punto provienen de la misma distribución, normalmente una distribución normal, con ubicación a cero y escala constante. La distinción en este modelo es que estos choques aleatorios se propagan a los valores futuros de las series temporales. El ajuste de las estimaciones de MA es más complicado que con los modelos de AR porque los términos de error no son observables. Esto significa que los procedimientos de ajuste no lineales iterativos deben ser usados ​​en lugar de mínimos cuadrados lineales. Los modelos MA también tienen una interpretación menos obvia que los modelos AR. A veces, el ACF y PACF sugieren que un modelo de MA sería una mejor elección de modelo y, a veces, ambos AR y MA términos se deben utilizar en el mismo modelo (véase la Sección 6.4.4.5). Tenga en cuenta, sin embargo, que los términos de error después de que el modelo sea apropiado deberían ser independientes y seguir las suposiciones estándar para un proceso univariante. Box y Jenkins popularizaron un enfoque que combina el promedio móvil y los enfoques autorregresivos en el libro Análisis de series temporales: previsión y control (Box, Jenkins y Reinsel, 1994). Aunque tanto los enfoques de media móvil como autoregresivos ya eran conocidos (y fueron investigados originalmente por Yule), la contribución de Box y Jenkins fue desarrollar una metodología sistemática para identificar y estimar modelos que pudieran incorporar ambos enfoques. Esto hace que los modelos de Box-Jenkins sean una clase poderosa de modelos. En los apartados anteriores hemos visto cómo el valor de una serie temporal univariada en el tiempo t. X t Puede ser modelado usando una variedad de expresiones del promedio móvil. También hemos demostrado que componentes tales como tendencias y periodicidad en las series temporales pueden ser modelados y / o separados explícitamente, con los datos descompuestos en componentes de tendencia, estacionales y residuales. También mostramos, en las discusiones anteriores sobre la autocorrelación. Que los coeficientes de autocorrelación total y parcial son extremadamente útiles para identificar y modelar patrones en series de tiempo. Estos dos aspectos del análisis y modelado de series temporales pueden combinarse en un marco general de modelación general ya menudo muy efectivo. En su forma básica, este enfoque se conoce como modelado ARMA (media móvil autorregresiva), o cuando la diferenciación se incluye en el procedimiento, el modelo ARIMA o Box-Jenkins, después de los dos autores que fueron centrales para su desarrollo (véase Box amp Jenkins, 1968 BOX1 y Box, Jenkins amp Reinsel, 1994 BOX2). No hay una regla fija en cuanto al número de períodos de tiempo requeridos para un ejercicio de modelado exitoso, pero para modelos más complejos y para mayor confianza en los procedimientos de ajuste y validación, a menudo se recomiendan series con 50 pasos de tiempo. Los modelos ARMA combinan los métodos de autocorrelación (AR) y los promedios móviles (MA) en un modelo compuesto de la serie temporal. Antes de considerar cómo estos modelos se pueden combinar, examinamos cada uno por separado. Ya hemos visto que los modelos de media móvil (MA) pueden utilizarse para proporcionar un buen ajuste a algunos conjuntos de datos, y las variaciones en estos modelos que implican el suavizado exponencial doble o triple pueden manejar componentes tendenciales y periódicos en los datos. Además, estos modelos se pueden utilizar para crear pronósticos que imitan el comportamiento de períodos anteriores. Una forma simple de tales modelos, basada en datos previos, puede escribirse como: Donde los términos beta i son los pesos aplicados a valores previos en la serie temporal, y es usual definir beta i 1, sin pérdida de generalidad. Por lo tanto, para un proceso de primer orden, q 1 y tenemos el modelo: es decir, el valor medio móvil se estima como un promedio ponderado de los valores actuales e inmediatos anteriores. Este proceso de promediación es, en cierto sentido, un mecanismo de suavizado pragmático sin un vínculo directo con un modelo estadístico. Sin embargo, podemos especificar un modelo estadístico (o estocástico) que abarque los procedimientos de los promedios móviles en conjunción con procesos aleatorios. Si dejamos ser un conjunto de variables aleatorias independientes e idénticamente distribuidas (un proceso aleatorio) con media cero y variación fija conocida, entonces podemos escribir el proceso como un promedio móvil de orden q en términos de: Claramente el valor esperado de xt bajo Este modelo es 0, por lo que el modelo sólo es válido si el xt ya ha sido ajustado para tener una media cero o si se agrega una constante fija (la media del xt) a la suma. También es evidente que la varianza de xt es simplemente: El análisis anterior puede extenderse para evaluar la covarianza cov (x t. Xtk), que encontramos rendimientos: Nótese que ni el valor medio, ni la covarianza (o autocovariancia) Al retraso k es una función del tiempo, t. Por lo que el proceso es de segundo orden estacionario. La expresión anterior nos permite obtener una expresión para la función de autocorrelación (acf): Si k 0 rho k 1, y para k gt q rho k 0. Además, el acf es simétrico y rho k rho - k. El acf se puede calcular para un proceso MA de primer orden: El componente autorregresivo o AR de un modelo ARMA se puede escribir en la forma: donde los términos en son coeficientes de autocorrelación en lags 1,2. P y z t es un término de error residual. Tenga en cuenta que este término de error se refiere específicamente al período de tiempo actual, t. Así, para un proceso de primer orden, p 1 y tenemos el modelo: Estas expresiones indican que el valor estimado de x en el tiempo t está determinado por el valor inmediatamente anterior de x (es decir, en el tiempo t -1) multiplicado por una medida, alfa . De la medida en que se correlacionan los valores de todos los pares de valores en períodos de tiempo con un intervalo 1 (es decir, su autocorrelación), más un término de error residual, z. En el tiempo t. Pero esta es precisamente la definición de un proceso de Markov. Por lo que un proceso de Markov es un proceso autorregresivo de primer orden. Si alfa 1 el modelo indica que el siguiente valor de x es simplemente el valor anterior más un término de error aleatorio, y por lo tanto es una simple caminata aleatoria 1D. Si se incluyen más términos, el modelo estima el valor de x en el tiempo t por una suma ponderada de estos términos más un componente de error aleatorio. Si sustituimos la segunda expresión anterior en la primera, tenemos: y la aplicación repetida de esta sustitución produce: Ahora bien, si alfa lt1 yk es grande, esta expresión puede escribirse en orden inverso, con términos decrecientes y con aportación del término En x en el lado derecho de la expresión se vuelve cada vez más pequeño, por lo que tenemos: Dado que el lado derecho de esta expresión xt modelos como la suma de un conjunto ponderado de valores anteriores, en este caso los términos de error aleatorio, es claro que Este modelo AR es, de hecho, una forma de modelo MA. Y si asumimos que los términos de error tienen media cero y varianza constante, entonces como en el modelo MA tenemos el valor esperado del modelo como también 0, asumiendo que el xt se ha ajustado para proporcionar una media cero, con varianza: Ahora como Por lo que tenemos: Como con el modelo de MA anterior, este análisis se puede extender para evaluar la covariación, cov (x t. X tk) de a (Α-1), por lo que tenemos: Esto demuestra que para un modelo autorregresivo de primer orden la función de autocorrelación (acf) es Simplemente definida por potencias sucesivas de la autocorrelación de primer orden, con la condición alfa lt1. Para alfa gt0 esto es simplemente una potencia que disminuye rápidamente o una curva de tipo exponencial, tendiendo a cero, o para lt0 es una curva oscilatoria amortiguadora, tendiendo de nuevo a cero. Si se supone que la serie temporal es estacionaria, el análisis anterior puede extenderse a autocorrelaciones de segundo orden y de orden superior. Con el fin de ajustar un modelo de AR a un conjunto de datos observados, tratamos de minimizar la suma de errores cuadrados (ajuste de mínimos cuadrados) utilizando el menor número de términos que proporcionan un ajuste satisfactorio a los datos. Los modelos de este tipo se describen como autorregresivos. Y puede aplicarse tanto a series de tiempo como a conjuntos de datos espaciales (véase más adelante, modelos de autorregresión espacial). Aunque en teoría un modelo autorregresivo puede proporcionar un buen ajuste a un conjunto de datos observados, que generalmente requieren la eliminación previa de la tendencia y los componentes periódicos, e incluso entonces podría necesitar un gran número de términos con el fin de proporcionar un buen ajuste a los datos. Sin embargo, al combinar los modelos AR con los modelos MA, podemos producir una familia de modelos mixtos que se pueden aplicar en una amplia gama de situaciones. Estos modelos se conocen como modelos ARMA y ARIMA, y se describen en las subsecciones siguientes. En las dos subsecciones anteriores hemos introducido el modo MA de orden q: y el modelo AR de orden p: Podemos combinar estos dos modelos simplemente añadiéndolos juntos como un modelo de orden (p, q), donde tenemos p AR términos Y q términos MA: En general, esta forma de modelo ARMA combinado se puede utilizar para modelar una serie de tiempo con menos términos en general que un MA o un modelo AR por sí mismos. Expresa el valor estimado en el tiempo t como la suma de q términos que representan la variación media de la variación aleatoria sobre q períodos anteriores (el componente MA), más la suma de p AR términos que calculan el valor actual de x como la suma ponderada De los p valores más recientes. Sin embargo, esta forma de modelo supone que la serie temporal es estacionaria, lo que rara vez es el caso. En la práctica, existen tendencias y periodicidad en muchos conjuntos de datos, por lo que es necesario eliminar estos efectos antes de aplicar dichos modelos. La retirada se lleva a cabo típicamente incluyendo en el modelo una etapa de diferenciación inicial, típicamente una, dos o tres veces, hasta que la serie es al menos aproximadamente estacionaria, sin mostrar tendencias obvias ni periodicidades. Al igual que con los procesos MA y AR, el proceso de diferenciación se describe por el orden de diferenciación, por ejemplo 1, 2, 3. En conjunto, estos tres elementos forman un triple: q define el tipo de modelo aplicado. En esta forma, el modelo se describe como un modelo ARIMA. La letra I de ARIMA se refiere al hecho de que el conjunto de datos se ha diferenciado inicialmente (ver diferenciación) y cuando el modelado está completo, los resultados tienen que ser sumados o integrados para producir las estimaciones y pronósticos finales. El modelo ARIMA se discute a continuación. Como se señala en la subsección anterior, la combinación de la diferenciación de una serie temporal no estacionaria con el modelo ARMA proporciona una poderosa familia de modelos que pueden aplicarse en una amplia gama de situaciones. El desarrollo de esta forma extendida de modelo se debe en gran parte a G E P Box y G M Jenkins, y como resultado los modelos ARIMA también se conocen como modelos Box-Jenkins. El primer paso en el procedimiento de Box-Jenkins es diferenciar la serie temporal hasta que esté estacionaria, asegurando así que los componentes de tendencia y estacionales sean eliminados. En muchos casos, una o dos etapas de diferenciación son suficientes. La serie diferenciada será más corta que la serie de origen por c intervalos de tiempo, donde c es el rango de la diferenciación. Un modelo ARMA se ajusta a las series de tiempo resultantes. Debido a que los modelos ARIMA tienen tres parámetros hay muchas variaciones a los posibles modelos que podrían ser instalados. Sin embargo, la decisión sobre cuáles deben ser estos parámetros puede guiarse por una serie de principios básicos: (i) el modelo debe ser lo más simple posible, es decir, contener tan pocos términos como sea posible, lo que significa los valores de p y q (Ii) el ajuste a los datos históricos debe ser lo más eficaz posible, es decir, el tamaño de las diferencias cuadradas entre el valor estimado en cualquier período de tiempo pasado y el valor real debe ser minimizado (principio de mínimos cuadrados) - los residuos Del modelo seleccionado puede examinarse a continuación para ver si cualquier residuo restante es significativamente diferente de 0 (véase más abajo) (iii) la autocorrelación parcial medida en los retardos 1,2,3. Debe proporcionar una indicación del orden del componente AR, es decir, el valor elegido para q (iv) el diagrama de la forma de la función de autocorrelación (acf) puede sugerir el tipo de modelo ARIMA requerido - la tabla a continuación (del NIST) proporciona orientación sobre Interpretando la forma del acf en términos de selección del modelo. ARIMA Selección del tipo de modelo con forma acf La serie no es estacionaria. Los modelos ARIMA estándar se describen a menudo por el triple: (p. Estos definen la estructura del modelo en términos del orden de AR, diferenciación y modelos de MA que se utilizarán. También es posible incluir parámetros similares para la estacionalidad en los datos, aunque estos modelos son más complejos para adaptarse e interpretar - el tripa (P. D.Q) se utiliza generalmente para identificar dichos componentes del modelo. En la captura de pantalla de SPSS que se muestra a continuación, se muestra el cuadro de diálogo para seleccionar manualmente elementos estructurales no estacionales y estacionales (instalaciones similares están disponibles en otros paquetes integrados, como SAS / ETS). Como se puede ver, el diálogo también permite transformar los datos (típicamente para ayudar con la estabilización de la varianza) y permitir a los usuarios incluir una constante en el modelo (el valor predeterminado). Esta herramienta de software particular permite detectar los valores atípicos si es necesario, de acuerdo con una gama de procedimientos de detección, pero en muchos casos los valores atípicos se han investigado y ajustado o eliminado y se han estimado los valores antes de cualquier análisis. Modelador de series temporales SPSS Modelado ARIMA, modo experto Se pueden ajustar varios modelos ARIMA a los datos, manualmente oa través de un proceso automatizado (por ejemplo, un proceso escalonado), y una o más medidas usadas para juzgar cuál es la mejor en términos de Ajuste y parsimony. La comparación de modelos utiliza típicamente una o más de las medidas teóricas de información descritas anteriormente en este manual: AIC, BIC y / o MDL (la función R, arima (), proporciona la medida AIC, mientras que SPSS proporciona una gama de medidas de ajuste, Incluyeron una versión de la estadística BIC otras herramientas varían en las medidas proporcionadas - Minitab, que proporciona una gama de métodos TSA, no incluye AIC / BIC tipo de estadísticas). En la práctica, puede utilizarse una amplia gama de medidas (es decir, además de las medidas basadas en los mínimos cuadrados, para evaluar la calidad del modelo). Por ejemplo, el error absoluto medio y el error absoluto máximo pueden ser medidas útiles, ya que incluso un Un buen ajuste de mínimos cuadrados puede ser todavía pobre en algunos lugares. Una serie de paquetes de software también puede proporcionar una medida general de la autocorrelación que puede permanecer en los residuos después de la adaptación del modelo. Una estadística con frecuencia se debe a Ljung y Box (1978 LJU1) , Y es de la forma: donde n es el número de muestras (valores de los datos), ri es la autocorrelación de la muestra con el retraso iy k es el número total de retrasos sobre los cuales se realiza el cálculo. Q k está distribuido aproximadamente como Una distribución de chi-cuadrado con k-m grados de libertad, donde m es el número de parámetros utilizados en el ajuste del modelo, excluyendo cualquier variable de predicción o término constante (es decir, incluyendo los triples pd q) Si la medida es estadísticamente significativa, Indica que los residuos siguen conteniendo una autocorrelación significativa después de que el modelo ha sido instalado, lo que sugiere que se debe buscar un modelo mejorado. Ejemplo: Modelar el crecimiento del número de pasajeros de aerolíneas A continuación se muestra un ejemplo de ajuste automático, utilizando SPSS para los datos de prueba de Box-Jenkins-Reinsel de los números de pasajeros REI1 proporcionados anteriormente en este Manual. Inicialmente no se especificó ninguna especificación de las fechas siendo meses dentro de años. El modelo seleccionado por el proceso automatizado fue un modelo ARIMA (0,1,12), es decir, el proceso identificó correctamente que la serie requería un nivel de diferenciación y aplicó un modelo de media móvil con una periodicidad de 12 y ningún componente de autocorrelación para ajustarse a la datos. El ajuste del modelo produjo un valor R 2 de 0.966, que es muy alto, y un error máximo absoluto (MAE) de 75. El ajuste visual del modelo a los datos parece excelente, pero el gráfico de la autocorrelación residual después de la adaptación y Ljung La prueba de la caja demuestra que la autocorrelación significativa permanece, indicando que un modelo mejorado es posible. A continuación, se revisó un modelo revisado basado en la discusión de este conjunto de datos por Box y Jenkins (1968) y la edición actualizada de Chatfields (1975 CHA1) book in Que él utiliza Minitab para ilustrar su análisis (6ta edición, 2003). La serie temporal se definió como una periodicidad de 12 meses y un modelo ARIMA con componentes (0,1,1), (0,1,1). Gráficamente, los resultados parecen muy similares al gráfico anterior, pero con este modelo el R-cuadrado es 0,991, el MAE41 y el estadístico de Ljung-Box ya no son significativos (12,6, con 16 grados de libertad). El modelo es, por lo tanto, una mejora respecto a la versión original (generada automáticamente), que comprende una MA no estacional y un componente MA estacional, ningún componente autorregresivo y un nivel de diferenciación para las estructuras estacionales y no estacionales. Ya sea que el ajuste sea manual o automatizado, un modelo ARIMA puede proporcionar un buen marco para modelar una serie temporal, o puede ser que modelos o enfoques alternativos ofrezcan un resultado más satisfactorio. A menudo es difícil saber de antemano cuán bueno es probable que sea cualquier modelo de pronóstico dado, ya que es sólo a la luz de su capacidad de predecir valores futuros de las series de datos que puede ser verdaderamente juzgado. A menudo, este proceso se aproxima ajustando el modelo a datos pasados ​​excluyendo períodos de tiempo recientes (también conocidos como muestras de retención), y luego usando el modelo para predecir estos eventos futuros conocidos, pero incluso esto sólo ofrece una confianza limitada en su validez futura. Los pronósticos a más largo plazo pueden ser extremadamente poco fiables usando tales métodos. Es evidente que el modelo de estadísticas de tráfico aéreo internacional descrito anteriormente no es capaz de predecir correctamente el número de pasajeros hasta la década de los noventa y más allá, ni la caída de 5 años en el número de pasajeros de las aerolíneas internacionales estadounidenses después del 9/11/2001. Del mismo modo, un modelo ARIMA puede ajustarse a los valores históricos de los precios de la bolsa o valores de índices (por ejemplo, los índices NYSE o FTSE) y normalmente proporcionará un ajuste excelente a los datos (obteniendo un valor R cuadrado mejor que 0,99) pero son A menudo de poca utilidad para predecir los valores futuros de estos precios o índices. Por lo general, los modelos ARIMA se utilizan para la predicción, en particular en el campo de la modelización macro y microeconómica. Sin embargo, pueden aplicarse en una amplia gama de disciplinas, ya sea en la forma descrita aquí, o aumentada con variables predictoras adicionales que se cree que mejoran la fiabilidad de las previsiones realizadas. Estos últimos son importantes porque toda la estructura de los modelos ARMA discutidos anteriormente depende de los valores anteriores y eventos aleatorios independientes a lo largo del tiempo, no en cualquier factor explicativo o causativo. Por lo tanto, los modelos ARIMA solo reflejarán y extenderán patrones pasados, los cuales podrían necesitar ser modificados en pronósticos por factores como el ambiente macroeconómico, los cambios tecnológicos o los cambios a largo plazo en los recursos y / o el medio ambiente. BOX1 Caja G E P, Jenkins G M (1968). Algunos avances recientes en la predicción y el control. Estadística Aplicada, 17 (2), 91-109 BOX2 Box, G E P, Jenkins, G M, Reinsel G C (1994) Análisis, predicción y control de series temporales. 3ª ed. Prentice Hall, acantilados de Englewood, NJ CHA1 Chatfield C (1975) El análisis de la serie de los tiempos: Teoría y práctica. Chapman y Hall, Londres (véase también, sexta edición, 2003) LJU1 Ljung G M, Box G E P (1978) Sobre una medida de la falta de ajuste en modelos de series temporales. Biometrika, 65, 297303 NIST / SEMATECH Manual electrónico de métodos estadísticos, itl. nist. gov/div898/handbook/ Sección 6.4: Introducción a series temporales. 2010 SPSS / PASW 17 (2008) AnalyseForecasting (modelos de series temporales) REI1 Reinsel G C Conjuntos de datos para modelos de Box-Jenkins: stat. wisc. edu/

No comments:

Post a Comment