Friday, November 18, 2016

Exponential Smoothing Over Moving Averages

Datos de mercado Preguntas Exponencial Versus Promedios Móviles Simples Hola Tom - Soy un suscriptor tuyo y me preguntaba si tenías un gráfico ldquoconversionrdquo para convertir el valor de tendencia en MAs exponenciales de periodo. Por ejemplo, 10 Trend es aproximadamente igual a un EMA de 19 periodos, 1 Tendencia a 200EMA etc. Gracias por adelantado. La fórmula para convertir una constante de suavización del promedio móvil exponencial (EMA) a un número de días es: 2 mdashmdashmdash-N1 donde N es el número de días. Por lo tanto, un EMA de 19 días encajaría en la fórmula de la siguiente manera: 2 2 mdashmdashmdashmdash-mdashmdashmdash - 0.10 o 10 19 1 20 Esto se deriva de la idea de que la constante de suavizado se elige para dar la misma edad media de los datos Como se haría en una media móvil simple. Si tuviera un promedio móvil simple de 20 periodos, entonces la edad promedio de cada entrada de datos es de 9.5. Uno podría pensar que la edad promedio debe ser 10, ya que es la mitad de 20, o 10.5, ya que es el promedio de los números de 1 a 20. Pero en la convención estadística, la edad de la pieza más reciente de los datos es 0. Así que Encontrar la edad promedio de los últimos veinte puntos de datos se hace mediante la búsqueda de la media de esta serie: Por lo tanto, la edad promedio de los datos en un conjunto de N períodos es: N - 1 mdashmdashmdashmdash - 2 Para el suavizado exponencial, con una constante de suavizado de A , Resulta de la matemática de la teoría de la suma que la edad media de los datos es: 1 - A mdashmdashmdashmdash - A Combinando estas dos ecuaciones: 1 - AN - 1 mdashmdashmdash mdashmdashmdashmdash A 2 podemos resolver para un valor de A que iguala un EMA a una longitud media móvil simple como: 2 A mdashmdashmdashmdash - N 1 Puede leer una de las piezas originales escritas sobre este concepto en McClellanMTAaward. pdf. Allí, extracto de P. N. Haurlanrsquos folleto, ldquoMeasuring Trend Valuesrdquo. Haurlan fue una de las primeras personas en utilizar promedios móviles exponenciales para rastrear los precios de las acciones en la década de 1960, y aún preferimos su terminología original de una Tendencia XX, en lugar de llamar un promedio móvil exponencial por un número de días. Una razón importante para esto es que con un promedio móvil simple (SMA), sólo está mirando hacia atrás un cierto número de días. Cualquier cosa más antigua que ese período de reflexión no factor en el cálculo. Pero con un EMA, los datos antiguos nunca desaparece sólo se hace cada vez menos importante para el valor de la media móvil. Para entender por qué los técnicos se preocupan por los EMAs en comparación con los SMA, un rápido vistazo a este gráfico proporciona algunos ejemplos de la diferencia. Durante las tendencias se mueve hacia arriba o hacia abajo, una Tendencia 10 y una SMA de 19 días en gran parte en conjunto. Es durante los períodos en que los precios son agitados, o cuando la dirección de la tendencia está cambiando, que vemos que los dos comienzan a separarse. En estos casos, la Tendencia suele abrazar más estrechamente la acción de los precios, y así estar en mejor posición para señalar un cambio cuando el precio lo cruza. Para muchas personas, esta propiedad hace EMAs ldquobetterrdquo que SMAs, pero ldquobetterrdquo está en el ojo del espectador. La razón por la que los ingenieros han utilizado EMAs durante años, especialmente en electrónica, es que son más fáciles de calcular. Para determinar todayrsquos nuevo valor de EMA, sólo necesita el valor de EMA de yesterdayrsquos, la constante de suavizado y el nuevo precio de cierre de todayrsquos (u otro dato). Pero para calcular un SMA, usted tiene que saber cada valor detrás en el tiempo para el período de lookback entero. Media móvil exponencial - EMA Cargando el jugador. Los EMA de 12 y 26 días son los promedios a corto plazo más populares, y se utilizan para crear indicadores como la divergencia de convergencia de la media móvil (MACD) y el oscilador de precios porcentuales (PPO). En general, los EMA de 50 y 200 días se utilizan como señales de tendencias a largo plazo. Los comerciantes que emplean el análisis técnico encuentran que las medias móviles son muy útiles y perspicaces cuando se aplican correctamente, pero crean estragos cuando se usan incorrectamente o se malinterpretan. Todos los promedios móviles utilizados comúnmente en el análisis técnico son, por su propia naturaleza, indicadores rezagados. En consecuencia, las conclusiones derivadas de la aplicación de una media móvil a un gráfico de mercado en particular debe ser para confirmar un movimiento del mercado o para indicar su fortaleza. Muy a menudo, en el momento en que una línea de indicador de media móvil ha hecho un cambio para reflejar un movimiento significativo en el mercado, el punto óptimo de entrada al mercado ya ha pasado. Un EMA sirve para aliviar este dilema en cierta medida. Debido a que el cálculo EMA pone más peso en los datos más recientes, abraza la acción del precio un poco más estricta y por lo tanto reacciona más rápido. Esto es deseable cuando se usa un EMA para derivar una señal de entrada de negociación. Interpretación de la EMA Al igual que todos los indicadores de media móvil, son mucho más adecuados para los mercados de tendencias. Cuando el mercado está en una fuerte y sostenida tendencia alcista. La línea de indicadores EMA también mostrará una tendencia alcista y viceversa para una tendencia descendente. Un comerciante vigilante no sólo prestará atención a la dirección de la línea EMA, sino también la relación de la tasa de cambio de una barra a la siguiente. Por ejemplo, a medida que la acción del precio de una fuerte tendencia alcista comienza a aplastarse y retroceder, la tasa de cambio de una barra a la siguiente empezará a disminuir hasta que la línea del indicador se aplaste y la tasa de cambio sea cero. Debido al efecto de retraso, en este punto, o incluso algunas barras antes, la acción del precio debería ya haber invertido. Por lo tanto, se sigue que la observación de una disminución consistente en la tasa de cambio de la EMA podría utilizarse como un indicador que podría contrarrestar el dilema causado por el efecto retardado de las medias móviles. Usos comunes de la EMA Los EMAs se usan comúnmente junto con otros indicadores para confirmar movimientos significativos del mercado y para calibrar su validez. Para los comerciantes que comercian los mercados intradía y de rápido movimiento, la EMA es más aplicable. Muy a menudo los comerciantes utilizan EMAs para determinar un sesgo de negociación. Por ejemplo, si un EMA en un gráfico diario muestra una fuerte tendencia al alza, una estrategia de comerciantes intradía puede ser el comercio sólo desde el lado largo en un gráfico intraday. Smoothing datos elimina la variación aleatoria y muestra las tendencias y los componentes cíclicos Inherente a la colección de Los datos tomados en el tiempo son alguna forma de variación aleatoria. Existen métodos para reducir la cancelación del efecto debido a la variación aleatoria. Una técnica frecuentemente utilizada en la industria es suavizar. Esta técnica, cuando se aplica correctamente, revela más claramente la tendencia subyacente, los componentes estacionales y cíclicos. Existen dos grupos distintos de métodos de suavizado Métodos de promedio Métodos exponenciales de suavizado Tomar promedios es la forma más sencilla de suavizar los datos Primero investigaremos algunos métodos de promediación, como el promedio simple de todos los datos anteriores. Un gerente de un almacén quiere saber cuánto un proveedor típico ofrece en unidades de 1000 dólares. Se toma una muestra de 12 proveedores, al azar, obteniendo los siguientes resultados: La media o media calculada de los datos 10. El gestor decide usar esto como la estimación para el gasto de un proveedor típico. Es esto una buena o mala estimación? El error cuadrático medio es una forma de juzgar qué tan bueno es un modelo Vamos a calcular el error cuadrático medio. La cantidad verdadera del error gastada menos la cantidad estimada. El error al cuadrado es el error anterior, al cuadrado. El SSE es la suma de los errores al cuadrado. El MSE es la media de los errores al cuadrado. Resultados de MSE por ejemplo Los resultados son: Errores y errores cuadrados La estimación 10 La pregunta surge: podemos usar la media para pronosticar ingresos si sospechamos una tendencia? Un vistazo a la gráfica abajo muestra claramente que no debemos hacer esto. El promedio pesa todas las observaciones pasadas igualmente En resumen, declaramos que El promedio simple o la media de todas las observaciones pasadas es sólo una estimación útil para pronosticar cuando no hay tendencias. Si hay tendencias, utilice estimaciones diferentes que tengan en cuenta la tendencia. El promedio pesa todas las observaciones pasadas igualmente. Por ejemplo, el promedio de los valores 3, 4, 5 es 4. Sabemos, por supuesto, que un promedio se calcula sumando todos los valores y dividiendo la suma por el número de valores. Otra forma de calcular el promedio es añadiendo cada valor dividido por el número de valores, o 3/3 4/3 5/3 1 1.3333 1.6667 4. El multiplicador 1/3 se llama el peso. En general: barra frac fracción izquierda (frac derecha) x1 izquierda (frac derecha) x2,. ,, Izquierda (frac derecha) xn. La (izquierda (frac derecha)) son los pesos y, por supuesto, se suman a la aplicación 1.Separsheet de ajuste estacional y suavizado exponencial Es sencillo realizar el ajuste estacional y ajustar modelos de suavizado exponencial utilizando Excel. Las imágenes y gráficos de pantalla que se muestran a continuación se toman de una hoja de cálculo que se ha configurado para ilustrar el ajuste estacional multiplicativo y el suavizado lineal exponencial en los siguientes datos de ventas trimestrales de Outboard Marine: Para obtener una copia del archivo de la hoja de cálculo, haga clic aquí. La versión de suavizado exponencial lineal que se utilizará aquí para propósitos de demostración es la versión de Brown8217s, simplemente porque puede implementarse con una sola columna de fórmulas y sólo hay una constante de suavizado para optimizar. Por lo general, es mejor usar la versión de Holt8217s que tiene constantes de suavizado separadas para nivel y tendencia. El proceso de pronóstico se desarrolla de la siguiente manera: (i) en primer lugar los datos se ajustan estacionalmente (ii) luego se generan pronósticos para los datos desestacionalizados a través de la suavización exponencial lineal y (iii) finalmente los pronósticos desestacionalizados son quotorasonalizados para obtener pronósticos para la serie original . El proceso de ajuste estacional se lleva a cabo en las columnas D a G. El primer paso en el ajuste estacional es calcular una media móvil centrada (realizada aquí en la columna D). Esto puede hacerse tomando el promedio de dos promedios de un año que son compensados ​​por un período entre sí. (Se necesita una combinación de dos promedios de compensación en lugar de un solo promedio para fines de centrado cuando el número de estaciones es par.) El siguiente paso es calcular la relación con el promedio móvil - ie. Los datos originales divididos por la media móvil en cada período - que se realiza aquí en la columna E. (Esto también se llama el componente quottrend-cyclequot del patrón, en la medida en que los efectos de tendencia y de ciclo de negocio podrían ser considerados como todo lo que Por supuesto, los cambios mensuales que no son debidos a la estacionalidad podrían ser determinados por muchos otros factores, pero el promedio de 12 meses suaviza sobre ellos en gran medida. El índice estacional estimado para cada estación se calcula primero haciendo un promedio de todas las razones para esa estación particular, que se hace en las células G3-G6 usando una fórmula de AVERAGEIF. Las relaciones medias se vuelven a escalar de modo que suman exactamente 100 veces el número de períodos en una estación, o 400 en este caso, lo que se hace en las células H3-H6. En la columna F, las fórmulas VLOOKUP se usan para insertar el valor de índice estacional apropiado en cada fila de la tabla de datos, de acuerdo con el trimestre del año que representa. La media móvil centrada y los datos desestacionalizados terminan pareciendo esto: Obsérvese que la media móvil típicamente se parece a una versión más suave de la serie con ajuste estacional, y es más corta en ambos extremos. Otra hoja de trabajo en el mismo archivo de Excel muestra la aplicación del modelo de suavizado exponencial lineal a los datos desestacionalizados, empezando en la columna G. Un valor para la constante de suavizado (alfa) se introduce por encima de la columna de pronóstico (aquí en la celda H9) y Por comodidad se le asigna el nombre de rango quotAlpha. quot (El nombre se asigna mediante el comando quotInsert / Name / Createquot). El modelo LES se inicializa estableciendo los dos primeros pronósticos igual al primer valor real de la serie ajustada estacionalmente. La fórmula utilizada aquí para la previsión de LES es la forma recursiva de una sola ecuación del modelo Brown8217s: Esta fórmula se introduce en la celda correspondiente al tercer período (aquí, célula H15) y se copia desde allí. Obsérvese que la previsión de LES para el período actual se refiere a las dos observaciones precedentes ya los dos errores de pronóstico precedentes, así como al valor de alfa. Por lo tanto, la fórmula de pronóstico en la fila 15 se refiere sólo a los datos que estaban disponibles en la fila 14 y anteriores. (Por supuesto, si deseamos usar el suavizado exponencial lineal simple en vez de lineal, podríamos sustituir la fórmula SES aquí en lugar. También podríamos usar Holt8217s en lugar de Brown8217s modelo LES, lo que requeriría dos columnas más de fórmulas para calcular el nivel y la tendencia Que se utilizan en la previsión). Los errores se calculan en la siguiente columna (aquí, columna J) restando las previsiones de los valores reales. El error cuadrático medio raíz se calcula como la raíz cuadrada de la varianza de los errores más el cuadrado de la media. En el cálculo de la media y la varianza de los errores en esta fórmula, se excluyen los dos primeros períodos porque el modelo no comienza realmente a pronosticar hasta el momento en que se calcula la media y la varianza de los errores en esta fórmula. El tercer período (fila 15 en la hoja de cálculo). El valor óptimo de alpha se puede encontrar cambiando manualmente alfa hasta que se encuentre el RMSE mínimo, o bien puede usar el quotSolverquot para realizar una minimización exacta. El valor de alfa que encontró el Solver se muestra aquí (alpha0.471). Por lo general, es una buena idea trazar los errores del modelo (en unidades transformadas) y también calcular y trazar sus autocorrelaciones a retrasos de hasta una temporada. Las correlaciones de error se calculan usando la función CORREL () para calcular las correlaciones de los errores con ellos mismos rezagados por uno o más períodos - los detalles se muestran en el modelo de hoja de cálculo . Aquí hay una gráfica de las autocorrelaciones de los errores en los primeros cinco retrasos: Las autocorrelaciones en los retornos 1 a 3 son muy cercanas a cero, pero el pico con retraso 4 (cuyo valor es 0,35) es ligeramente problemático. El proceso de ajuste estacional no ha sido completamente exitoso. Sin embargo, en realidad sólo es marginalmente significativo. 95 para determinar si las autocorrelaciones son significativamente diferentes de cero son más o menos 2 / SQRT (n-k), donde n es el tamaño de la muestra yk es el retraso. Aquí n es 38 y k varía de 1 a 5, por lo que la raíz cuadrada de - n-menos-k es de alrededor de 6 para todos ellos, y por lo tanto los límites para probar la significación estadística de las desviaciones de cero son más o menos - O-menos 2/6, o 0,33. Si se modifica el valor de alfa manualmente en este modelo de Excel, se puede observar el efecto sobre la serie temporal y las gráficas de autocorrelación de los errores, así como sobre el error de cuadrícula media raíz, que se ilustrará a continuación. En la parte inferior de la hoja de cálculo, la fórmula de pronóstico se quotbootrapeado en el futuro mediante la simple sustitución de los pronósticos de los valores reales en el punto en que se agotan los datos reales, es decir, Donde comienza el futuro. (En otras palabras, en cada celda donde se produzca un valor de datos futuro, se inserta una referencia de celda que apunta a la previsión hecha para ese período). Todas las otras fórmulas se copian simplemente desde arriba: Obsérvese que los errores para pronósticos de El futuro se calcula que es cero. Esto no significa que los errores reales sean cero, sino que simplemente refleja el hecho de que para propósitos de predicción estamos asumiendo que los datos futuros serán iguales a los pronósticos en promedio. Las previsiones de LES para los datos desestacionalizados se ven así: Con este valor particular de alfa, que es óptimo para predicciones de un período de anticipación, la tendencia proyectada es levemente ascendente, reflejando la tendencia local que se observó en los últimos 2 años más o menos. Para otros valores de alfa, se podría obtener una proyección de tendencia muy diferente. Por lo general, es una buena idea ver qué sucede con la proyección de tendencia a largo plazo cuando el alfa es variado, porque el valor que es mejor para pronósticos a corto plazo no será necesariamente el mejor valor para predecir el futuro más lejano. Por ejemplo, aquí está el resultado que se obtiene si el valor de alpha se establece manualmente en 0.25: La tendencia a largo plazo proyectada es ahora negativa en lugar de positiva Con un valor menor de alfa, el modelo está poniendo más peso en datos antiguos en Su estimación del nivel y tendencia actual y sus previsiones a largo plazo reflejan la tendencia a la baja observada en los últimos 5 años en lugar de la tendencia al alza más reciente. Este gráfico también ilustra claramente cómo el modelo con un valor menor de alpha es más lento para responder a los puntos de quotturning en los datos y por lo tanto tiende a hacer un error del mismo signo para muchos períodos en una fila. Sus errores de pronóstico de 1 paso son mayores en promedio que los obtenidos antes (RMSE de 34,4 en lugar de 27,4) y fuertemente positivamente autocorrelacionados. La autocorrelación lag-1 de 0,56 excede en gran medida el valor de 0,33 calculado anteriormente para una desviación estadísticamente significativa de cero. Como alternativa a la disminución del valor de alfa para introducir un mayor conservadurismo en los pronósticos a largo plazo, a veces se añade al modelo un factor quottrend de amortiguación para hacer que la tendencia proyectada se aplaste después de unos pocos períodos. El paso final en la construcción del modelo de predicción es el de la obtención de la razón de los pronósticos de LES, multiplicándolos por los índices estacionales apropiados. Por lo tanto, las previsiones reseasonalized en la columna I son simplemente el producto de los índices estacionales en la columna F y las previsiones desestacionalizadas de LES en la columna H. Es relativamente fácil calcular intervalos de confianza para los pronósticos de un paso adelante realizados por este modelo: primero Calcular el RMSE (error cuadrático-medio cuadrático, que es sólo la raíz cuadrada del MSE) y luego calcular un intervalo de confianza para el pronóstico ajustado estacionalmente sumando y restando dos veces el RMSE. (En general, un intervalo de confianza de 95 para un pronóstico de un período por delante es aproximadamente igual al punto de previsión más o menos dos veces la desviación estándar estimada de los errores de pronóstico, suponiendo que la distribución del error es aproximadamente normal y el tamaño de la muestra Es lo suficientemente grande, por ejemplo, 20 o más. En este caso, el RMSE en lugar de la desviación estándar de la muestra de los errores es la mejor estimación de la desviación estándar de futuros errores de pronóstico, ya que toma el sesgo, así como las variaciones aleatorias en cuenta. Para el pronóstico estacionalmente ajustado son entonces reseasonalized. Junto con el pronóstico, multiplicándolos por los índices estacionales apropiados. En este caso el RMSE es igual a 27.4 y la previsión desestacionalizada para el primer período futuro (Dec-93) es 273.2. Por lo que el intervalo de confianza estacionalmente ajustado es de 273.2-227.4 218.4 a 273.2227.4 328.0. Multiplicando estos límites por Decembers índice estacional de 68,61. Obtenemos límites de confianza inferiores y superiores de 149,8 y 225,0 en torno al pronóstico del punto Dec-93 de 187,4. Los límites de confianza para los pronósticos más de un período por delante se ampliarán generalmente a medida que aumenta el horizonte de pronóstico, debido a la incertidumbre sobre el nivel y la tendencia, así como los factores estacionales, pero es difícil calcularlos en general por métodos analíticos. (La forma apropiada de calcular los límites de confianza para la previsión de LES es utilizando la teoría ARIMA, pero la incertidumbre en los índices estacionales es otra cuestión.) Si desea un intervalo de confianza realista para un pronóstico de más de un período, tomando todas las fuentes de Su mejor opción es utilizar métodos empíricos: por ejemplo, para obtener un intervalo de confianza para un pronóstico de dos pasos adelante, podría crear otra columna en la hoja de cálculo para calcular un pronóstico de dos pasos adelante para cada período ( Iniciando el pronóstico de un paso adelante). A continuación, calcular el RMSE de los errores de pronóstico de 2 pasos adelante y utilizar esto como base para un intervalo de confianza de 2 pasos adelante. Moving media y modelos de suavizado exponencial Como un primer paso para ir más allá de los modelos de media, aleatoria y Modelos de tendencias lineales, patrones no estacionales y tendencias pueden extrapolarse usando un modelo de media móvil o de suavizado. La suposición básica detrás de los modelos de promedio y suavizado es que la serie temporal es localmente estacionaria con una media que varía lentamente. Por lo tanto, tomamos un promedio móvil (local) para estimar el valor actual de la media y luego usarlo como pronóstico para el futuro cercano. Esto puede considerarse como un compromiso entre el modelo medio y el modelo aleatorio-paseo-sin-deriva. La misma estrategia se puede utilizar para estimar y extrapolar una tendencia local. Una media móvil se denomina a menudo una versión quotomoldeada de la serie original porque el promedio de corto plazo tiene el efecto de suavizar los golpes en la serie original. Al ajustar el grado de suavizado (el ancho de la media móvil), podemos esperar encontrar algún tipo de equilibrio óptimo entre el rendimiento de la media y los modelos de caminata aleatoria. El tipo más simple de modelo de promediación es el. Promedio móvil simple (igualmente ponderado): El pronóstico para el valor de Y en el tiempo t1 que se hace en el tiempo t es igual al promedio simple de las observaciones m más recientes: (Aquí y en otros lugares usaré el símbolo 8220Y-hat8221 para permanecer en pie Para un pronóstico de la serie de tiempo Y hecho a la fecha más temprana posible posible por un modelo dado). Este promedio se centra en el período t (m1) / 2, lo que implica que la estimación de la media local tiende a quedar rezagada detrás del Valor real de la media local de aproximadamente (m1) / 2 periodos. Por lo tanto, decimos que la edad media de los datos en el promedio móvil simple es (m1) / 2 en relación con el período para el cual se calcula el pronóstico: ésta es la cantidad de tiempo por el cual los pronósticos tienden a quedar rezagados datos. Por ejemplo, si está promediando los últimos 5 valores, las previsiones serán de aproximadamente 3 períodos tarde en la respuesta a los puntos de inflexión. Tenga en cuenta que si m1, el modelo de media móvil simple (SMA) es equivalente al modelo de caminata aleatoria (sin crecimiento). Si m es muy grande (comparable a la longitud del período de estimación), el modelo SMA es equivalente al modelo medio. Como con cualquier parámetro de un modelo de pronóstico, es habitual ajustar el valor de k para obtener el mejor valor de los datos, es decir, los errores de predicción más pequeños en promedio. He aquí un ejemplo de una serie que parece presentar fluctuaciones aleatorias alrededor de una media de variación lenta. En primer lugar, vamos a tratar de encajar con un modelo de caminata al azar, que es equivalente a una media móvil simple de un término: El modelo de caminata aleatoria responde muy rápidamente a los cambios en la serie, pero al hacerlo, recoge gran parte del quotnoisequot en el Los datos (las fluctuaciones aleatorias), así como el quotsignalquot (la media local). Si en lugar de eso intentamos una media móvil simple de 5 términos, obtendremos un conjunto de previsiones más suaves: El promedio móvil simple a 5 terminos produce errores significativamente menores que el modelo de caminata aleatoria en este caso. La edad promedio de los datos de esta previsión es de 3 ((51) / 2), de modo que tiende a quedar a la zaga de los puntos de inflexión en aproximadamente tres períodos. (Por ejemplo, parece haber ocurrido una recesión en el período 21, pero las previsiones no giran hasta varios periodos más tarde). Obsérvese que los pronósticos a largo plazo del modelo SMA son una línea recta horizontal, al igual que en la caminata aleatoria modelo. Por lo tanto, el modelo SMA asume que no hay tendencia en los datos. Sin embargo, mientras que las previsiones del modelo de caminata aleatoria son simplemente iguales al último valor observado, las previsiones del modelo SMA son iguales a un promedio ponderado de valores recientes. Los límites de confianza calculados por Statgraphics para los pronósticos a largo plazo de la media móvil simple no se amplían a medida que aumenta el horizonte de pronóstico. Esto obviamente no es correcto Desafortunadamente, no hay una teoría estadística subyacente que nos diga cómo los intervalos de confianza deberían ampliarse para este modelo. Sin embargo, no es demasiado difícil calcular estimaciones empíricas de los límites de confianza para las previsiones a más largo plazo. Por ejemplo, podría configurar una hoja de cálculo en la que el modelo SMA se utilizaría para pronosticar dos pasos adelante, tres pasos adelante, etc. dentro de la muestra de datos históricos. A continuación, podría calcular las desviaciones estándar de los errores en cada horizonte de pronóstico y, a continuación, construir intervalos de confianza para pronósticos a más largo plazo sumando y restando múltiplos de la desviación estándar apropiada. Si intentamos una media móvil sencilla de 9 términos, obtendremos pronósticos aún más suaves y más de un efecto rezagado: La edad promedio es ahora de 5 períodos ((91) / 2). Si tomamos una media móvil de 19 términos, la edad promedio aumenta a 10: Obsérvese que, de hecho, las previsiones están ahora rezagadas detrás de los puntos de inflexión en aproximadamente 10 períodos. Qué cantidad de suavizado es la mejor para esta serie Aquí hay una tabla que compara sus estadísticas de error, incluyendo también un promedio de 3 términos: El modelo C, la media móvil de 5 términos, produce el valor más bajo de RMSE por un pequeño margen sobre los 3 A término y 9 promedios, y sus otras estadísticas son casi idénticas. Por lo tanto, entre los modelos con estadísticas de error muy similares, podemos elegir si preferiríamos un poco más de capacidad de respuesta o un poco más de suavidad en las previsiones. El modelo de media móvil simple descrito anteriormente tiene la propiedad indeseable de que trata las últimas k observaciones por igual e ignora por completo todas las observaciones precedentes. Intuitivamente, los datos pasados ​​deben ser descontados de una manera más gradual - por ejemplo, la observación más reciente debería tener un poco más de peso que la segunda más reciente, y la segunda más reciente debería tener un poco más de peso que la tercera más reciente, y pronto. El modelo de suavizado exponencial simple (SES) lo logra. Sea 945 una constante quotsmoothingquot (un número entre 0 y 1). Una forma de escribir el modelo es definir una serie L que represente el nivel actual (es decir, el valor medio local) de la serie, tal como se estimó a partir de los datos hasta el presente. El valor de L en el tiempo t se calcula recursivamente a partir de su propio valor anterior como este: Así, el valor suavizado actual es una interpolación entre el valor suavizado anterior y la observación actual, donde 945 controla la proximidad del valor interpolado al valor más reciente observación. El pronóstico para el siguiente período es simplemente el valor suavizado actual: Equivalentemente, podemos expresar el próximo pronóstico directamente en términos de previsiones anteriores y observaciones previas, en cualquiera de las siguientes versiones equivalentes. En la primera versión, la previsión es una interpolación entre la previsión anterior y la observación anterior: En la segunda versión, la siguiente previsión se obtiene ajustando la previsión anterior en la dirección del error anterior por una cantidad fraccionada de 945. es el error hecho en Tiempo t En la tercera versión, el pronóstico es una media móvil exponencialmente ponderada (es decir, descontada) con el factor de descuento 1-945: La versión de interpolación de la fórmula de pronóstico es la más simple de usar si está implementando el modelo en una hoja de cálculo: se ajusta en un Célula única y contiene referencias de celdas que apuntan al pronóstico anterior, la observación anterior y la celda donde se almacena el valor de 945. Tenga en cuenta que si 945 1, el modelo SES es equivalente a un modelo de caminata aleatoria (sin crecimiento). Si 945 0, el modelo SES es equivalente al modelo medio, asumiendo que el primer valor suavizado se establece igual a la media. La edad promedio de los datos en el pronóstico de suavización exponencial simple es de 1/945 en relación con el período para el cual se calcula la predicción. (Esto no se supone que sea obvio, pero se puede demostrar fácilmente mediante la evaluación de una serie infinita.) Por lo tanto, el pronóstico promedio móvil simple tiende a quedar rezagado detrás de puntos de inflexión en aproximadamente 1/945 períodos. Por ejemplo, cuando 945 0.5 el retraso es 2 períodos cuando 945 0.2 el retraso es 5 períodos cuando 945 0.1 el retraso es 10 períodos, y así sucesivamente. Para una edad promedio dada (es decir, la cantidad de retraso), el simple suavizado exponencial (SES) pronosticado es algo superior a la predicción del promedio móvil simple (SMA) porque coloca relativamente más peso en la observación más reciente - ie. Es un poco más sensible a los cambios ocurridos en el pasado reciente. Por ejemplo, un modelo SMA con 9 términos y un modelo SES con 945 0.2 tienen una edad promedio de 5 para los datos de sus pronósticos, pero el modelo SES pone más peso en los 3 últimos valores que el modelo SMA y en el modelo SMA. Otra ventaja importante del modelo SES sobre el modelo SMA es que el modelo SES utiliza un parámetro de suavizado que es continuamente variable, por lo que se puede optimizar fácilmente Utilizando un algoritmo quotsolverquot para minimizar el error cuadrático medio. El valor óptimo de 945 en el modelo SES de esta serie resulta ser 0.2961, como se muestra aquí: La edad promedio de los datos de esta previsión es de 1 / 0,2961 3,4 períodos, que es similar a la de un movimiento simple de 6 términos promedio. Los pronósticos a largo plazo del modelo SES son una línea recta horizontal. Como en el modelo SMA y el modelo de caminata aleatoria sin crecimiento. Sin embargo, tenga en cuenta que los intervalos de confianza calculados por Statgraphics ahora divergen de manera razonable y que son sustancialmente más estrechos que los intervalos de confianza para el modelo de caminata aleatoria. El modelo SES asume que la serie es algo más predecible que el modelo de caminata aleatoria. Un modelo SES es en realidad un caso especial de un modelo ARIMA. Por lo que la teoría estadística de los modelos ARIMA proporciona una base sólida para el cálculo de los intervalos de confianza para el modelo SES. En particular, un modelo SES es un modelo ARIMA con una diferencia no estacional, un término MA (1) y ningún término constante. Conocido también como modelo quotARIMA (0,1,1) sin constantequot. El coeficiente MA (1) en el modelo ARIMA corresponde a la cantidad 1-945 en el modelo SES. Por ejemplo, si se ajusta un modelo ARIMA (0,1,1) sin constante a las series analizadas aquí, el coeficiente MA estimado (1) resulta ser 0.7029, que es casi exactamente uno menos 0.2961. Es posible añadir la suposición de una tendencia lineal constante no nula a un modelo SES. Para ello, basta con especificar un modelo ARIMA con una diferencia no estacional y un término MA (1) con una constante, es decir, un modelo ARIMA (0,1,1) con constante. Las previsiones a largo plazo tendrán entonces una tendencia que es igual a la tendencia media observada durante todo el período de estimación. No puede hacerlo junto con el ajuste estacional, ya que las opciones de ajuste estacional están deshabilitadas cuando el tipo de modelo está ajustado a ARIMA. Sin embargo, puede agregar una tendencia exponencial a largo plazo constante a un modelo de suavización exponencial simple (con o sin ajuste estacional) utilizando la opción de ajuste de inflación en el procedimiento de previsión. La tasa apropiada de inflación (crecimiento porcentual) por período puede estimarse como el coeficiente de pendiente en un modelo de tendencia lineal ajustado a los datos en conjunción con una transformación de logaritmo natural o puede basarse en otra información independiente sobre las perspectivas de crecimiento a largo plazo . (Regreso al inicio de la página.) Browns Linear (es decir, doble) Suavizado exponencial Los modelos SMA y SES suponen que no hay ninguna tendencia de ningún tipo en los datos (que normalmente está bien o al menos no es demasiado malo para 1- Avance anticipado cuando los datos son relativamente ruidosos), y se pueden modificar para incorporar una tendencia lineal constante como se muestra arriba. Qué pasa con las tendencias a corto plazo? Si una serie muestra una tasa de crecimiento variable o un patrón cíclico que se destaca claramente contra el ruido, y si hay una necesidad de pronosticar más de un período, la estimación de una tendencia local también podría ser un problema. El modelo de suavizado exponencial simple puede generalizarse para obtener un modelo lineal de suavizado exponencial (LES) que calcula las estimaciones locales de nivel y tendencia. El modelo de tendencia más simple que varía en función del tiempo es el modelo lineal de suavizado exponencial de Browns, que utiliza dos series suavizadas diferentes centradas en diferentes momentos del tiempo. La fórmula de predicción se basa en una extrapolación de una línea a través de los dos centros. (Una versión más sofisticada de este modelo, Holt8217s, se discute a continuación). La forma algebraica del modelo de suavizado exponencial lineal de Brown8217s, como la del modelo de suavizado exponencial simple, puede expresarse en un número de formas diferentes pero equivalentes. La forma estándar de este modelo se expresa usualmente de la siguiente manera: Sea S la serie de suavizado simple obtenida aplicando el suavizado exponencial simple a la serie Y. Es decir, el valor de S en el periodo t está dado por: (Recuérdese que, Exponencial, esta sería la previsión para Y en el período t1). Entonces, Squot denote la serie doblemente suavizada obtenida aplicando el suavizado exponencial simple (usando el mismo 945) a la serie S: Finalmente, la previsión para Y tk. Para cualquier kgt1, viene dado por: Esto produce e 1 0 (es decir, trucar un poco y dejar que el primer pronóstico sea igual a la primera observación real), y e 2 Y 2 8211 Y 1. Después de lo cual las previsiones se generan usando la ecuación anterior. Esto produce los mismos valores ajustados que la fórmula basada en S y S si estos últimos se iniciaron usando S 1 S 1 Y 1. Esta versión del modelo se utiliza en la página siguiente que ilustra una combinación de suavizado exponencial con ajuste estacional. Holt8217s Linear Exponential Smoothing Brown8217s El modelo LES calcula las estimaciones locales de nivel y tendencia al suavizar los datos recientes, pero el hecho de que lo haga con un solo parámetro de suavizado impone una restricción en los patrones de datos que puede encajar: el nivel y la tendencia No se les permite variar a tasas independientes. El modelo LES de Holt8217s aborda este problema incluyendo dos constantes de suavizado, una para el nivel y otra para la tendencia. En cualquier momento t, como en el modelo Brown8217s, existe una estimación L t del nivel local y una estimación T t de la tendencia local. Aquí se calculan recursivamente a partir del valor de Y observado en el instante t y de las estimaciones previas del nivel y la tendencia por dos ecuaciones que aplican el suavizado exponencial a ellas por separado. Si el nivel estimado y la tendencia en el tiempo t-1 son L t82091 y T t-1. Respectivamente, entonces la previsión de Y tshy que habría sido hecha en el tiempo t-1 es igual a L t-1 T t-1. Cuando se observa el valor real, la estimación actualizada del nivel se calcula recursivamente interpolando entre Y tshy y su pronóstico, L t-1 T t-1, utilizando pesos de 945 y 1-945. El cambio en el nivel estimado, Es decir L t 8209 L t82091. Puede interpretarse como una medida ruidosa de la tendencia en el tiempo t. La estimación actualizada de la tendencia se calcula recursivamente mediante la interpolación entre L t 8209 L t82091 y la estimación anterior de la tendencia, T t-1. Utilizando los pesos de 946 y 1-946: La interpretación de la constante de suavizado de tendencia 946 es análoga a la de la constante de suavizado de nivel 945. Los modelos con valores pequeños de 946 asumen que la tendencia cambia muy lentamente con el tiempo, mientras que los modelos con 946 más grandes suponen que está cambiando más rápidamente. Un modelo con una gran 946 cree que el futuro lejano es muy incierto, porque los errores en la estimación de la tendencia son muy importantes cuando se pronostica más de un período por delante. Las constantes de suavizado 945 y 946 se pueden estimar de la manera habitual minimizando el error cuadrático medio de los pronósticos de 1 paso adelante. Cuando esto se hace en Statgraphics, las estimaciones resultan ser 945 0,3048 y 946 0,008. El valor muy pequeño de 946 significa que el modelo supone muy poco cambio en la tendencia de un período al siguiente, por lo que básicamente este modelo está tratando de estimar una tendencia a largo plazo. Por analogía con la noción de la edad media de los datos que se utilizan para estimar el nivel local de la serie, la edad media de los datos que se utilizan para estimar la tendencia local es proporcional a 1/946, aunque no exactamente igual a eso. En este caso, resulta ser 1 / 0.006 125. Esto no es un número muy preciso en la medida en que la precisión de la estimación de 946 es realmente de 3 decimales, pero es del mismo orden general de magnitud que el tamaño de la muestra de 100 , Por lo que este modelo está promediando bastante historia en la estimación de la tendencia. La gráfica de pronóstico siguiente muestra que el modelo LES calcula una tendencia local ligeramente mayor al final de la serie que la tendencia constante estimada en el modelo SEStrend. Además, el valor estimado de 945 es casi idéntico al obtenido ajustando el modelo SES con o sin tendencia, por lo que este es casi el mismo modelo. Ahora, se ven como pronósticos razonables para un modelo que se supone que está estimando una tendencia local? Si observas esta gráfica, parece que la tendencia local se ha vuelto hacia abajo al final de la serie. Lo que ha sucedido Los parámetros de este modelo Se han estimado minimizando el error al cuadrado de las previsiones de un paso adelante, y no las previsiones a largo plazo, en cuyo caso la tendencia no hace mucha diferencia. Si todo lo que usted está mirando son errores de un paso adelante, no está viendo la imagen más grande de las tendencias sobre (digamos) 10 o 20 períodos. Con el fin de obtener este modelo más en sintonía con la extrapolación de nuestro ojo de los datos, podemos ajustar manualmente la tendencia de suavizado constante de modo que utiliza una base más corta para la estimación de tendencia. Por ejemplo, si elegimos establecer 946 0.1, la edad promedio de los datos utilizados para estimar la tendencia local es de 10 períodos, lo que significa que estamos promediando la tendencia en los últimos 20 períodos aproximadamente. Here8217s lo que el pronóstico gráfico parece si fijamos 946 0.1 mientras que mantener 945 0.3. Esto parece intuitivamente razonable para esta serie, aunque probablemente sea peligroso extrapolar esta tendencia en más de 10 periodos en el futuro. Qué pasa con las estadísticas de errores? Aquí hay una comparación de modelos para los dos modelos mostrados arriba, así como tres modelos SES. El valor óptimo de 945 para el modelo SES es de aproximadamente 0,3, pero se obtienen resultados similares (con un poco más o menos de capacidad de respuesta, respectivamente) con 0,5 y 0,2. (A) Holts lineal exp. Alisamiento con alfa 0.3048 y beta 0.008 (B) Holts linear exp. Alisamiento con alfa 0.3 y beta 0.1 (C) Suavizado exponencial simple con alfa 0.5 (D) Alisamiento exponencial simple con alfa 0.3 (E) Suavizado exponencial simple con alfa 0.2 Sus estadísticas son casi idénticas, por lo que realmente no podemos hacer la elección sobre la base De errores de pronóstico de un paso adelante en la muestra de datos. Tenemos que recurrir a otras consideraciones. Si creemos firmemente que tiene sentido basar la estimación de tendencia actual en lo que ha ocurrido durante los últimos 20 períodos, podemos hacer un caso para el modelo LES con 945 0.3 y 946 0.1. Si queremos ser agnósticos acerca de si hay una tendencia local, entonces uno de los modelos SES podría ser más fácil de explicar y también daría más pronósticos intermedios para los próximos 5 o 10 períodos. (Volver al principio de la página.) Qué tipo de tendencia-extrapolación es la mejor: horizontal o lineal La evidencia empírica sugiere que, si los datos ya han sido ajustados (si es necesario) para la inflación, puede ser imprudente extrapolar lineal a corto plazo Tendencias en el futuro. Las tendencias evidentes hoy en día pueden desacelerarse en el futuro debido a causas variadas como la obsolescencia del producto, el aumento de la competencia y las caídas o repuntes cíclicos en una industria. Por esta razón, el suavizado exponencial simple a menudo realiza mejor fuera de la muestra de lo que de otra manera podría esperarse, a pesar de su extrapolación horizontal de tendencia horizontal. Las modificaciones de la tendencia amortiguada del modelo de suavizado exponencial lineal también se usan a menudo en la práctica para introducir una nota de conservadurismo en sus proyecciones de tendencia. El modelo LES con tendencia amortiguada se puede implementar como un caso especial de un modelo ARIMA, en particular, un modelo ARIMA (1,1,2). Es posible calcular intervalos de confianza en torno a los pronósticos a largo plazo producidos por modelos de suavizado exponencial, al considerarlos como casos especiales de modelos ARIMA. El ancho de los intervalos de confianza depende de (i) el error RMS del modelo, (ii) el tipo de suavizado (simple o lineal) (iii) el valor (S) de la (s) constante (s) de suavizado y (iv) el número de periodos por delante que está pronosticando. En general, los intervalos se extienden más rápido a medida que el 945 se hace más grande en el modelo SES y se extienden mucho más rápido cuando se usa lineal en lugar de simple suavizado. Este tema se discute más adelante en la sección de modelos de ARIMA de las notas. (Volver al inicio de la página.)


No comments:

Post a Comment