Que el estudiante distinga entre regresión y serie de tiempo: la primera busca una relación promedio entre variables; la segunda busca patrones internos de una variable observada en el tiempo para pronosticar períodos futuros.
Si las ventas cambian con el precio, ¿conviene mirar un gráfico precio-ventas? ¿Y si las ventas cambian semana a semana por tendencia y estacionalidad, no conviene mirar la secuencia temporal?
Ambos enfoques ayudan a pronosticar, pero miran estructuras distintas. La regresión explica una variable con ayuda de otra. La serie de tiempo usa el propio pasado de la variable para construir un pronóstico.
La idea de la regresión es describir una relación promedio entre una variable explicativa y una variable respuesta. Por ejemplo: precio y demanda, publicidad y ventas, horas-personal y producción. No busca adivinar cada observación individual, sino capturar la tendencia central del vínculo.
En su forma más simple, una regresión lineal puede escribirse como:
Y = a + bX + error
Si la pendiente es positiva, al aumentar X la respuesta tiende a subir. Si es negativa, tiende a bajar. Pero aun con una relación real bien definida, los datos observados no quedan perfectamente alineados: aparece ruido, dispersión y variabilidad.
Por eso conviene distinguir entre:
Algunas métricas útiles para leer el ajuste son:
Didácticamente, lo importante es no confundir tendencia con certeza. Una regresión puede ser útil aunque no pase cerca de todos los puntos.
En una serie de tiempo no miramos una variable en función de otra, sino una misma variable ordenada en el tiempo: demanda semanal, ventas mensuales, ocupación diaria, pedidos por hora. Acá importa no solo cuánto vale la variable, sino también cuándo lo hace.
Una serie puede combinar varios componentes:
Pronosticar consiste en usar la información disponible hasta hoy para estimar los valores futuros. No todos los métodos sirven igual para todos los procesos:
Para comparar pronósticos no alcanza con “mirar si la curva parece razonable”. Conviene separar una parte final de la serie como zona de prueba y evaluar allí el error:
En síntesis: la regresión pregunta “¿cómo cambia Y cuando cambia X?”, mientras que la serie de tiempo pregunta “¿qué patrón temporal sigue Y y cómo podría continuar?”.
Qué conviene mirar:
Qué conviene mirar:
Una buena secuencia de exploración es esta: primero generá una serie casi estable, luego agregá tendencia, después agregá estacionalidad y finalmente subí el ruido. En cada paso compará varios métodos y fijate cómo cambia el ranking de la tabla.
| Método | MAE | RMSE | MAPE | Error relativo medio |
|---|
Conviene pensar en regresión cuando querés explicar una variable a partir de otra, como ventas según precio. Conviene pensar en series de tiempo cuando la propia secuencia temporal tiene patrón, como demanda semanal con tendencia y estacionalidad.
No. Intenta capturar la tendencia promedio. En presencia de ruido, siempre habrá puntos por arriba y por abajo de la recta.
Porque copiar el último valor puede ser insuficiente si la serie tiene una tendencia marcada o una estacionalidad clara. En esos casos conviene un método que use más estructura.
Conviene compararlos sobre la misma zona de prueba, usando métricas comunes. En esta página podés mirar MAE y RMSE como errores absolutos, y también MAPE y error relativo medio para interpretar el error en términos porcentuales.
El MAPE resume el tamaño promedio del error porcentual sin importar el signo. El error relativo medio conserva el signo y ayuda a ver si el método tiende a sobrepronosticar o subpronosticar de manera sistemática.
En general sí. Más ruido hace más difícil distinguir la señal principal, tanto en una relación entre variables como en una serie temporal.