Regresión y series de tiempo

Objetivo didáctico puntual

Que el estudiante distinga entre regresión y serie de tiempo: la primera busca una relación promedio entre variables; la segunda busca patrones internos de una variable observada en el tiempo para pronosticar períodos futuros.

Pregunta disparadora

Si las ventas cambian con el precio, ¿conviene mirar un gráfico precio-ventas? ¿Y si las ventas cambian semana a semana por tendencia y estacionalidad, no conviene mirar la secuencia temporal?

Idea central

Ambos enfoques ayudan a pronosticar, pero miran estructuras distintas. La regresión explica una variable con ayuda de otra. La serie de tiempo usa el propio pasado de la variable para construir un pronóstico.

Marco conceptual antes de experimentar

1. Regresión: explicar una variable con ayuda de otra

La idea de la regresión es describir una relación promedio entre una variable explicativa y una variable respuesta. Por ejemplo: precio y demanda, publicidad y ventas, horas-personal y producción. No busca adivinar cada observación individual, sino capturar la tendencia central del vínculo.

En su forma más simple, una regresión lineal puede escribirse como:

Y = a + bX + error

a es el intercepto: el valor base de Y cuando X vale 0.
b es la pendiente: cuánto cambia Y, en promedio, cuando X aumenta una unidad.
error resume todo lo que también influye sobre Y y no está siendo explicado por X.

Si la pendiente es positiva, al aumentar X la respuesta tiende a subir. Si es negativa, tiende a bajar. Pero aun con una relación real bien definida, los datos observados no quedan perfectamente alineados: aparece ruido, dispersión y variabilidad.

Por eso conviene distinguir entre:

relación estructural: el patrón que querríamos describir;
datos observados: puntos concretos afectados por ruido;
recta ajustada: la mejor síntesis lineal de esa nube de puntos.

Algunas métricas útiles para leer el ajuste son:

correlación: indica dirección e intensidad lineal de la asociación;
R²: muestra qué proporción de la variabilidad de Y queda capturada por la recta;
RMSE: mide el tamaño típico del error del ajuste, en las mismas unidades de Y.

Didácticamente, lo importante es no confundir tendencia con certeza. Una regresión puede ser útil aunque no pase cerca de todos los puntos.

2. Series de tiempo: pronosticar mirando la secuencia temporal

En una serie de tiempo no miramos una variable en función de otra, sino una misma variable ordenada en el tiempo: demanda semanal, ventas mensuales, ocupación diaria, pedidos por hora. Acá importa no solo cuánto vale la variable, sino también cuándo lo hace.

Una serie puede combinar varios componentes:

nivel: la altura general de la serie;
tendencia: movimiento persistente hacia arriba o hacia abajo;
estacionalidad: patrón que se repite cada cierta cantidad de períodos;
ruido: fluctuación irregular que no sigue un patrón claro.

Pronosticar consiste en usar la información disponible hasta hoy para estimar los valores futuros. No todos los métodos sirven igual para todos los procesos:

un método ingenuo copia el último dato;
un promedio móvil suaviza ruido usando varios períodos recientes;
un método con tendencia extiende una dirección de cambio;
un método estacional ingenuo repite el patrón del último ciclo;
los suavizados como SES o Holt dan más peso a lo reciente y pueden captar estabilidad o tendencia;
un esquema tipo ARIMA simplificado intenta aprender la dinámica de cambio entre períodos.

Para comparar pronósticos no alcanza con “mirar si la curva parece razonable”. Conviene separar una parte final de la serie como zona de prueba y evaluar allí el error:

MAE: error absoluto medio;
RMSE: penaliza más fuerte los errores grandes;
MAPE: error porcentual absoluto medio;
error relativo medio: conserva el signo y ayuda a ver sesgo sistemático, es decir, si el método tiende a sobrepronosticar o subpronosticar.

En síntesis: la regresión pregunta “¿cómo cambia Y cuando cambia X?”, mientras que la serie de tiempo pregunta “¿qué patrón temporal sigue Y y cómo podría continuar?”.

Cómo usar la interactividad

Guía de exploración del bloque A — Regresión

Intercepto: mueve la nube y las rectas hacia arriba o hacia abajo.
Pendiente: cambia la inclinación de la relación. Probá valores positivos, negativos y cercanos a cero.
Ruido: abre o cierra la dispersión de los puntos alrededor de la tendencia.
Cantidad de observaciones: te deja ver cómo cambia la estabilidad del ajuste cuando hay más o menos datos.
Contexto: cambia el encuadre narrativo del ejemplo, pero la lógica estadística es la misma.
Mostrar relación verdadera: deja visible la regla generadora del experimento.
Mostrar ajuste lineal: muestra la recta estimada a partir de los datos observados.
Generar datos: vuelve a crear la nube con los parámetros actuales.
Reproducir: hace aparecer gradualmente los puntos para ver cómo se forma la nube.

Qué conviene mirar:

si la recta ajustada conserva el signo correcto de la pendiente;
cómo cambian R², correlación y RMSE al aumentar el ruido;
qué pasa cuando la relación es fuerte, débil o negativa;
por qué una relación real puede existir aunque ningún punto individual coincida exactamente con la recta.

Guía de exploración del bloque B — Series de tiempo

Nivel: cambia la altura promedio de la serie.
Tendencia: hace que la serie suba o baje con el tiempo.
Amplitud estacional: fortalece o debilita el patrón repetitivo.
Ruido: vuelve la serie más irregular y dificulta el pronóstico.
Largo estacional: define cada cuántos períodos se repite el ciclo.
Períodos observados: modifica cuánta historia tenés disponible para aprender.
Períodos de prueba: define cuántos datos futuros reservás para evaluar el pronóstico.
Método de pronóstico: permite comparar enfoques sobre exactamente la misma serie.
Mostrar valores reales futuros: deja ver si el pronóstico acompaña o no la realidad en la zona final.
Resaltar zona de prueba: ayuda a distinguir visualmente entre aprendizaje y evaluación.

Qué conviene mirar:

si el método elegido acompaña bien el patrón dominante de la serie;
cómo cambian MAE, RMSE, MAPE y error relativo medio cuando modificás el proceso;
si el método tiende a quedarse corto o largo de manera sistemática;
qué método gana cuando domina la tendencia, cuándo domina la estacionalidad y cuándo la serie es más estable.

Una buena secuencia de exploración es esta: primero generá una serie casi estable, luego agregá tendencia, después agregá estacionalidad y finalmente subí el ruido. En cada paso compará varios métodos y fijate cómo cambia el ranking de la tabla.

Bloque A — Regresión

Pendiente verdadera: 3.0 Ruido: 8.0 Pendiente ajustada: – Intercepto ajustado: –

Cuando sube el ruido, la nube de puntos se dispersa y la recta ajustada sigue mostrando la tendencia promedio, pero predice con más error.

Configuración del bloque de regresión

Semilla

Cantidad de observaciones

Contexto

Intercepto 40

Pendiente 3.0

Ruido 8

Mostrar relación verdadera Mostrar ajuste lineal

Media de Y

–

R²

–

Correlación

–

RMSE del ajuste

–

Bloque B — Series de tiempo

Nivel: 80 Tendencia: 1.5 Estacionalidad: 18 Método: Promedio móvil

Si hay tendencia y estacionalidad, un promedio global suele quedarse corto. Los mejores métodos son los que logran capturar el patrón dominante del proceso.

Configuración del bloque de series de tiempo

Semilla

Períodos observados

Períodos de prueba

Nivel 80

Tendencia 1.5

Amplitud estacional 18

Ruido 6

Largo estacional

Método de pronóstico

Mostrar valores reales futuros Resaltar zona de prueba

Media observada

–

Desvío estándar

–

MAE en prueba

–

RMSE en prueba

–

MAPE en prueba

–

Error relativo medio

–

Comparación de métodos sobre esta misma serie

Método	MAE	RMSE	MAPE	Error relativo medio

MAPE y error relativo medio se muestran en porcentaje. Un MAPE más bajo implica, en promedio, un error porcentual menor.

Cómo leer esta página

Qué observar en regresión

Si la nube de puntos sigue una dirección clara, la recta captura una tendencia útil.
Más ruido implica más dispersión y menor capacidad predictiva.
Una pendiente positiva o negativa cambia el sentido de la relación.

Qué observar en series de tiempo

El nivel marca la altura general de la serie.
La tendencia empuja la serie hacia arriba o hacia abajo.
La estacionalidad repite un patrón; el ruido lo vuelve imperfecto.
Compará métodos: no alcanza con “que la línea se vea linda”; conviene mirar métricas de error.

Aplicación a operaciones

Regresión: precio-demanda, horas-personal, publicidad-ventas.
Series de tiempo: demanda semanal, pedidos mensuales, ocupación de capacidad.
Elegir mal el enfoque puede llevar a malos pronósticos y malas decisiones.

Preguntas y respuestas

¿Cuándo conviene pensar en regresión y cuándo en series de tiempo?

Conviene pensar en regresión cuando querés explicar una variable a partir de otra, como ventas según precio. Conviene pensar en series de tiempo cuando la propia secuencia temporal tiene patrón, como demanda semanal con tendencia y estacionalidad.

¿Una recta de regresión intenta pasar por todos los puntos?

No. Intenta capturar la tendencia promedio. En presencia de ruido, siempre habrá puntos por arriba y por abajo de la recta.

¿Por qué un método ingenuo puede fallar en una serie temporal?

Porque copiar el último valor puede ser insuficiente si la serie tiene una tendencia marcada o una estacionalidad clara. En esos casos conviene un método que use más estructura.

¿Cómo comparo métodos de pronóstico sobre la misma serie?

Conviene compararlos sobre la misma zona de prueba, usando métricas comunes. En esta página podés mirar MAE y RMSE como errores absolutos, y también MAPE y error relativo medio para interpretar el error en términos porcentuales.

¿Qué me dicen el MAPE y el error relativo medio?

El MAPE resume el tamaño promedio del error porcentual sin importar el signo. El error relativo medio conserva el signo y ayuda a ver si el método tiende a sobrepronosticar o subpronosticar de manera sistemática.

¿Más ruido implica peor pronóstico?

En general sí. Más ruido hace más difícil distinguir la señal principal, tanto en una relación entre variables como en una serie temporal.