Regresión y series de tiempo

Explorá dos formas distintas de pronosticar y entender datos. La regresión relaciona una variable con otra. Las series de tiempo buscan patrones dentro del tiempo: nivel, tendencia, estacionalidad y ruido, y comparan métodos con métricas como MAE, RMSE, MAPE y error relativo.
Datos observados Relación verdadera / patrón generador Ajuste / pronóstico Zona de prueba
Objetivo didáctico puntual

Que el estudiante distinga entre regresión y serie de tiempo: la primera busca una relación promedio entre variables; la segunda busca patrones internos de una variable observada en el tiempo para pronosticar períodos futuros.

Pregunta disparadora

Si las ventas cambian con el precio, ¿conviene mirar un gráfico precio-ventas? ¿Y si las ventas cambian semana a semana por tendencia y estacionalidad, no conviene mirar la secuencia temporal?

Idea central

Ambos enfoques ayudan a pronosticar, pero miran estructuras distintas. La regresión explica una variable con ayuda de otra. La serie de tiempo usa el propio pasado de la variable para construir un pronóstico.

Marco conceptual antes de experimentar

1. Regresión: explicar una variable con ayuda de otra

La idea de la regresión es describir una relación promedio entre una variable explicativa y una variable respuesta. Por ejemplo: precio y demanda, publicidad y ventas, horas-personal y producción. No busca adivinar cada observación individual, sino capturar la tendencia central del vínculo.

En su forma más simple, una regresión lineal puede escribirse como:

Y = a + bX + error

  • a es el intercepto: el valor base de Y cuando X vale 0.
  • b es la pendiente: cuánto cambia Y, en promedio, cuando X aumenta una unidad.
  • error resume todo lo que también influye sobre Y y no está siendo explicado por X.

Si la pendiente es positiva, al aumentar X la respuesta tiende a subir. Si es negativa, tiende a bajar. Pero aun con una relación real bien definida, los datos observados no quedan perfectamente alineados: aparece ruido, dispersión y variabilidad.

Por eso conviene distinguir entre:

  • relación estructural: el patrón que querríamos describir;
  • datos observados: puntos concretos afectados por ruido;
  • recta ajustada: la mejor síntesis lineal de esa nube de puntos.

Algunas métricas útiles para leer el ajuste son:

  • correlación: indica dirección e intensidad lineal de la asociación;
  • : muestra qué proporción de la variabilidad de Y queda capturada por la recta;
  • RMSE: mide el tamaño típico del error del ajuste, en las mismas unidades de Y.

Didácticamente, lo importante es no confundir tendencia con certeza. Una regresión puede ser útil aunque no pase cerca de todos los puntos.

2. Series de tiempo: pronosticar mirando la secuencia temporal

En una serie de tiempo no miramos una variable en función de otra, sino una misma variable ordenada en el tiempo: demanda semanal, ventas mensuales, ocupación diaria, pedidos por hora. Acá importa no solo cuánto vale la variable, sino también cuándo lo hace.

Una serie puede combinar varios componentes:

  • nivel: la altura general de la serie;
  • tendencia: movimiento persistente hacia arriba o hacia abajo;
  • estacionalidad: patrón que se repite cada cierta cantidad de períodos;
  • ruido: fluctuación irregular que no sigue un patrón claro.

Pronosticar consiste en usar la información disponible hasta hoy para estimar los valores futuros. No todos los métodos sirven igual para todos los procesos:

  • un método ingenuo copia el último dato;
  • un promedio móvil suaviza ruido usando varios períodos recientes;
  • un método con tendencia extiende una dirección de cambio;
  • un método estacional ingenuo repite el patrón del último ciclo;
  • los suavizados como SES o Holt dan más peso a lo reciente y pueden captar estabilidad o tendencia;
  • un esquema tipo ARIMA simplificado intenta aprender la dinámica de cambio entre períodos.

Para comparar pronósticos no alcanza con “mirar si la curva parece razonable”. Conviene separar una parte final de la serie como zona de prueba y evaluar allí el error:

  • MAE: error absoluto medio;
  • RMSE: penaliza más fuerte los errores grandes;
  • MAPE: error porcentual absoluto medio;
  • error relativo medio: conserva el signo y ayuda a ver sesgo sistemático, es decir, si el método tiende a sobrepronosticar o subpronosticar.

En síntesis: la regresión pregunta “¿cómo cambia Y cuando cambia X?”, mientras que la serie de tiempo pregunta “¿qué patrón temporal sigue Y y cómo podría continuar?”.

Cómo usar la interactividad

Guía de exploración del bloque A — Regresión
  • Intercepto: mueve la nube y las rectas hacia arriba o hacia abajo.
  • Pendiente: cambia la inclinación de la relación. Probá valores positivos, negativos y cercanos a cero.
  • Ruido: abre o cierra la dispersión de los puntos alrededor de la tendencia.
  • Cantidad de observaciones: te deja ver cómo cambia la estabilidad del ajuste cuando hay más o menos datos.
  • Contexto: cambia el encuadre narrativo del ejemplo, pero la lógica estadística es la misma.
  • Mostrar relación verdadera: deja visible la regla generadora del experimento.
  • Mostrar ajuste lineal: muestra la recta estimada a partir de los datos observados.
  • Generar datos: vuelve a crear la nube con los parámetros actuales.
  • Reproducir: hace aparecer gradualmente los puntos para ver cómo se forma la nube.

Qué conviene mirar:

  • si la recta ajustada conserva el signo correcto de la pendiente;
  • cómo cambian , correlación y RMSE al aumentar el ruido;
  • qué pasa cuando la relación es fuerte, débil o negativa;
  • por qué una relación real puede existir aunque ningún punto individual coincida exactamente con la recta.
Guía de exploración del bloque B — Series de tiempo
  • Nivel: cambia la altura promedio de la serie.
  • Tendencia: hace que la serie suba o baje con el tiempo.
  • Amplitud estacional: fortalece o debilita el patrón repetitivo.
  • Ruido: vuelve la serie más irregular y dificulta el pronóstico.
  • Largo estacional: define cada cuántos períodos se repite el ciclo.
  • Períodos observados: modifica cuánta historia tenés disponible para aprender.
  • Períodos de prueba: define cuántos datos futuros reservás para evaluar el pronóstico.
  • Método de pronóstico: permite comparar enfoques sobre exactamente la misma serie.
  • Mostrar valores reales futuros: deja ver si el pronóstico acompaña o no la realidad en la zona final.
  • Resaltar zona de prueba: ayuda a distinguir visualmente entre aprendizaje y evaluación.

Qué conviene mirar:

  • si el método elegido acompaña bien el patrón dominante de la serie;
  • cómo cambian MAE, RMSE, MAPE y error relativo medio cuando modificás el proceso;
  • si el método tiende a quedarse corto o largo de manera sistemática;
  • qué método gana cuando domina la tendencia, cuándo domina la estacionalidad y cuándo la serie es más estable.

Una buena secuencia de exploración es esta: primero generá una serie casi estable, luego agregá tendencia, después agregá estacionalidad y finalmente subí el ruido. En cada paso compará varios métodos y fijate cómo cambia el ranking de la tabla.

Bloque A — Regresión

Pendiente verdadera: 3.0 Ruido: 8.0 Pendiente ajustada: Intercepto ajustado:
Cuando sube el ruido, la nube de puntos se dispersa y la recta ajustada sigue mostrando la tendencia promedio, pero predice con más error.

Configuración del bloque de regresión

40
3.0
8
Media de Y
Correlación
RMSE del ajuste

Bloque B — Series de tiempo

Nivel: 80 Tendencia: 1.5 Estacionalidad: 18 Método: Promedio móvil
Si hay tendencia y estacionalidad, un promedio global suele quedarse corto. Los mejores métodos son los que logran capturar el patrón dominante del proceso.

Configuración del bloque de series de tiempo

80
1.5
18
6
Media observada
Desvío estándar
MAE en prueba
RMSE en prueba
MAPE en prueba
Error relativo medio
Comparación de métodos sobre esta misma serie
MétodoMAERMSEMAPEError relativo medio
MAPE y error relativo medio se muestran en porcentaje. Un MAPE más bajo implica, en promedio, un error porcentual menor.

Cómo leer esta página

Qué observar en regresión
  • Si la nube de puntos sigue una dirección clara, la recta captura una tendencia útil.
  • Más ruido implica más dispersión y menor capacidad predictiva.
  • Una pendiente positiva o negativa cambia el sentido de la relación.
Qué observar en series de tiempo
  • El nivel marca la altura general de la serie.
  • La tendencia empuja la serie hacia arriba o hacia abajo.
  • La estacionalidad repite un patrón; el ruido lo vuelve imperfecto.
  • Compará métodos: no alcanza con “que la línea se vea linda”; conviene mirar métricas de error.
Aplicación a operaciones
  • Regresión: precio-demanda, horas-personal, publicidad-ventas.
  • Series de tiempo: demanda semanal, pedidos mensuales, ocupación de capacidad.
  • Elegir mal el enfoque puede llevar a malos pronósticos y malas decisiones.

Preguntas y respuestas

¿Cuándo conviene pensar en regresión y cuándo en series de tiempo?

Conviene pensar en regresión cuando querés explicar una variable a partir de otra, como ventas según precio. Conviene pensar en series de tiempo cuando la propia secuencia temporal tiene patrón, como demanda semanal con tendencia y estacionalidad.

¿Una recta de regresión intenta pasar por todos los puntos?

No. Intenta capturar la tendencia promedio. En presencia de ruido, siempre habrá puntos por arriba y por abajo de la recta.

¿Por qué un método ingenuo puede fallar en una serie temporal?

Porque copiar el último valor puede ser insuficiente si la serie tiene una tendencia marcada o una estacionalidad clara. En esos casos conviene un método que use más estructura.

¿Cómo comparo métodos de pronóstico sobre la misma serie?

Conviene compararlos sobre la misma zona de prueba, usando métricas comunes. En esta página podés mirar MAE y RMSE como errores absolutos, y también MAPE y error relativo medio para interpretar el error en términos porcentuales.

¿Qué me dicen el MAPE y el error relativo medio?

El MAPE resume el tamaño promedio del error porcentual sin importar el signo. El error relativo medio conserva el signo y ayuda a ver si el método tiende a sobrepronosticar o subpronosticar de manera sistemática.

¿Más ruido implica peor pronóstico?

En general sí. Más ruido hace más difícil distinguir la señal principal, tanto en una relación entre variables como en una serie temporal.