En este artículo continúa el torneo de predicciones de IMACEC en base a modelos de machine learning.
En primer lugar, se evalúan las predicciones del mes anterior, diciembre de 2021, en que se predijo el IMACEC de noviembre de 2021. Luego se hace una nueva predicción, para diciembre de 2021. Durante cada mes se hace una predicción para el IMACEC del mes anterior.
Puedes descargar el código utilizado en este artículo en GitHub.
Evaluación de los resultados del mes anterior
La tasa de crecimiento anual del IMACEC en noviembre de 2021 fue de 14,3%, lo que nuevamente representa un crecimiento muy grande para el indicador. En consecuencia, todos los modelos en base a percepciones subestimaron la tasa de crecimiento del IMACEC. Se debe tener en cuenta que estos modelos usan datos de índices de confianza de consumidores y empresarios, exclusivamente. No utilizan ninguna información adicional a las percepciones que permita mejorar las predicciones, lo que representa un desafío adicional para predecir con precisión.
La mejor predicción del mes fue la realizada en base a todos los índices de confianza empresarial (IMCE + ICE). En segundo lugar, se ubicó la predicción en base a todos los índices de confianza (empresarios + consumidores). Luego se encuentra la predicción en base al ICE.
A continuación se muestra el ranking promedio por índice. En primer lugar se ubica el modelo en base a todos los índices empresariales (IMCE + ICE), empatando con el modelo en base a todos los índices (consumidores + empresarios). En tercer lugar se ubica el modelo en base al ICE, uno de los índices de confianza empresarial.
El siguiente cuadro muestra el número acumulado de victorias. En el primer lugar se ubica el modelo en base a TODOS los índices (consumidores + empresarios), luego el modelo en base a todos los índices empresariales (IMCE + ICE), y a continuación el modelo en base al IMCE.
Variables
Para hacer la nueva predicción se ocuparon los mismos modelos del mes anterior, y los mismos pasos y parámetros para calibrarlos. También se siguieron considerando las nuevas variables creadas en meses anteriores, que se describen a continuación.
En el caso de los índices de confianza de los consumidores, IPECO e IPEC, se crearon las siguientes variables:
- Promedio móvil trimestral
- Promedio móvil semestral
- Índice de percepciones del presente
- Índice de percepciones del futuro
- Índice de percepciones personales
- Índice de percepciones nacionales
Los índices de percepciones del presente, futuro, personales y nacionales sólo incluyen los índices de percepciones relacionados con estas dimensiones.
En el caso de los índices de confianza empresarial IMCE e ICE se construyeron las siguientes variables:
- Promedio simple de los índices sectoriales
- Promedio trimestral
- Promedio semestral
- Promedios excluyendo algún sector económico
De esta manera se obtiene una gran cantidad de variables por cada base de datos: IPECO (12), IPEC (12), ICE (16), IMCE (12), Consumidores (IPECO + IPEC, 24), Empresarios (ICE + IMCE, 28), Todos (52).
Además, al igual que en el mes anterior, se acotó a la mitad el número de variables de cada modelo en base a las feature importances entregadas por un Random Forest, con el objetivo de ajustar modelos más parsimoniosos.
Calibración de los modelos
La matriz de predictores ocupados en cada modelo se compone de:
- Filas: todos los datos (observaciones) disponibles para cada grupo de índices, lo que varía dependiendo de cada grupo.
- Columnas: la mitad más importante de los índices de confianza, índices de percepciones (variables que los componen), y los nuevos índices generados (descritos anteriormente).
Luego, para cada modelo se usa K-fold cross validation y una búsqueda de grilla en un conjunto de parámetros, para seleccionar la mejor combinación de éstos, que minimice el CV-RMSE.
Se observa que el modelo en que se ocuparon todas las variables fue el que obtuvo el menor CV-RMSE. También se observa que entre los índices individuales el IMCE y el ICE obtuvieron los mejores resultados.
Antes de hacer las predicciones se ajustaron los modelos a la muestra completa, usando los mejores parámetros seleccionados.
Predicciones de DICIEMBRE de 2021
Por último, se muestran las predicciones para el mes de DICIEMBRE de 2021:
La mayor predicción la da el modelo en base al ICE (11,35%), mientras que la menor predicción la da el modelo en base al IPECO (2,46%%). Como referencia, la encuesta de expectativas económicas predice un crecimiento anual del IMACEC de 10,7%.