En este artículo continúa el torneo de predicciones de IMACEC en base a modelos de machine learning.
En primer lugar, se evalúan las predicciones del mes anterior, febrero de 2022, en que se predijo el IMACEC de enero de 2022. Luego se hace una nueva predicción, para febrero de 2022. Durante cada mes se hace una predicción para el IMACEC del mes anterior respectivo.
Puedes descargar el código utilizado en este artículo en GitHub.
Evaluación de los resultados del mes anterior
La tasa de crecimiento anual del IMACEC en enero de 2021 fue de 10,1%. La mejor predicción del mes fue la realizada en base al IPEC, uno de los índices de confianza de los consumidores. En segundo lugar, se ubicó la predicción en base al ICE, uno de los índices de confianza empresarial. En tercer lugar su ubica la predicción en base a todos los índices empresariales (ICE + IMCE).
A continuación se muestra el ranking promedio por índice. En primer lugar se ubica el modelo en base a todos los índices empresariales (IMCE + ICE). En segundo lugar, se encuentra el modelo en base a todos los índices (consumidores + empresarios). En tercer lugar se ubica el modelo en base al ICE.
El siguiente cuadro muestra el número acumulado de victorias. En el primer lugar se ubica el modelo en base a TODOS los índices (consumidores + empresarios), luego el modelo en base a todos los índices empresariales (IMCE + ICE), y a continuación empatan los modelos en base al IPEC.
Variables
Para hacer la nueva predicción se ocuparon los mismos modelos del mes anterior, y los mismos pasos y parámetros para calibrarlos. También se siguieron considerando las nuevas variables creadas en meses anteriores, que se describen a continuación.
En el caso de los índices de confianza de los consumidores, IPECO e IPEC, se crearon las siguientes variables:
- Promedio móvil trimestral
- Promedio móvil semestral
- Índice de percepciones del presente
- Índice de percepciones del futuro
- Índice de percepciones personales
- Índice de percepciones nacionales
Los índices de percepciones del presente, futuro, personales y nacionales sólo incluyen los índices de percepciones relacionados con estas dimensiones.
En el caso de los índices de confianza empresarial IMCE e ICE se construyeron las siguientes variables:
- Promedio simple de los índices sectoriales
- Promedio trimestral
- Promedio semestral
- Promedios excluyendo algún sector económico
De esta manera se obtiene una gran cantidad de variables por cada base de datos: IPECO (12), IPEC (12), ICE (16), IMCE (12), Consumidores (IPECO + IPEC, 24), Empresarios (ICE + IMCE, 28), Todos (52).
Además, al igual que en el mes anterior, se acotó a la mitad el número de variables de cada modelo en base a las feature importances entregadas por un Random Forest, con el objetivo de ajustar modelos más parsimoniosos.
Calibración de los modelos
La matriz de predictores ocupados en cada modelo se compone de:
- Filas: todos los datos (observaciones) disponibles para cada grupo de índices, lo que varía dependiendo de cada grupo.
- Columnas: la mitad más importante de los índices de confianza, índices de percepciones (variables que los componen), y los nuevos índices generados (descritos anteriormente).
Luego, para cada modelo se usa K-fold cross validation y una búsqueda de grilla en un conjunto de parámetros, para seleccionar la mejor combinación de éstos, que minimice el CV-RMSE.
Se observa que el modelo en que se ocuparon todas las variables fue el que obtuvo el menor CV-RMSE. También se observa que entre los índices individuales el ICE obtuvo los mejores resultados.
Antes de hacer las predicciones se ajustaron los modelos a la muestra completa, usando los mejores parámetros seleccionados.
Predicciones de FEBRERO de 2022
Por último, se muestran las predicciones para el mes de FEBRERO de 2022:
La mayor predicción la da el modelo en base a TODOS los índices (8,88%), mientras que la menor predicción la da el modelo en base al IPECO (5,60%%). Como referencia, la encuesta de expectativas económicas predice un crecimiento anual del IMACEC de 7,5%.