Índices

Análisis de Sentimiento del Informe de Percepciones de Negocios

Este artículo resume el trabajo Análisis de Sentimiento Basado en el Informe de Percepciones de Negocios del Banco Central de Chile de los autores María del Pilar Cruz, Hugo Peralta y Bruno Ávila del Banco Central de Chile.

El objetivo de este trabajo fue demostrar la efectividad de las herramientas de text mining para el análisis económico, desarrollando una aplicación de sentiment análisis del Informe de Percepciones de Negocios del Banco Central. Un resultado importante de este estudio fue la construcción de un diccionario en español para el análisis de sentimiento.

¿Qué es el Informe de Percepciones de Negocios?

El Informe de Percepciones de Negocios (IPN) evalúa las percepciones que tienen las empresas de sus negocios, de su sector de actividad y del país, y las expectativas de crecimiento, de inversiones y creación de empleo. Se publica trimestralmente desde comienzos de 2013, y se basa en entrevistas realizadas a ejecutivos de alrededor de 200 empresas.

Análisis de sentimientos y Modelamiento de tópicos

Las metodologías utilizadas para el análisis fueron las siguientes:

  1. Análisis de sentimientos (AS), que permite transformar textos en índices cuantitativos según la polaridad de sus palabras.
  2. Modelamiento de tópicos, que permite la extracción de características semánticas de los textos del IPN, con el objetivo de inferir los temas más mencionados y su evolución en el tiempo.

Importancia de medir el sentimiento

El text mining permitiría mejorar los indicadores de incertidumbre económica, que son fundamentales para la eficacia del manejo de expectativas que hacen los bancos centrales, a través de la comunicación de su política monetaria.

Por ejemplo, los autores citan un estudio de Correa, Garud, Londo y Mislang (201), de la Reserva Federal de EEUU, en que midieron el sentimiento de los informes de estabilidad financiera de 35 bancos centrales en entre 2005 y 2015. Luego, demostraron que las características del ciclo financiero y el sentimiento respecto de la estabilidad financiera se influencian estrechamente el uno al otro. Asimismo, este indicador sería capaz de predecir la ocurrencia de crisis financieras mejor que otros indicadores comúnmente utilizados.

Metodologías para el análisis de sentimiento

El Análisis de Sentimiento se basa en la clasificación de palabras dentro de los textos en categorías como “positivo”, “negativo”, “alcista” o “declinante”, que se gradúan a través de intensificadores. Luego, el modelo es capaz de clasificar el sentimiento contenido en un texto, mediante el recuento o sumatoria de las palabras según su polaridad e intensidad.

Existen dos enfoques para realizar este análisis:

  1. Machine learning. En que la clasificación es realizada por un modelo matemático/estadístico, capaz de extraer patrones en los datos de forma automática, y que no son evidentes bajo las lecturas convencionales de los individuos.
  2. Basado en léxicos. En que la clasificación se realiza en base a un corpus o diccionario con textos o palabras previamente clasificadas según la polaridad de su sentimiento.
Fuente: del Pilar Cruz, María & Hugo Peralta & Bruno Ávila (2020)

Metodología utilizada en el análisis de sentimiento del IPN

El análisis se enfocó en la lectura y procesamiento de 25 IPN publicados por el Banco Central de Chile entre mayo de 2003 y agosto de 2019, utilizando el modelo basado en diccionario.

Etapas del proceso:

  1. Generación de los datos. En que se pre procesaron los textos: se clasificaron las categorías de palabras, se identificaron bi-gramas y tri-gramas, y se removieron las stopwords y otros términos que aportan poco o nada de información contextual.
  2. Generación del diccionario. Se seleccionó un conjunto de palabras específico para el dominio del IPN, que se utilizó para el cálculo del índice de sentimiento.
  3. Categorización de textos. Se clasificaron los textos del IPN en base a dos categorías: (1) por región geográfica (zona norte, zona centro, zona sur y resumen); y (2) modelamiento de tópicos mediante métodos de machine learning, en que se clasificaron los textos en temas como: mercado laboral, condiciones financieras o inversiones.

Creación del diccionario

El diccionario se elaboró siguiendo las siguientes etapas:

  • Clasificación de las palabras de la base de datos del IPN. Con enfoque en verbos y adjetivos, ya que se consideró que estos tipos de palabras son los que mejor transmiten la polaridad de la oración. Se clasificaron 2.231 adjetivos y verbos únicos, mediante el modelo Stanford for POS Tagger.
  • Agrupación de palabras. Se utilizó lematización (lemmatization) y estemización (stemming) para reducir el número de palabras. La lematización permitió transformar los verbos a una conjugación única (infinitivo) y mediante stemming se conservó sólo la raíz común de los adjetivos, eliminando los sufijos. De esta manera, se redujo el diccionario a un total de 678 palabras únicas.
Fuente: del Pilar Cruz, María & Hugo Peralta & Bruno Ávila (2020)
  • Asignación de puntajes. La asignación de puntajes se hizo de forma manual e independiente por cada uno de los miembros del equipo investigador. Los puntajes +1, -1 o 0 corresponden a las categorías positivo, negativo o neutral (ni positivo ni negativo). Finalmente, los puntajes se asignaron a las palabras en su forma original, anterior a la aplicación de lemmatization y stemming, de forma de trabajar con el diccionario de 2.231 palabras.

Manejo de negaciones

Se utilizó la herramienta Semantic Orientation Calculator, que invierte la polaridad de una palabra cuando es precedida por una negación, como: no, ningún, ninguna, ninguno y nunca.

Ejemplo: “Los entrevistados mencionan que no esperan mejorar las ventas en próximo trimestre

Cálculo del Índice de Sentimiento del IPN

El Índice de Sentimiento del IPN (ISIPN) se creó para cada uno de los 25 informes, dando origen a una serie de tiempo, mediante la fórmula:

(N° palabras positivas – N° palabras negativas) / (N° palabras positivas + N° palabras negativas).

Es decir, se trata de un índice que puede flucturar entre -1 y +1, y en que el valor 0 indica neutralidad. Un crecimiento del indicador significa un mayor crecimiento relativo de las palabras positivas que de las negativas, reflejando una mejora en el sentimiento de negocios.

Cómo se correlaciona el Índice de Sentimiento del IPN (ISIPN)

A continuación, se analizó cómo se correlaciones el ISIPN con otros índices de confianza empresarial. Destaca una alta correlación de Pearson con una agrupación especifica de subíndices del IMCE, el indicador mensual de confianza empresarial, de ICARE-UAI.

Fuente: del Pilar Cruz, María & Hugo Peralta & Bruno Ávila (2020)

También se analizó la correlación con el ICE, el índice de confianza empresarial del CEEN-UDD, donde también se encontraron correlaciones significativas, pero no tan altas como con el IMCE.

Por otro lado, se analizó la correlación del ISIPN con el IMACEC (minero / no minero / ajustado / no ajustado). Se encontraron correlaciones entre 0.5 y 0.6. También se analizaron las correlaciones con la inversión y consumo agregado, que fueron débiles.

Fuente: del Pilar Cruz, María & Hugo Peralta & Bruno Ávila (2020)

En conclusión, los resultados sugieren que el ISIPN se asemeja principalmente a un índice de confianza empresarial. En particular, a algunos subíndices específicos, que se relacionan con las expectativas de los empresarios respecto de la situación económica nacional y de sus empresas.

¿Qué más podemos encontrar en este estudio?

El documento continúa presentando los resultados del ISIPN por macrozonas y un análisis de robustez de los resultados, cambiando la estructura del diccionario. Por último, se presenta la metodología y los resultados del análisis de tópicos

Fuente: del Pilar Cruz, María & Hugo Peralta & Bruno Ávila (2020)

Conclusiones

Se presentó una metodología que representa un primer avance en el uso de tecnología para extraer información de textos económicos para en análisis de la coyuntura.

Al correlacionar el ISIPN se reveló la importancia que tienen los indicadores de confianza empresarial cuando se evalúan de forma desagregada, ya que se encontró que dicha información fue más consistente con la obtenida del IPN.

Por último, el análisis de tópicos reveló que la composición del IPN ha estado dominada por temas relacionados con las expectativas de los entrevistados. Asimismo, se encuentra que recientemente han tomado mayor relevancia temas relacionados con la inversión y costos que enfrentan las empresas.

Referencias

Correa, R., Garud, K., Londono, J. M., & Mislang, N. (2017). Sentiment in Central Banks’ Financial Stability Reports. FRB International Finance Discussion Paper N° 1203

del Pilar Cruz, María & Hugo Peralta & Bruno Ávila (2020). Análisis de Sentimiento Basado en el Informe de Percepciones de Negocios del Banco Central de Chile, Working Papers Central Bank of Chile 862, Central Bank of Chile. https://www.bcentral.cl/en/web/banco-central/content/-/detalle/analisis-de-sentimiento-basado-en-el-informe-de-percepciones-de-negocios-del-banco-central-de-chile


Contenido relacionado

Guillermo Acuña

Economista | Investigador | Data Scientist | Consultor

Compartir
Publicado por
Guillermo Acuña

Entradas recientes

El secreto de Spinoza, de José Rodrigues dos Santos

"El secreto de Spinoza" es una novela histórica sobre la vida de Baruch Spinoza, uno…

4 meses hace

La casa de la mezquita, de Kader Abdolah

El autor: Kader Abdolah Kader Abdolah (1954-) es un escritor iraní-neerlandés, conocido por sus novelas,…

5 meses hace

El último judío, de Noah Gordon

El autor: Noah Gordon Noah Gordon (1926-2021) fue un escritor estadounidense, conocido principalmente por sus…

5 meses hace

Fahrenheit 451, de Ray Bradbury

El autor Ray Bradbury (1920-2012) fue un escritor estadounidense de ciencia ficción y fantasía. Es…

5 meses hace

1984, de George Orwell

El autor Eric Arthur Blair (1903-1950), conocido como George Orwell fue un escritor británico conocido…

5 meses hace

VALIS, de Philip K. Dick

El autor: Philip K. Dick Philip K. Dick (1928-1982) fue un influyente escritor estadounidense de…

6 meses hace