Este artículo resume el trabajo Análisis de Sentimiento Basado en el Informe de Percepciones de Negocios del Banco Central de Chile de los autores María del Pilar Cruz, Hugo Peralta y Bruno Ávila del Banco Central de Chile.
El objetivo de este trabajo fue demostrar la efectividad de las herramientas de text mining para el análisis económico, desarrollando una aplicación de sentiment análisis del Informe de Percepciones de Negocios del Banco Central. Un resultado importante de este estudio fue la construcción de un diccionario en español para el análisis de sentimiento.
¿Qué es el Informe de Percepciones de Negocios?
Contenidos
El Informe de Percepciones de Negocios (IPN) evalúa las percepciones que tienen las empresas de sus negocios, de su sector de actividad y del país, y las expectativas de crecimiento, de inversiones y creación de empleo. Se publica trimestralmente desde comienzos de 2013, y se basa en entrevistas realizadas a ejecutivos de alrededor de 200 empresas.
Análisis de sentimientos y Modelamiento de tópicos
Las metodologías utilizadas para el análisis fueron las siguientes:
- Análisis de sentimientos (AS), que permite transformar textos en índices cuantitativos según la polaridad de sus palabras.
- Modelamiento de tópicos, que permite la extracción de características semánticas de los textos del IPN, con el objetivo de inferir los temas más mencionados y su evolución en el tiempo.
Importancia de medir el sentimiento
El text mining permitiría mejorar los indicadores de incertidumbre económica, que son fundamentales para la eficacia del manejo de expectativas que hacen los bancos centrales, a través de la comunicación de su política monetaria.
Por ejemplo, los autores citan un estudio de Correa, Garud, Londo y Mislang (201), de la Reserva Federal de EEUU, en que midieron el sentimiento de los informes de estabilidad financiera de 35 bancos centrales en entre 2005 y 2015. Luego, demostraron que las características del ciclo financiero y el sentimiento respecto de la estabilidad financiera se influencian estrechamente el uno al otro. Asimismo, este indicador sería capaz de predecir la ocurrencia de crisis financieras mejor que otros indicadores comúnmente utilizados.
Metodologías para el análisis de sentimiento
El Análisis de Sentimiento se basa en la clasificación de palabras dentro de los textos en categorías como “positivo”, “negativo”, “alcista” o “declinante”, que se gradúan a través de intensificadores. Luego, el modelo es capaz de clasificar el sentimiento contenido en un texto, mediante el recuento o sumatoria de las palabras según su polaridad e intensidad.
Existen dos enfoques para realizar este análisis:
- Machine learning. En que la clasificación es realizada por un modelo matemático/estadístico, capaz de extraer patrones en los datos de forma automática, y que no son evidentes bajo las lecturas convencionales de los individuos.
- Basado en léxicos. En que la clasificación se realiza en base a un corpus o diccionario con textos o palabras previamente clasificadas según la polaridad de su sentimiento.
Metodología utilizada en el análisis de sentimiento del IPN
El análisis se enfocó en la lectura y procesamiento de 25 IPN publicados por el Banco Central de Chile entre mayo de 2003 y agosto de 2019, utilizando el modelo basado en diccionario.
Etapas del proceso:
- Generación de los datos. En que se pre procesaron los textos: se clasificaron las categorías de palabras, se identificaron bi-gramas y tri-gramas, y se removieron las stopwords y otros términos que aportan poco o nada de información contextual.
- Generación del diccionario. Se seleccionó un conjunto de palabras específico para el dominio del IPN, que se utilizó para el cálculo del índice de sentimiento.
- Categorización de textos. Se clasificaron los textos del IPN en base a dos categorías: (1) por región geográfica (zona norte, zona centro, zona sur y resumen); y (2) modelamiento de tópicos mediante métodos de machine learning, en que se clasificaron los textos en temas como: mercado laboral, condiciones financieras o inversiones.
Creación del diccionario
El diccionario se elaboró siguiendo las siguientes etapas:
- Clasificación de las palabras de la base de datos del IPN. Con enfoque en verbos y adjetivos, ya que se consideró que estos tipos de palabras son los que mejor transmiten la polaridad de la oración. Se clasificaron 2.231 adjetivos y verbos únicos, mediante el modelo Stanford for POS Tagger.
- Agrupación de palabras. Se utilizó lematización (lemmatization) y estemización (stemming) para reducir el número de palabras. La lematización permitió transformar los verbos a una conjugación única (infinitivo) y mediante stemming se conservó sólo la raíz común de los adjetivos, eliminando los sufijos. De esta manera, se redujo el diccionario a un total de 678 palabras únicas.
- Asignación de puntajes. La asignación de puntajes se hizo de forma manual e independiente por cada uno de los miembros del equipo investigador. Los puntajes +1, -1 o 0 corresponden a las categorías positivo, negativo o neutral (ni positivo ni negativo). Finalmente, los puntajes se asignaron a las palabras en su forma original, anterior a la aplicación de lemmatization y stemming, de forma de trabajar con el diccionario de 2.231 palabras.
Manejo de negaciones
Se utilizó la herramienta Semantic Orientation Calculator, que invierte la polaridad de una palabra cuando es precedida por una negación, como: no, ningún, ninguna, ninguno y nunca.
Ejemplo: “Los entrevistados mencionan que no esperan mejorar las ventas en próximo trimestre”
Cálculo del Índice de Sentimiento del IPN
El Índice de Sentimiento del IPN (ISIPN) se creó para cada uno de los 25 informes, dando origen a una serie de tiempo, mediante la fórmula:
(N° palabras positivas – N° palabras negativas) / (N° palabras positivas + N° palabras negativas).
Es decir, se trata de un índice que puede flucturar entre -1 y +1, y en que el valor 0 indica neutralidad. Un crecimiento del indicador significa un mayor crecimiento relativo de las palabras positivas que de las negativas, reflejando una mejora en el sentimiento de negocios.
Cómo se correlaciona el Índice de Sentimiento del IPN (ISIPN)
A continuación, se analizó cómo se correlaciones el ISIPN con otros índices de confianza empresarial. Destaca una alta correlación de Pearson con una agrupación especifica de subíndices del IMCE, el indicador mensual de confianza empresarial, de ICARE-UAI.
También se analizó la correlación con el ICE, el índice de confianza empresarial del CEEN-UDD, donde también se encontraron correlaciones significativas, pero no tan altas como con el IMCE.
Por otro lado, se analizó la correlación del ISIPN con el IMACEC (minero / no minero / ajustado / no ajustado). Se encontraron correlaciones entre 0.5 y 0.6. También se analizaron las correlaciones con la inversión y consumo agregado, que fueron débiles.
En conclusión, los resultados sugieren que el ISIPN se asemeja principalmente a un índice de confianza empresarial. En particular, a algunos subíndices específicos, que se relacionan con las expectativas de los empresarios respecto de la situación económica nacional y de sus empresas.
¿Qué más podemos encontrar en este estudio?
El documento continúa presentando los resultados del ISIPN por macrozonas y un análisis de robustez de los resultados, cambiando la estructura del diccionario. Por último, se presenta la metodología y los resultados del análisis de tópicos
Conclusiones
Se presentó una metodología que representa un primer avance en el uso de tecnología para extraer información de textos económicos para en análisis de la coyuntura.
Al correlacionar el ISIPN se reveló la importancia que tienen los indicadores de confianza empresarial cuando se evalúan de forma desagregada, ya que se encontró que dicha información fue más consistente con la obtenida del IPN.
Por último, el análisis de tópicos reveló que la composición del IPN ha estado dominada por temas relacionados con las expectativas de los entrevistados. Asimismo, se encuentra que recientemente han tomado mayor relevancia temas relacionados con la inversión y costos que enfrentan las empresas.
Referencias
Correa, R., Garud, K., Londono, J. M., & Mislang, N. (2017). Sentiment in Central Banks’ Financial Stability Reports. FRB International Finance Discussion Paper N° 1203
del Pilar Cruz, María & Hugo Peralta & Bruno Ávila (2020). Análisis de Sentimiento Basado en el Informe de Percepciones de Negocios del Banco Central de Chile, Working Papers Central Bank of Chile 862, Central Bank of Chile. https://www.bcentral.cl/en/web/banco-central/content/-/detalle/analisis-de-sentimiento-basado-en-el-informe-de-percepciones-de-negocios-del-banco-central-de-chile
Pingback: Índice de Sentimiento Corporativo – Parte 1/2 - Observatorio de Percepciones Económicas