Índices de percepciones: muestras y validación

¿Cómo determinar el tamaño muestral en una encuesta de percepciones?

Para seleccionar el tamaño muestral primero debemos definir qué tipo de muestreo realizaremos y cuál es el máximo error de estimación que estamos dispuestos a cometer. Por ejemplo, podemos suponer que haremos un muestreo aleatorio simple y que queremos una cota en el error de estimación de ±5%.

En las encuestas de percepciones queremos hacer una estimación de una proporción poblacional, ya que queremos medir el porcentaje de personas optimistas en las distintas percepciones medidas en la encuesta. Para calcular el tamaño muestral necesario podemos usar la siguiente fórmula:

Texto

Descripción generada automáticamente
Fuente: Scheaffer, Mendenhall, Ott & Gerow. Elementary survey sampling

Donde:

Fuente: Scheaffer, Mendenhall, Ott & Gerow. Elementary survey sampling

N es el tamaño poblacional, n es el tamaño muestral, p es la proporción de optimistas y q = (1 – p). Se debe destacar que el tamaño poblacional se encuentra tanto en el numerador como en el denominador de la ecuación, por lo que su efecto no es muy relevante al determinar el tamaño muestral. Por el contrario, un factor muy importante es la varianza del estimador de p: a mayor varianza, mayor tamaño muestral. La varianza toma su máximo valor cuando p=0.50. Por lo tanto, si asumimos que p=q=0.50, estaremos haciendo un cálculo conservador del tamaño muestral.

En el siguiente ejercicio se calcula el tamaño muestral para distintos tamaños poblacionales, p=q=0.50, y distintas cotas en el erro de estimación, desde 0.025 a 0.100.

Gráfico, Gráfico de líneas

Descripción generada automáticamente

Se puede observar que no hay mucha diferencia de tamaño muestral según tamaño poblacional. De hecho, las 4 líneas prácticamente se superponen. Pero sí se observa una relación, no lineal, entre error de estimación y tamaño muestral. Por ejemplo, para un error de estimación de 0.05 (±5%), el tamaño muestral necesario es de:

Texto

Descripción generada automáticamente

A continuación, se muestra el tamaño muestral necesario para un N=18.000.000 (similar a la población de Chile) y distintas cotas en el error de estimación:

Imagen de la pantalla de un celular con letras y números

Descripción generada automáticamente con confianza baja

¿Cómo saber si la muestra es representativa?

Se supone que una muestra es representativa cuando sus elementos son seleccionados aleatoriamente de la población, ya que de esta manera la distribución de la muestra será igual a la distribución poblacional. Sin embargo, lo anterior no siempre sucede, debido a que es necesario contar con marcos muestrales adecuados para hacer una selección aleatoria. Los marcos muestrales son listas de los elementos de la población, por ejemplo, individuos u hogares. Estos marcos muestrales son muy difíciles de construir, y sólo están disponibles para instituciones de gran capacidad técnica como el INE.

Por otro lado, aun cuando se haga una selección aleatoria de datos, es posible que la selección no sea buena, y que la distribución de la muestra sea diferente a la de la población. Por ejemplo, podría suceder que la proporción de hombres y mujeres de la muestra sea distinta a la de la población. Por eso las encuestas más sofisticadas utilizan muestreo aleatorio estratificado, por conglomerados, o en varias etapas, para asegurar en mejor medida la representatividad de la muestra.

El código utilizado en este artículo se puede descargar en GitHub.

A posteriori, después de haber realizado el muestreo, podemos evaluar qué tan representativa es nuestra muestra comparando algunos promedios muestrales con los de la población. Por ejemplo, usando la información de la caracterización socioeconómica (género, edad, ingreso, educación, actividad). Podemos evaluar si los promedios calculados en nuestra muestra son estadísticamente distintos de los parámetros poblaciones, calculados usando información censal, o de alguna encuesta como la Casen, que es probablemente la encuesta con mejor representatividad en Chile.

Por último, hay que mencionar que si tenemos una muestra representativa de la población objeto, por ejemplo, de la población total del país, esto no implica que la muestra también sea representativa de las regiones o comunas, o de los distintos grupos socioeconómicos. Para que así sea la muestra se debe diseñar de esa manera. Es por ello que encuestas como la Casen utilizan una muestra tan grande. Por ejemplo, la encuesta Casen, cuyo objetivo es hacer una estimación de la pobreza a nivel nacional, urbano y rural, y regional; de forma tal que los errores de estimación no superaran un 4%, en el año 2017 encuestó a más de 74.000 hogares.

¿Cómo validar un índice de percepciones?

Una forma de validar un índice de confianza es verificar si empíricamente se cumplen las implicancias de los modelos teóricos que los fundamentan.

Por ejemplo, los índices de confianza de consumidores se basan en la Teoría Adaptativa del Comportamiento del Consumidor (Katona, 1968), en la que el gasto de los consumidores depende de dos aspectos, la capacidad y la voluntad de comprar. La capacidad de comprar se refiere al ingreso de los consumidores, así como también a su riqueza y acceso al crédito; mientras que la voluntad de comprar es un componente subjetivo, que depende de las percepciones de los consumidores respecto de sus finanzas personales y de la economía en general.

Por lo tanto, podríamos validar los índices de confianza de consumidores verificando distintas hipótesis: (1) Los índices de confianza de consumidores predicen el consumo; (2) Los índices de confianza de consumidores predicen el ingreso o las colocaciones de consumo; (3) Los índices de confianza de consumidores miden componentes subjetivos que afectan las decisiones de consumo.

Otras teorías que se han asociado a los índices de confianza de consumidores son la Hipótesis del Ingreso Permanente (los índices de confianza medirían las fluctuaciones del ingreso esperado) o la Teoría del Ahorro Precautorio (los índices de confianza medirían la incertidumbre de los consumidores).

Sin embargo, hay casos de índices que no se basan en fundamentos teóricos. En este contexto, se podría validar un índice verificando si cumple su objetivo. En el caso de los índices de percepciones podemos definir dos objetivos: (1) que el índice efectivamente mida lo que pretende medir (la confianza de consumidores o empresarios, o la incertidumbre), y (2) que el índice sea útil para monitorear la actividad económica.

Para validar el cumplimiento del primer objetivo, podemos comparar nuestros índices con otros indicadores que midan la confianza o incertidumbre. Si encontramos que se correlacionan podemos concluir que los índices efectivamente miden el fenómeno que queremos medir. Por ejemplo, para medir incertidumbre también se utilizan variables asociadas a los mercados financieros (cds, vix, yield curve, etc.). Otra forma es evaluar si los índices son un mero reflejo de la información ya contenida en otros indicadores o si contienen información adicional e independiente. Para esto podemos hacer una regresión del índice sobre otras variables económicas, para medir qué fracción de su varianza no se puede explicar por otras variables económicas. Si dicha fracción es significativa, podemos decir que el índice entrega información independiente, y si es capaz de predecir otras variables económicas, también podemos decir que dicha información es valiosa (ver, por ejemplo, Acuña et al 2020).

Para validar el cumplimiento del segundo objetivo, podemos analizar si los índices de percepciones son útiles para hacer predicciones de otras variables económicas, por ejemplo, la actividad económica, el consumo, la inversión, la inflación, el desempleo, etc. Además, podemos analizar si su efecto es significativo aun cuando se controla por el efecto de otras variables. Es decir, evaluar si ayudan a mejorar las predicciones de los modelos econométricos tradicionales.

Referencias

Acuña, G., Echeverría, C., and Pinto-Gutiérrez, C. (2020). Consumer confidence and consumption: empirical evidence from Chile, International Review of Applied Economics, 34:1, 75-93, https://doi.org/10.1080/02692171.2019.1645816

Katona, G. (1968). Consumer Behavior: Theory and Findings on Expectations and Aspirations. The American Economic Review, 58(2), 19-30.


Contenido relacionado