Autor: Trent Buskirk, PhD.
Al igual que en la historia, la literatura, la criminología y muchas otras áreas, el contexto es importante en la estadística. Saber de dónde proceden tus datos te da pistas sobre lo que puedes hacer con esos datos y las inferencias que puedes hacer de ellos.
En las muestras de encuestas, el contexto es fundamental porque le informa sobre cómo se seleccionó la muestra y de qué población se seleccionó.
No todas las muestras seleccionadas son simples muestras aleatorias, por lo que conocer la información sobre el diseño del muestreo proporciona el contexto necesario que permite a los investigadores crear estimaciones adecuadas y generar inferencias correctas y proyectables.
Uno de los primeros pasos, por tanto, al trabajar con datos de encuestas es comprender el diseño del muestreo. Hay algunos conceptos clave que no sólo hay que entender en general, sino que hay que definir en su muestra con el fin de proporcionar el contexto adecuado para calcular las estimaciones y hacer inferencias.
El primero es la Unidad de Muestreo.
Esta es la unidad real que incluimos en nuestra muestra. Por lo general, esta unidad se refiere a una persona individual, pero podría ser una empresa, una escuela o un vecindario, dependiendo de lo que esté midiendo y de cómo lo esté midiendo.
Ahora ponga las Unidades de Muestreo en su contexto adecuado y tendrá el Marco de Muestreo que consiste en una lista de todas las posibles Unidades de Muestreo.
La población objetivo proporciona el contexto general y representa la colección de personas, unidades de vivienda, escuelas, etc. sobre las que se desean hacer inferencias y estimaciones.
En principio, el marco de muestreo coincide perfectamente con la población objetivo. Por supuesto, lo ideal no siempre es posible. A veces el marco será más grande o más pequeño, dependiendo de las formas prácticas de ponerse en contacto con cada miembro de la muestra.
Por qué los marcos de muestreo son tan importantes
Digamos que está haciendo un estudio sobre las opiniones de los adultos estadounidenses sobre los políticos actuales.
Por supuesto, usted no tiene los números de teléfono de *todos* los adultos de los Estados Unidos. Pero puede obtener un marco maestro de todos los números de teléfono móvil disponibles, que puede muestrear utilizando la marcación aleatoria de dígitos.
La población objetivo (adultos de EE.UU.) estará en gran parte «cubierta» por el marco de muestreo (los de los bancos de teléfonos móviles).
Sin embargo, algunos números de teléfono móvil del banco pertenecen a niños, que no forman parte de la población objetivo.
De la misma manera, los adultos que sólo tienen un teléfono fijo o que no tienen ningún teléfono no estarán cubiertos por este marco de muestreo.
Si estos adultos son diferentes de alguna manera de los que poseen un teléfono móvil en los resultados de nuestra encuesta, entonces puede producirse un sesgo de selección. En este caso concreto, se denomina sesgo de cobertura.
Puede que no tenga ninguna opción mejor para un marco de muestreo o que el marco haya sido decidido por otra persona antes de que los datos estuvieran a su disposición. En cualquier caso, es vital que sepa cómo se obtuvo la muestra y cómo el marco de muestreo puede no haber cubierto toda la población objetivo.
Conocer esta información le permite derivar estimaciones estadísticas razonables y, tal vez más importante, le permite hacer inferencias que pueden ponerse en el contexto adecuado.