Población y Muestra
Población y Muestra
Población y Muestra
POBLACIÓN Y MUESTRA
1. Población
2. Muestra
3. Muestreo
4. Tamaño de muestra
5. Tipos de muestreo
Muestreo probabilístico
+ Aleatorio simple
+ Aleatorio sistemático
+ Aleatorio estratificado
+ Aleatorio por conglomerados
Muestreo no probabilístico
+ Muestreo por cuotas
+ Muestreo por conveniencia
+ Muestreo por conglomerados
Ejemplo:
Muestra
• Es un subconjunto obtenido de la población de estudio, una vez que se ha decidido escoger una
muestra, se deben tener presente:
• + La determinación del mínimo tamaño muestral requerido.
• + El procedimiento de selección de la muestra, también conocida como diseño muestral (tipo de
muestreo).
Tamaño muestral
• Para la mayoría de estudios, el mínimo tamaño muestral requerido se estima a
través de la aplicación de fórmulas.
• Existe una fórmula para cada tipo de estudio en particular.
Grupo de estudio
Este término ha sido utilizado ampliamente con el advenimiento de los
estudios de tipo experimental (grupo de sujetos de experimentación).
Conceptos básicos
Muestreo
• Es el proceso de seleccionar un conjunto de individuos de una población
con el fin de estudiarlos y poder caracterizar el total de la población.
Razones de muestreo
• Disminución de costos (tiempo, personal, material).
• Al disminuir el número de casos disminuyen también los errores
asociados a la manipulación de los datos.
• Puede confiarse en la generalización de los resultados si se ha tenido
cuidado al seleccionar la muestra.
Criterios para la selección de la muestra
Salvo en poblaciones muy pequeñas y accesibles nunca se
observan a todas las unidades de la población.
Población infinita
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)
GLOSARIO
Universo o Población total: si no lo conoce con exactitud puede ingresar un número
aproximado. Cuando es muy grande prácticamente no afecta el tamaño de la muestra ni el
margen de error.
Intervalo de confianza: en ambos cuadros el intervalo de confianza utilizado para el
cálculo es 95%. Esto significa que existe un 95% de probabilidad de que el margen de
error sea el calculado para ese tamaño muestral.
Heterogeneidad: en ambos cuadros la heterogeneidad utilizada para los cálculos es del
50%. Esto es el peor caso posible, el que maximiza el margen de error. Significa por
ejemplo que un 50% de la muestra opina una cosa y el otro 50% lo contrario. En cualquier
otro caso, por ejemplo en una proporción de 80% / 20%, el margen de error disminuye.
Margen de error: es el intervalo en el que puede oscilar un resultado. A modo de
ejemplo: si para un universo de 200.000 personas y una muestra de 500 casos el margen
de error es de ± 4.4%, significa que si un resultado es del 50% en realidad está
comprendido entre 45.6% y 54.4%.
Tamaño de la muestra
Depende:
• Del tamaño del universo
• Del nivel de error que esté dispuesto a aceptar
Por grande que sea el universo, con 385 personas puedo estudiar cualquier dato con el mismo nivel de error (E=
5% y N.C. = 95%). Por esta razón el muestreo es tan poderoso.
Nos permite hacer afirmaciones altamente precisas de una gran cantidad de individuos a través de una parte muy
pequeña de los mismos.
El muestreo no funciona bien en universos pequeños
Tamaño de la muestra
• Es el número de unidades a incluir en la muestra.
• Existen varios factores que influyen en el:
* Tiempo y recursos disponibles.
* Modalidad de muestreo.
* Tipo de análisis previsto.
* Varianza o heterogeneidad de la población.
* Margen de error máximo admisible.
* Nivel de confianza de la estimación muestral.
Heterogeneidad de poblaciones
• Cuanto más heterogénea sea la población mayor será su varianza
poblacional lo que implicará mayores tamaños muestrales.
• Cuando se desconoce el valor de la varianza poblacional se recurre
al supuesto más favorable, asumiendo una varianza poblacional
igual a 0,5.
• 0,5 significa que una unidad seleccionada tiene 50% de
posibilidades de pertenecer o no a un grupo específico dentro de
la población.
Fuentes de sesgo/error
• Las poblaciones objetivo y de estudio pueden diferir en cuanto a las variables
que estudiamos.
+ Los individuos que se eligen en la calle pueden ser de mayor edad (mayor
frecuencia de jubilados por ejemplo).
En este caso diremos que las muestras que se elijan estarán sesgadas. Al tipo
de sesgo debido a diferencias sistemáticas entre población objetivo y
población de estudio se denomina sesgo de selección.
• Hay otras fuentes de error/sesgo
+ No respuesta a encuestas embarazosas (consumo de drogas, violencia
doméstica, etc.)
+ Mentir en las preguntas “delicadas”.
• Para evitar este tipo de sesgos se utilizan la técnica de respuesta aleatorizada.
Error aleatorio
El error aleatorio no se suele ajustar a ninguna regla o norma, varían
en cada caso, en su sentido y magnitud, y por ello tiende a anularse
cuando se trata de un número elevado de casos.
Ejemplos:
La diferencia entre el valor del parámetro de una población y el obtenido de una muestra recibe el nombre
de error muestral.
Por muy perfecta que sea la muestra siempre habrá grado de divergencia entre los parámetros estimados y
los de la verdadera población.
Ventajas Inconvenientes
Necesitamos estudiar menos individuos Introducimos error (controlado) en el
y recursos (ahorro de tiempo y dinero). resultado, debido a la propia naturaleza
del muestreo y a la necesidad de
generalizar resultados.
La manipulación de datos es mucho más Se tiene el riesgo de introducir sesgos
simple. Si con una muestra de 1 000 debido a una mala selección de la
individuos tengo suficiente, ¿para qué muestra. Por ejemplo, si la forma en que
quiero analizar un fichero de millones de seleccionamos individuos para la
registros? muestra no es aleatoria, los resultados
pueden verse seriamente afectados.
1. Muestreo aleatorio simple
Muestreo aleatorio simple