Población y Muestra

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 60

UNIDAD III: MUESTREO Y TÉCNICAS DE RECOLECCIÓN DE DATOS

POBLACIÓN Y MUESTRA
1. Población
2. Muestra
3. Muestreo
4. Tamaño de muestra
5. Tipos de muestreo
Muestreo probabilístico
+ Aleatorio simple
+ Aleatorio sistemático
+ Aleatorio estratificado
+ Aleatorio por conglomerados

Muestreo no probabilístico
+ Muestreo por cuotas
+ Muestreo por conveniencia
+ Muestreo por conglomerados
Ejemplo:

¿Qué porcentaje de los habitantes de México


fuma habitualmente?
- Contactar con todos los habitantes de
(1 000) México (122 millones de personas) y
preguntarles si fuman.
- Seleccionar un conjunto de individuos (ej.
1 000 personas), preguntarles si fuman y
usar esta información como una
aproximación de la información buscada.
Este grupo de 1000 personas que me
permiten conocer mejor como se comportan
el total de mexicanos es una muestra, y la
Población forma en que los seleccionamos es la técnica
(122 millones) de muestreo.
1. Introducción
La representatividad de una muestra, permite extrapolar y por ende generalizar los
resultados observados en ésta, a la población accesible; y a partir de esta a la
población blanco.
Una muestra será representativa sólo si fue seleccionada al azar, es decir que todos
los sujetos de la población blanco tuvieron la misma posibilidad de ser
seleccionados en esta muestra y por ende ser incluidos en el estudio.
Por otro lado, que el número de sujetos seleccionados representen numéricamente
a la población que le dio origen respecto de la distribución de la variable en estudio
en la población, es decir, la estimación o cálculo de tamaño de la muestra.
Es así como el análisis de muestra permite realizar inferencias, extrapolar o
generalizar conclusiones a la población blanco con un alto grado de certeza; de tal
modo que una muestra se considera representativa de la población blanco, cuando
la distribución y valor de las diversas variables se pueden reproducir con márgenes
de error calculables.
Población y muestra Ejemplo:

Población: Los habitantes de México


Población de estudio: Fumadores de México

Muestra.- Es el conjunto de individuos de la


población que se selecciona para estudiarlos,
por ejemplo a través de una encuesta (técnica
de recolección de datos)
¿Porqué funciona el muestreo?
Es útil gracias a que podemos acompañarlo de un proceso inverso, que llamamos
generalización de resultados. Es decir, para conocer un universo lo que hacemos
es:
1. Extraer una muestra del mismo
2. Medir un dato
3. Proyectar en el universo el resultado observado en la muestra.

La generalización de resultados añade cierto error al dato que medimos.

El azar podría hacer que el porcentaje de fumadores en la población fuese algo


diferente (en el ejemplo anterior).

Por lo tanto, la generalización de resultados de una muestra a un universo conlleva


a aceptar que cometemos cierto error como ilustra el siguiente esquema:
¿Porqué funciona el muestreo?

Afortunadamente, el error cometido


al generalizar resultados puede
acotarse gracias a la estadística.
Para ello suelen usarse 2 parámetros:
1.El margen de error
Es la máxima diferencia entre el dato
observado en la muestra y el dato real en
el universo.
2. El nivel de confianza
Es el nivel de certeza que se tiene de que
el dato real está dentro del margen de
error.
Conceptos básicos
Población
• Conjunto completo de personas, animales u objetos con una característica o atributo observable.

Muestra
• Es un subconjunto obtenido de la población de estudio, una vez que se ha decidido escoger una
muestra, se deben tener presente:
• + La determinación del mínimo tamaño muestral requerido.
• + El procedimiento de selección de la muestra, también conocida como diseño muestral (tipo de
muestreo).

La representatividad de una muestra está dada por su tamaño y su tipo de


muestreo
Criterios de selección
Son todas aquellas características que deben poseer las unidades de observación
para ser consideradas como parte de la población de estudio.

Se pueden describir también criterios de inclusión y criterios de exclusión por


separado.

Tamaño muestral
• Para la mayoría de estudios, el mínimo tamaño muestral requerido se estima a
través de la aplicación de fórmulas.
• Existe una fórmula para cada tipo de estudio en particular.
Grupo de estudio
Este término ha sido utilizado ampliamente con el advenimiento de los
estudios de tipo experimental (grupo de sujetos de experimentación).
Conceptos básicos

Muestreo
• Es el proceso de seleccionar un conjunto de individuos de una población
con el fin de estudiarlos y poder caracterizar el total de la población.

Razones de muestreo
• Disminución de costos (tiempo, personal, material).
• Al disminuir el número de casos disminuyen también los errores
asociados a la manipulación de los datos.
• Puede confiarse en la generalización de los resultados si se ha tenido
cuidado al seleccionar la muestra.
Criterios para la selección de la muestra
Salvo en poblaciones muy pequeñas y accesibles nunca se
observan a todas las unidades de la población.

Se debe diseñar una muestra que constituya una representación a


pequeña escala de la población a la que pertenece.

Cualquier diseño muestral comienza con la búsqueda de la


información que ayude a la identificación de las características de
la población bajo estudio.
Condiciones que debe cumplir una buena muestra

• Que comprendan parte de la población y no la totalidad


de ésta.
• Aunque el sentido común pareciera indicar que
poblaciones más grandes deben producir muestras
mayores, esto no es siempre cierto ya que:
* El tamaño de la población no es el único elemento que influye en el
tamaño de la muestra.
Condiciones que debe cumplir una buena muestra
• La ausencia de distorsión en la elección de los elementos
de la muestra.
* Si esta elección presenta alguna anomalía, la muestra resultará por este mismo hecho viciada,

• Que sea representativa o reflejo fiel de la población, de tal


modo que reproduzca sus características básicas en orden
a la investigación.
• Si hay sectores diferenciados en la población que se
supone ofrecen características especiales la muestra
también deberá comprenderlos en la misma proporción.
Ejemplo:
Se quiere estimar la proporción de un determinado parámetro en
una población de N = 1500, con un nivel de confianza del 95%
(Z = 1,96). Adoptamos un margen de error e = 6% (0,06) y, como no
tenemos datos previos, estimamos una proporción de cumplimiento
del 50% (0,5).

1 500 . 1,962 . 0,5 . O,5


n = ________________________________________ = 227
(1500 – 1) . 0,062 + 1,962 . 0,05 . 0,05
Población finita
En donde:
N = tamaño de la población
Z = nivel de confianza (calculado en las tablas del área de la curva normal)
P = proporción esperada (probabilidad a favor)
Q = probabilidad de fracaso (probabilidad en contra)
D = precisión (Error máximo admisible en términos de proporción).

Población infinita
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)
GLOSARIO
Universo o Población total: si no lo conoce con exactitud puede ingresar un número
aproximado. Cuando es muy grande prácticamente no afecta el tamaño de la muestra ni el
margen de error.
Intervalo de confianza: en ambos cuadros el intervalo de confianza utilizado para el
cálculo es 95%. Esto significa que existe un 95% de probabilidad de que el margen de
error sea el calculado para ese tamaño muestral.
Heterogeneidad: en ambos cuadros la heterogeneidad utilizada para los cálculos es del
50%. Esto es el peor caso posible, el que maximiza el margen de error. Significa por
ejemplo que un 50% de la muestra opina una cosa y el otro 50% lo contrario. En cualquier
otro caso, por ejemplo en una proporción de 80% / 20%, el margen de error disminuye.
Margen de error: es el intervalo en el que puede oscilar un resultado. A modo de
ejemplo: si para un universo de 200.000 personas y una muestra de 500 casos el margen
de error es de ± 4.4%, significa que si un resultado es del 50% en realidad está
comprendido entre 45.6% y 54.4%.
Tamaño de la muestra
Depende:
• Del tamaño del universo
• Del nivel de error que esté dispuesto a aceptar

Cuanta más precisión se exija, mayor muestra se


necesita.
Si se quiere tener una certeza absoluta en los
resultados, hasta el último decimal, la muestra tendrá
que ser tan grande como el universo.

A medida que se estudia universos mayores, el


tamaño de muestra que se necesita cada vez
representa un porcentaje menor de dicho universo
Tamaño de la muestra – ejemplo:
Mediante una encuesta se recoge datos para conocer el porcentaje de individuos
que fuman, con un margen de error del 5% y un nivel de confianza del 95%.

Universo Muestra Porcentaje del


universo (%)
100 79,5 79,5
1 000 277,7 27
100 000 382,7 3,83

A medida que se trabaja con universos más grandes, la muestra que se


necesita debe ir creciendo pero de forma no proporcional, tiende a
estancarse y cada vez representa un porcentaje más pequeño del universo.
A partir de cierto tamaño del universo (100 000), el tamaño de la muestra ya
no necesita crecer más
Tamaño de muestra (error = 5% y confianza = 95%)
Universo Muestra necesaria Porcentaje (%)
10 10 100
100 80 80
1 000 278 27,8
10 000 370 3,7
100 000 383 0,38
1 000 000 384 0,38
10 000 000 385 0,004
100 000 000 385 0,0004

Por grande que sea el universo, con 385 personas puedo estudiar cualquier dato con el mismo nivel de error (E=
5% y N.C. = 95%). Por esta razón el muestreo es tan poderoso.
Nos permite hacer afirmaciones altamente precisas de una gran cantidad de individuos a través de una parte muy
pequeña de los mismos.
El muestreo no funciona bien en universos pequeños
Tamaño de la muestra
• Es el número de unidades a incluir en la muestra.
• Existen varios factores que influyen en el:
* Tiempo y recursos disponibles.
* Modalidad de muestreo.
* Tipo de análisis previsto.
* Varianza o heterogeneidad de la población.
* Margen de error máximo admisible.
* Nivel de confianza de la estimación muestral.
Heterogeneidad de poblaciones
• Cuanto más heterogénea sea la población mayor será su varianza
poblacional lo que implicará mayores tamaños muestrales.
• Cuando se desconoce el valor de la varianza poblacional se recurre
al supuesto más favorable, asumiendo una varianza poblacional
igual a 0,5.
• 0,5 significa que una unidad seleccionada tiene 50% de
posibilidades de pertenecer o no a un grupo específico dentro de
la población.
Fuentes de sesgo/error
• Las poblaciones objetivo y de estudio pueden diferir en cuanto a las variables
que estudiamos.
+ Los individuos que se eligen en la calle pueden ser de mayor edad (mayor
frecuencia de jubilados por ejemplo).
En este caso diremos que las muestras que se elijan estarán sesgadas. Al tipo
de sesgo debido a diferencias sistemáticas entre población objetivo y
población de estudio se denomina sesgo de selección.
• Hay otras fuentes de error/sesgo
+ No respuesta a encuestas embarazosas (consumo de drogas, violencia
doméstica, etc.)
+ Mentir en las preguntas “delicadas”.
• Para evitar este tipo de sesgos se utilizan la técnica de respuesta aleatorizada.
Error aleatorio
El error aleatorio no se suele ajustar a ninguna regla o norma, varían
en cada caso, en su sentido y magnitud, y por ello tiende a anularse
cuando se trata de un número elevado de casos.

Los errores aleatorios se cometen, por ejemplo:

• Cuando un encuestado elige erróneamente una casilla queriendo hacerla en


otra,
• Cuando un encuestador marca erróneamente un dato, etc.
Error sistemático
Un error sistemático es aquél que se produce de igual modo (sentido y proporción) en todas las
mediciones que se realizan sobre un parámetro de la muestra.

Contrario al error aleatorio, no se anula en muestras grandes.

Ejemplos:

• Las tendencias subjetivas conscientes o inconscientes del investigador.


• Sustituciones, según criterio propio del investigador, de unidades de la muestra que habían sido
elegidas al azar.
• Insuficiente observación del conjunto de la población que influye en una deficiente definición
de sus características.
Error muestral
Cuando se extrae una muestra de la población es frecuente que los resultados obtenidos de la muestra no
sean exactamente los valores reales de la población.

El error de muestreo ocurre al estudiar una muestra en lugar de la población total.

La diferencia entre el valor del parámetro de una población y el obtenido de una muestra recibe el nombre
de error muestral.

Por muy perfecta que sea la muestra siempre habrá grado de divergencia entre los parámetros estimados y
los de la verdadera población.

En el cálculo del error intervienen:


• Tamaño de la muestra
• Varianza poblacional
• Nivel de confianza
• Tipo de muestreo
Ventajas e inconvenientes del muestreo

Ventajas Inconvenientes
Necesitamos estudiar menos individuos Introducimos error (controlado) en el
y recursos (ahorro de tiempo y dinero). resultado, debido a la propia naturaleza
del muestreo y a la necesidad de
generalizar resultados.
La manipulación de datos es mucho más Se tiene el riesgo de introducir sesgos
simple. Si con una muestra de 1 000 debido a una mala selección de la
individuos tengo suficiente, ¿para qué muestra. Por ejemplo, si la forma en que
quiero analizar un fichero de millones de seleccionamos individuos para la
registros? muestra no es aleatoria, los resultados
pueden verse seriamente afectados.
1. Muestreo aleatorio simple
Muestreo aleatorio simple

• Es la técnica más simple de muestreo a partir de la cual se desarrollan el resto de


técnicas.
• Un muestreo aleatorio simple es aquella en la que se seleccionan individuos del
universo de forma totalmente aleatoria.
• Esto implica que todos los individuos deben tener idéntica probabilidad de ser
seleccionados para la muestra.
• Sólo en entornos muy controlados es posible hacer muestreo aleatorio.
• Cuando se tiene universos compuestos por grupos homogéneos entre sí de
individuos, se puede aprovechar esta agrupación para mejorar la precisión de la
muestra o reducir el tamaño de la muestra.
2. Muestreo aleatorio sistemático
3. Muestreo aleatorio estratificado
4. Muestreo por conglomerados

También podría gustarte