Ejercicios Resueltos Tema4 Muestreo Tecnicas Encuesta
Ejercicios Resueltos Tema4 Muestreo Tecnicas Encuesta
Ejercicios Resueltos Tema4 Muestreo Tecnicas Encuesta
Ejercicio 1
En una determinada ciudad deseamos conocer la proporción actual de hogares con más de un
automóvil. Por los datos de un estudio anterior sabemos que del total de 30.521 hogares, 12.530
tenían más de un vehículo. Estableciendo un nivel de confianza del 95,45% y un error e = 4%,
calcular:
Solución
a) A partir de los datos del enunciado podemos conocer la proporción de hogares con más de un
vehículo:
12530
p= = 0,41 Nótese que q = 1- p = 0,59
30521
Dado que se trata de una población finita (N<100.000), para calcular el tamaño muestral
utilizaremos la siguiente fórmula, que incorpora el tamaño poblacional a través de la corrección
para poblaciones finitas:
El tamaño muestral es ligeramente superior a 593. En el cálculo del tamaño muestral los redondeos
son por exceso, por lo que la muestra debe comprender 594 hogares.
Ejercicio 2
Se desea estimar la percepción media (en una escala del 0 al 10) sobre la incidencia del acoso
escolar en una Comunidad Autónoma. Sabiendo por estudios previos que la desviación típica es
3,6, se necesita saber el tamaño muestral necesario con un error admitido de ±0,5 puntos y un nivel
1
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
Solución
Debemos utilizar la fórmula del cálculo de n para la estimación de medias con población infinita:
Ejercicio 3
Solución
- Estimación proporciones
- Población finita: N<100.000
- e=0,04
- Nc=98%
- P=Q supuesto de máxima varianza al desconocerse P
𝑍𝑍 2 𝑃𝑃𝑃𝑃𝑃𝑃
n=
𝑒𝑒 2 (𝑁𝑁−1)+𝑍𝑍 2 𝑃𝑃𝑃𝑃
𝑁𝑁𝑁𝑁 0,98
: = 0,4900 Buscamos la celda 0,4900 y comprobamos a qué Z corresponde
2 2
En la tabla de la curva normal estándar vemos que el Z que más se aproxima a esa probabilidad es
Z= ±2,33. Aplicamos la fórmula:
2
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
n ≈ 837 entrevistas
Ejercicio 4
En un municipio de 1.500.000 habitantes, se sabe que el 60% suele realizar sus compras en grandes
almacenes. Se ha realizado una encuesta para valorar la posibilidad de mantener abiertos dichos
establecimientos en horario nocturno, con una muestra de 900 personas y un nivel de confianza del
95,45%.
Solución
- Población infinita
- P=0,6 Q=0,4
- n= 900
- Nc= 0,9545 por lo que Z= ±2
Utilizando la fórmula del tamaño muestral para poblaciones “infinitas”, puede despejarse el valor
del error:
Una forma análoga es sustituir directamente los datos en la fórmula del tamaño muestral y despejar
el error al final:
0,96 0,96
900·𝑒𝑒 2 = 0,96 ; 𝑒𝑒 2 = ; e= � = 0,0327
900 900
𝑍𝑍 2 𝑃𝑃𝑃𝑃 22 ·0,6·0,4
n= = = 2.400 entrevistas
𝑒𝑒 2 0,022
3
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
Como podemos observar, al reducir el error admisible (siempre que mantengamos el mismo nivel
de confianza) el tamaño muestral necesario aumenta.
c) Para un Nc= 99,5% tenemos que dividir 0,995 entre 2 para localizar el Z correspondiente.
0,995
= 0,4975 Este es el área bajo la curva normal que debemos buscar en las tablas, pues
2
marcará el Z que buscamos: Z=± 2,81.
¿Qué significa un nivel de confianza del 99,5%? Significa que un 99,5% de todas las muestras
posibles que se podrían extraer de la población tendrían un valor de p dentro del margen de error
establecido (p±0,02). Solo se quedarían fuera de ese margen de error el 0,05% restante de las
muestras que pudiéramos extraer. Sin embargo, la desventaja es que, al aumentar el tamaño de la
muestra, aumentan los costes de la investigación.
Como hemos visto en el apartado anterior, también aumentará el tamaño de la muestra si, para un
mismo nivel de confianza, quisiéramos reducir el error admitido.
Ejercicio 5
Se desea realizar un estudio sobre la prevalencia del consumo de cannabis en las Comunidades
Autónomas de Madrid, Castilla-la Mancha y Comunidad Valenciana. Según datos del Ministerio de
Sanidad de 2013, la proporción de consumidores en cada una de esas regiones era la siguiente:
Consumo de
Región Población (Ni)
cannabis (%)
Com. Madrid 6.466.996 9,1
Castilla-La Mancha 2.041.631 6,4
Com. Valenciana 4.959.968 10,8
Total 3 regiones 13.468.595
¿Qué tamaño muestral sería necesario para un estudio actualizado teniendo en cuenta un nivel de
confianza del 99% y un error máximo admitido del 3%? Considere cada región como un estrato
diferente, teniendo en cuenta su tamaño para el cálculo de n.
Solución
4
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
En este diseño, la afijación (el reparto de la muestra entre los distintos estratos) debe considerar el
tamaño de cada estrato respecto al total. Por eso, es necesario calcular el peso de cada uno de ellos:
𝑁𝑁𝑖𝑖
Wi =
𝑁𝑁
La fórmula del tamaño del tamaño muestral tiene en cuenta la varianza conjunta de los estratos
considerando su peso relativo:
Así:
𝑍𝑍 2 (𝑝𝑝𝑝𝑝)𝑆𝑇
n=
𝑒𝑒 2
Peso del
estrato en la
Región Población (Ni) pi qi pi qi Wi
población
(Wi)
Com. Madrid 6.466.996 0,48 0,091 0,909 0,0397051
Castilla-La Mancha 2.041.631 0,15 0,064 0,936 0,0089856
Com. Valenciana 4.959.968 0,37 0,108 0,892 0,0356443
Total 3 regiones 13.468.595 1 0,084335
Ejercicio 6
Una empresa de publicidad quiere conocer la proporción de hogares en los que se escucha una
determinada emisora de radio en una región. Para ello, dicha región se divide en tres estratos:
Municipio A, Municipio B y Área Rural con N1=620, N2=1.210 y N3=340 hogares
respectivamente. Las proporciones pi se aproximan por estimaciones de un estudio anterior:
p1=0,40, p2=0,45 y p3=0,32. Calcule el tamaño de la muestra para estimar la proporción de oyentes
en el conjunto de la región con un error máximo del 5% y un nivel de confianza del 95,45%.
Considerando la diferencia de varianza entre estratos, aplique una afijación de Neyman.
5
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
Solución
Ni Wi pi qi pi qi W i
Al tratarse de una población finita (N total < 100.000), debemos aplicar la siguiente fórmula para
hallar el tamaño total de la muestra:
Ahora debemos repartir el tamaño muestral total entre los distintos estratos según la afijación de
Neyman:
Ni pi qi Ni�𝑝𝑝𝑖𝑖 𝑞𝑞𝑖𝑖
Municipio A 620 0,40 0,60 303,736728
Municipio B 1210 0,45 0,55 601,967399
Área rural 340 0,32 0,68 158,601892
Total 1064,30602
303,736728
Municipio A: n1= 327 = 93,32 ≈ 93 hogares
1064,30602
601,967399
Municipio B: n2= 327 = 184,95 ≈ 185 hogares
1064,30602
158,601892
Área rural: n3= 327 = 48,73 ≈ 49 hogares
1064,30602
6
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
Ejercicio 7
Edad
Solución
Para calcular las cuotas correspondientes a cada categoría de sexo y edad, vemos su peso en el
conjunto de la población. Por ejemplo, la cuota correspondiente a los hombres de 18-34 años es:
25453
= 0,099
256970
Así, para cada una de las categorías de la población, obtenemos los siguientes resultados:
Edad
Una vez establecidas las cuotas, distribuimos proporcionalmente la muestra entre las distintas
categorías de la población. Sabiendo los datos del presupuesto municipal y el coste de cada
entrevista, hallamos el número de entrevistas a realizar (tamaño muestral):
15000
n= = 750 entrevistas
20
Para calcular el número de entrevistas para los hombres entre 18-34 años hay que ponderar el
número total de entrevistas por la cuota correspondiente a esta categoría (redondeamos los
resultados para ajustarnos al n total presupuestado):
7
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
Edad
Como puede observarse, no hemos utilizado para este supuesto ninguna fórmula probabilística para
el cálculo del tamaño muestral, ya que el muestreo por cuotas, aunque muy utilizado en la fase final
de muchos estudios mediante encuesta, no es un muestro probabilístico. En la práctica, para la
elaboración de encuetas se utilizan diseños mixtos con técnicas probabilísticas en la primera parte
del diseño muestral y cuotas para la selección de individuos solo en la fase final.
*******************************************************************
Ejercicio 2. Solución
b) Para construir la distribución muestral de las medias para muestras de tamaño 2, vamos a
calcular primero cuántas muestras de n=2 podemos obtener con el total de elementos de la
población. Tratándose de una población de N=8, hallamos las combinaciones de 8 elementos,
tomados de 2 en 2:
8!
C8,2 = �8� = = 28 muestras
2 2!·6!
Podemos construir 28 muestras de tamaño 2. Ahora desarrollamos todas las muestras posibles de
n=2 y calculamos el valor de la media muestral 𝑥𝑥̅ para cada una de ellas:
8
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
a, h 12 14 13
b, c 8 6 7
b, d 8 4 6
b, e 8 10 9
b, f 8 18 13
b, g 8 16 12
b, h 8 14 11
c, d 6 4 5
c, e 6 10 8
c, f 6 18 12
c, g 6 16 11
c, h 6 14 10
d, e 4 10 7
d, f 4 18 11
d, g 4 16 10
d, h 4 14 9
e, f 10 18 14
e, g 10 16 13
e, h 10 14 12
f, g 18 16 17
f, h 18 14 16
g, h 16 14 15
Ahora vamos a observar la distribución de frecuencias de las medias muestrales, es decir, cuántas
veces se repite cada una de las medias o, lo que es lo mismo, en cuántas muestras aparece cada
valor de la media. Para ello construimos una tabla de frecuencias donde el valor de las medias se
ordena de menor a mayor (tal como hacemos en cualquier otra distribución de frecuencias con una
variable cuantitativa):
𝑥𝑥̅ Frecuencia
5 1
6 1
7 2
8 2
9 3
10 3
11 4
12 3
13 3
14 2
15 2
16 1
17 1
A simple vista observamos que el valor que más repite de esta distribución (la moda) es
𝑥𝑥̅ = 11. Algo que también podemos comprobar con la representación gráfica de los datos.
9
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
c) Tomando los valores de 𝑥𝑥̅ como discretos, podemos construir un diagrama de barras:
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
En el gráfico se aprecia que las medias de las distintas muestras convergen hacia el valor de la
media poblacional que hallamos en el apartado a): µ = 11
µ𝑥𝑥̅ =11
Podemos comprobar a través de este ejercicio que el parámetro poblacional coincide con la media
de los estadísticos muestrales. Es decir, que la media poblacional coincide con la media de todas las
medias muestrales:
µ𝑥𝑥𝑖𝑖 = µ𝑥𝑥̅
Ejercicio 3. Solución
- Estimación proporciones
- Población infinita: N>100.000
- e= 5% = 0,05
- Nc=95% entonces Z= ±1,96
- P=Q=0,5 supuesto de máxima varianza al desconocerse P
10
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
Ejercicio 4. Solución
e= 2% = 0,02
Nc=99% entonces Z= ±2,58
Nótese que en comparación con el ejercicio anterior, vamos a calcular el tamaño muestral con unas
condiciones más exigentes: es menor el error (e) que estamos dispuestos a admitir, y es mayor el
nivel de confianza (Nc) que exigimos a la estimación a partir de un tamaño muestral (n)
Al establecer unas condiciones más exigentes para la estimación del resultado del referéndum, el
número de individuos que debe formar parte de la muestra ha aumentado considerablemente.
Ejercicio 5. Solución
N= 100.000
e= 0,05
Nc= 95,45% de forma que Z= ±2
P=Q=0,5 supuesto de máxima varianza
𝑍𝑍 2 𝑃𝑃𝑃𝑃 22 ·0,5·0,5
n= = = 400 individuos
𝑒𝑒 2 0,052
Como puede comprobarse, para N = 100.000 el tamaño de la muestra (n) resulta prácticamente
idéntico aplicando o no el factor de corrección para poblaciones finitas. Por eso, no es necesario su
uso cuando el tamaño poblacional es igual o mayor a 100.000 individuos.
Ejercicio 6. Solución
N ≥ 100.000
e = 2,5% = 0,025
11
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
Ejercicio 7. Solución
N ≥ 100.000
e=3
Nc= 95,45%
σ=4
𝑍𝑍 2 · 𝜎𝜎 2 22 · 42 64
n= = = = 7,1 ≈ 8 individuos
𝑒𝑒 2 32 9
Con una muestra de únicamente 8 personas podemos estimar el tiempo medio en que los parados
encuentran empleo. Este reducido n se debe fundamentalmente a que una desviación típica de tan
solo 4 meses en relación con el recorrido de la variable implica que existe bastante homogeneidad
en el tiempo en que los parados encuentran normalmente empleo. Por eso, solo hace falta conocer
muy pocos casos para estimar el comportamiento del conjunto total.
Se propone al estudiante calcular el tamaño muestral suponiendo que la dispersión es mayor, por
ejemplo, una desviación típica de un año (12 meses) exigiendo mayor precisión a la estimación:
reduciendo el error a 1 mes y/o trabajando con un nivel de confianza del 98%. Compare los
resultados con el tamaño muestral anterior.
Con ello podremos comprobar que el tamaño de la muestra no depende tanto del tamaño de la
población como de la varianza, del error admitido y del nivel de confianza.
Ejercicio 8. Solución
Estamos ante un ejercicio de muestreo estratificado uniforme. A partir del enunciado sabemos que
en cada una de las 5 provincias de Castilla-La Mancha se han realizado 968 entrevistas (n es igual
para todas las provincias, de ahí que sea un muestreo estratificado uniforme). Consideramos cada
provincia como un estrato diferente.
𝑊𝑊𝑖𝑖
ui =
𝑤𝑤𝑖𝑖
12
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
𝑁𝑁𝑖𝑖
Wi =
𝑁𝑁
Wi
Albacete 55.845 0,2178789
Ciudad Real 62.992 0,2457629
Cuenca 26.289 0,1025664
Guadalajara 29.633 0,115313
Toledo 81.553 0,3181786
Total (N) 256.312
Ahora calculamos el wi de cada estrato. Dado que se trata de una estratificación uniforme, todos
los wi serán idénticos, pues el tamaño muestral de cada estrato es idéntico. Si observamos la tabla
de datos muestrales del enunciado, basta con que hagamos el cálculo para un estrato (una
provincia):
𝑛𝑛𝑖𝑖 968
wi = = = 0,2
𝑛𝑛 4.840
𝑊𝑊𝑖𝑖
ui =
𝑤𝑤𝑖𝑖
Wi 𝑤𝑤𝑖𝑖 ui
Albacete 55.845 0,217878991 0,2 1,08939496
Ciudad Real 62.992 0,245762976 0,2 1,22881488
Cuenca 26.289 0,102566403 0,2 0,51283202
Guadalajara 29.633 0,115613003 0,2 0,57806501
Toledo 81.553 0,318178626 0,2 1,59089313
Total (N) 256.312
Los coeficientes > 1 indican que el estrato (en este caso, las provincias de Albacete, Ciudad Real y
Toledo) han sido infrarrepresentadas en la muestra, mientras que los estratos cuyo ui <1 han sido
sobrerrepresentados en la muestra.
b) Ahora debemos estimar la proporción total de activas en Castilla –La Mancha a partir de los
datos de la muestra, teniendo en cuenta que se trata de un muestreo estratificado uniforme.
Para ello, obtenemos la cantidad de activas en cada una de las provincias ajustando esta frecuencia
con el coeficiente de ponderación ui. Por ejemplo, para Albacete:
13
Estadística Social (Grado en Criminología) Ejercicios resueltos Tema 4
Haciendo la misma operación, obtenemos la frecuencia ponderada de activas para todas las
provincias. La frecuencia ponderada total de activas de Castilla-La Mancha será la suma de las
frecuencias ponderadas de cada estrato:
Datos de la muestra
Frecuencia ponderada:
Activas ui nº Activas x ui
Albacete 447 1,089395 486,95957
Ciudad Real 402 1,228815 493,98363
Cuenca 406 0,512832 208,20979
Guadalajara 487 0,578065 281,51766
Toledo 445 1,590893 707,94739
Total (N) 2.187 2178,618
La proporción total de activas en Castilla-La Mancha, que es lo que nos pide el ejercicio, es el
resultado de dividir el total ponderado de activas entre el número de entrevistas realizadas, es decir,
entre el tamaño muestral (n=4.840):
2178,618
Proporción total de activas = = 0,45 (45%)
4840
Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0
Internacional.
La autoría de este trabajo corresponde a los siguientes profesores del Departamento de Sociología I
de la UNED: Beatriz Mañas Ramírez, Alejandro Almazán Llorente y Luis Alfonso Camarero
Rioja.
http://www2.uned.es/socioestadistica/Crim/Ejercicios_resueltos_Tema4_Muestreo_Tecnicas_encu
esta.pdf
14