NC03M

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 23

Muestreo Aleatorio Simple

Introducción

El muestreo aleatorio simple (m.a.s.) es un diseño muestral muy popular, dadas las propie-
dades que posee con respecto a las estimaciones de parámetros y de errores de muestreo. Es un

diseño de tamaño fijo y exige disponer de un marco poblacional con sus elementos muy bien
identificados, por lo que su uso es frecuente junto con otras técnicas.
Se puede usar la librerı́a animation para mostrar la idea básica de este tipo de muestreo:

# Animaci ó n con R
library ( animation )
sample.simple ( nrow =10 , ncol =10 , size =15 , p.col = c ( " blue " , " red " ) ,
p.cex = c (1 ,3))

1
Definición del diseño m.a.s. y parámetros asociados

Es un diseño de tamaño fijo n y exige disponer de un marco poblacional con sus elementos
bien identificados.
A partir de una población U = {u1 , . . . , uN } se toma una muestra de tamaño n: {ui1 , . . . , uin }

Ası́,
S = {Todos los subconjuntos de tamaño n sin elementos repetidos, donde el orden de
los elementos no importa}

El diseño muestral es (S, P (·)) donde

1
P (s) =  
N
n
En el tema anterior ya se vieron algunas propiedades de este diseño:

– La probabilidad de inclusión de un elemento de la población es:

n
πk = =f
N

para k = 1, . . . , N , donde f se denomina fracción de muestreo.

Del mismo modo,


n(n − 1)
πkl =
N (N − 1)
para k ̸= l.
n
πkk = πk =
N
Por otro lado

f (1 − f )
∆kl = Cov(Ik , Il ) = πkl − πk πl = −
N −1
n  n 2
∆kk = − = f (1 − f )
N N

– Es un diseño muestral cuantificable, πk y πkl > 0, y dado que es de tamaño fijo y

∆kl = πkl − πk πl < 0

para k ̸= l = 1, . . . , N , se pueden obtener estimadores no negativos del error de muestreo.

En general, una muestra se extrae de forma secuencial, es decir se obtiene elemento a


elemento. Aunque con R es trivial hacerlo usando el comando sample.

2
U = c ( " Manolo " , " Luisa " , " Pedro " , " Eva " , " Juan " )
N = length ( U )

# Mira la ayuda de sample


help ( sample )

sam = sample (N , 2 , replace = FALSE )


U [ sam ]

[1] " Eva " " Juan "

Estimación de parámetros poblacionales

Dada U población finita de tamaño N , consideramos la variable aleatoria en estudio X y


deseamos estimar la media y el total poblacional usando m.a.s.(N, n) mediante el estimador de

Horvitz-Thompson.

Se tienen los siguientes resultados:

– Media
N
1 X
X= Xi
N i=1
Ya se vio en el tema anterior que:

i)
n
b = 1 XX
X i
n i=1

es un estimador insesgado de X

ii ) Además,
b = 1 − f S2
V (X) X
n
donde

N
2 1 X
SX = (Xi − X)2
N − 1 i=1
y
n
f=
N

iii ) El estimador de la varianza insesgado para V (X)


b es

b = 1 − f Sb2
Vb (X) X
n
3
tal que
n
2 1 X b 2
SbX = (Xi − X)
n − 1 i=1
es decir, la cuasivarianza muestral.

– Total
N
X
X= Xi
i=1

i)
b = NX
X b

es un estimador insesgado de X.

ii )
b = N 2 (1 − f ) SX
V (X) 2
n

iii ) Un estimador insesgado de V (X)


b es

b = N 2 (1 − f ) Sb2
Vb (X) X
n

Observación:

En una población infinita la varianza de la media muestral es


σ2 S2

n n
si la población es finita, el único cambio que presenta dicha varianza es la introducción del

factor
N −n
=1−f <1
N

Este factor (1 − f ) se denomina factor de corrección para poblaciones finitas (finite

population correction) fpc. Resalta la alteración que se produce al trabajar con poblaciones
finitas.
En la varianza de la media muestral se ve que a medida que crece la fracción de muestreo

f , disminuye la varianza, o lo que es lo mismo: a medida que aumenta el tamaño muestral la


fracción de muestreo crece y disminuye la varianza del estimador de la media poblacional.
En la práctica el fpc se puede ignorar siempre y cuando la fracción de muestreo no exceda del

5 % (es decir sea menor que 0.05). Pero, ignorar el fpc equivale a sobrestimar el error estándar
del estimador de la media poblacional X.

4
Intervalos de Confianza

Si se asume que las estimaciones de X


b y de X
b se distribuyen como una normal entonces los

intervalos de confianza al (1 − α) % son

i) Para la media X: r
b ∓ zα 1 − f b2
X SX
2
n
donde
n
2 1 X b 2
SbX = (Xi − X)
n − 1 i=1

ii) Para el total X: r


b ∓ zα N 2 (1 − f ) b2
X SX
2
n

Si el tamaño muestral es menor que 50, es más correcto utilizar una distribución t-Student
con (n − 1) grados de libertad.

Determinación tamaño muestral n

Una cuestión importante es decidir cuantos elementos deben formar parte de la muestra. Este
tamaño muestral dependerá del error que estemos dispuestos a asumir al obtener estimaciones.
Pero además, habrá que tener en cuenta el presupuesto disponible y los costes que se deriven

del muestreo.
La forma estándar de proceder es fijar un error de muestreo que deberá ser el mı́nimo posible,
aunque hay varios criterios para fijarlo.

– Fijar σ(θ)
b

– Fijar el error máximo admisible

– Fijar el error de muestreo relativo


σ(θ)
b
E(θ)
b

Vamos a considerar los casos de la estimación de la media X y el total X.

5
Obtención de n al estimar X

Fijar σ(θ)
b

Sabemos que r
2
  SX
σ X
b = (1 − f )
n
Si consideramos un error de muestreo e fijo como máximo, debemos encontrar n tal que
r
S2 S2 S2
e = (1 − f ) X ⇒ X = e2 + X
n n N

Despejando
2 2
SX N SX
n= 2 = 2
e2 +
SX N e2 + SX
N
Observaciones:

La expresión obtenida depende del tamaño poblacional N.


Si el tamaño de la población aumenta indefinidamente, en el lı́mite
2
SX
n −→
N →∞ e2

que es un valor constante. Es decir, no hace falta tomar una muestra más grande.
2
Un problema que se plantea es que, para obtener n, se necesita calcular SX . La solución

consiste en usar una muestra piloto de tamaño n′ .

Fijar el error máximo admisible

El error máximo admisible d es la precisión mı́nima exigible y es la diferencia en valor


absoluto entre el verdadero valor del parámetro y su estimación.
Fijado d y un nivel de confianza 1 − α se busca el tamaño muestral n tal que en el (1 − α) %

de las muestras se vaya a obtener un error máximo de d, es decir


 
b − X| ≤ d ≥ 1 − α ⇔
P |X

!
|X
b − X| d
P ≤ ≥ 1−α
e e

Si asumimos normalidad de X
b se obtiene que

d
= z α2 ⇒ d = z α2 e
e
6
Si consideramos el apartado anterior y observando que fijar un error máximo admisible d es
d
equivalente a fijar un error de muestreo e = zα
el tamaño muestral a utilizar será
2

2 2
SX SX
n= 2
SX
= 2 ⇒
e2 + d
2
SX
N

+ N
2

 z α 2
2
SX 2
d
n= 2
 z α 2
SX
1+ N
2
d

Fijar un error relativo de muestreo

Sea
σ(θ)
b
er =
E(θ)
b
un error de muestreo dado (equivalentemente coeficiente de variación).
Se trata de buscar n para un valor fijo de er :
q
S2
σ(θ)
b σ(X)
b (1 − f ) nX
er = = = ⇒
E(θ)
b E(X)
b X

SX 2

X
n =  2
SX

e2r + X
N

CV 2
n = 2
e2r + CV
N

SX
donde el coeficiente de variación CV = X
y se debe estimar a partir de una muestra piloto.

Se puede observar que se obtiene la misma expresión que en el caso de fijar σ(θ)
b sustituyendo

SX por CV.

Obtención de n al estimar el total

Fijar σ(θ).
b

Dado que
X
b = NX
b

7
entonces se trata de fijar r
2
    SX
e X =σ X
b b =N (1 − f )
n
luego aplicando el resultado anterior, se obtiene que
 
SX2
2
N b )2
e(X
n=  
2
SX
1+ b )2
N
e(X

En este caso se observa que cuando aumenta indefinidamente el tamaño de la población hay
que aumentar también el tamaño de la muestra.

Fijando el error máximo admisible

Se fijan d y α tales que


 
P |X
b − X| ≤ d ≥ 1 − α

Se sabe que fijar d equivale a fijar

d
= z α2 ⇒ d = z αs e
e

y se obtiene como en el caso de la media


 z α 2
N 2 SX
2
d
s

n=  z α 2
2
1 + N SX s
d

Fijando un error relativo de muestreo

Si fijamos
σ(θ)
b σ(X)
b N σ(X)
b
er (X) =
b = = = er (X)
b
E(θ)
b E(X)
b N E(X)
b

Es decir, coincide con el caso de la estimación de la media

Observaciones
En general los pasos a seguir para elegir el tamaño de la muestra pueden resumirse en:

i) Se debe preguntar: ¿Cuánta precisión se necesita? ¿en términos de qué se define una
precisión?

8
ii) Determinar una ecuación que relacione el tamaño de la muestra n y las expectativas que

se tienen con respecto a la muestra.

iii) Estimar normalmente mediante una muestra piloto las cantidades desconocidas para de-
terminar n.

iv) Si el tamaño muestral obtenido es demasiado grande, replantear la precisión inicial fijada.

9
Muestreo aleatorio simple con reemplazamiento

Un muestreo aleatorio simple con reemplazamiento es simplemente un m.a.s.(N, n) en el


que devolvemos, en cada extracción, el elemento obtenido al conjunto original.
El m.a.s. con reemplazamiento consiste en seleccionar en cada extracción un elemento de U
1
con probabilidad constante igual a , es decir
N
1
pk = ,
N

para todo k = 1, . . . , N.

Si consideramos las muestras ordenadas de tamaño n, el espacio muestral está formado por
N n muestras, todas ellas equiprobables:

1
P (s) =
Nn

para todo s ∈ S donde S = {Muestras ordenadas de n elementos con reposición}

En una muestra de tamaño n un elemento dado puede aparecer un cierto número de veces.
Si denominamos Nr = número de veces que aparece en una muestra la unidad r
Entonces

   k  n−k
n 1 1
P {Nr = k} = 1−
k N N
Ası́ Nr ∼ Bin(N, N1 ).

Las probabilidades de inclusión (que está al menos en una muestra s) son

P {k ∈ s} = πk = 1 − P {k ∈
/ s} =

1 − P {en todas las extracciones no salga k}


 n
1
= 1− 1−
N

para k = 1, . . . , N.

10
Por otro lado, para k ̸= l = 1, . . . , N

πkl = P {k, l ∈ s} = 1 − P {k ó l ∈
/ s} =

1 − [P {k ∈
/ s} + P {l ∈
/ s} − P {k, l ∈
/ s}] =

1 − [2(1 − πk ) − P {en las n extracciones no salgan k, l}] =

  n  n 
1 2
1− 2 1− − 1− =
N N

 n  n
1 2
1−2 1− + 1−
N N

Estimadores de X y X

Basándonos en el estimador de Hansen-Hurwitz se obtiene que:

Estimación de X:

Media muestral
b = 1 XX
X k
n k∈s

N  1 2
  1X X
N k 1
V X =
b
1 −X =
n k=1 N
N
N
1 X 2 1 2 1N −1 2
Xk − X = σX = SX
nN k=1 n n N

2 2
donde σX es la varianza poblacional y SX es la cuasivarianza poblacional.
El estimador es
  1 X 2 1 2
V X
b b = Xk − X = SbX
b
n(n − 1) k∈s n
2
donde SbX es la cuasivarianza muestral.

11
Estimación del total X:

Como X = N X, entonces

X
b = NX
b

  N2 2
V X
b = σ
n X

  N 2 b2
Vb X
b = S
n X

Comparación entre el muestreo m.a.s con y sin reposición

La pregunta que se plantea es cuál de los dos tipos de muestreo es más preciso, o tiene
menor error.
Si se comparan las varianzas
 
Vmasr X b 1 N −1 2
SX 1 − N1 1
n N
  = 1 2
= ≃
Vmas X b n
(1 − f )SX 1−f 1−f

dado que N es grande.


Ası́, si f es pequeña las dos muestras son igual de eficientes, es decir, si se muestrean pocos
elementos de una población grande, es lo mismo elegirlos con o sin reemplazamiento.
   
Si f es grande, entonces Vmasr X ≥ Vmas X
b b .
   
Por ejemplo, si f = 0,5 entonces Vmasr X ≈ 2Vmas X
b b .

12
Ejemplo con R
# Generas unos datos artificiales
set.seed (666)
unosdatos = rbind ( matrix ( rep ( " nc " ,165) ,165 ,1 , byrow = TRUE ) ,
matrix ( rep ( " sc " ,70) ,70 ,1 , byrow = TRUE ))
genero = rbinom (235 , 1 , 0 .43 )
genero [ genero ==1]= " M "
genero [ genero ==0]= " H "
unosdatos = c b in d . d a t a . f r a m e ( unosdatos , c ( rep (1 ,100) , rep (2 ,50) ,
rep (3 ,15) , rep (1 ,30) , rep (2 ,40)) , genero ,100 * runif (235))

dim ( unosdatos )
names ( unosdatos ) = c ( " provincia " , " region " , " genero " , " ingresos " )
head ( unosdatos )

provincia region genero ingresos


1 nc 1 M 61 .050833
2 nc 1 H 41 .378524
3 nc 1 M 63 .162693
4 nc 1 H 2 .017675
5 nc 1 H 56 .045284
6 nc 1 M 21 .955715

N = dim ( unosdatos )[[1]]


n = 50

# Selecci ó n de una muestra aleatoria


srs _ cuales = sample (N , n )
srs = unosdatos [ srs _ cuales , ]

library ( survey )
srs $ popcuanto = N
srs $ pesos = N / n

dsrs = svydesign ( id =∼1 , fpc =∼popcuanto , data = srs )


summary ( dsrs )

Independent Sampling design


svydesign ( id = ∼1 , fpc = ∼popcuanto , data = srs )
Probabilities :
Min. 1 st Qu. Median Mean 3 rd Qu. Max.
0 .2128 0 .2128 0 .2128 0 .2128 0 .2128 0 .2128
Population size ( PSUs ) : 235
Data variables :
[1] " provincia " " region " " genero " " ingresos " " popcuanto " " pesos "

svytotal (∼ingresos , dsrs , na.rm = TRUE )

total SE
ingresos 14180 810 .37

13
svymean (∼ingresos , dsrs , na.rm = TRUE )

mean SE
ingresos 60 .339 3 .4484

svyvar (∼ingresos , dsrs , na.rm = TRUE )

variance SE
ingresos 755 .25 99 .552

svyquantile (∼ingresos , quantile = c (0 .25 ,0 .5 ,0 .75 ) , design = dsrs ,


na.rm = TRUE , ci = TRUE )

$ quantiles
0 .25 0 .5 0 .75
ingresos 40 .50154 65 .42247 84 .27074

$ CIs
, , ingresos

0 .25 0 .5 0 .75
( lower 31 .15592 46 .49287 76 .89246
upper ) 44 .89626 76 .53099 88 .61348

confint ( svytotal (∼ingresos , dsrs , na.rm = TRUE ))

2 .5 % 97 .5 %
ingresos 12591 .27 15767 .84

confint ( svymean (∼ingresos , dsrs , na.rm = TRUE ))

2 .5 % 97 .5 %
ingresos 53 .57988 67 .09721

par ( mfrow = c (2 ,1))


svyhist (∼ingresos , dsrs , main = " Muestra ponderada " , col = " red " )
hist ( unosdatos $ ingresos , main = " Poblacion " , xlab = " ingresos " ,
col = " yellow " , prob = TRUE )

14
Si no se especifica el tamaño de la población, es necesario especificar las probabilidades de
muestreo o pesos de muestreo.
La variable pesos en el conjunto de datos contiene el peso muestral que es igual a 235/50 =

4,7.
El efecto de omitir el tamaño de la población aparece como (with replacement) en la
salida. La media estimada y el total son los mismos, pero los errores estándar son un poco más

grandes que en el caso de sin reemplazamiento.

dsrsR = svydesign ( id =∼1 , weights =∼srs $ pesos , data = srs )


summary ( dsrsR )

Independent Sampling design ( with replacement )


svydesign ( id = ∼1 , weights = ∼srs _ pesos , data = srs )
Probabilities :
Min. 1 st Qu. Median Mean 3 rd Qu. Max.
0 .2128 0 .2128 0 .2128 0 .2128 0 .2128 0 .2128
Data variables :
[1] " provincia " " region " " genero " " ingresos " " popcuanto " " pesos "

15
svytotal (∼ingresos , dsrsR )

total SE
ingresos 14180 913 .33

svymean (∼ingresos , dsrsR )

mean SE
ingresos 60 .339 3 .8865

confint ( svytotal (∼ingresos , dsrsR , na.rm = TRUE ))

2 .5 % 97 .5 %
ingresos 12389 .46 15969 .66

confint ( svymean (∼ingresos , dsrsR , na.rm = TRUE ))

2 .5 % 97 .5 %
ingresos 52 .72111 67 .95599

svyboxplot ( ingresos∼1 , design = dsrsR , col = " yellow " )

16
Introducción al estudio de variables cualitativas

En una población finita es frecuente querer estimar la proporción de unidades que poseen
cierta caracterı́stica, o el número total de unidades de la población que la poseen.
Por ello se puede definir para todo i = 1, . . . , N

(
1 si i posee la caracterı́stica
Ii =
0 si i no posee la caracterı́stica
Ası́ los parámetros de interés se pueden escribir como
N N
1 X X
P = Ii T = Ii
N i=1 i=1

dado que P es simplemente una X de variables dicotómicas.


Para calcular los estimadores y sus varianzas, entonces se aplican las fórmulas de los esti-

madores de Horwitz-Thompson.
Ası́, la proporción de valores muestrales

1X
Pb = Ik
n k∈s

y como Tb = N Pb
NX
Tb = Ik
n k∈s
Sus varianzas respectivas son
  (N − n) P (1 − P )
V Pb =
N −1 n

  N 2 (N − n) P (1 − P )
V Tb =
N −1 n

Demostración:

Como
  1−f
2
V X
b = SX
n
donde
N
2 1 X 2
SX = Xk − X =
N − 1 k=1
" N #
1 X 2 1   N P (1 − P )
Xk2 − N |{z}
X = NP − NP 2 =
N − 1 k=1 2
N −1 N −1
=P

17
de modo que
N −n
N N P (1 − P ) (N − n)
V (Pb) = = P (1 − P )
n N −1 n(N − 1)

Del mismo modo se demuestra, como Tb = N Pb, la expresión para Tb.

De manera análoga, sustituyendo las expresiones de X


b por Pb en las fórmulas generales de

la media, se pueden obtener los resultados para los estimadores de las varianzas:
  (1 − f ) b
Vb Pb = P (1 − Pb)
n−1

  (1 − f ) b
Vb Tb = N 2 P (1 − Pb)
n−1
donde
1X
Pb = Ik
n k∈s

Muestreo con reemplazamiento

En este caso, sustituyendo las expresiones de X


b por Pb en las fórmulas generales de la media,

para muestreo con reemplazamiento, se obtienen los resultados para las varianzas:
  P (1 − P )
V Pb =
n

  P (1 − P )
V Tb = N 2
n
y los estimadores de las varianzas:
  1 b
Vb Pb = P (1 − Pb)
n−1

  1 b
V Tb = N 2
b P (1 − Pb)
n−1
donde
1X
Pb = Ik
n k∈s

Determinación del tamaño muestral

Se trata ahora de determinar el tamaño muestral necesario cuando se fija el error de muestreo
e o para obtener una precisión determinada d.

18
Fijando el error de muestreo σ(θ)
b =e

En este caso las variables Xi son dicotómicas por lo que

2 N P (1 − P )
SX =
N −1
2 2
Sustituyendo en la fórmula general y tomando SX en lugar de su estima SbX , dado que

depende solo de P :
2
N SX
n= 2

N e2 + SX

N P (1 − P )
n=
(N − 1)e2 + P (1 − P )

Del mismo modo para estimar el total, aplicando la fórmula general, se obtiene

N 3 P (1 − P )
n=
(N − 1)e2 + N 2 P (1 − P )

Se puede observar que para calcular n se deberı́a conocer P.

Pero es inmediato comprobar (calculando el máximo de la función, tomado derivadas) que


el valor de n es máximo cuando se toma P = 21 . Lo cual lleva a una estima de n conservadora.

Ejemplo

En un distrito donde hay 4000 casas se quiere estimar el porcentaje de propietarios de 2


vehı́culos, con un error de muestreo no mayor que 0.01.
El porcentaje verdadero de propietarios de dos vehı́culos se piensa que está entre el 5 % y

10 %. ¿Cuál debe ser el tamaño de la muestra para conseguir el error de muestro fijado?
Sea U = “4000 casas” N = 4000
Se quiere estimar una proporción P. Para este caso, se tiene que

N P (1 − P )
n=
e2 (N − 1) + P (1 − P )

Para estimar P nos basamos en la información recogida, en lugar de tomar P = 1/2 ya que
se conseguirı́a una n demasiado grande. Como se sabe que 0,05 < P < 0,10 entonces

4000 · 0,1 · 0,9


n= = 734,8
0,012 · 3999 + 0,1 · 0,9

Es decir, se requieren 735 casas. ■

19
Fijando el error máximo admisible d

Por otro lado, si queremos fijar un error máximo admisible d, usando la fórmula general, se
obtiene que

N P (1 − P )z 2α
2
n= 2
P (1 − P )z α + (N − 1)d2
2

Dado que P ∈ (0, 1) el máximo de la expresión se alcanza en P = 1/2, de lo que se deduce

que P (1 − P ) ≤ 14 .

Luego
N z 2α
2
n=
z 2α + 4(N − 1)d2
2

Si se busca el valor de n, correspondiente al total, se obtiene, entonces,

N 3 P (1 − P )z 2α
2
n=
N 2 P (1 − P )z 2α + (N − 1)d2
2

20
Intervalos de Confianza

Para construir intervalos de confianza para P se puede usar la aproximación a la normal


(cuando n es grande)

r !
1−f N
Pb ∼ N P, P (1 − P )
n N −1
de modo que el intervalo de confianza es
 q 
P ∓ z α2 V (P ) =
b b b

" r #
1−f b
Pb ∓ z α2 P (1 − Pb)
n−1

Intervalos de confianza simultáneos para proporciones para carac-


terı́sticas no dicotómicas

Supongamos que se quiere estudiar una variable cualitativa que presenta k modalidades
(k > 2)

Sea Pj la proporción de individuos de la población con la modalidad j tal que j = 1, . . . , k.


Se quieren estimar dichas proporciones y construir intervalos de confianza. Se utiliza un
muestreo aleatorio con reemplazamiento (para simplificar los cálculos) de tamaño n.

Sea nj el número de elementos de la muestra donde se obtiene la respuesta j y sea

nj
Pbj =
n

la proporción muestral de la respuesta j.

Entonces como se tiene un muestreo con reemplazamiento

nj ∼ B(n, Pj )

y
   n  nP
j j
E Pbj = E = = Pj
n n

  1 Pj (1 − Pj )
V Pbj = 2
nPj (1 − Pj ) =
n n

21
siendo un estimador insesgado de la varianza

1 b
Vc(Pbj ) = Pj (1 − Pbj )
n−1

Utilizando los intervalos de confianza simultáneos de Bonferroni con un nivel de confianza

1 − α:

" r #
1 b
Pbj ∓ z 2k
α Pj (1 − Pbj )
n−1

Si fijamos un error máximo admisible d para cada Pj , el tamaño de la muestra viene dado

por: n o
máx Pbj (1 − Pbj )
n ≃ z 2α
2k d2
y como para todo j
1
Pj (1 − Pj ) ≤
4
siendo Pj ∈ (0, 1) se obtiene que
z 2α
n≃ 2k

4d2
Observación: Si k = 2 no son válidos los cálculos anteriores.

Ejemplo

En una población de 1000 personas mayores de 25 años se desea estimar las proporciones
de personas solteras, emparejadas y en otras circunstancias.

Dada una m.a.s. con reemplazamiento de 500 personas se obtiene 355 emparejadas, 112
solteras y 33 en otro estado.

a) Estimar las proporciones y construir I.C. simultáneos al 95 %

b) Obtener n tal que se obtenga un error máximo admisible del 4 %

a)

355 112 33
p̂1 = = 0,71; p̂2 = = 0,224; p̂3 = = 0,0066
500 500 500

Siendo
z 3·2
α = z 0,05 = z
0,0083 = 2,40
6

22
Entonces  q 
355 145
355 500
· 500
IC1 =  ∓ 2,40  = [0,6; 0,75]
500 499

 q 
112 388
112 500
· 500
IC21 =  ∓ 2,40  = [0,179; 0,268]
500 499

 q 
33 467
33 500
· 500
IC1 =  ∓ 2,40  = [0,039; 0,092]
500 499

b)
2,402
n= ≈ 900
4 · 0,042

Ejemplo con R
prop.table ( svytable (∼genero , design = dsrs ))

genero
H M
0 .56 0 .44

Alternativamente se puede escribir:

svymean (∼genero , design = dsrsR )

mean SE
generoH 0 .56 0 .0709
generoM 0 .44 0 .0709

23

También podría gustarte