Contrastes Frecuencias
Contrastes Frecuencias
Contrastes Frecuencias
Curso 2020/2021
Guía docente:
H 0 : µ = µ0
H1 : µ 6= µ0
Test χ2 de Pearson
H0 : X ∼ F0
H1 : X F0
El procedimiento a seguir será el siguiente: primero se divide el
soporte de la variable en k clases disjuntas A1 , A2 , ..., Ak ,
donde agruparemos las n observaciones. Entonces definimos
las siguientes frecuencias:
Frecuencias observadas y esperadas en el test χ2
ei = npi
Ejemplo
Padres con sangre del tipo AB dan lugar a hijos con sangre de
los tipos A, AB, B. De acuerdo con las leyes de Mendel, los tres
tipos anteriores aparecen con una frecuencia del 25, 50 y 25
por 100 respectivamente. Contrasta esta hipótesis en la
siguiente muestra de 292 niños nacidos de padres con sangre
AB.
H1 : otros pesos
e1 = nP(A) = 73
e2 = nP(AB) = 146
e3 = nP(B) = 73
Fórmula
clases ei oi ei − oi
A1 30 15 15
A2 75 90 −15
oij B1 B2 Bk eij B1 B2 Bk
A1 o11 o12 o1k A1 e11 e12 e1k
A2 o21 o22 o2k A2 e21 e22 e2k
... ... ... ... ... ... ... ...
Ah oh1 oh2 ohk Ah eh1 eh2 ehk
Ejemplo
< 60 60 − 70 70 − 80 > 80
< 1.65 15.14 22.59 24.89 14.37
1.65 − 1.75 23.99 35.79 39.45 22.77
> 1.75 19.86 29.63 32.66 18.85
Frecuencias esperadas Si No
Si 175 175
No 275 275
Pk Pl oij2
Aplicando el estadístico Q = i=1 j=1 − n = 11.688.
eij
Valor p = P(χ21 ≥ 11.688) < 0.01
Hay razones estadísticas significativas para decir que la
vacuna es efectiva (α = 0.05). En Excel, valor p
=1-DISTR.CHICUAD(11.688;1;1)= 0.0006
Ejemplo homogeneidad
Estudia la asociación entre las poblaciones de los expuestos a
la radioactividad y los no expuestos a ella en la siguiente tabla
de frecuencias:
Expuesto/Enfermo Si No
Si 52 248 300 (fijo)
No 48 272 320 (fijo)
Frecuencias esperadas Si No
Si 48.387 251.613 300 (fijo)
No 51.613 268.387 320 (fijo)
Pk Pl oij2
Q= i=1 j=1 − n = 0.623
eij
valor p = 0.1 < P(χ21 ≥ 0.623) < 0.9( con Excel 0.429)
Con lo que no hay razones estadísticas significativas a nivel
α = 0.05 para decir que son dependientes. Por lo tanto
radiactividad y enfermar no estarían asociados.
Test de McNemar
M = (b − c)2 /(b + c)
Otro ejemplo
Después/Antes + -
+ 15 16
- 19 20
9
I Estadístico M = 35 = 0.2571
I 0.1 < Valor p = P(χ21 ≥ 0.2571) < 0.9 (0.6120 con Excel)
I Conclusión: la diferencia no es estadísticamente
significativa, es decir el estímulo no produce cambios.
Medidas de asociación: interés
S(x, y )
rXY =
S(x)S(y )
Covarianza S(x, y ) = n1 i,j xi xj nij − x̄ ȳ
P
2,5
y = 0,7x + 1
2
1,5
0,5
xi yi 0
‐2,5 ‐2 ‐1,5 ‐1 ‐0,5 0 0,5 1 1,5 2 2,5
-2 0 ‐0,5
-1 0 ‐1
0 1
1 1
2 3
x̄ = 0, ȳ = 1
S 2 (x) = 2, S 2 (y ) = 1.2
I Covarianza: S(x, y ) = 7
5
7
I Coeficiente de correlación linea:l rXY = 5
√ √ = 0.9036
2 1.2
Asociación para variables ordinales
P −Q
γ=
P +Q
Se verifica que −1 ≤ γ ≤ 1.
I Si es positivo hay concordancia, a medida que aumenta X
aumenta Y .
I Si es negativo hay discordancia o concordancia inversa, a
medida que aumenta X disminuye Y .
I Si es cero no hay relación
Ejemplos aplicación tablas 2 × 2
P = 20 × 25, Q = 0, γ = 1
Y|X P M G
P a b c
G d e f
I Pares concordantes P = a × e + a × f + b × f
I Pares discordantes Q = c × d + c × e + b × d
Ejemplo
Y/X 1 2 3
a 10 5 2
b 10 15 20
450−100
γ= 450+100 = 0.636
Tau de Kendall
P −Q
τ=p p
P + Q + Y0 P + Q + X0
I Y0 son los empates en Y
I X0 son los empates en X
I Para la tabla 4, τ = 0.816
I Cálculo de los empates en tablas 2 × 3
Y|X P M G
P a b c
G d e f
I X0 = a × d + b × e + c × f
I Y0 = a × b + a × c + d × e + d × f + b × c + e × f
Concordancia con fines de predicción: Delta de Sommers
I Y predice X (penalizamos en los pares empatados en Y )
P −Q
dYX =
P + Q + Y0
I X predice Y (penalizamos en los pares empatados en X )
P −Q
dXY =
P + Q + X0
Ejemplo X predice Y "mejor que" Y predice X
Y/X 1 2 3
a 6 0 0
b 0 5 4
P −Q 54 − 0
dYX = = = 0.73
P + Q + Y0 54 + 0 + 20
P −Q 54 − 0
dXY = = =1
P + Q + X0 54 + 0 + 0
Concordancia: κ de Cohen
A/B 1 2 3 4
1 22 2 2 0
2 5 7 14 0
3 0 2 36 0
4 0 1 17 10