Medidas de Posición y Variabilidad
Medidas de Posición y Variabilidad
Medidas de Posición y Variabilidad
4.1 Medidas de Posicin 4.2 Medidas de Variabilidad 4.3 Medidas de Posicin y Variabilidad para Datos Agrupados 4.4 Cuantiles 4.5 Desviacin Cuartil y Cajas de Dispersin
Notacin de sumatoria
X
i =1
= X 1 + X 2 + X 3 L + X n 1 + X n
X
X =3 8
Ejemplos:
= 3+ 4+5+6+7+8
i =1
n i =1
X i f i = X 1 f1 + X
f2 + L + X
fn
(X
Yi ) 2 = ( X 1 Y1 ) 2 + ( X 2 Y2 ) 2 + L + ( X n Yn ) 2
Propiedades de la sumatoria
Orden:
(X
i =1
n
+ Yi ) = X i + Yi
i =1 i =1
Factor comn:
aX
i =1
= a X i
i =1
a = na
i =1
Ejemplo 1
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. La media simple es:
X = 15 + 45 + 47 + 53 + 58 + 58 + 60 + 62 + 67 + 74 + 75 + 78 + 80 + 80 + 81 + 85 + 85 + 85 + 90 + 92 20
1370 = 68 .50 20
X =
+ p
1
p 2 X 2 + L + p + p 2 + L + p n
pX
i
X =
i =1 n
p
i =1
Ejemplo 2
Supngase que un estudiante tiene las siguientes notas en cuatro cursos matriculados un cuatrimestre: 67, 82, 90, 71. El nmero de crditos que vale cada curso es, respectivamente: 3, 2, 2, 4. Entonces la media ponderada de las notas ser:
X = ( 3 67 ) + ( 2 82 ) + ( 2 90 ) + ( 4 71 ) 829 = 3 + 2 + 2 + 4 11 = 75 . 36
i =1
n
Xi
a) =X a
Mediana
La mediana es el valor que est en el centro de todos los valores, si stos se ordenan. Es un valor tal que no ms de la mitad de las observaciones son mayores que l y que no ms de la mitad son menores que l. La mediana se denota Me.
Mediana
Sean X1, X2, X3, , Xn las observaciones ordenadas de una variable cuantitativa
Si n es impar:
Me = X(n+1)/2
Ejemplo 1
Sean los datos -3, -3, -2, 0, 0, 1, 3, 3, 5, 8, 8, 10, 10 Entonces la mediana est en la posicin (n + 1) 2 = (13 + 1) 2 = 7 , es decir, Me = 3.
Ejemplo 2
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. n = 20 n/2 = 10 y n/2 + 1 = 11 Me = (74+75) 2 = 74.5
Moda
Dada una serie de observaciones para una variable cuantitativa, entonces la moda, denotada Mo, es el valor ms frecuente (si existe), o los valores ms frecuentes (si son varios). Unimodal: 1 moda Bimodal: 2 modas No es nica!
Ejemplo 1
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. Entonces la moda es 85, que tiene frecuencia 3.
Ejemplo 2
Supngase que se tienen observadas las siguientes estaturas de 10 personas, en centmetros: 168, 162, 181, 180, 169, 171, 175, 159, 173, 160 Como no hay ningn valor que sea ms frecuente que los dems, entonces la moda no existe.
Ejemplo 3
En una pequea empresa familiar, se tienen los siguientes salarios mensuales de los empleados, en miles de colones: 30, 35, 35, 35, 40, 90, 120, 120, 120, 150 Entonces hay dos modas: 35 y 120.
Distribucin Simtrica
X = Me = Mo
Consideraciones
La media de un conjunto de datos es la medida que conlleva mayores clculos aritmticos y su valor est afectado por los valores individuales de todos los datos, mientras que la mediana y la moda pueden no ser afectadas por todos los valores. Por ejemplo, vase el siguiente conjunto de datos, en el que el ltimo valor es aumentado:
Consideraciones
En grupos pequeos, la moda puede ser muy inestable o puede no existir. La mediana no se afecta por el tamao de los valores por encima o por debajo de ella. La media es influida por el tamao de cada valor en el grupo de datos. Algunos grupos de datos simplemente no manifiestan una posicin en forma significativa, siendo en este caso engaoso calcular una medida de posicin.
Consideraciones
La posicin de grupos de datos con valores extremos se mide probablemente mejor por la mediana, si las observaciones son unimodales. Sin embargo, si lo que se quiere es que la medida utilizada refleje el efecto de los valores extremos, entonces es conveniente utilizar la media. La media aritmtica es muy til para estimar la suma total de las observaciones si se conoce el nmero de observaciones.
-s1 -s2
+s1 +s2
Recorrido o amplitud
El recorrido o amplitud de una serie de datos es la diferencia entre el valor mximo (M) y el valor mnimo (m) de esa serie. Tambin se conoce como rango y se denota como A. A = M m.
Ejemplo 1
Sean los datos de salarios de una pequea empresa familiar: 30, 35, 35, 35, 40, 90, 120, 120, 120, 150. Entonces A = M m = 150 30 = 120. Si hubiera otro empleado con un salario de 200, entonces la amplitud cambia a: A = M m = 200 30 = 170.
Desviacin Estndar
La desviacin estndar es el promedio de desviacin o diferencia de las observaciones con respecto a la media aritmtica.
Datos observados
2 ( X X ) i n
Media
s=
i =1
n 1
Cantidad de observaciones
Simplificaciones
1 n 2 n 2 s= Xi (X ) n 1 i =1 n 1
1 X X i n i =1 i =1 s= n 1
n n 2 i 2
Var(X) = s2
Ejemplo 1
Considrese el conjunto de notas:
15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81, 85, 85, 85, 90, 92
Sabemos que la media es 68.50 Como X = 15 + 45 + 47 + L + 90 + 92 = 100714 20 (68.50) Entonces la varianza es: s = 100714 19 19 Luego, la desviacin estndar es:
20 2 i 2 2 2 2 2 i =1
= 361.53.
Propiedades de s
Si se suma o resta una constante:
(X
s=
i =1 n i
X)
(( X
=
i =1
a ) ( X a )) 2 n 1
n 1
aX )
a
=
i =1
(Xi X ) n 1
(X
=| a |
i =1
X )2 = as
n 1
n 1
Coeficiente de Variacin
Mide la variabilidad porcentual o relativa de un conjunto de datos respecto a su media:
CV = s 100 X
til cuando:
Los datos estn en unidades diferentes. Los datos estn en las mismas unidades, pero las medias son muy diferentes.
Ejemplo
Tipo de accin A B
CV ( A) = S A CV ( B ) = S B XA XB
100 = (500 / 15000 ) 100 = 3%, 100 = (300 / 5000 ) 100 = 6%.
Media o promedio
Para datos agrupados en clases, la media es:
X
X =
i =1 k
fi =
X
i =1
fi
donde
fi n k Xi
i =1
fi
es la frecuencia de la clase i, es el nmero total de observaciones es el nmero de clases, es el punto medio o marca de la clase i, si la variable es continua; si es discreta, entonces Xi es el valor que asume la variable.
Ejemplo 1
X =
Ejemplo 2
Mediana
La mediana debe estar en la clase cuya frecuencia acumulada sea aproximadamente n/2, si n es par, o bien la clase cuya frecuencia acumulada sea aproximadamente (n+1)/2, si n es impar. Se hace una interpolacin del valor donde debe estar la mediana.
Mediana
La mediana se aproxima por
n Fa c Me = Li + 2 fi
donde: fi es la frecuencia de la clase que contiene a la mediana, n es el nmero total de observaciones (suma de los fi), Li es el lmite inferior de la clase que contiene a la mediana, Fa es la frecuencia acumulada de la clase anterior a la clase que contiene a la mediana c es la amplitud de la clase que contiene a la mediana
Ejemplo 1
17
Moda
Ejemplo 2
20
Como n/2 = 40/2 = 20, la mediana es el valor de la variable tal que la frecuencia acumulada menos de sea al menos 20, por lo que el valor de la mediana es 4. Moda
Moda
Clase modal: clase que tiene mayor frecuencia Moda: punto medio de la clase modal Ejemplo 1. La clase modal es la clase: 80 a menos de 90, cuyo punto medio es Xi = 85. Por lo tanto, la moda es 85. Ejemplo 2. El nmero de ausencias ms frecuente es 4, por lo que la moda es 4.
(X
2 i =1
X ) fi
2
s =
Nmero de observaciones
k
n 1
( X i f i ) 2
2 i
X
s=
i =1
fi
i =1
n 1
Ejemplo 1
Ejemplo 2
2 2 2 + + + 4 ( 2 4 ) 6 ( 3 4 ) 10 ( 6 4 ) L 2 = 1.46. s = 39
4.4 Cuantiles
Qi son los cuartiles Ki son los quintiles Di son los deciles Pi son los percentiles
Datos simples
Se define el percentil m, denotado como Pm, como un valor tal que un (m/100)% de las observaciones son menores que l y un (1 m/100)% son mayores que Pm. Pm = [m (n + 1)] 100
Nmero de percentil Nmero de observaciones
Datos agrupados
lmite inferior de la clase que contiene al percentil Nmero de observaciones
m n Fa c Pm = Li + 100 fi
Frecuencia de la clase que contiene al percentil
Nmero de percentil
Ejemplo 1
Considrese el conjunto de notas:
15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81, 85, 85, 85, 90, 92
Los cuartiles son: Q1 = 58, Q2 = Me = 74.5 y Q3 = 83 Entonces la desviacion cuartil es Q = (83 58) 2 = 12.5 Asi, las notas se encuentran entre 74.5 12.5 = 62 y 74.5 + 12.5 = 87.
Ejemplo 2
Q1 (30) Q3 (90)
Ejemplo 2
Q1 = 4500 + 500 [(25/100 120) - 21] 22 = 4500 + (500 9) 22 = 4704.5 Q3 = 5500 + 500 [(75/100 120) - 83] 24 = 5500 + (500 7) 24 = 5645.8 La desviacin cuartil es: Q = (5645.8 4704.2) 2 = 470.65
Cajas de Dispersin
Limite permitido Datos atipicos Ultimo dato normal
50%
25%
25%
a = Q1 2Q b = Q3 + 2Q
25%
50%
25%
Ejemplo 3
Considerar el ejemplo de 20 notas.
Q1 = 58, Q2 = Me = 74.5, Q3 = 83 y Q = 12.5. a = Q1 2Q = 58 25 = 33 b = Q3 + 2Q = 83 + 25 = 108 xa = 45 > 33 ; xb = 92 < 108.
Ejemplo 4
Considerar la tabla de frecuencias del plan complementario de pensiones Q1 = 4704.5, Q3 = 5645.8 y Q = 470.65 a = Q1 2Q = 4704.5 941.3 = 3763.2 b = Q3 + 2Q = 5645.8 + 941.3 = 6587.1 xa =3766 y xb =6586