Medidas de Posición y Variabilidad

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 55

Captulo 4

4.1 Medidas de Posicin 4.2 Medidas de Variabilidad 4.3 Medidas de Posicin y Variabilidad para Datos Agrupados 4.4 Cuantiles 4.5 Desviacin Cuartil y Cajas de Dispersin

4.1 Medidas de Posicin


Notacin, sumatorias Propiedades de la sumatoria La media aritmtica o promedio La mediana La moda Consideraciones sobre el uso de las medidas de posicin

Notacin de sumatoria

X
i =1

= X 1 + X 2 + X 3 L + X n 1 + X n
X
X =3 8

Ejemplos:

= 3+ 4+5+6+7+8

i =1
n i =1

X i f i = X 1 f1 + X

f2 + L + X

fn

(X

Yi ) 2 = ( X 1 Y1 ) 2 + ( X 2 Y2 ) 2 + L + ( X n Yn ) 2

Propiedades de la sumatoria
Orden:

(X
i =1
n

+ Yi ) = X i + Yi
i =1 i =1

Factor comn:

aX
i =1

= a X i
i =1

Suma de una constante:

a = na
i =1

La media aritmtica o promedio


La media aritmtica de un conjunto de valores se define como la suma de todos esos valores dividida por el nmero de ellos. La media aritmtica puede ser simple o ponderada.

Media aritmtica simple


Sean X1, X2, X3, , Xn los n valores observados para una variable cuantitativa X. La media aritmtica simple es:
X1 + X 2 +L + X n X = n 1 n X = Xi n i =1

Ejemplo 1
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. La media simple es:
X = 15 + 45 + 47 + 53 + 58 + 58 + 60 + 62 + 67 + 74 + 75 + 78 + 80 + 80 + 81 + 85 + 85 + 85 + 90 + 92 20
1370 = 68 .50 20

X =

Media aritmtica ponderada


Sean X1, X2, X3, , Xn los n valores observados para una variable cuantitativa X, donde los datos estn ponderados por los p1, p2, p3, , pn, Entonces la media aritmtica ponderada es:
X = p
1

+ p
1

p 2 X 2 + L + p + p 2 + L + p n

pX
i

X =

i =1 n

p
i =1

Ejemplo 2
Supngase que un estudiante tiene las siguientes notas en cuatro cursos matriculados un cuatrimestre: 67, 82, 90, 71. El nmero de crditos que vale cada curso es, respectivamente: 3, 2, 2, 4. Entonces la media ponderada de las notas ser:
X = ( 3 67 ) + ( 2 82 ) + ( 2 90 ) + ( 4 71 ) 829 = 3 + 2 + 2 + 4 11 = 75 . 36

Propiedades de la media aritmtica


Multiplicar por # obs.: n X =
n

i =1
n

Xi

Centrar ( X X ) = 0 1 Sumar (restar) una constante: n ( X 1 Multiplicar: n aX = aX X X Dividir: 1 = n a a


i i =1
i =1
n i i =1
n i i =1

a) =X a

Mediana
La mediana es el valor que est en el centro de todos los valores, si stos se ordenan. Es un valor tal que no ms de la mitad de las observaciones son mayores que l y que no ms de la mitad son menores que l. La mediana se denota Me.

Mediana
Sean X1, X2, X3, , Xn las observaciones ordenadas de una variable cuantitativa
Si n es impar:
Me = X(n+1)/2

Si n es par: Me = (Xn/2 + Xn/2 + 1) 2

Ejemplo 1
Sean los datos -3, -3, -2, 0, 0, 1, 3, 3, 5, 8, 8, 10, 10 Entonces la mediana est en la posicin (n + 1) 2 = (13 + 1) 2 = 7 , es decir, Me = 3.

Ejemplo 2
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. n = 20 n/2 = 10 y n/2 + 1 = 11 Me = (74+75) 2 = 74.5

Moda
Dada una serie de observaciones para una variable cuantitativa, entonces la moda, denotada Mo, es el valor ms frecuente (si existe), o los valores ms frecuentes (si son varios). Unimodal: 1 moda Bimodal: 2 modas No es nica!

Ejemplo 1
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. Entonces la moda es 85, que tiene frecuencia 3.

Ejemplo 2
Supngase que se tienen observadas las siguientes estaturas de 10 personas, en centmetros: 168, 162, 181, 180, 169, 171, 175, 159, 173, 160 Como no hay ningn valor que sea ms frecuente que los dems, entonces la moda no existe.

Ejemplo 3
En una pequea empresa familiar, se tienen los siguientes salarios mensuales de los empleados, en miles de colones: 30, 35, 35, 35, 40, 90, 120, 120, 120, 150 Entonces hay dos modas: 35 y 120.

Distribucin Simtrica
X = Me = Mo

Distribucin Asimtrica Positiva


X > Me > Mo

Distribucin Asimtrica Negativa


X < Me < Mo

Consideraciones
La media de un conjunto de datos es la medida que conlleva mayores clculos aritmticos y su valor est afectado por los valores individuales de todos los datos, mientras que la mediana y la moda pueden no ser afectadas por todos los valores. Por ejemplo, vase el siguiente conjunto de datos, en el que el ltimo valor es aumentado:

Consideraciones
En grupos pequeos, la moda puede ser muy inestable o puede no existir. La mediana no se afecta por el tamao de los valores por encima o por debajo de ella. La media es influida por el tamao de cada valor en el grupo de datos. Algunos grupos de datos simplemente no manifiestan una posicin en forma significativa, siendo en este caso engaoso calcular una medida de posicin.

Consideraciones
La posicin de grupos de datos con valores extremos se mide probablemente mejor por la mediana, si las observaciones son unimodales. Sin embargo, si lo que se quiere es que la medida utilizada refleje el efecto de los valores extremos, entonces es conveniente utilizar la media. La media aritmtica es muy til para estimar la suma total de las observaciones si se conoce el nmero de observaciones.

4.2 Medidas de Variabilidad


Recorrido o Amplitud Desviacin estndar y varianza Coeficiente de variacin

-s1 -s2

+s1 +s2

Recorrido o amplitud
El recorrido o amplitud de una serie de datos es la diferencia entre el valor mximo (M) y el valor mnimo (m) de esa serie. Tambin se conoce como rango y se denota como A. A = M m.

Ejemplo 1
Sean los datos de salarios de una pequea empresa familiar: 30, 35, 35, 35, 40, 90, 120, 120, 120, 150. Entonces A = M m = 150 30 = 120. Si hubiera otro empleado con un salario de 200, entonces la amplitud cambia a: A = M m = 200 30 = 170.

Desviacin Estndar
La desviacin estndar es el promedio de desviacin o diferencia de las observaciones con respecto a la media aritmtica.
Datos observados
2 ( X X ) i n

Media

s=

i =1

n 1
Cantidad de observaciones

Simplificaciones
1 n 2 n 2 s= Xi (X ) n 1 i =1 n 1
1 X X i n i =1 i =1 s= n 1
n n 2 i 2

Var(X) = s2

Ejemplo 1
Considrese el conjunto de notas:
15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81, 85, 85, 85, 90, 92

Sabemos que la media es 68.50 Como X = 15 + 45 + 47 + L + 90 + 92 = 100714 20 (68.50) Entonces la varianza es: s = 100714 19 19 Luego, la desviacin estndar es:
20 2 i 2 2 2 2 2 i =1

= 361.53.

s = 361 .53 = 19.01.

Propiedades de s
Si se suma o resta una constante:
(X
s=
i =1 n i

X)

(( X
=
i =1

a ) ( X a )) 2 n 1

n 1

Si se multiplica por una constante positiva:


(aX
i =1 n i

aX )

a
=
i =1

(Xi X ) n 1

(X
=| a |
i =1

X )2 = as

n 1

n 1

Coeficiente de Variacin
Mide la variabilidad porcentual o relativa de un conjunto de datos respecto a su media:
CV = s 100 X

til cuando:
Los datos estn en unidades diferentes. Los datos estn en las mismas unidades, pero las medias son muy diferentes.

Ejemplo
Tipo de accin A B
CV ( A) = S A CV ( B ) = S B XA XB

Precio al cierre 15 000 5 000

Desviacin estndar 500 300

100 = (500 / 15000 ) 100 = 3%, 100 = (300 / 5000 ) 100 = 6%.

4.3 Medidas para datos agrupados


Una variable cuantitativa agrupada en clases en una distribucin de frecuencias Se aproxima el valor de las medidas de posicin y variabilidad Se supone que el punto medio o marca de clase las representa adecuadamente, es decir, se supone que los datos en cualquier clase estn uniformemente distribuidos a lo largo de sta Se calcula: media o promedio, mediana, moda, desviacin estndar y varianza

Media o promedio
Para datos agrupados en clases, la media es:

X
X =
i =1 k

fi =

X
i =1

fi

donde
fi n k Xi

i =1

fi

es la frecuencia de la clase i, es el nmero total de observaciones es el nmero de clases, es el punto medio o marca de la clase i, si la variable es continua; si es discreta, entonces Xi es el valor que asume la variable.

Ejemplo 1

X =

(1 15) + ( 2 25 ) + (1 35 ) + (6 45) + L + (8 85 ) + (3 95) 2135 = = 64 .69 33 33

Ejemplo 2

(6 2) + (10 3) + (12 4) + (8 5) + (4 6) 154 X = = = 3.85 4. 40 40

Mediana
La mediana debe estar en la clase cuya frecuencia acumulada sea aproximadamente n/2, si n es par, o bien la clase cuya frecuencia acumulada sea aproximadamente (n+1)/2, si n es impar. Se hace una interpolacin del valor donde debe estar la mediana.

Mediana
La mediana se aproxima por
n Fa c Me = Li + 2 fi

donde: fi es la frecuencia de la clase que contiene a la mediana, n es el nmero total de observaciones (suma de los fi), Li es el lmite inferior de la clase que contiene a la mediana, Fa es la frecuencia acumulada de la clase anterior a la clase que contiene a la mediana c es la amplitud de la clase que contiene a la mediana

Ejemplo 1

17

Li = 60, f i = 6, c=10, Fa = 12, n = 33 Me = 60 + [(332 12) 6]10 = 60 + [4.56]10 = 60 + 7.5 = 67.5

Moda

Ejemplo 2

20

Como n/2 = 40/2 = 20, la mediana es el valor de la variable tal que la frecuencia acumulada menos de sea al menos 20, por lo que el valor de la mediana es 4. Moda

Moda
Clase modal: clase que tiene mayor frecuencia Moda: punto medio de la clase modal Ejemplo 1. La clase modal es la clase: 80 a menos de 90, cuyo punto medio es Xi = 85. Por lo tanto, la moda es 85. Ejemplo 2. El nmero de ausencias ms frecuente es 4, por lo que la moda es 4.

Desviacin estndar y varianza


Punto medio de clase i Nmero de clases Media Frecuencia de clase i

(X
2 i =1

X ) fi
2

s =

Nmero de observaciones
k

n 1
( X i f i ) 2
2 i

X
s=
i =1

fi

i =1

n 1

Ejemplo 1

(15 64.69) 2 1 + (25 64.69) 2 2 + L + (95 64.69) 2 3 15497 s = = = 484.28. 32 32


2

Ejemplo 2

2 2 2 + + + 4 ( 2 4 ) 6 ( 3 4 ) 10 ( 6 4 ) L 2 = 1.46. s = 39

4.4 Cuantiles

Qi son los cuartiles Ki son los quintiles Di son los deciles Pi son los percentiles

Me = P50 Q3 = P75 D4 = P40

Datos simples
Se define el percentil m, denotado como Pm, como un valor tal que un (m/100)% de las observaciones son menores que l y un (1 m/100)% son mayores que Pm. Pm = [m (n + 1)] 100
Nmero de percentil Nmero de observaciones

Datos agrupados
lmite inferior de la clase que contiene al percentil Nmero de observaciones

m n Fa c Pm = Li + 100 fi
Frecuencia de la clase que contiene al percentil

Frecuencia acumulada de la clase anterior a la clase que contiene al percentil Amplitud

Nmero de percentil

4.5 Desviacin cuartil y cajas de dispersin


La desviacin cuartil es la medida de variabilidad asociada a la mediana. Se denota por Q y de define como la diferencia entre el tercer y el primer cuartil entre 2. Es decir, Q = (Q3 - Q1) / 2

Ejemplo 1
Considrese el conjunto de notas:
15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81, 85, 85, 85, 90, 92

Los cuartiles son: Q1 = 58, Q2 = Me = 74.5 y Q3 = 83 Entonces la desviacion cuartil es Q = (83 58) 2 = 12.5 Asi, las notas se encuentran entre 74.5 12.5 = 62 y 74.5 + 12.5 = 87.

Ejemplo 2

Q1 (30) Q3 (90)

Ejemplo 2
Q1 = 4500 + 500 [(25/100 120) - 21] 22 = 4500 + (500 9) 22 = 4704.5 Q3 = 5500 + 500 [(75/100 120) - 83] 24 = 5500 + (500 7) 24 = 5645.8 La desviacin cuartil es: Q = (5645.8 4704.2) 2 = 470.65

Cajas de Dispersin
Limite permitido Datos atipicos Ultimo dato normal

50%

25%

25%
a = Q1 2Q b = Q3 + 2Q

25%

50%
25%

Primer dato normal Limite permitido

Ejemplo 3
Considerar el ejemplo de 20 notas.
Q1 = 58, Q2 = Me = 74.5, Q3 = 83 y Q = 12.5. a = Q1 2Q = 58 25 = 33 b = Q3 + 2Q = 83 + 25 = 108 xa = 45 > 33 ; xb = 92 < 108.

Ejemplo 4
Considerar la tabla de frecuencias del plan complementario de pensiones Q1 = 4704.5, Q3 = 5645.8 y Q = 470.65 a = Q1 2Q = 4704.5 941.3 = 3763.2 b = Q3 + 2Q = 5645.8 + 941.3 = 6587.1 xa =3766 y xb =6586

También podría gustarte