Semana 9 (2da) y Semana 10 (1ra) Medidas de Dispersión
Semana 9 (2da) y Semana 10 (1ra) Medidas de Dispersión
Semana 9 (2da) y Semana 10 (1ra) Medidas de Dispersión
ÁREA DE CIENCIAS
CAPÍTULO 4.3
MEDIDAS ESTADÍSTICAS DE
DISPERSIÓN Y VARIABILIDAD
Medidas de
variabilidad
Rango o Coeficiente
Rango Desviación Desviación
amplitud Varianza de variación
intercuartil media estándar
total
Medidas de variabilidad: Contenido
Rango.
Rango intercuartil.
Desviación media.
Varianza.
Desviación estándar.
𝑅 = 𝑥 𝑚𝑎𝑥 − 𝑥 𝑚𝑖𝑛
Es fácil de calcular y se expresa en las mismas unidades que la variable, aunque
posee varios inconvenientes:
- No utiliza todas las observaciones (sólo dos de ellas).
- Puede verse muy afectada por alguna observación extrema.
- El rango aumenta con el número de observaciones, o bien se queda
igual. En cualquier caso, nunca disminuye.
Ejemplo 1
El gerente de un centro comercial de venta de partes de computadora, desea conocer el
rango de variación de las comisiones ganadas la semana anterior por agentes de venta,
para tal fin seleccionó una muestra de 25 agentes, a quienes se les preguntó cuánto
habían ganado de comisiones () la semana pasada. Los datos recolectados, en soles, son:
300 420 300 170 230 130 260 170 300 260 260 170 300
420 70 80 260 440 80 300 420 230 130 230 300
𝑅=440−70=370
Interpretación:
El rango o amplitud total, es decir, la diferencia entre la comisión más alta y la más
baja es 370 soles.
3.3 Rango intercuartil ()
Es la diferencia entre el tercer cuartil y el primer cuartil . En otras palabras, el rango
intercuartil es la amplitud o rango del 50% central de los datos. Se calcula con la
fórmula:
𝑅𝑄 =𝑄 3 −𝑄 1
Representación gráfica del rango intercuartil.
Ejemplo 2
Los sueldos mensuales iniciales (en dólares) de una muestra aleatoria de 12 recién
egresados de la carrera de administración de una universidad privada de la ciudad de
Egresado Sueldo mensual
Lima, son los siguientes: inicial
1 3 450
2 3 550
3 3 650
4 3 480
5 3 355
6 3 310
7 3 490
8 3 730
9 3 540
10 3 925
11 3 520
12 3 480
Primero se ordenan los datos de menor a mayor y luego se calculan los
cuartiles, inferior y superior, tal como se muestra a continuación
𝑄
=3 450+0,25 ( 3 480− 3 450 ) =3 457,5
1
𝑄 =3 550+0,75 ( 3 650 −3 550 ) =3 625
3
3 3 3 3 3 3 3 3 3 3 3
3 3 3 3 3 3 3 3 3 3 3
310 355 450 3 480 480 490 520 540 550 650 730 925
310 355 450 3 480 480 490 520 540 550 650 730 925
Luego, se calcula el rango intercuartil con
𝑅 𝑄 =3 625 − 3 457,5=167,5
Interpretación:
Si tenemos un conjunto de observaciones, entonces la desviación media se calcula
con:
𝑛
1
𝐷 𝑚= ∑ │ 𝑥 𝑖 − 𝑋
´│
𝑛 𝑖=1
Ejemplo 3
1 2 3 4 5 6 7 8 9 10 11
15 10 20 11 8 15 9 12 18 11 14
15 10 20 11 8 15 9 12 18 11 14
´𝑋 = 15+10+…+14 =13
11
Luego, la desviación media de los datos es
Interpretación:
Edad
[63 ; 68) 65,5 71 4 650,5 606,34
[78
[78 ;; 83)
83) 80,5
80,5 79
79 6
6 359,5
359,5 510,34
510,34
[83
[83 ;; 88)
88) 85,5
85,5 47
47 4
4 018,5
018,5 538,62
538,62
Total
Total -----
----- 450
450 33
33 320,0
320,0 2
2 361,64
361,64
La media aritmética de los datos es:
´ 33 320
𝑋= =74,04
450
Luego, su desviación media es
5
1 2361,64
𝐷𝑚= ∑ │𝑥 𝑖 − 𝑋´ │𝑓 𝑖= =5,25
𝑛 𝑖=1 450
Interpretación:
La varianza es el promedio de los cuadrados de las desviaciones de los datos con respecto
a su media.
Si tenemos los datos observados de la variable para una muestra de tamaño ,
representados por entonces la varianza de la muestra se calcula con la fórmula
𝑛
1
𝑛
2
∑ 𝑥 2𝑖 − 𝑛 𝑋´ 2
2 ´ 2 𝑖=1
𝑆 𝑥= ∑ ( 𝑥 − 𝑋 ) ⟺ 𝑆 =
𝑛 − 1 𝑖=1 𝑖 𝑥
𝑛 −1
Ejemplo 1
1 2 3 4 5 6 7 8 9 10 11
15 10 20 11 8 15 9 12 18 11 14
15 10 20 11 8 15 9 12 18 11 14
11
Luego, la varianza de la muestra es
Si tenemos los datos observados de una muestra de tamaño , resumidos en una tabla de
frecuencias, entonces la varianza de la muestra se calcula con la fórmula
𝑘
1
𝑘
2
∑ 𝑥2𝑖 𝑓 𝑖 −𝑛 𝑋´ 2
2 ´ 2 𝑖=1
𝑆 = 𝑥 ∑ ( 𝑥 − 𝑋 ) 𝑓 ⟺ 𝑆 =
𝑛 − 1 𝑖=1 𝑖 𝑖 𝑥
𝑛 −1
Ejemplo 2
0 1 0 0
1 2 2 2
2 4 8 16
3 12 36 108
4 9 36 144
5 2 10 50
Total 30 92 320
Se calcula la media aritmética
6
∑ 𝑥𝑖 𝑓 𝑖 92
´ = 𝑖=1
𝑋 = =3,067
30 30
6
∑ 𝑥2
𝑖 𝑓 𝑖 − 𝑛 𝑋
´ 2
𝑆2
𝑥=
𝑖=1
=320 − 30 ¿ ¿
𝑛 −1
Con la finalidad de conocer la varianza de los gastos semanales (en soles) del personal
administrativo de una empresa de cemento en Lima, en el mes de enero del 2016, se
seleccionó una muestra de 30 personas. Los datos resumidos y los cálculos necesarios
se presentan en la siguiente tabla 4.3.
[600
[600 ;; 800)
800) 700
700 4
4 2
2 800
800 1
1 960
960 000
000
[800
[800 ;; 1000)
1000) 900
900 9
9 8
8 100
100 7
7 290
290 000
000
[1000
[1000 ;; 1200)
1200) 1
1 100
100 16
16 17
17 600
600 19
19 360
360 000
000
Total
Total -----
----- 30
30 29
29 000
000 28
28 860
860 000
000
Se calcula la media aritmética
5
∑ 𝑥𝑖 𝑓 𝑖
´ = 𝑖=1 29 000
𝑋 = = 966,667
30 30
a) Para cualquier conjunto de datos la varianza es siempre una cantidad no negativa.
b) Si las observaciones tienen valores iguales, entonces la varianza es cero. Es decir, la
varianza de una constante es cero. Si , entonces
c) La varianza del producto de una constante por una variable, es igual al cuadrado de la
constante por la varianza de la variable. Es decir si , entonces:
d) La varianza de la suma de una variable más o menos una constante, es igual a la varianza de la
variable. Es decir si , entonces:
e) En general, la varianza cumple con la siguiente propiedad: si , entonces
3.6 Desviación estándar
𝑛
√
2
´ )
∑ ( 𝑥𝑖 − 𝑋
𝑖=1
𝑆 𝑥= , para datos no agrupado
𝑛 −1
𝑘
√
2
´
∑ ( 𝑥𝑖 − 𝑋 ) 𝑓 𝑖
𝑖=1
𝑆 𝑥= , para datos agrupados
𝑛 −1
Ejemplo 4
𝑆 𝑥 =√ 28 505,08=168,83
Interpretación:
Se puede decir que la cantidad típica en que los gastos semanales de los trabajadores
difieren del gasto semanal promedio es 168,83 soles.
3.6.1 Propiedades de la desviación
estándar
a) Para cualquier conjunto de datos la desviación estándar es siempre una cantidad no negativa.
b) Si las observaciones tienen valores iguales, entonces la desviación estándar es cero. Es decir, la
desviación estándar de una constante es cero. Si , entonces
c) La desviación estándar del producto de una constante por una variable, es igual a la constante por
la desviación estándar de la variable. Es decir, si , entonces
d) La desviación estándar de la suma de una variable más o menos una constante, es igual a la
desviación estándar de la variable. Es decir, si , entonces
e) En general, la desviación estándar cumple con lo siguiente: si , entonces
f) La desviación estándar tiene la propiedad de que en el intervalo se encuentra, al menos, el 75% de
las observaciones. Incluso si tenemos muchos datos y estos provienen de una distribución
simétrica, podremos llegar al 95% o más.
Ejemplo 5
300 420 300 170 230 130 260 170 300 260 260 170 300
𝑆 𝑥 = √ 11566=107,55
Se define la variable , entonces se tiene
𝑌 =1,1 𝑋 + 20
𝑆 𝑦 =1,1 𝑆 𝑥 =1,1×107,55=118,31
Se puede decir que después del aumento, la cantidad típica en que las
comisiones difieren de la comisión promedio es 118,31 soles.
Por lo tanto, observamos que en este caso el 100% de los datos están en el intervalo , tal
como indica la propiedad f de la desviación estándar.
3.8 Coeficiente de variación
Comparar el grado de variabilidad entre dos o más distribuciones aun cuando las
unidades de medida de las variables están expresadas en diferentes unidades o
escalas de medición.
3.7.1 Interpretación del coeficiente de variación
Baja variabilidad
5 %≤ < 10% Datos homogéneos
Moderada variabilidad
15% ≤ < 20% Datos regularmente heterogéneos
Con la finalidad de conocer la dispersión de los gastos semanales (en soles) del personal
administrativo de una empresa de cemento en Lima, en el mes de enero del 2016, se seleccionó
una muestra de 30 personas. Los datos resumidos y los cálculos correspondientes se
presentan en la tabla 4.4.
Gasto
[200 ; 400) 300 0 0 0
[400 ; 600) 500 1 500 250 000
[600 ; 800) 700 4 2 800 196 000
[800 ; 1 000) 900 9 8 100 729 000
2 𝑖=1
𝑆 𝑥= = 28 860 000 − 30 ¿ ¿
𝑛 −1
𝑆 𝑥 = √ 28 505,08=168,83
Luego, el coeficiente de variación es
168,83
𝐶𝑉 𝑥 = × 100 =17,47 %
966,667
Como el está entre 15% y 20%, la variabilidad de los gastos semanales del personal
administrativo de la empresa de cemento es moderada, son gastos regularmente
heterogéneos.
Ejemplo 7
Tipo de empresa
14 500
𝐶𝑉 2= ×100=21,11 %
68 700
Como , se concluye que las pequeñas empresas generan utilidades más homogéneas entre
ellas (sólo 6,62% de variabilidad) en comparación con las grandes empresas (con 21,11%
de variabilidad).