Estadística I: Medidas de Dispersión

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 40

ESTADÍSTICA I

MEDIDAS DE DISPERSIÓN

GERMÁN E. RINCÓN
MEDIDAS DE DISPERSIÓN
Dos situaciones con el mismo promedio
CREACIONES GALAXIA CONFECCIONES ARMANY
VENTAS VENTAS
MENSUALES No. De MENSUALES No. De
(MILLONES) MESES (MILLONES) MESES
10 14 11 6 10 14
14 18 32 10 14 13
18 22 19 14 18 16
22 26 12 18 22 11
26 30 7 22 26 10
30 34 5 26 30 10
86 30 34 7
34 38 5
86
MEDIDAS DE DISPERSIÓN
35

30

25
MESES

20

ARMANY
15
GALAXIA

10

0
4 8 12 16 20 24 28 32 36 40
MILLONES DE PESOS
CONCEPTO DE DISPERSIÓN
VARIABILIDAD: ¿Qué tan diferentes son, entre sí, los datos de
estas muestras?
Longitud en mm de muestras de una pieza fabricada por 3
máquinas
Máquina Máquina Máquina
No.1 No.2 No.3
14 14 14
14 14 14
14 14 11
14 14 14
14 12 12
14 14 14
14 14 14
14 14 14
14 14 15
14 14 14

 ¿Cuál máquina es mas variable?


CONCEPTO DE DISPERSIÓN

CONCEPTO DE VARIABILIDAD
Apreciación de la semejanza o diferencia que
existe entre los datos de una muestra o de una
población
CONCEPTO DE DISPERSIÓN
¿Qué tan variables son los datos de esta muestra?

Peso en
kilogramos
67
83
83
59
71
94
71
69
70
80

CONCLUSIÓN:
CONCEPTO DE DISPERSIÓN

MEDIDAS DE DISPERSIÓN
Son valores que se obtienen como resultado
de cálculos o procesos y que indican que tan
parecidos son los datos de una población o
una muestra, usualmente, con respecto a la
medida de tendencia central con la que se
describe el comportamiento de este conjunto
de datos
CONCEPTO DE DISPERSIÓN

Las notas obtenidas en una prueba por dos grupos


de estudiantes se presentan en la siguiente tabla:
Notas del Notas del
grupo A grupo B
3,1 2,5
2,9 4,7
3,3 0,7
3,4 3,8
3,3 1,0
3,2 5,0
4,7
Promedio Promedio
grupo A grupo B
3,2 3,2
CONCEPTO DE DISPERSIÓN
IMPORTANCIA DE LA DISPERSIÓN
Ventas de dos vendedores en millones de pesos
VENDEDOR VENDEDOR
A B
31 31
26 10
28 52
30 9
34 21
27 30
31 56
29 13
32 20
33 59

¿Cuál promedio es mas confiable?


CLASES DE MEDIDAS DE DISPERSIÓN

Las mas usadas son:


• El Rango
• El Rango Intercuartílico
• La Desviación Media
• La Varianza
• La desviación Estándar
EL RANGO
 CONCEPTO: Es la diferencia o distancia entre
el mayor valor, de un conjunto de datos y el
valor menor

 SÍMBOLO: R

 Expresión para datos no agrupados


R = Xmax - Xmin
EL RANGO
 EJEMPLO PARA DATOS NO AGRUPADOS
Ventas de dos vendedores en millones de pesos
VENDEDOR VENDEDOR
A B
31 31
26 10
28 52
30 9
34 21
27 30
31 56
29 13
32 20
33 59
RA = 33 - 26 = $7millones RB = 59 - 9 $50 millones
Son menos dispersas las ventas del vendedor A
son mas confiables las ventas del vendedor A
EL RANGO
 Expresión para datos agrupados
R = LSclase mas alta - LIclase mas baja
 Ejemplo:
DISEÑOS GALAXIA CREACIONES ARMANY
VENTAS VENTAS
MENSUALES No. De MENSUALES No. De
(MILLONES) MESES (MILLONES) MESES
10 14 11 6 10 14
14 18 32 10 14 13
18 22 19 14 18 16
22 26 12 18 22 11
26 30 7 22 26 10
30 34 5 26 30 10
86 30 34 7
34 38 5
86
R = 34 - 10 = $24 millones R = 38 - 6 = $32 millones
EL RANGO
CARACTERÍSTICAS DEL RANGO
 Es fácil de entender y de calcular
 Da una idea rápida de la dispersión
 En el cálculo únicamente se tienen en cuenta
los valores máximo y mínimo
 Varía mucho de una muestra a otra
 No se puede calcula con distribuciones de
frecuencia que tienen clases de extremo
abierto
EL RANGO INTERCUARTÍLICO

Una de las desventajas del rango es que


solamente se tienen en cuenta, para su
cálculo, los valores máximo y mínimo, por lo
que no indica como están distribuidos
internamente los datos. Esta desventaja se
puede corregir con el rango intercuartílico
EL RANGO INTERCUARTÍLICO
 SIMBOLO: RQ
 Expresión para datos agrupados y no agrupados
RQ = Q3 - Q1
Donde: Q1 es el primer cuartil y Q3 es el tercer cuartil

 Ejemplo
Las distancias en kilómetros, recorrida en un día por dos
muestras de vehículos se presentan en la siguiente tabla
EL RANGO INTERCUARTÍLICO
MUESTRA A MUESTRA B
Distancia No. De Distancia No. De
(Kilómetros) Vehículos FAA (Kilómetros) Vehículos FAA
25 35 3 3 25 35 3 3
35 45 7 10 35 45 7 10
45 55 12 22 45 55 11 21
55 65 15 37 55 65 19 40
65 75 10 47 65 75 7 47
75 85 6 53 75 85 6 53
53 53

RA = Xmax - Xmin = 60 Kmts RB = Xmax - Xmin = 60 Kmts

Q1 = 47,7 Kmts Q3 = 67,75 Kmts Q1 = 48,0 Kmts Q3 = 64,9 Kmts

RQ = 20,05 Kmts RQ = 16,9 Kmts


LA DESVIACIÓN MEDIA
PROBLEMA: Calcular la distancia promedio de un
conjunto de datos con respecto a su propia media
aritmética
Datos Datos
35 35 -10
27 27 -18
12 12 -33
45 45 0
98 98 53
53 53 8
45 45 0
SUMA 0

CONCLUSIÓN: La suma de las distancias de cualquier conjunto de datos con respecto


A su media aritmética siempre es igual a cero
LA DESVIACIÓN MEDIA
 CONCEPTO : Es la diferencia promedio, en valor absoluto, de
los datos de la muestra o población con respecto a su propia
media.
 SÍMBOLO: DM
 EXPRESIÓN PARA DATOS NO AGRUPADOS:

 EJEMPLO:
Una muestra, al azar, del tiempo, en minutos, que duran las
llamadas que se hacen desde un teléfono, se presenta en la
siguiente tabla:
3 14 24 9 7 12
LA DESVIACIÓN MEDIA

3 -8,5 8,5
14 2,5 2,5
24 12,5 12,5
9 -2,5 2,5
7 -4,5 4,5
12 0,5 0,5
SUMA 31
LA DESVIACIÓN MEDIA
• Expresión para datos agrupados

•Ejemplo: La siguiente tabla es una muestra, en miles


de pesos, del valor del arriendo mensual de vivienda
del estrato tres.
Valor arriendo No. De
(miles de pesos) viviendas
200 220 12
220 240 15
240 260 23
260 280 22
280 300 20
300 320 18
320 340 15
125
LA DESVIACIÓN MEDIA
• Cálculo de la media:

• Tabla de cálculo
Valor arriendo
(miles de pesos)
200 220 12 210 -61,920 61,92 743,04
220 240 15 230 -41,920 41,92 628,8
240 260 23 250 -21,920 21,92 504,16
260 280 22 270 -1,920 1,92 42,24
280 300 20 290 18,080 18,08 361,6
300 320 18 310 38,080 38,08 685,44
320 340 15 330 58,080 58,08 871,2
125 3836,48
LA VARIANZA
 Todo numero al cuadrado es positivo
 Concepto de varianza:
Promedio de la suma de las desviaciones con
respecto a la media elevados al cuadrado
 Símbolos
VARIANZA PARA DATOS NO AGRUPADOS

 POBLACIÓN

 MUESTRA
VARIANZA PARA DATOS NO AGRUPADOS
• EJEMPLO
Los siguientes datos corresponden a los puntajes
obtenidos por los aspirantes a un cargo en una
empresa

PUNTAJES

60 81 77 72 91 90

µ = 78,5 puntos
VARIANZA PARA DATOS NO AGRUPADOS

60 -18,5 342,25
81 2,5 6,25
77 -1,5 2,25
72 -6,5 42,25
91 12,5 156,25
90 11,5 132,25
681,5
PRÁCTICA EN CLASE

La medida de la dureza de una muestra ladrillos,


escogidos al azar, en una escala continua de 1 a 10
3,2
5,4
7,2
4,5
7,3
5,0
4,6
6,4
Calcular la varianza
VARIANZA PARA DATOS AGRUPADOS

 POBLACIÓN

 MUESTRA
VARIANZA PARA DATOS AGRUPADOS

Ejemplo:
En un programa sobre riesgo cardiovascular, se
registró el peso en kilogramos de todos los
empleados de una empresa
Peso en No. de
Kilogramos Empleados
39 49 5
49 59 11
59 69 50
69 79 31
79 89 27
89 99 18
99 109 9
151
VARIANZA PARA DATOS AGRUPADOS

Peso en
Kilogramos

39 49 5 44 -30,2 912,04 4560,20

49 59 11 54 -20,2 408,04 4488,44

59 69 50 64 -10,2 104,04 5202,00

69 79 31 74 -0,2 0,04 1,24

79 89 27 84 9,8 96,04 2593,08

89 99 18 94 19,8 392,04 7056,72

99 109 9 104 29,8 888,04 7992,36

151 31894,04

µ = 74,2 kilogramos
PRÁCTICA EN CLASE

La fuerza del pico de corriente necesario para fundir


la unidad de poder de una muestra de equipos
Fza del pico / unidad No.de
(Kilovoltios) unidades
3,34 3,75 4
3,75 4,16 4
4,16 4,57 13
4,57 4,98 23
4,98 5,39 32
5,39 5,80 17
5,80 6,21 5
98

Calcular la varianza
LA DESVIACIÓN ESTÁNDAR

 Problema con la varianza


 Solución. La desviación estándar que es……
 Símbolos:
Poblaciones:
Muestras:
 Desviación estándar para datos no agrupados
Poblaciones
LA DESVIACIÓN ESTÁNDAR

 Desviación estándar para datos no agrupados


Muestras:

 Desviación estándar para datos agrupados


Poblaciones:
LA DESVIACIÓN ESTÁNDAR

 Desviación estándar para datos agrupados


Muestras:

 Ejemplo:
Una muestra del tamaño de las fincas de una
región se presenta en la siguiente tabla:
LA DESVIACIÓN ESTÁNDAR

No. de
Hectáreas / finca fincas
2,03 2,73 12
2,73 3,43 36
3,43 4,13 30
4,13 4,83 19
4,83 5,53 13
5,53 6,23 11
6,23 6,93 9
Suma 130
LA DESVIACIÓN ESTÁNDAR

Hectáreas por No. de


finca fincas
2,03 2,73 12 2,38 28,56 -1,6908 2,8587006 34,304407
2,73 3,43 36 3,08 110,88 -0,9908 0,9816237 35,338452
3,43 4,13 30 3,78 113,4 -0,2908 0,0845467 2,5364024
4,13 4,83 19 4,48 85,12 0,40923 0,1674698 3,1819266
4,83 5,53 13 5,18 67,34 1,10923 1,2303929 15,995108
5,53 6,23 11 5,88 64,68 1,80923 3,273316 36,006476
6,23 6,93 9 6,58 59,22 2,50923 6,2962391 56,666151
130 529,2 184,02892
COEFICIENTE DE VARIACIÓN
SECCIÓN MATERIALES LIVIANOS SECCIÓN MATERIALES PESADOS

COEFICIENTE DE VARIACIÓN PARA COEFICIENTE DE VARIACIÓN PARA


POBLACIONES MUESTRAS

EJEMPLO: Se tomaron muestras de las ventas diarias, en miles de pesos,


de dos vendedores de una empresa. ¿Cuál de las dos muestras es mas
dispersa?

VENTAS DEL VENDEDOR A VENTAS DEL VENDEDOR B


500 450 390 600 290 400 440 80 25 23 57 90 10
COEFICIENTE DE VARIACIÓN
EJEMPLO: Una muestra de las ventas por día de un almacén
de ropa de moda y un gran distribuidor textil se presentan en
la siguientes tablas. ¿Cuál de los dos promedios de ventas por
día es más confiable?
JEANS AND BREECHES DISTRIMODA
VENTAS POR DÍA VENTAS POR DÍA
(Millones de pesos) (Millones de pesos)
Ventas No. de Ventas No. de
por día días por día días
0,9 1,1 3 9,2 10,3 12
1,1 1,3 9 10,3 11,4 16
1,3 1,5 16 11,4 12,5 25
1,5 1,7 23 12,5 13,6 19
1,7 1,9 29 13,6 14,7 10
1,9 2,1 20 14,7 15,8 9
2,1 2,3 11 Suma 91
Suma 111
COEFICIENTE DE VARIACIÓN
JEANS AND BREECHES DISTRIMODA
VENTAS POR DÍA VENTAS POR DÍA
(Millones de pesos) (Millones de pesos)
Ventas No. de Ventas No. de
por día días Xi
por día días Xi
0,9 1,1 3 1,0
9,2 10,3 12 9,75
1,1 1,3 9 1,2
10,3 11,4 16 10,85
1,3 1,5 16 1,4
11,4 12,5 25 11,95
1,5 1,7 23 1,6
12,5 13,6 19 13,05
1,7 1,9 29 1,8
1,9 2,1 20 2,0 13,6 14,7 10 14,15
2,1 2,3 11 2,2 14,7 15,8 9 15,25
Suma 111 Suma 91

También podría gustarte