Medidas Estadísticas: Tendencia Central - Posición - Dispersión
Medidas Estadísticas: Tendencia Central - Posición - Dispersión
Medidas Estadísticas: Tendencia Central - Posición - Dispersión
Dirección de Investigación
Área: Estadística
Sesión 5
Medidas Estadísticas:
Tendencia Central – Posición - Dispersión
CAPACIDADES
1. Realiza cálculos básicos utilizando las fórmulas,
tanto para datos simples como para datos
agrupados, de las medidas de tendencia central.
2. Interpreta las medidas calculadas, usando como
referencia el contexto y las variables en estudio.
3. Calcula e interpreta cuantiles.
4. Analiza la presencia de valores extremos en un
conjunto de datos.
ACTITUDES
1. Valora la importancia que tienen las medidas de tendencia central y los cuantiles en la
descripción de las poblaciones estadísticas en estudio.
2. Actúa trabajando en equipo con responsabilidad, puntualidad y orden en la ejecución de
las tareas y trabajos asignados, asumiendo una posición reflexiva y crítica hacia los
resultados obtenidos.
CONTENIDO
Medidas de Tendencia Central. Media Aritmética, Mediana y Moda. Cuantiles. Valores
Atípicos y Extremos.
MEDIDAS ESTADISTICAS
En numerosas ocasiones, en vez de trabajar con todos los datos, es preferible disponer de una
o más medidas descriptivas que resumen los datos de forma cuantitativa. Se trata, de resumir
en unos cuantos valores la información más importante y útil contenida en un conjunto de datos,
haciendo más fácil la comprensión y la comparación de las diversas características de las
poblaciones o muestras.
I. DEFINICIÓN
Las medidas estadísticas son medidas de resumen que se calculan a partir de una muestra
y que describen ciertos aspectos de una serie o distribución de datos para poder tener un
mejor conocimiento de la población
II. FINALIDAD
Las medidas estadísticas pretenden "resumir" la información de la "muestra" para poder
tener así un mejor conocimiento de la población
1
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística
Medidas
Estadísticas
a. MEDIDAS DE TENDENCIA CENTRAL
Son valores que se ubican en la parte central de un conjunto de datos o de una
distribución.
Las medidas de centralización responden a la pregunta. ¿Alrededor de qué valor se
agrupan los datos?
Estas medidas solo se calculan para variables cuantitativas.
EL conocimiento de estas medidas es de gran utilidad tanto en los niveles de decisión
como de ejecución.
Las principales medidas de tendencia central son:
MUESTRA POBLACION
Media aritmética simple X μ
Media ponderada Xp μp
La Mediana me Me
La Moda mo Mo
Datos
μ=
∑ Xi . fi x́=
∑ Xi . fi
Agrupados* fi N n
Ejemplo: Suponga que se han registrado 20 observaciones referentes a los ingresos
semanales del jefe de hogar de un determinado distrito. De la información muestral
obtenida calcule el promedio:
36 55 55 41 41 41 57 37 45 43
25 55 55 55 40 31 58 58 36 43
Solución: Calculamos el promedio muestral:
n
xi
36 25 ... 58 43 907 .0
x i 1 45 . 35
n 20 20
1.2.LA MEDIANA (Me)
Valor que divide en dos partes iguales un conjunto de datos ordenados en forma
ascendente o descendente
En otras palabras es el valor que ocupa del lugar central.
La cantidad de datos que queda por debajo y por arriba de la mediana son iguales.
Es una medida de tendencia central que divide al total de n observaciones
debidamente ordenadas o tabuladas en dos partes de igual tamaño, cada una con el
50% de los datos observados.
Datos no
agrupados Valor que está en la mitad de
la serie ordenada Promedio de los 2 valores
centrales
n
Datos
Agrupados
(TABLAS)
Me=LI +
2
[ ]
−F i−1
fi
c
X n +X n
2 2
+1 X 5+ X 6 850+850
Me= = = =85 0
2 2 2
PROPIEDADES DE LA MODA
La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de
intervalos, y relativa).
La moda no es afectada por valores extremos.
4
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística
DESVENTAJAS DE LA MODA
En muchas series de datos no hay moda porque ningún valor aparece más de una vez.
En algunas series de datos hay más de una moda, en este caso uno podría preguntarse
¿cuál es el valor representativo de la serie de datos?
∆1
Mo=LI +
[ ]
∆1 +∆ 2
c
1°) La media aritmética tiene la ventaja de que toma en cuenta para su cálculo, la totalidad de
los valores de la variable, aumentando o disminuyendo de acuerdo a ellos, pero a causa de
este problema, puede tener la desventaja que es afectada por la existencia de valores muy
altos o muy bajos en los extremos.
En conclusión cuando el comportamiento de la variable es más o menos simétrico la media
aritmética es la más recomendable.
4°) La moda no es muy usual, pero se emplea cuando se quiere conocer el valore que se
presenta más frecuentemente.
b. MEDIDAS DE POSICION
Formula: Qi=LI +
Q1 Q2 Q3
o Numero par de datos 1, 2, 3, 4, 5, 6, 7, 9
2.5 4.5 6.5
Q1 Q2 Q3
Ejemplo datos agrupados: 1∗63
fi FI Cuartil 1 (Q1) =15.75
4
15.75−8 5
Q 1=60+ [ 10 ]
10=67.75
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística
[ 50 – 60 ) 8 8
[ 60 – 70 ) 10 18
[ 70 – 80 ) 16 34
[ 80 – 90 ) 14 48 2∗63
Cuartil 2 (Q2) =31.5
[ 90 – 100 ) 10 58 4
[ 100 – 110 ) 5 63
31.5−18
Total 63 Q 1=70+ [ 16 ]10=78.44
]
c
EJEMPLO:
Pi=LI + [
100
fi
i −1
c ]
Suponga que se han registrado 20 observaciones referentes a los ingresos semanales
del jefe de hogar de un determinado distrito. De la información muestral obtenida
calcule el cuatil1, decil 8 y percentil 97:
36 55 55 41
25 55 55 55
41 41 57 37
40 31 58 58
45 36 43 43
Solución:
Seguimos el siguiente procedimiento:
1. Ordenar la serie en forma ascendente
2. Definir la posición de los cuartiles, deciles y percentiles siguiendo la formula
correspondiente.
3. Luego
Cuartil1
Ordenando los datos de forma ascendente:
25 31 36 36 37 40 41 41 41 43 43 45 55 55 55 55 55 57 58 58
De esto decimos que el cuartil 1 está entre la ubicación 5ºy 6º (pues el valor
hallado es 5.25), luego para hallar el valor de la ubicación 5.25 interpolamos:
5.0º 37
5.25º de esto obtenemos que la ubicación 5.25º 39.75
6.0º 40
Por lo tanto Q1: 39.75.
Calcularemos la ubicación del decil 8 para lo cual definimos la posición del decil 8
(D=8): DK Wk(n+1) 0.80 (20+1) 16.8.
De esto decimos que el decil 8 está entre la ubicación 16ºy 17º (pues el valor
hallado es 16.8), luego para hallar el valor de la ubicación 16.8 interpolamos:
16.0º 55
16.8º de esto obtenemos que la ubicación 16.80º 55
17.0º 55
Po lo tanto D8: 55
c. MEDIDAS DE DISPERSIÓN
Rango
Desviación estándar
Son indicadores estadísticos que representan cuan dispersas se encuentran los datos de la
variable, señalándonos el grado de concentración de los mismos con respecto al promedio
de la distribución.
7
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística
MUESTRA POBLACION
Rango R R
Varianza S2 2
Desviación estándar S σ
3.1. RANGO: R = Max - Min
Se denota por R y la medida de variabilidad más fácil de calcular.
Es la diferencia que existe entre el valor máximo y el valor mínimo del conjunto de
datos.
Su uso es muy limitado, pues solo toma en cuenta los valores extremos
Ejemplo: La edad de 10 alumnos en un aula de clase, es según se muestra a
continuación. Se pide hallar el rango.
23 18 28 18 16 26 19 20 21 18
Solución. Rango = 28-16 = 12
Luego, existe una dispersión de 12 años.
3.2. VARIANZA (σ2):
Mide la variabilidad de un conjunto de datos respecto a un valor central(promedio)
Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es ilógica su
interpretación.
Para calcular la varianza se utilizan las fórmulas adecuadas ya sea sin son datos
agrupados o datos no agrupados.
POBLACION MUESTRA
N n
DATOS SIN ∑ ( x i−μ ) 2
∑ ( x i− x̄ )2
AGRUPAR
σ 2 = i=1 S 2 = i=1
N n−1
N n
DATOS ∑ ( Y i −μ )2 . f i ∑ ( Y i− x̄ ) 2 . f i
i=1
AGRUPADOS σ 2 = i=1 S 2=
N n−1
N N
ABREVIADA
∑ X 2i ∑ X 2i
σ 2 = i=1 −μ 2 σ 2 = i=1 −μ 2
N n−1
Donde:
Xi valores de la variable X
Yi marca de clase de cada variable o grupo
N tamaño de la población
n tamaño de la muestra
2 Varianza poblacional
S2 Varianza muestral
8
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística
DESVIACION STANDARD: 2 S= √ S2
Ejemplo: En una de las fábricas de Motor Perú, se producen autos de diversas
marcas, desde Enero a Agosto de 2007
Meses : Ene Feb Mar Abr May Jun Jul Agos
Producción: 100 130 90 120 100 140 110 98
Defina la variable en estudio y halle la varianza y Desviación Standard.
σ S
C .V .= ∗ 100% c. v.= ∗ 100%
μ X
Donde: C.V. = coeficiente de variación de la población
c.v = coeficiente de variación muestral
σ = Desviación estándar poblacional
µ = Media aritmética poblacional
S = Desviación estándar muestral
X = Media aritmética muestral
Solución: A B
µ 500 500
σ 63.25 516.20
C.V.
EJEMPLO:
9
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística
Solución:
Rango: R=V max − V min 58-25 33
Varianza muestral:
Para calcular VARIANZA para datos sin agrupar, trabajamos con la fórmula:
n
( x i x ) 2 (36 45.38)2 (25 45.38)2 ... (58 45.38)2 (43 45.38)2 1882.55
s 2 i 1 20 1
19
99.08
n 1
La varianza tiene una interpretación un poco dificultosa de entender, es por eso que
nos ayudamos de la desviación estándar cuando queremos interpretar esta medida.
Este valor se puede interpretar como la variabilidad promedio de los datos con
respecto con respecto a su valor X́
Coeficiente de variación:
Para calcular el coeficiente de variación para datos sin agrupar, trabajamos con la
fórmula:
CV =s/ X́∗100=( 9.95/45.38 )∗100=21.93 %
1. La empresa A tiene 100 empleados, con su sueldo promedio mensual por empleado de $
250. La empresa B tiene 200 empleados con un sueldo promedio mensual de $ 240.
a. ¿Cuál es el sueldo promedio mensual de las dos empresas en conjunto?
b. Si las dos empresas se agrega una tercera con 50 empleados y un sueldo promedio
mensual por empleado de $ 300, ¿Cuál es el sueldo promedio para las tres
empresas en conjunto?
2. El ingreso medio mensual de los 16,500 obreros de una compañía es de S/. 116.00 y de los
12,900 empleados de esta compañía es de S/. 148.00. Si los obreros reciben una aumento
del 20% sobre sus ingresos más una bonificación de S/. 50.00 por condiciones de trabajo y
los empleados reciben un aumento del 30% más S/. 60.00 por refrigerio. ¿Cuál es el ingreso
promedio de todos los trabajadores de la compañía después del aumento?
3. Un auxiliar de contabilidad está trabajando en una Tienda Comercial, en la cual se han
realizado ciertas ventas, que han sido facturadas. Se presenta las facturas identificadas
según nro de código.
10
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística
FACTURAS: 123, 140, 300, 126, 127, 128, 129, 130, 141, 142, 120, 131, 132, 111, 133,
135, 134, 139, 142, 146.
a. Se le pide ordenar las facturas y luego aplicar los cuartiles Q1, Q2, Q3.
b. Calcular el nro. De factura mediana e interpretar correctamente
11
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística
1.2- 2.6 7
2.7-4.1 23
4.2-5.6 70
5.7-7.1 135
7.2-8.6 27
TOTAL
3. Se presenta el nro. de vacunas que se aplicaron a niños menores de 5 años. según fueron
atendidos en diferentes puestos de salud. Calcula el promedio, la mediana y la moda, e
interprete correctamente.
2 3 4 5 5 5 5 5 6 6 6 67 7 7 7 7 7 88
4. A aquellos pacientes que sienten mejoría todos los días del Tiempo de Nº de
tratamiento se les realiza un estudio sobre el tiempo de reacción pacientes
reacción del medicamento (en minutos), encontrándose 0-10 300
recogido los datos en la siguiente tabla:
Calcula el promedio, mediana, moda e interpreta correctamente 10-20 500
cada estadígrafo. Identifica la variable en estudio y realiza una 20-30 400
gráfica adecuada. 30-40 500
40-60 300
C.- INGENIERIA:
1. En una investigación agrícola en el Valle de Chancay se determinó la producción total en
(kilogramos), de un cierto cultivo, el cual fue sembrado en 20 parcelas experimentales. Los
resultados fueron:
Producción en Kg:40, 35, 38, 40, 41, 37, 41, 38, 20, 25, 33, 27, 25, 28, 44, 22, 29, 36
12
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística
3. En cada uno de las sgtes. Tablas determinar las medidas descriptivas que se te pide.
Media, Mediana, moda y sus interpretaciones.
a. Cantidad en litros de insecticida que se necesita para la fumigación de las plagas
según por nro. de terrenos de cultivo
MEDICIONES fi
1.2- 2.6 7
2.7-4.1 23
4.2-5.6 70
5.7-7.1 135
7.2-8.6 27
TOTAL
b. Sueldos en soles que se les paga a los trabadores que realizan siembra y riego en
los cultivos de Chavimochic
SUELDO fi
240-364 13
365-489 76
490-614 18
615-739 9
740-864 4
TOTAL
4. Se presenta el nro. frutos maduros hallados cada dos semanas en una huerta de cultivos.
2 3 4 5 5 5 5 5 6 6
6 6 7 7 7 7 7 7 8 8
Calcula el promedio de frutos, el fruto mediano. El fruto más frecuente. e interpreta.
5. Se tiene en cuenta el nro. de sembríos de arroz por valles de la costa peruana fue lo sgte:
13
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística
sembrío fi
1 3
2 7
3 10
4 5
5 10
TOTAL
Calcula:
a) El promedio, mediana, moda e interpreta
cada estadígrafo.
b) Realiza una gráfica correspondiente de acuerdo al tipo
de variable.
a. ¿Cuántos días hizo por encima de 21ºC? ¿Cuántos por debajo de 23ºC?
b. ¿Cuántos días hizo la temperatura máxima?
c. Calcula la media, la moda y la mediana.
7. El siguiente cuadro muestra la distribución de la renta anual (en miles de soles) en que
incurren 50 viviendas:
Marca de Clase 18.85 21.55 24.25 26.95 29.65 32.35 35.05
N° de Viviendas 3 2 7 7 11 11 9
D.- EDUCACION:
14
Universidad César Vallejo - Trujillo
Dirección de Investigación
Área: Estadística
1. Se realiza una estadística en dos centros de enseñanza, uno público y otro privado,
referente a la nota global del bachillerato de cada uno de los alumnos que van a acudir a los
exámenes de selectividad. Las distribuciones de frecuencias son las siguientes:
Centro privado Centro público
Nota global de
Nota global de Frecuencias Frecuencias
cada alumno.
cada alumno.
[5 , 6 250
5,5 10
(6 , 7 150
6.5 15
7.5 20 (7 , 9 100
9.5 15
Se pide:
a. A la vista de la tabla, te sugiere algún comentario de especial importancia. ¿Cuál es
el motivo de que los datos se presente en dos tablas de diferente tipo?
b. Estudiar las diferentes medidas de tendencia central (promedios) en las dos
distribuciones. En cada distribución ¿cuál te parece más representativo? ¿por qué?
c. Indique cual es la nota mediana de cada grupo.
(Li - Ls) fi
10-20 2
20-30 3
30-40 5
40 - 50 8
50-60 12
6. Se tiene que:
A 2 3 3 5 7 6 7 5 8 4
B 6 7Se pide 5 calcular
2 9 la 1 7 6 4 2
C 3 4mediana, 7 6moda 8 y media.
9 7 6 3 2
Se pide determinar el promedio, mediana y moda.
7. Dada la distribución de frecuencias de cierto número de alumnos:
Edades 20 22 24 26 28
fi 5 4 6 3 2
Determinar el promedio aritmético entre la mediana y la media.
16