Medidas de Tendenciacentral
Medidas de Tendenciacentral
Medidas de Tendenciacentral
MATERIAL DE PROFUNDIZACIÓN
Equipo recopilador
_Material de profundización
_ 3
Número con
Por medio de: mayor frecuencia Promedio de Centro de
dentro del conjunto de conjunto de
conjunto de datos numéricos. datos numéricos.
Números datos.
Las medidas de tendencia central o de resumen son valores que generalmente se ubican en la parte central de la
distribución de datos. Fundamentalmente, estas medidas se usan para variables cuantitativas, aportando una idea
acerca del comportamiento de la variable, por ejemplo, el promedio de un conjunto de datos.
Revisemos en detalle las medidas de tendencia central a continuación:
_Material de profundización
_ 4
6.8 5.1 6.2 5.8 4.5 5.0 6.0 5.7 4.2 3.8
3.8 5.8 3.7 5.0 4.8 5.9 5.7 6.1 5.8 6.2
6,8 + 5,1 + 6,2 + 5,8 + 4,5 + 5,0 + 6,0 + 5,7 + 4,2 + 3,8 + 3,8 + 5,8 + 3,7 + 5,0 + 4,8 + 5,9 + 5,7 + 6,1 + 5,8 + 6,2
X =
20
105,9
X = = 5,295 𝐿𝐿𝐿𝐿 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 5,3
20
Por ejemplo, consideremos las proteínas totales del plasma en prematuros normales de 15 días de edad, presentadas
en la siguiente tabla:
Tabla 1: Medida o promedio para datos agrupados en intervalos. Fuente: elaboración propia.
_Material de profundización
_ 5
DESVENTAJAS
datos. En estos casos podría
VENTAJAS
1.2. Moda
Es aquel valor que más se repite en una muestra y se denota por Mo.
Veamos el siguiente ejemplo para determinar la moda para datos no agrupados. Consideremos las siguientes notas
como las correspondientes a un curso de 20 estudiantes:
3.7 3.8 3.8 4.2 4.5 4.8 5.0 5.0 5.0 5.2
5.3 5.5 5.8 5.8 6.0 6.2 6.4 6.4 6.6 6.8
_Material de profundización
_ 6
También se utiliza la moda si la variable está medida en escala ordinal o numérica discreta:
0 14 4,17%
1 83 24,70%
2 193 57,44%
3 46 13,69%
∆1
𝑀𝑀𝑀𝑀 = 𝐿𝐿𝐿𝐿 + � � ∗ 𝐴𝐴
∆1 + ∆2
Donde:
Li: Límite inferior del intervalo que contiene la frecuencia más alta.
Δ1: Diferencia entre la frecuencia más alta y la del intervalo anterior.
Δ2: Diferencia entre la frecuencia más alta y la del intervalo siguiente.
A: Amplitud del intervalo.
Edad fi
16-20 8 La moda o dato más
20-24 10 5
24-28 15
𝑀𝑀𝑀𝑀 = 24 + �
5+3
� ∗ 4 = 26,5 frecuente de edad en este
28-32 12 grupo de datos es de 26,5
32-36 5
Li: 24.
Δ1: 15-10=5.
Δ2: 15-12=3.
A: 4.
_Material de profundización
_ 7
DESVENTAJAS
VENTAJAS
1.3. Mediana
Es aquel valor que divide la muestra en dos partes iguales. De este modo, la mediana es el primer valor de la variable
que deja por debajo de sí al 50% de las observaciones. La mediana corresponde al percentil 50 o cuartil 2,
(mediana=P50=Q2). Notemos que la mediana es tanto un estadígrafo de posición y de centralización.
Entonces, si tenemos los siguientes datos: 5 7 7 10 12 18 25, podemos decir que el valor que divida la muestra en dos
partes iguales es 10.
Si n es par, la mediana es igual al promedio de las dos posiciones centrales. Por ejemplo, si tenemos 5 7 7 10 12 18 25
32, la mediana será 11.
_Material de profundización
_ 8
𝑛𝑛
− (𝐹𝐹𝐹𝐹 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎)
𝑀𝑀𝑀𝑀 = 𝐿𝐿𝐿𝐿 + ��2 � ∗ 𝐴𝐴�
𝑓𝑓𝑓𝑓
Donde:
Li: Límite inferior del intervalo de la clase mediana
n: Número total de observaciones
Fi anterior: Frecuencia acumulada hasta el intervalo anterior a que contiene la mediana.
fi: Frecuencia absoluta de la clase mediana.
A: Amplitud de la clase mediana.
n/2: Muestra/2. Clase mediana
Veamos el siguiente ejemplo, en donde tenemos una distribución por edad de 975 personas:
Edad fi Fi Donde:
15-25 40 40 Li: 55
25-35 67 107 n: 975
35-45 143 250 Fi anterior: 430
fi: 270
45-55 180 430
A: 10
55-65 270 700 n/2: 975/2= 487,5
65-75 275 975
El 50% de los individuos tiene 57,1 años o menos. El valor que divide la muestra en dos partes iguales, es 57,1.
_Material de profundización
_ 9
DESVENTAJAS
VENTAJAS
REFERENCIAS BIBLIOGRÁFICAS
_Material de profundización