MTC y MD
MTC y MD
MTC y MD
Muchas veces usamos un solo número o información para representar la tendencia de toda una serie
de datos: “La esperanza de vida de los chilenos es de 78 años”; “El salario promedio en Chile es de 660
dólares mensuales”; “La mayoría de los chilenos se declara creyente”.
Estos números se conocen como medidas de tendencia central y son la media, la moda y la mediana.
__
La Media aritmética o promedio (X)
La media aritmética (o simplemente “la media”) de un conjunto de datos es un valor que se obtiene
sumando todos los datos y luego dividiendo por el total. _
Se anota X
Total 50
Si en vez de tener todos los datos, solamente disponemos de la tabla de frecuencias, podemos calcular
el promedio usando las marcas de clase. En vez de pensar, por ejemplo, que hay 13 puntajes entre 400
y 499, asumiremos que hay 13 personas que sacaron 450 puntos. Dado que puede que no tengamos
los datos reales, esto permite tener una buena aproximación al promedio.
Veamos: Si hay 2 puntajes de 350, 13 de 450 puntos, etc., el promedio que obtenemos es:
_
X= (2×350+13×450+19×550+11×650+5×750)/50
_
X= 27.900/50
_
x= =558
Por lo tanto, la fórmula para encontrar la media aritmética está dada por:
__
X=∑ (fi*xi)/n
Comparado con el promedio real (549,6) hay 8,4 puntos de diferencia, lo cual no es mucho y si
compruebas los dos promedios calculados, verás que el primero es muchísimo más largo de realizar,
por lo cual el segundo es preferible, aunque sea menos preciso.
La moda. (Mo)
La moda de un conjunto de datos es aquel que aparece más veces. Si se repite entre dos (o tres o más)
datos, el conjunto de datos se denomina bimodal (o trimodal o multimodal). Si ningún dato se repite,
diremos que no hay moda.
En el caso de los puntajes PSU, el intervalo modal es 500 – 599 (pues es el intervalo que presenta la
mayor frecuencia: 19).
La mediana. (Me)
Si ordenamos los datos desde el menor hasta el mayor, la mediana es un valor bajo el cual está el 50%
de los datos. Si hay dos datos que ocupan el lugar central, se calcula el promedio de ellos.
Por ejemplo:
a) La mediana de 1, 3, 5, 8, 9 es 5.
b) La mediana de 1, 3, 3, 5, 8, 8 es 4 (el promedio entre 3 y 5, pues estos son los datos del centro).
N° de hermanos N° alumnos
0 2
1 10
2 8
3 4
4 0
5 1
b) Moda.
La moda es 1, pues es el dato con la mayor frecuencia (10).
Respuesta: Los alumnos del curso tienen, en cuanto a moda, 1 hermano.
El ejemplo anterior te muestra que los valores de la media, la moda y la mediana pueden ser bastante
diferentes, por lo tanto hay que pensar bien cuál es el más representativo en cada caso.
Ejemplo 2:
La siguiente tabla muestra las atenciones médicas de un hospital durante un fin de semana,
considerando las edades de los pacientes:
Años f (N° de pacientes) F
[10-20[ 8 8
Intervalo modal y mediano
[20-30[ 20 28
[30-40[ 14 42
[40-50[ 8 50
[50-60[ 2 52
[60-70[ 2 54
[70-80[ 1 55
Me = 20 + 10[(55/2 –8)/20]
Me = 20 + 10[27,5 – 8)/20]
Me = 20 + 10[19, 5/20]
Me = 20 + 10*0,975
Me = 20 + 9,75
Me = 29, 75 ≈ 30
Rp. El 50% de los pacientes atendidos ese fin de semana eran menores de 30 años. (El otro 50% era
mayor de 30 años).
ACTIVIDADES
1. Un supermercado hace un estudio y descubre que las bolsas de mercadería que llevan las
personas pesan entre 500 gramos y 2 kilos. La siguiente tabla muestra los datos:
Peso de la bolsa N° de bolsas
(kg) Encontrar las Medidas de Tendencia Central e
2. Un colegio hace un estudio acerca de las estaturas de los alumnos. La siguiente tabla te
muestra los resultados.
Estatura N° alumnos
(cm) Encontrar e interpretar las Medidas de
150 - 155 4 Tendencia Central.
155 - 160 22
160 – 165 56
165 – 170 32
170 - 175 5
55 64 70 74 75 70 64 93 60 62 70 80
61 62 60 68 65 65 66 68 70 72 72 71
56 56 56 53 60 65 60 45 46 50 47 55
49 52 50 46 50 52 52 48 52 63 53 54
54 54 53 55 57 44 67 61 68 55 64 60
MEDIDAS DE DISPERSIÓN.
ACTIVIDAD
Consideremos los siguientes conjuntos de valores referidos a las edades de los jugadores de dos
equipos de fútbol.
Equipo 1: 24,25,26,23,26,21,27,24,23,26,25
Equipo 2: 36,18,28,17,37,15,14,44,27,21,13
En este caso, conformarnos solo con la media para informar sobre las edades de los jugadores es
insuficiente. Tal como habrás observado, en el equipo 1 todos los jugadores tienen edades cercanas a
los 24 años, y en cambio en el equipo 2 las edades son mucho más variables: varían entre los 13 y los
44 años.
Necesitamos entonces algún indicador estadístico que nos indique cuánto se separan algunos valores
de su media.
Las medidas de tendencia central que ya vimos (media, moda y mediana) sólo nos dicen parte de la
historia de un conjunto de datos. En general, no indican cómo están distribuidos los datos, es decir, si
estos son muy variables o no.
Las medidas de dispersión sí lo hacen. Las medidas de dispersión indican qué tanto se dispersa o
distribuye, alrededor de su media, un conjunto de datos. También entregan información sobre la
Profesor Gary Vilches Campos 4
ESTADISTICA II
variabilidad de las observaciones. Si los datos no son muy variables (como en el ejemplo 1), decimos
que hay homogeneidad; en caso contrario se habla de heterogeneidad del conjunto de datos.
1. Rango o recorrido
El rango de una variable es la diferencia entre el valor máximo y el valor mínimo de la distribución.
Aunque no es una medida muy significativa, nos indica cuán dispersos se encuentran los datos entre
los valores de los extremos.
2. Varianza (S)
Si elevamos al cuadrado la suma de todas las diferencias entre cada variable con el promedio de la
muestra y luego dividimos por el número total de la muestra, obtenemos un número denominado
varianza.
Matemáticamente:
La varianza como medida de dispersión sólo tiene un inconveniente: Su
n _ valor está dado en unidades cuadradas. Por lo tanto, no es muy
s= ∑ (xi-x)2 recomendable su uso. Para solucionar esto, definimos un nuevo
i=1________
indicador estadístico, la Desviación Estándar.
n
También podemos encontrar el Coeficiente de variación, este nos permite determinar cuan dispersos
están los datos en general. Además, nos permite comparar distintos estudios, con relación a la
homogeneidad de sus datos.
CV = Ẍ
ACTIVIDADES
1. ¿Es posible que la desviación estándar sea negativa? ¿Puede ser cero? En ambos casos explica tu
respuesta.
2. ¿Qué se puede decir de un conjunto de datos, si sólo sabemos que su media es 67 y que tanto su
rango como su varianza son cero?
5 Un profesor de matemática debe elegir entre sus dos mejores alumnos Andrés y Paula para una
Olimpiada de matemática. Las notas de ambos son:
Andrés 6,5- 6,6- 6,4- 6,6- 6,5- 6,7
Paula 7,0- 6,0- 6,3- 6,0- 7,0- 7,0
6. A los dos 2° medios de un colegio se le aplica una misma prueba de matemática, obteniendo
los siguientes resultados:
Juan Pablo, alumno del 2° medio A, obtuvo un 6,7 y Gabriel, alumno del 2° medio B, obtuvo un 6,6.
¿Quién obtuvo un mejor rendimiento en la prueba en relación con su curso?
Cuando tenemos datos agrupados, el rango se calcula como la diferencia entre el mayor valor de la
última clase menos el menor valor de la primera clase.
Para calcular los otros parámetros estadísticos, varianza, y desviación estándar, a partir de datos
agrupados, consideremos las marcas de clases como si fueran los valores verdaderos, es decir xi.
Recuerda que la marca de clases corresponde al punto medio de una clase.
n _
∑ fi*(xi - x)2
S= i=1________ ____
n
Así:
Desviación estándar:
n _
√ ∑ fi*(xi - x)2
i=1________ ____ o √s (raíz cuadrada de la varianza)
n
ACTIVIDADES
3. En un curso se anotan los pesos en kilos de los alumnos obteniéndose los siguientes valores:
63- 56- 51- 81- 68- 69- 67- 65- 71- 56- 77- 73- 67- 65- 63- 71- 72- 67- 58- 68- 58-
69- 65-56-58-67-65- 66- 68- 71- 65- 69- 61- 72- 78- 65- 70-49-56-59-54-65-64-53-
69-70-64-64-63-62-61-67-67-65-64-60-60-56-47-56-71-44-55-65-53-61-63-45-49
a) Calcula la media, la moda y la mediana.
b) Calcula la desviación estándar.
4. Un supermercado desea saber cuánto gasta una familia cuando realiza sus compras (en miles de
pesos). Un día realiza una encuesta a 5000 de sus clientes. Este estudio nos aporta la siguiente tabla:
Intervalo Frecuencia
0-5 1000
5-10 1100
10-20 1600
20-50 1000
50-100 300
a. ¿Cuánto gastan en promedio?
b. Encontrar en coeficiente de variación.