Medidas
Medidas
Medidas
Son aquellas que nos indican en qué medida se agrupan los datos o se acercan a un
punto medio.
i i
i i
i i
Entrevistado C.I.
Leticia 125
Francisco 92
Sara 72
Miguel 125
Rebeca 120
Rocı́o 99
Benjamı́n 130
Pablo 100
Total 863
Datos agrupados
Si obtenemos el promedio de calificaciones de matemáticas de un grupo de
secundaria, el resultado indica que en promedio la calificación del grupo fue 6.76,
esto es, que hay tanto calificaciones mayores como menores a ésta.
ř
fx 169
x̄ “ “ “ 6.76
n 25
x f fx
10 1 10
9 3 27
8 6 48
7 4 28
6 5 30
5 2 10
4 4 16
Total 25 169
Moda pMoq
La moda es el valor que se presenta con mayor frecuencia en un conjunto de datos.
De todas las medidas de tendencia central, la moda es la más fácil de determinar,
puesto que, en el caso de las distribuciones con datos no agrupados, se obtiene por
inspección, no por cómputo. Por otra parte, cuando los datos están agrupados, la
moda se define como el promedio de los valores mı́nimo y máximo del intervalo
de mayor frecuencia.
i i
i i
i i
A una distribución que cuenta con una sola moda se le denomina unimodal.
Las bimodales refieren dos valores que tienen frecuencias máximas similares. Las
multimodales, por su parte, son distribuciones de mediciones que tienen varias
modas.
Se interpreta como el dato que se repite el mayor número de veces en una
distribución, es decir, es el dato de mayor frecuencia.
Entrevistado C.I.
Leticia 125
Francisco 92
Sara 72
Miguel 125
Rebeca 120
Rocı́o 99
Benjamı́n 130
Pablo 100
Total 864
x f fx
10 1 10
9 3 27
8 6 48
7 4 28
6 5 30
5 2 10
4 4 16
Total 25 169
Mediana pMdq
Es el valor o punto en una serie que divide los valores ordenados en dos grupos de
igual tamaño. De manera que 50% de los sujetos tiene puntajes iguales o menores
i i
i i
i i
x f fa
7 2 2
6 3 5
5 4 9
4 5 14
3 4 18
2 3 21
1 2 23
Total 23
i i
i i
i i
p0.5 ˆ nq ´ f aa
Md “ LRI ` piq
f
donde:
LRI = Lı́mite real inferior del intervalo donde se encuentra la mediana.
f aa = Frecuencia acumulada anterior.
f = Frecuencia del intervalo.
i = Tamaño del intervalo.
‚ El resultado de la fórmula es el valor numérico de la mediana.
Ejemplo de datos agrupados:
Se aplicó un examen cuya calificación mayor fue 98 y la menor 64. Elabore 7
intervalos y obtenga la mediana
x f x f x f x f x f
64 1 71 4 78 5 85 4 92 2
65 2 72 3 79 6 86 4 93 2
66 1 73 3 80 6 87 4 94 4
67 2 74 4 81 6 88 4 95 3
68 2 75 5 82 7 89 5 96 2
69 3 76 5 83 7 90 5 97 2
70 5 77 5 84 4 91 3 98 2
i i
i i
i i
i f fa LRI
64-68 8 8 63.5
69-73 18 26 68.5
74-78 24 50 73.5
79-83 32 82 78.5
84-88 20 102 83.5
89-93 17 119 88.5
94-98 13 132 93.5
n`1 133
Md “ “ “ 66.5
2 2
MEDIDAS DE POSICIÓN
Son aquellas que se utilizan para conocer el lugar exacto que ocupa un dato dentro
de la distribución. Las medidas de distribución más populares son el cuartil, el
percentil y el decil.
Cuartiles
Son puntos que parten la distribución en cuatro partes o cuartos. El punto que
divide el cuarto inferior (25%) de los tres cuartos superiores de la distribución, es
el primer cuartil pQ1 q. El segundo cuartil pQ2 q es idéntico a la mediana, ya que
divide a la población en 2 partes iguales. El tercer cuartil pQ3 q divide el cuarto
superior de los tres cuartos inferiores de la distribución. La división se realiza de
acuerdo con la proporción de frecuencias observadas.
i i
i i
i i
0 25 50 75 100
Q1 Q2 Q3
Percentiles
Son puntos que dividen en centésimas (cien partes iguales) la distribución. Esto
es, son puntos bajo los cuales cae un porcentaje dado “P” de los casos. P50 es
equivalente a la mediana y al punto Q2 . Asimismo, P25 es equivalente a Q1 y, por
último, P75 equivale a Q3 .
0 25 50 75 100
i i
i i
i i
13 17 15 16 15 17 15 16 15 19 17 18 15 16 21
15 16 13 17 16 18 15 15 19 16 18 19 23 17 23
17 14 16 20 18 13 15 18 16 18 20 21 20 16 16
23 18 15 18 16 16 18 16 21 16 17 22 21 17 24
Valores f fa % % acumulado
13 3 3 5.00 5.00
14 1 4 1.66 6.66
15 10 14 16.66 23.32
16 14 28 23.33 46.65
17 8 36 13.33 59.98
18 9 45 15.00 74.98
19 3 48 5.00 79.98
20 3 51 5.00 84.98
21 4 55 6.66 91.64
22 1 56 1.66 93.3
23 3 59 5.00 98.3
24 1 60 1.66 99.96
Total 60 99.96
60 2p60q 3p60q
Q1 “ “ 15 “ 16 Q2 “ “ 30 “ 17 Q3 “ “ 45 “ 18
4 4 4
15p60q 80p60q
P15 “ “ 9 “ 15 P80 “ “ 48 “ 19
100 100
Los resultados se interpretan de la siguiente manera:
i i
i i
i i
25% de los bebés dicen su primera palabra entre los 13 y los 16 meses; 50%
antes de los 17 meses; 25% entre los 18 y los 24 meses; 15% de los bebés entre los
13 y los 15 meses y 20%, que se tarda más en hablar, lo hace entre los 19 y los 24
meses.
pxn{4q ´ f aa pxn{100q ´ f aa
Q x “ LRI ` piq P x “ LRI ` piq
f f
donde, LRI es el lı́mite real inferior del intervalo donde se encuentra la me-
dida buscada, f aa la frecuencia acumulada anterior, f la frecuencia del in-
tervalo, i el tamaño del intervalo y x el número de percentil o cuartil que se
quiere obtener.
Ejemplo de datos agrupados
Se aplicó una prueba para conocer el nivel de autoestima de un grupo de em-
pleados de una empresa. Obtener los cuartiles y los percentiles 10 y 60.
i i
i i
i i
10p194q 60p194q
P10 “ “ 19.4 P60 “ “ 116.4
100 100
i i
i i
i i
Rango o amplitud
El rango mide la extensión total de un conjunto de datos y se calcula utilizando
únicamente dos números. Para encontrar el rango se restan los dos extremos de la
medición, la medición más grande menos la medición más pequeña.
R “ X MAX ´ X MIN
i i
i i
i i
Varianza
Es una medida de dispersión que se abrevia S 2 e indica qué tanto se alejan los
datos en relación con la media. La varianza se basa en el cuadrado de la diferencia
entre cada uno de los valores del conjunto de datos y la media del grupo.
La varianza considera la distancia de cada medida con respecto a la media; esta
distancia se llama desviación. Si una sola medición cae a la izquierda de la media
sobre una gráfica de datos, se dice que la medida tiene una desviación negativa
con respecto a la media; si cae a la derecha de la media, se dice que tiene una
desviación positiva. Si tratamos de calcular la distancia promedio de cada medida
con respecto a la media, la suma de las desviaciones positivas invalida la suma
de las desviaciones negativas. El resultado de la suma numérica es cero, es decir,
representa una medida inútil de variabilidad. Para evitar este problema se elevan
las desviaciones al cuadrado (de este modo se eliminan los signos negativos) y
entonces, se promedia la suma de los cuadrados. Este cálculo produce la varianza
que indica la desviación con respecto a la media de cada medida de la muestra.
La varianza para datos agrupados se obtiene restando el punto medio del inter-
valo mayor del punto medio del intervalo más pequeño, obteniendo ası́ los valores
de x.
La varianza se obtiene mediante las siguientes fórmulas:
Para datos no agrupados:
px ´ x̄q2
ř
2
S “
n
i i
i i
i i
En los cuatro conjuntos la media es la misma: 70, pero los conjuntos son, desde
luego, completamente diferentes. No hay variabilidad alrededor de la media en el
conjunto uno, mientras que existe una gran variabilidad alrededor de la media en
el conjunto cuatro. Es obvio que la media en sı́ misma no refleja en forma alguna la
variabilidad de estas calificaciones. Por tanto, para encontrar el número que refleje
la variabilidad de las calificaciones de la prueba se emplea el rango, mediante el
cual se determina la diferencia entre la calificación más alta y la más baja.
Como puede observarse, el rango sólo toma la medida mayor y menor, ası́ que
para considerar todas las medidas se utiliza la varianza, la cual tiene en cuenta la
distancia de cada medida con respecto a la media. A continuación se desglosa el
cálculo de la varianza de uno de los conjuntos de calificaciones.
Como N “ 5, la varianza es igual a:
px ´ x̄q2
ř
2 10
S “ “ “2
n 5
i i
i i
i i
i i
i i
i i
pequeña con respecto a la media, indica que las calificaciones son homogéneas,
es decir están muy cercanas, pero si es grande, las puntuaciones son heterogéneas,
esto es, muy diferentes entre sı́.
Ejercicio de datos no agrupados
Obtener la media y la desviación estándar de la edad de los asistentes a un
curso de capacitación:
Edad x ´ x̄ px ´ x̄q2
25 ´12.88 165.89
27 ´10.88 118.37
32 ´5.88 34.57
33 ´4.88 23.81
38 0.12 0.01
39 1.12 1.25
43 5.12 26.21
48 10.12 102.41
56 18.12 328.33
Total 341 800.89
ř cř c
x 341 px ´ x̄q2 800.89
x̄ “ x̄ “ “ 37.88 s“ s“ “ 9.43
n 9 n 9
El promedio de la edad de los asistentes es 37.88 años y el promedio de la
distancia en la que se encuentran las edades con respecto a la media es 9.43. Esto
significa que las edades se desvı́an en promedio 9 años hacia arriba y hacia abajo
de la media.
Ejercicio para datos agrupados
Se aplicó una prueba de matemáticas a 200 estudiantes que deseaban ingresar
a la Licenciatura en Ingenierı́a. Obtener la media y la desviación estándar.
ř
fx
x̄ “ “ 10998{200 “ 54.99
n
cř c
px ´ x̄q2 3065.76
S “ “ “ 15.32
n 200
i i
i i
i i
i i
i i
i i
las mismas que permiten conocer cómo se distribuyen los datos del fenómeno es-
tudiado (Hopkins, Hopkins & Glass, 1997). Entre las distribuciones se encuentran:
Rectangular. Distribución simétrica con una frecuencia constante para todos
los valores. Por ejemplo, nacimientos por cada dı́a de la semana. No tiene una
moda ya que todos los valores tienen aproximadamente la misma frecuencia. La
media y la mediana pueden ser las mismas.
16000
11000
6000
1000
f
Estatura en cm
i i
i i
i i
Asimétricas. Son distribuciones que no son iguales para ambos lados. La asi-
metrı́a puede ser desde ligera hasta muy extrema. Dependiendo de la dirección
pueden ser:
‚ Positivas. Se alarga hacia la derecha, hacia el extremo de valores más alto.
Por ejemplo: número de faltas a una materia en un semestre.
‚ Negativas. Se alarga hacia la izquierda, hacia el extremo de valores más
bajo. Por ejemplo: las calificaciones de un examen muy fácil.
En las distribuciones asimétricas la media es jalada hacia los valores extremos de
la cola, por lo que en la positiva es mayor que la mediana y la moda, mientras que
en la negativa es menor.
Normal. Se llama distribución de campana o distribución normal. Tiene dos
caracterı́sticas principales:
‚ Es simétrica respecto a la lı́nea vertical de la mediana (Asimetrı́a = 0)
‚ La moda y la media son iguales a la mediana
‚ Unimodal
‚ 96% de la población cae dentro (normal) y 4% cae fuera (anormal)
‚ Por ejemplo, la estatura de las mujeres.
Para saber el grado en que una curva de distribución se parece a una curva normal,
se utilizan dos medidas: curtosis y asimetrı́a.
MEDIDAS DE DISTRIBUCIÓN
Curtosis
Describe el grado en que las proporciones observadas difieren de las de la curva
normal. Se refiere a la amplitud de la curva en una distribución normal, esto es, la
agudeza que presenta el perfil de una curva unimodal.
La curtosis está relacionada con el número de sujetos que estamos observando.
En la medida que el número de sujetos es más pequeño, la curva se hace más ancha
y conforme crece el número de sujetos la curva es menos ancha y se parece más a
una distribución normal.
De acuerdo con la curva se van a reflejar las distribuciones que pueden ser de
3 tipos:
Cuando los puntajes obtenidos al aplicar una prueba psicológica tienden a
agruparse en el centro de la distribución en un intervalo reducido de valores, se
tiene una curva aguda o leptocúrtica. Cuando esto ocurre, se dice que el grupo es
homogéneo con respecto a lo que se mide. Cuando el resultado de la curtosis es
i i
i i
i i
positivo y mayor a 1, indica que hay más casos en medio de la curva que en una
distribución normal.
> 1
= 1
< 1
i i
i i
i i
Negativa
As < 0
Positiva
As > 0
i i
i i
i i
Normal
As = 0
La curva normal es un modelo teórico o ideal sobre cómo debe comportarse la dis-
tribución de las variables en una muestra, se obtiene de una ecuación matemática.
Se utiliza como parámetro de comparación para diferentes fenómenos (Ritchey,
2008). Sus principales caracterı́sticas son:
‚ Las variables que representan deben ser numéricas, esto es, con un nivel de
medición intervalar o de razón.
‚ Representa una curva de distribución de frecuencias en la que la mediana, la
moda y la media de una variable son iguales y dividen en dos partes iguales
a la distribución.
‚ Tiene forma de campana.
‚ Es geométricamente simétrica, lo cual indica que la mitad derecha es el es-
pejo perfecto de la mitad izquierda.
‚ Aunque los valores de la media y la desviación estándar cambiaran depen-
diendo de las variables observadas, cada curva normal es simétrica y tiene
siempre el mismo porcentaje de observaciones que cae entre la media y las
desviaciones.
‚ Permite conocer la distribución de situaciones reales.
Muchas variables como la inteligencia medida en términos de Coeficiente In-
telectual (CI), se distribuyen en la población tomando la forma de la curva normal,
en que la mayorı́a de los casos se encuentran en el centro (Moda), existiendo po-
cos casos en los extremos, siguiendo el ejemplo del CI, existen pocos sujetos con
inteligencia muy baja por un lado y pocos genios por el otro, esto es lo que da a la
curva normal su caracterı́stica forma de campana (Ritchey, 2008).
i i
i i