Mediana de Datos Agrupados
Mediana de Datos Agrupados
Mediana de Datos Agrupados
x x
2
No clases f xi fa fr far f x f x 2 xi x i
Para calcular la mediana o cualquier medida de posición de una serie de datos agrupados en
determinadas clases podríamos hacer el siguiente análisis. En el caso de la mediana, se busca el
número que divida en dos partes de igual número de datos que sean, respectivamente, menores y
mayores que ese número. En el caso que nos ocupa, como n=500 la posición que define la
mediana es (500+1)/2=250.5. Observe que se sumó 1 a n porque es par. Es decir, la mediana
deberíamos buscarlo en la clase que contenga al hipotético dato 250.5. Si observamos la
columna de frecuencia acumulada, de la clase 5 indica que hasta esa clase se tienen
contabilizados 187 datos, mientras que la siguiente clase, se tienen contabilizados 313. Es
evidente que la mediana estará incluida en la clase 6 (129.545,142.545). En esa clase se
contabilizan 126 datos (su frecuencia). Entre esos datos deberá encontrarse la mediana. La
posición que ocupe la mediana será la diferencia entre 250.5 y la frecuencia acumulada de la
clase anterior a la de la clase mediana, esto es 250.5–187=63.5. Por otro lado, los 126 datos en
la clase mediana se suponen uniformemente distribuidos a lo largo de todo el intervalo de la
1
clase. De ello se desprende que a cada uno de los datos le corresponde del intervalo y
126
13
como la clase tiene un ancho de 13, a cada dato le corresponderá de la clase mediana.
126
Sabiendo que la mediana está en la posición 63.5, se tiene que la mediana se obtendrá del
13
producto de de 63.5 y más el límite real inferior de la clase en estudio. Esto es
126
13
129.545 63.5 136.1 . La mediana de la serie de no agrupados es 135.2, por lo que el
126
error es mínimo.
Un procedimiento similar se sigue para obtener cualquier cuantil de la distribución. Por ejemplo
en el caso del tercer cuartil, se busca el número para el cual, el 75% de los datos dela distribución
son menores o iguales a él, y el 25% son mayores o iguale a él. La posición que ocupa
corresponde al 75% de los datos de la distribución, es decir 500*0.75=375. Las clases 6 y 7
tienen fa de 313 y 424, respectivamente, por lo que se deduce que Q3 deberá estar en la clase 7.
Ésta tiene una frecuencia de 111 y la diferencia entre la posición de Q3 y la fa de la clase anterior
es 375-313=62. Como la clase 7 tiene un ancho de 13, entonces, finalmente
13
Q3 142.545 62 149.81 . El cuartil 3 de la serie de no agrupados es 149.53, por lo que el
111
error es mínimo.
Aunque existen fórmulas que simplifican los cálculos, hacerlo “a pié” clarifica mucho el
concepto.
Luis Solórzano
1 agosto 2008