Conocimientos en Estadística
Conocimientos en Estadística
Conocimientos en Estadística
μ=
∑X
N
Muestra
x́=
∑x
n
Media aritmética para datos agrupados:
x́=
∑ ( frecuencia × punto medio )
n
La media aritmética, como un solo número que representa a un conjunto de datos
completo, tiene importantes ventajas. Primero, se trata de un concepto familiar para la
mayoría de las personas y es intuitivamente claro. Segundo, cada conjunto de datos
tiene una media; es una medida que puede calcularse y es única debido a que cada
conjunto de datos posee una y sólo una media. Por último, la media es útil para llevar a
cabo procedimientos estadísticos como la comparación de medias de varios conjuntos
de datos.
La moda es una medida de tendencia central diferente de la media, pero un tanto
parecida a la mediana, pues en realidad no se calcula mediante algún proceso
aritmético ordinario. La moda es el valor que más se repite en el conjunto de datos.
Cuando los datos ya se encuentran agrupados en una distribución de frecuencias,
podemos suponer que la moda está localizada en la clase que contiene el mayor
número de elementos, es decir, en la clase que tiene la mayor frecuencia.
d1
Mo=LMo + ( )
d 1+ d 2
ω
Mediana= ( n+12 )
Mediana para datos agrupados
2.2. Medidas de dispersión.
El rango es la diferencia entre el más alto y el más pequeño de los valores observados.
En forma de ecuación, podemos decir:
Rango=valor de la observación más grande−valor de la observación más pequeña
Para calcular la varianza de una población, la suma de los cuadrados de las distancias
entre la media y cada elemento de la población se divide entre el número total de
observaciones en población. Al elevar al cuadrado cada distancia, logramos que todos
los números sean positivos y, al mismo tiempo, asignamos más peso a las desviaciones
más grandes (desviación es la distancia entre la media y un valor).
Varianza de la población
2 ∑ ( x−μ )2
σ =
N
La desviación estándar de la población es simplemente la raíz cuadrada de la varianza
de la población. Como la varianza es el promedio de los cuadrados de las distancias de
las observaciones a la media, la desviación estándar es la raíz cuadrada del promedio
de los cuadrados de las distancias entre las observaciones y la media
∑ ( x−μ )2
σ=
√ N
2 ∑ ( x−x́ )2
s=
n−1
Desviación de la muestra
∑ ( x−μ )2
s=
√ N
Varianza y desviación para datos agrupados
La simetría de una distribución de frecuencias hace referencia al grado en que valores
de la variable, equidistantes a un valor que se considere centro de la distribución,
poseen frecuencias similares. Media y mediana coinciden en las distribuciones
simétricas. Si sólo hay una moda (distribución unimodal), el valor de ésta también será
igual a las dos anteriores. En distribuciones unimodales, el nivel de simetría se suele
describir de acuerdo a tres grandes categorías: distribuciones simétricas, distribuciones
asimétricas positivas (o sesgada a la derecha) y distribuciones asimétricas negativas (o
sesgada a la izquierda).
Coeficiente de asimetría de Pearson
x́−Moda
As=
s
Los valores menores que 0 indican asimetría negativa; los mayores, asimetría positiva y
cuando sea cero, o muy próximo a cero, simétrica.
Coeficiente de asimetría de Fisher: se basa en las desviaciones de los valores
observados respecto a la media. La interpretación de los resultados proporcionados por
este coeficiente es igual al primer coeficiente de Pearson.
∑ ( x−x́ )3
As=
n s3
Para datos agrupados
∑ ( x− x́ )4
K= −3
n s4
Para datos agrupados
K=
∑ ( punto medio−x́ )4 × f recuencia −3
n s4
El valor de este coeficiente para la distribución normal será igual a 0, o sea que
cualquier distribución para la que se obtenga un valor de K igual o próximo a 0
significará que su nivel de apuntamiento es como el de la distribución normal
(mesocúrtica). Valores mayores que 0, expresan que la distribución es leptocúrtica,
mientras que si son menores que 0 ponen de manifiesto que la distribución es
platicúrtica.