Clase Octubre 19-1
Clase Octubre 19-1
Clase Octubre 19-1
1. ¿Qué estudian las medidas de dispersión y cuáles son las principales medidas de dispersión?
Las medidas de dispersión estudian el grado en que los datos de una distribución están dispersos o
agrupados. Es decir, miden la variabilidad de los datos.
2. ¿Cómo se determina la desviación media y como se calcula en una serie simple, en una serie
de datos y frecuencias y en una serie de clases y frecuencias?
La desviación media es una medida de dispersión que mide la distancia promedio entre cada dato de
un conjunto de datos y la media de ese conjunto. Se calcula tomando la suma de las diferencias
absolutas entre cada dato y la media, y dividiendo el resultado por el número total de datos.
En una serie simple, la desviación media se calcula de la misma manera que en una serie de datos
con frecuencias. La única diferencia es que no hay que sumar las frecuencias, ya que se considera
que cada dato tiene una frecuencia de 1.
dm = ∑ |xi - μ| / n
donde:
∑ es la suma
xi es el dato del conjunto en la posición i
μ es la media del conjunto
n es el número total de datos
dm = ∑ |(fi*li) - μ| / n
donde:
∑ es la suma
fi es la frecuencia de la clase i
li es el límite inferior de la clase i
μ es la media del conjunto
n es el número total de datos
donde:
R es el rango
xmax es el dato mayor
xmin es el dato menor
4. ¿Cómo se define a la varianza y cómo se calcula en una serie simple, en una serie de datos y
frecuencias y en una serie de clases y frecuencias?
La varianza es una medida de dispersión que mide la variabilidad de los datos de un conjunto de
datos con respecto a su media. Se calcula tomando la suma de los cuadrados de las diferencias entre
cada dato y la media, y dividiendo el resultado por el número total de datos.
Definición
La varianza se define como la media de los cuadrados de las desviaciones de los datos con respecto a
la media. Se representa por la letra griega σ² (sigma al cuadrado).
Fórmula
σ² = ∑(xi - μ)^2 / n
donde:
σ² es la varianza
xi es el dato del conjunto en la posición i
μ es la media del conjunto
n es el número total de datos
Interpretación
Una varianza alta indica que los datos están dispersos de manera uniforme. Una varianza baja
indica que los datos están agrupados cerca de la media.
En una serie simple, la varianza se calcula de la misma manera que en una serie de datos con
frecuencias. La única diferencia es que no hay que sumar las frecuencias, ya que se considera que
cada dato tiene una frecuencia de 1.
σ² = ∑(fi*xi - μ)^2 / n
donde:
fi es la frecuencia del dato del conjunto en la posición i
xi es el dato del conjunto en la posición i
μ es la media del conjunto
n es el número total de datos
σ² = ∑(fi*μi - μ)^2 / n
donde:
fi es la frecuencia de la clase i
μi es la media de la clase i
μ es la media del conjunto
n es el número total de datos
5. ¿Cómo se define a la desviación estándar y cómo se calcula en una serie simple, en una serie
de datos y frecuencias y en una serie de clases y frecuencias?
La desviación estándar es una medida de dispersión que mide la variabilidad de los datos de un
conjunto de datos con respecto a su media. Es la raíz cuadrada de la varianza.
Definición
La desviación estándar se define como la raíz cuadrada de la media de los cuadrados de las
desviaciones de los datos con respecto a la media. Se representa por la letra griega σ (sigma).
Fórmula
σ = √(σ²)
donde:
σ es la desviación estándar
σ² es la varianza
En una serie simple, la desviación estándar se calcula de la misma manera que en una serie de datos
con frecuencias. La única diferencia es que no hay que sumar las frecuencias, ya que se considera
que cada dato tiene una frecuencia de 1.
σ = √(∑(fi*xi - μ)^2 / n)
donde:
σ = √(∑(fi*μi - μ)^2 / n)
donde:
fi es la frecuencia de la clase i
μi es la media de la clase i
μ es la media del conjunto
n es el número total de datos
6. ¿Cómo se determina el coeficiente de variación y por qué es importante?
El coeficiente de variación es una medida de dispersión relativa que mide la variabilidad de un
conjunto de datos con respecto a su media, expresada como un porcentaje. Se calcula dividiendo la
desviación estándar por la media y multiplicando por 100.
Un sesgo positivo indica que la media de la distribución está por encima del valor verdadero. Esto
significa que el estimador tiende a sobreestimar el valor verdadero. Un sesgo negativo indica que la
media de la distribución está por debajo del valor verdadero. Esto significa que el estimador tiende a
subestimar el valor verdadero.
12. ¿Qué son los momentos como medidas de forma?
Los momentos son medidas que describen la forma de una distribución de datos. Se calculan
elevando la variable aleatoria a una potencia y luego tomando la media de los resultados.
Los momentos se pueden utilizar para comparar la forma de dos o más distribuciones de datos. Por
ejemplo, una distribución con un momento de tercer orden más alto que otra distribución tendrá
una cola más pesada, lo que significa que habrá más valores atípicos. Los momentos de forma son:
Momentos centrales:
Momento de primer orden: media
Momento de segundo orden: varianza
Momento de tercer orden: curtosis
Momentos no centrales
Los momentos no centrales más comunes son:
Momento de primer orden no central: media no central
Momento de segundo orden no central: varianza no central
Momento de tercer orden no central: curtosis no central