5-Varianza, Desviacion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 2

Estadística descriptiva.

Clase 5

Varianza y desviación estándar

El rango, los cuartiles y los percentiles no siempre alcanzan para analizar cómo se distribuyen
un conjunto de datos. Es importante determinar cuánto se dispersan los datos respecto de la
media. La diferencia entre un valor de la variable y la media se llama desvío. Si se realiza el
promedio de los desvíos de todos los datos respecto a la media, lo que puede pensarse como
una buena medida de la dispersión, se obtiene el valor cero. Es por eso que se elevan los
desvíos al cuadrado (para eliminar los valores negativos que se cancelan con los positivos) y se
calcula el promedio de los desvíos al cuadrado.

Varianza

Se define varianza como el promedio de los desvíos al cuadrado.

Usaremos las notaciones de media poblacional μ (letra griega mu) y varianza poblacional σ²
(letra griega sigma al cuadrado)

𝛴(𝑥𝑖− 𝜇)²
σ² =
𝑛

Si los datos están tabulados (sin intervalos) la fórmula es:

𝛴(𝑥𝑖− 𝜇)². 𝑓𝑖
σ² =
𝑛

Desviación estándar

Como las unidades de la varianza son las de la variable elevadas al cuadrado, suele usarse la
desviación estándar σ, que es simplemente la raíz cuadrada de la varianza

Para ordenar y facilitar el cálculo se agregan columnas en las tablas.

En el ejemplo 1 de los celulares habíamos obtenido una media de 2,67 (μ)

xi fi Fi (xi – μ) (xi – μ)² (xi – μ)². fi


0 2 2 -2,67 7,13 14,26
1 4 6 -1,67 2,79 11,16
2 9 15 -0,67 0,45 4,05
3 8 23 0,33 0,11 0,88
4 2 25 1,33 1,77 3,54
5 4 29 2,33 5,43 21,72
6 1 30 3,33 11,09 11,09
Σ (xi – μ)². fi = 66,70
La suma de la última columna es el numerador de la fórmula de varianza, bastará dividir por
n = 30 para obtener el valor de esta última, y calcular su raíz cuadrada para hallar la desviación
estándar.

σ² = 66,70 / 30 = 2,22

σ =√2,22 = 1,49

Observación: se trabajó aproximando al segundo decimal

Si la tabla tiene intervalos, la fórmula a usar es:

𝛴(𝑥𝑚𝑖− 𝜇)²
σ² =
𝑛

En el ejemplo 2 de las alturas se había obtenido una media de 170,43 (μ)

Intervalo fi Fi xMi (xMi – μ) (xMi – μ)² (xMi – μ)².fi


de xi
[150; 155) 2 2 152,5 -17,93 321,48 642,96
[155; 160) 6 8 157,5 -12,93 167,18 1003,08
[160; 165) 10 18 162,5 -7,93 62,88 628,88
[165; 170) 15 33 167,5 -2,93 8,58 128,70
[170; 175) 25 58 172,5 2,07 4,28 107,00
[175; 180) 8 66 177,5 7,07 49,98 399,60
[180; 185) 5 71 182,5 12,07 145,68 728,40
[185; 190) 4 75 187,5 17,07 291,38 1165,52
Σ (xMi – μ)². fi = 4804,14

σ² = 4804,14 / 75 = 64,06

σ =√64,06 = 8,00

Coeficiente de variación:

El cociente entre la desviación estándar y la media se llama coeficiente de variación y es una


medida de la homogeneidad de la variable. Si el CV es menor a 0,8 significa que la media es
representativa del conjunto de datos y este es homogéneo. Es un indicio que una muestra está
bien extraída. Si lo supera, se considera que el conjunto es heterogéneo y no pueden
obtenerse conclusiones de esa muestra _
. CV= s / X

(a la desviación estándar muestral se la indica con s)

Actividad: Calcular la varianza y desviación estándar de los ejercicios realizados

También podría gustarte