Estadísticas en R
Estadísticas en R
Estadísticas en R
1 Medidas Estadísticas en R
En esta sección se presenta una lista de funciones que calculan las principales medidas
estadísticas vistas en el curso.
Si se indica que la función está en la librería base, no es necesario instalar ninguna
librería para usarla. En caso contrario hay que instalar la librería que se indique.
Por ejemplo, si se requiere la librería DescTools se tendría que instalar y luego
cargar para usar las funciones que esta contiene.
# Instalar librería
install.packages("DescTools")
# Cargar librería
library(DescTools)
Ejemplo en R:
# Media
mean(mtcars$mpg)
## [1] 20.09062
# Mediana
median(mtcars$mpg)
## [1] 19.2
Ejemplo en R:
# Varianza
var(mtcars$mpg)
## [1] 36.3241
# Desviación estándar
sd(mtcars$mpg)
## [1] 6.026948
# Rango
diff(range(mtcars$mpg))
## [1] 23.5
# Rango intercuartil
IQR(mtcars$mpg)
## [1] 7.375
# Coeficiente de variación
CoefVar(mtcars$mpg)
## [1] 0.2999881
Ejemplo en R:
library(DescTools)
# Coeficiente de asimetría de Fisher
Skew(mtcars$mpg)
## [1] 0.610655
# Coeficiente de curtosis de Fisher
Kurt(mtcars$mpg)
## [1] -0.372766
1.4 Cuantiles
La función quantile(x,probs), con argumentos x un vector de datos y probs el nivel del
cuantil a ser calculado.
Ejemplo en R:
summary(mtcars$mpg)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 10.40 15.43 19.20 20.09 22.80 33.90
2 Medidas Estadísticas usando otras
librerías
Así como la función summary calcula algunas estadísticas en forma conjunta, también
existen otras funciones que permiten realizar el cálculo de las estadísticas presentadas:
Ejemplo en R:
summaryFull(mtcars$mpg,
stats=c("n","mean", "median",
"sd","iqr","range","cv",
"skew","kurtosis"))
## mtcars$mpg
## N 32.00000
## Mean 20.09000
## Median 19.20000
## Skew 0.67240
## Kurtosis -0.02201
## Range 23.50000
## Standard Deviation 6.02700
## Interquartile Range 7.38000
## Coefficient of Variation 0.30000
## [...]
donde
Ejemplo en R:
# Método 1
mean(mtcars$mpg[mtcars$am==0])
## [1] 17.14737
mean(mtcars$mpg[mtcars$am==1])
## [1] 24.39231
# Método 2
tapply(mtcars$mpg,mtcars$am,mean)
## 0 1
## 17.14737 24.39231
by(mtcars$mpg,mtcars$am,mean)
## mtcars$am: 0
## [1] 17.14737
## ------------------------------------------------------------
## mtcars$am: 1
## [1] 24.39231
Ejemplo en R:
Desc(mpg~am,data=mtcars,verbose=3,
plotit = FALSE, conf.level=NA,maxrows = 0)
## [...]
## 0 1
## mean 17.147 24.392
## median 17.300 22.800
## sd 3.834 6.167
## IQR 4.250 9.400
## n 19 13
## np 59.375% 40.625%
## NAs 0 0
## 0s 0 0
## min 10.400 15.000
## max 24.400 33.900
## Q1 14.950 21.000
## Q3 19.200 30.400
## mad 3.113 6.672
## skew 0.014 0.053
## kurt -0.803 -1.455
##
## [...]
summaryFull(mpg~am,data=mtcars,
stats=c("n","mean", "median",
"sd","iqr","range","cv",
"skew","kurtosis"))
## 0 1
## N 19.00000 13.00000
## Mean 17.15000 24.39000
## Median 17.30000 22.80000
## Skew 0.01646 0.06729
## Kurtosis -0.33390 -1.15900
## Range 14.00000 18.90000
## Standard Deviation 3.83400 6.16700
## Interquartile Range 4.25000 9.40000
## Coefficient of Variation 0.22360 0.25280
## [...]
[10,15] 6 0.1875 6
(15,20] 12 0.3750 18
(20,25] 8 0.2500 26
(25,30] 2 0.0625 28
(30,35] 4 0.1250 32
En R se construye una nueva variable que repita la marca de clase tantas veces como la
frecuencia y se calculan las estadísticas a partir de esta.
Ejemplo en R:
# Marca de clase
x.j = c(12.5,17.5,22.5,27.5,32.5)
# Frecuencia absoluta
n.j = c(6,12,8,2,4)
# Nueva variable que repite x.j, n.j veces.
x = rep(x.j,times=n.j)
# Media
mean(x)
## [1] 20.3125
# Desviación estándar
sd(x)
## [1] 6.213604
# Coeficiente de variación
CoefVar(x)
## [1] 0.3059005
# Coeficiente de asimetría de Fisher
Skew(x)
## [1] 0.6434255
# Coeficiente de curtosis de Fisher
Kurt(x)
## [1] -0.5498423