Práctica 3 Cuartiles Percentiles y Diagramas de Cajas
Práctica 3 Cuartiles Percentiles y Diagramas de Cajas
Práctica 3 Cuartiles Percentiles y Diagramas de Cajas
Solución:
X=c(4.054, 4.024, 4.030, 3.976, 3.947, 3.969, 3.937, 4.057, 3.964, 3.908,
4.047, 3.980, 4.017, 3.906, 3.963, 4.053, 3.951, 4.007, 3.970, 3.927,
4.015, 3.978, 3.944, 3.981, 3.951, 3.947, 3.992, 3.918, 4.031, 3.926)
X=sort(X)
print(X)
## [1] 3.906 3.908 3.918 3.926 3.927 3.937 3.944 3.947 3.947 3.951 3.951
3.963
## [13] 3.964 3.969 3.970 3.976 3.978 3.980 3.981 3.992 4.007 4.015 4.017
4.024
## [25] 4.030 4.031 4.047 4.053 4.054 4.057
b) Calcule los tres cuartiles de los datos, rango de datos, rango intercuartil, los
percentiles quinto y nonagésimo quinto.
Solución:
extremo=range(X) #valores del rango de datos extremo[1] mínimo,
extremo[2] máximo
min(X) #valor mínimo
## [1] 3.906
## [1] 4.057
## [1] 0.0695
## 5% 95%
## 3.91250 4.05355
## [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
FALSE
## [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
FALSE
## [25] FALSE FALSE FALSE FALSE FALSE FALSE
v_logico2=X>cerca_exterior
v_logico2
## [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
FALSE
## [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
FALSE
## [25] FALSE FALSE FALSE FALSE FALSE FALSE
## [1] 0
Solución:
p=c(0.05, 0.25, 0.5, 0.75, 0.95, 1)
valores=quantile(X,probs = c(0.05, 0.25, 0.5, 0.75, 0.95, 1))
valores
#Ojiva
plot(valores, p, main="Ojiva", xlab="Galones en miles" , ylab="Frecuencia
relativa acumulada")
lines(valores,p)
#Diagrama de cajas
boxplot(X, horizontal = TRUE)
Tema 2. Diagramas de cajas
Considerando los datos de Iris cargados en Rstudio, realice lo siguiente:
a) Diagrama de cajas de longitud del pétalo y Diagrama de cajas de longitud del sépalo,
adicionalmente incorpore los histogramas de frecuencia.
Solución:
D=iris
head(D,5)
print("Petal.Length")
## [1] "Petal.Length"
summary(D$Petal.Length)
print("Sepal.Length")
## [1] "Sepal.Length"
summary(D$Sepal.Length)
par(mfrow=c(2,2))
boxplot(D$Petal.Length, horizontal = T, xlab="Longitud de Pétalos")
boxplot(D$Sepal.Length, horizontal =T, xlab="Longitud de Sépalos")
hist(D$Petal.Length)
hist(D$Sepal.Length)
par(mfrow=c(1,1))
b) Considerando el campo Edad, calcule los tres cuartiles de los datos, rango de datos,
rango intercuartil, los percentiles quinto y nonagésimo quinto.
Comando:
#Cuartiles
quantile(edad)
quantile(edad, probs = c(0.25,0.5,0.75))
#Rango
min(edad)
max(edad)
rango=max(edad)-min(edad)
rango
#Rango Intercuartílico
RI=IQR(edad)
RI
#Percentiles
quantile(edad, probs = c(0.05,0.95))
summary(edad)
Solución:
c) Determine la existencia o no de valores aberrantes
Comando:
#LiteralC
#Valores Aberrantes
Q1=quantile(edad, probs = 0.25)
Q3=quantile(X, probs = 0.75)
cerca_interior=Q1-1.5*RI
cerca_exterior=Q3+1.5*RI
v_logico1=edad<cerca_interior
v_logico1
sum(v_logico1)
ifelse(sum(v_logico1)==0,"No existe valores aberrantes inferiores", edad[v_logico1])
v_logico2=edad>cerca_exterior
v_logico2
sum(v_logico2)
ifelse(sum(v_logico2)==0,"No existe valores aberrantes superiores", edad[v_logico2])
Solución:
d) Construya la Ojiva correspondiente con los valores del literal “b”.
Comando:
#Ojiva
p=c(0.05, 0.25, 0.5, 0.75, 0.95, 1)
valores=quantile(edad,probs = c(0.05, 0.25, 0.5, 0.75, 0.95, 1))
valores
plot(valores, p, main="Ojiva", xlab="Edad" , ylab="Frecuencia relativa acumulada")
lines(valores,p)
Solución:
Comando:
#Diadrama de Caja
boxplot(edad, horizontal = TRUE)
f) Realice un diagrama de cajas para cada nivel de educación analizar cómo se
distribuye la edad(age).
Comando:
#Diagrama de caja
educacion=banco$education
boxplot(edad ~ educacion)
Solución: