Exercices Data Mining (Partie2) Avec Solution
Exercices Data Mining (Partie2) Avec Solution
Exercices Data Mining (Partie2) Avec Solution
Exercice 1
5. Quelle est la moyenne de la colonne "Ozone" dans cet ensemble de données ? Exclure les
valeurs manquantes (codées comme NA) de ce calcul.
mean(dataset[, "Ozone"], na.rm = TRUE)
Exercice 2
2. Utilisez une boucle for pour créer un vecteur de longueur 6 contenant la moyenne de
chaque colonne du dataset (à l'exclusion de toutes les valeurs manquantes).
m <- numeric(6)
for (i in 1:6) {
m[i] <- mean(dataset[, i], na.rm = TRUE)
}
print(m)
3. Utilisez la fonction Apply pour calculer l'écart type de chaque colonne du dataset (à
l'exclusion de toutes les valeurs manquantes).
s <- apply(dataset, 2, sd, na.rm = TRUE)
print(s)
4. Calculez la moyenne de « Ozone » pour chaque mois dans le dataset et créez un vecteur
contenant les moyennes mensuelles (excluez toutes les valeurs manquantes).
tapply(dataset$Ozone, dataset$Month, mean, na.rm = TRUE)
Exercice 3
1. Créé un objet qui contient les mêmes colonnes que Airquality mais la température et la
vitesse du vent sont exprimées en degrés Celsius et en kilomètres par heure.
temp<-transform(airquality,Temp.C=(Temp-32)/1.8,Wind.Km=Wind*1.6)
my.airquality<-temp[,-c(3,4)]
head(my.airquality)
Exercice 4
1. Donner le revenu par habitant (per capita income) des États qui ont moins de 40 jours
avec une température minimale en dessous de zéro.
state.x77[state.x77[,"Frost"<40],"Income"]
2. Les états qui ont moins de 40 jours avec une température minimale en dessous de zéro et
une espérance de vie supérieure à 71 ans.
state.x77.new[Frost<40 & Life.Exp>71,]
round(apply(state.x77.new,2,sd),2)
Exercice 5
On va utiliser le package DAAG (Data Analysis and Graphics Data and Functions)
Installation du package
install.packages("DAAG")
1. Donner les valeurs non manquantes pour la colonne root pour chaque espèce.
tapply(X=complete.cases(root),INDEX=species,FUN=sum)
Exercice 6
Considérez les données sur la longueur des œufs dans le dataframe cuckoos du package DAAG.
6. Répétez (1), (4) et (5) pour la longueur des œufs de troglodyte seulement.
hist(cuckoos$length[cuckoos$species=="wren"])
qqnorm(cuckoos$length[cuckoos$species=="wren"])
qreference(cuckoos$length[cuckoos$species=="wren"])
vdensity= hist(cuckoos$length[cuckoos$species=="wren"])
hist(vdensity$density)