TP Statistique Descriptive Univarié
TP Statistique Descriptive Univarié
TP Statistique Descriptive Univarié
Travail à faire :
1. Utiliser l’une des fonctions scan() ou c() pour créer le
vecteur de données de cette distribution statistique.
> x=c(2500 , 3700 , 8000 , 3000 , 8000 , 8000 , 3000 , 3700 ,
2500 , 3700 , 3000 , 2500 , 3700 , 3000 , 3700 , 2500 , 3700 ,
3700 , 3000 , 3000 , 2500 , 3700 , 8000 , 3000 , 8000 , 8000 ,
3000 , 3700 , 2500 , 3700 , 3000 , 2500 , 3700 , 3000 , 3700 ,
2500 , 3700 , 3700 , 3000 , 3000)
>x
[1] 2500 3700 8000 3000 8000 8000 3000 3700 2500 3700
3000 2500 3700 3000 3700 2500 3700
[18] 3700 3000 3000 2500 3700 8000 3000 8000 8000 3000
3700 2500 3700 3000 2500 3700 3000
[35] 3700 2500 3700 3700 3000 3000
2. Trier les données en utilisant la fonction sort()
> sort(x)
[1] 2500 2500 2500 2500 2500 2500 2500 2500 3000 3000
3000 3000 3000 3000 3000 3000 3000
[18] 3000 3000 3000 3700 3700 3700 3700 3700 3700 3700
3700 3700 3700 3700 3700 3700 3700
[35] 8000 8000 8000 8000 8000 8000
3. Déterminer les éléments suivants :
a. La population
b. La taille de l’échantillon (utiliser la fonction length())
> length(x)
[1] 40
>
c. Le caractère statistique et sa nature (pour la nature
utiliser la fonction mode())
> mode(x)
[1] "numeric"
>
d. La liste des modalités (indication : utiliser la fonction
unique())
> unique(x)
[1] 2500 3700 8000 3000
>
4. Construire table la statistique contenant les modalités, les
effectifs, les fréquences, les personnages, les effectifs
cumulés, les fréquences cumulées et les pourcentages
(indication : utiliser la fonction table(), cumsum() et
length() pour construire les vecteurs colonnes puis utiliser
la fonction data.frame() pour construire la table statistique)
> eff = table(x)
> freq = eff/length(x)
> effCum = cumsum(eff)
> freqCum = cumsum(freq)
> pourc= freq*100
>
> tableStat = data.frame(eff, freq, effCum, freqCum, pourc)
> tableStat
x Freq x.1 Freq.1 effCum ferqCum x.2 Freq.2
2500 2500 8 2500 0.20 8 0.20 2500 20
3000 3000 12 3000 0.30 20 0.50 3000 30
3700 3700 14 3700 0.35 34 0.85 3700 35
8000 8000 6 8000 0.15 40 1.00 8000 15
>
Pour empêcher la duplication de la colonne des modalités
> eff = c(table(x)) #on a ajouté la fonction c() pour
convertir table(x) à un vecteur
> freq = eff/length(x)
> effCum = cumsum(eff)
> freqCum = cumsum(freq)
> pourc= freq*100
> pourcCum = cumsum(pourc)
> tableStat = data.frame(eff, freq, effCum, freqCum, pourc,
pourcCum)
> tableStat
eff freq effCum freqCum pourc pourcCum
2500 8 0.20 8 0.20 20 20
3000 12 0.30 20 0.50 30 50
3700 14 0.35 34 0.85 35 85
8000 6 0.15 40 1.00 15 100
>
5. Représentation graphique
a. Diagramme en bâton (fonction barplot)
> barplot(x)
>
> barplot(table(x))
ou bien
> barplot(eff)