Cours Analyse Statistique Univarié

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 36

1

Ecole Nationale des Sciences Appliquées Al Hoceima

Cours Statistique

Les Statistiques descriptives Année universitaire 2019-2020


2

Les Statistiques descriptives


Généralités sur la statistique
3

 On appelle Statistique l’ensemble des méthodes (ou encore des techniques) permettant
d’analyser (on dira plutôt de traiter) des ensembles d’observations (nous parlerons de données).
Les méthodes en question relèvent essentiellement des mathématiques et font largement appel
à l’outil informatique pour leur mise en œuvre.
 La statistique est un ensemble de méthodes scientifiques dont l'objectif est d'analyser,
structurer et modéliser des informations numériques.
 Les méthodes statistiques peuvent être classés en deux groupes :
Les Statistiques descriptives
4

 Elle regroupe les méthodes dont l'objectif principal est la description des données étudiées. Cette
description des données se fait à travers leur représentation graphique, et le calcul de résumés numériques.
Dans cette optique, on ne fait pas appel à des outils de type probabiliste
 On cite trois types des statistiques descriptives :

 Statistique descriptive univariée : étude de la population selon une seule variable.


 Statistique descriptive bivariée : étude des corrélations et relations éventuelles entre deux variables de la
même population.
 Statistique descriptive multivariée : étude des relations éventuelles entre plusieurs variables de la même
population
Les Statistiques descriptives
5

 Ce terme regroupe les méthodes dont l'objectif principal est de préciser un phénomène sur une population
globale, à partir de son observation sur un échantillon de cette population. Ce passage ne se fait que
moyennant des hypothèses de type probabiliste.
Remarque
La statistique descriptive précède en général la statistique inférentielle dans une démarche de traitement de
données : les deux aspects de la statistique se complètent bien plus qu'ils ne s'opposent.
Statistique descriptive uni variée
6

1. Vocabulaires
 Population : ensemble des individus objets de l'étude. (Étudiants, entreprises, plantes, animaux,
produits,...)

 Échantillon : sous-ensemble issu de la population. (Une classe, une ville, hommes, femmes,...)

 Unité statistique : chaque individu. (Un étudiant, une plante, un homme, une femme,...)

 Taille de l’échantillon : c’est le cardinal de l’´echantillon, autrement dit c’est le nombre d’individus
qu’il contient (´échantillon de taille 800, de taille 1000...). En général, on note n la taille de l’´echantillon
considère.

 Enquête (statistique) : c’est l’ opération consistant à observer (ou mesurer, ou questionner. . .)


l’ensemble des individus d’un échantillon (ou, éventuellement, de la population complète).
Statistique descriptive uni variée
7

 Variable : caractère ou propriété mesuré sur chaque individu notée X,Y ,... (Note, taille, poids, sexe,
couleur,...)

 Modalités : les valeurs possibles de la variable.

 Série statistique : suite des valeurs prises par une variable X notées

(x1; x2; x3;.....).


Statistique descriptive univariée
8

2. Les variables
Les variables sont classées en deux types :

 Variable quantitative : les modalités sont mesurables.

 Variable quantitative discrète : l'ensemble des modalités est fini : (Note, taille, poids, âge, mesure,...)
 Variable quantitative continue : l'ensemble des modalités est un intervalle fini ou infini : ([8; 20[,
[0;+1[, R,...)

 Variable qualitative : les modalités ne sont pas mesurables.

 Variable qualitative nominale : les modalités ne peuvent pas être ordonnées : (sexe, couleur,...)
 Variable qualitative ordinale : les modalités peuvent être ordonnées : (taille d'un vêtement : XXL,
XL, L, M, S).
Statistique descriptive uni variée
9

3. Effectif

 Effectif totale n: le nombre de toutes les valeurs prises par la variable.


 Effectif ni : nombre d'apparitions de la valeur xi dans la population ou dans l'échantillon.

 Effectif cumulé Ni
Statistique descriptive uni variée
10

4. Fréquence
 Fréquence fi associée à la valeur xi

 Fréquence cumulée Fi
Statistique descriptive uni variée
11

5. Pourcentage

 Pourcentage pi associé à la valeur xi


Statistique descriptive uni variée
12

6. exemples

 Variable qualitative nominale


On s'intéresse à la variable X=état-civil sur une population de n = 20 personnes. Considérons la série
statistique suivante avec C : célibataire, M : marié, V : veuf, D : divorcé.
Statistique descriptive uni variée
13
Statistique descriptive uni variée
14
Statistique descriptive uni variée
15
Statistique descriptive uni variée
16

Variable quantitative discrète


Un quartier est composé d'une population de 50 ménages, et la variable X représente le
nombre de personnes par ménage. Les valeurs de la variable sont :
Statistique descriptive uni variée
17
Statistique descriptive uni variée
18

Fonction de répartition
 Les fréquences cumulées sont représentées au moyen de la fonction de
répartition. Cette fonction est définie de R dans [0; 1] et vaut :
Statistique descriptive uni variée
19

Variable quantitative continue


Très souvent, la prise en compte de toute les valeurs observées ne permet pas de donner une
interprétation simple des résultats et conduit à des calculs inutiles. On peut souvent se contenter de
regarder des regroupements en classes.
 Exemple
On mesure la variable X=taille en centimètre d'une population de 50 élèves d'une classe.
Statistique descriptive uni variée
20

Tableau statistique
On va procéder à des regroupements en classes (intervalles) de même amplitude. En règle générale, on
choisit au moins cinq classes, sinon on utilise la règle de Sturge : le nombre de classes est
J = 1 + (3.3*log10(n)).
La longueur de chaque classe est l = (Xmax - Xmin)/J.
Par exemple pour J = 5, Xmax = 171 et Xmin = 152, on prend l ≈4.
Statistique descriptive uni variée
21
Statistique descriptive uni variée
22

Fonction de répartition

Si [cj- , cj+ [ désigne la classe j , on note, de manière générale :


Statistique descriptive uni variée
23
Statistique descriptive uni variée
24

6. Paramètres de position

Le mode ou classe modale

C'est la valeur ou classe correspondant à l'effectif (ou fréquence) le plus élevé.


Exemple 1

Le mode est x1 = C : célibataire correspondant à l'effectif n1 = 9 ou la fréquence f1 = 0:45.


Statistique descriptive uni variée
25

Exemple 2 :

la classe modale est [155.5; 159.5[.


Statistique descriptive uni variée
26

 La moyenne
La moyenne ne peut être définie que sur une variable quantitative.

Exemple
Les nombres d'enfants de 8 familles sont les suivants 0; 0; 1; 1; 1; 2; 3; 4: La moyenne est

La moyenne peut être calculée à partir des valeurs distinctes et des effectifs.
Statistique descriptive uni variée
27

 La médiane
Cas d'une variable quantitative discrète

La médiane, notée x1/2, est une valeur centrale de la série statistique qui la partage en deux groupes de même effectifs.
Elle est obtenue de la manière suivante :

On trie la série statistique par ordre croissant des valeurs observées :


Par exemple,
avec la série observée :
3 2 1 0 0 1 2;
on obtient :
0 0 1 1 2 2 3:
n = 7 est impair, alors la médiane est la valeur du rang (n + 1)/2 = 4. Donc x1/2= 1.
Si n est pair, alors la médiane est la moyenne des deux valeurs de rang n/2 et (n/2) + 1.
Exemple
Pour n = 8; si on a :
00112234
alors
x 1/2=(1 + 2)/2= 1.5
Statistique descriptive uni variée
28

 La médiane
Cas d'une variable quantitative continue

De manière générale, on définira la médiane comme étant la valeur (abscisse) correspondant à la fréquence cumulée F = 0.5 ou effectif
cumulé N = n/2 . On l'obtiendra en général par lecture graphique (valeur approchée x1/2= F-1(0.5)) sur la courbe des fréquences cumulées,
ou par une formule d'interpolation linéaire (valeur exacte) sur la courbe des effectifs cumulées.
Statistique descriptive uni variée
29

 La médiane
Statistique descriptive uni variée
30

 La médiane
Statistique descriptive uni variée
31

 La médiane

Formule pour calculer la médiane directement :


me= la médiane
a=la borne inférieure de la classe médiane)
Où b=la borne supérieure de la classe médiane)
Eci-1 =la fréquence cumulé de la classe i-1)(La classe i c’est
la classe médiane)
n= l’effective de la classe médiane)
Application où exemple précédent : N= effective total

La classe médiane : [100,120]


a= 100 (la borne inférieure de la classe médiane)
b= 120 (la borne supérieure de la classe médiane)
Eci-1 =83 (la fréquence cumulé de la classe i-1)(La classe i c’est la classe médiane)
n= 34(l’effective de la classe médiane)
N=200

(me - 100)/ (120-100) =((200/2) – 83/ 34

me= 110
Statistique descriptive uni variée
32

 L'étendue
L'étendue est défini par :

E = xmax - xmin
Exemple
Pour la série 11211355555325

on a
E = 5 - 1 = 4:
Statistique descriptive uni variée
33


Statistique descriptive uni variée
34


Statistique descriptive uni variée
35
Statistique descriptive uni variée
36

Vous aimerez peut-être aussi