Cours Analyse Statistique Univarié
Cours Analyse Statistique Univarié
Cours Analyse Statistique Univarié
Cours Statistique
On appelle Statistique l’ensemble des méthodes (ou encore des techniques) permettant
d’analyser (on dira plutôt de traiter) des ensembles d’observations (nous parlerons de données).
Les méthodes en question relèvent essentiellement des mathématiques et font largement appel
à l’outil informatique pour leur mise en œuvre.
La statistique est un ensemble de méthodes scientifiques dont l'objectif est d'analyser,
structurer et modéliser des informations numériques.
Les méthodes statistiques peuvent être classés en deux groupes :
Les Statistiques descriptives
4
Elle regroupe les méthodes dont l'objectif principal est la description des données étudiées. Cette
description des données se fait à travers leur représentation graphique, et le calcul de résumés numériques.
Dans cette optique, on ne fait pas appel à des outils de type probabiliste
On cite trois types des statistiques descriptives :
Ce terme regroupe les méthodes dont l'objectif principal est de préciser un phénomène sur une population
globale, à partir de son observation sur un échantillon de cette population. Ce passage ne se fait que
moyennant des hypothèses de type probabiliste.
Remarque
La statistique descriptive précède en général la statistique inférentielle dans une démarche de traitement de
données : les deux aspects de la statistique se complètent bien plus qu'ils ne s'opposent.
Statistique descriptive uni variée
6
1. Vocabulaires
Population : ensemble des individus objets de l'étude. (Étudiants, entreprises, plantes, animaux,
produits,...)
Échantillon : sous-ensemble issu de la population. (Une classe, une ville, hommes, femmes,...)
Unité statistique : chaque individu. (Un étudiant, une plante, un homme, une femme,...)
Taille de l’échantillon : c’est le cardinal de l’´echantillon, autrement dit c’est le nombre d’individus
qu’il contient (´échantillon de taille 800, de taille 1000...). En général, on note n la taille de l’´echantillon
considère.
Variable : caractère ou propriété mesuré sur chaque individu notée X,Y ,... (Note, taille, poids, sexe,
couleur,...)
Série statistique : suite des valeurs prises par une variable X notées
2. Les variables
Les variables sont classées en deux types :
Variable quantitative discrète : l'ensemble des modalités est fini : (Note, taille, poids, âge, mesure,...)
Variable quantitative continue : l'ensemble des modalités est un intervalle fini ou infini : ([8; 20[,
[0;+1[, R,...)
Variable qualitative nominale : les modalités ne peuvent pas être ordonnées : (sexe, couleur,...)
Variable qualitative ordinale : les modalités peuvent être ordonnées : (taille d'un vêtement : XXL,
XL, L, M, S).
Statistique descriptive uni variée
9
3. Effectif
Effectif cumulé Ni
Statistique descriptive uni variée
10
4. Fréquence
Fréquence fi associée à la valeur xi
Fréquence cumulée Fi
Statistique descriptive uni variée
11
5. Pourcentage
6. exemples
Fonction de répartition
Les fréquences cumulées sont représentées au moyen de la fonction de
répartition. Cette fonction est définie de R dans [0; 1] et vaut :
Statistique descriptive uni variée
19
Tableau statistique
On va procéder à des regroupements en classes (intervalles) de même amplitude. En règle générale, on
choisit au moins cinq classes, sinon on utilise la règle de Sturge : le nombre de classes est
J = 1 + (3.3*log10(n)).
La longueur de chaque classe est l = (Xmax - Xmin)/J.
Par exemple pour J = 5, Xmax = 171 et Xmin = 152, on prend l ≈4.
Statistique descriptive uni variée
21
Statistique descriptive uni variée
22
Fonction de répartition
6. Paramètres de position
Exemple 2 :
La moyenne
La moyenne ne peut être définie que sur une variable quantitative.
Exemple
Les nombres d'enfants de 8 familles sont les suivants 0; 0; 1; 1; 1; 2; 3; 4: La moyenne est
La moyenne peut être calculée à partir des valeurs distinctes et des effectifs.
Statistique descriptive uni variée
27
La médiane
Cas d'une variable quantitative discrète
La médiane, notée x1/2, est une valeur centrale de la série statistique qui la partage en deux groupes de même effectifs.
Elle est obtenue de la manière suivante :
La médiane
Cas d'une variable quantitative continue
De manière générale, on définira la médiane comme étant la valeur (abscisse) correspondant à la fréquence cumulée F = 0.5 ou effectif
cumulé N = n/2 . On l'obtiendra en général par lecture graphique (valeur approchée x1/2= F-1(0.5)) sur la courbe des fréquences cumulées,
ou par une formule d'interpolation linéaire (valeur exacte) sur la courbe des effectifs cumulées.
Statistique descriptive uni variée
29
La médiane
Statistique descriptive uni variée
30
La médiane
Statistique descriptive uni variée
31
La médiane
me= 110
Statistique descriptive uni variée
32
L'étendue
L'étendue est défini par :
E = xmax - xmin
Exemple
Pour la série 11211355555325
on a
E = 5 - 1 = 4:
Statistique descriptive uni variée
33
Statistique descriptive uni variée
34
Statistique descriptive uni variée
35
Statistique descriptive uni variée
36