E.P.A.C.S-TS2-Stat.à Deux Var.
E.P.A.C.S-TS2-Stat.à Deux Var.
E.P.A.C.S-TS2-Stat.à Deux Var.
Le 18/06/2013
T S2
L’effectif total N = n1 + n2 + n3 + n4 = 8.
et .
Une enquête faite sur 100 familles portant sur le nombre d’enfants par famille et le
nombre de pièce d’habitation par famille a donné les résultats suivants, consignés dans
un tableau à double entrée :
(a)
1 2 3 4 Totaux
y
0 8 3 1 0
1 2 11 3 1
2 1 10 16 3
3 0 5 13 5
4 0 1 4 8
5 0 0 1 4
Totau
N=100
x
valeur du caractère : .
est la somme des effectifs de la colonne j ou encore le nombre d’individus qui ont la
valeur du caractère : .
Exemple : = nombres de familles de trois enfants.
= nombres de familles de deux pièces.
2) Séries marginales, effectifs marginaux, fréquence marginales
sont les effectifs marginaux associés respectivement aux valeurs du
caractère .
de la population : .
.
Dans l’exemple, vérifier que et .
. .
.
Exercice : Déterminer le tableau de distribution des fréquences.
3) Covariance de x et y
La covariance de la série statistique double est le réel noté ou défini
par :
.
Dans l’exemple, vérifier que = 6,85 −5,9987 = 0,8513
4) Nuage de point – point moyen
l’effectif n’est pas nul est le nuage de points associé à la série double ,1
≤ i ≤ p, 1 ≤ j ≤ q ; chacun de ces points est représenté par un disque de rayon
On définit de même .
Exemple : ; . ;
.
La colonne j du tableau de contingence définit la série (ou distribution) conditionnelle
de liée par la valeur de y. Les caractéristiques de la série conditionnelle
ont :
a) Pour la moyenne :
b) Pour la variance : .
Exemple :
a) Pour la moyenne : .
b) Pour la variance : .
Remarques : On a :
et .
.
La covariance peut-être un réel négatif.
La moyenne de est : .
La variance de est : .
La moyenne de y est :
La variance de y est :
La covariance de x et de y est : .
On a aussi : .
IV. Ajustement linéaire par la méthode des moindres carrés
1) Principe :
L’ajustement linéaire par la méthode des moindres carrés du nuage des points ,
(où , ,
dans le cas d’une série double injective) consiste à déterminer une droite qui passe le plus
proche possible de
l’ensemble des points . Il existe deux droites d’ajustement appelées droites de régression :
; d’où :
Application : Estimer le nombre d’enfants par famille correspondant à 5 pièces d’habitation (
= 5)
Réponse : soit enfants.
.
b) Propriétés :
.
c) Interprétation du coefficient de corrélation linéaire :
Le (c.c.l) nous renseigne sur l’existence ou non d’une dépendance (ou corrélation) entre
les caractères étudiés et :
Si r est proche de 1 ou de -1, on dit qu’il y’a une forte corrélation entre et
c'est-à-dire lorsque .
Si r =1 ou 1=-1, on dit qu’il y’a une corrélation parfaite entre et ; les points du
nuage sont alignés.