Stat Double

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 3

Statistique double

2.1. INTRODUCTION
La statistique descriptive double (bi variée) consiste à examiner simultané-
ment deux variables.
Les types En statistique descriptive bi variée, nous distinguerons trois types
de couples de variables :
1 les deux variables sont qualitatives
2 l’une des deux est qualitative, l’autre quantitative
3 les deux variables sont quantitatives.
Exp: Dans une entreprise, l’examen du nombre de jours de formation par
an selon la catégorie de salarié (secrétariat, service technique, comptabilité et
service d’entretien) illustre le "croisement" d’une variable quantitative (QT ) et
d’une variable qualitative (QL), ici avec 4 modalités.
2.2. Démarche statistique
Le tableau suivant montre la distribution des e¤ectifs nij est le nombre
d’observations simultanées de la modalité xi de X et de la modalité yi de Y:
Les distributions marginales (mg) lignes et colonnes sont formées de
taux lignes et colonnes.
P
q P
p
ni: = nij ; et n:j = nij
j=1 i=1

X#Y ! y1 yj :: :: yq distribution mg de X
x1 n11 n1j :: :: n1q n1:
::: ::: :: :: :: :: :: :: ::
::: :: :: :: :: :: :: :: ::
xi ni1 nij niq ni:
::: :: :: :: :: :: :: :: :::
::: :: :: :: :: :: :: :: :::
xp np1 :: :: npj :: :: npq np:
distribution mg de Y n:1 :: :: n:j :: :: n:q n:: = N

Paramètres statistiques marginaux


Les paramètres moyenne et variance:

1 Pp 1 Pp
2
X= ni: xi ; V ar (X) = ni: xi X ;
N i=1 N i=1
1 Pp 1 Pq
2
Y = n:j yj ; V ar (Y ) = n:j yj Y
N j=1 N j=1

Le couple (X; Y ) dé…nit le centre de gravité ou barycentre de la série double


(X; Y ) ou encore du nuage de points. Notons G ce point de coordonnées (x; y).
Paramètres statistiques double

1
La covariance entre X et Y :
1 Pp P q
Cov (X; Y ) = nij xi X yj Y
N i=1 j=1

Remarque Cov (X; X) = V (X) : C’est un indicateur de dispersion autour


du centre de gravité G X; Y qui, de plus permet d’appréhender la relation de
croissance ou décroissance entre les variables X et Y:
- Cov(x; y) > 0 =) y fonction croissante de x
- Cov(x; y) < 0 =) y fonction décroissante de x
- Cov(x; y) = 0 =) les contributions positives et négatives des produits Pi
se compensent.
Proptiétés:

1. Cov(ax + b; cy + d) = acCov(x; y) (a; b; c et d étant des coe¢ cients réels).


2. Cov(x; y)j X Y

3. SI Cov(x; y)j = X Y ; il a liaison linéaire entre X et Y : y = ax + b:

Le coe¢ cient de corrélation linéaire entre X et Y :


Cov(x; y)
r(x; y) = ; avec X et Y 6=0
X Y

D’après la propriété 2 , on peut montrer que:

jr (x; y)j 1

0.1 Remarques:
1. r = 1 la liaison linéaire entre x et y.
2. r(x; y) mesure l’intensité de la liaison linéaire entre x et Y:
3. r = 0 traduit l’absence de liaison linéaire entre x et y.
4. Si r = 1 , le nuage de points s’étire linéairement.

2.4. Régression linéaire simple de y en x:


On va chercher un modèle linéaire Y = AX + B + " permettant de prédire
Y à partir de X. La régression est dite simple car on ne considère qu’une seule
variable explicative.
II s’agit de déterminer les coe¢ cients de l’équation de la droite y = ax + b.
On utulisant la méthode des moindres carrées pour déterminer les coe¢ cients
a et b (meilleures estimations de A et B) tels que la droite y = ax + b soit "la
plus proche" possible du nuage de points au sens des moindres carrés.
P
n
Soit : (a; b) ? tels que e2i =minimum avec ei = yi (axi + b).
i=1

2
Le calcul de cette optimisation conduit aux résultats

Cov (X; Y )
a= ; b=Y aX
V ar (X)

Par suite, l’équation de la droite de régression (d’estimation) selon le critère


des moindres carrés est:
Cov(x; y)
y Y = (x X)
V ar (X)

Remarque : la droite de régression (d’estimation) passe par le centre de


gravité G(X; Y ):

Vous aimerez peut-être aussi