Chapitre4 Esa Slides

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 33

Statistique Descriptives de deux variables

Khalid BOUIHAT

Ecole Supérieure des Affaires- Casablanca


Filière : Commerce et gestion

le 4 Mai 2023

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 1 / 33


Plan
1 Généralités
2 Distribution marginales
Effectifs et fréquences cumulés
Moyennes marginales
Variances marginales
3 Distribution conditionnelle
Définitions
Moyennes
Variances
4 Relation entre distributions marginales et conditionnelles
5 Dépendance et indépendance statistique
Définition
La notion de covariance
Propriétés

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 2 / 33


Généralités

Définition :
Soient deux caractères X et Y définis sur une même population d’effectif
total N (X et Y peuvent être tous les deux qualitatifs, tous les deux
quantitatifs, ou l’un qualitatif ou l’autre quantitatif). La distribution
statistique à deux dimension relative au couple (X , Y ) est définie par la
donnée :
des n valeurs possible x1 , x2 , . . . , xn de X
des m valeurs possible y1 , y2 , . . . , ym de Y
des n × m effectifs correspondents aux observations (X = xi , Y = yj )
notés nij
Remarques :
Si X est qualitatif, xi représente la modalité numéro i de ce caractère.
Si X est quantitatif xi représente la i ème valeur de ce caractère ou le
centre de i ème classe.
De même pour Y .

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 3 / 33


Généralités

Exemple (Effecifs parcielles et marginales) :


On étudie le poids et la taille notés P et T de 100 étudiants pris au hasard
dans une faculté. On a obtenu les données suivantes :

Pen Kg/T en cm 150 155 160 165 170 E. marginales


50 3 5 4 3 2 17
55 5 7 7 8 7 34
60 6 6 4 6 8 30
65 4 5 3 2 5 19
E. marginales 18 23 18 19 22 N = 100

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 4 / 33


Généralités

Quelques définitions :
La casae de la 3ème colonne et la 2ème ligne noté n23 = 7 appelé
effectif partiel et represente le nombre d’étudiants qui ont un poids de
55kg et une taille 160cm
n2. = 34 c’est l’effectif marginal des étudiant ayant un poids égal
55kg et une taille quelconque
n2. = n21 + n22 + n23 + n24 + n25
n.2 = n12 + n22 + n32 + n42 c’est l’effectif marginal des étudiants
mesurant 155cm avec un poids quelconque

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 5 / 33


Généralités

Présentation en tableau :
Comme le cas de dimension 1, on représente les variables par leurs
effectifs, mais dans ce cas a chaque couple (xi , yj ) on fait correspondre
l’effectif nij . On construit un tableau à double entrée des effectives (ou de
contingence) ayant la forme suivante :

X/Y y1 ... yj ... ym E. marginales


x1 n11 ... n1j ... n1m n1.
.. .. .. .. ..
. . ... . ... . .
xi ni1 ... nij ... nim ni.
.. .. .. .. ..
. . ... . ... . .
xn nn1 ... nnj ... nnm nn.
E. marginales n.1 ... n.j ... n.m n.. = N

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 6 / 33


Généralités

nij est l’effectif ou la fréquece absolut (le nombre de répitition) de


(xi , yj ).
ni. l’effectif de la valeur xi (aussi, le total des effectifs de la ligne i) :
m
X
ni. = ni1 + ni2 + · · · + nim = nij
j=1

n.j l’effectif de la valeur yj (aussi, le total des effectifs de la colonne


j) :
X n
n.j = n1j + n2j + · · · + nnj = nij
i=1

N.. le nombre dindividus (aussi, l’effectif total) :


n
X m
X n X
X m
N.. = ni. = n.j = nij = N
i=1 j=1 i=1 j=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 7 / 33


Généralités

Exemple (Fréquences parcielles et marginales) :


De la même façon, on peut constuire un tableau à double entrée (ou
tableau de contingence) des féquences relative :

Pen Kg/T en cm 150 155 160 165 170 F. marginales


50 0.03 0.05 0.04 0.03 0.02 0.17
55 0.05 0.07 0.07 0.08 0.07 0.34
60 0.06 0.06 0.04 0.06 0.08 0.30
65 0.04 0.05 0.03 0.02 0.05 0.19
F. marginales 0.18 0.23 0.18 0.19 0.22 F =1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 8 / 33


Généralités

De la même façon, on peut constuire un tableau à double entrée (ou


tableau de contingence) des féquences relative, c’est un tablau de type :

X/Y y1 ... yj ... ym F. marginales


x1 f11 ... f1j ... f1m f1.
.. .. .. .. ..
. . ... . ... . .
xi fi1 ... fij ... fim fi.
.. .. .. .. ..
. . ... . ... . .
xn fn1 ... fnj ... fnm fn.
F. marginales f.1 ... f.j ... f.m F.. = 1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 9 / 33


Généralités

fij est la fréquece relative de (xi , yj ) :


nij
fij =
N

fi. fréquence marginale de l’observation (X = xi ) :


m
ni. X
fi. = = fij
N
j=1

f.j la fréquence marginale de l’observation (Y = yj ) :


n
n.j X
f.j = = fij
N
i=1

on a :
n
X m
X n X
X m
f.. = fi. = f.j = fij = 1
i=1 j=1 i=1 j=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 10 / 33


Distribution marginales

Définitions :
A partir de la distribution conjointe de (X , Y ), on peut déduire la
distribution de X seul et Y seul.
la distribution marginale de X est donnée par :

{(xi , ni. )} ∀i = 1, 2, . . . , n

Le tablau statistique de cette distribution est

X E F
x1 n1. f1.
.. .. ..
. . .
xi ni. fi.
.. .. ..
. . .
xn nn. fn.
Total N 1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 11 / 33


Distribution marginales

La distribution marginale de Y est

{(yi , n.j )} ∀j = 1, 2, . . . , m

Le tablau statistique de cette distribution est

Y E F
y1 n.1 f.1
.. .. ..
. . .
yi n.j f.j
.. .. ..
. . .
ym n.m f.m
Total N 1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 12 / 33


Distribution marginales Effectifs et fréquences cumulés

On appelle effectif cumulé partielle du couple de valeurs (Xi , Yj ) le nombre


d’individus Nij tel que :
X
Nij = nsk
s≤i,k≤j
Exemple
X
N22 = nsk = n11 + n12 + n21 + n22 = 20
s≤2,k≤2
j
X
L’effectif cumulé marginal est noté N.j = N.t
t=1
Exemple
N3. : c’est la sommes de tous les effectifs marginales des couples (Pi , Tj )
pour lesquels Pi ≤ 3 c’est à dire :
3
X
N.3 = nt3 = N13 + N23 + N33 = 17 + 34 + 30 = 81
t=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 13 / 33


Distribution marginales Effectifs et fréquences cumulés

On appelle fréquence partielle cumulée du couple de valeurs (Xi , Yj ) est


définie comme suit :
Nij
Fij =
N
Exemple
X
F22 = fsk = f11 + f12 + f21 + f22 = 0.2
s≤2,k≤2

j
X
La fréquence marginale cumulée est noté F .j = F.t
t=1
Exemple
F3. : c’est la sommes de tous les fréquences marginales des couples (Pi , Tj )
pour lesquels Pi ≤ 3 c’est à dire :
3
X
F.3 = Ft3 = F13 + F23 + F33 = 0.17 + 0.34 + 0.30 = 0.81
t=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 14 / 33


Distribution marginales Variances marginales

On appelle moyennes marginales, les quantités suivantes :


n m
1 X 1 X
x= ni. xi et y = n.j yj
N N
i=1 j=1

Les variances marginales sont données par


n n
!
1 X 1 X
Var (X ) = σ 2 (X ) = ni. (xi − x)2 = ni. xi2 − x2
N N
i=1 i=1

 
m m
1 X 1 X
Var (Y ) = σ 2 (Y ) = n.j (yj − y )2 =  n.j yj2  − y 2
N N
j=1 j=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 15 / 33


Distribution marginales Variances marginales

Exemple :
Les moyennes marginales de la série double de l’exemple sont :
17 × 50 + 34 × 55 + 30 × 60 + 19 × 65
P= = 57.55kg
100

18 × 150 + 23 × 155 + 18 × 160 + 19 × 165 + 22 × 170


T = = 160.2cm
100
4
1 X
Var (P) = Ni. (Pi − P)2 = 24.24
100
i=1
et
5
1 X
Var (T ) = N.j (Tj − T )2 = 50.44
100
j=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 16 / 33


Distribution conditionnelle Définitions

Etant donné une variable (X , Y ) de dimension deux, on appelle variable X


conditionné à que Y = yj , la variable qui prend toutes les valeurs de xi
avec effectif nij . On la note par X /Y = yj

(X /Y = yj ) = {(xi , nij )} ∀i = 1, . . . , n

Le tableau statistique de cette distribution est

X /Y = yj Eff fréq
n
x1 n1j f1/j = n1j.j
.. .. ..
. . .
n
xi nij fi/j = n.jij
.. .. ..
. . .
n
xm nnj fn/j = nnj.j
Total n.j 1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 17 / 33


Distribution conditionnelle Définitions

Exemple :
Etant donné une variable (P, T ) de dimension deux, on appelle variable P
conditionné à que T = 160cm, la variable qui prend toutes les valeurs de
Pi avec effectif nij . On la note par P/T = 160cm

(P/T = 160cm) = {(Pi , nij )} ∀i = 1, . . . , n

Le tableau statistique de cette distribution est

P/T = 160cm Eff fréq


4
50 4 f1/j = 18
7
55 7 f2/j = 18
4
60 4 f3/j = 18
3
65 3 f4/j = 18
Total 18 1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 18 / 33


Distribution conditionnelle Définitions

Où
n n
X nij X nij
n.j = nij , fi/j = et fi/j = =1
n.j n.j
i=1 i=1

De la même façon, la variable Y sachant que X = xi est la variable qui


prend toutes les valeurs de xi avec effectif nij . on la note par Y /X = xi

(Y /X = xi ) = {(yi , nij )} ∀j = 1, . . . , m

Le tableau statistique est

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 19 / 33


Distribution conditionnelle Définitions

Y /X = xi Eff fréq
y1 ni1 f1/i = nni1i.
.. .. ..
. . .
n
yi nij fi/j = ni.ij
.. .. ..
. . .
ym nim fm/i = nnimi.
Total ni. 1

Où
m m
X nij X nij
ni. = nij , fj/i = et fi/j = =1
ni. ni.
j=1 i=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 20 / 33


Distribution conditionnelle Définitions

Exemple :
Etant donné une variable (P, T ) de dimension deux, on appelle variable P
conditionné à que P = 60kg , la variable qui prend toutes les valeurs de Pi
avec effectif nij . On la note par T /P = 60kg

(T /P = 60kg ) = {(Ti , nij )} ∀i = 1, . . . , n

Le tableau statistique de cette distribution est

T /P = 60kg Eff fréq


6
150 6 f1/i = 30
6
155 6 f2/i = 30
4
160 4 f3/i = 30
6
165 6 f4/i = 30
8
170 8 f4/i = 30
Total 30 1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 21 / 33


Distribution conditionnelle Variances

Moyennes et Variances conditionnelles :


n n
1 X X
xj = nij xi = fi/j xi
n.j
i=1 i=1
m m
1 X X
yi = nij yj = fj/i yj
ni.
j=1 j=1
n n n
1 X X 1 X
σj2 (x) = 2
nij (xi − x j ) = 2
fi/j (xi − x j ) = nij xi2 − x 2j
n.j n.j
i=1 i=1 i=1
m m m
1 X X 1 X
σi2 (y ) = nij (yj − y i )2 = fj/i (yj − y i )2 = nij yj2 − y 2i
ni. ni.
j=1 j=1 j=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 22 / 33


Relation entre distributions marginales et conditionnelles

On a les relations suivantes :


nij nij ni.
fij = = = fj/i fi.
n ni. n

nij nij n.j


fij = = = fi/j f.j
n n.j n
donc on a
fij = fj/i fi. = fi/j f.j
On aussi :
n
X n
X m
X n
X m
X m
X
x= fi. xi = xi fij = xi fi/j f.j = x j f.j
i=1 i=1 j=1 i=1 j=1 j=1

De même on a :
m
X m
X n
X m
X n
X n
X
y= f.j yj = yj fij = yj fj/i fi. = y i fi.
j=1 j=1 i=1 j=1 i=1 i=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 23 / 33


Relation entre distributions marginales et conditionnelles

Exemple :
Dans un groupe de 400 personnes, on a mesuré deux variables X = salaire
et Y = âge, les résultats sont donnés par le tableau suivant :

X/Y [18-25[ [25-35[ [35-65[


[50-100[ 50 30 20
[100-150[ 40 60 50
[150-300[ 30 40 80

Trouver les distributions marginales et conditionnelles.

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 24 / 33


Relation entre distributions marginales et conditionnelles

Marginale du salaire :

X ni. ci ni. ci ni. ci2


[50-100[ 100 75 7500 562500
[100-150[ 150 125 18750 2343750
[150-300[ 150 225 33750 7593750
400 60000 10500000

La moyenne est
1 X 60000
x= ni. xi = = 150
N 400
La variance
1 X 10500000
σ 2 (x) = ni. xi2 − x 2 = − 1502
N 400

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 25 / 33


Relation entre distributions marginales et conditionnelles

Marginale de l’âge :

Y n.j cj n.j cj n.j cj2


[18-25[ 120 21.5 2580 55470
[25-35[ 130 30 3900 117000
[35-65[ 150 50 7500 375000
400 13950 547470

La moyenne est
1 X 13980
y= n.j cj = = 34, 95
N 400
La variance
1 X 547470
σ 2 (y ) = n.j cj2 − y 2 = − 34, 952
N 400

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 26 / 33


Relation entre distributions marginales et conditionnelles

Les distributions conditionnelles de X sont :

X/y∼[18-25[ ni1 xi ni1 xi fi/j


50
[50-100[ 50 75 3750 120
40
[100-150[ 40 125 5000 120
30
[150-300[ 30 225 6750 120
120 15500 1

n
1 X 15500
x y =[18−25[ = nij xi = = 129, 166
n .j 120
i=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 27 / 33


Relation entre distributions marginales et conditionnelles

X/y∼[25-35[ ni2 xi ni2 xi. fi/j


30
[50-100[ 30 75 2250 130
60
[100-150[ 60 125 7500 130
40
[150-300[ 40 225 9000 130
130 18750 1

n
1 X 18750
x y =[18−25[ = nij xi = = 144, 23
n .j 130
i=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 28 / 33


Relation entre distributions marginales et conditionnelles

X/y∼[35-65[ ni3 xi ni2 xi. fi/j


20
[50-100[ 20 75 1500 150
50
[100-150[ 50 125 6250 150
80
[150-300[ 80 225 18000 150
150 25750 1

n
1 X 25750
x y =[35−65[ = nij xi = = 171, 66
n .j 150
i=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 29 / 33


Dépendance et indépendance statistique Définition

Étant donné deux caractères X et Y , X prenant les modalités :


x1 , x2 , . . . , xm et Y prenant les modalités : y1 , y2 , . . . , ym .
Définition :
On dit que les 2 caractères X et Y sont indépendants si les distributions
conditionnelles de X liées par yj de Y est identiques entre elles d’une part
et identique à la distribution marginale de X d’autre part. De même les
distributions conditionnelles de Y liées par xi de X est identiques entre
elles d’une part et identique à la distribution marginale de Y d’autre part.
Les lignes du tableau des effectifs ou des fréquences sont proportionnelles
entre elles et proportionnelles à la ligne marginale, de même pour les
colonnes.
Ainsi l’hypothèse de l’indépendance de X par rapport à Y est equivalente

ni. n.j
nij = ou fij = fi. f.j
n..

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 30 / 33


Dépendance et indépendance statistique Définition

Exemple :
On considère la statistique double donnée par le tableau suivant

X/Y y1 y2 y3 ni.
x1 4 6 2 12 ligne 1
x2 12 18 6 36 ligne 2
x3 24 36 12 72 ligne 3
n.j 40 60 20 120 ligne 4

Les lignes des effectifs sont proportionnelles entre elles et proportionnelles


à la ligne marginale, en effet :
10 10
ligne4 = 10 × ligne1 = ligne2 = ligne3
3 6
donc X et Y sont indépendants.

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 31 / 33


Dépendance et indépendance statistique La notion de covariance

Définition :
La covariance permet de détecter et de décrire la relation entre deux
variables statistiques. Elle donne cependant uniquement le sens et non le
degré de la liaison entre deux variable.
On considère deux caractères X et Y , X prenant les modalités :
x1 , x2 , . . . , xp et Y prenant les modalités : y1 , y2 , . . . , yq .
On appelle la covariance de deux variables X et Y , notée Cov (X , Y ), la
quantité donnée par
n m
1 XX
Cov (X , Y ) = nij (xi − x)(yj − y )
n
i=1 j=1

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 32 / 33


Dépendance et indépendance statistique Propriétés

Propriétés :
On démontre facilement les propriétés suivantes :
 
n X m
1 X
Cov (X , Y ) =  nij xi yj  − xy
n
i=1 j=1
Cov (X , Y ) = Cov (Y , X )
Cov (aX + b, cY + d) = acCov (X , Y )
Cov (X , X ) = Var (X )
Var (X + Y ) = Var (X ) + Var (Y ) + 2Cov (X , Y )
Var (X − Y ) = Var (X ) + Var (Y ) − 2Cov (X , Y )
Remarque :
X et Y indépendents, alors Cov (X , Y ) = 0 ; la réciproque est fausse c’est à
dire que la covariance peut être nulle mais X et Y ne sont pas
indépendents.

Khalid BOUIHAT (ESAC) ESAC le 4 Mai 2023 33 / 33

Vous aimerez peut-être aussi