Serie4 Corrige
Serie4 Corrige
Serie4 Corrige
Corrigé - Série 4
Lois conjointes et tableaux de fréquences à double entrée
Exercice 1
a) Loi conjointe de X et Y :
HH
Y
H
HH 2 3 4 Total
X HH
1 1/6 1/6 1/6 3/6
2 0 1/6 1/6 2/6
3 0 0 1/6 1/6
Total 1/6 2/6 3/6 1
xi 1 2 3 Total
Loi marginale de X :
pi• 3/6 2/6 1/6 1
yj 2 3 4 Total
Loi marginale de Y :
p•j 1/6 2/6 3/6 1
b)
Diagramme en mosaïque (X conditionnel a Y)
2 3 4
x
1
3
2
c) X et Y ne sont pas indépendantes, car il y a plusieurs cas où pij 6= pi• p•j .
d) Loi conditionnelle de Y lorsque le plus petit numéro tiré vaut 3 :
yj 4 Total2 3
pj|X=3 1 1 0 0
p
e) E(Y |X = 3) = 4 ; V ar(Y |X = 3) = 0.
f) Loi conditionnelle de X lorsque le plus grand numéro tiré est pair :
1
Université Laval STT-2902
Faculté des sciences et de génie Automne 2012
Département de mathématiques et de statistique Emmanuelle Reny-Nolin
xi 1 2 3 Total
pi|Y =2 ou 4 1/2 1/4 1/4 1
1
g) Cov(X, Y ) = E(XY ) − E(X)E(Y ) = [1(2) + 1(3) + 1(4) + 2(3) + 2(4) + 3(4)] −
6
3 2 1 1 2 3 35 10 20 5
(1) + (2) + (3) (2) + (3) + (4) = − = .
6 6 6 6 6 6 6 6 6 18
Exercice 2
a) Loi conjointe de X et Y :
HH
Y
H
HH -2 5 8 Total
X HH
1 0,21 0,35 0,14 0,7
2 0,09 0,15 0,06 0,3
Total 0,3 0,5 0,2 1
b) P (X et Y pairs) = 0, 09 + 0, 06 = 0, 15.
P (X = 1 et Y = 5) + P (X = 1 et Y = 8) 0, 35 + 0, 14
c) P (X = 1|Y = 5 ou 8) = = =
P (Y = 5) + P (Y = 8) 0, 5 + 0, 2
0, 7
d) Il n’est pas nécessaire d’effectuer le calcul, car les variables sont indépendantes. Ainsi,
leur covariance est nulle. Si vous avez besoin de vous convaincre :
Cov(X, Y ) = 4, 55 − (1, 3)(3, 5) = 0.
2
Université Laval STT-2902
Faculté des sciences et de génie Automne 2012
Département de mathématiques et de statistique Emmanuelle Reny-Nolin
Exercice 3
a) Loi conjointe de X et Y :
PP
PP Y (K)
P PP 0 1 2 Total
X (♠) PP
P
P
36 3 36 3 39
2 1
0 52
52
1 2
52
2
52
2 2 2 2
12 36 36 3 12 3 13 39
1 1 1
+ 1 1 1 1 1
1 52
52
52
52
2 2 2 2
12 12 13
2 1 2
2 52
52
0 52
2 2 2
48 4 48 4
2 1
Total 52
52
1 2
52
1
2 2 2
432 72 3 507
1
1326 1326 1326 1326
66 12 78
2 0
1326 1326 1326
1128 192 6
Total 1
1326 1326 1326
b) X et Y ne sont pas des variables indépendantes, car le produit des probabilités mar-
ginales n’est pas toujours égal à la probabilité conjointe correspondante.
6×78
Contre-exemple : p22 = 0, ce qui n’égale pas p2• p•2 = 13262
3
Université Laval STT-2902
Faculté des sciences et de génie Automne 2012
Département de mathématiques et de statistique Emmanuelle Reny-Nolin
c)
P (Y ≥ 1 ∩ X ≥ 1)
P (Y ≥ 1|X ≥ 1) =
P (X ≥ 1)
(72 + 3 + 12 + 0)/1326
=
(507 + 78)/1326
= 0, 1487
d) • Vous payez 1$ pour chaque carte de pique pigée.
• Vous recevez 2$ pour chaque roi pigé.
Un jeu est équitable si l’espérance de gain est nulle. Pour calculer l’espérance du gain,
on peut procéder de deux façons :
1) On détermine la valeur du gain pour chaque couple de valeurs (xi , yj ), que l’on
notera g(xi , yj ). On calcule l’espérance du gain comme suit :
I P
P J
E(Gain) = g(xi yj ) P (X = xi et Y = yj )
i=1j=1
630 108
=0 +2 + ... = −0, 19$
1326 1326
G = (−1) X + 2 Y
Le jeu n’est donc pas équitable, car en moyenne, le joueur perd de l’argent.
Quel montant un roi devrait-il vous faire gagner pour le jeu devienne équitable ?
Supposons qu’un roi vous donne k dollars. La valeur de k sera déterminée d’après
l’équation :
663
E(G) = (−1) E(X) + k E(Y ) = 0 ⇒ k= = 3, 25 $
204
4
Université Laval STT-2902
Faculté des sciences et de génie Automne 2012
Département de mathématiques et de statistique Emmanuelle Reny-Nolin
Exercice 4
Le tabac est-il plus associé aux décès par cancer du poumon ou aux décès par maladies
coronariennes ?
Il suit que
5 50
P (Cancer|F um) = 10 × =
100 000 100 000
et que
170 289
P (M al.coron.|F um) = 1, 7 × =
100 000 100 000
Ainsi, puisque les maladies coronariennes sont beaucoup plus présentes dans la population
que le cancer du poumon, il est normal qu’elles soient associées à plus de décès de fumeurs.
Cette analyse ne permet toutefois pas de déterminer si le tabac a causé ces décès.
Exercice 5
691
Sages-femmes : pSF = = 0, 039
17 791
5
Université Laval STT-2902
Faculté des sciences et de génie Automne 2012
Département de mathématiques et de statistique Emmanuelle Reny-Nolin
b) Y a-t-il un lien statistique entre le type d’accoucheur et la survie ? (La différence entre
les deux taux de mortalité est-elle significative ou fortuite ?)
On peut conduire un test d’indépendance et tester les hypothèses suivantes à l’aide
de la distribution du khi-carré.
H0 : La survie et le métier de l’accompagnant sont indépendants
H1 : Il existe une relation entre la survie et le métier de l’accompagnant
On calcule les fréquences espérées, puis la distance observée entre le modèle d’indépendance
(le tableau des fréquences espérées) et les observations.
Fréq. obs. Oij Survie Décès Total Fréq. esp. Eij Survie Décès Total
Médecins 18 215 1 989 20 204 Médecins 18 778,9 1 425,1 20 204
Sages-femmes 17 100 691 17 791 Sages-femmes 16 536,1 1 254,9 17 791
Total 35 315 2 680 37 995 Total 35 315 2 680 37 995
Le lien est très clair : le taux de mortalité est plus élevé chez les médecins.
c) Taux de mortalité des mères après 1847 :
1 712
Médecins accoucheurs : pM = = 0, 036
47 938
1 248
Sages-femmes : pSF = = 0, 031
40 770
(Entre vous et moi, c’est encore très élevé, dans les deux cas !)
d) La différence entre les deux taux de mortalité est-elle encore significative ? On fait le
test d’indépendance de la même façon qu’en b).
Le lien est encore significatif : le taux de mortalité est plus élevé chez les médecins,
mais la différence est moins grande que précédemment. Les médecins n’ont pas tous
6
Université Laval STT-2902
Faculté des sciences et de génie Automne 2012
Département de mathématiques et de statistique Emmanuelle Reny-Nolin
accepté de changer instantanément leur pratique : cela les aurait obligés à admettre
qu’ils étaient responsables de tant de morts...
Exercice 6
On veut savoir si la distribution de la variable d’intérêt (ici : années vécues après le décès)
est la même pour toutes les populations considérées (ici les hommes et les femmes).
• Puisque lorsque deux variables sont indépendantes leurs lois conditionnelles sont toutes
égales à leur loi marginale, il est équivalent de dire ”Les I = 2 distributions conditionnelles
sont les mêmes” et ”La variable d’intérêt (durée de vie) et la variable qui distingue les
populations (sexe) sont indépendantes”. Dans notre exemple, la question revient à se
demander s’il existe un lien entre les variables ”sexe” et ”durée de vie”, et la statistique
du test d’indépendance nous permet de répondre à la question.
• Décision et conclusion :
Puisque χ22,0.05 = 5, 99, on ne rejette pas H0 au seuil de 5%, et on conclut que la distri-
bution de la durée de vie ne diffère pas selon le sexe.
On peut aussi calculer le seuil observé du test : P (D > 3, 328) = 0.1894 (où D ∼ χ22 sous
H0 ), ce qui indique qu’on ne rejetterait pas l’indépendance même en utilisant un seuil de
10% ou 15%.
7
Université Laval STT-2902
Faculté des sciences et de génie Automne 2012
Département de mathématiques et de statistique Emmanuelle Reny-Nolin
Exercice 7
Succès Échec
Traitement 1
Succès Échec Total
Traitement 1 273 77 350
Traitement 2
Traitement 2 289 61 350
Total 562 138 700
Valeur-P = 0,1285
b) Quand on considère les résultats des traitements sans tenir compte de la taille des
calculs rénaux, on conclut que le traitement 2 a un plus grand taux de succès que le
traitement 1. (Cette différence est non significative statistiquement).
Quand on considère les résultats des traitements en tenant compte de la taille des
calculs rénaux, i.e. en faisant l’analyse séparément pour les petites pierres et les grosses
pierres, on conclut l’inverse. (Encore non significatif).
8
Université Laval STT-2902
Faculté des sciences et de génie Automne 2012
Département de mathématiques et de statistique Emmanuelle Reny-Nolin
Bien sûr, dans le choix d’un traitement, il faut aussi tenir compte des risques col-
latéraux (anesthésie générale, grande incision, etc.), mais c’est une autre histoire...