TD-Maths-11 Statistiques D200430
TD-Maths-11 Statistiques D200430
TD-Maths-11 Statistiques D200430
Ils décident alors de chercher à savoir si la pluviométrie est liée à la température et dans ce cas,
prévoir la pluviométrie d’octobre 2019.
MOTIVATION
Dans les classes antérieures, nous avons étudié les séries statistiques à une variable (ou à un seul
caractère).
Face à la situation de la pandémie de la maladie à Coronavirus 2019 (COVID-19), des chercheurs
ont établi un lien entre le nombre de décès lié à ce virus et l’âge des personnes testées positives.
Cette étude a donc porté sur deux caractères quantitatifs :
• X le nombre de décès
• Y l’âge des personnes testées positives.
D’où l’importance de notre leçon : STATISTIQUE A DEUX VARIABLES
Nous allons traiter en :
Plan du cours
I. Présentation de la série statistique double
II. Ajustement linéaire par la méthode des moindres carrés
III. L’estimation
IV Exercice de synthèse
Page 1 sur 15
2. RESUME DE COURS
Exemple
Une étude statistique porte sur une population de 100 ménages. Deux caractères X et Y sont
étudiés :
- le caractère X est le nombre d’enfants
- le caractère Y est le nombre de pièces de l’appartement occupé.
On obtient le tableau ci-dessous qui représente le série statistique de caractère(X , Y)
X
0 1 2 3 4 5
Y
1 6 4 1 0 0 0
2 3 11 10 5 1 0
3 1 3 16 13 4 1
4 0 1 3 5 8 4
Les nombres qui ne sont pas dans cette ligne et cette colonne, représentent les différents 𝑛𝑖𝑗 .
Ainsi considérons le nombre 4 dans ce tableau. On constate qu’il est dans la colonne de la valeur
1 du caractère X et dans la ligne de la valeur 1du caractère Y. On dit alors il y’a 4 ménages qui ont
un enfant et occupent un appartement d’une pièce.
Ainsi le couple (𝑥2 , 𝑦1 )=(1 ;1) a pour effectif 𝑛21 = 4
Combien de ménages ont deux enfants et occupent un appartement de quatre pièces ?
On va donc considérer la colonne ayant la valeur 2 du caractère X et la ligne ayant la valeur 4 du
caractère Y. L’intersection de cette ligne et de cette colonne est 3.
3ménages ont donc deux enfants et occupent un appartement quatre pièces.
Le reste des 𝑛𝑖𝑗 , trouvez-les à la maison
Ce tableau à double entrée ci-dessus est appelé tableau de contingence.
Page 2 sur 15
2. Tableau de séries marginales
Considérons le caractère X
Pour trouver l’effectif de la valeur 0 on additionne tous les 𝑛𝑖𝑗 qui se trouvent dans la colonne de
la valeur 0 c’est-à-dire 6+3+1+0=10. 10 ménages n’ont donc pas d’enfants.
On procède de la même manière pour trouver l’effectif des autres modalités du caractère X. Ainsi
à chaque valeur on a son effectif dans la dernière ligne
Page 3 sur 15
𝑦𝑖 1 2 3 4
11 30 38 21
𝑓𝑖
100 100 100 100
3. Nuage de points
Définition
On considère deux caractères quantitatifs X et Y sur une même population de n individus.
On note 𝑥1 , 𝑥2 , 𝑥3 ,…, 𝑥𝑝 les valeurs du caractère X,
𝑦1 , 𝑦2 , 𝑦3 ,…, 𝑦𝑝 les valeurs du caractère Y,
On appelle nuage de points associé à la série statistique double de caractère (X, Y) les points de
couple de coordonnées (𝑥𝑖 ; 𝑦𝑗 ) d’effectifs non nuls.
Exemple
Le tableau suivant donne le nombre d’exploitations agricoles d’une région selon leur superficie
en hectares.
Superficie X 2 2 3 4 5 6 7 7,6
Nombre d’exploitations Y 14 26 31 29 44 40 54 50
Représente le nuage de points associé à cette série.
Réponse
Page 4 sur 15
Remarque
Dans la suite, les séries doubles considérées seront comme la série de l’exemple précédent ; c’est-
à-dire l’effectif 𝑛𝑖𝑗 du couple (𝑥𝑖 ,𝑦𝑗 ) vaut 1.
4. Point moyen
Définition
On appelle point moyen d’un nuage de 𝑛 points 𝑀𝑖 de coordonnées (𝑥𝑖 ; 𝑦𝑖 ) le point G de
coordonnées (𝑥𝐺 ; 𝑦𝐺 ) telles que :
𝑥 +𝑥 +⋯+𝑥𝑛 𝑦 +𝑦 +⋯+𝑦𝑛
𝑥𝐺 = 𝑋 = 1 2𝑛 ; 𝑦𝐺 = 𝑌 = 1 2𝑛 .
Exercice
Détermine les coordonnées du point moyen du nuage de points de la série statistique suivante :
Superficie X 2 2 3 4 5 6 7 7,6
Nombre d’exploitations Y 14 26 31 29 44 40 54 50
Réponse
C’est le point de coordonnées (X ; Y).
2+2+3+4+5+6+7+7,6 36,6
On a : X = = 8 = 4,575
8
14+26+31+29+44+40+54+50 288
et Y = = = 36
8 8
Donc : G (4,575 ; 36)
Exercice de maison
On considère la série statistique suivante :
𝑥𝑖 0 1 2 3 4 5 6 7 8
𝑦𝑖 160 110 100 72 36 29 20 10 3
Page 5 sur 15
1. Covariance
Définition
On appelle covariance de la série statistique double de caractère (X ; Y),
le nombre réel noté COV(X ; Y) tel que :
1
COV(𝑋, 𝑌) = 𝑛 ∑ 𝑛𝑖𝑗 (𝑥𝑖 − 𝑥 )(𝑦𝑗 − 𝑦 ) ou
∑ 𝑛𝑖𝑗 𝑥𝑖 𝑦𝑗
COV(𝑋, 𝑌) = − X Y.
𝑛
Exercice
Calcule la covariance de la série statistique précédente
Superficie X 2 2 3 4 5 6 7 7,6
Nombre d’exploitations Y 14 26 31 29 44 40 54 50
Réponse
∑ 𝑥𝑖 𝑦 𝑗
La covariance COV(X, Y) de cette série statistique est −XY
𝑛
2×14+2×26+3×31+4×29+5×44+6×40+7×54+7,6×50
COV(X, Y) = − 4,575 × 36
8
1503
COV(X, Y) = 8 − 164,7 .
Donc : COV(X, Y) = 23,675
Définition
Soit V(X) la variance de la série statistique de caractère X, V(Y) la variance de la série statistique
de caractère Y et COV (X ; Y) la covariance de la série statistique (X ; Y).
On appelle coefficient de corrélation linéaire de la série statistique double (X ; Y), le nombre réel
COV(X,Y)
noté 𝑟 tel que : 𝑟 = .
√V(X)√V(Y)
Exercice
Calcule le coefficient de corrélation linéaire de la série statistique du B.1.3.
Superficie X 2 2 3 4 5 6 7 7,6
Nombre d’exploitations Y 14 26 31 29 44 40 54 50
Réponse
COV(X,Y)
Le coefficient de corrélation linéaire 𝑟 de cette série statistique est : 𝑟 =
√V(X)√V(Y)
On a:
∑ 𝑥𝑖 2 2 22 +22 +32 +42 +52 +62 +72 +(7,6)2
• V(X) = − (X) = − 4,5752
𝑛 8
200,76
V(X) = − 4,5752 ≈ 4,16
8
23,675
Donc : 𝑟 = ≈ 0,92
√4,16×157,25
Page 6 sur 15
Remarques
• Le coefficient de corrélation linéaire permet de voir la dépendance linéaire des deux caractères
X et Y.
• Le coefficient de corrélation linéaire 𝑟 est un nombre réel de même signe que COV (X, Y) et on
a : −1 ≤ 𝑟 ≤ 1.
• Si │r│ est proche de 1, c’est-à-dire en pratique : 0,87≤ 𝑟 < 1 ou −1 < 𝑟 ≤ −0,87, alors on dit qu’il y a un
bonne corrélation linéaire ou une forte corrélation linéaire entre les deux caractères
X et Y.
Exemple
Interprète le coefficient de corrélation linéaire ci-dessus.
Réponse
On a : 𝑟 =0,92.
Comme 0,87≤ 𝑟 < 1, il y a une forte corrélation entre la superficie et le nombre d’exploitations
agricoles de cette région.
3. Droites de régressions
Propriété
Soit V(X) la variance de la série statistique de caractère X, V(Y) la variance de la série statistique
de caractère Y et COV (X, Y) la covariance de X et Y.
i. Droite de régression de Y en X.
En supposant qu’il y ait une forte corrélation entre les caractères X et Y alors, la droite (D)
Cov(X,Y)
d’équation : 𝑦 = 𝑎𝑥 + 𝑏 où 𝑎 = V(X) et 𝑏 = 𝑦 − 𝑎𝑥 est appelée la droite de régression de Y en
X par la méthode des moindres carrés.
ii. Droite de régression de X en Y.
Cov(X,Y)
La droite (D’) d’équation : 𝑥 = 𝑎′ 𝑦 + 𝑏′ avec : 𝑎′ = V(Y) et 𝑏′ = 𝑥 − 𝑎′ 𝑦 est appelée la droite de
régression de X en Y par la méthode des moindres carrés.
Exercice
On considère la série statistique précédente.
On sait que : 0,87≤ 𝑟 < 1.
1. Détermine une équation de la droite d’ajustement linéaire de Y en X par la méthode des
moindres carrés. On donnera les arrondis d’ordre 2 de a et b.
2. Détermine une équation de la droite d’ajustement linéaire de X en Y par la méthode des
moindres carrés. On donnera les arrondis d’ordre 2 de a’ et b’.
Réponse
Cov(X,Y)
1. C’est la droite (D) d’équation : 𝑦 = 𝑎𝑥 + 𝑏 où 𝑎 = V(X) et 𝑏 = Y − 𝑎X
Cov(X,Y) 23,675
𝑎= = = 5,69 et 𝑏 = Y − 𝑎X = 36 – 5,69 ×4,575 = 9,97
V(X) 4,16
Donc (D) : 𝑦 = 5,69𝑥 + 9,97
Cov(X,Y)
2. C’est la droite (D’) d’équation : 𝑥 = 𝑎′𝑦 + 𝑏′ avec 𝑎′ = V(Y) et 𝑏′ = X − 𝑎′Y
Cov(X,Y) 23,675
𝑎′ = = 157,25 = 0,15 et 𝑏′ = X − 𝑎′Y = 4,575 – 0,15×36 = –0,825
V(Y)
Donc : (D’) : 𝑥 = 0,15𝑦 −0,825.
Page 7 sur 15
Remarques
- Les droites (D) et (D’) passent par le point moyen G du nuage de points.
- Si 𝑟 est le coefficient de corrélation linéaire on a :
• 𝑎𝑎′ = 𝑟 2 et |𝑟| = √𝑎𝑎′
• Si 𝑎 > 0 et 𝑎’ > 0, alors 𝑟 = √𝑎𝑎′.
• Si 𝑎 < 0 et 𝑎’ < 0, alors 𝑟 = −√𝑎𝑎′.
1
• Si 𝑟 2 = 1, alors 𝑎 = 𝑎′ et les deux droites sont confondues.
4. Estimation
Exercice
On considère la série statistique précédente.
En considérant que la tendance se poursuit ainsi, détermine le nombre d’exploitations agricoles
pour une superficie de 9 ha.
Réponse
Une superficie de 9 ha correspond à x = 9.
En utilisant l’équation de la droite par la méthode des moindres carrés, on a :
𝑦 = 5,69𝑥 + 9,97
𝑦 = 5,69 × 9 + 9,97 = 61,8
Donc pour une superficie de 9 ha, le nombre d’exploitations agricoles est estimé à 62.
1) Représente le nuage de correspondant à la série statistique double (X, Y) dans le plan muni
d’un repère orthonormé.
On prendra sur l’axe des abscisses 1cm pour 1 travailleur et sur l’axe des ordonnées 1cm pour
une superficie de 1ha
Page 8 sur 15
3) On note V(X) la variance de X, V(Y) la variance de Y et Cov (X ; Y) la covariance de X et Y.
Justifie que V(X)=4,18 et Cov (X, Y) =5.57
Corrigé
1) Représentation du nuage de points associé à la série
y
12
11
10
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 x
Page 9 sur 15
3) Justifions que V(X)=4,18, V(Y)=8 ,44 et Cov (X, Y) =5.57
∑ 𝑥𝑖 2 2 22 + 42 + 42 + 52+ 72 + 72 + 82 + 82
𝑉(𝑋) = −X = − 5,632
𝑛 8
𝑉(𝑋) = 4,178 donc V(X)=4,18
COV(X, Y) 5,37
𝑟= =
√V(X)√V(Y) √4,18 × √8,44
r =0.904 soit r=0,90
Puisqu’il y a une forte corrélation entre le nombre de travailleurs et la superficie exploitée alors,
Cov(X,Y)
(D) a pour équation : 𝑦 = 𝑎𝑥 + 𝑏 où 𝑎 = V(X) et 𝑏 = 𝑦 − 𝑎𝑥.
5,37
a =4,18=1,28 et b=7,75- 1,28x5,63=0 ,54
Page 10 sur 15
b) Trace (D) sur le graphique précédent.
y
12
11
10
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 x
On a : y = 1,28x +0,54
𝑦−0,54
x= or y= 16
1,28
x=12
Une exploitation de 16ha d’hévéa prendrait donc 12travailleurs.
Exercice de maison
𝑥𝑖 0 1 2 3 4 5 6 7 8
𝑦𝑖 160 110 100 72 36 29 20 10 3
Page 11 sur 15
3. EXERCICES
3-1. Exercices de fixation
Exercice 1
On considère la série statistique suivante :
𝑥𝑖 1 4 7 8 10
𝑦𝑖 2 7 8 10 13
Exercice 2
On considère la série statistique suivante :
𝑥𝑖 0 1 2 3 4 5 6 7
𝑦𝑖 160 110 100 72 36 29 20 10
Exercice 3
Détermine le point moyen de la série de l’exercice 1.
Exercice 4
Détermine le point moyen de la série de l’exercice 2.
Exercice 5
Détermine la covariance de la série de l’exercice 2.
Exercice 6
Détermine le coefficient de corrélation linéaire de la série de l’exercice 2.
Exercice 7
Détermine une équation de la droite d’ajustement linéaire de Y en X du nuage de points de la
série de l’exercice 2 par la méthode des moindres carrés.
Exercice 8
Un agriculteur a estimé son budget annuel alloué, en euros, à la nourriture de ses bovins en
fonction de la taille de son troupeau. Il sait que son troupeau va encore grandir d'ici 2 ans. Il a
estimé qu'alors, son troupeau comportera 10 individus.
En extrapolant, détermine, à 100 euros près, le budget nourriture de l'agriculteur dans deux ans.
Page 12 sur 15
3-2. Exercices de renforcement
Exercice 9
La tension artérielle est une donnée médicale correspondant à la pression du sang dans les
artères. On la mesure chez les patients car une tension anormale peut-être le symptôme de
pathologies cardiovasculaires comme l'hypertension artérielle.
La tension artérielle d'une personne comporte deux mesures :
- la Tension Artérielle Systolique (notée TAS)
- la Tension Artérielle Diastolique (notée TAD).
Le tableau suivant regroupe les mesures de la tension artérielle pour un groupe de personnes
saines :
Page 13 sur 15
Exercice 10
Le tableau suivant donne le chiffre d'affaires (en millions de francs) réalisé au cours des 6
derniers mois par un site de vente en ligne en fonction du nombre de commandes reçues.
Nombre de
6 400 8 350 9 125 9 600 10 050 12 000
commandes (𝑥𝑖 )
Chiffre d'affaires
250 320 335 350 370 400
mensuel (𝑦𝑖 )
Exercice 11
Un chef d’entreprise reçoit de la part de ses collaborateurs la demande d’obtenir des véhicules de
fonction plus confortables et plus puissants. Il sollicite alors son comptable afin que celui-ci
examine la demande et sa faisabilité.
Le comptable utilise le tableau ci-dessous, donnant le prix de revient kilométrique (PRK) des
véhicules d’une puissance fiscale de 4 à 8 CV et en fait une projection sur les véhicules plus
puissants.
Puissance fiscale des
4 5 6 7 8
véhicules (CV)
Prix de revient
0,424 0,471 0,492 0,513 0,555
kilométrique (€)
Page 14 sur 15
Exercice 12 (Série A1 seulement)
La consommation d'une voiture, z, est donnée en fonction de sa vitesse, x, par le tableau suivant :
x (en km/h) 80 90 100 110 120
z (en litres/ 100 km) 4 5 6,5 8 10
4. SITUATION COMPLEXE
Exercice 13
Dans le cadre des recherches pour un exposé, des élèves d’une classe de Terminale ont été
accrochés par les informations suivantes :
La prévision météorologique est une science en pleine évolution. Elle a pour objectif de prédire
un ensemble de paramètres comme la pluviométrie, la pression, la température, etc.
Le tableau suivant donne les pluviométries et températures moyennes de septembre 2018 à août
2019 d’une ville.
Sept Oct Nov Déc Jan Fév Mars Avril Mai Juin JuilletAoût
18 18 18 18 19 19 19 19 19 19 19 19
Pluviométrie
13 23 49 49 50 64 79 48 40 10 5 6
(en mm)
Température
23 17 14 10 10 11 13 15 17 23 27 28
(en °C)
La température moyenne d’octobre 2019 était de 32 °C.
Ils décident alors de chercher à savoir si la pluviométrie est liée à la température et dans ce cas,
prévoir la pluviométrie d’octobre 2019.
À l’aide des outils mathématiques au programme, justifie que la pluviométrie est liée à la
température et détermine une estimation de la pluviométrie d’octobre 2019.
Page 15 sur 15