Biométrie P2
Biométrie P2
Biométrie P2
Analyse de la variance
ANOVA
I. ANOVA à un facteur
Introduction
(𝒁 − 𝝁)
𝒀 =
𝜹
Z ∼ 𝑵 𝝁, 𝜹𝟐 Y ∼ 𝑵 𝟎, 𝟏
loi normale Centrée - réduite
I. ANOVA à un facteur
Conditions d'applications de l'ANOVA
• Les populations étudiées suivent Homoscédasticité
prélevés aléatoirement et
indépendamment dans les
populations.
I. ANOVA à un facteur
Tableau de données
• Chacune des colonnes
.1. .2. … ..i.. …. ..I. est assimilée à un groupe
X11 : X21 … Xi1 ….. XI1
expérimental.
.
: : : : • La ligne 1 du tableau est
X1n1 : Xij constitué de I entrées
: : : XInI appelées traitements ou
X2n2 : :
variantes.
Xini • L’ensemble des
Modèle 1:
traitements constitue un
Xij = i + ij facteur.
Modèle 2: Plusieurs
Xij = + i + ij
niveaux
• = moyenne commune (à toutes les populations) (Traitements)
• i = effet du traitement i pour le
• ij = erreur de la jème observation du groupe i
facteur
I. ANOVA à un facteur
Procédure de calcul d'une ANOVA
Test de l'homogénéité des variances
• H0: les variances sont homogènes (les I moyennes sont égales,
i.e. H0 : 1 = 2 = … = I)
• H1: Au moins une des variances est différente des autres
→ utilisation d'un test de comparaison de plusieurs variances
Conclusion
•Si H0 est rejetée: il est théoriquement impossible de comparer des
échantillons qui ne varient pas de la même manière.
•Si H1 n’est pas rejetée: par conséquent, il est possible de
comparer les moyennes de tels échantillons
I. ANOVA à un facteur: modèle 1
Variabilité factorielle : Variabilité totale au sein de
reflète les écarts des l'expérience (quel que soit
moyennes des échantillons l'échantillon) :
Somme des Carrés des Écarts Somme des Carrés des Écarts à
à la moyenne factorielle la moyenne totale
DDL = k-1. Variabilité résiduelle: reflète variations DDL = N-1.
individuelles dans chaque échantillon.
• Total = n – 1
T
Terme Description
nT nombre total d'observations
r nombre de niveaux de
facteurs
I. ANOVA à un facteur
Variabilités : comparaison variation factorielle – variation résiduelle
Sous l’hypothèse H0 :
•F suit une loi à et ddl (test unilatéral :
le rapport n’est pas obligatoirement supérieur à 1),
Choix du risque:
•Risque de première espèce α=5% (erreur commise
lorsqu’on rejette H0 à tort).
I. ANOVA à un facteur
Décision
Si => rejet de H0 au risque α :
•La variance factorielle est significativement supérieure à la
variance résiduelle : les moyennes diffèrent
significativement entre-elles.
→ on attribue une influence significative au facteur étudié.
•Recherche du degré de signification p (recherche du
risque α le plus petit possible pour conclure au rejet de H0)
I. ANOVA à un facteur: modèle 2
• Ensemble 1 de • Ensemble 2 de
données données
A B C A B C
8 7,5 9,5 3 1,5 5,2
9 8,5 9,8 9 8,5 9,8
10 9,5 10,1 15 15,5 14,4
9 8,5 9,8 9 8,5 9,8
• est estimé par X..
(X − X )
i i. ..
2
• S.C.E.intra-groupes =
(X − X )
ij i.
2
• S.C.E.totale = ij ..
SCE CMEint er
Inter-gps I–1 SCEinter CMEinter= int er
F=
I −1 CMEint ra
SCEint ra
N–I
Intra-gps SCEintra CMEintra=
N −I
Totale N-1 SCEtotale
I. ANOVA à un facteur: modèle 2
Mesure de la décomposition de la SCE
SCE T
NB : 2 inclue
* SCET expliquée de façon linéaire : r2
* SCET expliquée de façon non linéaire : 2-r2
2 ≥ r2
I. ANOVA à un facteur: modèle 2
• R carré (ajusté)
• Remarque:
Dans le cas de la régression linéaire simple 𝑹𝟐 = 𝒓𝒙𝒚 𝟐
I. ANOVA à un facteur: modèle 2
Exemple: effet de la nature du sol sur le rendement de la
pomme de terre
sable argile terreau
21 16 23
20 18 31
16 11 24
I. ANOVA à un facteur: modèle 2
ni 3 3 3 9 =N
Ti. 57 45 78 180 = T
19 15 26 20
sable argile terreau
21 16 23
20 18 31
16 11 24
Ti. 57 45 78 180
2
180
SCET = 212 + 20 2 + ....− = 264
9
572 452 1802 = 186
SCE A = + + ....−
3 3 9
I. ANOVA à un facteur: modèle 2
SV SCE ddl CM F
A 186 2 93 7,15
R 78 6 13
T 264 8
F 2
6, = 0,05 = 5,14
186
• Part de la variabilité du rendement = = 0,70
2
expliqué par le sol: 264
•
Le coefficient de détermination
R2 = 1-(78/186)=0,58 soit 58%
I. ANOVA à un facteur
Exemple: comparer le poids moyen, à un âge déterminé, de moutons
d'une même race provenant de 3 régions différentes. Les résultats
obtenus sur 3 échantillons sont les suivants (en kg) :
II. ANOVA à Deux facteurs
Introduction
• Étude simultanée d’un facteur A à p modalités et d’un
facteur B à q modalités.
A1 A2 … Ai … Ap
B1 y111
y112
…
B2
…
Bj yijk
…
nij mesures par case
Bq
II. ANOVA à Deux facteurs
Données et notations
1≤i≤p;1≤j≤q;1≤k≤r
A1 A2 … Ai … Ap
B1 y111
y112 n11
… n.1
y11k T11. T.1.
…
y11r
B2
…
n.j
Bj yijk nij
… T.j.
Tij.
Bq
n1. T1.. ni. Ti.. N
T
II. ANOVA à Deux facteurs
Les plans d’expérience de l’ANOVA 2
• A et B fixe : plan fixe
• A et B aléatoires : plan aléatoire
• A ou B aléatoire : plan mixte
15 18 21 24 27 30 15 18 21 24 27 30
Pas d’interaction Interaction
(y ijk − y ... ) = (y i.. − y ... ) + (y . j. − y ... ) + (y ij. − y i .. − y . j. + y ... ) + (y ijk − y ij. )
2 2 2 2 2
A B AxB e=0
SCET = SCEA + SCEB + SCEAxB + SCER
II. ANOVA à Deux facteurs
Calculs pratiques
T2 p
Ti..2 T 2
SCET = y ijk − SCE A = −
2
ijk N i =1 qr N
2 Tij.2
SCE R = y ijk −
q
T T 2
SCE B =
2
−
. j.
j =1 pr N ijk ij r
SV SCE ddl CM F
T SCET pqr-1
II. ANOVA à Deux facteurs
Tableau ANOVA récapitulatif
Source de
variation d.d.l. SCE CME F
Facteur A
(lignes) a-1 SCEA CMEA FA = CMEA/CMErésid.
Facteur B
(colonnes) b-1 SCEB CMEB FB = CMEB/CMErésid.
Résiduelle
(erreur) ab(n-1) SCErésiduelle CMErésid.
• Ho : bj = 0 FB :F q−1
pq(r− 1)
- Effet de l’interaction :
* graphiquement
* test de Tukey
- Lorsque l’interaction n’a pas d’influence significative :
* tests sur A et B
- Lorsque l’interaction a un effet significatif :
* pas de test sur A et B
II. ANOVA à Deux facteurs
Tests de l’ANOVA 2
II. ANOVA à Deux facteurs
Exemple 1: Rendement agricole en fonction du sol et de la
variété
sable argile terreau nij = 1
A 21 16 23
B 20 18 31
C 16 11 24
II. ANOVA à Deux facteurs
SV SCE ddl CM F
variété 54 2 27 4,5
R 24 4 6
T 264 8
F2
4, = 0,05 = 6,94
II. ANOVA à Deux facteurs
analyse graphique de l’interaction
35 35
30 30
25 25
20 20
15 15
10 10
5 5
0 0
sable argile terreau A B C
II. ANOVA à Deux facteurs
Exercice: on veut comparer, chez deux races bovines
différentes (critère 1), les effets de 3 régimes alimentaires
caractérisés par des teneurs énergétiques différentes
(critère 2) : haut (H), bas (B) et moyen (M).
II. ANOVA à Deux facteurs
II. ANOVA à Deux facteurs
II. ANOVA à Deux facteurs
Conclusions
• il existe un effet race très important (Fobs >>> Ftable) ;
• il existe un effet régime mais faible (Fobs > Ftable);
• il n'y a pas d'interaction entre la race et le régime (Fobs
< Ftable).