Section 4
Section 4
Section 4
Principes généraux
On constate ainsi que la somme des carrés des écarts par rapport à la
moyenne générale, est appelée somme des carres des écarts totale : SCEt,
peut elle aussi être divisée en deux composantes additives : une somme des
carrés des écarts factorielle : SCEa ou entre échantillons, et une somme
des carrées des écarts résiduelle SCEr, on peut résumer l’´equation
d’analyse de la variance sous la forme :
6◦ En divisant les sommes des carrés des écarts par leurs nombres de degrés
de liberté respectifs, on définit des quantités appelées carré moyen total :
CMt, un carré moyen factoriel : CMa ou entre échantillons, et un carré
moyen résiduel : CMr ou dans les échantillons:
Ces carrés moyens sont aussi appelés variances et ils possèdent d’ailleurs
certaines des propriétés des variances, notamment en ce qui concerne leurs
distributions d’´echantillonnage.
8◦ Le rapport des sommes des carrés des écarts factorielle sur la somme
carrés des écarts totale permet de définir facilement le rapport de corrélation,
aussi appelé coefficient de corrélation non linéaire :
Application
Dans cet exemple, nous allons vérifier s’il existe ou non, en moyenne, des
différences significatives de hauteurs entre les trois types de forêts, et chiffrer
éventuellement ces différences. Les hauteurs en mètre de 37 arbres sont
mentionnées dans le tableau 1 suivant :
Tableau1.
Comparaison des hauteurs des arbres de trois types de
hêtraies : hauteurs Observées, en mètres et rangs.
SCEt =165,5198
En sommant les carrés des écarts ainsi obtenus, on aboutirait aux trois
sommes des carrés des écarts définies précédemment : pour cela on obtient
les sommes des carrés de la manière suivante :
Le tableau ci-dessous présente les sommes des carrés des écarts qui sont ainsi
obtenues, les nombres de degrés de liberté et les carrés moyens.
On applique ces 3 formules on obtient les carrés moyens respectifs dont n=37 arbres
et p=3
Tableau d’analyse de la variance de la comparaison des hauteurs
moyennes des arbres de trois types de hêtraies
Ce carré moyen total (ou cette variance totale), auquel correspond un écart
type égal `a 2,14 m (c’est la racine carrée du CMt), mesure globalement
l’hétérogénéité des hauteurs, sans tenir compte de la subdivision en trois
types de forêts. Le carré moyen résiduel (ou la variance résiduelle), auquel est
associé un écart-type égal à 1,85 m (racine carrée du CMr), mesure, toujours
globalement, l’hétérogénéité des hauteurs à l’intérieure des trois types de
forêts. Il faut rappeler que
η² = 48,88/165,53 = 0,30.
4◦ Enfin, la somme des carrés des écarts factorielle (SCEa) peut être
obtenue soit par différence :
Soit par la relation :
SCEt=(23,4−24,98)²+(24,4−24,98)²+(24,6−24,98)²+…
..................................................................................................... +(27,7−24,98)²+(22,5
−24,98)²
+(22,9−24,98)²+(23,7−24,98)²+………..…………….…+(28,5-24,98)²+(18,9−24,98)²+(21,1−
24,98)²
+ (21,2− 24,98)²+……….…..+ (26,7− 24,98)²= (23.260,54 − 924,42²/37 =
165,53 SCEt=165,53 et
En outre, on peut calculer comme suit des limites de confiance, pour les
moyennes mi et pour les différences de moyennes mi –mi’ :
et pour
les deux derniers types de forêts :
Le fait que le premier intervalle de confiance englobe la valeur zéro indique qu’il n’y
a pas de différence significative entre les deux premiers types de hêtraies, ce qui
était déjà la
con
clusion de l’exemple. On peut en conséquence calculer éventuellement une
moyenne globale pour l’ensemble de ces deux types :
et déterminer des limites de confiance relatives à la différence entre cette
nouvelle moyenne et la moyenne du troisième type de forets :
Ces populations sont en général des variantes (ou niveaux k) d'un ou plusieurs
facteurs contrôlés de variation (facteurs A, B, ...).
Conclusion
: Est rejetée : il est théoriquement impossible de comparer des
échantillons qui ne varient pas de la même manière.
: N’est pas rejetée : par conséquent, il est possible de comparer les
moyennes de tels échantillons
Variabilité totale
Variabilité factorielle
Variabilité factorielle : reflète les écarts des moyennes des échantillons
(supposées influencées par le facteur étudié) par rapport à la moyenne
générale (G) de l'expérience.
Calcul de la Somme des Carrés des Écarts à la moyenne factorielle (SCEF)
DDL associés : k-1
Variabilité résiduelle
Bilan
Pour résumer :
SCET=SCEF+SCER
DDL associés : N-1 = k-1 + N-k.
On comparera les variabilités factorielles s²F=SCEF/k-1 et résiduelle s²R=SCER/N-K
SCET=SCEF+SCER
Choix du risque
Risque de première espèce (erreur commise lorsqu’on rejette à tort)
Décision
Sinon rien ne permet de dire que les moyennes des populations ne sont pas égales
=> n’est pas rejetée.
II-ANALYSE DE LA VARIANCE A DEUX CRITERES DE CLASSIFICATION
Introduction
Les deux facteurs envisagés peuvent être soit placés sur pied d’égalité dans
ce cas les modèles d’analyse de la variance sont dits croisés, soit au contraire
subordonnés l’un à l’autre les modèles sont dits hiérarchisés. Le cas hiérarchique
est parfois qualifié aussi de multi-niveaux.
.
Dans les différents cas, on doit également faire la distinction entre les modèles fixes, les
modèles
aléatoires et les modèles mixtes.
2◦ Nous considérerons tout d’abord les aspects descriptifs, puis les aspects
inferentiels de l’analyse à deux critères, en nous limitant dans un premier temps aux
modèles croisés à effectifs égaux. Nous envisagerons ensuite les modèles croisés à
effectifs inégaux et les modèles hiérarchisés.
d’un
e part, et j = 1 , . . . , q d’autre part) :
et une moyenne générale :
subdivision des écarts par rapport à la moyenne générale : en deux, puis
en quatre composantes :
Les deux premières composantes sont des sommes de carrés d’écarts factorielles,
la troisième est une somme de carré d’écarts liée à l’interaction, et la quatrième
est une somme de carrés d’écarts résiduelle.
Aux différentes sommes des carrés des écarts, peuvent être associés des
nombres de degrés de liberté, qui sont liés par la relation :
p q n−1 degrés de liberté pour la somme totale, puisqu’elle fait intervenir globalement les p
qn
observations individuelles,
p−1 et q−1 degrés de liberté pour les deux sommes factorielles, puisqu’elles sont
calculées respectivement à partir de p et de q moyennes,
p q (n−1) degrés de liberté pour la somme résiduelle, puisqu’elle fait intervenir p q
échantillons de n
observations, et
(p − 1) (q − 1) degrés de liberté pour la somme des carrés des écarts de l’interaction.
Enfin, en divisant les différentes sommes des carrés des écarts par leurs
nombres de degrés de liberté, on obtient les carrés moyens CMt , CMa , CMb ,
CMab et CMr . L’ensemble des résultats peut alors être présent sous la forme d’un
tableau d’analyse de la variance ou ANOVA
Tab
leau 3. Analyse de variance (ANOVA) à deux critères de classification :
modèles croisés à Effectifs égaux
=42,00= (44,75+39,25)/2
Tableau.
Comparaison de trois types de sondes dans deux types de sols : tableau partiel
d’analyse de la variance (aspects descriptifs).
2◦ Les différentes sommes des carrés des écarts peuvent alors être obtenues à l’aide des relations suivantes :
SCEr= SCE11+ SCE12+ SCE13+ SCE21 +SCE22 +SCE23= 56,8 +6,8 + 20,0 +5 +18,0+ 6,0= 112,6
On constate tout d’abord que l’interaction est non significative. Le test confirme
donc la conclusion intuitive que les différences entre types de sondes ne
dépendent pas des types de sols et vice versa Par contre, les différences observées
sont très hautement significatives en ce qui concerne les types de sols, et juste
significatives en ce qui concerne les types de sondes.
La comparaison, plus intéressante, des trois types de sondes est un problème qui
peut être traité notamment par la méthode de Newman et Keuls. Cette méthode
permet de montrer que les résultats obtenus à l’aide du premier type de sondes sont
significativement supérieurs aux résultats fournis par le deuxième type de sondes, le
troisième type conduisant à des résultats intermédiaires, qui ne sont pas
significativement différents des deux autres.
Conclusion
Conclusion
Tableau d'analyse de la variance :
Décision
Analyse De La Variance A Trois Critères De
Classification
Principes généraux
1◦ Pour trois critères de classification et dans le cas des effectifs égaux, on peut
considérer qu’on a p q r échantillons ou séries d’observations d’effectif n, et
designer les observations individuelles par (i = 1 , . . . , p , j = 1 , . . . , q ,k = 1 ,
. . . , r , et l = 1 , . . . , n). A partir de ces observations, on peut calculer les différentes
moyennes suivantes :
Aux différentes sommes des carrés des écarts, correspondent des nombres de
degrés de liberté liés par la relation :
La division des sommes des carrés des écarts par les nombres de degrés de liberté
permet de définir les carrés moyens, et l’ensemble des résultats peut être présente
sous la forme d’un tableau d’analyse de la variance.