Plans Experience
Plans Experience
Plans Experience
lans
Introduction
Vocabulaire de la
planification et de l’analyse
de variance
René Thom :
« Halte au hasard, silence au bruit ! »
Le Débat n°3 juillet-août 1980 éditions
Gallimard, Paris, 192p.
« Ce qui limite le vrai ce n’est pas le faux
mais l’insignifiant »
Prédire n’est pas expliquer page 132
1. Le plan à un facteur
Ou plan en randomisation
totale
A. On détermine l’allocation
Nombre d’unités expérimentales par
modalité du facteur
B. Chaque unité reçoit une modalité
par tirage au sort exhaustif
= randomisation
20 boîtes de culture
P
1.2. Analyse
L’analyse de variance
Yij = µ + α i + ε ij
Effet moyen résidu
Effet de la modalité i
On reconnaît le modèle de
l’échantillonnage stratifié
J.S. Pierre Intro plans
d'expérience 19
P
lans
But
H 0 ⇔ α1 = α 2 = ... = α i = ...α p = 0
Absence totale d’effet du facteur
Hypothèses alternatives
∃i , α i ≠ 0
J.S. Pierre Intro plans
d'expérience 20
P
lans La décomposition des sommes
de carrés d’écarts
Considérons un écart à la moyenne des
valeurs observées
yij − y..
Intercalons dans cet écart la moyenne des
individus d’une modalité
yij − yi. + yi. − y..
J.S. Pierre Intro plans
d'expérience 21
P
lans
Graphiquement
Modalité 1
y.. yij
Modalité 2
Modalité 3 (i )
(y ) ( ) ( )
2
⎡ ⎤
2
ij − y.. = ⎣ ijy − yi. + yi. − y.. ⎦
= ( yij − yi. ) + ( yi. − y.. ) + 2 yi. ( yij − yi. ) − 2 y.. ( yij − yi. )
2 2
∑∑ ( y − y.. ) =
p
2
ij
i =1 j =1
ni
= ∑∑ ( yij − yi. ) + ∑ ni ( yi. − y.. ) +
p p
2 2
i =1 j =1 i =1
ni ni
+2∑ yi. ∑ ( yij − yi. ) − 2 y.. ∑∑ ( yij − yi. )
p p
i =1 j =1 i =1 j =1
∑∑ ( y − y.. ) =
p
2
ij
i =1 j =1
T
Somme des carrés
des écarts totale
ni
= ∑∑ ( yij − yi. ) + ∑ ni ( yi. − y.. )
p p
2 2
i =1 j =1
i =1
W B
Somme des carrés Somme des carrés
des écarts intra des écarts inter
⎝ p − 1 ⎠
⎛ SCEw ⎞
E ( SCEw ) = ( n − p )σ ⇒ E ⎜
2
⎟ = σ 2
⎝ n − p ⎠
⎛ SCEw ⎞ ⎛ SCEB ⎞
Et donc E⎜ ⎟ = E ⎜ p −1 ⎟ = σ 2
⎝ n − p ⎠ ⎝ ⎠
Var ( ε ij ) = σ 2
R
E ( SCEB ) E ( SCEw )
>>
( p − 1) (n − p)
F de Fisher :
SCEB
( p −1)
F=
SCEw
( n− p )
Si F est « assez grand » on décidera
que le facteur a un effet
J.S. Pierre Intro plans
d'expérience 30
P
lans
Comment est distribué F ?
Cela dépend des hypothèses sur les erreurs
Si les erreurs sont
- Distribuées normalement
- Indépendantes deux à deux
- Avec une espérance nulle
- Et une variance uniforme σ2 indépendante de la
modalité i
Le numérateur est distribué comme un χ2 à p – 1
degrés de liberté
Le dénominateur est distribué comme un χ2 à n – p
degrés de liberté
F est alors distribué comme une variable de Fisher –
Snedecor à p –J.S.1 d'expérience
et nIntro
Pierre –p degrés de liberté
plans
31
P
lans
F est-il assez grand
Pour rejeter Ho ?
On peut utiliser une table
Exemple : F =4.8, dl1 = 4, dl2 = 44
∑∑ ( y − y..) n-1
p
Total ij SCET/(n-1)
i =1 j =1
∑ ni ( yi. − y..)
2
Inter (B) p-1 SCEB/(p-1) CMB/CMW p (F>=Fobs
(F>=Fobs))
i =1
ni 2
∑∑ ( y − yi. )
p
Validité
Des résultats
lans
Exemple : Anatalanta
> 0.4
0.2
lm(Lo~station %in% altitude)->m1
> plot(m1$fit,m1$res)
0.0
m1$res
> abline(0,0)
> title("Lo : résidus en fonction
-0.2
de l'estimée")
-0.4
-0.6
Exemple : Anatalanta
80
60
Frequency
40
0.4
0
> qqline(m1$res)
0.2
-0.6 -0.4 -0.2 0.0 0.2 0.4
Sample Quantiles
0.0
Shapiro-Wilk normality test
-0.2
data: m1$res
-0.4
W = 0.9787, p-value = 0.0001096 -0.6
-3 -2 -1 0 1 2 3
d'expérience 40
P
lans
Résumé
L’analyse de variance permet de juger
l’effet de tout un ensemble de modalités
On compare une estimation de la variance
interindividuelle
A partir de la somme des carrés des écarts inter
(B)
Et à partir de la somme des carrés des écarts
intra (W)
Par la statistique F de Fisher
Il nous reste à comparer les modalités
J.S. Pierre Intro plans
d'expérience 41
P
lans
Comparaisons multiples de
moyennes
m2 NS (4) * (5)
m3 * (6)
M4
Un équilibre
réalité
En fonction du coût Ho correct
des erreurs de
première et
seconde espèce
H1 β correct
Conservativité vs
puissance
J.S. Pierre Intro plans
d'expérience 54
P
lans
Les courbes de puissance
1−β 1.2
PPDS de Fisher
1
0.8
Tukey test1
test2
0.6
test3
Scheffé alpha
0.4
0.2
α
0
J.S. Pierre Intro plans
∆
0 10 20 30
d'expérience 40 50 60 70 55
P
lans Quelques tests bien connus
et appréciés
Etendue studentisée
De Duncan
De Newman & Keuls
De Tukey
T corrigé de Bonferroni
Test de Dunett
Comparaison à un témoin
1.3 Optimisation
Calcul du nombre de
répétitions nécessaires
δ
z α + zβ = δ
2
β
α /2 α /2
-4 -2 0 2 4 6
zα zβ
J.S. Pierre Intro plans
2
d'expérience 64
P
lans
Et donc …
z α + zβ = δ
2
∆
z α + zβ =
2 σ2
2
n
2 2
2σ ⎛ ⎞⎟
n≥ 2 ⎜⎜ z α + z β ⎟
∆ ⎝ 2 ⎠⎟
J.S. Pierre Intro plans
d'expérience 65
P
lans
Avec F
n2=42
5(r-1)=42
R=IntSup(42/5)+1=9+1=10
Un effort total de 50 boîtes
Le jeu en vaut-il la chandelle ?
Optimisation de l’allocation
Améliorer le contraste !
C12 = m1 − m2
En effet :
C12 = 1 × m1 + ( −1) × m2
ni n j ⎜n n ⎟ r
⎝ i j ⎠
∑n
i =1
i =N
Trouver le minimum de
1 1
+
ni n j
Sous la contrainte d’égalité
p
∑n
i =1
i =N
J.S. Pierre Intro plans
d'expérience 77
P
lans Solution : on forme le
« lagrangien »
⎛ p ⎞
L ( n1, n2 ,..., n p , λ ) = n + n + λ ⎜ ∑ ni − N ⎟
1 1
i j ⎝ i =1 ⎠
Quantité à
minimiser Multiplicateur de
Lagrange
Contrainte
(quantité = 0)
J.S. Pierre Intro plans
d'expérience 78
P
lans On annule les dérivées
partielles
∂L 1
= − 2 +λ = 0
∂n ni
i
Soit
1
ni =
λ
Allocation équilibrée
Optimale lorsque toutes les
comparaisons sont également
intéressantes
p
C = ∑ mi − pm0
i =1
∂L 1
= − 2 +λ = 0
∂n ni
i
∂L 1
= −p 2 +λ = 0 2
∂n n0
0
J.S. Pierre Intro plans
d'expérience 82
P
lans
Solution
Charge du témoin
1 ⎫
ni = ; i ≠ 0⎪
λ ⎪
⎬ ⇒ n0 = pni
p ⎪
n0 =
λ ⎪⎭
Si on ne s’intéresse qu’aux
comparaisons de chaque modalité
avec le témoin on doit :
Equilibrer toutes les modalités hors
témoin
Affecter autant d’unités au témoin qu’à
toutes les autres modalités réunies
m1 + m3
m2 = ⇔ m1 − 2m2 + m3 = 0
2
J.S. Pierre Intro plans
d'expérience 85
P
lans
Variance du contraste
⎛1 4 1⎞
Var ( C ) = σ ⎜ + + ⎟
2
⎝ n1 n2 n3 ⎠
Lagrangien :
1 4 1 ⎛ 3 ⎞
L ( n1 , n2 , n3 , λ ) = + + + λ ⎜ ∑ ni − N ⎟
n1 n2 n3 ⎝ i =0 ⎠
n2 = 2n1 = 2n3
Croisement, hiérarchie,
interaction, orthogonalité
Fixes ou aléatoires
Etudiés ou contrôlés
J.S. Pierre Intro plans
d'expérience 90
P
lans
a) Facteurs croisés
a1 : modèle additif
Effets indépendants
A2 : modèle interactif
Effets particulier de chaque combinaison
de modalités
A3 : modèles croisés non
orthogonaux
Effets fixes
yij = µ + αi + β j + εij
Response: Lo
Df Sum Sq Mean Sq F value Pr(>F)
sexe 1 0.2081 0.2081 5.6279 0.01827 *
altitude 1 0.6716 0.6716 18.1650 2.675e-05
***
Residuals 317 11.7204 0.0370
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05
`.' 0.1 ` ' 1
Et test de l’interaction
Response: Lo
Df Sum Sq Mean Sq F value
Pr(>F)
sexe 1 0.2081 0.2081 5.6431
0.01812 *
altitude 1 0.6716 0.6716 18.2140 2.613e-
05 ***
sexe:altitude 1 0.0684 0.0684 1.8562
0.17403
Residuals 316 11.6520 0.0369
J.S. Pierre Intro plans
d'expérience 104
P
lans
Modèle additif et interactif
altitude Littoral
Littoral
altitude
Modèle additif
yijk = µ + αi + β j + εijk
Modèle interactif
Facteur 1
1 2 3
(hiérarchisant)
Facteur 2
1 2 3 1 2 1 2 3
(hiérarchisé)
yijk = µ + αi + β j ( i ) + εijk
Effet du facteur 2
(hiérarchisé)
Effet du facteur 1
(hiérarchisant)
A venir
βj(i )
βj i
β j <i
J.S. Pierre Intro plans
d'expérience 110
P
lans
Anatalanta
α : sexe
β : altitude
D : station
Aléatoire
Hiérarchisée sous altitude
Response: Lo
Df Sum Sq Mean Sq F value Pr(>F)
sexe 1 0.2081 0.2081 7.3296 0.007158 **
altitude 1 0.6716 0.6716 23.6574 1.831e-06 ***
altitude:station 6 2.8914 0.4819 16.9750 < 2.2e-16 ***
Residuals 311 8.8290 0.0284
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
J.S. Pierre Intro plans
d'expérience 112
P
lans
Cas particulier :
35 35
A C E E B Randomi- A C E D B B1
sation
30 30
E D A B C B2
D D A A C
C D D E E C D A B E B3
25 25
D C B B E D C B E A B4
D
20 C B B C Blocs D C A E B B5
20
E A A D B E A C D B B6
15 15
12 porcs
Très
hétérogènes
4 traitements
A,B,C,D
3 blocs
C B
D A
C B
Essai colza
12 blocs
3 terreaux
4 variétés
12 pots perdus par bloc
Plan factoriel en blocs complets
équilibrés
J.S. Pierre Intro plans
d'expérience 124
P
lans
> m1<-lm(D12~bloc*var*ter,data=colza)
> anova(m1)
Analysis of Variance Table
Response: D12
Df Sum Sq Mean Sq F value Pr(>F)
bloc 11 30465 2770 3.5551 8.439e-05 ***
var 3 39950 13317 17.0936 1.685e-10 ***
ter 2 7720 3860 4.9545 0.007463 **
bloc:var 33 44207 1340 1.7196 0.009096 **
bloc:ter 22 20968 953 1.2234 0.222592
var:ter 6 8186 1364 1.7514 0.107696
bloc:var:ter 64 49031 766 0.9834 0.516420
Residuals 426 331871 779
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
J.S. Pierre Intro plans
d'expérience 125
P
lans
> m2<-lm(D12~bloc+var+ter+bloc:var,data=colza)
> anova(m2)
Analysis of Variance Table
Response: D12
Df Sum Sq Mean Sq F value Pr(>F)
bloc 11 30465 2770 3.4986 9.715e-05 ***
var 3 39950 13317 16.8220 1.928e-10 ***
ter 2 7720 3860 4.8758 0.007983 **
bloc:var 33 44207 1340 1.6922 0.010424 *
Residuals 518 410057 792
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
colza$bloc
Bloc2
Bloc1
90
Bloc11
Bloc7
mean of colza$D12
Bloc9
80
Bloc4
Bloc8
Bloc12
Bloc10
70
Bloc6
Bloc5
Bloc3
60
50
C F N P
A C E D B
b =5
t =5
E B A C D
r =4
λ =3
C E D B A
D A B E C
B D C A E
λ=
( t − 2 )!
( k − 2 )!( t − k )!
J.S. Pierre Intro plans
d'expérience 132
P
lans
Notion d’efficacité
λt
E=
kr
Ici (3 x 5)/(4 x 4) = 15/16 = 93.75%
Pas d’interprétation trop rapide de cet
indice !
J.S. Pierre Intro plans
d'expérience 133
P
lans
Sens de l’efficacité
Variance d'un contraste élémentaire dans le BIE
E=
Variance du même contraste dans le BCE correspondant
Carré de Youden
Plans irréductibles
Plans complémentaires
Catalogues de plan (Raghavarao
1971, Cochran 1963)
Logiciels : AlgDesign (Package de R)
Response: rdt
Df Sum Sq Mean Sq F value Pr(>F)
bloc 4 861.94 215.49 162.089 1.070e-09 ***
var 4 241.35 60.34 45.387 8.997e-07 ***
Residuals 11 14.62 1.33 # Forme correcte pour un BIE
> anova(lm(rdt~var+bloc,data=bie))
Analysis of Variance Table
Response: rdt
Df Sum Sq Mean Sq F value Pr(>F)
var 4 173.37 43.34 32.602 4.824e-06 ***
bloc 4 929.93 232.48 174.874 7.100e-10 ***
Residuals 11 14.62 1.33 # Si l’on veut s’assurer du statut des blocs
J.S. Pierre Intro plans
d'expérience 146
P
lans
A C D B E
E D C A B
B A E C D
C E B D A
Az Cv Dw By Ex
Ew Dx Cv Az By
Bx Az Ey Cv Dw
Cv Ey Bx Dw Az
Traitement 1
Traitement 2
Système orthogonal
Aucune interaction accessible
Très peu puissant
J.S. Pierre Intro plans
d'expérience 151
P
lans
Le split-plot
Une simplification pratique des plans factoriels
complets à deux facteurs étudiés + les blocs
Exemple : Sur une grande boîte de Petri carrée, on
peut étudier plusieurs mutants d’Arabidopsis
Mais on ne peut faire qu’un seul traitement
(témoin, ou sucre, ou sucre + herbicide)
Le facteur traitements doit donc être randomisé
plus grossièrement que le facteur mutant
Split-plot = parcelle coupée
A B A B B A B B B A A A
X Z Z Y X Y Y X Z X Z Y
B A B A B A A A A B B B
Y X Z Y X Z Z X Y Y Z X
B B A B A A A A A B B B
Z Y Z X X Y Z Y X Y X Z
B A B A B A B B B A A A
X Y Z Z Y X Z Y X Z X Y
Deux niveaux
On traite le premier facteur comme
un bloc complet en « grandes
parcelles »
Le facteur « sous-bloc » ou « grande
parcelle » est aléatoire
yi .k . = µ + αi + δ k + ηik
second niveau
yijkl = µ + αi + β j l + γ ij l + δ k + ηik + ε ijkl
• Complets
• Fractionnaires
Response: rep
Df Sum Sq Mean Sq F value Pr(>F)
F1 1 60.03 60.03 481.1913 3.655e-06 ***
F2 1 406.89 406.89 3261.4950 3.114e-08 ***
F3 1 50.64 50.64 405.9219 5.569e-06 ***
F4 1 9.20 9.20 73.7112 0.0003535 ***
F1:F2 1 0.10 0.10 0.7975 0.4127430
F1:F3 1 1.68 1.68 13.4788 0.0144231 *
F1:F4 1 0.01 0.01 0.0541 0.8253533
F2:F3 1 0.004031 0.004031 0.0323 0.8644070
F2:F4 1 0.16 0.16 1.2843 0.3085060
F3:F4 1 0.13 0.13 1.0281 0.3571296
Residuals 5 0.62 0.12
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Response: rep
Df Sum Sq Mean Sq F value Pr(>F)
F1 1 60.03 60.03 587.085 3.266e-10 ***
F2 1 406.89 406.89 3979.239 2.438e-14 ***
F3 1 50.64 50.64 495.252 7.537e-10 ***
F4 1 9.20 9.20 89.933 2.579e-06 ***
F1:F3 1 1.68 1.68 16.445 0.002304 **
Residuals 10 1.02 0.10
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> AIC(m1,m2)
df AIC
m1 12 17.49315
m2 7 15.40103
14
x$F3
beta
12 alpha
mean of x$rep
10
8
A B
Fractions de plans
Ou plans fractionnaires
1 +1 +1 +1 1 +1 +1 +1 1 A X α
2 +1 -1 -1 2 +1 -1 -1 2 A Y β
3 -1 +1 -1 3 -1 +1 -1 3 B X β
4 -1 -1 +1 4 -1 -1 +1 4 B y α
1 A X α 5 A X β
2 A Y β 6 A Y α
3 B X β 7 B X α
4 B y α 8 B y β
Ouvrages
Dagnélie, P. 1993. Principes d’expérimentation. 2e
réimpression. Les presses agronomiques de
Gembloux. 182 p.
Cochran, W. G., and G. M. Cox. 1957. Experimental
designs. Second edition. New York : Wiley. 611 p.
http://fr.wikipedia.org/wiki/Plan_d%27exp
%C3%A9rience#
(plutôt mauvais. Voir de préférence l’original
anglais « design of experiments »)
http://www.educnet.education.fr/rnchimie/
math/benichou/cours/plan/plan.htm
Bon cours mais limité aux plans factoriels et
fractionnaires (point de vue de chimiste)