Analyse de La Variance AÌ Un Seul Facteur (1)

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 14

A NALYSE DE LA VARIANCE À UN SEUL FACTEUR

Statistiques - 4 DS - A.U. 2023/2024


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

Plan

1 Introduction et objectif

2 Présentation des données et notations

3 Estimation des paramètres

4 Variabilité et significativité

5 Application R

@UP-Maths ANOVA Statistiques


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

Exemple introductif
Un agronome utilise trois types d’engrais de blé.

@UP-Maths ANOVA Statistiques


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

Exemple introductif

L’agronome effectue une étude sur le rendement en hectare de parcelles de blé pour
chaque type d’engrais:

Niveaux : Engrais Rendements Moyenne Médiane Variance


A 48 30 50 49 44.25 48.5 90.9167
B 47 49 50 48 48.5 48.5 1.6666
C 47 51 20 50 42 48.5 218

Effet du type d’engrais


Y-a-t-il un effet du type d’engrais sur le rendement de percelles de blé?

@UP-Maths ANOVA Statistiques


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

Objectif

Objectif:
Étudier l’effet des variables qualitatives sur une variable quantitative.

Exemples :
Dans une expérimentation pédagogique, on désire étudier la performance de deux
pédagogies d’enseignement (pédagogie active, pédagogie traditionnelle) sur les
notes.

On veux étudier l’effet de quatre systèmes de présentation d’un produit dans les
magasins sur les ventes.

@UP-Maths ANOVA Statistiques


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

Représentation des données

Yij Variable à expliquer

Niveaux Effectifs Valeurs de Y


1 n1 Y11 , Y12 , ..., Y1n1
2 n2 Y21 , Y22 , ..., Y2n2
. . ...........
. . ...........
k nk Yk1 , Yk2 , ..., Yknk

@UP-Maths ANOVA Statistiques


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

Le modèle

Yij = µ + αi + εij
²
µi

Yij ∶ la variable à expliquer


✓ εij sont indépendantes ∀i, j
αi ∶ l’effet du i ème niveau du facteur
µ ; L’effet moyen général. ✓ εij ∼ N (0, σ) , ∀i, j
εij ∶ erreur

@UP-Maths ANOVA Statistiques


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

Test d’homogénéité des variances : Test de Bartlett

✦ Comparer les variances de k échantillons.


✦ Condition d’application: les variables doivent être distribuées normalement.
✦ Hypothèse :



⎪ H0 ∶ les k σi sont égaux



⎪ H ∶ au moins σi sont différents
⎩ 1

✦ Statistique :
χ2n loi Khi-deux de (k − 1) ddl

✦ Commande R: > bartlett.test()

@UP-Maths ANOVA Statistiques


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

Test d’égalité des moyennes


⎪ ⎧


⎪ H0 ∶ α1 = α2 = ⋅ ⋅ ⋅ = αi = ⋅ ⋅ ⋅ = αk = 0 ⎪
⎪ H0 ∶ µ1 = µ2 = ⋅ ⋅ ⋅ = µi = ⋅ ⋅ ⋅ = µk
⎨ ⇔ ⎨


⎪ H ∶ ∃ i , tel que αi = /0 ⎪

⎪ H ∶ ∃i= / j , tels que µi =/ µj
⎩ 1 ⎩ 1

L’hypothèse nulle suppose toujours l’égalité des moyennes des k populations, (les
échantillons proviennent tous d’une population unique P).

Plus précisément, on suppose que les k moyennes sont égales a une même moyenne µ

@UP-Maths ANOVA Statistiques


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

10

Estimation
Sous hypothèse H0 ∶ µ1 = µ2 = ⋅ ⋅ ⋅ = µi = ⋅ ⋅ ⋅ = µk = µ( αi = 0)

Modèle réduit
Yij = µ + εij

Estimation
µ̂ = Y

Résidus
eij = Yij − Y = (Yij − Y i. ) + (Y i. − Y )

@UP-Maths ANOVA Statistiques


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

11

Equation de l’analyse de la variance

Somme des carrés

SCT = SCR + SCE


± ² ±
Variabilité totale Variabilité résiduelle (intra) Variabilité factorielle (inter)


⎪ k ni


⎪ SCT = ∑ ∑ (Yij − Y )2 ∶ Variabilité totale






i=1 j=1








⎪ k ni
⎨ SCR = ∑ ∑ (Yij − Yi. )2 ∶ Variabilité résiduelle (intra)






i=1 j=1









k


⎪ SCE = ∑ ni (Y i − Y )2 ∶ Variabilité factorielle (inter)

⎩ i=1

@UP-Maths ANOVA Statistiques


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

12

Tableau d’analyse de la variance

Sources de Degré de Somme des Carrés Statistique


variation liberté carrés moyens F
SCE
F = k−1
SCE
Inter k−1 SCE
k−1 SCR
n−k

SCR
Intra n−k SCR
n−k

Totale n−1 SCT

@UP-Maths ANOVA Statistiques


Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

13

Test d’hypothèses

⎪ ⎧


⎪ H0 ∶ α1 = ⋅ ⋅ ⋅ = αi = ⋅ ⋅ ⋅ = αk = 0 ⎪
⎪ H0 ∶ µ1 = ⋅ ⋅ ⋅ = µi = ⋅ ⋅ ⋅ = µk
⎨ ⇔ ⎨


⎪ H ∶ ∃ i , tel que αi = /0 ⎪

⎪ H ∶ ∃i= / j , tels que µi =/ µj
⎩ 1 ⎩ 1

La statistique de test:
Sous hypothèse H0
SCE
F = k−1 suit la loi de Fisher Fk−1,n−k
SCR
n−k

Critère de décision:
Au risque α, on rejette H0 si p∗ = αobs < α avec
p∗ = αobs = PH0 (F ≥ fobs )
@UP-Maths ANOVA Statistiques
Introduction et objectif Présentation des données et notations Estimation des paramètres Variabilité et significativité Application R

14

Application R
On cherche à étudier l’effet du type du sol sur la qualité des arbres. On plante des
arbres dans 3 forêts, et on compare la hauteur des arbres. Les données sont
présentées dans le tableau suivant

Forêt 1 23.3 24.4 24.6 24.9 25 26.2


Forêt 2 18.9 21.1 21.1 22.1 22.5 23.5
Forêt 3 22.5 22.9 23.7 24 24 24.5

1 Entrer les données dans une variable « Data ».


2 Afficher les effectifs des différents groupes (niveaux du facteur).
3 Donner un résumé des données par groupe.
4 Tester la normalité des données de chaque groupe, interpréter le résultat.
5 Tester l’homogénéité des variances intra-groupes, interpréter le résultat.
6 Tester l’effet du sol sur la qualité des arbres. Interpréter le résultat.

@UP-Maths ANOVA Statistiques

Vous aimerez peut-être aussi