Chapitre 1

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 19

Introduction

ÉTUDE D’UN CARACTÈRE QUANTITATIF


ÉTUDE d’UN CARACTÈRE QUALITATIF

Tests d’hypothèses paramétriques : Tests


d’homogénéité : échantillons indépendants

30 septembre 2019

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
ÉTUDE D’UN CARACTÈRE QUANTITATIF
ÉTUDE d’UN CARACTÈRE QUALITATIF

Table of contents

1 Introduction

2 ÉTUDE D’UN CARACTÈRE QUANTITATIF


Comparaison de deux moyennes
Comparaison de deux variances

3 ÉTUDE d’UN CARACTÈRE QUALITATIF


Comparaison de deux proportions

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
ÉTUDE D’UN CARACTÈRE QUANTITATIF
ÉTUDE d’UN CARACTÈRE QUALITATIF

Introduction

Les tests statistiques constituent une approche décisionnelle de


la statistique inférentielle. Il existe de nombreuses applications
qui consistent, par exemple, à comparer deux groupes
d’individus en regard d’un caractère quantitatif particulier ou
encore de comparer les proportions d’apparition d’un caractère
qualitatif de deux populations.
Les variables aléatoires qui sont alors utilisées pour effectuer
des tests d’hypothèses sont la différence des moyennes
d’échantillon, le quotient des variances d’échantillon ou la
différence des proportions d’échantillon.

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

Nous nous proposons de tester si la moyenne de la première


population m1 peut être ou non considérée comme égale à la
moyenne de la deuxième population m2 . Nous allons alors
comparer les deux moyennes d’échantillon x 1 et x 2 . Il est
évident que si x 1 et x 2 diffèrent beaucoup, les deux
échantillons n’appartiennent pas la même population. Mais si
x 1 et x 2 un petit peu diffèrent, il se pose la question de savoir
si l’écart d = x 1 − x 2 peut être attribué aux hasards de
l’échantillonnage. Afin de donner une réponse rigoureuse à
cette question, nous procéderons encore en quatre étapes.

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

étape 1 : formulation des hypothèses

Le premier échantillon dont nous disposons provient d’une


population dont la moyenne est m1 . Le deuxième échantillon
dont nous disposons provient d’une population dont la
moyenne est m2 .
Nous voulons savoir si il s’agit de la même population en ce
qui concerne les moyennes, c’est-à-dire si m1 = m2 .
On va donc tester l’hypothèse H0 contre l’hypothèse H1 :
H 0 : m1 = m2
H1 : m1 6= m2

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

Etape 2 : Distribution de probabilité

On détermine la statistique c.a.d. la différence D = X 1 − X 2


des deux moyennes d’échantillon, on détermine la loi de
probabilité de D sous l’hypothèse H0 .
On suppose que l’on dispose de grands échantillons
(n1 ≥ 30etn2 ≥ 30) et que les deux variances d’échantillon
sont connues.
Donc X1 suit alors une loi normale de moyenne m1 et
l’écart-type √σn11 et X 2 suit alors une loi normale de moyenne
m2 et d’écart-type √σn22 .

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

Etape 2 : Distribution de probabilité

On en déduit, puisque X 1 et X 2 sont indépendantes que


D = X 1 − X 2 suit également une loi normale.
σ2 σ2
Sous H0 E (D) = 0 et V (D) = V (X1 ) + V (X2 ) = n11 + n22 .
Alors Z = r σ2D σ2 converge en loi vers une v.a. de loi N(0, 1).
1 + n2
n1 2

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

étape 3 : Détermination des valeurs critiques : zone


d’acceptation

la zone d’acceptation de H0 au seuil de signification α :


[−z α2 ; z α2 ].

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

étape 4 : Calcul de la valeur critique prise dans


l’échantillon

On calcule la valeur z0 prise par Z dans l’échantillon.


Si la valeur z0 se trouve dans la zone d’acceptation, on dira
que l’écart réduit observé n’est pas significatif au seuil α. Cet
écart est imputable aux fluctuations d’échantillonnage. On
accepte H0 .
Remarque : Si on travaille sur de petits échantillons, si la loi
suivie par la grandeur est une loi normale et si on ignore les
écarts-type des populations, on doit utiliser la loi de Student.

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

Exemple d’application sur R

La société de Monsieur Labrador utilise deux machines,


machine 1 et machine 2, pour remplir automatiquement des
paquets de cacao en poudre.
- On prélève un échantillon de 10 paquets remplis par la
machine 1 et on les pèse. Les résultats, en grammes, sont :
106.70 107.02 107.15 107.22 107.41
106.39 107.47 107.61 107.38 107.22

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

Exemple d’application sur R

- On prélève un échantillon de 9 paquets remplis par la


machine 2 et on les pèse. Les résultats, en grammes, sont :
107.68 106.69 107.24 107.69 106.97
107.52 106.22 107.23 107.32
On suppose que le poids en grammes d’un paquet rempli par
la machine 1 peut être modélisé par une va X1 ∼ N(µ1 , 1.32 )
et celui avec la machine 2 peut être modélisé par une va
X2 ∼ N(µ2 , 0.92 )
Peut-on affirmer, au risque 5%, que les machines sont réglées
de manière différente ?

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

Correction
On va tester l’hypothèse H0 contre l’hypothèse H1 :
H0 : µ1 = µ2 H1 : µ1 6= µ2
library(OneTwoSamples)
x1 = c(106.70, 107.02, 107.15, 107.22, 107.41, 106.39,
107.47, 107.61, 107.38, 107.22)
x2 = c(107.68, 106.69, 107.24, 107.69, 106.97, 107.52,
106.22, 107.23, 107.32)
mean test2(x1, x2, sigma = c(1.3, 0.9))$p value
Cela renvoie :0.974397
Comme p-valeur > 0.05, on ne rejette pas H0 . Les données ne
nous permettent pas d’affirmer que les machines 1 et 2 sont
réglées de manière différente.
Tests d’hypothèses paramétriques : Tests d’homogénéité : écha
Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

Avec les mêmes notations que précédemment on teste :


H0 : σ1 = σ2 contre H1 : σ1 6= σ2
On considère
S12 = n11−1 ni=1 (Xi − X 1 )2 et S22 = n21−1 ni=1 (Xi − X 2 )2
P1 P2
Donc la statistique F :

S12
F =
S22
Sous l’hypothèse H0 la statistique F suit une loi de
Fisher-Snedecor de degrés de liberté n1 − 1 et n2 − 1.
Pour un risque d’erreur α fixé on détermine la zone
d’acceptation :

[F α2 ; F 1−α ]
2

où les quantiles sont déterminées à l’aide de la loi précédente.


Tests d’hypothèses paramétriques : Tests d’homogénéité : écha
Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

Application R

Dans le jeu de données INTIMAMEDIA, on veut savoir si dans


la population des femmes il y a une différence significative de
la variance de la mesure de l’intimarnedia entre les femmes qui
ont une activité sportive et celles qui n’en ont pas.

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
Comparaison de deux moyennes
ÉTUDE D’UN CARACTÈRE QUANTITATIF
Comparaison de deux variances
ÉTUDE d’UN CARACTÈRE QUALITATIF

Correction

> mesure.SPORT.l = mesure[SPORT==1&SEXE==2]


> mesure.SPORT.O = mesure[SPORT==O&SEXE==2]
> var.test(mesure.SPORT.l,mesure.SPORT.O)

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
ÉTUDE D’UN CARACTÈRE QUANTITATIF Comparaison de deux proportions
ÉTUDE d’UN CARACTÈRE QUALITATIF

Il y a de nombreuses applications où nous devons décider si


l’écart observé entre deux proportions échantillonnales est
significatif où s’il est attribuable au hasard de
l’échantillonnage.

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
ÉTUDE D’UN CARACTÈRE QUANTITATIF Comparaison de deux proportions
ÉTUDE d’UN CARACTÈRE QUALITATIF

On veut comparer deux proportions p1 et p2 à partir de deux


échantillons. Le modèle mathématique est le suivant : on
considère les propositions f1 et f2 associés aux deux
échantillons. On veut tester H0 : p1 = p2 contre H0 : p1 6= p2
On prend la statistique :
f1 − f2
Z=q
F (1 − F )( n11 + 1
n2
)

Avec F = n1nf11 +n
+n2
2 f2

Sous l’hypothèse H0 la statistique Z suit une loi normale


centrée réduite. Pour un risque d’erreur α fixé on détermine la
zone d’acceptation :
[−z α2 ; z α2 ]

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha


Introduction
ÉTUDE D’UN CARACTÈRE QUANTITATIF Comparaison de deux proportions
ÉTUDE d’UN CARACTÈRE QUALITATIF

Exemple d’application sur R


Un producteur de desserts lactés au caramel se trouve en
concurrence avec d’autres marques. Au début de l’année 2010,
il décide d’investir dans une nouvelle présentation de ses
desserts. Avant d’avoir le bilan de l’année, il fait une rapide
enquête auprès d’un certain nombre de magasins.
- Avant la nouvelle présentation, sur 230 desserts vendus, 54
étaient ceux du producteur.
- Après la nouvelle présentation, sur 340 desserts vendus, 110
étaient ceux du producteur.
Est-ce que le producteur peut affirmer que la nouvelle
présentation a augmenté sa part de marché sur les desserts
lactés au caramel ?
Tests d’hypothèses paramétriques : Tests d’homogénéité : écha
Introduction
ÉTUDE D’UN CARACTÈRE QUANTITATIF Comparaison de deux proportions
ÉTUDE d’UN CARACTÈRE QUALITATIF

Correction

On va tester l’hypothèse H0 contre l’hypothèse H1 :


H0 : p1 ≥ p2 H1 : p1 < p2

prop.test(x = c(54, 110), n = c(230, 340), alternative =


”less”)$p.value
Cela renvoie :0.01383626
Comme p-valeur < 0.05 on rejette H0 .
Ainsi, le producteur peut affirmer que la nouvelle présentation
a significativement augmenté sa part de marché sur les
desserts lactés au caramel.

Tests d’hypothèses paramétriques : Tests d’homogénéité : écha

Vous aimerez peut-être aussi