Tests
Tests
Tests
Plan
1 Exemple introductif 1
2 Les erreurs 3
5 Test unilatéral 8
7 Test du khi-deux 12
1. Exemple introductif
Exemple 1
Un journal affirme que le budget "de vie" moyen d'un étudiant est de:
700 € par mois. Vous prenez un échantillon de 100 personnes
et vous trouvez un budget moyen de 750 € avec un écart-type s = 200 €
Questions
è La différence avec l'affirmation du journal est-elle "significative" ?
4
è Est-elle due au "hasard de l'échantillonnage"?
Un test utilise des données pour prendre une décision sur une hypothèse :
accepter ou refuser
Bien évidemment, on ne sait pas si l'hypothèse est vraie ou fausse ; si on le savait, il n'y
aurait pas de problème de décision (il suffirait de l'accepter quand elle est vraie et de la
rejeter quand elle est fausse).
Dans un test, une hypothèse est privilégiée, on l'appelle l'hypothèse nulle et on la note
généralement (H0). Il s'agit en quelque sorte de l'hypothèse par défaut.
Commentaires
Nous pouvons dire qu'il y a 95 chances sur 100 que la moyenne m de la population
dont est extrait cet échantillon, soit à l'intérieur de cet intervallle.
Il y a au plus 5% de chances pour que la moyenne de la population dont cet échantillon
est extrait, soit à l'extérieur de l'intervalle.
On peut aussi dire que cet intervalle constitue :
l'ensemble des hypothèses acceptables avec un seuil de confiance de 95%
Attention cela ne veut pas dire que l'on a 95 chances sur 100 d'avoir raison
en acceptant une telle hypothèse, nous verrons pourquoi plus loin.
Décision
700 est en dehors de l'intervalle. L'hypothèse (H 0) est très peu probable.
Au seuil de signification de 5% nous rejeterons l'hypothèse (H 0).
Un test est un critère statistique permettant de vérifier une hypothèse sur une population
à partir d'un échantillon.
(H0) m = m0
à l'aide d'un échantillon sur lequel on a calculé une valeur m pour la moyenne
Attention : cela veut dire qu'en acceptant l'hypothèse, vous ne pourrez pas donner le risque
d'erreur
Tout ce que l'on peut dire en acceptant l'hypothèse est que la différence
entre m et la valeur de référence m0
3.1 Méthodologie
(H0) µ = 700
(H1) µ <> 700 Il s'agit ici d'un test bilatéral
Attention, lorsque l'on accepte l'hypothèse nulle, par contre, on ne peut pas donner
aussi facilement le risque d'erreur qui est le risque de deuxième espèce, c'est à dire
la probabilité d'accepter à tort l'hypothèse nulle.
- on lit dans la table (ou on cherche avec EXCEL), la probabilité bilatérale correspondant à t
On l'appelle "p-valeur"
p = 0.0141
Exemple 2
Un journal affirme que 35% des Français lisent quotidiennement
un journal.
Sur un échantillon aléatoire de 200 personnes, on trouve 60
personnes dans ce cas. Tester l'exactitude de cette affirmation avec un
seuil de signification de 0.05
d/ Prise de décision
le risque d'erreur.
Exemple 3
Vous devez décider d'adopter ou non un nouveau procédé de fabrication qui doit vous permettre
de réduire vos coûts variables.
Pour des raisons de coûts de mise en œuvre, vous ne l'adopterez que si le coût unitaire
de production devient inférieur à 30 € grâce au nouveau procédé.
Avec un échantillon de 60 pièces, vous trouvez un coût moyen de 29 € par unité (écart-type : 4)
Ce résultat est-il significativement inférieur à l'objectif des 30 € ?
c/ Calcul de tcalc
tcalc = -1.936
m−µ 0
t calc =
s / √n
d/ Prise de décision
s21 s22
m 1 −m 2 ± Z
Dans le cas ou s1 = s2 = s, la formule devient :
√ n1
+
n2
1 1
Mécanique du test
m 1 −m 2 ± Z s
√ +
n1 n 2
Lorsque l'on veut comparer 2 échantillons, en testant la différence entre les 2 moyennes,
il suffit de prendre comme hypothèse nulle:
(H0) : m1-m2 = 0
Ce qui veut dire que si cette hypothèse est vraie, les 2 échantillons proviennent de populations
de moyennes identiques, et que donc la différence observée n'est pas significative, elle est due
au "hasard de l'échantillonnage".
La suite du test est classique, il suffit de calculer l'intervalle de confiance donné plus haut,
et on peut alors rejetter l'hypothèse nulle si 0 n'appartient pas à cet intervalle.
ou alors calculer la p-valeur et conclure.
Si on suppose que s1 = s2 = s,
Ceci à condition que les populations d'origine soient normalement distribuées dans le cas
où les échantillons sont de petite taille.
Dans le cas où les échantillons sont de taille plus importante (>30) , c'est moins important
et en plus on peut remplacer t par son approximation : Z
Exemple 4
Le directeur d'un fast-food hésite entre 2 types de promotions (offre 1 et offre 2)
Il fait distribuer des bons correspondant à ces offres à deux échantillons aléatoires d'étudiants Grenoblois.
Au bout d'une semaine, 14 étudiants ayant eu un bon pour l'offre 1 et 12 étudiants
ayant eu un bon pour l'offre 2 sont venus au restaurant et on dépensé
les sommes suivantes (en francs). On veut savoir s'il existe une différence
significative entre les 2 offres.
Offre 1 Offre 2
27 18 m1 = 29.71 s1 = 13.57
25 22 m2 = 25.92 s2 = 8.67
18 24
7 26 Hypothèses (H0) µ1 = µ2 test bilatéral
48 19 (H1) µ1 <> µ2
39 33
26 34 Calcul p-valeur ###
55 32 (on suppose que les variances des populations sont égales)
29 26
12 42 Décision
23 9 on peut ne peut pas rejeter (H0) au seuil de 5%
28 26 la différence n'est pas significative.
33
46
sD
mD ± t
√n
Ceci dans le cas où l'écart-type de la population est inconnu.
SD est alors l'écart-type de D calculé à partir de l'échantillon.
Exemple 6
C A
27% 24%
B
49%
A B C
48 98 54
"Les proportions (ou fréquences) obtenus sont-ils les mêmes qu'auparavant ?"
La démarche à suivre pour un test du KHI-DEUX est très voisine de la démarche du test
sur une moyenne ou une fréquence.
(Eobs - Eth)²
Khi2c = S ----------- = S ( 2.40 0.04 4.90 ) =
Eth
Exemple 7
La brasserie ZOKIRCH produit 3 types de bières : légère, blonde et brune.
Le service marketing, constamment à l'écoute des consommateurs, réalise une étude.
Dans cette étude, deux des caractères étudiés sont : le sexe et le type de bière préféré
On obtient le tableau de contingence suivant :
"Les pourcentages (ou fréquences) obtenus sont-ils les mêmes pour chaque catégorie ?"
que l'on peut aussi formuler autrement:
et on en fait la somme:
(Eobs - Eth)²
Khi2c S ----------- = 4.91
Eth
28 32 10 22.4 33.6 14
20 40 20 25.6 38.4 16
Le test du khi-deux peut enfin servir à mesurer l'adéquation d'une distribution observée à une
distribution théoriqu
Exemple 8
Xi ni pi Ethi khi2
0 163 0.083 ### ###
1 418 0.206 ### ###
2 500 0.257 ### ###
3 437 0.214 ### ###
4 270 0.133 ### ###
5 128 0.066 ### ###
6 57 0.028 ### ###
7 19 0.010 ### ###
8 8 0.004 ### ###
2000 1 2000 ###
600
500
400
300
200
100
0
0 1 2 3 4 5 6 7 8
Décision :
Khi2c < Khi2l, donc on accepte l'hypothèse d'adéquation
à une loi de Poisson.
La différence n'est pas significative au seuil choisi
Exemple 9
Votre entreprise achète des composants électroniques chez 3 fournisseurs différents
L'avantage est de pouvoir mieux négocier les prix et les délais de livraison mais le risque
risque peut être d'avoir une moins bonne assurance de qualité.
A B C
75 94 90
72 87 86
87 80 92
77 86 75
84 80 79
82 67 94
84 86 95
81 82 85
78 86 86
97 82 92
85 72 92
81 77 85
95 87 87
81 68 86
72 80 92
89 76 85
84 68 93
73 86 89
74 83
86
90
Les hypothèses
(H0) m1 = m2 = m3
(H1) mi <> mj pour au moins un couple (i,j)
RAPPORT DÉTAILLÉ
Nombre
Groupes d'échantillons Somme Moyenne Variance
ANALYSE DE VARIANCE
Valeur
Source des Somme des Moyenne des critique pour
variations carrés Degré de liberté carrés F Probabilité F
Entre
Groupes ### 2 269.081 5.897 0.005 3.165
A l'intérieur
des groupes ### 55 45.631
Total ### 57
Puisque F (5,897) est supérieur au F critique (3,165), nous pouvons rejeter l'hypothèse
(H0) avec un risque d'erreur au plus égal à 5% (on peut même dire 5 pour mille
si l'on considère la probabilité critique.
Les écarts observés entre les échantillons sont extrêmement significatifs.
é de refuser
e racine(p(1-p)/n)
(H0) est vraie
a population est
donc négligé
pothèse (H0),
tre plus performant en
ous permettre
cart-type : 4)
7.34
de l'échantillon)
Exercice 1
Une chaîne de production a pour but de remplir des paquets avec 250g de café.
On dira que le process fonctionne correctement si la moyenne est
de 250g et l'écart-type de 4g.
Exercice 2
Un responsable associatif d'une école de commerce affirme que la consommation
annuelle cumulée d'alcool durant les soirées, est en moyenne de :
35 litres
Exercice 4
On sait que le pourcentage de fumeurs dans la population des jeunes de 18-25 ans
est de 25%
Un échantillon aléatoire de 213 étudiants Sup de Co donne un pourcentage de
27.7%
La différence est-elle significative au seuil de 5%
Exercice 6
Le service de de production doit faire réparer une machine lorsque le nombre
d'articles défecteux dépasse 10% des articles produits.
Le pourcentage d'articles acceptables dans un échantillon de 100 articles est de 85
Déterminer si la machine doit être réparée.
Exercice 8
On veut comparer les CA journaliers de 2 restaurants de la même ville.
Sur 12 jours séléctionnés au hasard sur une période de 6 mois on a les résultats suivants :
Tester l'indépendance des goûts des gens pour les émissions de télé par rapport à leur mode de vie ?
a = 0,05
Exercice 10
Le tableau suivant présente les réactions de 400 électeurs à un projet
de loi, suivant le parti dont ils se sentent le plus proche.
Réaction
Parti favor. indif. opposé total
A 120 20 20 160
B 50 30 60 140
C 50 10 40 100
total 220 60 120 400
A B C D
251.2 263.2 269.7 251.6
245.1 262.9 263.2 248.6
248 265 277.5 249.4
251.1 254.5 267.4 242
260.5 264.3 270.5 246.5
250 257 265.5 251.3
253.9 262.8 270.7 261.8
244.6 264.4 272.9 249
254.6 260.6 275.6 247.1
248.8 255.9 266.5 245.9