Statistiques

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 171

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/353889473

Statistiques - Notes de cours

Presentation · September 2024


DOI: 10.13140/RG.2.2.16639.94882

CITATIONS READS
0 449

1 author:

Jean Bégin
Gouvernement du Québec
65 PUBLICATIONS 926 CITATIONS

SEE PROFILE

All content following this page was uploaded by Jean Bégin on 13 August 2021.

The user has requested enhancement of the downloaded file.


Plan du cours

La statistique descriptive
Introduction et concepts de base

Objectifs et utilité de la statistique


Description de la méthode statistique
L'approche critique en statistique
Outils mathématiques nécessaires

Description et représentation des données

Variables et niveaux de mesure


Données brutes
Rangement des données
Distribution de fréquences
Diagramme en bâtonnets
Histogramme et polygone de fréquences
Distribution de fréquences cumulées

Mesures de synthèse d'une distribution

Survol des mesures de synthèse


Mesures de tendance centrale
La proportion et le total
Mesures de tendance centrale (données groupées)
Moyenne pondérée
Comparaison des mesures de tendance centrale
Mesures de dispersion (données non groupées)
Mesures de dispersion (données groupées)
Comparaison des mesures de dispersion
Mesure de dispersion relative: le coefficient de variation
Mesure de dissymétrie

Mesures de la relation entre deux variables

Concepts de base
Le cas qualitatif: tableau de contingences
Le diagramme de corrélation (dispersion)
La droite de régression
Prédiction à l'aide de la droite de régression
Le coefficient de détermination
Le coefficient de corrélation
Interprétation et limites

L'inférence statistique
Concepts de base de la théorie des probabilités

Définitions et types de probabilités


Règles de calcul des probabilités
Espérance mathématique

file:///C|/B%20-%20Jean/PSY1300/plan.html[2020-04-30 09:31:03]
Plan du cours

Arrangements et combinaisons
Distributions de probabilités
La distribution binômiale
La distribution normale
La règle empirique
Approximation de la binômiale par une normale
La distribution de Poisson

Concepts de la théorie de l'échantillonnage

Population versus échantillon


Importance et avantages de l'échantillonnage
Méthodes de prélèvement d'un échantillon
Distributions d'échantillonnage des moyennes
Théorème limite central
Distributions d'échantillonnage des proportions

Estimation de moyennes et de pourcentages

Terminologie de l'estimation
Estimation par intervalles: concepts de base
Propriétés des estimateurs: absence de biais et efficacité
Estimation de la moyenne μ lorsque σ est connu
La distribution t
Estimation de la moyenne μ lorsque σ est inconnu
Estimation du pourcentage π
Détermination de la taille de l'échantillon

Tests d'hypothèse et prise de décision

Distribution d'échantillonnage et prise de décision


Formulation des hypothèses
Les deux types d'erreur
Étapes d'un test d'hypothèse
Test bilatéral vs test unilatéral
Estimation vs test d'hypothèse
La probabilité des erreurs de type I et de type II
Test d'hypothèse sur une moyenne lorsque σ est connu
Test d'hypothèse sur une moyenne lorsque σ est inconnu
Test d'hypothèse sur un pourcentage
Notions préliminaires
Distribution d'échantillonnage des différences entre deux moyennes
Test d'hypothèse sur deux moyennes lors les σ sont connus
Test d'hypothèse sur deux moyennes lors les σ sont inconnus
Test d'hypothèse sur deux proportions
Différence significative et différence signifiante

Comparaison de plusieurs pourcentages échantillonnaux

Distribution du χ 2
Méthode générale du test de χ 2
Test de comparaison de plusieurs pourcentages

file:///C|/B%20-%20Jean/PSY1300/plan.html[2020-04-30 09:31:03]
Plan du cours

Test d'ajustement analytique

Analyse de régression linéaire

Analyse de régression et de corrélation: rappels


L'erreur type de l'estimation
Test d'hypothèse sur la pente

file:///C|/B%20-%20Jean/PSY1300/plan.html[2020-04-30 09:31:03]
CHAPITRE 1: INTRODUCTION ET CONCEPTS DE BASE

CHAPITRE 1: INTRODUCTION ET CONCEPTS DE BASE

Objectifs et utilité de la statistique


Description de la méthode statistique
L'approche critique en statistique
Outils mathématiques nécessaires

Suite > OBJECTIFS ET UTILITÉ DE LA STATISTIQUE

file:///C|/B%20-%20Jean/PSY1300/C1P0.html[2020-04-30 09:31:04]
OBJECTIFS ET UTILITÉ DE LA STATISTIQUE

OBJECTIFS ET UTILITÉ DE LA STATISTIQUE


OBJECTIFS

Collecte des données


Classement, synthèse et traitement
Présentation et communication de l'information

Population ou échantillon ?
Recensement > description
Échantillon > inférence (estimation et décision)

Tant pour l'étude d'une donnée quantitative


ou les liens entre deux (ou plusieurs) variables

NOTE: les deux objectifs sont aussi importants l'un que l'autre

UTILITÉ

Décrire les variables et les relations qu'elles entretiennent


Exemple: décrire le lien entre les notes en mathématiques
au secondaire et au collégial en utilisant un échantillon représentatif

Estimer la valeur des paramètres et prendre des décisions


(avantages: coûts, situations paradoxales ou risquées)
Exemple: inférer pour la population québécoise

Prévoir et éventuellement expliquer


Exemple: Utiliser (ou non) la note du secondaire
pour prédire la performance au collégial

Suite > DESCRIPTION DE LA MÉTHODE STATISTIQUE

file:///C|/B%20-%20Jean/PSY1300/C1P1.html[2020-04-30 09:31:04]
DESCRIPTION DE LA MÉTHODE STATISTIQUE

DESCRIPTION DE LA
MÉTHODE STATISTIQUE
Identifier le problème (fondamental!)

Rassembler les données pertinentes

Recueillir de nouvelles données

Classer et synthétiser les données

Présenter les données (de façon réfléchie)

Analyser les données

et...

Interpréter correctement les résultats obtenus

Suite > L'APPROCHE CRITIQUE EN STATISTIQUES

file:///C|/B%20-%20Jean/PSY1300/C1P2.html[2020-04-30 09:31:04]
L'APPROCHE CRITIQUE EN STATISTIQUES

L'APPROCHE CRITIQUE EN STATISTIQUES


L'obstacle du biais
95% des dentistes recommandent le dentifrice Tresse...
mais si 94% recommandaient un dentifrice quelconque ?!?

Les «moyennes» trompeuses


Dans une classe de secondaire I de l'école de La Conception (nord de Montréal)
les filles ont, en moyenne, plus d'un enfant (1,2 , i.e. 1 × 12 + 9 × 0)

La dispersion (variance), cette grande oubliée


Sur la route de ville Vide, il passe, en moyenne, un seul véhicule par heure.
Un véhicule a passé il y a 5 minutes, alors traversons...

Les artistes de la persuasion


(pages suivantes)

Post hoc ergo proper hoc (à la suite de cela, donc à cause de cela)
L'espérance de vie a augmenté depuis la découverte du plant de tabac...

Les corrélations fallacieuses


Au Québec, il existe une corrélation entre la vente de crème glacée
et le nombre de morts par noyade, donc..!

Jouer sur les mots


Cette nouvelle marque de beignes contient 20% moins de sucres
et de matières grasses... que si on n'y avait pas fait de trou!

La tendance doit se maintenir


La moyenne d'âge lors de la première relation sexuelle diminue de x mois à toutes
les décennies... dans 200 ans, l'humain naîtra après sa première relation!

La précision excessive
Parmi les 44 étudiants/es d'un cours de statistiques, 2,727% sont nés le 29 février
1967 à 11h38... en fait, il ne s'agit que d'une seule personne

Décrire sans inférer (pour un échantillon)


Exemple: les nombreux sondages d'opinions

Inférer sans décrire (sic!)


Voir les quelques (!) exemples dans la littérature «scientifique»

ÉVITER LES PIÈGES!

Question à se poser

Quelle est la source de l'information ?

Sur quelle preuve se base la source pour appuyer l'information ?

Quelle preuve ou quelle information manque-t-il ?

La conclusion est-elle vraisemblable ?

file:///C|/B%20-%20Jean/PSY1300/C1P3.html[2020-04-30 09:31:04]
L'APPROCHE CRITIQUE EN STATISTIQUES

LES ARTISTES DE LA PERSUASION

Suite > OUTILS MATHÉMATIQUES NÉCESSAIRES

file:///C|/B%20-%20Jean/PSY1300/C1P3.html[2020-04-30 09:31:04]
OUTILS MATHÉMATIQUES NÉCESSAIRES

OUTILS MATHÉMATIQUES NÉCESSAIRES


(de niveau secondaire seulement)

Opérations arithmétiques habituelles: + - × ÷

Les puissances et les racines

Les propriétés élémentaires des nombres: 4 × (2 + 3) = 4 × 2 + 4 × 3

Les variables (et les opérations sur...)

Quelques lettres grecques: μ, σ, α, β

Les simplifications (égalités et inégalités)

Les équations linéaires: y = 4x + 3

La construction de tableaux

Les graphiques dans le plan

La notation pour la sommation:

Suite > CHAPITRE 2: DESCRIPTION ET REPRÉSENTATION DES DONNÉES

file:///C|/B%20-%20Jean/PSY1300/C1P4.html[2020-04-30 09:31:05]
CHAPITRE 2: DESCRIPTION ET REPRÉSENTATION DES DONNÉES

CHAPITRE 2: DESCRIPTION ET REPRÉSENTATION DES DONNÉES

Variables et niveaux de mesure


Données brutes
Rangement des données
Distribution de fréquences
Diagramme en bâtonnets
Histogramme et polygone de fréquences
Distribution de fréquences cumulées

Suite > VARIABLES ET NIVEAUX DE MESURE

file:///C|/B%20-%20Jean/PSY1300/C2P0.html[2020-04-30 09:31:05]
VARIABLES ET NIVEAUX DE MESURE

VARIABLES ET NIVEAUX DE MESURE


VARIABLE (aléatoire)

C'est une règle de mesure qui permet d'apparier


un nombre à un événement simple
(on note habituellement une variable par une lettre majuscule: X, Y,...)

Exemple: apparier à chaque ville du Québec le nombre qui correspond


à sa distance en kilomètres à partir de Montréal

NIVEAUX DE MESURE (placés en hiérarchie: du qualitatif au quantitatif)

° Nominal: les nombres sont fixés de façon arbitraire


Exemple: le numéro de votre programme d'études

° Ordinal: les nombres respectent un certain ordre (rang): x < y < ... < z
Exemple: Les niveaux socio-économiques

° Intervalle: les «grandeurs» entre les nombres sont préservées; x-z = (x-y)+(y-z)
Exemple: la distance indiquée sur l'odomètre

° Rapport: il existe un point 0 ; la division est donc possible


Exemple: la distance à partir de Montréal

VARIABLE DISCRÈTE ET VARIABLE CONTINUE

° Discrète (discontinue): le nombre de valeurs


que peut prendre la variable est limité
Exemple: le nombre d'enfants dans une famille (pas de ½ enfant!)

° Continue: le nombre de valeurs que peut prendre la variable est illimité


(ces valeurs sont cependant notées avec une précision donnée)
Exemple: l'âge

Suite > DONNÉES BRUTES

file:///C|/B%20-%20Jean/PSY1300/C2P1.html[2020-04-30 09:31:05]
DONNÉES BRUTES

DONNÉES BRUTES
Après la cueillette des données, celles-ci apparaissent de façon brute.
Sous cette forme, elles sont peu informatives.
Trouvons donc des moyens pour en extraire un maximum d'informations.

CAS QUALITATIF

Dans un cours de statistiques, on fait un sondage pour savoir ce que chacun des
25 étudiants/es a trouvé le plus intéressant. On utilise la règle suivante
Réponse X

Le chargé de cours 1

Le livre 2

La couleur du plafond 3

Le confort des bureaux 4

Quoi ?!? 5

Les résultats obtenus sont les suivants


3 2 2 4 2
3 4 2 3 2
5 3 3 4 3
4 4 5 4 5
2 5 5 3 1

CAS QUANTITATIF

(page 83, problème 1)


Voici les résultats obtenus par les élèves dans le
cours de comptabilité du professeur Debby Lecompte
68 52 49 56 69
74 41 59 79 81
42 57 60 88 87
47 65 55 68 65
50 78 61 90 85
65 66 72 63 95

Suite > RANGEMENT DES DONNÉES

file:///C|/B%20-%20Jean/PSY1300/C2P2.html[2020-04-30 09:31:06]
RANGEMENT DES DONNÉES

RANGEMENT DES DONNÉES


C'est la méthode la plus simple d'organiser les données. Il s'agit simplement de
replacer ces données selon un ordre ascendant ou descendant.

CAS QUALITATIF

1 2 3 4 5
2 2 3 4 5
2 3 3 4 5
2 3 3 4 5
2 3 4 4 5

CAS QUANTITATIF

95 79 68 61 52
90 78 66 60 50
88 74 65 59 49
87 72 65 57 44
85 69 65 56 42
81 68 63 55 41

PLUSIEURS AVANTAGES

Donne immédiatement une idée de:


La «tendance centrale»: autour de 65
L'étendue: de 41 à 95
Des concentrations particulières de valeurs
En somme, ça donne déjà une image un peu plus précise

CEPENDANT

Cette méthode est peu pratique et manque de synthèse et de rigueur


Surtout si le nombre de valeurs est élevé (imaginez s'il y avait 2000 étudiants/es!)

Suite > DISTRIBUTION DE FRÉQUENCES

file:///C|/B%20-%20Jean/PSY1300/C2P3.html[2020-04-30 09:31:06]
DISTRIBUTION DE FRÉQUENCES

DISTRIBUTION DE FRÉQUENCES
C'est une façon de présenter les données sous une forme synthétique, sans perdre
l'essentiel de l'information. Il s'agit alors simplement de classer (intelligemment)
les données selon une caractéristique observable.

CAS QUALITATIF

Nombre
Valeur d'étudiants/es
Réponse
de X (fréquence)

Le chargé de cours 1 1

Le livre 2 6

La couleur du plafond 3 7

Le confort des bureaux 4 6

Quoi ?!? 5 5

25

CAS QUANTITATIF

Nombre
d'élèves
Résultat
(fréquence)

40 et moins de 50 4

50 et moins de 60 6

60 et moins de 70 10

70 et moins de 80 4

80 et moins de 90 4

90 et moins de 100 2

30

NOTE IMPORTANTE

La distribution de fréquences décrit l'aspect général des données. Cependant, dans


la plupart des cas, cette «compression» des données entraîne une certaine perte
d'information (e.g.: l'étendue exacte), perte compensée par un gain de clarté.

file:///C|/B%20-%20Jean/PSY1300/C2P4.html[2020-04-30 09:31:06]
DISTRIBUTION DE FRÉQUENCES

POUR CONSTRUIRE UNE DISTRIBUTION, IL FAUT DÉTERMINER:

° Le nombre de classes à utiliser

° La largeur de ces classes

° Le nombre d'observations (fréquence) de chaque classe

QUELQUES RÈGLES POUR CONSTRUIRE UNE DISTRIBUTION

(il n'y a pas de règle stricte, mais certaines règles de «gros bon sens»)

Cas qualitatif

S'il n'y a pas trop de catégories: utiliser directement celles-ci (aucune perte)

S'il y a trop de catégories: regrouper celles-ci selon un «méta-critère»

Exemple: langues parlées dans un pays/dans le monde > familles de langues

Cas quantitatif

° Le nombre de classes devrait habituellement se situer entre 5 et 15


Les cas extrêmes ne sont pas informatifs:
seulement une classe ou autant que le nombre d'observations !

° Éviter les chevauchements d'intervalles et les écarts entre les intervalles


Toutes les données doivent pouvoir y être classées sans équivoque
Un intervalle entre deux classes successives
(e.g. 20-29 suivi de 35-45 ans) nuit à la compréhension

° La largeur des classes doit être constante


Et, il est souhaitable d'utiliser des multiples simples (5 ou 100 plutôt que 7 ou 98)
Une formule intéressante pour calculer la largeur des classes (l) est

où G et P sont respectivement les valeurs de la plus grande et de la plus petite


observation et c est le nombre de classes
Dans notre cas: G = 95 et P = 41; choisissons, à l'essai, c = 6, d'où

qu'on «arrondit» à = 10, en partant de 40, pour maximiser la compréhension.


Évidemment, on aurait pu fixer d'abord la longueur des intervalles (l=10), d'où

qu'on «arrondit», par le haut, à c = 6, puisque c doit être un nombre entier

° Éviter l'utilisation des classes ouvertes


I.e., «en bout» de distribution, des classes du type «50 et moins» ou «80 et plus»
En effet, cela crée une perte d'information considérable (l'étendue par exemple)
Cependant, il peut arriver que cela soit inévitable, dans le cas où il y a quelques

file:///C|/B%20-%20Jean/PSY1300/C2P4.html[2020-04-30 09:31:06]
DISTRIBUTION DE FRÉQUENCES

valeurs extrêmement marginales (les cas du prix des maisons en est un exemple)

° S'il existe une concentration de données, la situer près du centre d'une classe
Puisque le centre des classes servira éventuellement au calcul de plusieurs indices

Suite > DIAGRAMME EN BÂTONNETS

file:///C|/B%20-%20Jean/PSY1300/C2P4.html[2020-04-30 09:31:06]
DIAGRAMME EN BÂTONNETS

DIAGRAMME EN BÂTONNETS
Le diagramme en bâtonnets est une représentation graphique de la distribution de
fréquences d'une variable qualitative.

Les «bâtonnets» sont bien séparés pour indiquer les différentes catégories.

La hauteur d'un bâtonnet est proportionnelle


à la fréquence de la catégorie correspondante

D'autres représentations sont également possibles


Par exemple: le camembert

Suite > HISTOGRAMME ET POLYGONE DE FRÉQUENCES

file:///C|/B%20-%20Jean/PSY1300/C2P5.html[2020-04-30 09:31:07]
HISTOGRAMME ET POLYGONE DE FRÉQUENCES

HISTOGRAMME ET POLYGONE DE FRÉQUENCES


Histogramme
L'histogramme est une représentation graphique (en tuyaux d'orgue) de la
distribution de fréquences d'une variable quantitative.
Souvent, les «tuyaux» sont accolés pour montrer la continuité de la variable.
La hauteur du tuyau est proportionnelle à la fréquence de la classe correspondante.

Polygone de fréquences
Le polygone de fréquences est une autre représentation graphique (en ligne brisée)
de la distribution de fréquences d'une variable quantitative.
Pour tracer le polygone, on joint les points milieu du sommet
des rectangles adjacents par un segment de droite.
Le polygone est fermé aux deux bouts en le prolongeant sur l'axe horizontal.

Le choix dépend de ce que l'on veut mettre en évidence


L'histogramme permet une représentation claire
où l'aire des rectangles représente fidèlement la fréquence de chaque classe

Le polygone de fréquences peut être fort utile


lorsqu'il s'agit de comparer plusieurs populations
ou lorsque que le nombre de classes et de sujets est élevé
et qu'un certain «polissage» s'avère pertinent

Exemple: supposons que l'examen de comptabilité du professeur Lecompte soit


administré à tous les comptables du Québec. La représentation graphique des
résultats obtenus ressemblerait probablement à la figure suivante:

Cette distribution, qui reviendra fréquemment dans la suite du cours, s'appelle la


distribution normale

file:///C|/B%20-%20Jean/PSY1300/C2P6.html[2020-04-30 09:31:07]
HISTOGRAMME ET POLYGONE DE FRÉQUENCES

D'autres représentations sont également possibles


Par exemple: le graphique curviligne

Suite > LA DISTRIBUTION DE FRÉQUENCES CUMULÉLES

file:///C|/B%20-%20Jean/PSY1300/C2P6.html[2020-04-30 09:31:07]
LA DISTRIBUTION DE FRÉQUENCES CUMULÉLES

LA DISTRIBUTION DE FRÉQUENCES CUMULÉES


Dans certaines situations, il est plus intéressant de savoir le nombre d'observations
se situant au-dessous ou au-dessus de certaines valeurs, plutôt qu'à l'intérieur d'un
intervalle donné.
Un simple transformation du tableau de fréquences précédent permet de construire
le tableau de fréquences cumulées suivant
Nombre
Résultat d'élèves
(fréquence cumulée)

Moins de 50 4

Moins de 60 10

Moins de 70 20

Moins de 80 24

Moins de 90 28

Moins de 100 30

À cette distribution correspond également une représentation graphique


appelée parfois ogive.
Une telle figure fournit des données descriptives intéressantes telle que la valeur médiane, i.e. le point séparant le
groupe en deux parties égales.

Suite > CHAPITRE 3: MESURES DE SYNTHÈSE D'UNE DISTRIBUTION

file:///C|/B%20-%20Jean/PSY1300/C2P7.html[2020-04-30 09:31:08]
CHAPITRE 3: MESURES DE SYNTHÈSE D'UNE DISTRIBUTION

CHAPITRE 3: MESURES DE SYNTHÈSE D'UNE DISTRIBUTION

Survol des mesures de synthèse


Mesures de tendance centrale
La proportion et le total
Mesures de tendance centrale (données groupées)
Moyenne pondérée
Comparaison des mesures de tendance centrale
Mesures de dispersion (données non groupées)
Mesures de dispersion (données groupées)
Comparaison des mesures de dispersion
Mesure de dispersion relative: le coefficient de variation
Mesure de dissymétrie

Suite > SURVOL DES MESURES DE SYNTHÈSE

file:///C|/B%20-%20Jean/PSY1300/C3P0.html[2020-04-30 09:31:08]
SURVOL DES MESURES DE SYNTHÈSE

SURVOL DES MESURES DE SYNTHÈSE


MESURES DE TENDANCE CENTRALE

° Objectif: résumer en un seul nombre la valeur typique

Moyenne (arithmétique): somme des valeurs divisée par le nombre d'observations

Médiane: valeur pour laquelle 50% des mesures sont au-dessous (ou au-dessus)

Mode: valeur observée la plus fréquente (pas nécessairement unique)

Graphiquement: supposons que la moyenne de la distribution A


est supérieure à la moyenne de la distribution B

Note importante

Deux distributions peuvent avoir exactement la même moyenne,


sans pour autant être identiques.
Elles peuvent différer, par exemple, au plan de l'éparpillement (dispersion) des
valeurs autour de la moyenne.
Exemple: l'âge dans la population ou l'âge des universitaires (?)

MESURES DE DISPERSION

° Objectif: quantifier le taux de dispersion des données autour de la valeur centrale

Étendue: différence entre la valeur la plus grande et la valeur la plus petite

Écart interquartile: différence entre le premier et le troisième quartile

Écart type: mesure de dispersion la plus fréquente (distances au carré)

Graphiquement: Supposons que la distribution A et la distribution B


ont la même moyenne, mais que la distribution B possède
un taux de dispersion plus grand que la distribution A

file:///C|/B%20-%20Jean/PSY1300/C3P1.html[2020-04-30 09:31:08]
SURVOL DES MESURES DE SYNTHÈSE

MESURE DE DISSYMÉTRIE

° Objectif: Il est possible que la distribution des valeurs autour de la valeur


centrale ne soit pas symétrique de part et d'autre.
La mesure de dissymétrie a pour but de quantifier ce &n

Lorsque qu'il y a concentration des données du côté gauche de la distribution,


et une plus longue queue du côté droit, on dit que la distribution est
positivement dissymétrique (voir la distribution A)

Lorsque qu'il y a concentration des données du côté droit de la distribution,


et une plus longue queue du côté gauche, on dit que la distribution est
négativement dissymétrique (voir la distribution B)

MESURE DE L'APLATISSEMENT

Il est possible que des distributions de fréquences aient


la même moyenne, le même taux de dispersion (écart-type) et
qu'elles soient symétriques, sans pour autant être identiques

file:///C|/B%20-%20Jean/PSY1300/C3P1.html[2020-04-30 09:31:08]
SURVOL DES MESURES DE SYNTHÈSE

Théoriquement, il existe une infinité de paramètres


sur lesquels les distributions peuvent différer

Le dernier paramètre qui sera présenté ici est la mesure de l'aplatissement


qui, grosso modo, évalue la concentration des données autour du centre de la
distribution par rapport à leur taux de dispersion

Une courbe mésokurtique est de la forme de la courbe normale (distribution A)

Une courbe leptokurtique est plus pointue et possède des queues plus longues
que la courbe normale (distribution B)

Une courbe platykurtique est plus arrondie et possède des queues plus courtes
que la courbe normale (distribution C)

Suite > MESURES DE TENDANCE CENTRALE

file:///C|/B%20-%20Jean/PSY1300/C3P1.html[2020-04-30 09:31:08]
MESURES DE TENDANCE CENTRALE

MESURES DE TENDANCE CENTRALE


LA MOYENNE ARITHMÉTIQUE

Définition: la moyenne arithmétique d'un ensemble de données est la somme des


valeurs obtenues divisée par le nombre d'observations

La formule générale est


μ (mu) = moyenne (d'une population)
N = nombre d'unités d'observation
(Σ symbolise la somme des X, i.e. des valeurs obtenues)

Exemple

LA MÉDIANE

Définition: La médiane, notée Md, est la valeur qui sépare une série
d'observations ordonnées en ordre croissant ou décroissant, en deux parties
comportant le même nombre d'observations

La formule générale est différente selon que


le nombre d'observations (N) est pair ou impair

Si N est impair,

dans le rangement ascendant (ou descendant)

Exemple: Si on a les données suivantes: 34, 37, 40, 41, 44, 44, 45, alors

Si N est pair
la médiane correspond au point milieu (ou la moyenne) des deux observations
centrales dans le rangement ascendant (ou descendant)
En formule, soit N = 2K, donc K = N/2; alors

Exemple: Pour les notes du professeur Lecompte, il y a N = 30 observations.


Par conséquent, K = 30/2 = 15 et, dans le classement ascendant,
la 15e valeur était 65 et la 16e valeur était aussi 65, d'où

file:///C|/B%20-%20Jean/PSY1300/C3P2.html[2020-04-30 09:31:09]
MESURES DE TENDANCE CENTRALE

LE MODE

Définition: Le mode, noté Mo, est la valeur


la plus fréquente dans une série d'observations

Note: le mode n'est pas nécessairement unique

Exemples

Pour les données suivantes: 5, 6, 6, 7, 8, 8


il y a deux modes, soit 6 et 8

Pour les données du professeur Lecompte,


la note la plus fréquente (3 fois) est 65

Le mode est aussi une mesure intéressante dans le cas qualitatif.


Ainsi, dans l'exemple du cours de statistiques, on avait Md = 3

EXEMPLE

Les nombres ci-dessous représentent le nombre d'enfants


dans chacune de dix familles choisies au hasard
3, 8, 1, 1, 4, 5, 2, 3, 0, 1

Moyenne

Médiane
Rangeons les données en ordre ascendant
0, 1, 1, 1, 2, 3, 3, 4, 5, 8
Comme N = 10 (donc pair), K = 5 et

Mode
On voit immédiatement que Mo = 1

On remarque que les trois mesures sont différentes.

Laquelle est la plus «représentative» ?

Suite > LA PROPORTION ET LE TOTAL

file:///C|/B%20-%20Jean/PSY1300/C3P2.html[2020-04-30 09:31:09]
LA PROPORTION ET LE TOTAL

LA PROPORTION ET LE TOTAL
LA PROPORTION

Définition: quantité (fraction) qui exprime le rapport entre le nombre de mesures


qui partagent une caractéristique quelconque et le nombre total de mesures
(on note π (pi) la proportion dans une population)

La formule est donc

On transforme souvent la proportion en pourcentage en la multipliant par 100

Exemples
Nombre
Valeur d'étudiants/es
Réponse Proportion Pourcentage
de X (fréquence)

Le chargé de cours 1 1 1/25 = 0,04 4%

Le livre 2 6 6/25 = 0,24 24%

La couleur du plafond 3 7 7/25 = 0,28 28%

Le confort des bureaux 4 6 6/25 = 0,24 24%

Quoi ?!? 5 5 5/25 = 0,20 20%

25

De même, dans le cas de l'examen du professeur Lecompte, on peut vouloir


calculer la proportion de réussite, définie par une note 60. Alors

ou 67%

LE TOTAL

Dans certaines situations, le total s'avère être une donnée plus intéressante
(exemple: le total des ventes, plutôt que la moyenne par vendeur)

Le total est tout simplement la somme des valeurs observées, c'est-à-dire

On note que, puisque

file:///C|/B%20-%20Jean/PSY1300/C3P3.html[2020-04-30 09:31:09]
LA PROPORTION ET LE TOTAL

on a

c'est-à-dire qu'on peut obtenir le total en multipliant


la moyenne par le nombre d'observations

Exemples

Nombre mensuel d'accidents à une intersection donnée


2, 1, 0, 3, 4, 6, 1, 2, 3, 0, 1, 5
Le total est: ΣXi = 28

Le poids moyen d'un homme adulte est d'environ 76 kg. Si 10 hommes


embarquent dans un ascenseur, quel est l'estimé du poids total de la charge ?
Le total est: 10 × 76 kg = 760 kg

Suite > MESURES DE TENDANCE CENTRALE (données groupées)

file:///C|/B%20-%20Jean/PSY1300/C3P3.html[2020-04-30 09:31:09]
MESURES DE TENDANCE CENTRALE (données groupépes)

MESURES DE TENDANCE CENTRALE


(données groupées)

Il arrive que les données brutes ne soient plus disponibles


parce que celles-ci ont déjà été regroupées en distribution de fréquences.
Néanmoins, il demeure possible d'approximer les différentes mesures de synthèse
(en travaillant sur le même exemple que précédemment, i.e. les notes de
comptabilité, on pourra évaluer la qualité de l'approximation)

LA MOYENNE

Hypothèse: chaque observation à l'intérieur d'une classe a une valeur égale au


centre de la classe (i.e. les sous- et sur-estimations s'annulent)

La formule est

où f = la fréquence dans la classe


m = (~) le centre de la classe
N = la somme des fréquences (nombre d'observations)

Exemple
Nombre Centre de
d'élèves classes
Résultat
(f) (m) fm

40 et moins de 50 4 45 180

50 et moins de 60 6 55 330

60 et moins de 70 10 65 650

70 et moins de 80 4 75 300

80 et moins de 90 4 85 340

90 et moins de 100 2 95 190

Σ 30 1990

On calcule alors

Ce qui est relativement proche de la «vraie» moyenne, c'est-à-dire μ = 66,23

Notes

On constate ici l'importance de

° éviter les classes ouvertes

file:///C|/B%20-%20Jean/PSY1300/C3P4.html[2020-04-30 09:31:10]
MESURES DE TENDANCE CENTRALE (données groupépes)

puisqu'on ne saurait évaluer le point milieu de ces classes

° situer les concentrations de données au centre des classes


sinon l'hypothèse du «point milieu» serait insatisfaite

° Selon certains auteurs, les points milieu, dans l'exemple précédent,


seraient respectivement 44½ , 54½, 64½, ...
En effet, puisque la variable est discrète, le calcul effectué avec ces valeurs serait
généralement plus précis, quoique, dans ce cas-ci, on obtiendrait μ = 65,83

Voir aussi la «méthode abrégée» décrite par les auteurs


(il s'agit d'une technique de calcul)

LA MÉDIANE

Étapes

1° Localiser la classe médiane, i.e. celle qui contient la médiane


(à partir de la distribution de fréquences cumulées)

2° Déterminer à laquelle des observations de cette classe correspond la médiane

3° Déterminer, par interpolation, la valeur approximative de la médiane


(on suppose une répartition uniforme des données à l'intérieur de la classe)

La formule est


LMd = la limite inférieure de la classe médiane
FC = la fréquence cumulée de toutes les classes précédant la classe médiane
f Md = la fréquence de la classe médiane
l = la largeur de la classe médiane
N = le nombre d'observations

Exemple
La classe médiane est celle qui contient le quinzième élève.
À partir de la distribution de fréquences cumulées, on observe
qu'il s'agit de la classe «60 et moins de 70»; donc

Dans ce cas-ci, l'approximation est «exacte» puisque


la «vraie» médiane est aussi Md = 65

LE MODE

Définition: la classe modale est la classe qui a la plus haute fréquence

Hypothèse: on suppose que le mode appartient à la classe modale

file:///C|/B%20-%20Jean/PSY1300/C3P4.html[2020-04-30 09:31:10]
MESURES DE TENDANCE CENTRALE (données groupépes)

La formule est


LMo = limite inférieure de la classe modale
d1 = différence entre la fréquence de la classe modale et celle de la précédente
d2 = différence entre la fréquence de la classe modale et celle de la suivante
l = largeur de la classe modale

Exemple
La classe modale est «60 et moins de 70»
On calcule donc d1 = 10 - 6 = 4, d2 = 10 - 4 = 6 et

Ce qui est relativement proche du «vrai» mode, c'est-à-dire Mo = 65

LA MOYENNE PONDÉRÉRE

file:///C|/B%20-%20Jean/PSY1300/C3P4.html[2020-04-30 09:31:10]
LA MOYENNE PONDÉRÉRE

LA MOYENNE PONDÉRÉE
Dans certains cas, on calcule la moyenne arithmétique en assignant
un poids ou une importance relative
aux données dont on veut trouver la moyenne

Un exemple très courant est le calcul de la note finale d'un cours


à partir des diverses évaluations, dont le poids relatif peut varier

Exemple

Dans le cours, une personne obtient les notes suivante


Évaluation Note (%) Pondération (%) ×

Premier devoir 85 10 8,5

Deuxième devoir 75 10 7,5

Premier examen 72 40 28,8

Deuxième examen 78 40 31,2

Total 76,0

On a donc fait le calcul suivant

qui donne la note finale

Suite > COMPARAISON DES MESURES DE TENDANCE CENTRALE

file:///C|/B%20-%20Jean/PSY1300/C3P5.html[2020-04-30 09:31:10]
COMPARAISON DES MESURES DE TENDANCE CENTRALE

COMPARAISON DES MESURES


DE TENDANCE CENTRALE
Il n'y a pas de règle générale pour déterminer laquelle des mesures de tendance
centrale est la plus pertinente pour caractériser une distribution

Lorsque la distribution est symétrique, il y a peu de problèmes puisque


la moyenne, la médiane et (généralement) le mode sont égaux

Dans tous les cas, voici les principales


caractéristiques des mesures de tendance centrale
Caractéristique Moyenne Médiane Mode

Compréhensibilité + calcul Familière Facile Facile

Influence des données Toutes les Leur nombre Quelques unes


valeurs seulement
Influence des valeurs extrêmes Forte Non Non

Utilisation avec des distributions Peu repré- Fréquente Oui


fortement dissymétriques sentative

Unicité Oui Oui Non

Calcul avec des classes ouvertes Non Oui Oui

Possibilité d'inférence Oui Rarement Non

Propriétés mathématiques (X-μ) = 0 Peu Minimales


(X-μ) 2 est
minimale

Suite > MESURES DE DISPERSION

file:///C|/B%20-%20Jean/PSY1300/C3P6.html[2020-04-30 09:31:11]
MESURES DE DISPERSION

MESURES DE DISPERSION
Justification (rappel)
° Juger la représentativité de la «tendance centrale» (valeur «typique»)
° Dans certains cas, prendre des mesures de contrôle de la variabilité

ÉTENDUE

Définition: L'étendue est la différence entre


la plus grande valeur et la plus petite valeur

Le formule générale est


G = la valeur la plus grande
P = la valeur la plus petite

Exemple
Dans notre exemple des notes de comptabilité, on a
G = 95 et P = 41
donc
Étendue = 95 - 41 = 54

ÉCART MOYEN

Définition: l'écart moyen, noté EM,


est la moyenne des écarts absolus
entre chaque observation et
la moyenne des observations

Étapes
° Calcul de la moyenne des observations
° Calcul de l'écart absolu entre chaque observation et la moyenne
° Calcul de la moyenne de ces écarts

La formule générale est


X = la valeur des observations
μ = la moyenne des observations
| | = le symbole de la valeur absolue
N = le nombre d'observations

Exemple

Voir le tableau de calcul

Tableau de calcul
X μ | X-μ|

file:///C|/B%20-%20Jean/PSY1300/C3P7.html[2020-04-30 09:31:11]
MESURES DE DISPERSION

68 66,23 1,77

74 66,23 7,77

42 66,23 24,23

47 66,23 19,23

50 66,23 16,23

65 66,23 1,23

52 66,23 14,23

41 66,23 25,23

57 66,23 9,23

65 66,23 1,23

78 66,23 11,77

66 66,23 0,23

49 66,23 17,23

59 66,23 7,23

60 66,23 6,23

55 66,23 11,23

61 66,23 5,23

72 66,23 5,77

56 66,23 10,23

79 66,23 12,77

88 66,23 21,77

68 66,23 1,77

90 66,23 23,77

63 66,23 3,23

69 66,23 2,77

81 66,23 14,77

87 66,23 20,77

65 66,23 1,23

85 66,23 18,77

95 66,23 28,77

file:///C|/B%20-%20Jean/PSY1300/C3P7.html[2020-04-30 09:31:11]
MESURES DE DISPERSION

1987 345,93

On a donc

VARIANCE et ÉCART TYPE

Définitions: la variance, notée σ2 , est la moyenne des carrés des écarts


entre chaque observation et la moyenne des observations.
L'écart type, noté σ, est simplement la racine carrée de la variance.

Étapes
° Calcul de la moyenne arithmétique
° Calcul de la différence entre chaque observation et la moyenne
° Ces écarts sont mis au carré
° Calcul de la moyenne de ces carrés > Variance
° Extraction de la racine carrée de la variance > Écart type

Les formules sont

(ces formules sont bonnes dans le cas d'une population)


Par simples transformations algébriques, on a les formules

qui facilitent le calcul manuel

Exemple
Par le tableau de calcul de la page suivante, on a

ou, par la formule «simplifiée»

Tableau de calcul
X (X - μ) (X - μ) 2 X2

68 1,77 3,12 4624

74 7,77 60,32 5476

42 -24,23 587,25 1764

47 -19,23 369,92 2209

file:///C|/B%20-%20Jean/PSY1300/C3P7.html[2020-04-30 09:31:11]
MESURES DE DISPERSION

50 -16,23 263,52 2500

65 -1,23 1,52 4225

52 -14,23 202,59 2704

41 -25,23 636,72 1681

57 -9,23 85,25 3249

65 -1,23 1,52 4225

78 11,77 138,45 6084

66 -0,23 0,05 4356

49 -17,23 296,99 2401

59 -7,23 52,32 3481

60 -6,23 38,85 3600

55 -11,23 126,19 3025

61 -5,23 27,39 3721

72 5,77 33,25 5184

56 -10,23 104,72 3136

79 12,77 162,99 6241

88 21,77 473,79 7744

68 1,77 3,12 4624

90 23,77 564,85 8100

63 -3,23 10,45 3969

69 2,77 7,65 4761

81 14,77 218,05 6561

87 20,77 431,25 7569

65 -1,23 1,52 4225

85 18,77 352,19 7225

95 28,77 827,52 9025

1987 0,00 6083,37 137689

INTERVALLE SEMI-INTERQUARTILE

Définitions
Le premier quartile, noté Q , est le point qui sépare la portion de 25%

file:///C|/B%20-%20Jean/PSY1300/C3P7.html[2020-04-30 09:31:11]
MESURES DE DISPERSION

1
des valeurs les plus petites de la portion de 75% des valeurs les plus grandes
Le troisième quartile, noté Q3 , est le point qui sépare la portion de 25%
des valeurs les plus grandes de la portion de 75% des valeurs les plus petites
La deuxième quartile correspond tout simplement à la médiane
L'étendue interquartile est la distance entre le premier et le troisième quartile
L'intervalle semi-interquartile (Q) correspond à la moitié de l'étendue interquartile

En formule

Q1 et Q3 sont obtenus par une méthode similaire à celle utilisée pour la médiane
On utilise les données rangées et, au besoin, une méthode d'interpolation

Exemple
Comme il y a 30 observations
Q1 correspond à la «30(25%)e = 7,5e observation»,
i.e. au point milieu entre la 7e observation (55) et la 8e observation (56)

Q3 correspond à la «30(75%)e = 22,5e observation»,


i.e. au point milieu entre la 22e observation (74) et la 23e observation (78)

D'où

Suite > MESURES DE DISPERSION (DONNÉES GROUPÉES)

file:///C|/B%20-%20Jean/PSY1300/C3P7.html[2020-04-30 09:31:11]
MESURES DE DISPERSION (DONNÉES GROUPÉES)

MESURES DE DISPERSION
(DONNÉES GROUPÉES)
Rappel: comme les données sont groupées, il s'agit de faire des approximations

VARIANCE et ÉCART TYPE

La formule générale est

où f = la fréquence de la classe
m = le centre de la classe (valeur hypothétique)
N = le nombre d'observations

Évidemment, on a

et la formule «simplifiée»

(voir aussi la méthode abrégée présentée dans le livre)

Exemple

Nombre Écarts
Centre (m)
Résultat (f) fm m-μ (m-μ) 2 f(m-μ) 2

40 et moins de 50 4 45 180 -21,33 454,97 1819,88

50 et moins de 60 6 55 330 -11,33 128,37 770,22

60 et moins de 70 10 65 650 -1,33 1,77 17,70

70 et moins de 80 4 75 300 8,67 75,17 300,68

80 et moins de 90 4 85 340 18,67 348,57 1394,28

90 et moins de 100 2 95 190 28,67 821,97 1643,94

Σ 30 1990 5946,70

d'où

qu'on peut comparer avec la valeur «exacte» = 14,24

INTERVALLE SEMI-INTERQUARTILE

file:///C|/B%20-%20Jean/PSY1300/C3P8.html[2020-04-30 09:31:12]
MESURES DE DISPERSION (DONNÉES GROUPÉES)

La technique de calcul de Q1 et Q3 est similaire à celle utilisée


pour calculer la médiane lorsque les données sont groupées

Les formules sont

où les symboles s'interprètent comme pour le cas de la médiane


On a encore

Exemple
On sait déjà que Q1 correspond à la «7,5e observation»
et que Q3 correspond à la «22,5e observation»

Fréquence cumulée
Résultat Fréquence

40 et moins de 50 4 4

Q1 > 50 et moins de 60 6 10

60 et moins de 70 10 20

Q3 > 70 et moins de 80 4 24

80 et moins de 90 4 28

90 et moins de 100 2 30

Suite > COMPARAISON DES MESURES DE DISPERSION

file:///C|/B%20-%20Jean/PSY1300/C3P8.html[2020-04-30 09:31:12]
COMPARAISON DES MESURES DE DISPERSION

COMPARAISON DES MESURES DE DISPERSION


Il n'y a pas de règle générale pour déterminer laquelle des mesures de dispersion
est la plus pertinente pour caractériser une distribution

Voici les principales caractéristiques des mesures de dispersion


Étendue Écart moyen Écart type Intervalle
Caractéristique semi-IQ

Compréhen- Facile Facile Plus difficile Facile


sibilité

Calcul Facile Facile Plus difficile Peut être long

Influence des données Deux valeurs Même poids Poids différent Deux valeurs
seulement seulement

Influence des valeurs Forte Plus faible Forte Non


extrêmes

Utilisation avec ± ± Pas vraiment Fréquent


des distribu-
tions fortement
dissymétriques

Calcul avec des Non Non Non Oui


classes
ouvertes

Possibilité d'inférence Non - Oui Non

Propriétés Minimales Oui Beaucoup Minimales


mathématiques

Suite > MESURE DE DISPERSION RELATIVE

file:///C|/B%20-%20Jean/PSY1300/C3P9.html[2020-04-30 09:31:13]
MESURE DE DISPERSION RELATIVE

MESURE DE DISPERSION RELATIVE


Jusqu'ici, les seules mesures de dispersion qui ont été présentées sont des mesures
dites absolues. Considérons maintenant une mesure de dispersion relative.

LE COEFFICIENT DE VARIATION

Objectif: dans certaines situations, on désire comparer le taux de dispersion


de distributions alors que leur échelle de mesure respective ne sont pas comparables.
L'objectif du coefficient de variation est de fournir
un indice quantitatif permettant cette comparaison.

Définition: le coefficient de variation, noté CV, correspond à l'écart type


de la distribution exprimé en pourcentage de la moyenne de la distribution

La formule générale est

Exemple

Pour les données du cours de comptabilité, on a obtenu


μ = 66,23 et σ = 14,24; donc

À titre de comparaison, si la note finale avait été calculée sur 10,


on aurait obtenu μ = 6,623 et σ = 1,424, mais quand même

Suite > MESURE DE DISSYMÉTRIE

file:///C|/B%20-%20Jean/PSY1300/C3P10.html[2020-04-30 09:31:13]
MESURE DE DISSYMÉTRIE

MESURE DE DISSYMÉTRIE
LE COEFFICIENT DE DISSYMÉTRIE

Lorsque la distribution est symétrique, la moyenne et la médiane sont égales

Cependant, lorsqu'elle est dissymétrique, la moyenne se déplace


plus rapidement que la médiane et ce, dans le sens de l'étalement

Par conséquent, on prend, comme mesure de dissymétrie,


la distance entre ces deux mesures de tendance centrale, pondérée par l'écart type

La formule générale du coefficient de dissymétrie (CD) est

Le signe de ce coefficient indique le type de dissymétrie (positive ou négative)


Ce coefficient est nul lorsque la distribution est symétrique

Exemple

On avait μ = 66,23, Md = 65 et σ = 14,24, donc

Suite > CHAPITRE 4: MESURES DE LA RELATION ENTRE DEUX VARIABLES

file:///C|/B%20-%20Jean/PSY1300/C3P11.html[2020-04-30 09:31:13]
CHAPITRE 4: MESURES DE LA RELATION ENTRE DEUX VARIABLES

CHAPITRE 4: MESURES DE LA RELATION ENTRE DEUX VARIABLES

Concepts de base
Le cas qualitatif: tableau de contingences
Le diagramme de corrélation (dispersion)
La droite de régression
Prédiction à l'aide de la droite de régression
Le coefficient de détermination
Le coefficient de corrélation
Interprétation et limites

Suite > CONCEPTS DE BASE

file:///C|/B%20-%20Jean/PSY1300/C4P0.html[2020-04-30 09:31:14]
CONCEPTS DE BASE

CONCEPTS DE BASE
OBJECTIF

Évaluer la relation entre deux variables

DÉFINITIONS

Analyse de régression: méthode pour déduire une équation d'estimation qui décrit
la nature fonctionnelle de la relation entre deux variables
Analyse de corrélation: méthode pour mesurer la force de la relation,
i.e. dans quelle mesure les variations d'une des variables
«expliquent» les variations de l'autre

La variable qui doit être estimée est appelée variable dépendante (notée Y)
La variable qui sert à estimer est appelée variable indépendante (notée X)

Ici, on verra uniquement l'analyse de régression/corrélation linéaire simple, i.e.


linéaire: la relation entre les variables peut être représentée par une droite
simple: il n'y a que deux variables impliquées (1 dépendante et 1 indépendante)

CORRÉLATION ET «CAUSALITÉ»

Il est FONDAMENTAL de noter que la corrélation


n'implique absolument pas la causalité

En fait, la corrélation entre deux variables peut être attribuable à:

° Une relation de cause à effet (X > Y)


Exemple: étrangler le chargé de cours et il va arrêter de parler (?!?)

° Une cause commune


Exemple: le nombre de noyades et la vente de crème glacée au Québec

° Une relation fortuite (fausse corrélation)


Exemple: votre réussite à l'examen et votre signe astrologique

Par conséquent, l'analyse de la relation logique entre les variables


doit précéder toute analyse de régression/corrélation

Suite > LE CAS QUALITATIF: TABLEAU DE CONTINGENCES

file:///C|/B%20-%20Jean/PSY1300/C4P1.html[2020-04-30 09:31:14]
LE CAS QUALITATIF: TABLEAU DE CONTINGENCES

LE CAS QUALITATIF: TABLEAU DE CONTINGENCES


Objectif: mettre en relation deux variables qualitatives

Définition: le tableau de contingences est un tableau de fréquences à double


entrées où on utilise ses lignes et ses colonnes pour présenter le nombre
d'unités d'observation présentant simultanément deux caractéristiques.

Exemple
Dans l'exemple où l'on demandait ce que les étudiants/es d'un cours de statistiques
avaient préféré, supposons que l'on ait aussi demandé si ils/elles appréciaient la
bouffe de la cafétéria. On obtient les résultats suivants
3 Oui 2 Non 2 Non 4 Oui 2 Non
3 Oui 4 Non 2 Non 3 Oui 2 Non
5 Non 3 Oui 3 Oui 4 Oui 3 Oui
4 Non 4 Non 5 Oui 4 Oui 5 Non
2 Oui 5 Non 5 Non 3 Oui 1 Non

Soit X la variable codant 0 pour oui et 1 pour non


et Y la variable de la question des préférences au cours.
On peut alors construire le tableau de contingences suivant
Y 1 2 3 4 5
X (C.C.) (livre) (plafond) (bureau) (quoi!) Total

0 (oui) 0 1 7 3 1 12

1 (non) 1 5 0 3 4 13

Total 1 6 7 6 5 25

Ce tableau permet de soupçonner un certain lien entre l'appréciation de la bouffe


de la cafétéria et ce qui a été apprécié dans le cours de statistiques
Exemple: tous ceux qui apprécient surtout le plafond apprécient également
cette bouffe, mais doit-on penser que ce lien est causal ou fortuit???

Notes
Il existe une multitude de coefficients d'association pour mesurer
la force du lien entre les deux variables du tableau de contingences.
Malheureusement (?), ils ne pourront être vus dans le cadre de ce cours.

Ce type de tableau est parfois utilisé pour les variables quantitatives (groupées)

Suite > LE DIAGRAMME DE CORRÉLATION (dispersion)

file:///C|/B%20-%20Jean/PSY1300/C4P2.html[2020-04-30 09:31:14]
LE DIAGRAMME DE CORRÉLATION (dispersion)

LE DIAGRAMME DE CORRÉLATION (dispersion)


Définition: le diagramme de corrélation est une représentation graphique, dans le
plan, des valeurs ponctuelles obtenues pour deux variables de nature quantitative.
Chaque symbole représente une unité d'observation et sa position dépend des
valeurs obtenues pour les variables X (en abscisse) et Y (en ordonnée)

Ce diagramme aide à déterminer s'il existe une relation entre les deux variables et,
si oui, il aide à choisir le type d'équation qui permettrait de décrire cette relation

Exemple (chapitre 12, problème 2)


On cherche à déterminer si, dans la ville Pompaluile, il existe une relation entre le
nombre de véhicules qui passent devant une station d'essence et le nombre de
litres d'essence vendus (moyennes par jour, sur un an). Voici les résultats:
Emplacement X = Nombre de véhicules Y = Nombre de litres
(centaines) (milliers)

Rue Barbe 3 100

Rue Brique 4 112

Rue Gueuse 5 150

Avenue Anse 7 210

Rue Elle 2 60

Chemin Sire 3 85

Chemin Soeur 2 77

et le diagramme correspondant

La relation entre deux variables quelconques peut être de différents types


C'est ce qu'illustrent les diagrammes suivants

file:///C|/B%20-%20Jean/PSY1300/C4P3.html[2020-04-30 09:31:15]
LE DIAGRAMME DE CORRÉLATION (dispersion)

Suite > LA DROITE DE RÉGRESSION

file:///C|/B%20-%20Jean/PSY1300/C4P3.html[2020-04-30 09:31:15]
LA DROITE DE RÉGRESSION

LA DROITE DE RÉGRESSION
Dans les cas où le diagramme de dispersion montre l'existence d'une relation
linéaire, on désire déterminer la droite qui décrira le «mieux» cette relation

Cependant, le choix de cette droite dépend d'un critère qu'il faudra fixer.
Le critère mathématique habituel est celui des moindres carrés
Selon ce critère, on cherche à minimiser
la somme des carrés des écarts (= variance) entre
les valeurs estimées et les valeurs observées de la variable dépendante

En formule, la droite de régression (comme toute droite) sera donnée par


X = la valeur de la variable indépendante
Yc = la valeur estimée (calculée) de la variable dépendante
a = l'ordonnée à l'origine, i.e. la valeur de Yc lorsque X = 0
b = la pente, i.e. la variation de Yc pour une variation d'une unité de X

Propriétés de la droite de régression


Par définition, la somme

est minimale.
De plus

i.e. que les écarts «positifs» sont compensés par des écarts «négatifs» équivalents

Pour calculer a et b
(attention: on prend ici la notation «pour échantillon»)

où n = le nombre de paires de valeurs observées

où = la moyenne de la variable X et = la moyenne de la variable Y


Emplacement X Y XY X2 Y2

file:///C|/B%20-%20Jean/PSY1300/C4P4.html[2020-04-30 09:31:15]
LA DROITE DE RÉGRESSION

Rue Barbe 3 100 300 9 10 000

Rue Brique 4 112 448 16 12 544

Rue Gueuse 5 150 750 25 22 500

Avenue Anse 7 210 1 470 49 44 100

Rue Elle 2 60 120 4 3 600

Chemin Sire 3 85 255 9 7 225

Chemin Soeur 2 77 154 4 5 929

26 794 3 497 116 105 898

Suite > PRÉDICTION À L'AIDE DE LA DROITE DE RÉGRESSION

file:///C|/B%20-%20Jean/PSY1300/C4P4.html[2020-04-30 09:31:15]
PRÉDICTION À L'AIDE DE LA DROITE DE RÉGRESSION

PRÉDICTION À L'AIDE DE LA DROITE DE RÉGRESSION


On utilise la droite de régression pour estimer la valeur de la variable dépendante
sachant une valeur (réelle ou potentielle) de la variable indépendante

Pour faire la prédiction, il s'agit simplement de substituer la valeur donnée à X


dans l'équation de régression et de calculer la valeur de Yc

Exemple
La droite obtenue par les calculs précédents est

Supposons que, lors d'un détournement de circulation, on a une augmentation du


trafic sur la Rue Gueuse; on évalue qu'il passe désormais 8 (cent) voitures.
On estime alors le nombre de litres (milliers) vendus en posant X = 8:

De même, supposons que l'on désire ouvrir une nouvelle station sur une petite rue
où il ne passe que cent voitures, donc on pose X = 1 et on calcule

Graphiquement, on a

Suite > LE COEFFICIENT DE DÉTERMINATION

file:///C|/B%20-%20Jean/PSY1300/C4P5.html[2020-04-30 09:31:16]
LE COEFFICIENT DE DÉTERMINATION

LE COEFFICIENT DE DÉTERMINATION
Objectif
Évaluer le degré d'association entre les deux variables
i.e. juger de la qualité de l'ajustement des points par la droite de régression

Définitions
Soit
= la moyenne des valeurs de la variable dépendante
et Y* = une donnée en particulier
alors
Y* - = l'écart total
Yc - = l'écart expliqué
Y* - Yc = l'écart inexpliqué

Et pour toute Y*

En additionnant tous les écarts ainsi obtenus,


on a (suite à quelques manipulations)

Définition: le coefficient de détermination, noté ρ2 (population) ou r 2 (échantillon)


est une mesure de la proportion de la variation de la variable Y
qui s'«explique» par les variations de la variable X

En formule

Exemple
X Y Y 2 2

file:///C|/B%20-%20Jean/PSY1300/C4P6.html[2020-04-30 09:31:16]
LE COEFFICIENT DE DÉTERMINATION

c (Yc- ) (Yc- ) (Y- ) (Y- )

3 100 93,29 -20,14 405,62 -13,43 180,36

4 112 121,49 8,06 64,96 -1,43 2,04

5 150 149,69 36,26 1 314,79 36,57 1 337,36

7 210 206,09 92,66 8 585,88 96,57 9 325,76

2 60 65,09 -48,34 2 336,76 -53,43 2 854,76

3 85 93,29 -20,14 405,62 -28,43 808,26

2 77 65,09 -48,34 2 336,76 -36,43 1 327,14

26 794 794,03 0 15 450,39 0 15 835,68

D'où

On peut aussi utiliser la formule «simplifiée»

Suite > LE COEFFICIENT DE CORRÉLATION

file:///C|/B%20-%20Jean/PSY1300/C4P6.html[2020-04-30 09:31:16]
LE COEFFICIENT DE CORRÉLATION

LE COEFFICIENT DE CORRÉLATION
Définition: le coefficient de corrélation (de Pearson), noté ρ ou r, est tout
simplement la racine carré du coefficient de détermination;
son signe (±) donne le sens de la relation

En formule

On peut calculer

en décidant du signe selon le signe de la pente (b)

On peut aussi utiliser directement la formule

ou sa forme «simplifiée»

Exemple
En appliquant la dernière formule

et on a bien

Note
Plus la valeur de r se rapproche de ±1, plus la relation linéaire est forte,
et plus la valeur de r est voisine de 0, plus la relation linéaire est faible

Suite > INTERPRÉTATION ET LIMITES

file:///C|/B%20-%20Jean/PSY1300/C4P7.html[2020-04-30 09:31:17]
INTERPRÉTATION ET LIMITES

INTERPRÉTATION ET LIMITES
Ne pas oublier que le coefficient de détermination donne un pourcentage
de variation (ou variance) de la variable dépendante «expliquée»
par la présence de la variable indépendante.

Cette notion de «pourcentage de variance expliquée» est fondamentale...


et reviendra dans nombre d'analyses subséquentes
malheureusement, en pratique, beaucoup de gens l'oublient

ERREURS FRÉQUENTES

° Utiliser, à tort, l'analyse de corrélation pour établir une relation de cause à effet

° Interpréter le coefficient de corrélation comme un pourcentage

° Mal interpréter le coefficient de détermination, i.e. comme un «% de cause»

° Faire des estimations, via la droite de régression, au-delà des valeurs observées

° Ne pas respecter le postulat d'indépendance des observations

etc...

Suite > CHAPITRE 5: CONCEPTS DE BASE DE LA THÉORIE DES PROBABILITÉS

file:///C|/B%20-%20Jean/PSY1300/C4P8.html[2020-04-30 09:31:17]
CHAPITRE 5: CONCEPTS DE BASE DE LA THÉORIE DES PROBABILITÉS

CHAPITRE 5: CONCEPTS DE BASE DE LA THÉORIE DES PROBABILITÉS

Définitions et types de probabilités


Règles de calcul des probabilités
Espérance mathématique
Arrangements et combinaisons
Distributions de probabilités
La distribution binômiale
La distribution normale
La règle empirique
Approximation de la binômiale par une normale
La distribution de Poisson

Suite > DÉFINITIONS ET TYPES DE PROBABILITÉS

file:///C|/B%20-%20Jean/PSY1300/C5P0.html[2020-04-30 09:31:17]
DÉFINITIONS

DÉFINITIONS
L'espace échantillonnal est l'ensemble de tous les résultats
«potentiellement possibles» d'une expérience

Un événement simple est un élément de l'espace échantillonnal


Un événement composé est un ensemble formé
d'un ou de plusieurs événements simples

La probabilité d'un événement, notée P(«événement») est une mesure


des chances (en proportion) de réalisation de l'événement
Toute probabilité est un nombre situé entre 0 et 1

Un événement impossible a une probabilité de 0


Un événement certain a une probabilité de 1

Exemple

Prenons un jeu de cartes «normal»


composé de 54 cartes et duquel on retire les 2 «jokers»

L'espace échantillonnal est l'ensemble formé par chacune de cartes, i.e.


{ A♥, 2♥, 3♥, ..., V♠, D♠, R♠, «joker noir», «joker coloré»}

Tirer un 2♠ est un événement simple


Sa probabilité est : 1/52 = 0,0192

Tirer un ♥ est un événement composé


Sa probabilité est : 13/52 = 0,25

Tirer une carte quelconque est un événement certain

Tirer un joker est un événement impossible

Note importante: la probabilité de 1/52 de tirer un 2♠ ne signifie pas que,


en 52 tirages (avec remise), on obtiendra une et une seule fois cette carte.
Cette probabilité signifie plutôt que si on tire des cartes un très grand nombre
de fois, la proportion de tirage du 2♠ s'approchera de 1/52

Lorsqu'on tire une carte du jeu,


on peut soit la remettre ensuite dans le paquet, soit l'éliminer;
dans le premier cas, on parle de tirage avec remise,
dans le second cas, on parle de tirage sans remise.

Soit P(A) = la probabilité que l'événement A se produise


Soit P(B) = la probabilité que l'événement B se produise

On définit la probabilité conditionnelle de B étant donné A, notée P(B | A),


comme la probabilité que l'événement B se produise
étant donné que l'événement A s'est produit

Deux événements sont dits mutuellement exclusifs si la réalisation de l'un


empêche la réalisation de l'autre: P(B) ≠ 0 et P(B | A) = 0
dans le cas contraire, ces événements sont dits

file:///C|/B%20-%20Jean/PSY1300/C5P1.html[2020-04-30 09:31:18]
DÉFINITIONS

non mutuellement exclusifs: P(B) ≠ 0 et P(B | A) ≠ 0

Deux événements sont dits indépendants si la réalisation ou la non-réalisation de l'un


ne modifie en rien la probabilité de réalisation de l'autre: P(B | A) = P(B)
dans le cas contraire, ces événements sont dits dépendants

Exemples

En tirant une carte au hasard, il est impossible d'obtenir à la fois


un ♥ et un ♠, par conséquent, ces événements sont mutuellement exclusifs.
Cependant, il est possible d'obtenir simultanément un 2 et un ♠ en tirant le 2♠,
par conséquent, ces événements ne sont pas mutuellement exclusifs.

Dans un tirage sans remise,


la probabilité de tirer un ♥ après avoir tiré les quatre as est
P(♥ | A♥A♦A♣A♠) = 12/48 = 0,25 = P(♥)
par conséquent, ces événements sont indépendants.
Par contre, la probabilité de tirer un ♥ après avoir tiré quatre ♠ est
P(♥ | ♠♠♠♠) = 13/48 = 0,2708 ≠ P(♥)
par conséquent, ces événements sont dépendants.

TYPES DE PROBABILITÉS

Une probabilité a priori (ou théorique)


est une probabilité déterminée à l'avance, sans effectuer aucune expérience
Exemple: la probabilité qu'une pièce de monnaie
bien équilibrée tombe sur pile est 1/2

La probabilité empirique
d'un événement est déterminée à l'aide de l'observation et de l'expérimentation.
La probabilité d'un événement correspond à la fréquence relative
(i.e. la proportion) d'occurrence de l'événement
lorsque l'expérience est répétée un très grand nombre de fois.
Exemple: un professeur de statistiques a enseigné à 12848 personnes et, parmi
celles-ci, 542 ont échoué; la probabilité d'échouer dans un cours donné par ce
professeur est alors de 542/12848 = 0,0422

La probabilité subjective
intervient lorsqu'il est impossible d'établir la probabilité a priori ou de façon
empirique. On doit alors s'en remettre à notre bon (??) jugement...
Exemple: évaluer à 0,01 la probabilité qu'il neige demain

Suite > RÈGLES DE CALCUL DES PROBABILITÉS

file:///C|/B%20-%20Jean/PSY1300/C5P1.html[2020-04-30 09:31:18]
RÈGLES DE CALCUL DES PROBABILITÉS

RÈGLES DE CALCUL DES PROBABILITÉS


Règle du complément ( = NON )

P(non A) = 1 - P(A)
Exemple: lors d'un tirage, la probabilité de ne pas obtenir un ♠ et
P(non ♠) = 1 - P(♠) = 1 - 1/4 = 3/4 = 0,75

Règles de l'addition ( = OU )

Événements mutuellement exclusifs


P(A ou B) = P(A) + P(B)
Exemple: lors d'un tirage, la probabilité d'obtenir un ♥ ou un ♠ est
P(♥ ou ♠) = P(♥) + P(♠) = 1/4 + 1/4 = 1/2 = 0,5

Événements non mutuellement exclusifs


P(A ou B) = P(A) + P(B) - P(A et B)
Exemple: lors d'un tirage, la probabilité d'obtenir un 2 ou un ♠ est
P(2 ou ♠) = P(2) + P(♠) - P(2♠) = 4/52 + 13/52 - 1/52 = 16/52 = 0,3077
(i.e. il faut soustraire le 2♠ qui est compté deux fois)

Note: si les événements sont mutuellement exclusifs, P(A et B) = 0


i.e. que la dernière formule est générale

Règles de la multiplication ( = ET )

Événements indépendants
P(A et B) = P(A) × P(B)
Exemple: en tirant séquentiellement, et avec remise, deux cartes du jeu,
la probabilité d'obtenir 2 cartes ♠ est
P(♠ et ♠) = P(♠) × P(♠) = 13/52 × 13/52 = 1/16 = 0,0625

Événements dépendants
P(A et B) = P(A) × P(B | A)
Exemple: en tirant simultanément (ou sans remise), deux cartes du jeu,
la probabilité d'obtenir 2 cartes ♠ est alors
P(♠ en 1e et ♠ en 2e) = P(♠ en 1e) × P(♠ en 2e | ♠ en 1e)
= 13/52 × 12/51 = 0,0588
Cette formule donne, par simple transformation,
une formule pour la probabilité conditionnelle

Addenda

Parmi les 50 étudiants/es du programme de maîtrise (M) en


«Machintrucologie appliquée», 25 suivent un cours de statistiques (S),
15 étudient le ballon-balai (B) et 10 suivent les deux cours.

On a donc la situation suivante:

file:///C|/B%20-%20Jean/PSY1300/C5P2.html[2020-04-30 09:31:18]
RÈGLES DE CALCUL DES PROBABILITÉS

Quelle est la probabilité que cette personne suive au moins un des deux cours?
P(A ou B) = P(A) + P(B) - P(A et B) = 25/50 + 15/50 - 10/50 = 30/50 = 0,6

Quelle est la probabilité que cette personne suive un seul de ces deux cours?
P(A ou B) - P(A et B) = 30/50 - 10/50 = 20/50 = 2/5 = 0,4

Quelle est la probabilité que cette personne ne suive pas le cours de statistiques?
P(non A) = 1 - P(A) = 1 - 25/50 = 25/50 = 1/2 = 0,5

Quelle est la probabilité que cette personne suive le cours de ballon-balai


sachant qu'elle suit le cours de statistiques?

P(B | S) = P(S et B)/P(S) = (10/50)/(25/50) = 10/25 = 2/5 = 0,4

Suite > ESPÉRANCE MATHÉMATIQUE

file:///C|/B%20-%20Jean/PSY1300/C5P2.html[2020-04-30 09:31:18]
ESPÉRANCE MATHÉMATIQUE

ESPÉRANCE MATHÉMATIQUE
On sait qu'à chaque événement de l'espace échantillonnal est associé
une probabilité; supposons qu'on lui associe également une «valeur»
(donnée par la variable aléatoire)
La question est alors de savoir quelle «valeur», à long terme, peut-on obtenir.

La valeur espérée, appelée espérance mathématique,


est alors la moyenne pondérée, par la probabilité,
de toutes les valeurs des événements de l'espace échantillonnal

Pour la calculer, on fait


le produit de la valeur de chaque résultat possible par sa probabilité d'apparition
et on fait la somme de tous les produits ainsi obtenus

En formule


E(X) = l'espérance mathématique de la variable X
x = toute valeur que peut prendre la variable X
P(x) = la probabilité d de la valeur x

Exemple
On suppose le jeu suivant:
en tirant un carte d'un jeu de 52 cartes, on donne 1$ si vous tirer un ♥, 2$ si
vous tirer un ♦, 5$ si vous tirer un ♣ et 10$ si vous tirer un ♠
On a alors le tableau de calcul suivant
Valeur Probabilité
Événement x P(x) x P(x)

♥ 1 1/4 0,25

♦ 2 1/4 0,50

♣ 5 1/4 1,25

♠ 10 1/4 2,50

1 4,50

Par conséquent E(x) = Σx P(x) = 4,50


i.e. que le «gain attendu» (ou moyen) est de $4,50
À ce jeu, on serait, à long terme,
gagnant de gager 4$, mais perdant de gager 5$

Suite > ARRANGEMENTS ET COMBINAISONS

file:///C|/B%20-%20Jean/PSY1300/C5P3.html[2020-04-30 09:31:18]
ARRANGEMENTS ET COMBINAISONS

ARRANGEMENTS ET COMBINAISONS
NOTATION (factoriel)

n! = n(n-1)(n-2)...(2)(1)
Exemple: 6! = 6 × 5 × 4 × 3 × 2 × 1 = 720
Par définition: 0! = 1

ARRANGEMENTS

(dans le livre [traduit] : permutations)


Définition: un arrangement de r objets parmi n objets différents est un
sous-ensemble ordonné de r objets choisis parmi les n objets
Pour dénombrer le nombre d'arrangements, on a la formule

Exemple: Pour le jeu de cartes, les sous-ensembles


{A♠,2♠,3♠,4♠,5♠} {2♠,A♠,3♠,4♠,5♠} {7♥,D♦,7♣,7♦,V♥}
sont des arrangements distincts de 5 cartes choisies parmi 52.
En utilisant la formule, on peut calculer qu'il existe

arrangements différents de ce type

COMBINAISONS

Définition: une combinaison de r objets parmi n objets différents est un


sous-ensemble non-ordonné de r objets choisis parmi les n objets
Pour dénombrer le nombre de combinaisons, on considère le nombre
d'arrangements que l'on divise par le nombre de «répétitions»; on a la formule

Exemple: Pour le jeu de cartes, les sous-ensembles


{A♠,2♠,3♠,4♠,5♠} et {2♠,A♠,3♠,4♠,5♠}
forment la même combinaison
En utilisant la formule, on peut calculer qu'il existe

combinaisons différentes de ce type

Suite > DISTRIBUTIONS DE PROBABILITÉS

file:///C|/B%20-%20Jean/PSY1300/C5P4.html[2020-04-30 09:31:19]
DISTRIBUTIONS DE PROBABILITÉS

DISTRIBUTIONS DE PROBABILITÉS
Définition: une distribution de probabilités est une énumération de tous
les résultats possibles d'une expérience avec leur probabilité respective

Exemple

Reprenons le jeu où un certain montant est donné pour chaque sorte de carte tirée
On tire simultanément deux cartes et soit X la somme totale du gain.
On a le tableau suivant
Événement Résultats (x) Calcul Probabilité

♥♥ 2 13/52 × 12/51 3/51

♥♦ ou ♦♥ 3 2(13/52 × 13/51) 13/102

♦♦ 4 13/52 × 12/51 3/51

♥♣ ou ♣♥ 6 2(13/52 × 13/51) 13/102

♦♣ ou ♣♦ 7 2(13/52 × 13/51) 13/102

♣♣ 10 13/52 × 12/51 3/51

♥♠ ou ♠♥ 11 2(13/52 × 13/51) 13/102

♦♠ ou ♠♦ 12 2(13/52 × 13/51) 13/102

♣♠ ou ♠♣ 15 2(13/52 × 13/51) 13/102

♠♠ 20 13/52 × 12/51 3/51

On remarque que la somme de toutes les probabilités est 1;


ce qui est le cas pour toutes les distributions de probabilités

Plusieurs distributions de probabilités s'avèrent essentielles


pour comprendre les méthodes de l'inférence statistique. On étudiera ici:
la distribution binômiale, la distribution normale et la distribution de Poisson.
Plus tard, on présentera: la distribution t de Student, la distribution F de Fischer
et la distribution du χ 2

LA DISTRIBUTION BINÔMIALE

file:///C|/B%20-%20Jean/PSY1300/C5P5.html[2020-04-30 09:31:19]
LA DISTRIBUTION BINÔMIALE

LA DISTRIBUTION BINÔMIALE
Définition: la distribution binômiale décrit la distribution de probabilités
lorsqu'il n'y a que deux résultats possibles à chaque essai et
que le résultat d'un essai est indépendant du résultat de tout autre essai

Exemples

° Lorsqu'on tire une pièce de monnaie, il n'y a que deux résultats: pile ou face
° Lorsqu'on tire une carte et qu'on regarde si c'est un ♥, il n'y a que deux résultats
possibles: c'est un ♥ ou ce n'est pas un coeur
Lors d'un tirage d'une carte par paquet dans cinq paquets côte à côte,
la distribution de probabilité donnant la probabilité d'obtenir 0, 1, 2, 3, 4 ou 5
cartes de ♥ est une distribution binômiale

Définitions

On appelle les deux résultats possibles: «succès» et «échec»


Le succès est le résultat pour lequel on désire déterminer
la distribution de probabilité, alors que l'échec est l'autre résultat
La probabilité (fixe) de succès en un essai est identifiée par la lettre p
alors que la probabilité d'échec lors du même essai est identifiée par la lettre q
On note que: p + q = 1 -> q = 1 - p

La probabilité d'obtenir r succès en n essais est donnée par

Exemple

Dans l'exemple ci-dessus, quelle est la probabilité


de n'obtenir aucun ♥ (donc r = 0) en tirant 5 cartes (donc n = 5)
La probabilité d'obtenir un ♥ en tirant chaque carte est 13/52 ou 1/4,
donc p = 1/4, q = 3/4 et

De même, on calcule

file:///C|/B%20-%20Jean/PSY1300/C5P6.html[2020-04-30 09:31:20]
LA DISTRIBUTION BINÔMIALE

On obtient donc la distribution de probabilités suivante

Nombre de ♥ Probabilité

0 0,2373

1 0,3955

2 0,2637

3 0,0879

4 0,0146

5 0,0010

D'où
P(2) = 0,2637
P(2 ou 3) = P(2) + P(3) = 0,2637 + 0,0879 = 0,3516
P(plus de 2) = P(3) + P(4) + P(5) = 0,0879 + 0,0146 + 0,0010 = 0,1035

Calcul des mesures de synthèse


Pour toute distribution binômiale, on a

et

Dans l'exemple: n = 5, p = 1/4 et q = 3/4, donc


μ = 5(1/4) = 5/4 = 1,25
σ = 5(1/4)(3/4) = 15/16 = 0,9375
2

Utilisation de la table
Le calcul des probabilités binômiales peut devenir fastidieux
Ainsi, pour les valeurs fréquentes, on utilise la table de l'annexe I
dont voici un extrait
n r 0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,40 0,50

1 0 0,990 0,950 0,900 0,850 0,800 0,750 0,700 0,600 0,500

1 0,010 0,050 0,100 0,150 0,200 0,250 0,300 0,400 0,500

2 0 0,980 0,902 0,810 0,722 0,640 0,562 0,490 0,360 0,250

file:///C|/B%20-%20Jean/PSY1300/C5P6.html[2020-04-30 09:31:20]
LA DISTRIBUTION BINÔMIALE

1 0,020 0,095 0,180 0,255 0,320 0,375 0,420 0,480 0,500

2 0,000 0,002 0,010 0,022 0,040 0,062 0,090 0,160 0,250

5 0 0,951 0,774 0,590 0,444 0,328 0,237 0,168 0,079 0,031

1 0,048 0,204 0,328 0,392 0,410 0,396 0,360 0,259 0,156

2 0,001 0,021 0,073 0,138 0,205 0,264 0,309 0,346 0,312

3 0,000 0,001 0,008 0,024 0,051 0,088 0,132 0,230 0,312

4 0,000 0,000 0,000 0,002 0,006 0,015 0,028 0,077 0,156

5 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,010 0,031

Pour des valeurs de n, r et p données,


on trouve, dans la table, la probabilité correspondante
Exemple: les valeurs en gris correspondent aux valeurs calculées précédemment

Note: la table s'arrête à p = 0,50. Si p > 0,50, il faut utiliser la propriété


P(r succès en n essais avec une probabilité p)
= P(n-r échecs en n essais avec une probabilité q)
Exemple: P(4 cartes de ♥ en 5 essais) = P(1 carte de ♦,♣,♠ en 5 essais)

Suite > LA DISTRIBUTION NORMALE

file:///C|/B%20-%20Jean/PSY1300/C5P6.html[2020-04-30 09:31:20]
LA DISTRIBUTION NORMALE

LA DISTRIBUTION NORMALE
Définition: une distribution normale correspond à la distribution de probabilités
d'une variable aléatoire continue dont la courbe est parfaitement symétrique,
unimodale et en forme de cloche

Formellement, une distribution normale


de moyenne μ et d'écart type σ est définie par la formule

Graphiquement, si trois distributions normales ne diffèrent que par leur moyenne:

Alors que si elles ne diffèrent que par leur écart type:

Aires sous la courbe et probabilités

Dans le cas des distributions continues, la probabilité


associée à une valeur ponctuelle est toujours nulle.
Les probabilités qui peuvent être évaluées sont celles qui correspondent à des
intervalles entre deux valeurs données.

La probabilité qu'une variable prenne une valeur entre a et b est égale à l'aire
sous la courbe entre les droites verticales élevées aux points a et b

Exemple
Supposons que la distribution des scores de Q.I. soit normale avec une moyenne

file:///C|/B%20-%20Jean/PSY1300/C5P7.html[2020-04-30 09:31:21]
LA DISTRIBUTION NORMALE

μ = 100 et un écart-type σ = 15, alors la probabilité qu'une personne choisie au


hasard ait un Q.I. situé entre 115 et 130 est donnée par l'aire grise de la figure

Pour déterminer l'aire sous la courbe normale pour un intervalle donné,


on utilise une table d'aires (il serait trop long de calculer l'intégrale)
Évidemment, on ne peut construire de table pour chaque courbe normale
(selon μ et σ), mais on peut en construire une pour la
courbe normale centrée réduite, i.e. avec μ = 0 et σ = 1
et rendre comparable, par changement d'échelle,
toute distribution normale à cette distribution de référence

Normalisation

Pour rendre une distribution normale quelconque comparable à la distribution


normale centrée réduite, il faut «normaliser» chacune de ses valeurs,
i.e. calculer la valeur Z correspondante.

Cette valeur Z est définie comme étant la différence entre la valeur considérée et
la moyenne de la distribution, divisée par l'écart type

En formule

Dans l'exemple

file:///C|/B%20-%20Jean/PSY1300/C5P7.html[2020-04-30 09:31:21]
LA DISTRIBUTION NORMALE

i.e., que les valeurs 115 et 130 se situent


respectivement à 1 et 2 écarts types de la moyenne

Utilisation de la table
La table de l'annexe 3 donne l'aire de la courbe normale centrée réduite
pour la zone indiquée en gris dans la figure

Voici un extrait de la table


Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,000 0,004 0,008 0,012 0,016 0,020 0,024 0,028 0,032 0,036

0,1 0,040 0,044 0,048 0,052 0,056 0,060 0,064 0,068 0,071 0,075

0,2 0,079 0,083 0,087 0,091 0,095 0,099 0,103 0,106 0,110 0,114

0,3 0,118 0,122 0,126 0,129 0,133 0,137 0,141 0,144 0,148 0,152

0,4 0,155 0,159 0,163 0,166 0,170 0,174 0,177 0,181 0,184 0,188

0,5 0,192 0,195 0,198 0,202 0,205 0,209 0,212 0,216 0,219 0,222

0,6 0,226 0,229 0,232 0,236 0,239 0,242 0,245 0,249 0,252 0,255

0,7 0,258 0,261 0,264 0,267 0,270 0,273 0,276 0,279 0,282 0,285

0,8 0,288 0,291 0,294 0,297 0,300 0,302 0,305 0,308 0,311 0,313

0,9 0,316 0,319 0,321 0,324 0,326 0,329 0,332 0,334 0,336 0,339

1,0 0,341 0,344 0,346 0,348 0,351 0,353 0,355 0,358 0,360 0,362

... ... ... ... ... ... ... ... ... ...

2,0 0,477 0,478 0,478 0,479 0,479 0,480 0,480 0,481 0,481 0,482

... ... ... ... ... ... ... ... ... ...

3,0 0,499 0,499 0,499 0,499 0,499 0,499 0,499 0,499 0,499 0,499

La première colonne donne les valeurs de Z à une décimale et la première ligne

file:///C|/B%20-%20Jean/PSY1300/C5P7.html[2020-04-30 09:31:21]
LA DISTRIBUTION NORMALE

indique la seconde décimale. Les nombres inscrits aux intersections donnent l'aire
sous la courbe entre le point Z donné et 0.

Exemples
Pour Z = 0,61 on a 0,2291; pour Z = 1 on a 0,3413 et pour Z = 2 on a 0,4772

Note: Puisque la courbe est symétrique, ce qui est vrai


pour la moitié droite de la courbe l'est aussi pour la moitié gauche.
Par conséquent, pour Z = -1 on a 0,3413, etc.

Calcul des probabilités de la distribution normale

Notes importantes

° La valeur de Z doit toujours s'interpréter comme le nombre d'écarts types à


partir de la moyenne. La longueur de l'intervalle entre Z = 1 et Z = 2 est bien
un écart type, mais il ne détermine pas la même aire que l'intervalle entre la
moyenne et la valeur Z = 1.

° Puisque la courbe normale est une distribution de probabilité, l'aire totale sous la
courbe est égale à 1 et, par symétrie, l'aire sous chaque moitié est égale à 0,5

Méthode de calcul (étapes)

1° Calcul de la valeur de Z pour chaque borne de l'intervalle


2° Recherche dans la table de l'aire qui correspond à chaque valeur de Z
3a° Si les Z sont de signes opposés, on additionne les aires
3b° Si les Z sont de mêmes signes, on soustrait
la plus petite aire de la plus grande

Le résultat ainsi obtenu est la probabilité


qu'une valeur de X choisie au hasard se situe dans l'intervalle donné

Exemples

Quelle est la probabilité qu'une


personne ait un Q.I. entre 100 et 115?

On note que 100 correspond à μ


QI = 115 > Z = (115-100)/15 = 1

P(100 ≤ X ≤ 115)
= P(0 ≤ Z ≤ 1) = 0,3413

Quelle est la probabilité qu'une


personne ait un Q.I. entre 110 et 120?

QI = 110 > Z = (110-100)/15 = 0,67


QI = 120 > Z = (120-100)/15 = 1,33

P(110 ≤ X ≤ 120)
= P(0,67 ≤ Z ≤ 1,33)

file:///C|/B%20-%20Jean/PSY1300/C5P7.html[2020-04-30 09:31:21]
LA DISTRIBUTION NORMALE

= 0,4082 - 0,2486 = 0,1596

Quelle est la probabilité qu'une


personne ait un Q.I. entre 85 et 130?

QI = 85 > Z = (85-100)/15 = -1
QI = 130 > Z = (130-100)/15 = 2

P(85 ≤ X ≤ 130)
= P(-1 ≤ Z ≤ 2)
= 0,3413 + 0,4772 = 0,8185

Quelle est la probabilité qu'une


personne ait un Q.I. de plus de 115?

QI = 115 > Z = (115-100)/15 = 1

P(X ≥ 115) = P(Z ≥ 1)


= 0,5 - P(0 ≤ Z ≤ 1)
= 0,5 - 0,3413 = 0,1587

Quelle est la probabilité qu'une


personne ait un Q.I. de moins de 110?

QI = 110 > Z = (110-100)/15 = 0,67

P(X ≤ 110) = P(Z ≤ 0,67)


= 0,5 + P(0 ≤ Z ≤ 0,67)
= 0,5 + 0,2486 = 0,7486

Trouver une valeur pour une probabilité donnée

Il arrive des cas où, de façon inverse, on veut trouver


la valeur qui correspond à une probabilité donnée

file:///C|/B%20-%20Jean/PSY1300/C5P7.html[2020-04-30 09:31:21]
LA DISTRIBUTION NORMALE

Exemple: Quelle valeur de Q.I. délimite le 5% des scores


les plus élevés de la population?

Méthode

1° Identification du Z correspondant au pourcentage recherché


2° Calcul de la valeur de x correspondante par la formule

Exemple: Dans la table, le point Z identifiant le 5% supérieur


est aussi celui qui détermine une aire (entre 0 et Z) de 0,45
donc, en lisant «à l'envers», on a Z = 1,645 donc

Suite > LA RÈGLE EMPIRIQUE

file:///C|/B%20-%20Jean/PSY1300/C5P7.html[2020-04-30 09:31:21]
LA RÈGLE EMPIRIQUE

LA RÈGLE EMPIRIQUE
Énoncé: si la distribution de probabilités
d'une variable est symétrique et en forme de cloche, alors
environ 68% des valeurs de la population se retrouveront entre μ - σ et μ + σ
environ 95% des valeurs de la population se retrouveront entre μ - 2σ et μ + 2σ
presque 100% des valeurs de la population se retrouveront entre μ - 3σ et μ + 3σ

Exemple
Pour le Q.I. avec μ = 100 et σ = 15,
environ 68% des valeurs de la population se retrouvent entre 85 et 115
environ 95% des valeurs de la population se retrouvent entre 70 et 130
presque 100% des valeurs de la population se retrouvent entre 55 et 145

Suite > APPROXIMATION DE LA BINÔMIALE PAR UNE NORMALE

file:///C|/B%20-%20Jean/PSY1300/C5P8.html[2020-04-30 09:31:21]
APPROXIMATION DE LA BINÔMIALE PAR UNE NORMALE

APPROXIMATION DE LA BINÔMIALE
PAR UNE NORMALE
Lorsque n est grand, le calcul de la binômiale peut être fastidieux.
Cependant, dans ce cas, la distribution binômiale tend vers la distribution normale
Cette dernière peut donc être utilisée
pour faire des approximations de probabilités binômiales

On superpose la courbe normale sur l'histogramme


de la distribution binômiale en utilisant

et on prend les points milieu des valeurs frontières


afin d'obtenir une meilleure approximation

Exemple

Supposons que l'on tire, avec remise, 10 cartes du jeu de cartes


On cherche la probabilité d'obtenir au moins 7 cartes rouges (♥ ou ♦)

Graphiquement

L'évaluation directe par la table de la distribution binômiale donne


P = 0,1172 + 0,0439 + 0,0098 + 0,0010 = 0,1719

Pour faire l'approximation par la normale, on a p = 0,5 et n = 10 d'où

donc
P(X ≥ 7) = P(Z ≥ 0,95) = P(Z ≥ 0) - P(Z ≤ 0,95) = 0,5 - 0,3289 = 0,1711
ce qui est une bonne approximation

En fait, l'approximation est d'autant plus exacte


que n grandit (et que p tend vers ½)

Exemple: soit n = 100 et p = 0,25, alors on a

file:///C|/B%20-%20Jean/PSY1300/C5P9.html[2020-04-30 09:31:22]
APPROXIMATION DE LA BINÔMIALE PAR UNE NORMALE

Suite > LA DISTRIBUTION DE POISSON

file:///C|/B%20-%20Jean/PSY1300/C5P9.html[2020-04-30 09:31:22]
LA DISTRIBUTION DE POISSON

LA DISTRIBUTION DE POISSON
Définition: la distribution de Poisson décrit la distribution de probabilités
du nombre d'occurrences d'un événement par unité de temps ou d'espace
(par contraste avec la binômiale où c'est le nombre d'essais qui est fixé)

Exemple: le nombre d'oiseaux par heure qui se perchent sur votre corde à linge

Conditions
° Le nombre moyen (μ) d'occurrences est constant pour chaque unité
° La probabilité d'observer plus d'une occurrence
dans un petit intervalle est quasi-nulle
°Le nombre d'occurrences pour une unité donnée
est indépendant du nombre d'occurrences dans les autres unités

La distribution de Poisson est déterminée par la valeur de μ


Pour une valeur de x donnée, on évalue la probabilité par la formule


μ = le nombre moyen d'occurrences par unité (de temps ou d'espace)
e = une constante, la base des logarithmes naturels (= 2,718...)

Il existe également des tables (voir l'annexe 2) qui donnent ces probabilités

Exemple
Supposons que le nombre moyen d'oiseaux se perchant sur votre corde est de deux
par heure, la probabilité de ne pas y voir d'oiseau pour une heure donnée est

De même, la probabilité d'y voir exactement 4 oiseaux est

De même:
P(1) = 0,2707, P(2) = 0,2707, P(3) = 0,1804, P(5) = 0,0361, P(6) = 0,0120...

Suite > CHAPITRE 6: CONCEPTS DE LA THÉORIE DE L'ÉCHANTILLONNAGE

file:///C|/B%20-%20Jean/PSY1300/C5P10.html[2020-04-30 09:31:22]
CHAPITRE 6: CONCEPTS DE LA THÉORIE DE L'ÉCHANTILLONNAGE

CHAPITRE 6: CONCEPTS DE LA THÉORIE DE L'ÉCHANTILLONNAGE

Population versus échantillon


Importance et avantages de l'échantillonnage
Méthodes de prélèvement d'un échantillon
Distributions d'échantillonnage des moyennes
Théorème limite central
Distributions d'échantillonnage des proportions

Suite > POPULATION VERSUS ÉCHANTILLON

file:///C|/B%20-%20Jean/PSY1300/C6P0.html[2020-04-30 09:31:23]
POPULATION VERSUS ÉCHANTILLON

POPULATION VERSUS ÉCHANTILLON


DÉFINITIONS

Population: l'ensemble complet des unités qu'on désire étudier


Échantillon: tout sous-ensemble de la population

Paramètre: mesure utilisée pour décrire la population


Statistique (indice...): mesure utilisée pour décrire un échantillon

° Note importante: un même ensemble d'unités d'observation peut être considéré,


selon la question à l'étude, comme un échantillon ou une population.

Exemple: considérons la présente classe.


° Pour la question de l'évaluation de l'enseignement de ce cours particulier,
l'ensemble des personnes inscrites au cours forme une population;
la moyenne des évaluations de chaque étudiant/e est alors un paramètre
° Si, par contre, on s'intéresse au revenu moyen annuel
des étudiants/es de l'Uqam, le présent groupe forme un échantillon;
le revenu moyen des individus de ce groupe est alors un indice statistique

BUT DE L'INFÉRENCE STATISTIQUE

Le but de l'inférence est de généraliser les résultats obtenus


auprès d'un échantillon pour décrire la population.
Plus précisément, les indices statistiques sont utilisés pour estimer les paramètres.

NOTATIONS

Pour distinguer entre les paramètres et les indices statistiques, on recourt


habituellement aux lettres grecques (ou aux lettres majuscules) pour désigner les
paramètres, tandis que les lettres minuscules désignent les indices statistiques
Caractéristique Population Échantillon

Moyenne μ
Écart type σ s

Nombre d'unités N n

Pourcentage π p

Suite > IMPORTANCE ET AVANTAGES DE L'ÉCHANTILLONNAGE

file:///C|/B%20-%20Jean/PSY1300/C6P1.html[2020-04-30 09:31:23]
IMPORTANCE ET AVANTAGES DE L'ÉCHANTILLONNAGE

IMPORTANCE ET AVANTAGES DE L'ÉCHANTILLONNAGE


IMPORTANCE

L'échantillonnage n'est pas spécifique de la méthode statistique


On pratique souvent cette méthode dans la vie de tous les jours

Exemples
Un test est souvent formé d'un échantillon d'items
représentant un ensemble potentiellement infini de questions
On assiste à un premier cours pour voir si ça risque d'être intéressant
On goûte au vin avant de le servir, etc.

Le but de l'échantillonnage est de fournir suffisamment d'informations


pour que des inférences concernant la population puissent être faites.

En fait, dans nombre de cas, il s'avère tout simplement impossible d'étudier toute
la population, parce que ce serait risqué, paradoxal ou trop exigeant.

Lors de l'échantillonnage, on tente de choisir un sous-ensemble


de la population qui représente le plus fidèlement possible
les caractéristiques (à l'étude) de la population

Cependant, il est impossible de choisir un échantillon qui soit parfaitement


représentatif de la population. Il est farfelu de penser que l'indice statistique
obtenu pour un échantillon prenne exactement la même valeur que le paramètre
que l'on désire estimer.
Exemple: la moyenne du revenu des gens de cette classe (peut-être $8409) est
possiblement proche de la valeur moyenne pour tous les étudiants/es de l'Uqam
(peut-être $8552), mais pas nécessairement identique

En somme, il est impossible d'éliminer complètement l'erreur d'échantillonnage


Mais les méthodes de l'inférence statistique
tiennent systématiquement compte de ce type d'erreur.
À noter que la seule façon d'éliminer complètement cette erreur serait d'étudier
l'ensemble de la population.

PRINCIPAUX AVANTAGES

Le coût et la complexité
Il s'avère souvent moins coûteux et moins complexe de prendre un échantillon
Exemple: enquête sur les habitudes télévisuelles des québécois

Le temps
Il faut parfois prendre une décision rapide
Exemple: mise en marché d'un nouveau produit

Précision des résultats échantillonnaux


Les résultats de petits échantillons fournissent
parfois toute l'information nécessaire
Exemple: une prise de sang

Situations paradoxales

file:///C|/B%20-%20Jean/PSY1300/C6P2.html[2020-04-30 09:31:23]
IMPORTANCE ET AVANTAGES DE L'ÉCHANTILLONNAGE

Lorsque la mesure a un impact sur l'unité d'observation,


il peut être paradoxal de tester toutes les unités
Exemple: tester la durée de fonctionnement des ampoules

Population fluctuante
La population peut changer le temps que se déroule l'observation
Exemple: calculer le nombre total de mouches noires au Québec

MÉTHODES DE PRÉLÈVEMENT D'UN ÉCHANTILLON

file:///C|/B%20-%20Jean/PSY1300/C6P2.html[2020-04-30 09:31:23]
MÉTHODES DE PRÉLÈVEMENT D'UN ÉCHANTILLON

MÉTHODES DE PRÉLÈVEMENT
D'UN ÉCHANTILLON
Rappel: un échantillon doit être aussi représentatif que possible de la population

ÉCHANTILLONNAGE SUR LA BASE DU JUGEMENT

Définition: un échantillon formé sur la base du jugement est un échantillon formé


à partir de l'opinion d'une ou de plusieurs personnes suffisamment éclairées pour
identifier les unités qui représentent adéquatement la population.

Exemple: une firme de mise en marché pose l'hypothèse


qu'un centre commercial particulier de Trois-Rivières
donne des résultats représentatifs de la population québécoise

Avantage: constitue un net avantage lorsque


des individus compétents ont une expérience pertinente

Inconvénient: il est difficile d'évaluer objectivement


jusqu'à quel point l'échantillon est représentatif

ÉCHANTILLONNAGE ALÉATOIRE

Définition: un échantillon est dit aléatoire lorsque la probabilité de sélection de


chaque élément de la population est connue et non nulle

Avantage: permet de juger objectivement de la valeur des estimations

Types: aléatoire simple, stratifié et par grappes

Échantillonnage au hasard simple


Définition: l'échantillonnage au hasard simple est une méthode pour laquelle
tous les échantillons possibles (de même taille) ont la même probabilité
d'être choisis et tous les éléments de la population ont
une chance égale de faire partie de l'échantillon
° Pour choisir les unités, on peut utiliser la «technique du chapeau»
ou une table de nombres aléatoires (voir page suivante)

Exemple: dans une classe de 20 personnes,


on désire choisir un échantillon aléatoire simple de 5 individus.
Le nombre de combinaisons possibles est donné par

Par conséquent, chaque combinaison doit avoir une probabilité de 1/15504 d'être
choisie et chaque personne doit avoir une probabilité de 5/20 = 1/4 de se
retrouver dans l'échantillon

Échantillonnage stratifié
Définition: l'échantillonnage stratifié est une méthode qui consiste d'abord à
subdiviser la population en groupes homogènes (strates) pour ensuite extraire un
échantillon aléatoire de chaque strate

file:///C|/B%20-%20Jean/PSY1300/C6P3.html[2020-04-30 09:31:24]
MÉTHODES DE PRÉLÈVEMENT D'UN ÉCHANTILLON

° Cette méthode suppose la connaissance de la structure de la population


° Pour estimer les paramètres, les résultats doivent être pondérés
par l'importance relative de chaque strate dans la population

Exemple: Pour estimer le revenu annuel moyen des étudiants/es à l'Uqam, on


prend un échantillon aléatoire de 10 individus dans chaque programme

Échantillonnage par grappes


Définition: l'échantillonnage par grappes est une méthode
qui consiste à choisir un échantillon aléatoire d'unités
qui sont elles-mêmes des sous-ensembles de la population («grappes»)
° Cette méthode suppose que les unités de chaque grappe sont représentatives
° Elle possède l'avantage d'être souvent plus économique

Exemple: Dans l'exemple du revenu des étudiants de l'Uqam, on choisit également


un échantillon aléatoire de 30 programmes d'études différents

Utilisation de la table de nombres aléatoires

Définition: Une table de nombres aléatoires est une table où chacun des chiffres ou
haque séquence de chiffres a la même chance d'apparaître.

Une table de nombres aléatoires se trouve à l'annexe 4 du livre


En voici un autre exemple:
33 398 99 151 11 851 33 167 82 759 90 258 90 776 54 784

14 987 79 632 53 506 03 555 15 037 47 111 09 578 13 101

80 976 67 577 94 022 31 439 59 609 26 832 84 285 03 116

46 657 70 382 63 743 00 661 96 798 74 197 89 595 56 915

13 879 51 502 47 978 74 805 16 625 34 670 04 093 16 116

00 143 96 272 80 163 95 833 38 538 98 352 19 041 33 618

98 960 83 982 16 270 38 963 62 385 50 173 28 417 31 616

71 448 66 190 90 481 23 805 50 642 26 340 00 205 15 855

Méthode
1° On numérote les unités d'observation de façon
à ce que chaque unité ait un numéro distinct
(on utilisera le nombre de chiffres nécessaires
pour écrire la plus grande valeur possible)
2° En se fermant les yeux, on choisit une case au hasard
et une façon de se déplacer dans la table
3° Pour chaque case parcourue, si le nombre correspond au numéro d'une unité
non encore choisie, on sélectionne cette unité; sinon, on passe à la case suivante
4°On répète l'étape 3 jusqu'à ce que le nombre d'unités désiré soit atteint

Exemple
Supposons que, dans la classe de comptabilité de M. Lecompte, on désire former
un échantillon aléatoire de 5 individus parmi les 30 inscrits.
° On utilise les numéros de la liste de classe; le plus grand nombre étant 30,

file:///C|/B%20-%20Jean/PSY1300/C6P3.html[2020-04-30 09:31:24]
MÉTHODES DE PRÉLÈVEMENT D'UN ÉCHANTILLON

on utilisera les deux premières colonnes de chaque case


° On pointe une case au hasard (en pointillés ci-dessus)
On parcourt la table de gauche à droite, puis de haut en bas
° Le nombre 74 ne correspondant à personne, on passe à la case suivante
° En répétant le processus, on sélectionne successivement (cases en gris)
les individus portant les numéros: 16, 4, 19, 28 et 23

DISTRIBUTIONS D'ÉCHANTILLONNAGE DES MOYENNES

file:///C|/B%20-%20Jean/PSY1300/C6P3.html[2020-04-30 09:31:24]
DISTRIBUTIONS D'ÉCHANTILLONNAGE DES MOYENNES

DISTRIBUTIONS D'ÉCHANTILLONNAGE
DES MOYENNES
Définition: la distribution d'échantillonnage des moyennes consiste en la
distribution des moyennes arithmétiques de tous les échantillons possibles de taille
donnée n pouvant être formés à partir de la population
La variation de ces moyennes est appelée variation d'échantillonnage

Exemple: Dans l'exemple du cours de comptabilité, calculons la moyenne


des notes des cinq personnes choisies pour faire partie de l'échantillon.
En retournant aux données originales, on a
Observation 16 4 19 28 23

Notes 55 47 72 68 65

et on calcule

De même, d'autres échantillons (tous aussi probables) aurait donné les moyennes

En fait, il y a

échantillons possibles de 5 personnes, chacun ayant sa moyenne spécifique


C'est la distribution de toutes ces moyennes que l'on appelle
la distribution d'échantillonnage des moyennes

On remarque que ces moyennes échantillonnales ne sont pas égales entre elles et
varient autour de la moyenne μ = 66,23 de la population
C'est ce que représente la variation d'échantillonnage

À noter que cette variation est d'autant réduite


que le nombre d'unités formant l'échantillon est élevé

Attention, il y a trois types de distributions de probabilités d'impliquées

La distribution de la population

Moyenne = μ

file:///C|/B%20-%20Jean/PSY1300/C6P4.html[2020-04-30 09:31:25]
DISTRIBUTIONS D'ÉCHANTILLONNAGE DES MOYENNES

Écart type = σ

Elle est unique et fixe

Les distributions d'échantillons

Moyenne =
Écart type = s
(ces indices statistiques sont des
estimateurs des paramètres)
Il y autant de distributions qu'il y a
d'échantillons différents possibles
Chaque échantillon a
ses indices particuliers

Les distributions d'échantillonnage


des moyennes (échantillonnales)

Moyenne =
Écart type =

Elle est unique et fixe pour un n donné


L'écart type dépend de la taille de
l'échantillon (n 1 < n2 < n3 )

Moyenne de la distribution d'échantillonnage des moyennes

Propriété: La moyenne de la distribution d'échantillonnage des moyennes


est égale à la moyenne de la distribution de la population, i.e. = μ

Exemple (p. 202, #3)


Une population compte 5 étudiants. Le nombre d'heures passées devant le
téléviseur par chacun d'eux est donné ci-dessous:
Étudiant a b c d e

Heures 7 16 20 12 22

On a donc

file:///C|/B%20-%20Jean/PSY1300/C6P4.html[2020-04-30 09:31:25]
DISTRIBUTIONS D'ÉCHANTILLONNAGE DES MOYENNES

Pour calculer la moyenne de la distribution d'échantillonnage des moyennes, on


doit former tous les échantillons possibles ( 5 C3 ) et calculer la moyenne pour
chacun d'eux. On a donc le tableau de calcul suivant:
Échantillon Données Moyenne ( )

abc 7 16 20 14,33

abd 7 16 12 11,67

abe 7 16 22 15,00

acd 7 20 12 13,00

ace 7 20 22 16,33

ade 7 12 22 13,67

bcd 16 20 12 16,00

bce 16 20 22 19,33

bde 16 12 22 16,67

cde 20 12 22 18,00

154,00

On constate donc que la moyenne des moyennes échantillonnales


est exactement égale à la moyenne de la population
On remarque aussi que ces moyennes échantillonnales
se rapprochent de la moyenne de la population

De même, dans l'exemple du cours de comptabilité, quelqu'un pourrait


s'amuser (??) à calculer la moyenne des des 142 506 échantillons possibles
D'après la propriété énoncée, on sait que la valeur
ainsi obtenue serait égale à la moyenne de la population

Cette propriété est intéressante parce que, en réalité, on ne travaille que sur un
seul échantillon, et la moyenne de celui-ci sert à faire l'approximation de la
moyenne de la population qui, habituellement, est inconnue

À propos de la forme de la distribution

° Lorsque la taille de l'échantillon est suffisamment grande (on dit souvent n>30),
la distribution d'échantillonnage est approximativement une distribution normale,
que la distribution de la population soit normale ou non

° De plus, lorsque la distribution de la population est normale,


la distribution d'échantillonnage est une distribution normale

Par la «règle empirique», on peut donc affirmer qu'il y a 68% des chances que la

file:///C|/B%20-%20Jean/PSY1300/C6P4.html[2020-04-30 09:31:25]
DISTRIBUTIONS D'ÉCHANTILLONNAGE DES MOYENNES

moyenne d'un échantillon aléatoire se situe à moins d'un écart type ( ) de la


moyenne de la population. De même, il y a 95% des chances que cette moyenne
se situe à moins de deux écarts types de la moyenne

Par conséquent, il est important de savoir le taux de dispersion des moyennes


échantillonnales , i.e. de pouvoir calculer

Définition: on appelle l'écart type de la distribution d'échantillonnage


l'erreur type de la moyenne

Exemple
Notons d'abord que

De même, pour calculer l'erreur type, on a le tableau de calcul suivant:


Échantillon Données Moyenne ( ) ( - ) ( - )2

abc 7 16 20 14,33 -1,07 1,14

abd 7 16 12 11,67 -3,73 13,91

abe 7 16 22 15,00 -0,40 0,16

acd 7 20 12 13,00 -2,40 5,76

ace 7 20 22 16,33 0,93 0,86

ade 7 12 22 13,67 -1,73 2,99

bcd 16 20 12 16,00 0,60 0,36

bce 16 20 22 19,33 3,93 15,44

bde 16 12 22 16,67 1,27 1,61

cde 20 12 22 18,00 2,60 6,76

154,00 0,00 48,99

D'où

Cependant, dans le cas du cours de comptabilité,


il est invraisemblable de traiter tous les échantillons possibles

On va donc utiliser le fait que, tout comme il existe une relation entre μ et ,
il existe un lien entre σ et

Le lien est donné par la formule

file:///C|/B%20-%20Jean/PSY1300/C6P4.html[2020-04-30 09:31:25]
DISTRIBUTIONS D'ÉCHANTILLONNAGE DES MOYENNES


σ = l'écart type de la population
N = la taille de la population
n = la taille de l'échantillon
et

est un facteur de correction qui tend vers 1 à mesure que N grandit


Par conséquent, lorsque la population est infinie, on a simplement

Exemple
Dans l'exemple précédent, on calculerait

qui donne la même valeur que précédemment

De plus, on peut maintenant calculer l'erreur type dans le cas


du cours de comptabilité. Par la formule, on a

Par conséquent, si on prend un échantillon au hasard de 5 personnes dans cette


classe, il y a 68% des chances que sa moyenne se situe dans l'intervalle
66,23 ± 5,91, i.e. entre 60,32 et 72,14; il y a aussi 95% des chances qu'elle se
situe dans l'intervalle 66,23 ± 11,82, i.e. entre 54,41 et 78,05

Relation entre n et

En regardant la formule

on observe que l'erreur type est directement liée à l'écart type


Par conséquent, la diminution de ce dernier entraîne la diminution de l'erreur

De plus, il faut remarquer que n, i.e. la taille de l'échantillon, apparaît au


dénominateur. Par conséquent, plus le nombre d'unités d'observation dans
l'échantillon est élevé, plus l'erreur type est petite, i.e. plus les moyennes
échantillonnales seront proches de la moyenne de la population

Cette relation exprime le fait que,

file:///C|/B%20-%20Jean/PSY1300/C6P4.html[2020-04-30 09:31:25]
DISTRIBUTIONS D'ÉCHANTILLONNAGE DES MOYENNES

plus l'échantillon est grand, plus on a d'informations


À la limite, si la taille de l'échantillon était la même que la taille de la population,
i.e. n = N, il n'y aurait aucune erreur et

À l'autre extrême, si on prenait un


échantillon de taille minimale, i.e.
n = 1, le taux d'erreur serait égal à la
dispersion des données dans la
population puisque

C'est cette relation qu'exprimait le graphique ci-contre,


où n1 < n2 < n3

Suite > THÉORÉRME LIMITE CENTRAL

file:///C|/B%20-%20Jean/PSY1300/C6P4.html[2020-04-30 09:31:25]
THÉORÉRME LIMITE CENTRAL

THÉORÈME LIMITE CENTRAL


En résumé, les propriétés de la distribution d'échantillonnage des moyennes
sont décrites sous la forme d'un théorème appelé
théorème limite central
qui énonce les principes suivants

° La moyenne de la distribution d'échantillonnage des moyennes


est égale à la moyenne de la population, i.e.

° L'écart type de la distribution d'échantillonnage des moyennes


est donné par

si la population est infinie et par

si la population est finie

° Si la taille n de l'échantillon est suffisamment grande (disons n ≥ 30), la


distribution d'échantillonnage des moyennes s'approche d'une distribution normale
et ce, quelle que soit la distribution de la population, sauf si elle est normale, car,
dans ce cas, la distribution d'échantillonnage des moyennes est une distribution
normale, quelle que soit la taille de l'échantillon

Suite > DISTRIBUTIONS D'ÉCHANTILLONNAGE DES POURCENTAGES

file:///C|/B%20-%20Jean/PSY1300/C6P5.html[2020-04-30 09:31:25]
DISTRIBUTIONS D'ÉCHANTILLONNAGE DES POURCENTAGES

DISTRIBUTIONS D'ÉCHANTILLONNAGE DES POURCENTAGES


Tout comme il est possible d'utiliser une moyenne échantionnale pour estimer la
moyenne d'une population, on peut utiliser le pourcentage des unités d'un
échantillon qui possèdent une caractéristique pour faire l'approximation de ce
même pourcentage, mais pour toute la population

Définition: la distribution d'échantillonnage des pourcentages


(ou des proportions) consiste en la distribution des pourcentages
(ou des proportions) de tous les échantillons possibles
de taille donnée n pouvant être formés à partir de la population

Le pourcentage échantillonnal est défini comme étant


x = le nombre d'unités de l'échantillon qui possède la caractéristique
n = la taille de l'échantillon

Exemple: Dans l'exemple du cours de comptabilité, calculons


le pourcentage d'échecs (échec = note < 60) pour les cinq personnes
choisies pour faire partie de l'échantillon. Ainsi
Observation 16 4 19 28 23

Échec Oui Oui Non Non Non

et on calcule

De même, d'autres échantillons (il y en a 142 506) de 5 individus choisis dans ce


groupe donneraient des pourcentages échantillonnaux de 0%, 20%, 40%, 60%,
80% ou 100%. C'est la distribution de tous ces pourcentages p que l'on appelle
la distribution d'échantillonnage des pourcentages

On remarque que ces pourcentages échantillonnaux varient


autour de la proportion = 10/30 = 0,33 de la population
C'est ce que représente la variation d'échantillonnage

Moyenne de la distribution d'échantillonnage des pourcentages

Propriété: La moyenne de la distribution d'échantillonnage des pourcentages,


notée μp , de tous les échantillons aléatoires simples de taille n
est égale au pourcentage de la population, i.e. μp = π

Exemple
Supposons qu'un étudiant est inscrits à 5 cours, dont 3 qu'il trouve passionnants
Cours A B C D E

Passionnant Oui Oui Non Oui Non

file:///C|/B%20-%20Jean/PSY1300/C6P6.html[2020-04-30 09:31:26]
DISTRIBUTIONS D'ÉCHANTILLONNAGE DES POURCENTAGES

On a donc

Pour calculer la moyenne de la distribution d'échantillonnage des pourcentages,


on doit former tous les échantillons possibles de trois cours ( 5 C3 ) et calculer
le pourcentage p pour chacun d'eux. On a donc le tableau de calcul suivant:
Échantillon Données Pourcentage p

ABC oui oui non 2/3

ABD oui oui oui 3/3

ABE oui oui non 2/3

ACD oui non oui 2/3

ACE oui non non 1/3

ADE oui oui non 2/3

BCD oui non oui 2/3

BCE oui non non 1/3

BDE oui oui non 2/3

CDE non oui non 1/3

18/3 = 6

Écart type de la distribution d'échantillonnage des pourcentages

Comme dans le cas des moyennes échantillonnales, les pourcentages


échantillonnaux varient autour de la moyenne μp

Définition: on appelle l'écart type de la distribution d'échantillonnage


des pourcentages σp , l'erreur type du pourcentage

Dans le cas d'une population finie, cette erreur type est donnée par


π = le pourcentage de la population possédant la caractéristique
100% - π = le pourcentage de la population ne possédant pas la caractéristique
N = la taille de la population

file:///C|/B%20-%20Jean/PSY1300/C6P6.html[2020-04-30 09:31:26]
DISTRIBUTIONS D'ÉCHANTILLONNAGE DES POURCENTAGES

n = la taille de l'échantillon
Dans le cas d'une population infinie, on a

Exemples
Pour les données de l'exemple précédent, on a

Pour le pourcentage d'échecs dans le cours de comptabilité, on a


μp = π = 1/3 = 33,33%

Théorème limite central


(cas des pourcentages)

° La moyenne de la distribution d'échantillonnage des pourcentages


est égale au pourcentage de la population, i.e.

° L'écart type de la distribution d'échantillonnage des pourcentages


est donné par

si la population est infinie et par

si la population est finie

° Si la taille n de l'échantillon est suffisamment grande (disons n ≥ 30),


la distribution d'échantillonnage des pourcentages s'approche
d'une distribution normale

Dans ce dernier cas, on peut donc appliquer la «règle empirique»

Suite > CHAPITRE 7: ESTIMATION DE MOYENNES ET DE POURCENTAGES

file:///C|/B%20-%20Jean/PSY1300/C6P6.html[2020-04-30 09:31:26]
CHAPITRE 7: ESTIMATION DE MOYENNES ET DE POURCENTAGES

CHAPITRE 7: ESTIMATION DE MOYENNES ET DE POURCENTAGES

Terminologie de l'estimation
Estimation par intervalles: concepts de base
Propriétés des estimateurs: absence de biais et efficacité
Estimation de la moyenne μ lorsque σ est connu
La distribution t
Estimation de la moyenne μ lorsque σ est inconnu
Estimation du pourcentage π
Détermination de la taille de l'échantillon

Suite > TERMINOLOGIE DE L'ESTIMATION

file:///C|/B%20-%20Jean/PSY1300/C7P0.html[2020-04-30 09:31:26]
TERMINOLOGIE DE L'ESTIMATION

TERMINOLOGIE DE L'ESTIMATION
Rappels

La population, c'est l'ensemble complet des unités qu'on désire étudier


Elle est décrite à l'aide de paramètres (μ, σ, π)

Un échantillon, c'est tout sous-ensemble de la population


Il est décrit à l'aide d'indices statistiques ( , s, p)

Définitions

Estimateur: tout indice statistique utilisé pour estimer un paramètre

Estimation: toute valeur particulière de l'indice


statistique est une estimation du paramètre

Exemple
Pour les notes du cours de comptabilité, les 30 personnes du groupe
forment la population, alors que tout sous-groupe de 5 personnes
choisies au hasard forme un échantillon
On désire alors estimer la moyenne du groupe à partir des données
échantillonnales (on suppose, par exemple, que les 5 personnes ont passé l'examen
avant les autres et qu'on veut avoir une idée de la difficulté du test)
La moyenne échantillonnale ( ) est alors
un estimateur de la moyenne de la population (μ)
La valeur 61,4 est une estimation de la moyenne μ

Estimation ponctuelle: estimer le paramètre par une valeur unique


(peu utile parce que cette estimation est peu probable et
qu'elle ne donne aucune évaluation de la précision de l'estimation)
Exemple: estimer que μ vaut 61,4

Estimation par intervalle: estimer le paramètre par un intervalle de valeurs


Exemple: estimer que μ vaut quelque valeur entre 56,4 et 66,4
On obtient un intervalle d'estimation en ajustant l'estimation ponctuelle
afin de tenir compte de l'erreur d'échantillonnage
Évidemment, même cette estimation peut être fausse, mais il est possible d'évaluer
objectivement la probabilité d'erreur d'un intervalle donné

ESTIMATION PAR INTERVALLES: CONCEPTS DE BASE

file:///C|/B%20-%20Jean/PSY1300/C7P1.html[2020-04-30 09:31:27]
ESTIMATION PAR INTERVALLES: CONCEPTS DE BASE

ESTIMATION PAR INTERVALLES:


CONCEPTS DE BASE
En pratique, on ignore la valeur du paramètre et on prélève
un (seul) échantillon afin de pouvoir calculer un estimateur de ce paramètre

Afin de réaliser cette estimation, il est nécessaire de faire des hypothèses quant à
la relation qui existe entre un paramètre et son estimateur

LA DISTRIBUTION D'ÉCHANTILLONNAGE DE LA MOYENNE (rappel)

Si la distribution d'échantillonnage est approximativement normale


(i.e. si la taille échantillonnale est grande
ou si la distribution de la population est normale)
on sait, par la règle empirique, qu'environ 95% des valeurs possibles
de se situent à moins de 2 de chaque côté de la moyenne
de la distribution d'échantillonnage

LA LONGUEUR DE L'INTERVALLE

Propriété importante

Si 95% des valeurs possibles de se situent à moins de 2 de la moyenne de la


population, alors μ ne sera pas à plus de 2 de 95% des valeurs possibles de

Cet énoncé est également vrai pour d'autres valeurs que 2. Par exemple:
Si 68% des valeurs possibles de se situent à moins de 1 de la moyenne de la
population, alors μ ne sera pas à plus de 1 de 68% des valeurs possibles de

Illustrons ce propos par l'analogie suivante:


Si, pour 100 villes quelconques, 95 sont situées à 50 km ou moins de Montréal,
il est clair que, pour ces 95 villes, Montréal est située à 50 km ou moins.
Par conséquent, si on choisit une des 100 villes au hasard, la probabilité que
Montréal y soit distante de moins de 50 km est P = 0,95

Il est important de se rappeler qu'il s'agit d'une probabilité,


c'est-à-dire d'une valeur attendue suite à un grand nombre de tirages au hasard;
pour une ville en particulier, Montréal est ou n'est pas située à 50 km ou moins

file:///C|/B%20-%20Jean/PSY1300/C7P2.html[2020-04-30 09:31:27]
ESTIMATION PAR INTERVALLES: CONCEPTS DE BASE

Reprenons l'analogie précédente et appliquons-la à la distribution d'échantillonnage


en remplaçant Montréal par μ et les autres villes par les

Ainsi, si on calcule un grand nombre d'intervalles de la forme ± 2


(à partir d'autant d'échantillons), la moyenne μ cherchée se situera
à l'intérieur d'environ 95% de ceux-ci

Mais pour un intervalle donné, il faut souligner que le paramètre s'y trouve ou ne
s'y trouve pas. C'est la probabilité de s'y trouver qui vaut 95%

Dans le graphique ci-dessous, l'intervalle construit autour de 1 ne contient pas μ,


alors que ceux construits autour de 2 et de 3 englobent le paramètre μ

RÈGLE GÉNÉRALE

On peut cependant vouloir calculer un intervalle


pour un autre «niveau de probabilité» (e.g. 99%)

En règle générale, si la distribution d'échantillonnage est normale,


on construit un intervalle de confiance pour μ par la formule générale

= la moyenne échantillonnale
= l'erreur type de la moyenne
Z = valeur déterminée par la probabilité associée à l'intervalle d'estimation
De plus, on note que
- = la limite inférieure de l'intervalle d'estimation
+ = la limite supérieure de l'intervalle d'estimation

file:///C|/B%20-%20Jean/PSY1300/C7P2.html[2020-04-30 09:31:27]
ESTIMATION PAR INTERVALLES: CONCEPTS DE BASE

LE NIVEAU DE CONFIANCE

Définition: le niveau (ou degré) de confiance est le niveau de probabilité


associé à l'intervalle d'estimation. Plus le niveau de probabilité est élevé, plus la
«confiance» est grande que l'estimation englobe la moyenne de la population

Pour un niveau de confiance donné, on obtient, via la table de la distribution


normale, la valeur du Z appropriée pour construire l'intervalle voulu
(par la formule donnée ci-dessus)

Ainsi, pour les niveaux les plus souvent utilisés, on a le tableau suivant
Niveau de confiance Valeur de Z Forme de l'intervalle de confiance

90% 1,64 - 1,64 < μ < + 1,64

95% 1,96 - 1,96 < μ < + 1,96

99% 2,58 - 2,58 < μ < + 2,58

Compromis

On doit considérer plusieurs niveaux de confiance puisque, si on veut augmenter le


niveau de confiance, il faut accepter une marge d'erreur plus élevée.
En d'autres termes:
D'un plus haut niveau de confiance résulte un intervalle d'estimation plus long,
d'où une diminution de la précision de l'estimation

Aux extrêmes:
° Il n'y a (quasiment) aucune certitude
d'associée à une estimation ponctuelle
(i.e. aucun intervalle)
Exemple: demain, à 10h, il fera 20,0345...o C
° La certitude est absolue que le paramètre
prenne une valeur quelconque
(i.e. intervalle non-borné)
Exemple: demain, à 10h, il fera entre -273o C et 1356453....o C

Généralement, le niveau de confiance est fixé avant que ne s'effectue l'estimation


Son choix dépend de la question à l'étude,
i.e de l'importance relative de la confiance et de la précision désirées

Exemple

Dans les données du cours de comptabilité, on avait obtenu,


pour des échantillons de taille n = 5, = 5,91,
et pour l'échantillon choisi: = 61,4
Par conséquent, pour un niveau de confiance de 90%,
on estimerait que μ (qu'on ignore) se situe entre 51,7 et 71,1;
par contre, pour un niveau de confiance de 99%,
on estimerait que μ se situe quelque part entre 46,2 et 76,6

Suite > PROPRIÉTÉS DES ESTIMATEURS: ABSENCE DE BIAIS ET EFFICACITÉ

file:///C|/B%20-%20Jean/PSY1300/C7P2.html[2020-04-30 09:31:27]
PROPRIÉTÉS DES ESTIMATEURS: ABSENCE DE BIAIS ET EFFICACITÉ

PROPRIÉTÉS DES ESTIMATEURS:


ABSENCE DE BIAIS ET EFFICACITÉ
Lors du choix d'un estimateur, on préférera que celui-ci soit non biaisé et efficace

Appelons t l'estimateur, i.e. , s, p...


et θ le paramètre, i.e. μ, σ, π, ...

Définitions

L'estimateur t d'un paramètre θ est dit non biaisé si sa distribution


d'échantillonnage se concentre autour de de façon telle
que la moyenne de tous les t possibles est égale à θ

S'il existe plusieurs estimateurs non biaisés d'un même paramètre, celui qui
possède la distribution d'échantillonnage dont la variance est la plus petite est
considéré comme l'estimateur le plus efficace

Graphiquement,
° l'estimateur dont la distribution est A est non biaisé
alors que celui dont la distribution est B est biaisé
° l'estimateur dont la distribution est A est plus
efficace que celui dont la distribution est C

On note que et p sont des estimateurs non-biaisés de, respectivement, μ et π

De plus, dans la plupart de cas, est un estimateur de μ


plus efficace que la médiane échantillonnale

CORRECTION DU BIAIS DE s 2

Pour la variance échantillonnale s 2 , il est important de noter que si on calculait

on obtiendrait une estimation biaisée de σ2

Pour corriger ce biais, on doit remplacer le dénominateur par n-1

La formule pour la variance échantillonnale est donc

file:///C|/B%20-%20Jean/PSY1300/C7P3.html[2020-04-30 09:31:28]
PROPRIÉTÉS DES ESTIMATEURS: ABSENCE DE BIAIS ET EFFICACITÉ

et, par suite

Avec ces formules, s 2 est un estimateur non biaisé de σ2


mais s demeure quelque peu biaisé pour estimer σ

De plus, ce sont ces formules qui seront utilisées pour estimer l'erreur type
(on notera l'estimation par un ^) lorsque l'écart type de la population est inconnu
En formule

selon, respectivement, que la population est infinie ou finie

Suite > ESTIMATION DE LA MOYENNE μ LORSQUE s EST CONNU

file:///C|/B%20-%20Jean/PSY1300/C7P3.html[2020-04-30 09:31:28]
ESTIMATION DE LA MOYENNE μ LORSQUE σ EST CONNU

ESTIMATION DE LA MOYENNE μ
LORSQUE σ EST CONNU
Rappels

° Si la population est distribuée normalement, la distribution d'échantillonnage


des moyennes est une distribution normale, peu importe la taille des échantillons

° Si la population n'est pas distribuée normalement


ou si la distribution de la population est inconnue,
on sait que la distribution d'échantillonnage des moyennes est approximativement
normale dès que la taille des échantillons est assez grande (n > 30)

INTERVALLE DE CONFIANCE

L'intervalle de confiance pour μ, la moyenne de la population, est donné par


= la moyenne de l'échantillon
Z = la valeur de Z qui correspond au niveau de confiance désiré
= l'erreur type de la moyenne, i.e.

si la population est infinie et

si la population est finie

En pratique, lorsque N est très grand, on néglige le facteur de correction puisqu'il


vaut à peu près 1. Par exemple, si N = 6 millions et n = 100, on a

Exemples

Dans notre exemple du cours de comptabilité, on avait


= 61,40, n = 5, = 5,91
° pour un niveau de confiance de 99%, la valeur de Z est égale à 2,58
Donc
-Z <μ< +Z
61,40 - 2,58(5,91) < μ < 61,40 + 2,58(5,91)
61,40 - 15,25 < μ < 61,40 + 15,25
46,15 < μ < 76,65
° pour un niveau de confiance de 90%, la valeur de Z est égale à 1,64
Donc
-Z <μ< +Z
61,40 - 1,64(5,91) < μ < 61,40 + 1,64(5,91)

file:///C|/B%20-%20Jean/PSY1300/C7P4.html[2020-04-30 09:31:28]
ESTIMATION DE LA MOYENNE μ LORSQUE σ EST CONNU

61,40 - 9,69 < μ < 61,40 + 9,69


51,71 < μ < 71,09
On remarque que cet intervalle est plus restreint que le précédent
mais son niveau de confiance est plus bas

Supposons qu'on obtienne, pour un échantillon


de cinq psychologues, les QI suivants
75, 88, 112, 85, 80
et on veut construire un intervalle avec un niveau de confiance de 95%
On sait (ou plutôt: on suppose) que = 15; on a aussi
= 88,00, n = 5, et puisque N est très grand, on a

pour un niveau de confiance de 95%, la valeur de Z est égale à 1,96


Donc
-Z <μ< +Z
88,00 - 1,96(6,71) < μ < 88,00 + 1,96(6,71)
88,00 - 13,15 < μ < 88,00 + 13,15
74,85 < μ < 101,15

Suite > LA DISTRIBUTION t

file:///C|/B%20-%20Jean/PSY1300/C7P4.html[2020-04-30 09:31:28]
LA DISTRIBUTION t

LA DISTRIBUTION t
OBJECTIF

Supposons que x 1 , x 2 , ..., x n représentent les résultats


obtenus à partir d'un échantillon aléatoire de taille n d'une population normalement
distribuée de moyenne μ et d'écart type σ
On sait déjà que la distribution des moyennes échantillonnales est normalement
distribuée et l'écart type de cette distribution est donné par

selon, respectivement, que la population est infinie ou finie


Par conséquent, la variable aléatoire

suit une distribution normale centrée réduite; donc cette variable est une cote Z.

Mais dans nombre de cas, l'écart type de la population est inconnu et


il faut l'estimer à l'aide de l'écart type échantillonnal, i.e.

selon, respectivement, que la population est infinie ou finie


Cependant, dans ce cas, la variable aléatoire

ne se distribue pas normalement, mais selon une distribution particulière appelée


distribution t de Student

DESCRIPTION

La distribution t ressemble à la distribution normale


Elle est symétrique et centrée sur 0
Mais sa forme exacte dépend de la taille de l'échantillon (n)
Elle est plus aplatie que la distribution normale
Mais, à mesure que la taille échantillonnale augmente
la distribution t tend à se confondre avec la distribution normale
(en fait, dès que n ≥ 30, l'approximation est intéressante)

Graphiquement, on a

file:///C|/B%20-%20Jean/PSY1300/C7P5.html[2020-04-30 09:31:29]
LA DISTRIBUTION t

Formellement (ou pour votre amusement), la distribution t est donnée par

où υ est le nombre de degré de liberté (d.l.), c'est-à-dire n-1

UTILISATION DE LA TABLE

Tout comme pour la distribution normale,


la probabilité qu'une valeur t se situe à l'intérieur d'un certain
intervalle est donnée par l'aire sous la courbe, pour cet intervalle

Or, puisqu'il existe autant de distributions t qu'il y a de valeurs de n,


on ne peut penser à utiliser une table pour chacune de ces distributions

La table habituellement utilisée est différente de celle de la distribution normale


Cette table donne, pour des niveaux de confiance fixés,
la valeur de t correspondante

On a donc une table qui ressemble à celle-ci


0,80 0,90 0,95 0,98 0,99 NC

0,200 0,100 0,050 0,020 0,010 α

n dl 0,100 0,050 0,025 0,010 0,005 α/2

2 1 3,078 6,314 12,706 31,821 63,657

3 2 1,886 2,920 4,303 6,965 9,925

4 3 1,638 2,353 3,182 4,541 5,841

5 4 1,533 2,132 2,776 3,747 4,604

6 5 1,476 2,015 2,571 3,365 4,032

11 10 1,372 1,812 2,228 2,764 3,169

21 20 1,325 1,725 2,086 2,528 2,845

file:///C|/B%20-%20Jean/PSY1300/C7P5.html[2020-04-30 09:31:29]
LA DISTRIBUTION t

31 30 1,310 1,697 2,042 2,457 2,750

41 40 1,303 1,684 2,021 2,423 2,704

121 120 1,289 1,658 1,980 2,358 2,617

¥ ¥ 1,282 1,645 1,960 2,236 0,576

Il est important de noter que, dans la table fournie à l'annexe 5, les espaces gris
sont absents. Par conséquent, pour chercher une valeur de t donnée, il faut
déterminer la valeur de d.l. et de α/2

Pour les degrés de liberté, on a, dans ce cas-ci,

De plus, rappelons que le niveau de confiance (noté NC) détermine la probabilité


que l'intervalle construit autour de l'estimateur contienne le paramètre.
De là, 1 - NC est la probabilité que cet intervalle ne contienne pas le paramètre
Cette probabilité d'erreur est alors notée par α

Mais puisque α est la probabilité totale d'erreur


et puisque la distribution t est symétrique,
cette probabilité peut se diviser en deux probabilités d'erreur distinctes,
notées par α/2 (sous-évaluation et sur-évaluation)

La table de t est construite de façon à donner la valeur de t correspondant à


une aire déterminée, complètement à droite de la distribution
C'est donc cette valeur de α/2 qui forme la première ligne de la table de t

En formule, on a

et graphiquement

Exemple

On cherche la valeur de t associée à un niveau de confiance de 95%


dans un échantillon de taille n = 6. On a donc

et

file:///C|/B%20-%20Jean/PSY1300/C7P5.html[2020-04-30 09:31:29]
LA DISTRIBUTION t

En cherchant dans la table des t,


à l'intersection de la ligne d.l. = 5 et de la colonne α/2 = 0,025
on trouve la valeur t = 2,571

C'est donc dire que, lorsque n = 6,


95% des valeurs de t se situent entre -2,571 et 2,571

DISTRIBUTION t ET DISTRIBUTION NORMALE

On a déjà remarqué que, à mesure que n croît,


la distribution t tend à se confondre avec la distribution normale

C'est pour cette raison que, dans la table, lorsque n est très grand (i.e. n → ∞), la
valeur de t associée à un niveau de confiance donné
correspond exactement à la valeur de Z pour ce même niveau

Par exemple, à un niveau de confiance de 95% correspond la valeur Z = 1,960


De même, pour n → ∞, on lit dans la table la valeur t = 1,960

C'est à cause de cette convergence que plusieurs auteurs préfèrent utiliser


la valeur Z lorsque la taille de l'échantillon est suffisamment élevée (e.g. n ≥ 30)

Mais il semble plus simple de se rappeler uniquement de la règle suivante:


° Si on connaît σ, on utilise la distribution normale
° Si on doit estimer σ (via s), on utilise la distribution t
(et ce, indépendamment de la taille de l'échantillon)

Suite > ESTIMATION DE LA MOYENNE μ LORSQUE σ EST INCONNU

file:///C|/B%20-%20Jean/PSY1300/C7P5.html[2020-04-30 09:31:29]
ESTIMATION DE LA MOYENNE μ LORSQUE σ EST INCONNU

ESTIMATION DE LA MOYENNE μ
LORSQUE σ EST INCONNU
Rappels

Lorsque σ est inconnu, on doit estimer l'erreur type par la formule

selon, respectivement, que la population est infinie ou finie,


et où s est l'écart type échantillonal, i.e.

De plus, on sait que la variable aléatoire

suit une distribution t

INTERVALLE DE CONFIANCE

Dans cette situation, l'intervalle de confiance


pour μ, la moyenne de la population, est donné par


= la moyenne de l'échantillon
t α/2 = la valeur de t qui correspond à la probabilité α/2
= l'estimé de l'erreur type de la moyenne

Exemple (I)

Dans notre exemple du cours de comptabilité, si les 5 personnes de l'échantillon


ont vraiment passé l'examen avant les autres, on ignore
On doit donc l'estimer à l'aide de l'écart type échantillonnal
Rappelons que = 61,40, n = 5, donc
x x- (x - ) 2

55 -6,40 40,96

47 -14,40 207,36

72 10,60 112,36

68 6,60 43,56

65 3,60 12,96

307 0,00 417,20

file:///C|/B%20-%20Jean/PSY1300/C7P6.html[2020-04-30 09:31:30]
ESTIMATION DE LA MOYENNE μ LORSQUE σ EST INCONNU

et

qui permet de calculer

(qu'on peut comparer avec = 5,91)

° pour un niveau de confiance de 99%, on a α/2 = 0,005 et d.l. = 5 - 1 = 4,


d'où, par la table, on obtient la valeur de t, soit 4,604
Donc
-t <μ< +t
61,40 - 4,604(4,24) < μ < 61,40 + 4,604(4,24)
61,40 - 19,52 < μ < 61,40 + 19,52
41,88 < μ < 80,92

Qu'on peut comparer à l'intervalle obtenu lorsque σ est connu soit:


46,15 < μ < 76,65

Exemple (II)

Pour l'échantillon de cinq psychologues ayant passé un test,


supposons qu'il s'agisse d'un nouvel instrument dont on ignore σ
On doit donc l'estimer à l'aide de l'écart type échantillonnal
Rappelons que = 88, n = 5, donc
x x- (x - ) 2

75 -13 169

88 0 0

112 24 576

85 -3 9

80 -8 64

440 0 818

et

qui permet de calculer (en supposant N très grand)

° pour un niveau de confiance de 95%, on a α/2 = 0,025 et d.l. = 5 - 1 = 4,

file:///C|/B%20-%20Jean/PSY1300/C7P6.html[2020-04-30 09:31:30]
ESTIMATION DE LA MOYENNE μ LORSQUE σ EST INCONNU

d'où, par la table, on obtient la valeur de t, soit 2,776


Donc
-t <μ< +t
88,00 - 2,776(6,40) < μ < 88,00 + 2,776(6,40)
88,00 - 17,77 < μ < 88,00 + 17,77
70,23 < μ < 105,77

Qu'on peut comparer à l'intervalle obtenu lorsque est connu et égal à 15


soit: 74,85 < μ < 101,15

ESTIMATION DU POURCENTAGE π

file:///C|/B%20-%20Jean/PSY1300/C7P6.html[2020-04-30 09:31:30]
ESTIMATION DU POURCENTAGE π

ESTIMATION DU POURCENTAGE π
Dans le cas des pourcentages, on sait que si la taille échantillonnale est
suffisamment grande (n ≥ 30), on sait que la distribution des pourcentages
échantillonnaux est approximativement normale

Par conséquent, on peut construire, autour du pourcentage échantillonnal p,


un intervalle de confiance pour estimer le pourcentage de la population π

On a la formule

ou, puisque n ≥ 30, on peut prendre simplement

où p = la moyenne de l'échantillon
Z = la valeur de Z qui correspond au niveau de confiance donné
p = l'estimé de l'erreur type du pourcentage, i.e.

selon, respectivement, que la population est finie ou infinie


(attention: il s'agit d'un estimateur de σp et le dénominateur est n-1)

On note que, dans le cas des pourcentages, on est toujours dans l'obligation
d'estimer l'erreur type σp puisque, si on le connaissait, on connaîtrait
nécessairement la valeur de π puisqu'on pourrait l'isoler dans la formule

et il serait inutile de construire un intervalle pour l'estimer

Exemples (#22 et #17)

Parmi 1000 téléspectateurs choisis au hasard, 340 affirment regarder assidûment


l'émission «Laure Dutemps». Au niveau de confiance de 95%, estimez le pourcentage
de téléspectateurs qui regardent assidûment l'émission.

On a p = 340/1000 = 0,34 = 34% et, puisque N est très grand,

De plus, pour un niveau de confiance de 95%, la valeur de Z est égale à 1,96


Donc
p-Z p<π<p+Z p
34% - 1,96(1,50%) < π < 34% + 1,96(1,50%)
34% - 2,94% < π < 34% + 2,94%
31,06% < π < 36,94%

Bjorn Talloz, un étudiant norvégien, veut savoir s'il vaut la peine de se porter

file:///C|/B%20-%20Jean/PSY1300/C7P7.html[2020-04-30 09:31:31]
ESTIMATION DU POURCENTAGE π

comme candidat à la présidence de l'Association des étudiants/es de l'université.


Un échantillon de 50 étudiants/es a montré que 22% des étudiants/es voteraient
pour lui. Estimez le véritable pourcentage à un niveau de confiance de 99%.

On a p = 22% et, puisque N est très grand,


le facteur de correction pour σp est négligeable et on peut calculer

De plus, pour un niveau de confiance de 99%, la valeur de Z est égale à 2,58


Donc
p-Z p<<p+Z p
22% - 2,58(5,92%) < π < 22% + 2,58(5,92%)
22% - 15,27% < π < 22% + 15,27%
6,73% < π < 37,27%
Donc, l'étudiant devrait réviser ses plans...

Suite > DÉTERMINATION DE LA TAILLE DE L'É'CHANTILLON

file:///C|/B%20-%20Jean/PSY1300/C7P7.html[2020-04-30 09:31:31]
DÉTERMINATION DE LA TAILLE DE L'É'CHANTILLON

DÉTERMINATION DE LA TAILLE DE L'ÉCHANTILLON


Jusqu'à présent, on a calculé la valeur de l'intervalle pour un échantillon
Puisque le taille de l'échantillon n et le niveau de confiance sont fixés
(en effet, il est injustifié de jouer a posteriori avec cette probabilité)
on doit accepter cet intervalle, quelle qu'en soit la longueur

Or, dans nombre de cas, on désire obtenir


une estimation d'une précision donnée a priori
Il est alors possible, moyennant certaines hypothèses de calculer
la taille échantillonnale requise pour atteindre ce degré de précision
(ici, on suppose que la taille de la population est infinie ou très grande)

TAILLE DE L'ÉCHANTILLON POUR ESTIMER μ

Lorsque l'on écrit l'intervalle


-Z <μ< +Z
la forme générale des bornes est ± Z
c'est-à-dire
± δ où δ est la marge d'erreur tolérée

Or, puisque

on peut tout mettre au carré, i.e.

et, en isolant n, on a

où Z = la valeur du Z correspondant au niveau de confiance désiré


σ 2 = la variance dans la population
δ = la marge d'erreur tolérée

Il est important de noter ici que, comme le montre la formule précédente,


il est nécessaire de poser une hypothèse quant à la valeur de σ
pour être en mesure d'évaluer la taille requise pour l'échantillon

Il faut également noter que la forme de l'intervalle considéré suppose que la


distribution d'échantillonnage est normale.
Par conséquent, sauf si σ est connu et que la distribution de la population est normale,
on doit considérer que si la formule donne un n < 30, on pose n = 30

Exemples

Supposons que, pour les psychologues qui passent un test de Q.I., je puisse
affirmer que la distribution de la population possède un σ d'à peu près 15,
quelle doit être la taille de mon échantillon si je désire avoir

file:///C|/B%20-%20Jean/PSY1300/C7P8.html[2020-04-30 09:31:31]
DÉTERMINATION DE LA TAILLE DE L'É'CHANTILLON

une précision de ±5 points avec un niveau de confiance de 95%


° pour un niveau de confiance de 95%, on a Z = 1,96, d'où

qu'on arrondit, par le haut, à n = 35.

Si on désire obtenir une précision de ±1 point, alors

c'est donc dire qu'on aurait alors besoin de 865 personnes!

TAILLE DE L'ÉCHANTILLON POUR ESTIMER π

De même, lorsque l'on écrit l'intervalle


p - Zσp < π < p + Zσp
la forme générale des bornes est
p ± Z σp
c'est-à-dire
p ±< δ
où δ est la marge d'erreur tolérée

Or, puisque

on peut tout mettre au carré, i.e.

et, en isolant n, on a

où Z = la valeur du Z correspondant au niveau de confiance désiré


π = le pourcentage dans la population
δ = la marge d'erreur tolérée

Étrangement, cette formule exige la connaissance de π,


ce qu'on cherche justement à estimer
Il s'agit donc de faire un estimé conservateur de π
Dans nombre de cas, on connaît les bornes à l'intérieur desquelles le vrai π risque
de se situer; un intervalle conservateur peut être construit en donnant à π la valeur
de la borne située le plus près de 50%
Dans le pire des cas, on pose π = 50% puisqu'alors le produit π(1-π) sera
maximal et le nombre d'observations requises sera surévalué

Exemples

file:///C|/B%20-%20Jean/PSY1300/C7P8.html[2020-04-30 09:31:31]
DÉTERMINATION DE LA TAILLE DE L'É'CHANTILLON

Supposons qu'on désire estimer ±5% le pourcentage de gains à une nouvelle


loterie pour laquelle on annonce qu'il y a jusqu'à 40% de chances de gagner
et ce, avec un niveau de confiance de 95%. Combien faut-il acheter de billets?

π peut donc prendre n'importe quelle valeur entre 0% et 40%,


l'estimé conservateur est donc 40% et,
pour ce niveau de confiance, Z = 1,96, donc

Il faut donc acheter 369 billets.

Dans l'exemple de l'élection de l'étudiant norvégien,


combien faudrait-il interroger de personnes pour estimer
le pourcentage de votes à ±10%, avec un niveau de confiance de 99%?

Puisqu'on ne sait rien de π, on pose l'estimé de π à 50%


de plus, pour ce niveau de confiance, Z = 2,58 donc

Il faut donc questionner (au moins) 167 personnes

Évidemment, en acceptant un niveau de confiance plus faible,


tel que 90%, on aurait Z = 1,64 et

i.e. que 68 personnes seraient suffisantes

Suite > CHAPITRE 8: TESTS D'HYPOTHÈSE ET PRISE DE DéCISION

file:///C|/B%20-%20Jean/PSY1300/C7P8.html[2020-04-30 09:31:31]
CHAPITRE 8: TESTS D'HYPOTHÈSE ET PRISE DE DéCISION

CHAPITRE 8: TESTS D'HYPOTHÈSE ET PRISE DE DéCISION

Tests d'hypothèse et prise de décision


Distribution d'échantillonnage et prise de décision
Formulation des hypothèses
Les deux types d'erreur
Étapes d'un test d'hypothèse
Test bilatéral vs test unilatéral
Estimation vs test d'hypothèse
La probabilité des erreurs de type I et de type II
Test d'hypothèse sur une moyenne lorsque σ est connu
Test d'hypothèse sur une moyenne lorsque σ est inconnu
Test d'hypothèse sur un pourcentage
Notions préliminaires
Distribution d'échantillonnage des différences entre deux moyennes
Test d'hypothèse sur deux moyennes lors les σ sont connus
Test d'hypothèse sur deux moyennes lors les σ sont inconnus
Test d'hypothèse sur deux proportions
Différence significative et différence signifiante

Suite > DISTRIBUTION D'ÉCHANTILLONNAGE ET PRISE DE DÉCISION

file:///C|/B%20-%20Jean/PSY1300/C8P0.html[2020-04-30 09:31:32]
DISTRIBUTION D'ÉCHANTILLONNAGE ET PRISE DE DÉCISION

DISTRIBUTION D'ÉCHANTILLONNAGE
ET PRISE DE DÉCISION
Dans nombre de situations concrètes, on ne désire pas seulement estimer la valeur
d'un paramètre, mais on a une hypothèse quant à sa valeur et on veut, à l'aide de
données échantillonnales, vérifier ou infirmer cette hypothèse

Par exemple, reprenons le cas des cinq psychologues qui ont passé un test de QI
Quelqu'un pourrait poser l'hypothèse que les psychologues ont, en général, un QI
différent de la «norme», c'est-à-dire de μ = 100

Évidemment, si la moyenne échantillonnale donnait = 170,


on aurait de bonnes raisons de croire à l'hypothèse de la différence
Par contre, si était égale à 101, on serait porté à attribuer la différence obtenue
à l'erreur d'échantillonnage et à maintenir l'hypothèse du statu quo (μ = 100)

Mais, dans le cas présenté précédemment, on avait = 88


Que peut-on alors conclure?

La question de base du test d'hypothèse est de déterminer combien


grande ou significative doit être la différence entre un indice statistique
et une valeur supposée du paramètre pour pouvoir légitimement rejeter
l'hypothèse que le paramètre vaut bien cette valeur présumée

La décision repose sur l'étude de la distribution


d'échantillonnage présumée des indices statistiques considérés
Si l'indice calculé prend une valeur peu probable selon cette distribution,
on rejette alors l'hypothèse initiale à propos de la valeur du paramètre

Dans le cas des QI, on peut se demander quelle est la probabilité d'obtenir,
pour un échantillon de cinq personnes, une moyenne échantillonnale = 88
si l'on suppose que μ = 100 et σ = 16
(On prend donc pour acquis que, jusqu'à preuve du contraire,
les psychologues n'ont rien de particulier)
En d'autres termes, on cherche à déterminer si une différence
de 12 points entre la moyenne échantillonnale et la valeur présumée de μ
est suffisante pour être jugée significative
En termes statistiques, cela revient à chercher la probabilité que la moyenne
échantillonnale diffère d'au moins 12 points de la valeur supposée de μ

Puisque la distribution des QI est (supposée) normale,


la distribution d'échantillonnage des moyennes est aussi normale

En supposant que μ = 100 et σ = 15, et puisque

on a la distribution d'échantillonnage suivante

file:///C|/B%20-%20Jean/PSY1300/C8P1.html[2020-04-30 09:31:32]
DISTRIBUTION D'ÉCHANTILLONNAGE ET PRISE DE DÉCISION

Pour calculer la probabilité cherchée, on transforme la valeur obtenue en cote Z

Par la table de la distribution normale, on a alors


P( ≤ 88) = P(Z ≤ -1,79) = 0,5 - P(0 Z < 1,79) = 0,5 - 0,4633 = 0,0367

Cette probabilité est relativement faible et laisse supposer


que la moyenne du QI de psychologues est différente de 100

Mais, comme le montre cet exemple, tout test d'hypothèse


suppose l'établissement, a priori, d'une règle suivant laquelle
une hypothèse doit être rejetée lorsque la probabilité d'obtenir
une valeur particulière de se situe sous un niveau minimal acceptable

FORMULATION DES HYPOTHÈSES

file:///C|/B%20-%20Jean/PSY1300/C8P1.html[2020-04-30 09:31:32]
FORMULATION DES HYPOTHÈSES

FORMULATION DES HYPOTHÈSES


Définition: une hypothèse est un énoncé conjectural sur la valeur d'un paramètre
de la population (évidemment, on ignore cette valeur!)

HYPOTHÈSE NULLE (H0 )

° C'est l'hypothèse du statu quo,


celle qui est maintenue jusqu'à preuve du contraire
° C'est l'hypothèse qu'on veut rejeter
° Pour la formuler, on utilise les symboles: =, ≤, ≥

HYPOTHÈSE ALTERNATIVE (H1 )

° C'est l'hypothèse qu'on voudrait démontrer


° Son acceptation n'est conditionnelle qu'au rejet de l'hypothèse nulle
° Pour la formuler, on utilise les symboles: ≠, >, <

Note importante
H0 doit être formulée de façon à ce que son rejet erroné
soit plus grave que son acceptation erronée.
Par conséquent, la question est fonction de H0 qui est
maintenue (et non pas prouvée) ou rejetée

Exemples
Dans l'exemple des psychologues, on a
H0 : μ = 100 vs H1 : μ ≠ 100

De même, pour montrer qu'une nouvelle méthode contraceptive est efficace


à plus de 99%, on formulerait les hypothèses suivantes:
H0 : π ≤ 99% vs H1 : π > 99%

Suite > LES DEUX TYPES D'ERREURS

file:///C|/B%20-%20Jean/PSY1300/C8P2.html[2020-04-30 09:31:33]
LES DEUX TYPES D'ERREURS

LES DEUX TYPES D'ERREURS


Selon que la décision statistique nous amène à accepter ou à rejeter H 0 ,
il existe une probabilité de commettre une erreur de décision dans chaque cas

Définitions

L'erreur de type I (ou de «première espèce») est l'erreur commise


quand l'hypothèse nulle est rejetée, alors qu'elle est vraie
(cette erreur est jugée plus grave que l'autre)

L'erreur de type II (ou de «deuxième espèce») est l'erreur commise


quand l'hypothèse nulle est maintenue, alors qu'elle est fausse

En fait, il y a quatre possibilités qu'on représente par le tableau suivant


DÉCISION
RÉALITÉ H 0 est maintenue H 0 est rejetée

H 0 est vraie Aucune erreur Erreur de type I

H 0 est fausse Erreur de type II Aucune erreur

Exemple

Dans le cas du test pour la méthode contraceptive (H0 : 99%)


DÉCISION H 0 est maintenue H 0 est rejetée
RÉALITÉ (inefficace) (efficace)

H 0 est vraie
Aucune erreur Erreur de type I
(inefficace)

H 0 est fausse
Erreur de type II Aucune erreur
(efficace)

Notons que, pour une décision en particulier,


on commet OU on ne commet pas d'erreur
Si on commet une erreur, elle est de type I OU de type II
(selon la décision)

Suite >ÉTAPES D'UN TEST D'HYPOTHÉSE

file:///C|/B%20-%20Jean/PSY1300/C8P3.html[2020-04-30 09:31:33]
ÉTAPES D'UN TEST D'HYPOTHÉSE

ÉTAPES D'UN TEST D'HYPOTHÈSE


ÉTAPE 1: FORMULER L'HYPOTHÈSE NULLE
ET L'HYPOTHÈSE ALTERNATIVE

C'est ce que nous avons vu ci-dessus


Cette étape est cruciale
(la valeur du paramètre posée par l'hypothèse est notée par l'indice H 0 , e.g. μHo)

ÉTAPE 2: CHOISIR LE SEUIL DE SIGNIFICATION DU TEST


(ainsi que l'effectif échantillonnal)

Lorsque la valeur véritable du paramètre de la population est celle proposée par


l'hypothèse nulle, on sait que la probabilité d'observer une différence entre
l'estimateur et la valeur hypothétique devient plus petite à mesure que la différence
s'accroît, i.e. il est très improbable d'observer une grande différence

Avant même de prélever l'échantillon, on doit déterminer


la probabilité maximale acceptable de commettre une erreur de type I

Ce niveau de risque, appelé seuil de signification du test, est noté par la lettre α

Plus les conséquences du rejet erroné de


l'hypothèse nulle sont graves, plus α doit être petit

Traditionnellement, est fixé à 0,05 ou 0,01

Note: c'est à cette probabilité que les gens réfèrent lorsqu'ils disent:
«... mon test statistique est significatif à 5%»

C'est aussi à cette étape qu'on doit se questionner


sur la taille nécessaire de l'échantillon
Rappelons seulement que plus n est grand, plus l'erreur type est petite
Par conséquent, la taille de l'échantillon détermine la puissance du test
d'hypothèse, i.e. sa capacité de détecter une différence réelle
{En d'autres termes, la taille de l'échantillon est inversement reliée
à la probabilité de commettre une erreur de type II

ÉTAPE 3: DÉTERMINER LA DISTRIBUTION


POUR EFFECTUER LE TEST

Selon le type d'indice statistique choisi pour estimer le paramètre,


on aura divers types de distribution de probabilités

Le choix de cette distribution de référence permet de définir si la valeur calculée


de l'estimateur est probable, si l'on s'en tient à l'hypothèse nulle

C'est lorsque la valeur calculée est jugée très peu probable qu'on décide
de rejeter l'hypothèse nulle parce que la distribution d'échantillonnage
des estimateurs que celle-ci suppose ne semble pas appropriée

Pour les cas présentés dans la suite de la partie 8 du cours,

file:///C|/B%20-%20Jean/PSY1300/C8P4.html[2020-04-30 09:31:33]
ÉTAPES D'UN TEST D'HYPOTHÉSE

on utilisera la distribution normale et la distribution t

Cependant, il convient de souligner qu'il existe des tests d'hypothèse


dont les distributions de probabilités sont différentes
Par exemple, lorsqu'on doit comparer plusieurs pourcentages échantillonnaux,
on utilise la distribution du χ 2 (9 e partie du cours)
De même, si on fait des rapports de variances, la distribution de référence
est la distribution F de Fischer (11 e partie du cours)

ÉTAPE 4: DÉFINIR LA RÉGION CRITIQUE

Ayant déterminé le seuil de signification et la distribution de probabilités


pertinente, il faut définir ce que l'on entend par une différence significative

Ainsi, lorsque la distribution d'échantillonnage est normale,


on utilise la table des Z pour déterminer la valeur critique
correspondant au seuil de signification désiré

Par exemple, si α = 0,05, cela signifie que l'hypothèse nulle sera rejetée
si la différence entre l'estimateur et le paramètre supposé n'a qu'une
probabilité de 0,05 ou moins de se produire lorsque H0 est vraie

Dans les cas d'une moyenne échantillonnale, il s'agit de déterminer la zone pour
laquelle la différence entre et μHo, exprimée en unités standard (Z), n'a qu'une
faible probabilité de se produire (5% ou moins)

Mais la différence peut être positive ou négative


On doit donc partager la probabilité d'erreur, i.e. α, en deux parties
égales de chaque côté de la distribution, donc α/2 = 0,025

Il reste donc une aire de 0,475 (0,5 - 0,025) de chaque côté de μHo,
ce qui correspond à une valeur Z de 1,96

Par conséquent, si la moyenne diffère de plus de 1,96 erreur type


de la valeur hypothétique μHo, il est justifié de rejeter l'hypothèse nulle,
mais ceci, avec un risque d'erreur de 5% (car α = 0,05)

Évidemment, dans cette situation, la valeur Z critique


dépendra du seuil de signification fixé à l'étape 2
Par exemple, si on fixe α à 0,01, il faut trouver le Z délimitant une aire de
0,5 - α/2 = 0,5 - 0,005 = 0,495
ce qui correspond à une valeur de 2,58

Graphiquement, on a donc la figure suivante

file:///C|/B%20-%20Jean/PSY1300/C8P4.html[2020-04-30 09:31:33]
ÉTAPES D'UN TEST D'HYPOTHÉSE

Définitions

Une différence significative est un différence entre l'estimateur (e.g. ) et la


valeur supposée du paramètre (e.g. μHo) qui mène au rejet de l'hypothèse nulle

La région de rejet (ou région critique) de l'hypothèse nulle est constituée du ou


des intervalles de valeurs à l'intérieur desquels il est jugé fort improbable
(selon α) que l'indice statistique se situe si H0 est vraie

La région d'acceptation est tout simplement


la région complémentaire de la région de rejet

ÉTAPE 5: ÉTABLIR LA RÈGLE DE DÉCISION

Il faut énoncer clairement et a priori la règle de décision

Cette règle doit stipuler la conclusion appropriée qui sera tirée


selon ce qu'indiquent les résultats échantillonnaux

De façon générale, la règle de décision est formulée de la façon suivante:


Maintenir H0 si la valeur de l'indice statistique
se situe dans la région d'acceptation
ou
Rejeter H0 si la valeur de l'indice statistique
se situe dans la région de rejet

Dans le cas d'une moyenne échantillonnale issue d'une distribution


d'échantillonnage normale, on dira plus spécifiquement:
Maintenir H0 si se situe dans la région
d'acceptation construite autour de
ou
Rejeter H0 si se situe dans la région
de rejet construite autour de

ÉTAPE 6: FAIRE LES CALCULS NÉCESSAIRES

Une fois établies toutes les règles du test d'hypothèse,


on doit prélever un échantillon et calculer la valeur de l'indice
statistique qui permet d'estimer le paramètre concerné

file:///C|/B%20-%20Jean/PSY1300/C8P4.html[2020-04-30 09:31:33]
ÉTAPES D'UN TEST D'HYPOTHÉSE

Par exemple, dans le cas d'une moyenne,


on doit déterminer et et calculer le rapport critique

qui exprime, en unités standard, la différence entre


la moyenne échantillonnale et la valeur présumée du paramètre

ÉTAPE 7: PRENDRE LA DÉCISION

En analysant la valeur de l'indice statistique obtenu à l'étape 6


à la lumière des règles établies à l'étape 5, on prend la décision pertinente
i.e. rejeter H0 si la valeur de l'indice est dans la région de rejet et, évidemment,
maintenir H0 si la valeur de l'indice est dans la région d'acceptation

EN RÉSUMÉ

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative

° Étape 2: Choisir le seuil de signification du test

° Étape 3: Déterminer la distribution pour effectuer le test

° Étape 4: Définir la région critique

° Étape 5: Établir la règle de décision

° Étape 6: Faire les calculs nécessaires

° Étape 7: Prendre la décision

Dans l'exemple du QI des psychologues, on aurait la situation suivante


(où l'on accomplirait séquentiellement chacune des étapes susmentionnées)

file:///C|/B%20-%20Jean/PSY1300/C8P4.html[2020-04-30 09:31:33]
ÉTAPES D'UN TEST D'HYPOTHÉSE

Suite >TEST BILATÉRAL vs TEST UNILATÉTRAL

file:///C|/B%20-%20Jean/PSY1300/C8P4.html[2020-04-30 09:31:33]
TEST BILATÉRAL vs TEST UNILATÉTRAL

TEST BILATÉRAL vs TEST UNILATÉRAL


TEST BILATÉRAL

Lorsqu'on ne peut spécifier de direction particulière pour


l'hypothèse alternative, on dit que le test est bilatéral

Dans ce cas, les hypothèses sont de la forme


H0 : θ = valeur présumée vs H1 : θ ≠ valeur présumée
(où θ est le paramètre)

Dans ce cas, il importe peu que le paramètre soit plus grand ou plus petit,
ce qui compte, c'est qu'il diffère de la valeur supposée en hypothèse,
et c'est là la seule conclusion possible

Dans ce type de test, il y a deux régions de rejet, situées aux extrémités


de la distribution et chacune est d'aire α/2

TEST UNILATÉRAL

Lorsqu'on peut spécifier une direction particulière pour


l'hypothèse alternative, on dit que le test est unilatéral

Dans ce cas, les hypothèses sont de la forme


H0 : θ ≥ valeur présumée vs H1 : θ < valeur présumée (unilatéral à gauche)
ou
H0 : θ ≤ valeur présumée vs H1 : θ > valeur présumée (unilatéral à droite)

Dans ce cas, le rejet de l'hypothèse nulle permet de conclure que la valeur du


paramètre est, respectivement, inférieure ou supérieure, à la valeur présumée

Dans ce type de test, il y a une seule région de rejet,


située du côté spécifié par l'hypothèse alternative et d'aire α

Note: le test unilatéral est préférable puisque, pour un seuil de signification donné,
il est plus puissant (moins d'erreurs de type II)

Graphiquement, on a par exemple (pour α = 0,05)

le test bilatéral

file:///C|/B%20-%20Jean/PSY1300/C8P5.html[2020-04-30 09:31:34]
TEST BILATÉRAL vs TEST UNILATÉTRAL

et le test unilatéral (à droite)

Suite > ESTIMATION vs TEST D'HYPOTHÈSE

file:///C|/B%20-%20Jean/PSY1300/C8P5.html[2020-04-30 09:31:34]
ESTIMATION vs TEST D'HYPOTHÈSE

ESTIMATION vs TEST D'HYPOTHÈSE


Rappels

Une estimation est une procédure qui permet de déterminer


l'étendue à l'intérieur de laquelle devrait se situer la valeur du paramètre

Un test d'hypothèse est une procédure de prise de décision binaire


pour vérifier un énoncé à propos de la valeur du paramètre

Note importante

Dans le cas de la moyenne, la différence n'est que d'ordre méthodologique

En effet, connaissant un intervalle de confiance pour la moyenne de la population


(avec un niveau de confiance de 1-α), on peut toujours prendre une décision
quant au rejet d'une hypothèse nulle (avec un seuil de signification
de α/2 pour un test unilatéral et de α pour un test bilatéral)

Si la valeur présumée dans H0 est à l'extérieur de


l'intervalle, on rejette H0 , sinon on l'accepte

Exemple

Supposons que pour le QI des psychologues l'intervalle


construit autour de la moyenne échantillonnale est
74,85 ≤ μ ≤ 101,15
avec un niveau de confiance 1-α = 95%
et que l'on pose
H 0 : μ = 100 vs H1 : μ ≠ 100
avec α = 5%
Alors on doit maintenir H0 puisque
la valeur 100 est comprise dans l'intervalle

Suite > LA PROBABILITÉ DES ERREURS DE TYPE I ET DE TYPE II

file:///C|/B%20-%20Jean/PSY1300/C8P6.html[2020-04-30 09:31:34]
LA PROBABILITÉ DES ERREURS DE TYPE I ET DE TYPE II

LA PROBABILITÉ DES ERREURS


DE TYPE I ET DE TYPE II
ERREUR DE TYPE I

α = la probabilité de l'erreur de type I


i.e. la probabilité de rejet de H0 alors qu'elle est VRAIE

C'est donc la probabilité que le résultat du test statistique, calculé à partir des
données échantillonnales, soit dans la zone de rejet, alors que H0 est VRAIE

Cette probabilité est aussi appelée seuil de signification du test d'hypothèse

Exemple
(Illustration à l'aide d'un cas simple)

Supposons que nous désirons vérifier l'hypothèse que plus


d'une fois sur deux, une pièce de monnaie tombe du côté pile
On la lance 5 fois et on compte le nombre de fois qu'elle tombe sur pile
On pose donc: H0 : π ≤ 50% vs H1 : π > 50%
On suppose également la règle de décision suivante:
On rejette H0 si on obtient 5 piles, sinon on maintient H 0

Si H0 est VRAIE,
la distribution de probabilité réelle
est donc une binômiale avec
n = 5 et π = 0,5
Dans ce cas, la probabilité
de faire L'ERREUR de rejeter
H0 est donnée par
α = P(5) = 0,031

ERREUR DE TYPE II

β = la probabilité de l'erreur de type II


i.e. la probabilité de maintien de H0 alors qu'elle est FAUSSE

C'est donc la probabilité que le résultat du test statistique,


calculé à partir des données échantillonnales,
soit dans la zone d'acceptation, alors que H0 est FAUSSE

Le complément de cette probabilité (i.e. 1-β)


est aussi appelé puissance du test d'hypothèse

Exemple
(cas simple)

Dans l'exemple précédent de la

file:///C|/B%20-%20Jean/PSY1300/C8P7.html[2020-04-30 09:31:35]
LA PROBABILITÉ DES ERREURS DE TYPE I ET DE TYPE II

pièce de monnaie, il se peut que H0


soit FAUSSE, c'est-à-dire que
π = 64% ou π = 70% ou
π = 51% (mais on l'ignore)
Pour chacune de ces valeurs, la
probabilité de maintien erroné de
l'hypothèse est différente, mais
d'autant plus faible que π
s'éloigne de la valeurs présumée

Supposons que π = 70%, la distribution de probabilité réelle est donc une


binômiale avec n = 5 et π = 0,7 (ci-dessus)
Dans ce cas, la probabilité de faire L'ERREUR de maintenir H 0 est donnée par
β = P(0) + P(1) + P(2) + P(3) + P(4)
β = 0,002 + 0,028 + 0,132 + 0,309 + 0,360 = 0,831

De la même façon, pour


π = 60%, on aurait β = 0,922
π = 80%, on aurait β = 0,672

De même, dans l'exemple du QI des cinq psychologues,


on avait H 0 : μ = 100 et = 6,71

Selon la situation réelle et selon la décision prise


on risque de commettre une erreur de type I ou de type II

Ici, dans le cas où H0 serait fausse, on suppose que, en réalité, μ = 96

C'est l'une OU l'autre situation qui correspond à la réalité


Mais on ne sait pas laquelle, puisqu'on n'a pas accès à la population

Pour calculer ces probabilités, supposons que la zone d'acceptation est l'intervalle
90 ≤ ≤ 110
alors

file:///C|/B%20-%20Jean/PSY1300/C8P7.html[2020-04-30 09:31:35]
LA PROBABILITÉ DES ERREURS DE TYPE I ET DE TYPE II

Il y a donc une probabilité de 13,62% de rejeter H0


par ERREUR lorsque μ = 100

Il y a donc une probabilité de 79,50% de maintenir H0


par ERREUR si, en réalité, μ = 96

(cette probabilité est élevée; il y aurait donc intérêt


à augmenter la taille de l'échantillon afin de réduire
l'erreur type de la moyenne - pour une valeur de α constante)

Suite > TEST D'HYPOTHÈSE SUR UNE MOYENNE LORSQUE σ EST CONNU

file:///C|/B%20-%20Jean/PSY1300/C8P7.html[2020-04-30 09:31:35]
TEST D'HYPOTHÈSE SUR UNE MOYENNE LORSQUE σ EST CONNU

TEST D'HYPOTHÈSE SUR UNE MOYENNE


LORSQUE σ EST CONNU
Lorsque σ est connu, on sait que la distribution d'échantillonnage des moyennes
est une distribution normale ou approximativement normale dans deux situations:
° la distribution de la population est normale
° la taille de l'échantillon est suffisamment grande (n ≥ 30)

Dans cette situation, le test d'hypothèse


sur une moyenne se fait de la façon suivante

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


Soit une des trois possibilités suivantes:
(1) H0 : μ = μHo vs H1 : μ ≠ μHo
(2) H0 : μ ≤ μHo vs H1 : μ > μHo
(3) H0 : μ ≥ μHo vs H1 : μ < μHo
° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon
α est déterminée a priori (e.g. α = 0,05) et n doit tenter de minimiser α et β
° Étape 3: Déterminer la distribution pour effectuer le test
Il s'agit de la distribution normale (cote Z)
° Étape 4: Définir la région critique
Hypothèse Zone de rejet Zone d'acceptation

(1) RC > Zα/2 ou RC < -Zα/2 -Zα/2 ≤ RC ≤ Zα/2

(2) RC > Zα RC ≤ Zα

(3) RC < -Zα RC ≥ -Zα

° Étape 5: Établir la règle de décision


Maintenir H0 si la différence standardisée
entre et μHo se situe dans la région d'acceptation
ou
Rejeter H0 si la différence standardisée
entre et μHo se situe dans la région de rejet
° Étape 6: Faire les calculs nécessaires
Prélever un échantillon et calculer le rapport critique

° Étape 7: Prendre la décision


Rejeter H0 si la valeur de RC se situe dans la zone de rejet, sinon maintenir H 0

Exemple I
Prenons l'exemple du QI de nos cinq psychologues. On veut montrer que le QI
des psychologues est différent de 100, avec α = 0,05 et σ = 15

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : μ = 100 vs H1 : μ ≠ 100

file:///C|/B%20-%20Jean/PSY1300/C8P8.html[2020-04-30 09:31:35]
TEST D'HYPOTHÈSE SUR UNE MOYENNE LORSQUE σ EST CONNU

° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon


α = 0,05 et n = 5

° Étape 3: Déterminer la distribution pour effectuer le test


Puisque la distribution de QI est (supposée) normale,
on utilise la distribution normale

° Étape 4: Définir la région critique


Z0,025 = 1,96, par conséquent, la région critique est RC < -1,96 ou RC > 1,96

° Étape 5: Établir la règle de décision


Maintenir H0 si -1,96 ≤ RC ≤ 1,96 OU
Rejeter H0 si RC < -1,96 ou RC > 1,96

° Étape 6: Faire les calculs nécessaires


Prélever un échantillon de cinq personnes et calculer
(rappel: on avait = 88 et = 6,71)

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone d'acceptation, il n'y a pas d'évidence statistique
suffisante pour rejeter H0 ; par conséquent, on doit maintenir H0 .
En d'autres termes, on maintient l'hypothèse
que les psychologues ont un QI moyen de 100

NOTE IMPORTANTE: On serait arrivé à la même conclusion en considérant


l'intervalle de confiance construit à la partie précédente
En effet, l'intervalle obtenu pour α = 0,05, est: 74,85 ≤ μ ≤ 101,15
et il contient la valeur hypothétique μHo = 100

Exemple II (# 14)
Un hôpital reçoit une grosse quantité de fioles de sérum. Ces fioles ne doivent
contenir ni plus ni moins de 50 mg de sérum. On choisit un échantillon aléatoire
de 64 fioles et la moyenne obtenue est = 49,25 mg. On sait que l'écart type de
la population est pratiquement 2 mg. Au seuil de signification de 0,01, l'hôpital
devrait-il accepter la livraison?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : μ = 50 vs H1 : μ ≠ 50

° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon


α = 0,01 et n = 64

° Étape 3: Déterminer la distribution pour effectuer le test


Puisqu'on connaît σ et que n ≥ 30, on utilise la distribution normale

° Étape 4: Définir la région critique


Z0,005 = 2,58, par conséquent, la région critique est RC < -2,58 ou RC > 2,58

° Étape 5: Établir la règle de décision

file:///C|/B%20-%20Jean/PSY1300/C8P8.html[2020-04-30 09:31:35]
TEST D'HYPOTHÈSE SUR UNE MOYENNE LORSQUE σ EST CONNU

Maintenir H0 si -2,58 ≤ RC ≤ 2,58 OU


Rejeter H0 si RC < -2,58 ou RC > 2,58

° Étape 6: Faire les calculs nécessaires


Prélever l'échantillon et calculer

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone de rejet, on doit rejeter H 0
Par conséquent, l'hôpital ne peut pas accepter la livraison

Exemple III
Reprenons l'exemple du cours de comptabilité. Supposons que si l'examen était
distribué aux 30 étudiants/es de ce cours, la distribution des notes serait à peu près
normale avec un écart-type de 14,24. À partir de l'échantillon de 5 personnes
créé précédemment, peut-on conclure, au seuil de signification de 5%, que
l'examen est trop difficile, i.e. que la moyenne du groupe sera sous 60

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : μ ≥ 60 vs H1 : μ < 60

° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon


α = 0,05 et n = 5

° Étape 3: Déterminer la distribution pour effectuer le test


Puisqu'on connaît σ et que la population est supposée se
distribuer normalement, on utilise la distribution normale

° Étape 4: Définir la région critique


Z0,05 = 1,64, par conséquent, la région critique est RC < -1,64

° Étape 5: Établir la règle de décision


Maintenir H0 si RC ≥ -1,64 OU rejeter H0 si RC < -1,64

° Étape 6: Faire les calculs nécessaires


Prélever l'échantillon et calculer (rappel: = 61,40 et = 5,91)

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone d'acceptation, on doit maintenir H 0 .
Par conséquent, on ne peut supposer que l'examen est trop difficile

NOTE IMPORTANTE: On serait arrivé à la même conclusion en considérant


l'intervalle de confiance construit à la partie précédente
En effet, l'intervalle obtenu pour α = 0,10, est: 51,71 ≤ μ ≤ 71,09
et il contient des valeurs hypothétiques de la forme μHo ≥ 60

file:///C|/B%20-%20Jean/PSY1300/C8P8.html[2020-04-30 09:31:35]
TEST D'HYPOTHÈSE SUR UNE MOYENNE LORSQUE σ EST CONNU

Exemple IV (# 19)
Un distributeur de fertilisant vend son produit dans des sacs de 22 kg.
La masse des sacs est distribuée normalement avec un écart type de 0,3 kg.
Un consommateur prétend que la compagnie fraude puisqu'il a acheté
quatre sacs dont la masse moyenne est 19,8 kg. Au seuil de signification
de 0,05, la plainte de ce consommateur est-elle fondée?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : μ ≥ 22 vs H1 : μ < 22

° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon


α = 0,05 et n = 4

° Étape 3: Déterminer la distribution pour effectuer le test


Puisqu'on connaît σ et que la population est supposée se
distribuer normalement, on utilise la distribution normale

° Étape 4: Définir la région critique


Z0,05 = 1,64, par conséquent, la région critique est RC < -1,64

° Étape 5: Établir la règle de décision


Maintenir H0 si RC ≥ -1,64 OU rejeter H0 si RC < -1,64

° Étape 6: Faire les calculs nécessaires


Prélever l'échantillon et calculer

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone de rejet, on doit rejeter H 0 .
Par conséquent, la plainte du consommateur semble être fondée

Suite > TEST D'HYPOTHÈSE SUR UNE MOYENNE LORSQUE σ EST INCONNU

file:///C|/B%20-%20Jean/PSY1300/C8P8.html[2020-04-30 09:31:35]
TEST D'HYPOTHÈSE SUR UNE MOYENNE LORSQUE σ EST INCONNU

TEST D'HYPOTHÈSE SUR UNE MOYENNE


LORSQUE σ EST INCONNU
On sait que, lorsque σ est inconnu et qu'il doit être estimé par s, la différence
standardisée (selon ) entre et μHo ne se distribue pas normalement, mais selon
une distribution t et ce, peu importe la taille de l'échantillon. Si la taille est petite
(n < 30), on doit néanmoins supposer que la population se distribue normalement

Dans cette situation, le test d'hypothèse sur une moyenne se fait de la façon
suivante (note: les étapes 1, 2, 5 et 7 sont identiques à celles du cas précédent)

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


Soit une des trois possibilités suivantes:
(1) H0 : μ = μHo vs H1 : μ ≠ μHo
(2) H0 : μ ≤ μHo vs H1 : μ > μHo
(3) H0 : μ ≥ μHo vs H1 : μ < μHo
° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon
α est déterminée a priori (e.g. α = 0,05) et n doit tenter de minimiser α et β
° Étape 3: Déterminer la distribution pour effectuer le test
Il s'agit de la distribution t de Student
° Étape 4: Définir la région critique
Hypothèse Zone de rejet Zone d'acceptation

(1) RC > t α/2 ou RC < -t α/2 -t α/2 ≤ RC ≤ t α/2

(2) RC > t α RC ≤ t α

(3) RC < -t α RC ≥ -t α

où la valeur de t est donnée pour n-1 degrés de liberté


° Étape 5: Établir la règle de décision
Maintenir H0 si la différence standardisée
entre et μHo se situe dans la région d'acceptation
ou
Rejeter H0 si la différence standardisée
entre et μHo se situe dans la région de rejet
° Étape 6: Faire les calculs nécessaires
Prélever un échantillon et calculer le rapport critique

° Étape 7: Prendre la décision


Rejeter H0 si la valeur de RC se situe dans la zone de rejet, sinon maintenir H 0

Exemple I
Prenons l'exemple de nos cinq psychologues, mais supposons encore qu'il s'agisse
d'un nouvel instrument pour lequel on ignore la valeur de σ, mais dont on a de
bonnes raisons de croire que les scores se distribuent normalement. On veut
vérifier si le score moyen des psychologues est différent de 100, pour α = 0,05.

file:///C|/B%20-%20Jean/PSY1300/C8P9.html[2020-04-30 09:31:36]
TEST D'HYPOTHÈSE SUR UNE MOYENNE LORSQUE σ EST INCONNU

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : μ = 100 vs H1 : μ ≠ 100

° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon


α = 0,05 et n = 5

° Étape 3: Déterminer la distribution pour effectuer le test


Puisque la distribution est (supposée) normale et que σ
doit être estimé par s, on doit utiliser la distribution t

° Étape 4: Définir la région critique


Pour dl = 5-1 = 4, on a t 0,025 = 2,776,
par conséquent, la région critique est RC < -2,776 ou RC > 2,776

° Étape 5: Établir la règle de décision


Maintenir H0 si -2,776 ≤ RC ≤ 2,776 OU
Rejeter H0 si RC < -2,776 ou RC > 2,776

° Étape 6: Faire les calculs nécessaires


Prélever un échantillon de cinq personnes et calculer
(rappel: on avait = 88 et = 6,40)

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone d'acceptation, on doit maintenir H 0 .
En d'autres termes, on maintient l'hypothèse du score moyen de 100

NOTE IMPORTANTE: On serait arrivé à la même conclusion en considérant


l'intervalle de confiance construit à la partie précédente
En effet, l'intervalle obtenu pour α = 0,05, est: 70,23 ≤ μ ≤ 105,77

Exemple II (# 27)
Des ampoules dont la durée de vie moyenne est de 750 heures sont entreposées
depuis plusieurs années. On craint que ce long séjour n'ait réduit la durée de vie
des ampoules. En supposant que la durée de vie se distribue normalement, on
prend 10 ampoules dont la durée de vie moyenne est 710 heures avec un écart type
de 40 heures. Au seuil de 0,10, doit-on conclure que la durée de vie des
ampoules entreposées est significativement réduite?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : μ ≥ 750 vs H1 : μ < 750

° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon


α = 0,10 et n = 10

° Étape 3: Déterminer la distribution pour effectuer le test


Puisque la distribution est normale et que σ doit
être estimé par s, on utilise la distribution t

° Étape 4: Définir la région critique

file:///C|/B%20-%20Jean/PSY1300/C8P9.html[2020-04-30 09:31:36]
TEST D'HYPOTHÈSE SUR UNE MOYENNE LORSQUE σ EST INCONNU

Pour dl = 10-1 = 9, on a t 0,10 = 1,383


par conséquent, la région critique est RC < -1,383

° Étape 5: Établir la règle de décision


Maintenir H0 si RC ≥ -1,383 OU
Rejeter H0 si RC < -1,383

° Étape 6: Faire les calculs nécessaires


Prélever un échantillon de dix ampoules et calculer

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone de rejet, on doit rejeter H 0 et accepter H1
En d'autres termes, la durée de vie des ampoules semble effectivement plus courte

Exemple III (# 24)


Charles affirme que son score moyen au golf est 75. Charles a la réputation d'être
un fieffé menteur (quoique son score au golf se distribue à peu près normalement).
Vous l'observez pendant 9 rondes et vous calculez que pour ces rondes,
la moyenne est de 80 coups avec un écart type de 4 coups.
Au seuil de 0,01, qu'allez-vous conclure?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : μ ≤ 75 vs H1 : μ > 75

° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon


α = 0,01 et n = 9

° Étape 3: Déterminer la distribution pour effectuer le test


Puisque la distribution est (pratiquement) normale et que σ doit
être estimé par s, on utilise la distribution t

° Étape 4: Définir la région critique


Pour dl = 9-1 = 8, on a t 0,01 = 2,896
par conséquent, la région critique est RC > 2,896

° Étape 5: Établir la règle de décision


Maintenir H0 si RC ≤ 2,896 OU
Rejeter H0 si RC > 2,896

° Étape 6: Faire les calculs nécessaires


Prélever un échantillon de neuf rondes et calculer

file:///C|/B%20-%20Jean/PSY1300/C8P9.html[2020-04-30 09:31:36]
TEST D'HYPOTHÈSE SUR UNE MOYENNE LORSQUE σ EST INCONNU

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone de rejet, on doit rejeter H 0 et accepter H1
En d'autres termes, Charles est quelque peu menteur

Suite > TEST D'HYPOTHÈSE SUR UN POURCENTAGE

file:///C|/B%20-%20Jean/PSY1300/C8P9.html[2020-04-30 09:31:36]
TEST D'HYPOTHÈSE SUR UN POURCENTAGE

TEST D'HYPOTHÈSE SUR UN POURCENTAGE


On sait que lorsque la taille échantillonnale est suffisamment élevée (n ≥ 30),
la distribution d'échantillonnage des pourcentages est approximativement normale

Dans ce cas, la méthode pour faire un test d'hypothèse sur un pourcentage


est essentiellement la même que celle du test sur la moyenne.

La seule différence importante réside dans la façon de calculer le rapport critique

Dans ce cas-ci

où π Ho est la valeur présumée du pourcentage de la population et

De plus, puisqu'on a directement la valeur de l'erreur type, si l'hypothèse


nulle est vraie, la distribution de référence est la distribution normale
i.e. le rapport critique est une cote Z

Exemple I
Reprenons l'exemple de l'étudiant norvégien qui voulait savoir s'il avait des
chances de remporter les élections à la présidence de l'Association des étudiants/es
Rappelons que p = 22%, n = 50 et α = 0,005

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : π ≥ 50% vs H1 : π < 50%

° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon


α = 0,005 et n = 50

° Étape 3: Déterminer la distribution pour effectuer le test


On prend la distribution normale (puisque n est suffisamment grand)

° Étape 4: Définir la région critique


Z0,005 = 2,58, par conséquent, la région critique est RC < -2,58

° Étape 5: Établir la règle de décision


Maintenir H0 si RC ≥ -2,58 OU
Rejeter H0 si RC < -2,58

° Étape 6: Faire les calculs nécessaires


Prélever un échantillon de 50 personnes et calculer

et

file:///C|/B%20-%20Jean/PSY1300/C8P10.html[2020-04-30 09:31:37]
TEST D'HYPOTHÈSE SUR UN POURCENTAGE

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone de rejet, on doit rejeter H 0 et accepter H1
En d'autres termes, l'étudiant a peu de chances d'être élu

NOTE: dans le cas des pourcentages, la relation entre l'intervalle de confiance et


le test d'hypothèse n'est pas directe puisqu'on n'utilise pas la même valeur pour σp

Exemple II (# 21)
Le principal commanditaire de l'émission La Cuisine Rapide dit que l'émission
devra être retirée de l'horaire si elle ne rejoint pas au moins 25% de l'auditoire
potentiel. Dans un échantillon aléatoire de 1250 téléspectateurs, 260 affirment
regarder l'émission. Au seuil de 0,05, l'émission devrait-elle être retirée?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : π ≥ 25% vs H1 : π < 25%

° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon


α = 0,05 et n = 1250

° Étape 3: Déterminer la distribution pour effectuer le test


On prend la distribution normale (puisque n est suffisamment grand)

° Étape 4: Définir la région critique


Z0,05 = 1,64, par conséquent, la région critique est RC < -1,64

° Étape 5: Établir la règle de décision


Maintenir H0 si RC ≥ -1,64 OU
Rejeter H0 si RC < -1,64

° Étape 6: Faire les calculs nécessaires


Prélever l'échantillon et calculer p = 260/1250 = 20,8%,

et

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone de rejet, on doit rejeter H 0 et accepter H1
En d'autres termes, l'émission devrait peut-être être retirée des ondes

Suite > NOTIONS PRÉLIMINAIRES

file:///C|/B%20-%20Jean/PSY1300/C8P10.html[2020-04-30 09:31:37]
NOTIONS PRÉLIMINAIRES

NOTIONS PRÉLIMINAIRES
La méthode du test d'hypothèse vue précédemment
est une méthode très générale de l'inférence statistique

On généralisera ici cette notion à l'analyse de la différence entre deux populations


i.e. on tentera de déterminer, à partir d'un échantillon de chaque population, si ces
populations sont différentes en ce qui a trait à une caractéristique donnée
(On verra ici les différences de moyennes et de pourcentages)

Note importante: Les méthodes présentées ici se restreignent


aux situations où les échantillons sont indépendants
i.e. qu'ils proviennent de groupes différents et que l'échantillon prélevé dans l'un
des groupes n'est d'aucune façon relié à l'échantillon prélevé dans l'autre groupe
Ainsi, toutes les situations où les unités sont appariées, de quelque façon que
ce soit, ne sauraient faire appel aux méthodes présentées dans cette partie

On a vu que tout test d'hypothèse repose sur la comparaison d'un indice à une
distribution d'échantillonnage présumée par la validité de l'hypothèse nulle

Si cet indice calculé à partir des données échantillonnales a peu de chances de se


produire, si l'hypothèse nulle était vraie, alors on rejette cette hypothèse

Dans les cas présentés ci-dessous, cet indice est une différence
entre deux moyennes (ou deux pourcentages) d'échantillon.
Puisqu'il s'agit d'indices statistiques,
une certaine erreur est associée à chacun d'eux.
Par conséquent, la différence entre deux moyennes (ou deux pourcentages)
d'échantillon contient aussi une certaine part d'erreur.
Il est donc essentiel de déterminer ce qu'est la distribution d'échantillonnage
de la différence entre ces deux moyennes (ou ces deux pourcentages)

Suite > DISTRIBUTION D'ÉCHANTILLONNAGE DE LA DIFFÉRENCE ENTRE DEUX MOYENNES

file:///C|/B%20-%20Jean/PSY1300/C8P11.html[2020-04-30 09:31:37]
DISTRIBUTION D'ÉCHANTILLONNAGE DE LA DIFFÉFRENCE ENTRE DEUX MOYENNES

DISTRIBUTION D'ÉCHANTILLONNAGE
DE LA DIFFÉRENCE ENTRE DEUX MOYENNES
Soit A la distribution
d'échantillonnage des
moyennes d'une première
population
et B la distribution
d'échantillonnage des
moyennes d'une seconde
population

En choisissant une moyenne


échantillonnale de la
distribution A et une autre
de la distribution B,
on pourrait calculer la
différence d = 1 - 2

On pourrait répéter cette opération pour toutes les combinaisons possibles


d'échantillons et faire la distribution de tous les d ainsi obtenus
C'est cette distribution qui s'appelle la
distribution d'échantillonnage de la différence entre deux moyennes

À l'image du théorème limite central déjà présenté, on peut affirmer que:


° la moyenne de cette distribution est δ = μ1 - μ2
° l'écart type de cette distribution est donné par

et est appelé: erreur type de la différence entre deux moyennes


° cette distribution est (approximativement) normale
si les distributions A et B sont (approximativement) normales

Ainsi, on peut faire les mêmes étapes pour réaliser


un test d'hypothèse sur une différence entre deux moyennes

À noter que le même type d'analyse s'applique


à la différence entre deux pourcentages

Suite > TEST D'HYPOTHÈSE SUR DEUX MOYENNES LORSQUE LES σ SONT CONNUS

file:///C|/B%20-%20Jean/PSY1300/C8P12.html[2020-04-30 09:31:37]
TEST D'HYPOTHÈSE SUR DEUX MOYENNES LORSQUE LES σ SONT CONNUS

TEST D'HYPOTHÈSE SUR DEUX MOYENNES


LORSQUE LES σ SONT CONNUS
Lorsque σ1 et σ2 sont connus, on sait que la distribution d'échantillonnage de la
différences entre les moyennes est (approximativement) normale lorsque:
° soit la distribution de chacune des deux populations est normale
° ou soit la taille de chacun des deux échantillons
est suffisamment grande (n1 ≥ 30 et n2 ≥ 30)

Dans cette situation, le test d'hypothèse suit les étapes habituelles


mais en tenant compte des particularités suivantes

À l'étape 1: les hypothèses sont de la forme:


(1) H0 : μ1 - μ2 = δ vs H1 : μ1 - μ2 ≠ δ
(2) H0 : μ1 - μ2 ≤ δ vs H1 : μ1 - μ2 > δ
(3) H0 : μ1 - μ2 ≥ δ vs H1 : μ1 - μ2 < δ
où δ est la différence hypothétique entre les deux populations
(on pose souvent δ = 0, i.e. que les deux populations sont semblables)

° À l'étape 3: Puisque σ1 et σ2 sont connus, on utilise la distribution normale

° À l'étape 6: Le rapport critique est donné par la formule

Exemple
Deux machines, nommées 1 et 2, remplissent des sacs d'arachides. Grâce à de
nombreux contrôles de qualité, on sait que σ1 = 0,26 gramme et σ2 = 0,31 gramme.
Suite à un déménagement, on pense que les deux machines ne donnent
plus la même quantité d'arachides. Pour vérifier cette hypothèse, on prélève 50
sacs de la machine 1 et 60 sacs de la machine 2 et on obtient respectivement
1 = 50,60 et 2 = 50,30. Que peut-on conclure si on fixe α à 0,05?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : μ1 - μ2 = 0 vs H1 : μ1 - μ2 ≠ 0

°Étape 2: Choisir le seuil de signification du test et la taille des échantillons


α = 0,05, n1 = 50 et n2 = 60

° Étape 3: Déterminer la distribution pour effectuer le test


Puisque σ1 et σ2 sont connus, on utilise la distribution normale

° Étape 4: Définir la région critique

file:///C|/B%20-%20Jean/PSY1300/C8P13.html[2020-04-30 09:31:38]
TEST D'HYPOTHÈSE SUR DEUX MOYENNES LORSQUE LES σ SONT CONNUS

Z0,025 = 1,96, par conséquent, la région critique est RC < -1,96 ou RC > 1,96

° Étape 5: Établir la règle de décision


Maintenir H0 si -1,96 ≤ RC ≤ 1,96 OU
Rejeter H0 si RC < -1,96 ou RC > 1,96

° Étape 6: Faire les calculs nécessaires

d'où

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone de rejet, on doit rejeter H 0
En d'autres termes, les deux machines ne donnent pas des sacs de même poids

TEST D'HYPOTHÈSE SUR DEUX MOYENNES LORSQUE LES σ SONT INCONNUS

file:///C|/B%20-%20Jean/PSY1300/C8P13.html[2020-04-30 09:31:38]
TEST D'HYPOTHÈSE SUR DEUX MOYENNES LORSQUE LES σ SONT INCONNUS

TEST D'HYPOTHÈSE SUR DEUX MOYENNES


LORSQUE LES σ SONT INCONNUS
Lorsque σ1 et σ2 sont inconnus, on doit les estimer
à l'aide des écarts type échantillonnaux s 1 et s 2
De plus, l'erreur type de la différence entre les moyennes
ne peut être calculée directement et doit donc être estimée

Dans ce cas, le test d'hypothèse est de la même forme que le


test d'hypothèse sur deux moyennes lorsque les σ sont connus,
à l'exception du rapport critique qui est donné par

où l'erreur type est estimée de deux façons


différentes selon les conditions rencontrées

° Si les tailles n1 et n2 sont toutes deux suffisamment grandes (≥ 30)


Alors on estime l'erreur type par la formule

et le rapport critique résultant est approximativement une cote Z


-> Donc, à l'étape 3, on doit choisir une distribution normale

° Si n1 ou n2 est petite (< 30) et que l'on peut supposer que les distributions
des deux populations sont normales et de même écart type (i.e. σ1 = σ2 )
Alors, il faut d'abord calculer l'écart type commun

puis on estime l'erreur type par la formule

et le rapport critique résultant suit une distribution t avec d.l. = n1 + n2 - 2


-> Donc, à l'étape 3, on doit choisir une distribution t avec ce nombre de d.l.

Exemple I [tiré de Oakes, 1986]


On administre un test à 250 psychologues et à 250 psychiatres pour mesurer leur
tendances psychopathes. Pour l'échantillon de psychologues, on obtient
O = 50,7 et s O = 5,2 tandis que pour les psychiatres, I = 49,8 et s I = 5,1.
Peut-on conclure, à un seuil de signification de 5%, que les psychologues
sont plus psychopathes (i.e. ont un score plus élevé) que les psychiatres?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : μO - μI ≤ 0 vs H1 : μO - μI > 0

file:///C|/B%20-%20Jean/PSY1300/C8P14.html[2020-04-30 09:31:39]
TEST D'HYPOTHÈSE SUR DEUX MOYENNES LORSQUE LES σ SONT INCONNUS

° Étape 2: Choisir le seuil de signification du test et la taille des échantillons


α = 0,05, nO = 250 et nI = 250

° Étape 3: Déterminer la distribution pour effectuer le test


Puisque nO ≥ 30 et nI ≥ 30, on effectue une approximation
à l'aide de la distribution normale

° Étape 4: Définir la région critique


Z0,05 = 1,645, par conséquent, la région critique est RC > 1,645

° Étape 5: Établir la règle de décision


Maintenir H0 si RC ≤ 1,645 OU rejeter H0 si RC > 1,645

° Étape 6: Faire les calculs nécessaires

d'où

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone de rejet, on doit rejeter H 0
En d'autres termes, à partir de ces données, on pourrait conclure que les
psychologues semblent plus psychopathes que les psychiatres

Exemple II
Un pauvre professeur ose encore affirmer qu'il existe une différence entre les
hommes et les femmes sur un test d'habiletés spatio-cognitivo-émotives (sic!).
Encore pire, il prétend que les hommes ont un score de plus de deux points
supérieur à celui des femmes. Voici les données sur lesquelles repose son
affirmation: ° Hommes: 82, 80, 81, 84, 75 ° Femmes: 74, 79, 78, 71
Son affirmation est-elle digne d'intérêt au seuil de 5% (on suppose que σH = σF )?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : μH - μF ≤ 2 vs H1 : μH - μF > 2
° Étape 2: Choisir le seuil de signification du test et la taille des échantillons
α = 0,05, nH = 5 et nF = 4
° Étape 3: Déterminer la distribution pour effectuer le test
Puisque nH et nF sont petites, mais que σ H = σF , on utilise une distribution t
° Étape 4: Définir la région critique
On a d.l. = nH + nF - 2 = 5 + 4 - 2 = 7, donc t 0,05 = 1,895,
par conséquent, la région critique est RC > 1,895
° Étape 5: Établir la règle de décision
Maintenir H0 si RC ≤ 1,895 OU rejeter H0 si RC > 1,895
° Étape 6: Faire les calculs nécessaires
On calcule d'abord H = 80,4, s H = 3,36, F = 75,5 et s F = 3,70. Ensuite

file:///C|/B%20-%20Jean/PSY1300/C8P14.html[2020-04-30 09:31:39]
TEST D'HYPOTHÈSE SUR DEUX MOYENNES LORSQUE LES σ SONT INCONNUS

d'où

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone d'acceptation, on doit maintenir H 0
En d'autres termes, l'argument du professeur
est peu fondé par rapport aux données présentées

Suite > TEST D'HYPOTHÈSE SUR DEUX POURCENTAGES

file:///C|/B%20-%20Jean/PSY1300/C8P14.html[2020-04-30 09:31:39]
TEST D'HYPOTHÈSE SUR DEUX POURCENTAGES

TEST D'HYPOTHÈSE SUR


DEUX POURCENTAGES
Lorsque la taille des échantillons est suffisamment grande (n1 ≥ 30 et n2 ≥ 30),
on sait que la distribution d'échantillonnage de la différences entre
deux pourcentages est approximativement normale et son écart type,
appelé erreur type de la différence des pourcentages, est donné par

Mais, on ignore π 1 et π 2 (c'est ce qu'on cherche) et on doit les estimer à l'aide des
pourcentages échantillonnaux, i.e. p1 et p2 . Par suite, on estime l'erreur type par

(attention aux dénominateurs)


Dans cette situation, le test d'hypothèse suit les étapes habituelles
mais en tenant compte des particularités suivantes

° À l'étape 1: les hypothèses sont de la forme:


(1) H0 : π 1 - π 2 = δ vs H1 : π 1 - π 2 ≠ δ
(2) H0 : π 1 - π 2 ≤ δ vs H1 : π 1 - π 2 > δ
(3) H0 : π 1 - π 2 ≥ δ vs H1 : π 1 - π 2 < δ
où δ est la différence hypothétique de pourcentages entre les deux populations
(on pose souvent δ = 0%, i.e. que les deux populations sont semblables)

° À l'étape 3: Puisque n1 et n2 sont grands, on utilise la distribution normale

° À l'étape 6: Le rapport critique est donné par la formule

Exemple (#14)
Le directeur d'un collège affirme que les élèves de son collège (groupe 1) se
trouvent plus facilement un emploi d'été que les élèves du collège voisin
(groupe 2). Un échantillon aléatoire de 200 élèves du groupe 1 montre que 55
d'entre eux se sont trouvé un emploi d'été alors que, pour un échantillon de 150
élèves du groupe 2, le nombre est 40. Au seuil de 1%, le directeur a-t-il raison?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : π 1 - π 2 ≤ 0 vs H1 : π 1 - π 2 > 0

file:///C|/B%20-%20Jean/PSY1300/C8P15.html[2020-04-30 09:31:39]
TEST D'HYPOTHÈSE SUR DEUX POURCENTAGES

° Étape 2: Choisir le seuil de signification du test et la taille des échantillons


α = 0,01, n1 = 200 et n2 = 150

° Étape 3: Déterminer la distribution pour effectuer le test


Puisque n1 et n2 sont grandes, on utilise la distribution normale

° Étape 4: Définir la région critique


Z0,01 = 2,326, par conséquent, la région critique est RC > 2,326

° Étape 5: Établir la règle de décision


Maintenir H0 si RC ≤ 2,326 OU rejeter H0 si RC > 2,326

° Étape 6: Faire les calculs nécessaires


Notons d'abord que p1 = 55/200 = 27,50% et p2 = 40/150 = 26,67%. Donc

d'où

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone d'acceptation, on doit maintenir H 0
En d'autres termes, les données sont insuffisantes pour justifier l'argument du
directeur. Il se semble pas que ses élèves trouvent plus facilement un emploi

Suite > DIFFÉRENCE SIGNIFICATIVE ET DIFFÉRENCE SIGNIFIANTE

file:///C|/B%20-%20Jean/PSY1300/C8P15.html[2020-04-30 09:31:39]
DIFFÉRENCE SIGNIFICATIVE ET DIFFÉRENCE SIGNIFIANTE

DIFFÉRENCE SIGNIFICATIVE
ET DIFFÉRENCE SIGNIFIANTE
Il est FONDAMENTAL de se rappeler que lorsqu'une différence est dite
significative, ce terme est entendu au sens strictement statistique

Après le calcul, il faut nécessairement juger l'AMPLEUR


de cette différence à la lumière de nos questions de recherche

La différence entre deux populations peut être jugée significative


du point vue statistique, mais insignifiante sur le plan conceptuel

Par exemple, si deux échantillons de 1250 personnes sont sélectionnés


au hasard et que leur pourcentage respectif est p1 = 49% et p2 = 51%,
on rejettera l'hypothèse nulle H0 : π 1 - π 2 = 0 au seuil de signification de 5%.
π 1 doit effectivement être situé proche de 49% et π 2 doit être proche de 51%.
Mais, ce maigre ≈2% de différence entre les deux populations peut, dans certain
cas, n'être que d'intérêt réduit pour distinguer ces deux populations

Vu d'une autre façon, on peut reprendre l'exemple des 250 psychologues et des
250 psychiatres donné précédemment. On se rappelle que le calcul du rapport
critique (RC = 1,95) nous amenait à conclure que les psychologues sont plus
psychopathes que les psychiatres. Posons maintenant la question suivante:
«Si on plaçait ces 500 personnes en ordre descendant sur le score de psychopathie
et qu'on formait un groupe avec les 250 personnes les plus psychopathes, combien
ce groupe contiendrait-il de psychologues et de psychiatres?»
On pourrait démontrer que la réponse est:
«à peu près 134 psychologues et 116 psychiatres»

En pratique, on doit calculer des indices pour mesurer l'ampleur d'une différence
On pourrait, par exemple, exprimer la différence entre les groupes en termes
d'écarts types; ainsi, dans cet exemple, la différence entre les deux échantillons est
de 0,9 alors que l'écart type est de 5,1 ou 5,2. Par conséquent, la différence est
de 0,9/5,15 = 0,175 écart type
De même, on pourrait transformer le RC critique en coefficient de détermination

Ce qui démontre que le pourcentage de variance expliquée est très faible

Suite > CHAPITRE 9: COMPARAISON DE PLUSIEURS POURCENTAGES ÉCHANTILLONNAUX

file:///C|/B%20-%20Jean/PSY1300/C8P16.html[2020-04-30 09:31:40]
CHAPITRE 9: COMPARAISON DE PLUSIEURS POURCENTAGES ÉCHANTILLONNAUX

CHAPITRE 9: COMPARAISON DE PLUSIEURS POURCENTAGES


ÉCHANTILLONNAUX

Comparaison de plusieurs pourcentages échantillonnaux

Distribution du χ 2
Méthode générale du test de χ 2
Test de comparaison de plusieurs pourcentages
Test d'ajustement analytique

Suite > DISTRIBUTION DU χ 2

file:///C|/B%20-%20Jean/PSY1300/C9P0.html[2020-04-30 09:31:40]
DISTRIBUTION DU χ<sup>2</sup>

DISTRIBUTION DU χ 2
Lorsqu'on désire comparer plus de deux pourcentages échantillonnaux,
il est essentiel d'introduire une nouvelle distribution de probabilités:
la distribution du χ 2 (khi-carré)

DESCRIPTION
Une distribution de χ 2 résulte de l'addition d'un certain nombre de variables
aléatoires indépendantes mises au carré, chacune de ces variables étant une cote Z
i.e. χ 2 = Z1 2 + Z2 2 + ... Zi2
La quantité de variables impliquées donne le nombre de degré de liberté (d.l.)
Ce nombre détermine la forme de la courbe
Celle-ci est positivement dissymétrique pour des petites valeurs de d.l.,
mais s'approche progressivement de la distribution normale
à mesure que le nombre de d.l. augmente
On note également que, pour ces distributions, μ = d.l.

Graphiquement, on a

Les tests impliquant la distribution du χ 2 serviront toujours à déterminer


si le χ 2 calculé à partir des données échantillonnales (donc, une somme
d'écarts au carré) est significativement différent de 0

Une valeur de χ 2 critique détermine la zone pour laquelle un χ 2 calculé a peu de


chances (selon ) d'être aussi élevé si l'hypothèse nulle est vraie. Par conséquent,
la zone de rejet se situera toujours à l'extrémité droite de la distribution

file:///C|/B%20-%20Jean/PSY1300/C9P1.html[2020-04-30 09:31:40]
DISTRIBUTION DU χ<sup>2</sup>

À l'image de la distribution t, on a une table (voir l'annexe 6) pour déterminer


la valeur de χ 2 pour un certain seuil et un certain nombre de d.l.
En voici un extrait
d.l. 0,10 0,05 0,01

1 2,706 3,841 6,635

2 4,605 5,991 9,210

3 6,251 7,815 11,345

4 7,779 9,488 13,277

5 9,236 11,070 15,086

Par exemple, pour d.l. = 5 et = 0,10, on obtient la valeur critique 9,236


En d'autres termes, si les cinq écarts (au carré) indépendants obtenus
empiriquement proviennent véritablement de distributions normales centrées
réduites, il y a 10% des chances que la valeur de χ 2 calculée dépasse 9,236

Suite > MÉTHODE GÉNÉRALE DU TEST DE χ 2

file:///C|/B%20-%20Jean/PSY1300/C9P1.html[2020-04-30 09:31:40]
MÉTHODE GÉNÉRALE DU TEST DE χ<sup>2</sup>

MÉTHODE GÉNÉRALE DU TEST DE χ 2


Dans un test de χ 2 , il s'agit d'évaluer l'importance des écarts entre des fréquences
d'occurrence (ou des pourcentages) observées à l'intérieur d'échantillons aléatoires
et des fréquences (ou des pourcentages) théoriques espérées qui devrait être
observées si l'hypothèse nulle soumise au test était vraie

De façon générale, les étapes du test de χ 2 sont les suivantes:

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


Dans ce cas, l'hypothèse nulle affirme qu'il n'existe aucune différence significative
(i.e non attribuable à l'erreur d'échantillonnage) entre les fréquences observées
dans les populations et les fréquences attendues (i.e. hypothétiques)

° Étape 2: Choisir le seuil de signification du test

° Étape 3: Prélever des échantillons aléatoires de chaque population


et relever, pour chacun, les fréquences observées

° Étape 4: Calculer les fréquences théoriques espérées (ou les pourcentages)


que l'on devrait observer si l'hypothèse nulle était vraie

° Étape 5: À partir de fréquences observées (fo ) et des fréquences théoriques


espérées (fe), calculer la valeur de χ 2 à l'aide de la formule

On note que si toutes les fréquences observées étaient égales aux fréquences
espérées, cette somme serait égale à 0. Donc 0 est la valeur idéale que devrait
prendre la valeur du χ 2 lorsque H0 est vraie.

° Étape 6: Comparer la valeur du χ 2 calculée à l'étape 5 avec la valeur critique de


la table de χ 2 (selon α et d.l.) afin de déterminer si le χ 2 calculé est
significativement différent de 0. Si c'est le cas, c'est donc que ce χ 2 a si peu de
chance d'être aussi élevé, si l'hypothèse nulle était vraie, qu'on en conclut que
l'hypothèse nulle est probablement fausse

Suite > TEST DE COMPARAISON DE PLUSIEURS POURCENTAGES

file:///C|/B%20-%20Jean/PSY1300/C9P2.html[2020-04-30 09:31:41]
TEST DE COMPARAISON DE PLUSIEURS POURCENTAGES

TEST DE COMPARAISON DE PLUSIEURS POURCENTAGES


Exemple I

Supposons que l'on demande à un certain nombre d'étudiants/es de trois modules


de l'université s'ils/elles désirent prendre un cours de statistiques à la prochaine
session. On veut savoir, au seuil de 5%, si le pourcentage de gens qui songent à
s'inscrire est identique dans chaque module. Les résultats obtenus, présentés sous
forme de tableau de contingences, sont les suivants
MODULE Psychologie Administration Mathématiques Total
RÉPONSE

Oui 30 32 25 87

Non 60 80 40 180

Total 90 112 65 267

Voici comment réaliser le test d'hypothèse correspondant

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative

H0 : le pourcentage des populations désirant s'inscrire à un cours


de statistiques est le même dans chaque module
vs
H1 : le pourcentage des populations désirant s'inscrire à un cours
de statistiques n'est pas le même dans chaque module

Attention: il n'est pas question ici de vérifier que le pourcentage de gens disant
«oui» est le même que le pourcentage de gens disant «non». Il ne s'agit pas non
plus de vérifier qu'il y a le même pourcentage de gens dans chaque module.

Une autre façon, équivalente, de formuler les hypothèses, serait:

H0 : le désir de s'inscrire à un cours de statistiques


est indépendant du module auquel appartient l'étudiant/e
vs
H1 : le désir de s'inscrire à un cours de statistiques
est dépendant du module auquel appartient l'étudiant/e

° Étape 2: Choisir le seuil de signification du test


Ce seuil réfère toujours à la probabilité de commettre
une erreur de type I lorsque l'hypothèse nulle est vraie.
Le seuil choisi ici est α = 0,05

° Étape 3: Prélever des échantillons et relever les fréquences observées


(voir le tableau de la page précédente)

° Étape 4: Calculer les fréquences théoriques espérées si H 0 était vraie

On remarque que, au total, 87 personnes, sur les 267 interrogées, désirent


effectivement s'inscrire à un cours de statistiques, soit 32,58%

file:///C|/B%20-%20Jean/PSY1300/C9P3.html[2020-04-30 09:31:41]
TEST DE COMPARAISON DE PLUSIEURS POURCENTAGES

Par conséquent, si l'hypothèse nulle était vraie, 32,58% de 90 étudiants/es en


psychologie devraient vouloir suivre un cours de statistiques, i.e.
32,58% × 90 = (87/267) × 90 = 29,33 personnes

Ce nombre correspond à la fréquence théorique espérée


pour la case «Oui - Psychologie» du tableau de contingence

De la même façon, on pourrait calculer cette fréquence théorique pour


chaque cellule; par exemple, pour la case «Non - Mathématiques», on a
(180/267) × 65 = 43,82

La formule générale pour calculer les fréquences théoriques espérées est

qui permet de construire le tableau des fréquences théoriques suivant


MODULE
Psychologie Administration Mathématiques Total
RÉPONSE

Oui 29,33 30 36,49 32 21,18 25 87


Non 60,67 60 75,51 80 43,82 40 180

Total 90 112 65 267

° Étape 5: Calculer la valeur de χ 2


On complète le tableau de calcul suivant
Case (l/c) fo fe fo - fe (fo - f e) 2 (fo - f e) 2 /fe

1-1 30 29,33 0,67 0,45 0,02

1-2 32 36,49 -4,49 20,16 0,55

1-3 25 21,18 3,82 14,59 0,69

2-1 60 60,67 -0,67 0,45 0,01

2-2 80 75,51 4,49 20,16 0,27

2-3 40 43,82 -3,82 14,59 0,33

Σ 267 267,00 0,00 1,87

Où, pour vérifier les calculs, on a


Σf o = Σf e et Σ (fo - f e) = 0

Finalement

° Étape 6: Comparer la valeur du χ 2 calculée avec la valeur critique de la table

file:///C|/B%20-%20Jean/PSY1300/C9P3.html[2020-04-30 09:31:41]
TEST DE COMPARAISON DE PLUSIEURS POURCENTAGES

Pour déterminer la valeur du χ 2 critique, on doit connaître α et d.l.

Pour un tableau de contingences, le nombre de d.l. est donné par la formule


d.l. = (l - 1)(c - 1)
où l = le nombre de lignes du tableau
et c = le nombre de colonnes du tableau

Ici = 0,05 et d.l. = (2 - 1)(3 - 1) = 1 × 2 = 2


À l'annexe 6, on voit que, pour ces valeurs, le χ 2 critique est 5,991

Puisque le χ 2 calculé (1,87) est inférieur à la valeur critique, on doit maintenir H0

En d'autres termes, il semble que le pourcentage de gens qui désirent


suivre un cours de statistiques est le même dans chaque module

Exemple II (#9)

Pour cerner l'opinion des travailleurs sur un éventuel changement aux règles de
régie interne de la centrale syndicale qui les représente, l'exécutif a fait parvenir
un questionnaire à 100 membres de trois syndicats affiliés.
Les résultats du sondage apparaissent dans le tableau ci-dessous
SYNDICAT x y z
OPINION

Pour 17 23 10

Contre 9 13 8

Indécis 4 4 12

Au seuil de 0,05, les travailleurs des trois syndicats


diffèrent-ils significativement d'opinion?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : les pourcentages d'opinion sont les mêmes pour chaque syndicat
vs
H1 : les pourcentages d'opinion sont différents selon le syndicat

° Étape 2: Choisir le seuil de signification du test


Le seuil choisi ici est α = 0,05

° Étape 3: Prélever des échantillons et relever les fréquences observées


(voir le tableau ci-dessus)

° Étape 4: Calculer les fréquences théoriques espérées si H 0 était vraie


On complète le tableau suivant
SYNDICAT
x y z Total
OPINION

Pour 15 17 20 23 15 10 50

Contre 9 9 12 13 9 8 30

file:///C|/B%20-%20Jean/PSY1300/C9P3.html[2020-04-30 09:31:41]
TEST DE COMPARAISON DE PLUSIEURS POURCENTAGES

Indécis 6 4 8 4 6 12 20

Total 30 40 30 100

° Étape 5: Calculer la valeur de χ 2


On complète le tableau de calcul suivant
Case (l/c) fo fe fo - fe (fo - f e) 2 (fo - f e) 2 /fe

1-1 17 15 2 4 0,27

1-2 23 20 3 9 0,45

1-3 10 15 -5 25 1,67

2-1 9 9 0 0 0,00

2-2 13 12 1 1 0,08

2-3 8 9 -1 1 0,11

3-1 4 6 -2 4 0,67

3-2 4 8 -4 16 2,00

3-3 12 6 6 36 6,00

Σ 100 100 0 11,25

Donc

° Étape 6: Comparer la valeur du χ 2 calculée avec la valeur critique de la table


Pour α = 0,05 et d.l. = (3 - 1)(3 - 1) = 2 × 2 = 4 on a un χ 2 critique de 9,488
Puisque le χ 2 calculé est supérieur à la valeur critique,
on doit rejeter H0 et accepter H1
En d'autres termes, les travailleurs des trois syndicats semblent différer d'opinion

Notes
° On pourrait analyser plus en détail cette relation, mais il faudrait faire des
tests a posteriori. On peut néanmoins noter que, par exemple, les travailleurs
du syndicat z sont particulièrement «indécis» puisqu'on remarque que f o > f e;
en contrepartie, ils semblent moins «pour» puisque, pour cette cellule, f o < f e

° Il est important de noter que le test de comparaison de plusieurs pourcentages,


tel que présenté ci-dessus, n'est adéquat que si toutes les
fréquences théoriques espérées sont supérieures ou égales à 5

Suite > TEST D'AJUSTEMENT ANALYTIQUE

file:///C|/B%20-%20Jean/PSY1300/C9P3.html[2020-04-30 09:31:41]
TEST D'AJUSTEMENT ANALYTIQUE

TEST D'AJUSTEMENT ANALYTIQUE


Le test d'ajustement analytique est une application particulière du test de χ 2
Il permet de déterminer si une population donnée suit une distribution
particulière connue (e.g. une distribution normale, de Poisson, etc.)

Pour ce type de test, l'hypothèse nulle spécifie toujours


que la distribution de la population est de la forme supposée

Les étapes du test sont identiques à celles vues précédemment

Le nombre de degrés de liberté sera toujours déterminé


par le nombre de classes moins le nombre de relations qui lient
la distribution théorique à la distribution réelle

Exemple I

Vous affirmez que le nombre de pannes de métro n'est pas identique sur
chaque ligne. Vous relevez les pannes pendant un mois. Voici les résultats:
LIGNE FRÉQUENCE

Verte 56

Orange 66

Bleue 44

Jaune 54

Au seuil de 0,05, que peut-on conclure?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : le pourcentage de pannes est identique sur chaque ligne métro
vs
H1 : le pourcentage de pannes est différent selon la ligne de métro
(la distribution présumée est donc une distribution uniforme)

° Étape 2: Choisir le seuil de signification du test


Le seuil choisi ici est α = 0,05

° Étape 3: Prélever un échantillon et relever les fréquences observées


(voir le tableau de la page précédente)

° Étape 4: Calculer les fréquences théoriques espérées si H 0 était vraie


Si H0 était vraie, on devrait avoir le même nombre de pannes sur chaque ligne
Comme il y a 4 lignes et un total de 220 pannes, on a: f e = ¼(220) = 55

° Étape 5: Calculer la valeur de χ 2


On complète le tableau de calcul suivant
Ligne fo fe fo - fe (fo - f e) 2 (fo - f e) 2 /fe

file:///C|/B%20-%20Jean/PSY1300/C9P4.html[2020-04-30 09:31:42]
TEST D'AJUSTEMENT ANALYTIQUE

Verte 56 55 1 1 0,02

Orange 66 55 11 121 2,20

Bleue 44 55 -11 121 2,20

Jaune 54 55 -1 1 0,02

Σ 220 220 0 4,44

Donc

° Étape 6: Comparer la valeur du χ 2 calculée avec la valeur critique de la table


Le nombre de relations liant les deux distributions est 1
puisque seule la fréquence totale est supposée identique
Pour = 0,05 et d.l. = 4 - 1 = 3 on a un χ 2 critique de 7,815
Puisque le χ 2 calculé est inférieur à la valeur critique, on doit maintenir H0

En d'autres termes, les données ne permettent pas de montrer pas que


le nombre de pannes est différent sur chaque ligne de métro

Exemple II
Vous soutenez que la distribution du poids des grains
de fromage de la poutine uqamienne est une distribution normale
À partir d'un échantillon de 200 grains, vous obtenez une moyenne de 6
grammes, un écart-type de 1 gramme et le tableau de fréquences suivant:
POIDS (grammes) FRÉQUENCE

x<4 6

4≤x<5 27

5≤x<6 70

6≤x<7 67

7≤x<8 26

8≤x 4

Au seuil de 1%, peut-on affirmer que la distribution de la population est normale?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : la distribution de la population des poids est une distribution normale
vs
H1 : la distribution de la population des poids n'est pas une distribution normale

° Étape 2: Choisir le seuil de signification du test


Le seuil choisi ici est α = 0,01

file:///C|/B%20-%20Jean/PSY1300/C9P4.html[2020-04-30 09:31:42]
TEST D'AJUSTEMENT ANALYTIQUE

° Étape 3: Prélever un échantillon et relever les fréquences observées

° Étape 4: Calculer les fréquences théoriques espérées si H 0 était vraie


Si H0 était vraie, le nombre de grains dans chacune des classes du tableau
ci-dessus devrait respecter les probabilités données par la table de la distribution
normale. Ici, on pose μ = 6 et σ = 1; d'où le tableau
POIDS Valeurs Z P(Z) f e = 200 × P(Z)

x<4 Z < -2 0,0228 4,56

4≤x<5 -2 ≤ Z < -1 0,1359 27,18

5≤x<6 -1 ≤ Z < 0 0,3413 68,26

6≤x<7 0≤Z<1 0,3413 68,26

7≤x<8 1≤Z<2 0,1359 27,18

8≤x 2≤Z 0,0228 4,56

° Étape 5: Calculer la valeur de χ 2


On complète le tableau de calcul suivant
Poids fo fe fo - fe (fo - f e) 2 (fo - f e) 2 /fe

x<4 6 4,56 1,44 2,07 0,4539

4≤x<5 27 27,18 -0,18 0,03 0,0011

5≤x<6 70 68,26 1,74 3,03 0,0444

6≤x<7 67 68,26 -1,26 1,59 0,0233

7≤x<8 26 27,18 -1,18 1,39 0,0511

8≤x 4 4,56 -0,56 0,31 0,0680

Σ 200 200,00 0,00 0,6418

Donc

° Étape 6: Comparer la valeur du χ 2 calculée avec la valeur critique de la table


Le nombre de relations liant les deux distributions est 3 puisque
(1) la fréquence totale, (2) la moyenne et (3) l'écart type sont supposés identiques
Pour α = 0,01 et d.l. = 6 - 3 = 3 on a un χ 2 critique de 11,345
Puisque le χ 2 calculé est inférieur à la valeur critique, on doit maintenir H0

En d'autres termes, jusqu'à preuve du contraire, le poids


des grains de poutine semble se distribuer normalement

file:///C|/B%20-%20Jean/PSY1300/C9P4.html[2020-04-30 09:31:42]
TEST D'AJUSTEMENT ANALYTIQUE

Suite > CHAPITRE 10: ANALYSE DE RÉGRESSION LINÉAIRE

file:///C|/B%20-%20Jean/PSY1300/C9P4.html[2020-04-30 09:31:42]
CHAPITRE 10: ANALYSE DE RÉGRESSION LINÉAIRE

CHAPITRE 10: ANALYSE DE RÉGRESSION LINÉAIRE

Analyse de régression linéaire


Analyse de régression et de corrélation: rappels
L'erreur type de l'estimation
Test d'hypothèse sur la pente

file:///C|/B%20-%20Jean/PSY1300/C10P0.html[2020-04-30 09:31:42]
ANALYSE DE RÉGRESSION ET DE CORRÉRRLATION: RAPPELS

ANALYSE DE RÉGRESSION
ET DE CORRÉLATION: RAPPELS
L'analyse de régression permet de déduire une équation d'estimation qui décrit la
nature fonctionnelle de la relation entre deux variables, alors que
l'analyse de corrélation donne une mesure de la force de cette relation

En formule, une droite de régression est donnée par


X = la valeur de la variable indépendante
Yc = la valeur estimée de la variable dépendante
a = l'ordonnée à l'origine, i.e. la valeur de Yc lorsque X = 0
b = la pente, i.e. la variation de Yc pour une variation d'une unité de X

On a aussi

Le coefficient de détermination
est une mesure de la proportion des variations de la variable Y
qui s'«explique» par les variations de la variable X

Le coefficient de corrélation

Lors de la 4e partie du cours, on a présenté l'exemple (#2) suivant:


On cherche à déterminer si, dans la ville Pompaluile, il existe une relation entre le
nombre de véhicules qui passent devant une station d'essence et le nombre de
litres d'essence vendus (moyennes par jour, sur un an). Voici les résultats:
Emplacement X = Nombre de véhicules Y = Nombre de litres (milliers)
(centaines)

Rue Barbe 3 100

Rue Brique 4 112

Rue Gueuse 5 150

Avenue Anse 7 210

file:///C|/B%20-%20Jean/PSY1300/C10P1.html[2020-04-30 09:31:43]
ANALYSE DE RÉGRESSION ET DE CORRÉRRLATION: RAPPELS

Rue Elle 2 60

Chemin Sire 3 85

Chemin Soeur 2 77

Rappelons les résultats obtenus


ΣX = 26, ΣY = 794, ΣXY = 3497, ΣX2 = 116, ΣY2 = 105 898

Par conséquent, la droite est

De plus

Suite > L'ERREUR TYPE DE L'ESTIMATION

file:///C|/B%20-%20Jean/PSY1300/C10P1.html[2020-04-30 09:31:43]
L'ERREUR TYPE DE L'ESTIMATION

L'ERREUR TYPE DE L'ESTIMATION


On sait déjà que la droite de régression permet de prédire la valeur de la variable dépendante (Yc) pour des valeurs
données de la variable indépendante (X)

On sait également que la qualité de la prédiction dépendra du degré


de dispersion des points autour de la droite de régression

Ainsi, par exemple, les estimations s'appuyant sur la relation illustrée


par le diagramme de gauche seront probablement plus fiables que celles
obtenues à partir de la relation illustrée par le diagramme de droite

Le coefficient de détermination et le coefficient de corrélation


sont des mesures standardisées du taux de dispersion

Pour réaliser des inférences statistiques à partir des données d'une analyse de
régression (faite à partir de données échantillonnales), une autre mesure servira à
quantifier le taux de dispersion des données autour de la droite de régression

On définit l'erreur type de l'estimation par la formule

(attention, le dénominateur est: n-2)

Exemple

Pour l'exemple donné ci-dessus, on peut construire le tableau de calcul suivant


X Y Yc (Y-Yc) (Y-Yc) 2

3 100 93,29 6,71 45,02

4 112 121,48 -9,48 89,87

5 150 149,68 0,32 0,10

7 210 206,08 3,92 15,37

2 60 65,09 -5,09 25,91

3 85 93,29 -8,29 68,72

file:///C|/B%20-%20Jean/PSY1300/C10P2.html[2020-04-30 09:31:43]
L'ERREUR TYPE DE L'ESTIMATION

2 77 65,09 11,91 141,85

26 794 794,00 0,00 386,84

D'où l'on peut calculer

Il existe également une formule simplifiée

qui, appliquée à notre exemple, donne

(la différence étant due aux erreurs d'arrondissement)

On note le rapport suivant entre r 2 et s yx

Suite > TEST D'HYPOTHÈSE SUR LA PENTE

file:///C|/B%20-%20Jean/PSY1300/C10P2.html[2020-04-30 09:31:43]
TEST D'HYPOTHÈSE SUR LA PENTE

TEST D'HYPOTHÈSE SUR LA PENTE


Lorsque les données utilisées pour réaliser le test d'hypothèse
proviennent d'un échantillon, on doit s'attendre à ce que la droite
de régression calculée contienne une certaine part d'erreur d'échantillonnage.
Par conséquent, cette droite n'est pas exactement celle de la population

On verra ici comme tester une hypothèse à propos de la pente de la droite de


régression pour toute la population (on nomme cette pente: B)

Ce test est particulièrement important puisque, si B est nulle,


il faut conclure à l'absence de relation entre les deux variables.
En effet, si B = 0, la droite de régression est horizontale et,
pour n'importe quelle valeur de X, Yc =
En d'autres termes, le test dont les hypothèses sont
H0 : B = 0 vs H1 : B ≠ 0
permet de vérifier l'existence d'une relation linéaire entre les variables X et Y

CONDITIONS D'APPLICATION

° La relation entre les


variables X et Y est linéaire;
les paramètres A et B de la
population sont inconnus,
fixes, et estimés par les
valeurs d'échantillon a et b

° Pour chaque valeur


possible de la variable X,
les valeurs de la variable Y
suivent une distribution
normale dont la moyenne
est égale à la valeur Yc
de la droite

° Toutes ces distributions des valeurs de Y pour chacune des valeurs de X ont le
même écart type (syx). On parle alors d'homoscédasticité

° Chaque valeur de Y dans ces distributions est indépendante des autres

MÉTHODE GÉNÉRALE DU TEST D'HYPOTHÈSE

Les étapes du test d'hypothèse sur la pente sont pratiquement les mêmes
que celles des tests vus dans les parties précédentes du cours
° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative
Soit une des trois possibilités suivantes:
(1) H0 : B = BHo vs H1 : B ≠ BHo
(2) H0 : B ≤ BHo vs H1 : B > BHo
(3) H0 : B ≥ BHo vs H1 : B < BHo
° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon
° Étape 3: Déterminer la distribution pour effectuer le test

file:///C|/B%20-%20Jean/PSY1300/C10P3.html[2020-04-30 09:31:44]
TEST D'HYPOTHÈSE SUR LA PENTE

Il s'agit toujours de la distribution t avec d.l. = n - 2


° Étape 4: Définir la région critique
Hypothèse Zone de rejet Zone d'acceptation

(1) RC > t α/2 ou RC < -t α/2 -t α/2 ≤ RC ≤ t α/2

(2) RC > t α RC ≤ t α

(3) RC < -t α RC ≥ -t α

° Étape 5: Établir la règle de décision


Maintenir H0 si la différence standardisée
entre b et BHo se situe dans la région d'acceptation
ou
Rejeter H0 si la différence standardisée
entre b et BHo se situe dans la région de rejet
° Étape 6: Faire les calculs nécessaires
Prélever un échantillon et calculer le rapport critique

où s b est l'estimé de l'erreur type de la distribution d'échantillonnage des pentes


Cette erreur type est donnée par la formule

° Étape 7: Prendre la décision


Rejeter H0 si la valeur de RC se situe dans la zone de rejet, sinon maintenir H 0

Exemple

Supposons que, pour l'exemple des stations d'essence, les sept stations ne
représentent qu'un petit échantillon de toutes les stations d'une grande ville
Vous affirmez que la pente, dans la population, est supérieure à 25
i.e. que pour chaque augmentation de 1 centaine de véhicules,
la vente d'essence augmente de 25 milliers de litres
Au seuil de 5%, les données sont-elles suffisantes pour appuyer votre position?
(on suppose que les conditions d'application sont satisfaites)

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative


H0 : B ≤ 25 vs H1 : B > 25

° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon


α = 0,05 et n = 7

° Étape 3: Déterminer la distribution pour effectuer le test


Puisque l'erreur type de la pente est estimée, on utilise une distribution t

° Étape 4: Définir la région critique

file:///C|/B%20-%20Jean/PSY1300/C10P3.html[2020-04-30 09:31:44]
TEST D'HYPOTHÈSE SUR LA PENTE

On a d.l. = n - 2 = 7 - 2 = 5, donc t 0,05 = 2,015


par conséquent, la région critique est RC > 2,015

° Étape 5: Établir la règle de décision


Maintenir H0 si RC ≤ 2,015 OU rejeter H0 si RC > 2,015

° Étape 6: Faire les calculs nécessaires


Prélever un échantillon de sept stations et calculer d'abord

puis

° Étape 7: Prendre la décision


Puisque RC se situe dans la zone d'acceptation, il n'y a pas d'évidence statistique
suffisante pour rejeter H0 ; par conséquent, on doit maintenir H0 .

En d'autres termes, jusqu'à preuve du contraire, on ne peut soutenir


l'hypothèse que la pente de la population est supérieure à 25
(25 milliers de litres par centaine de voitures)

NOTE IMPORTANTE

On serait arrivé à la même conclusion en considérant un intervalle


de confiance à 90% (puisque le test est unilatéral) pour la valeur de B

En effet

b - t α/2 s b < B < b + t α/2 s b


28,20 - 2,015(1,9955) < B < 28,20 + 2,015(1,9955)
28,20 - 4,02 < B < 28,20 + 4,02
24,18 < B < 32,22

Puisque cet intervalle contient la valeur hypothétique BHo = 25


on aurait pu conclure au maintien de l'hypothèse nulle

De plus, puisque cet intervalle ne contient pas la valeur


hypothétique BHo = 0, on sait que le test d'hypothèse avec
H0 : B = 0 vs H1 : B ≠ 0
qui vise à vérifier l'existence d'une relation linéaire,
aurait amené le rejet de cette hypothèse nulle
Par conséquent, il semble bien qu'il existe une relation linéaire (dans la
population) entre le nombre de voitures et le nombre de litres d'essence vendus

file:///C|/B%20-%20Jean/PSY1300/C10P3.html[2020-04-30
View publication stats 09:31:44]

Vous aimerez peut-être aussi