COURS DE STATISTIQUE ET PROBABILITE, IR KENNEDY, Bac 2
COURS DE STATISTIQUE ET PROBABILITE, IR KENNEDY, Bac 2
COURS DE STATISTIQUE ET PROBABILITE, IR KENNEDY, Bac 2
Savoir choisir la méthode statistique adaptée sur un cas concret simple et pour une
question donnée simple, et savoir appliquer cette méthode;
Connaıtre les limites de chaque méthode et interpréter correctement les résultats;
Prendre conscience de l’importance d’une bonne collecte des données.
Pour bien comprendre et apprécier à sa juste valeur les informations chiffrées qui
nous envahissent quotidiennement, il est important de ne pas laisser quiconque faire,
dire n’importe quoi aux statistiques; on doit plutôt être capable de soutirer soi même
une information juste et objective à partir de données chiffrées.
2. Nature
La statistique est la science qui traite des principes et des méthodes servant à recueillir,
à classer, à organiser, à synthétiser et à présenter des données numériques, puis, avec le
concours du calcul des probabilités, à analyser, à interpréter, à tirer des conclusions et à
prendre des décisions judicieuses à partir de ces données numériques.
Lorsqu'on utilise l'expression « la statistique » au singulier, on fait référence à
la science telle qu'on vient de la définir.
Lorsqu'on parle « des statistiques » au pluriel, on parle de données numériques.
L'expression « une statistique » désigne une donnée numérique.
1. Méthode des sciences exactes
La méthode classique des sciences exactes étudie un phénomène quelconque dans des
conditions idéales et néglige certains écarts aléatoires en décrivant le phénomène étudié
selon un schéma idéal et souvent simplifié.
Cette méthode retient les facteurs fondamentaux intervenant dans un phénomène et ne
porte pas attention à l'influence de facteurs secondaires. Les modèles ainsi obtenus
peuvent être très utiles mais rarement parfaits.
Dans tout phénomène ou expérience interviennent des facteurs aléatoires secondaires
très nombreux et parfois très compliqués, de sorte qu'il est impossible de les enregistrer
tous et, ainsi, de tenir compte de chacun dans l'élaboration d'un modèle. Cependant,
l'ensemble de ces facteurs aléatoires secondaires conduit à la théorie dite théorie des
probabilités.
De nos jours, il est presque impensable de faire une étude sérieuse des statistiques sans
s'adjoindre les éléments de base de la théorie des probabilités.
INTRODUCTION
2. Méthode statistique
Elle fait appel à l’utilisation conjointe des statistiques et de la théorie des probabilités,
c’est-à-dire elle tient compte de l'ensemble des facteurs aléatoires secondaires qui
amène à étudier les lois régissant les dispersions aléatoires de données numériques.
Cette méthode d'étude peut être utilisée dans presque toutes les disciplines.
Etapes de la méthode statistique
La reconnaissance du problème;
La collecte des données;
Le regroupement, classification et présentation des données;
La comparaison avec des modèles théoriques;
L’analyse et interprétation.
INTRODUCTION
1. Reconnaissance du problème
Dans cette étape, il faut délimiter de manière précise :
- la population sur laquelle porte l’étude;
- la / ou les caractéristiques étudiées dans cette population, et
- les objectifs qu’on désire atteindre par cette étude.
Négliger cette étape peut conduire à des résultats inexacts ou déformés (et / ou truqués)
2. Collecte des données
Cette deuxième étape est très importante et elle doit être effectuée méticuleusement.
C'est le défi principal du statisticien « sur le terrain ». L'adéquation entre les objectifs
poursuivis et les résultats obtenus en dépend.
Cette collecte se fait selon l'un des deux modes suivants :
Le recensement : opération par laquelle on recueille les informations faisant l'objet
d'étude auprès de tous les individus de la population.
Le sondage : opération par laquelle on recueille les informations requises auprès
d'une partie de la population appelée « échantillon ».
La caractéristique principale de l’échantillon est qu’il doit être représentatif.
La collecte des données est donc une opération clé qui peut s'avérer très délicate dans
son aspect technique.
INTRODUCTION
3. Regroupement, classification et présentation des données
A l'issue du recensement ou du sondage, on a un amas de données appelées données
brutes.
À partir de normes, de définitions, de méthodes et de techniques reconnues, il faut
maintenant synthétiser et organiser cet amas de données pour en faire une présentation
aussi simple et aussi claire que possible. C'est l'objet d'étude de la statistique
descriptive.
4. Comparaison avec des modèles théoriques
A partir de l'étude de phénomènes où intervient le hasard, on élabore des modèles
théoriques de comportement qu'on appelle des lois de probabilités.
Selon la nature et les objectifs du problème étudié, on compare la situation observée
avec l'une ou l'autre des lois de probabilités.
5. Analyse et interprétation
A l'aide des éléments fournis par les deux étapes précédentes, on procède à une analyse
des résultats.
On peut expliquer et interpréter les résultats obtenus, tirer certaines conclusions, faire
une prévision avec une certaine marge d'erreur ou prendre une décision éclairée sur
base de l'interprétation des résultats.
INTRODUCTION
La partie de la statistique qui a pour objet l'étude des méthodes permettant de tirer des
conclusions concernant une population à l'aide de données recueillies dans un
échantillon extrait de cette population s'appelle « l’inférence statistique ».
L’étude des statistiques est subdivisée en 3 grandes parties:
Statistique descriptive : étudie l’ensemble des méthodes permettant de recueillir, de
classer, de synthétiser, de décrire et de présenter des données numériques.
Modèles probabilistes: on introduit les modèles mathématiques permettant
d’étudier les phénomènes liés au hasard.
Inférence statistique: on étudie l’ensemble des méthodes permettant de tirer des
conclusions concernant une population déterminée à partir de données provenant
d’un échantillon choisi dans cette population.
REGROUPEMENT ET EXPOSITION DES DONNEES
1.1 Terminologie de base
1.1.1 Population et échantillon
On appelle population (ou ensemble statistique) tout ensemble sur lequel porte
une étude statistique.
• Une population peut être formée de personnes, d’animaux, d’objets et même de
faits.
On désigne par « N » le nombre d’éléments dans la population ou la taille de la
population.
On appelle individu(s) (ou unités statistiques) l(es) élément(s) de l’ensemble sur
lequel porte une étude statistique.
On appelle échantillon tout sous-ensemble de la population.
On désigne par « n » le nombre d’éléments dans l’échantillon ou la taille de
l'échantillon.
• On procède à l’étude sur un échantillon lorsqu’une étude statistique porte sur une
population très grande ou difficilement accessible dans sa totalité.
REGROUPEMENT ET EXPOSITION DES DONNEES
Individus Population
Echantillon
Exemple 1
Une usine fabrique des tiges métalliques utilisées dans l’assemblage de certaines
structures. Pour étudier la résistance à la traction de ces tiges, on mesure cette résistance
pour un lot de 100 tiges. On demande de déterminer la propriété étudiée, la population
et l’unité statistique ?
Solution
• Propriété étudiée : la résistance à la traction de tiges métalliques,
• Population : l’ensemble des 100 tiges ou des 100 mesures,
• Unité statistique : chacune des tiges ou chacune des 100 mesures.
REGROUPEMENT ET EXPOSITION DES DONNEES
1.1.2 Caractères
Un caractère est tout critère sur lequel repose une étude statistique.
Un caractère peut être :
quantitatif
qualitatif
Caractère quantitatif
Un caractère est dit quantitatif lorsque les modalités sont mesurables ou repérables.
Exemple
La taille, poids, âge, composition, nombre des particules, délai de livraison, etc.
Caractère qualitatif
Un caractère est dit qualitatif lorsque les modalités ne sont pas mesurables.
Exemple
La couleur, marque, sexe, niveau d’études, activité professionnelle, type de logement,
etc.
REGROUPEMENT ET EXPOSITION DES DONNEES
Lorsqu’on s’intéresse à certaines particularités ou caractères des individus d’une
population statistique, notamment :
un seul caractère étudié série numérique à une dimension.
deux caractères étudiés série numérique à deux dimensions.
plus de deux caractères on utilise les techniques de l’analyse multidimensionnelle
1.1.3 Variables statistiques
Une variable statistique ou aléatoire est un caractère que possède chacun des individus
de l’échantillon ou de la population faisant l’objet d’une étude statistique.
Elle est notée par une lettre majuscule : 𝑋, 𝑌, …
Modalités
Ce sont les différents états ou différentes valeurs que peut prendre une variable
statistique.
Elles sont notées par le même lettre minuscule d’une variable statistique affectée
d’indices : 𝑥1 , 𝑥2 , … 𝑜𝑢 𝑦1 , 𝑦2 , … .
Une modalité quelconque peut être notée par 𝒙𝒊 .
REGROUPEMENT ET EXPOSITION DES DONNEES
En effet, on peut pour une même variable statistique avoir des ensembles de modalités
différents.
Par exemple, pour la variable statistique « état civil », comme modalités :
On pourrait se contenter des deux modalités suivantes : marié et non marié.
On peut raffiner davantage en admettant d’autres modalités : marié, en union libre,
séparé, divorcé, célibataire, veuf et religieux.
En effet, l’ensemble de modalités choisi pour une variable statistique donnée dépend
des objectifs de la recherche et de la précision requise. Cependant, ces modalités
devront former un ensemble tel que chaque observation faite sur un individu donne un
résultat qui se situe dans une et une seule de ces modalités.
Exemple 2
Un restaurant désire faire une enquête auprès de sa clientèle. On décide donc qu'à
chaque client qui viendra la semaine suivante, on lui demandera de remplir une petite
carte où celui-ci indiquera son sexe, son degré de satisfaction, son heure d'arrivée, le
nombre de personnes qui l'accompagnent et le montant de l'addition. Indiquer quelle est
la population concernée et l'échantillon choisi, quelles sont les variables statistiques
étudiées et quelles seraient les modalités ou valeurs de celles-ci.
REGROUPEMENT ET EXPOSITION DES DONNEES
Solution
Population : Ensemble des clients du restaurant.
Echantillon : Ensemble des clients qui viendront au restaurant au cours de la semaine
suivante.
Variables statistiques :
𝑋: sexe
𝑌: degré de satisfaction
𝑇: heure d’arrivée
𝑉: nombre de personnes qui accompagnent le client
𝑊: montant de l’addition
𝑋: 𝑚𝑎𝑠𝑐𝑢𝑙𝑖𝑛, 𝑓é𝑚𝑖𝑛𝑖𝑛
Pour
𝑌: 𝑡𝑟è𝑠 𝑖𝑛𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑖𝑡, 𝑖𝑛𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑖𝑡, 𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑖𝑡, 𝑡𝑟è𝑠 𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑖𝑡
𝑇: 0, 24
𝑉: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 𝑜𝑢 𝑝𝑙𝑢𝑠
𝑊: 0, 200
REGROUPEMENT ET EXPOSITION DES DONNEES
Les variables statistiques sont parfois qualifiées de :
Variable dépendante : variable dont on veut expliquer le comportement.
Variable indépendante : est celle qui cause la variation du variable dépendante.
Variable contrôlée : est celle qui peut, au gré du chercheur, prendre la modalité ou
la valeur désirée.
Exemple
Si on énonce l’hypothèse que le revenu d’un Congolais dépend de son âge et de sa
scolarisation, trouver les différentes variables étudiées.
• Variable dépendante : revenu.
• Variable indépendante : âge et le niveau de scolarisation.
• On peut faire de l'âge une variable contrôlée en choisissant des individus d'âge
déterminé à l’avance pour former l’échantillon.
En effet, les variables statistiques sont classifiées en fonction de la nature des modalités
qu’elles peuvent prendre, ainsi on a :
Les variables statistiques qualitatives, et
Les variables statistiques quantitatives.
REGROUPEMENT ET EXPOSITION DES DONNEES
1.2 Etude d’une variable statistique qualitative
On parle d’une variable statistique qualitative lorsque les modalités de la variable ne
sont pas des nombres.
Les variables statistiques peuvent être subdivisées en deux espèces selon l’échelle de
mesure utilisée dans les observations :
Echelle de mesure nominale : utilisée lorsque les observations recueillies sont
simplement placées dans des modalités mutuellement exclusives décrites par une
propriété. On parle d’une variable statistique qualitative nominale.
Dans l’exemple 2, le caractère 𝑿 fait intervenir une échelle de mesure nominale.
Echelle de mesure ordinale : utilisée lorsque les observations recueillies sont
classées dans des modalités ordonnées selon un critère bien défini. On parle d’une
variable statistique qualitative ordinale.
Dans l’exemple 2, le caractère 𝒀 fait intervenir une échelle de mesure ordinale.
Bien sûr, on ne peut pas mesurer la différence entre « très insatisfait » et « satisfait »,
mais il y a certainement un peu plus de satisfaction lorsqu’on passe d’une modalité à
la modalité suivante. Il y a donc une certaine mesure relative de la quantité de
satisfaction. On parle de la variable statistique semi-quantitative.
REGROUPEMENT ET EXPOSITION DES DONNEES
1.2.1 Distribution d’une variable statistique 𝑿
Lorsqu’on mène une étude statistique dans une population formée de N individus ou
dans un échantillon formé de n individus, les premières informations recueillies forment
ce qu’on appelle les données brutes.
L’ensemble des modalités de 𝑋 est : 𝑥1 , 𝑥2 , … , 𝑥𝑖 , … , 𝑥𝑘
Le nombre k de modalités différentes, ne peut pas être supérieur à N ou à n.
Cependant, ces données brutes sont difficilement utilisables et très difficiles à
interpréter. D’où il faut les condenser pour en faire une présentation aussi simple que
possible.
On trace un tableau des données brutes dans lequel pour chaque modalité 𝒙𝒊 , on calcule
le nombre d’individus ayant cette modalité.
Exemple
Soit l'étude de l'état civil des 40 employés de la compagnie SOLID. Ainsi, N = 40, et 𝑋
représente la variable statistique qualitative ou caractère. Admettons pour le caractère 𝑋
les modalités suivantes :
{Marié(e), célibataire, divorcé(e), veuf (ve), religieux (se)}
REGROUPEMENT ET EXPOSITION DES DONNEES
Les données recueillies se présentent comme suit:
REGROUPEMENT ET EXPOSITION DES DONNEES
On dresse la liste de toutes les modalités puis, en relisant le tableau des données brutes,
on inscrit une marque verticale en regard d’une modalité sur la liste chaque fois qu’on
rencontre celle-ci dans le tableau.
♠ Sur un échantillon
REGROUPEMENT ET EXPOSITION DES DONNEES
1.2.3 Fréquence relative ou proportion 𝒇𝒊
On définit la fréquence relative ou proportion d’une modalité 𝒙𝒊 par :
Population Echantillon
Toute l’information chiffrée que l’on possède se trouve dans le tableau de distribution
de fréquences. Il est cependant bien utile d’illustrer cette information en représentant
graphiquement la distribution de fréquences d’un caractère.
REGROUPEMENT ET EXPOSITION DES DONNEES
La représentation graphique se fait généralement par plusieurs diagrammes à savoir :
Un diagramme en colonnes (ou en rectangle, ou en tuyaux d’orgue),
Un diagramme à secteurs (ou diagramme circulaire), ou
Un diagramme figuratif (ou pictogramme).
Diagramme en colonnes
On utilise deux axes perpendiculaires. Sur l’axe horizontal, on indique par des segments
de longueurs égales, séparés l’un de l’autre, les modalités de 𝑋. Sur l’axe vertical, en
choisissant une unité de mesure appropriée, on indique les effectifs (ou les fréquences
relatives).
Chaque couple (𝒙𝒊 , 𝒏𝒊 ) est représenté par un rectangle de hauteur 𝒏𝒊 (ou 𝒇𝒊 ).
REGROUPEMENT ET EXPOSITION DES DONNEES
Diagramme à secteurs
On utilise un cercle que l’on subdivise en autant de secteurs qu’il y a de modalités et où
l’aire de chacun de ces secteurs est proportionnelle au pourcentage de la modalité
correspondante.
L’angle au centre pour chacun des secteurs est de 𝒇𝒊 × 𝟑𝟔𝟎 degrés.
Par exemple pour le cas de la compagnie SOLID, on aura :
REGROUPEMENT ET EXPOSITION DES DONNEES
Diagramme figuratif ou pictogramme
On utilise diverses illustrations ou images pour donner une synthèse visuelle de la
distribution de fréquences.
En pratique, ces pictogrammes sont surtout utilisés lorsque les fréquences sont des
nombres très grands.
Par exemple pour le cas de la compagnie SOLID :
REGROUPEMENT ET EXPOSITION DES DONNEES
Exemple
Dans un sondage réalisé auprès d'un échantillon de 450 personnes âgées de 18 ans et
plus et demeurant dans la région métropolitaine de Québec, on a demandé si on croyait
qu'il y a beaucoup de gens mariés ou en union libre qui ne se séparent pas à cause des
enfants. 131 personnes ont répondu «beaucoup», 249 «un peu», 43 de ce nombre, «pas
du tout» et 27 «ne peut pas préciser». (Source: Le Soleil, dimanche 11 septembre 1988.)
Indiquer la population, la variable concernée et le type d'échelle de mesure utilisée.
Construire un tableau de distribution de fréquences en y incluant une colonne de
fréquences relatives. Trouver le mode de la distribution. Représenter graphiquement
cette distribution par un diagramme en colonnes.
Solution
Population : Ensemble des personnes âgées de 18 ans et plus et demeurant dans la
région métropolitaine de Québec. L'échantillon est extrait de cette population.
Variable : Opinion sur l'importance du nombre de gens mariés ou en union libre qui ne
se séparent pas à cause des enfants.
Échelle de mesure : C'est une variable statistique qualitative et les réponses suggérées
indiquent une échelle de mesure ordinale.
REGROUPEMENT ET EXPOSITION DES DONNEES
Le mode de cette distribution est « un peu », ce qui permet de dire qu'en général les
gens concernés croient qu'il y aurait un peu plus de séparations sans la présence des
enfants dans un couple.
REGROUPEMENT ET EXPOSITION DES DONNEES
REGROUPEMENT ET EXPOSITION DES DONNEES
T.D
REGROUPEMENT ET EXPOSITION DES DONNEES
1.3 Etude d’une variable statistique quantitative
1.3.1 Variable discrète et continue
Une variable statistique quantitative est dite discrète si les valeurs que peut prendre
cette variable sont des valeurs isolées, généralement entières.
Exemple
Le nombre d’enfants d’une personne, le nombre d’employés d’une usine, etc.
Une variable statistique quantitative est dite continue si l’ensemble des valeurs
qu’elle peut prendre est un intervalle de l’ensemble des nombres réels.
Exemple
La température (39,107°), les longueurs, les surfaces, le temps, l’espace, la masse, etc.
En effet, la distinction entre une variable statistique discrète et une variable statistique
continue semble claire d’un point de vue théorique. Cependant, en pratique cette
distinction n’est pas toujours aussi nette puisque, rigoureusement, toute mesure est
discrète du fait que la précision d’une mesure est toujours limitée.
Ce n’est pas la nature de l’ensemble, mais le nombre des valeurs d’une variable
statistique quantitative qui nous servira de critère pour distinguer diverses situations.
REGROUPEMENT ET EXPOSITION DES DONNEES
De ce fait, les données d’une variable statistique quantitative peuvent être représentées
sous trois formes : les données rangées, condensées ou regroupées en classes.
1.3.2 Données rangées
Le nombre 𝑵 d’individus dans la population est petit (𝑵 < 𝟐𝟎)
Cette définition de (𝑵 < 𝟐𝟎) n’a pas de fondement théorique et ne se base que sur
l’expérience pratique. Ce n’est pas une règle stricte mais beaucoup plus une ligne de
conduite. Ce nombre n’est donc pas rigoureux et on pourra s’en écarter à l’occasion.
Par ailleurs, le présent cas s’applique aussi lorsqu’on a un échantillon petit (𝒏 < 𝟐𝟎), si
bien qu’il soit assez rare qu’on considère un tel échantillon.
o Un échantillon trop petit risque de fournir des données qui s’écartent trop des
données réelles dans la population.
Exemple
Carole vient de s’acheter un terrain et elle a noté, en mètres, la hauteur des arbres sur ce
terrain; elle obtient les données brutes suivantes:
12 11 14 7 9 4 21 11 8
Ranger ces données dans un ordre ascendant.
REGROUPEMENT ET EXPOSITION DES DONNEES
Solution
On a : 4 7 8 9 11 11 12 14 21
De ce fait, il serait peu utile de construire un tableau de distribution de fréquences vu
qu’un diagramme en colonnes ou à secteurs apporterait fort peu d’éléments intéressants.
Cependant, construire un tableau de distribution de fréquences là que tous les effectifs
seraient de 1 sauf celui de la donnée 11 qui serait 2 équivaudrait presque à reproduire la
liste des données rangées dans un ordre ascendant.
Parmi les situations où le nombre d’observations ou de données est petit, on trouve les
séries chronologiques ou série temporelle ou chronique qui est un ensemble de
valeurs d’une variable statistique quantitative observées dans le temps, habituellement à
intervalle égaux.
Pour une série chronologique, il est inutile de construire un tableau de distribution de
fréquences. Cependant, il est intéressant même très révélateur de représenter
graphiquement une série chronologique.
Cette représentation graphique se fait dans un système de coordonnées cartésiennes ;
sur l’axe horizontal ou axe des abscisses, on représente le temps ; sur l’axe vertical ou
axe des ordonnées, on représente la variable statistique quantitative étudiée.
REGROUPEMENT ET EXPOSITION DES DONNEES
Exemple
Un journaliste sportif étudie la carrière du légendaire joueur de hockey Maurice
Richard. Il relève, notamment, le nombre de buts marqués par le « Rocket » au cours de
chacune des 18 saisons jouées par celui-ci de 1942-1943 à 1959-1960.
On a, dans l'ordre : 5, 32, 50, 27, 45, 28, 20, 43, 42, 27, 28, 37, 38, 38, 33, 15, 17, 19
Représenter graphiquement cette série chronologique.
Solution
REGROUPEMENT ET EXPOSITION DES DONNEES
1.3.3 Données condensées
A noter que lorsqu’on choisit de porter sur l’un des axes les fréquences relatives en lieu
et place des effectifs, le diagramme garde le même profil.
LOIS DE PROBABILITE
180
On en tire donc : Etendue = 9 – 2 = 7 ; 𝐸𝑀 = 𝑥𝑖 − 𝐸 𝑋 𝑓 𝑥𝑖 = = 1,6667
108
1260
𝑉𝑎𝑟 𝑋 = (𝑥𝑖 − 𝐸 𝑋 )2 𝑓 𝑥𝑖 = = 3,8889 ; 𝜎𝑋 = 𝑉𝑎𝑟(𝑋) = 1,9720
324
LOIS DE PROBABILITE
6.3.5 Variable centrée réduite : Z
Une variable aléatoire centrée réduite est une variable aléatoire dont l'espérance
mathématique est zéro et la variance est 1.
Pour toute variable aléatoire X, la transformation linéaire donne :
Exemple 7
Pour faire une petite enquête dans un quartier de la ville, on envoie par la poste 10
questionnaires à remplir. Si la probabilité de recevoir une réponse à un questionnaire est
1/3 et si on note par X le nombre de questionnaires retournés, trouver la fonction de
probabilités de X.
Solution
En considérant que l'envoi d'un questionnaire et son retour par la poste est une épreuve
de Bernoulli avec une probabilité de succès de 1/3. On a donc ici une suite de n = 10
épreuves de Bernoulli indépendantes avec p = 1/7, alors X↝B (10 ; 1/3).
On a :
0 2 10 1 2 9
0 1 1 1
𝑓 0 = 𝐶10 = 0,0173 𝑓 1 = 𝐶10 = 0,0867
3 3 3 3
2 2 8 3 2 7
2 1 3 1
𝑓 2 = 𝐶10 = 0,1951 𝑓 3 = 𝐶10 = 0,2601
3 3 3 3
LOIS DE PROBABILITE
4 2 6 5 2 5
4 1 5 1
𝑓 4 = 𝐶10 = 0,2276 𝑓 5 = 𝐶10 = 0,1366
3 3 3 3
6 2 4 7 2 10
6 1 7 1
𝑓 6 = 𝐶10 = 0,0569 𝑓 7 = 𝐶10 = 0,0163
3 3 3 3
8 2 2 9 2 1
8 1 9 1
𝑓 8 = 𝐶10 = 0,0030 𝑓 9 = 𝐶10 = 0,003
3 3 3 3
10 2 0
10 1
𝑓 10 = 𝐶10 = 0,00002
3 3
LOIS DE PROBABILITE
Tableau résumant la fonction de probabilités :
LOIS DE PROBABILITE
6.4.2 Loi géométrique
Situons-nous dans le contexte où on effectue une suite d'épreuves de Bernoulli
indépendantes avec une probabilité p d'obtenir un succès à chacune de ces épreuves.
Imaginons qu’on poursuit ces épreuves jusqu’à l’obtention d’un premier succès et
désignons par X la variable aléatoire représentant le nombre d’épreuves nécessaire pour
obtenir ce premier succès. Dans ce cas, on dit que X est une variable aléatoire
géométrique et que sa distribution de probabilités suit une loi géométrique.
Pour trouver une formule générale définissant la fonction de probabilités d’une variable
aléatoire géométrique telle que 𝑿 ↝ 𝑮(𝒑), il revient de trouver la probabilité d'obtenir
un premier succès après 𝒙𝒊 épreuves de Bernoulli indépendantes (1 ≤ 𝑥𝑖 < ∞).
On doit donc obtenir 𝒙𝒊 − 𝟏 échecs avec une probabilité 𝒒 = 𝟏 − 𝒑 chacun, suivi d'un
succès avec une probabilité p.
Ainsi :
LOIS DE PROBABILITE
Exemple 8
Dans un certain territoire, il y a 12 % de la population qui parle l’espagnol. En
choisissant au hasard des personnes dans cette population (on suppose que les choix
sont faits avec remise), quelle est la probabilité que la première personne trouvée
parlant espagnol soit dans les trois premiers choix?
Solution
Considérons chaque choix de personne comme une épreuve de Bernoulli où le fait que
cette personne parle l'espagnol est un succès. Notons que le fait de considérer que les
choix sont faits avec remise assure l'indépendance des épreuves de Bernoulli
successives. Si X représente le nombre requis d'épreuves de Bernoulli pour obtenir un
premier succès, alors X ↝ G (0, 12).
On recherche 𝑃 𝑋 =1 +𝑃 𝑋 =2 +𝑃 𝑋 =3 .
On a : (0,12) + (0,12)(0,88) + (0,12)(0,88)² = 0,3185
LOIS DE PROBABILITE
6.4.3 Loi binomiale négative (ou loi de Pascal)
Situons-nous encore une fois dans le contexte où on effectue une suite d'épreuves de
Bernoulli indépendantes avec une probabilité p d'obtenir un succès à chacune de ces
épreuves.
A l’inverse de la loi binomiale, ici on fixe le nombre de succès r et on s’intéresse au
nombre d’épreuves 𝒙𝒊 nécessaire pour obtenir ces r succès. La variable aléatoire
considérée représente le nombre d’épreuves qu’il faut pour obtenir r succès. On dit que
cette variable aléatoire considérée X est une variable aléatoire binomiale négative et que
sa distribution de probabilités suit une loi binomiale négative ou loi de Pascal.
Exemple 10
Dans le contexte de l’exemple 9, trouver E(Y) et Var(Y).
Solution
𝑌 ↝ 𝐵𝑁(2; 0,12)
𝑟 2
𝐸 𝑌 = = = 16,6667
𝑝 12
𝑟(1 − 𝑝) 2(1 − 0,12)
𝑉𝑎𝑟 𝑌 = = = 122,2222 et 𝜎𝑌 = 122,2222 = 11,05
𝑝2 (0,12)2
Exemple 11
Dans un groupe de 15 automobilistes, 6 possèdent une voiture japonaise et les 9 autres,
une voiture américaine. Si on choisit 5 de ces automobilistes, quelle est la probabilité
que 2 d’entre eux soient propriétaires d’une voiture japonaise ? De plus, trouver la
fonction de probabilités de la variable aléatoire X représentant le nombre
d’automobilistes possédant une voiture japonaise et tracer l’histogramme.
LOIS DE PROBABILITE
Solution
On a une population de 15 automobilistes, donc N = 15. Parmi ces automobilistes, 6
possèdent la caractéristique d'avoir une voiture japonaise, donc :
𝑘 6
𝑘 = 6 𝑒𝑡 𝑝 = = = 0,4
𝑁 15
On choisit simultanément (donc sans remise) 5 automobilistes, donc n = 5. Désignons par X
le nombre d'automobilistes choisis possédant une voiture japonaise.
Alors : X↝H(15 ; 5 ; 0,4), On cherche d'abord f (2) :
𝐶62 𝐶93 15 × 84
𝑓 2 = 𝑃(𝑋 = 2) = 5 = 3003 = 0,4196
𝐶15
Pour compléter la fonction de probabilités de X, rappelons que l'ensemble des réalisations
possibles de X est {0, 1, 2, 3, 4, 5} et cherchons les probabilités f (0), f (l), f (2), f (3), f (4),
f (5) :
LOIS DE PROBABILITE
La fonction de probabilités se résume dans le tableau :
LOIS DE PROBABILITE
Théorème
Si X est une variable aléatoire obéissant à une loi hypergéométrique 𝑋 ↝ 𝐻(𝑁; 𝑛; 𝑝),
alors :
Exemple 12
Dans le contexte de l’exemple 11 :
a) Quel nombre d’automobilistes possédant une voiture japonaise peut-on espérer ?
b) Quelle est la probabilité qu’on choisisse plus d’automobilistes possédant une
voiture japonaise que ceux propriétaires d’une voiture américaine ?
Solution
a) E(X) = np = 5(0,4) = 2,0
b) On cherche 𝑃 𝑋 > 2 ; 𝑃 𝑋 > 2 = 𝑃 𝑋 = 3 + 𝑃 𝑋 = 4 + 𝑃 𝑋 = 5
= 0,2398 + 0,0450 + 0,0020 = 0,2868
LOIS DE PROBABILITE
6.4.5 Loi de Poisson
Un autre modèle mathématique fréquemment utilisé en statistique est celui de
1’occurrence de succès dans un certain intervalle de temps, de longueur, d'espace ou de
tout intervalle continu.
Toute variable X résultant d’une expérience aléatoire est dite variable aléatoire ; si, de
plus, elle correspond au nombre de phénomènes observés (comptage) par unité
fondamentale, elle suit en général une loi type, dite loi de Poisson de paramètre λ.
On note
Exemple 12
La compagnie TRUITE reçoit en moyenne deux appels téléphoniques à la minute. Si on
admet que le nombre d’appels téléphoniques reçus suit une loi de Poisson, quelle est la
probabilité que la compagnie reçoive cinq appels dans les trois prochaines minutes ?
LOIS DE PROBABILITE
Solution
Désignons par X le nombre d’appels reçus dans un intervalle de trois minutes.
Alors : 𝜆 =3×2=6
𝑋 ↝ 𝑃(6)
65 −6
On cherche P(X=5) 𝑃 𝑋=5 = 𝑒 = 0,1606
5!
La variable aléatoire est dite continue lorsque l'ensemble des réalisations d'une variable
aléatoire X n'est pas dénombrable et que 𝑃 𝑋 = 𝑥𝑖 = 0 pour toute réalisation 𝒙𝒊 .
A une variable aléatoire continue, on peut généralement associer une fonction de
densité, qui est une fonction réelle y = f (x) possédant les deux propriétés suivantes :
a) 𝑓(𝑥) ≥ 0 pour toute valeur de x
∞
b) −∞
𝑓 𝑥 𝑑𝑥 = 1
LOIS DE PROBABILITE
La représentation graphique utilisée dans le cas d’une variable aléatoire continue est
celle de la courbe représentative de la fonction de densité. On peut considérer que c’est
un cas limite de polygone de probabilités lorsque le nombre de réalisations est infini.
Une fonction de densité est toujours positive et l’aire totale sous la courbe (au sens
géométrique d’une intégrale) est égale à 1.
LOIS DE PROBABILITE
Dans le cas d’une variable aléatoire continue, la probabilité est définie par une mesure
et cette mesure, c’est l’aire sous la fonction de densité.
Fonction de répartition
Elle représente la probabilité que la variable aléatoire X prenne une valeur inférieure à
la valeur x, c’est-à-dire l’aire sous la courbe de y = f (x) entre - ∞ et x.
La représentation graphique d’une fonction de répartition est une ogive. On peut
considérer qu’une ogive est un cas limite d’une courbe de distribution de probabilités
cumulées lorsque le nombre de réalisations est infini.
La propriété principale de la fonction de répartition est :
Mode
Le mode d’une variable aléatoire continue X est la valeur de X pour laquelle la fonction
de densité y = f (x) atteint son maximum.
LOIS DE PROBABILITE
Médiane
La médiane d’une variable aléatoire continue X est la valeur de X qui divise l’aire sous
la courbe de y = f (x) en deux parties égales, ce qu’on exprime mathématiquement par :
Espérance mathématique
Ecart moyen
Variance
Puisque l’aire sous la courbe de la fonction de densité doit être égale à 1 et que cette
figure est un rectangle de base 𝛽 − 𝛼, il s’ensuit que la hauteur est 1/(𝛽 − 𝛼).
L’expression mathématique de la fonction de densité d’une variable aléatoire uniforme
est :
On note :
LOIS DE PROBABILITE
Exemple 12
Si X est une variable aléatoire continue distribuée uniformément sur l’intervalle 𝛼, 𝛽 ,
trouver 𝑃(𝑎 < 𝑋 < 𝑏) si a et b ϵ 𝛼, 𝛽 .
Solution
Géométriquement :
La probabilité cherchée est l’aire sous la courbe entre les verticales x = a et x = b. c’est
un rectangle de base b – a et de hauteur 1/(𝛽 - 𝛼)
LOIS DE PROBABILITE
La probabilité 𝑃(𝑎 < 𝑋 < 𝑏) est donc proportionnelle à la longueur de l’intervalle
𝑎, 𝑏 .
Théorème
Si X est une variable aléatoire distribuée uniformément sur 𝑎, 𝑏 , 𝑋 ↝ 𝑈(𝛼, 𝛽), alors :
Exemple 13
A un certain arrêt d’autobus, les autobus passent toutes les 20 minutes. Par exemple, il y
a un autobus qui passe à 17h00, un autre à 17h20, puis à 17h40, à 18h00 et ainsi de
suite. Etienne se présente entre 17h00 et 18h00 à cet arrêt, l’heure exacte de son arrivée
étant une variable distribuée uniformément sur cette période. Trouver la probabilité
qu’Etienne attende moins de 5 minutes.
Solution
Soit X, le nombre de minutes entre 17h00 et l’heure d’arrivée d’Etienne: 𝑋 ↝ 𝑈 0, 60 .
Pour qu’il attende moins de 5 minutes, il faut qu’il arrive entre 17h15 et 17h20, ou entre
17h35 et 17h40 ou entre 17h55 et 18h00. Donc,
LOIS DE PROBABILITE
6.5.3 Loi exponentielle
Une variable aléatoire continue X est dite variable aléatoire exponentielle lorsque la
fonction de densité est de la forme :
On dit alors que cette variable aléatoire obéit à une loi exponentielle de paramètre 𝝀, et
on note :
Le paramètre 𝝀 représente le nombre moyen de succès par unité de temps ou, ce qui est
souvent plus commode à interpréter, 1/𝝀 représente, en moyenne, le temps entre deux
succès consécutifs.
Exemple 14
On sait que la durée moyenne des transactions au guichet automatique de la banque
APITON est de 6 minutes. Vous arrivez au guichet et quelqu’un juste devant vous
commence sa transaction. Si on suppose que la durée d’une transaction obéit à une loi
exponentielle, quelle est la probabilité que vous attendiez plus de 10 minutes ?
LOIS DE PROBABILITE
Solution
Désignons par X la variable aléatoire représentant la durée d’une transaction en
minutes.
1
𝑋 ↝ 𝐸𝑋𝑃( )
6
1
Alors : 𝑓 𝑥 = 𝑒 −𝑥/6 . On cherche 𝑃 𝑋 > 10 :
6
∞ ∞
1 −𝑥/6 ∞
𝑃 𝑋 > 10 = 𝑓 𝑥 𝑑𝑥 = 𝑒 𝑑𝑥 = −𝑒 −𝑥/6 = 𝑒 −10/6 = 0,1889
10 6
10
10
On peut aussi procéder ainsi : 𝑃 𝑋 > 𝑥 = 𝑒 −𝜆𝑥 , donc 𝑃 𝑋 > 10 = 𝑒 −10/6 = 0,1889
Théorème
Si X est une variable aléatoire exponentielle,
Alors :
LOIS DE PROBABILITE
6.5.4 Loi normale
C’est la loi la plus importante en statistique, on l’appelle également la loi de Laplace-
Gauss.
Une variable aléatoire continue X suit une loi de Gauss, dite également loi normale ou
loi gaussienne, si sa fonction de distribution, dite encore fonction de répartition, est telle
que :
Avec :
• e est la notation usuelle de la fonction exponentielle (𝑒 = 2,71828 … ),
• µ et σ sont deux réels, respectivement l’espérance E[X] et la variance Var(X) de la
variable aléatoire X
La loi de Gauss est donc une loi à deux paramètres : on dit que la variable aléatoire X
suit une loi normale de moyenne µ et de variance σ².
Si la moyenne d’une loi de Gauss est nulle, et sa variance égale à l’unité, on obtient une
distribution normale centrée et réduite (ou loi normale standard) donnée par :
LOIS DE PROBABILITE
𝟏 𝒙𝟐
−
𝒇 𝒙 = 𝒆 𝟐
𝟐𝝅
Pour toute variable aléatoire X suivant une loi normale de moyenne µ et de variance σ²,
la variable aléatoire réduite Z, définie par : Z = (x - µ) /σ, suit une loi normale standard.
La représentation graphique de la fonction de densité d’une variable aléatoire X
obéissant à une loi normale a la forme suivante :
LOIS DE PROBABILITE
A partir de la définition et de la représentation graphique, on fait les observations
suivantes :
La courbe a une forme dite de cloche,
La courbe est symétrique par rapport à la droite verticale 𝑥 = 𝜇,
1
La courbe atteint son maximum, lorsque 𝑥 = 𝜇, ce maximum étant ,
𝜎 2𝜋
Le mode, la médiane et la moyenne ont tous la même valeur : 𝜇,
La courbe a deux points d’inflexion, c’est-à-dire deux points de changement de
concavité. Ces points sont les points d’abscisses 𝜇 + 𝜎 et 𝜇 − 𝜎,
La courbe s’étend indéfiniment dans les deux directions, en se collant presque sur
l’axe horizontal. On dit qu’elle a un comportement asymptotique et que l’axe des x
est une asymptote,
L’aire totale sous la courbe est 1,
+∞
𝐸 𝑋 = −∞
𝑥𝑓 𝑥 𝑑𝑥 = 𝜇
+∞
𝑉𝑎𝑟 𝑋 = −∞
𝑥 − 𝜇 2 𝑓 𝑥 𝑑𝑥 = 𝜎²
LOIS DE PROBABILITE
En effet, une loi normale dépend toujours de deux paramètres 𝝁 et 𝝈² qui, lorsqu’ils
sont connus, la loi normale est entièrement connue. Cependant,
• Si 𝝁 change, la courbe se déplace horizontalement et,
• Si 𝝈 𝑜𝑢 𝝈² varie, la courbe devient plus condensée ou plus dispersée.
Quelques exemples graphiques : cas des courbes ayant le même centre mais avec des
dispersions différentes.
LOIS DE PROBABILITE
Calcul d’une probabilité pour une variable obéissant à une loi normale
Supposons que X est une variable aléatoire continue telle que 𝑋 ↝ 𝑁(𝜇; 𝜎 2 ). La
probabilité que X prenne une valeur entre deux nombres a et b est définie par :
Pour évaluer la probabilité on ramène toutes les courbes normales à une seule, la courbe
(𝑋−𝜇)
normale centrée réduite, par la transformation linéaire 𝑍 =
𝜎
Il est facile de vérifier que Z est une variable aléatoire centrée réduite.
LOIS DE PROBABILITE
En effet,
Si X est une variable aléatoire obéissant à une loi normale alors Z, la variable aléatoire
centrée réduite obéit également à une loi normale.
Ainsi, lorsque
En faisant cette transformation linéaire sur la variable X et sur toutes les valeurs de X,
on ramène le calcul d’une probabilité sur X à un calcul de probabilités sur Z.
En faisant confondre ces deux distributions en une seule courbe. Pour symboliser cette
situation, on utilise deux échelles de mesure différentes sur l’axe horizontal et, on note
l’échelle selon X avec les valeurs touchées puis en dessous, on note l’échelle en Z avec
les valeurs correspondantes :
LOIS DE PROBABILITE
Grace à ces transformations linéaires, il suffit de construire une seule table, celle de la
variable centrée réduite Z. Dans la table II, à la fin du livre, on trouve la valeur de l’aire
sous une courbe normale centrée réduite Z entre la moyenne 0 et une valeur 𝑧𝑖 : P(0 <
𝑍 < 𝑧𝑖 ). Les différentes valeurs de 𝑧𝑖 sont données à une décimale dans la colonne de
gauche alors que la ligne du haut représente la seconde décimale.
Par exemple, pour trouver 𝑃(0 < 𝑍 < 1,34), on cherche la valeur 1,3 dans la colonne
de gauche, puis on se déplace horizontalement jusqu’à la colonne sous le chiffre 4 de la
ligne du haut pour repérer la probabilité cherchée : 𝑃 0 < 𝑍 < 1,34 = 0,4099.
Il sera toujours utile d’esquisser un graphique dans ces calculs de probabilités.
LOIS DE PROBABILITE
Exemple 15
Soit Z, une variable aléatoire normale centrée réduite, 𝑍 ↝ 𝑁(0 ; 1). Trouver :
a) 𝑃(0 < 𝑍 < 0,93) c) 𝑃(−1,35 < 𝑍 < 0)
b) 𝑃(0,36 < 𝑍 < 2,07) d) 𝑃(−0,76 < 𝑍 < 1,57)
Solution
a) La table II donne directement le résultat :
b) Pour trouver la probabilité que Z se situe entre deux valeurs positives, il faut faire
la différence entre deux nombres de la table.
LOIS DE PROBABILITE
En effet, la table donne l’aire entre 0 et 2,07 et l’aire entre 0 et 0,36. La différence sera
l’aire entre 0,36 et 2,07 et, donc, la probabilité cherchée.
𝑃 0,36 < 𝑍 < 2,07 = 𝑃 0 < 𝑍 < 2,07 − 𝑃 0 < 𝑍 < 0,36 = 0,4808 − 0,1406
= 0,3402
c) On peut utiliser la table même pour des valeurs de Z négatives en utilisant le fait
que la courbe est symétrique par rapport à la verticale z = 0
𝑃 −1,35 < 𝑍 < 0 = 𝑃 0 < 𝑍 < 1,35 = 0,4115
d) Si les valeurs 𝑧𝑖 sont situées de part et d’autre de 0, il faut alors additionner deux
valeurs de la table.
LOIS DE PROBABILITE
𝑃 −0,76 < 𝑍 < 1,57 = 𝑃 −0,76 < 𝑍 < 0 + 𝑃 0 < 𝑍 < 1,57
= 𝑃 0 < 𝑍 < 0,76 + 𝑃 0 < 𝑍 < 1,57 = 0,2764 + 0,4418 = 0,7182
Exemple 16
Soit 𝑋 ↝ 𝑁 42 ; 49 . Trouver :
a) 𝑃(𝑋 > 45) b) 𝑃(𝑋 > 40)
Solution
Pour utiliser la table II, il faut transformer la variable aléatoire X en une variable
aléatoire Z centrée réduite.
𝑋 − 42 𝑋 − 42
𝑍= =
49 7
LOIS DE PROBABILITE
a)
On sait que l’aire totale sous la courbe est 1, donc la moitié de cette aire est 0,5000.
b)
LOIS DE PROBABILITE
Dans les calculs de probabilités, on n’a pas à se soucier si les inégalités sont strictes (<)
ou larges (≤) puisque la probabilité qu’une variable aléatoire continue prenne une
valeur réelle précise est nulle.
TD
On considère que l'âge des citoyens d’une ville est une variable aléatoire normale de
moyenne 32 ans et d’écart-type 18 ans. Si on choisit au hasard un citoyen de cette ville,
quelle est la probabilité qu’il soit âgé de moins de 18 ans ?
ECHANTILLONNAGE
7.1 RECENSEMENT – SONDAGE
7.1.1 Enquête ou Recherche
Effectuer une enquête c’est recueillir des données sur certaines personnes ou sur
l’ensemble d’une population dans le but d’estimer certains caractères ou certaines
variables de cette population ou encore dans le but de vérifier des hypothèses ou
analyser les liens entre des caractères ou des variables dans cette population.
On subdivise les recherches ou enquêtes en deux grandes catégories : les recensements
et les sondages.
Recensement : on recueille les informations faisant l'objet d'études auprès de
tous les individus de la population.
Sondage : la collecte d'informations se fait auprès d'un échantillon de la
population.
Théoriquement, on devrait privilégier le recensement comme forme enquête puisqu’elle
donnerait idéalement une information complète et précise.
Cependant, en Pratique, il est rarement possible d’effectuer un recensement sur une
population importante pour l’une ou l’autre des raisons suivantes:
La population est trop grande.
La population est non accessible.
Le recensement entraine des couts trop élevés.
Le recensement est trop long à effectuer.
Un grand nombre de recensements deviendrait un fardeau pour une population.
En effet, le recensement a encore sa place lorsque la population est très petite ou
lorsqu’on veut des données détaillées sur de très petites parties de la population.
Cependant, sur de très grandes populations, il peut être utile d’effectuer
occasionnellement un recensement pour bien décrire la population, facilitant ainsi les
sondages qui seront faits par la suite.
L’ensemble des méthodes qui permettent d’obtenir des informations utiles concernant
une population sans avoir effectué un recensement s’appelle « l’inférence statistique. »
Trois étapes de l’inférence statistique :
Choisir un échantillon représentatif de la population
Étudier les variables statistiques dans l’échantillon prélevé
Tirer des conclusions sur le comportement de ces variables statistiques dans la
population.
Les méthodes employées en inférence statistique sont devenues des outils efficaces dans
les processus de prévision et dans ceux de prise de décision.
Est utilisé lorsque les individus d'une population sont rangés dans un ordre précis.
Il consiste à choisir un premier individu au hasard, à définir une période fixe appelée pas de
sondage et à choisir dans la population rangée, en utilisant ce pas de sondage, les individus
jusqu'à concurrence du nombre désiré.
Exemple
Sur une ligne de montage de pièces mécaniques, on peut prélever un échantillon
périodique de taille n en choisissant une première pièce au hasard, puis par la suite,
chaque 25è pièce qui suit jusqu’à ce qu’on ait le nombre désiré de pièces.
Cette méthode d’échantillonnage est facile d’application, peu couteuse, et n’exige qu’un
seul nombre aléatoire et un pas de sondage qui sera fixé selon la taille de l’échantillon
désiré ; cependant, elle répartit l’échantillon sur l’ensemble de la population, permet
souvent une grande précision mais l’inconvénient qu’elle possède et qu’elle peut laisser
échapper certains phénomènes de périodicité.
La méthode non probabiliste est une méthode d'échantillonnage dans laquelle les
éléments sont choisis de manière arbitraire et où on ne connaît pas la probabilité qu'a un
élément de faire partie de l'échantillon.
En effet, ces méthodes ne sont pas scientifiques, et parmi elles on trouve :
L'échantillonnage à l'aveuglette,
L'échantillonnage de volontaires,
L'échantillonnage au jugé et
L'échantillonnage par la méthode des quotas.
1. Echantillonnage à l’aveuglette
Ce sont des erreurs attribuables à l’imperfection humaine à l’une ou l’autre des phases
du sondage. Elles contribuent à fausser les résultats d’un sondage.
Les principales sources de ces erreurs sont :
Échantillon mal choisi représentativité d’un échantillon
Termes mal définis termes bien compris et facile à interpréter
Mauvaise base de sondage bien cerner et bien décrire la population visée
Question mal posée question claire et sans ambiguïté
Réponses ou renseignements inexacts données recueillies méticuleusement
Biais imputables aux relations entre des personnes éviter en tant que sondeur
de diriger ou influencer les réponses. La personne qui répond ne doit pas être
indisposée par le sondeur ou par la méthode utilisée.
Absences de réponses peu importe le soin qu’on apporte dans la conduite
d’un sondage, on se retrouve toujours avec des taux plus ou moins importants de
non-réponses, c’est-à-dire d’indécis, de refus de répondre, d’absences ou de manque
d’informations. On peut imputer des réponses aux non-répondants en s’appuyant sur
des données extérieures au sondage.
Mauvais traitement des données éviter les erreurs d’ordre technique allant
de la banale erreur de calcul à l’utilisation erronée de concepts et de formules.
En bref, les statistiques menteuses ou trompeuses ne viennent pas des mathématiques
mais bien des personnes qui manipulent ou lisent ces chiffres.
Le chercheur, l’enquêteur et le statisticien doivent impérativement mettre beaucoup de
soins dans la formation de l’échantillon et prendre toutes les mesures possibles pour
assurer le caractère représentatif de celui-ci.
7.3 Distributions d’échantillonnage
7.3.1 Paramètre et statistique
Considérant une population de taille N sur laquelle on étudie une variable statistique
quantitative X. Pour décrire une population, on a défini certaines caractéristiques
numériques intrinsèques telles la moyenne, la variance, une proportion ou fréquence
relative, etc.
• Paramètres de la population : valeurs numériques qui décrivent une population.
• Une statistique : valeur numérique décrivant une caractéristique d’un échantillon.
Le problème fondamental de l’étude des statistiques consiste à trouver les valeurs des
paramètres et statistiques correspondantes.
L’inférence statistique utilise une pour tirer des conclusions concernant un paramètre.
7.3.2 Distribution d’échantillonnage
C’est la distribution de probabilités d’une variable aléatoire dont les réalisations sont
des statistiques associées aux échantillons.
Si on veut avoir un certain contrôle sur les variations d’une statistique d’un échantillon
à l’autre, il faut connaitre le comportement de cette statistique lorsqu’elle est soumise
aux variations attribuables à l’échantillonnage. En somme, il faut connaitre la
distribution d’échantillonnage de la variable dont les réalisations sont ces statistiques
d’échantillons.
Par ailleurs, on décrit généralement une distribution d’échantillonnage comme toute
autre distribution de probabilités, par deux mesures importantes : sa moyenne et sa
variance (ou son écart-type).
7.4 Distribution d’échantillonnage de la moyenne 𝑿
7.4.1 Echantillonnage avec remise
Lorsque les échantillons sont prélevés sans remise, alors les variables aléatoires 𝑋𝑖 ne
sont plus indépendantes.
Cela ne modifie pas le résultat en ce qui a trait à l’espérance mathématique, mais la
variance doit dans ce cas être affectée d’un facteur de correction (N – n)/(N – 1).
Théorème
Soit une population de taille N sur laquelle on étudie une variable statistique 𝑋 de
moyenne 𝝁 et de variance 𝝈𝟐 , et soit 𝑋, la variable aléatoire représentant la moyenne
dans un échantillon de taille n prélevé sans remise dans cette population.
Alors : et
Exemple
Dans un grand centre commercial, on a disposé 33 distributrices à breuvages. On sait
qu’en moyenne une distributrice offre 48 breuvages différents avec une variance de
11,4. Si on note par 𝑋 la variable aléatoire représentant le nombre moyen de breuvages
différents offerts par une distributrice dans un échantillon de 12 distributrices prélevé
sans remise dans ce centre commercial. Trouver 𝐸 𝑋 𝑒𝑡 𝑉𝑎𝑟(𝑋)
Solution
𝑋 est la variable représentant le nombre de breuvages différents offerts par une
distributrice dans ce centre commercial. On a 𝜇𝑋 = 48, 𝜎𝑋2 = 11,4, 𝑁 = 33 𝑒𝑡 𝑛 =
12. L’échantillon étant prélevé sans remise, on a :
D’un point de vue pratique, lorsque la taille de la population N est grande et lorsque
l’échantillon n est petit par rapport à N (𝑛 < 𝑁/20), le facteur de correction est
tellement près de 1 qu’il n’y a presque plus de différence entre les deux résultats de
calcul de variance. Dans ces circonstances, on peut négliger ce facteur de correction.
La variance 𝑉𝑎𝑟(𝑋) mesure la dispersion des moyennes échantillonnales autour de la
moyenne 𝝁 de la population. Plus n est grand, moins les moyennes échantillonnales
𝒙𝒊 s’écartent de 𝝁.
7.4.3 Distribution de probabilités de 𝑿
Pour avoir une indication sur la forme de la distribution de probabilités de 𝑋, on
recourt aux théorèmes suivants :
Théorème 1
Soit une population de taille N sur laquelle on étudie une variable X telle que 𝑋 ↝
𝑁 𝜇; 𝜎 2 . Si 𝑋 est la variable aléatoire représentant la moyenne dans un échantillon de
taille n prélevé dans cette population, alors pour toute valeur de n on a :
• Si l’échantillon est prélevé avec remise :
En effet, lorsqu’une variable 𝑋 obéit à une loi normale, la variable aléatoire 𝑋 obéit
également, cependant, on peut trouver son espérance et sa variance.
Le fait de connaitre la distribution de 𝑋 permet de calculer la probabilité qu’une
moyenne échantillonnale se situe dans un intervalle donné.
Exemple
Une brûlerie offre des sacs de café torréfié. La masse de ces sacs est une variable
obéissant à une loi normale de moyenne 250 g et de variance 14,3 g². Si on prélève un
échantillon de 32 de ces sacs, quelle est la probabilité que la masse moyenne dans cet
échantillon soit comprise entre 249 g et 251 g ?
Solution
On note par 𝑋 la variable représentant la masse des sacs de café de cette brûlerie. Vu
qu’on ne connait pas la taille de la population, on peut supposer que cette taille est très
grande, c’est-à-dire on considère que N est quasi infini. De ce fait, on constate qu’il n’y
a aucune différence entre un échantillon prélevé sans remise et un échantillon prélevé
avec remise.
Par ailleurs, en traitant l’échantillon comme s’il était prélevé avec remise, on aura :
Si 𝑋 est la variable aléatoire représentant la masse moyenne des sacs de café dans un
échantillon de taille 𝑛 = 32, alors :
On cherche maintenant : 𝑃(249 < 𝑋 < 251)
T.D
Le prix de vente d’une calculatrice offerte par 58 commerces de la région
métropolitaine est une variable obéissant à une loi normale de moyenne 19,65$ avec un
écart type de 1,16$. Si on prélève (sans remise) un échantillon de 10 commerces de la
région métropolitaine offrant cette calculatrice, quelle est la probabilité que le prix de
vente moyen soit supérieur à 20$ ?
Le théorème 1 est fort utile puisqu’il nous fait connaitre la distribution de 𝑋 à partir des
paramètres connus de 𝑋. Cependant, ce théorème exige que 𝑋 obéit à une loi normale.
Par ailleurs, on a observé que, même si 𝑋 n’obéit pas à une loi normale lorsqu’on
considère des échantillons de taille assez grande, 𝑋 obéit presque à une loi normale.
Cette observation trouve son fondement théorique dans un théorème appelé théorème
central limite.
Théorème central limite
Si 𝑋1 , 𝑋2 , … , 𝑋𝑖 , … , 𝑋𝑛 sont des variables aléatoires indépendantes ayant la même
distribution de probabilités et si 𝑺 est une variable aléatoire représentant la somme des
variables aléatoires 𝑋𝑖 , 𝑆 = 𝑋𝑖 , alors, lorsque n devient infiniment grand (𝑛 ↝ ∞),
Où :
𝝈²
• 𝝈𝒙 = si l’échantillon est prélevé avec remise.
𝒏
𝝈𝟐 𝑵−𝒏
• 𝝈𝒙 = si l’échantillon est prélevé sans remise.
𝒏 𝑵−𝟏
Exemple
Une compagnie fabrique des patins à roues alignées. On sait que les roues utilisées font
en moyenne 1340 km avec un écart-type de 280 km. Trouver la probabilité que dans un
échantillon de 75 patins, les roues fassent en moyenne moins de 1300 km.
Solution
Soit 𝑋, la distance que font les roues d’un patin. En considérant, également que la
population de patins est très grande et que le prélèvement de l’échantillon se fait avec
remise. Rien ne permet de présumer que 𝑋 obéit à une loi normale.
On a :
Puisque l’échantillon est grand (𝑛 = 75 ≥ 30), on peut utiliser le théorème central
limite et affirmer que 𝑋 est approximé par une loi normale :
Soit une population de taille 𝑁, dans laquelle on trouve une proportion 𝝅 d’individus
ayant une certaine caractéristique. Si 𝑃 est la variable aléatoire représentant la
proportion des individus dans un échantillon de taille 𝒏 ayant la caractéristique étudiée,
si 𝒏 ≥ 𝟑𝟎, 𝒏𝝅 ≥ 𝟓, 𝒏 𝟏 − 𝝅 ≥ 𝟓, alors l’approximation suivante est valable :
Où :
𝝅(𝟏−𝝅)
• 𝝈𝑷 = si l’échantillon est prélevé avec remise.
𝒏
𝝅(𝟏−𝝅) 𝑵−𝒏
• 𝝈𝑷 = si l’échantillon est prélevé sans remise.
𝒏 𝑵−𝟏
Exemple
L’été dernier, 23% des Montréalais ont pris des vacances à l’extérieur du Québec. Si on
prélève avec remise un échantillon de 60 Montréalais, quelle est la probabilité que dans
cet échantillon on trouve entre 20% et 25% de Montréalais ayant pris des vacances à
l’extérieur du Québec ?
Solution
Soit 𝜋, la proportion de Montréalais ayant pris des vacances à l’extérieur du Québec ;
𝜋 = 0,23.
On a :
Si 𝑃 représente la proportion des Montréalais ayant pris des vacances à l’extérieur du
Québec dans un échantillon de taille 𝑛 = 60, alors :
On cherche 𝑃(0,20 < 𝑃 < 0,25).
Dans ce cas-ci, on a 𝑃 = 𝑋/𝑛. On sait que 𝑋 obéit à une loi binomiale et qu’on
l’approxime par une loi normale. Il faut donc tenir compte de la correction de continuité
et, selon le cas, ajouter ou soustraire 0,5 à 𝑋, c’est-à-dire 0,5/𝑛 à la variable 𝑃.
Ainsi,
T.P
Parmi les 450 personnes qui assistent au spectacle du groupe AUCUBE ce soir, 288 ont
acheté leur billet à l’avance. Si on prélève un échantillon de 40 personnes assistant au
spectacle, quelle est la probabilité que dans cet échantillon au moins 30 personnes aient
acheté leur billet à l’avance ?
ESTIMATION
8.1 Estimateur
8.1.1 Théorie de l’estimation
Est l’ensemble des méthodes utilisées pour évaluer un paramètre d’une population à
l’aide d’une statistique prise dans un échantillon extrait de cette population.
Exemple
On veut estimer le revenu moyen des médecins américains sans avoir à faire un
recensement qui s’avérait sans doute pénible, long et couteux.
Solution
La méthode statistique consiste à prélever un échantillon de taille 𝑥, à calculer le revenu
moyen 𝑥 dans cet échantillon et à utiliser cette statistique 𝑥 pour remplacer 𝜇. On
s’attend cependant que 𝑥 soit une valeur assez près de 𝜇.
Pour s’en assurer il faut étudier la distribution d’échantillonnage de la variable aléatoire
𝑋.
On dit que 𝒙 est un estimé de 𝝁 et que 𝑿 est un estimateur de 𝝁.
ESTIMATION
On dira d’une estimation et, par extension, d’un sondage qu’il est valide si l’estimation
est sans biais, c’est-à-dire si la moyenne de tous les estimés provenant de tous les
échantillons possibles est égale à la valeur du paramètre dans la population.
En effet, un sondage valide ne donne certainement pas des résultats parfaits. Cependant
il y aura certainement des erreurs attribuables à l’échantillonnage.
Pour mesurer la précision ou la fiabilité des résultats, on étudie la distribution
d’échantillonnage, c’est-à-dire la distribution des estimés provenant de tous les
échantillons possibles ; plus précisément, on étudie l’écart-type de cette distribution
d’échantillonnage que l’on appelle erreur-type.
Plus l’erreur-type est petite, plus le sondage est fiable. Dans un sondage fiable, l’erreur-
type diminue à mesure que la taille de l’échantillon augmente.
𝑛 𝑥𝑖2 15 40677 2
𝑠= − 𝑥² = − 50,2 = 14,3338
𝑛−1 𝑛 14 15
ESTIMATION
Exemple
Pour connaitre l’opinion des Américains concernant le programme d’aide sociale, on
prélève un échantillon de 460 personnes parmi lesquelles on en trouve 167 qui
approuvent ce programme. Estimer de façon ponctuelle la proportion d’Américains
approuvant le programme d’aide sociale.
Solution
Désignons par 𝜋 la proportion d’Américains approuvant le programme d’aide sociale.
On peut estimer 𝜋 par 𝑝.
𝑛𝑖 167
𝑃= = = 0,3630
𝑛 460
On peut donc estimer qu’environ 36% des Américains approuvent le programme d’aide
sociale.
L’estimation ponctuelle est simple à effectuer et commode puisqu’elle fournit une
valeur qui peut jouer le rôle du paramètre inconnu. Elle présente cependant un
inconvénient, soit celui de ne pas donner d’indications sur l’erreur possible entre
l’estimé et le paramètre.
La connaissance de la distribution de probabilités permet de juger l’écart possible entre,
l’estimé et le paramètre. Cela nous amène à l’estimation par intervalle.
8.1.4 Estimation par intervalle
Elle consiste à construire autour de l'estimé un intervalle qui aura une grande
probabilité de contenir la valeur du paramètre. Cet intervalle, qui varie d'un échantillon
à l'autre, s'appelle un intervalle de confiance et la probabilité qu'un tel intervalle
contienne la valeur du paramètre s'appelle le niveau de confiance.
On note le niveau de confiance par 1 − 𝛼; 𝛼 devient alors le risque d'erreur, c'est-à-dire
la probabilité qu'un intervalle de confiance ne contienne pas la valeur du paramètre. Si
𝜃 est le paramètre à estimer alors un intervalle de confiance de la forme [a,b]doit être
tel que P a ≤ θ ≤ b = 1 − α.
On dit alors que [a,b] est un intervalle de confiance du paramètre 𝜃 au niveau de
confiance 1 − α. Ce niveau de confiance que l'on peut associer à un degré de certitude
est souvent exprimé en pourcentage.
Si on imagine qu’à l’aide d’un grand nombre d’échantillons différents, on construit un
grand nombre d’intervalles de confiance, 1 − α représente la proportion de ces
intervalles de confiance qui contiennent le paramètre .
Pour les paramètres 𝜇, 𝜋 𝑒𝑡 𝜎 2 , on a comme intervalles de confiance :
8.2 Intervalle de confiance pour la moyenne 𝜇
8.2.1 Distribution de l’estimateur
Considérons une population sur laquelle on étudie une variable X qui obéit à une loi
normale : 𝑋 ↝ 𝑁 𝜇; 𝜎 2
On suppose 𝜎 2 connue et on veut estimer la moyenne 𝜇par un intervalle de confiance.
On prélève avec remise un échantillon de taille n. On calcule 𝑥 ce qui constitue une
estimation ponctuelle de 𝝁.
Graphiquement, on peut représenter Z et 𝑋 par une même courbe mais avec des échelles
différentes selon l'axe horizontal puisque l'une est une transformation linéaire de l'autre.
Avec :
• 𝟏 − 𝜶, le niveau de confiance désiré qui représente la probabilité que 𝑋 se situe dans
la partie centrale de la distribution.
• 𝜶 : le risque d’erreur, doit être divisé en deux parties égales 𝛼/2 puisqu’on peut
s’éloigner de 𝜇 aussi bien à gauche qu’à droite.
ESTIMATION
En considérant la courbe normale centrée réduite de la variable 𝑍.
Avec 𝑍𝛼/2 la valeur de 𝑍 telle que l’aire sous la courbe normale centrée réduite, à droite
de cette valeur, est 𝛼/2 c’est-à-dire 𝑃 𝑍 > 𝑧𝛼/2 = 𝛼/2.
On peut écrire 𝑃 −𝑧𝛼/2 ≤ 𝑍 ≤ 𝑧𝛼/2 = 1 − 𝛼.
𝑋−𝜇 𝑋−𝜇
En remplaçant 𝑍 par on obtient 𝑃 −𝑧𝛼/2 ≤ ≤ 𝑧𝛼/2 = 1 − 𝛼.
𝜎² 𝜎²
𝑛 𝑛
L’équation finale montre que, selon les diverses valeurs de la variable aléatoire 𝑋, on a
une proportion 1 − 𝛼 des intervalles contenant 𝜇 de la forme :
Considérons une population sur laquelle on étudie une variable 𝑋 qui obéit à une loi
normale.
Dans les deux premiers cas étudiés, la variance 𝜎² de la distribution de la variable 𝑋
était connue. Or dans la plus part des cas où on veut estimer une moyenne, la variance
de la variable 𝑋 dans la population n'est pas connue.
Cependant, on en fait une estimation ponctuelle en utilisant :
Avec :
o 𝒙𝒊 : donnée recueillie dans un échantillon de taille 𝑛.
o 𝒙 : la moyenne dans cet échantillon.
La statistique 𝑆² est une valeur de l’estimateur :
Difficile dans ces conditions d’affirmer que la variable obéit à une loi
normale.
ESTIMATION
Cette variable, ce n'est plus Z. Les variations de Z sont attribuables uniquement aux
variations de 𝑋.
𝑋−𝜇
La nouvelle variable a des variations qui sont imputables aux variations de deux
𝑆2
𝑛
variables 𝑋 et 𝑆² qui sont indépendantes.
En effet, 𝑋 peut prendre une valeur très grande par rapport à 𝝁 alors que 𝑺² peut
prendre une valeur très petite par rapport à 𝝈² et inversement. De ce fait, on doit donc
s’attendre à ce que cette variable ait une plus grande dispersion que 𝑍 ; de plus cette
dispersion diminue à mesure que 𝑛 augmente.
La variable n’est donc pas la même d’une valeur de 𝒏 à l’autre. On a donc un ensemble
de variables qu’on note 𝑻𝒏−𝟏 ∶
Avec :
o 𝒏 − 𝟏 : le nombre de degrés de liberté.
ESTIMATION
La courbe représentative ressemble à une courbe de loi normale. Elle est symétrique par
rapport à 0, elle a une forme de cloche mais elle est plus aplatie qu’une courbe normale.
A mesure que 𝒏 augmente, la courbe de 𝑇𝑛−1 s’approche de plus en plus de la courbe
de 𝑍.
Une autre distribution est celle de W.S. Gosset, appelée distribution de Student ou
distribution t, que l’on note par :
A l’aide d’un raisonnement analogue à celui utilisé dans le premier cas, on trouve qu’un
intervalle de confiance au niveau de confiance 1 − 𝛼 a la forme :
ESTIMATION
o Lorsque l’échantillonnage est fait avec remise :
En pratique,
Les lois de Student sont utilisées pour de petits échantillons 𝑛 < 30 .
La loi normale centrée réduite pour de grands échantillons 𝑛 > 30 .
Exemple
Un fabricant de piles veut estimer la durée de vie de ses piles. Pour ce faire il prélève un
échantillon de 20 piles et vérifie leur durée de vie. Il obtient les résultats suivants en
heures :
35 41 46 38 37 34 41 37 39 41 42 43 49 35 42 40 48 32 36 44
En supposant que la durée de vie obéit à une loi normale, construire un intervalle de
confiance au niveau de confiance de 95 % pour estimer la durée de vie moyenne de ces
piles.
ESTIMATION
Solution
Soit 𝑋, la variable représentant la durée de vie d’une pile. On a 𝑋 ↝ 𝑁(𝜇 ; 𝜎 2 ).
On a 𝑛 = 20 et, à partir des données brutes, on calcule 𝑥 = 40,0 et 𝑠 = 4,62.
𝛼
On désire un niveau de confiance de 95%, donc 1 − 𝛼 = 0,950 et = 0,025.
2
Selon la table IV, 𝑡0,025 𝑝𝑜𝑢𝑟 20 − 1 = 19 degrés de liberté vaut 2,09.
L’intervalle de confiance cherchée a la forme :
𝑆2 𝑆²
𝑥 − 𝑡𝛼/2 ; 𝑥 + 𝑡𝛼/2
𝑛 𝑛
On aura :
4,622 4,62²
40 − 2,09 ; 40 + 2,09 = 37,8 ; 42,2
20 20
Considérons maintenant une population dans laquelle on étudie une variable 𝑋 dont on
ne connaît ni la distribution, ni la variance σ².
Dans ce cas, on ne peut utiliser ni la distribution de Student, ni le théorème de
distribution normale.
L'expérience démontre que pour 𝒏 très grand, la variable : peut être approximée
par la variable 𝑍.
Cette approximation est valable pour des valeurs de 𝒏 très grandes, soit 𝑛 ≥ 100.
En pratique, on utilise cette approximation pour 𝑛 ≥ 30 puisqu’il n’y a pas d’autres
résultats à utiliser dans ces circonstances ; il faut garder à l’esprit le fait qu’alors
l’approximation peut être beaucoup moins bonne.
On trouve qu’un intervalle de confiance au niveau de confiance 1 − 𝛼 a la forme :
o Lorsque l’échantillonnage est fait avec remise :
o Lorsque l’échantillonnage est fait sans remise dans une population de taille 𝑁 :
ESTIMATION
Exemple
Julie possède une collection de 320 timbres rares. Pour estimer la valeur moyenne de
ces timbres, elle prélève sans remise un échantillon de 60 timbres et trouve une valeur
moyenne de 12,61$ avec un écart-type échantillonnal de 3,46$. Construire un intervalle
de confiance au niveau de confiance de 99% pour estimer la valeur moyenne des
timbres de Julie.
Solution
Soit 𝑋, la valeur des timbres de la collection de Julie. On ne connait rien de la
distribution de 𝑋. On prélève un échantillon de taille 𝑛 = 60 et on trouve 𝑥 = 12,61 et
𝑠 = 3,46. On a 𝑁 = 320.
𝛼
On désire un niveau de confiance de 99%, 1 − 𝛼 = 0,990 et = 0,005 ;
2
On trouve 𝑍0,005 = 2,58.
L’intervalle de confiance cherché a la forme :
Avec les données du problème, on a :
ESTIMATION
On résume dans le tableau de synthèse les quatre cas d’estimation par intervalle de la
moyenne 𝜇 d’une population.
ESTIMATION
8.3 Intervalle de confiance pour une proportion 𝝅
8.3.1 Distribution de l’estimateur 𝑷
Pour estimer une proportion 𝜋 des membres d’une population possédant une certaine
caractéristique, on peut utiliser la proportion 𝑝 trouvée dans un échantillon et ainsi
obtenir une estimation ponctuelle.
Si on veut ajouter des indications sur l’écart possible entre 𝑝 et 𝜋, on doit alors faire
une estimation par intervalle. La méthode utilisée est en tout point semblable à celle
utilisée dans le cas d’une moyenne.
Considérons une population dans laquelle on trouve une proportion 𝜋 d’individus ayant
une certaine caractéristique. La variable aléatoire représente la proportion des individus
ayant cette caractéristique dans un échantillon de taille 𝑛.
Soit 𝒏 ≥ 𝟑𝟎, 𝒏𝝅 ≥ 𝟓 et 𝒏(𝟏 − 𝝅) ≥ 𝟓.
D’après le théorème de proportion dans un échantillon, l’approximation suivante est
valable :
ESTIMATION
Exemple
Pour connaitre la popularité d’une émission de radio, on prélève avec remise un
échantillon de 650 personnes et on en trouve 182 qui écoutent cette émission.
Construire un intervalle de confiance au niveau de confiance de 95% pour estimer la
proportion de la population qui écoute cette émission.
Solution
Dans ce contexte, on suppose qu’on a une très grande population.
Désignons par 𝜋 la proportion de la population qui écoute cette émission.
On trouve :
182
𝑝= = 0,28
650
ESTIMATION
A l’aide de cet estimé ponctuel 𝑝 on vérifie les conditions :
𝑛𝑝 = 650 0,28 = 182 ≥ 5 et 𝑛 1 − 𝑝 = 650 0,72 = 468 ≥ 5.
𝛼
On désire un niveau de confiance de 95 % donc 1 − 𝛼 = 0,95, = 0,025 𝑒𝑡 𝑧0,025 =
2
1,96.
L’intervalle de confiance cherché a la forme :
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑝 − 𝑧𝛼/2 ; 𝑝 + 𝑧𝛼/2
𝑛−1 𝑛−1
Dans ce cas :
0,28 0,72 (0,28)(0,72)
0,28 − 1,96 ; 0,28 + 1,96 = 0,245 ; 0,315
649 649
𝜎²
𝐸𝐸𝑀 = 𝑧𝛼/2
𝑛
A partir de cette formule, on déduit que, pour une marge d’erreur spécifiée, la taille de
l’échantillon est donnée par :
En pratique, avant de faire une estimation, on doit se demander quelle est la marge
d’erreur acceptable ?
Cette marge d’erreur acceptable que l’on utilise ensuite comme erreur d’estimation
maximale permet de déterminer la taille de l’échantillon à prélever.
ESTIMATION
Exemple
Pour connaitre la recette journalière moyenne d’un théâtre, on veut prélever un
échantillon d’un certain nombre de jours dans le but d’estimer cette recette journalière
moyenne. Si on suppose que la recette journalière est une variable obéissant à une loi
normale d’écart-type 100$ et qu’on accepte une marge d’erreur de 40$ au niveau de
confiance de 95%, quelle doit être la taille de l’échantillon prélevé ?
Solution
Soit 𝑋, la recette journalière de ce théâtre.
On sait que 𝑋 ↝ 𝑁 et que 𝜎 = 100. On accepte 𝐸𝐸𝑀 = 40 et, à un niveau de
confiance de 95%, 𝑧0,025 = 1,96.
La taille de l’échantillon est de :
2
1,96 × 100
𝑛= = 24,01
40
Donc, un échantillon de taille 𝑛 = 25 ou plus répond aux exigences posées.
ESTIMATION
Si l’échantillonnage se fait sans remise dans une population de taille 𝑁, alors 𝒏 s’exprime
par :
En pratique, il ne faut pas oublier que la détermination de la taille de l’échantillon est une
opération préalable au calcul de l’intervalle de confiance et au prélèvement même de
l’échantillon.
En fait, ce que l’on veut connaitre avant de procéder au calcul d’un intervalle de confiance,
c’est l’ordre de grandeur de la taille de l’échantillon afin d’avoir une erreur d’estimation
acceptable.
En effet, la formule donnée pour déterminer 𝒏 suppose que 𝑋 obéit à une loi normale
(l’approximation est valable dès que 𝒏 ≥ 𝟑𝟎) et que 𝝈 est connu.
Or, en général, 𝝈 n’est pas connu. On peut l’estimer et remplacer 𝝈 par son estimé 𝒔 dans la
formule :
En isolant 𝑛 on obtient :
La méthode scientifique utilisée par l'être humain pour établir une connaissance quelconque
peut se résumer en trois grandes étapes :
Observation d'un fait ou d'un phénomène.
Formulation d'une explication de ce fait ou de ce phénomène sous la forme d'une hy-
pothèse ou d'une loi.
Vérification de l'hypothèse au moyen d'une expérience quelconque ou d'un test.
Le processus utilisé ici permet de valider ou d’invalider l’hypothèse posée, et c’est avec une
très grande probabilité. Ce qu’on fait lorsque, par une expérience quelconque, on arrive à
confirmer ou à infirmer une hypothèse s’appelle un test d’hypothèse.
Cette forme de vérification constitue la deuxième grande catégorie de problèmes abordés en
inférence statistique.
On appelle hypothèse statistique un énoncé, une affirmation concernant une ou plusieurs
populations. Cette hypothèse est dite paramétrique, si c’est un énoncé quantitatif concernant
un paramètre de la ou des populations. Autrement, elle est dite non paramétrique.
Un test d'hypothèse est un processus permettant de confirmer ou d'infirmer une
hypothèse statistique concernant une ou plusieurs populations en examinant un
échantillon dans la ou les populations.
Un test d'hypothèse est dit paramétrique si l'hypothèse à vérifier est paramétrique.
Si un test d'hypothèse est un instrument très utile dans le processus de prise de
décision, il faut comprendre qu'en aucun cas il ne donne de certitude absolue. La
confirmation ou l'infirmation d'une hypothèse est toujours faite avec une certaine
probabilité que l'on voudra cependant aussi forte que possible.
Dans tout test d'hypothèse, on établit deux hypothèses mutuellement exclusives qui
sont, en quelque sorte, confrontées. Une et une seule d'entre elles sera acceptée.
Hypothèse nulle, 𝑯𝟎 .
C'est l'hypothèse qui sera rejetée uniquement s'il y a suffisamment d'évidence contre
elle. C’est l’hypothèse qui n’amène pas de changement, qui n’amène pas d’action à
entreprendre. C'est l'hypothèse du statu quo, appelée hypothèse de l’incrédule ou
hypothèse prudente.
Cette hypothèse nulle sera rejetée uniquement si la preuve présentée montre, hors de
tout doute raisonnable, que cette hypothèse nulle est fausse.
• Dans tout test d’hypothèse, on considère que l’hypothèse nulle est l’hypothèse à
vérifier.
Dans un test paramétrique, l’hypothèse nulle doit être simple, c’est-à-dire ne
mentionner qu’une seule valeur du paramètre étudié. Par exemple une hypothèse nulle
pourrait avoir la forme: « 𝜋 = 0,50 »
Hypothèse alternative ou contre-hypothèse : H1
C'est l'hypothèse qui sera acceptée si H 0 est rejetée. C'est l'hypothèse qui amène un
changement, qui implique généralement une action à entreprendre.
Dans un test paramétrique, l’hypothèse alternative est généralement composée, c’est-à-
dire qu’elle mentionne plusieurs valeurs du paramètre étudié. Par exemple, une
hypothèse alternative pourrait avoir la forme: « 𝜋 > 0,50 »
Soit 𝜃, un paramètre quelconque et soit H 0 , une hypothèse nulle ainsi formulée : H 0 :
«𝜃 = 𝜃0 » où 𝜃0 est une valeur fixe du paramètre.
L'hypothèse alternative peut prendre l'une ou l'autre des formes suivantes:
⇰ 𝐻1 : 𝜃 ≠ 𝜃0 le test est dit bilatéral
⇰ 𝐻1 : 𝜃 < 𝜃0 le test est dit unilatéral à gauche
⇰ 𝐻1 : 𝜃 > 𝜃0 le test est dit unilatéral à droite
Le choix de la forme de l'hypothèse alternative peut dépendre du point de vue de
la personne qui construit le test ou encore de ce qu'on cherche à établir avec ce test.
Exemple
La compagnie BELTOTO affirme que ses nouvelles voitures consomment 8,6 litres par
100 km. Un chroniqueur automobile met en doute cette affirmation. Pour vérifier cette
affirmation, le Club Automobile élabore un test d'hypothèse. Formuler une hypothèse
nulle H 0 et une hypothèse alternative H 1 pour ce test d'hypothèse.
Solution
La variable étudiée 𝑋 est la consommation en litres par 100 km des nouvelles voitures
BELTOTO. Le test porte sur la moyenne de 𝑋. À moins de preuve du contraire, on
accepte l'affirmation de la compagnie.
Ainsi, H 0 : « 𝜇 = 8,6 »
L'hypothèse alternative pourrait prendre l'une ou l'autre des trois formes suivantes:
𝜇 ≠8,6 ou 𝜇<8,6 ou 𝜇>8,6.
Dans le contexte, si on met en doute l'affirmation de la compagnie, c'est qu'on pense
que la consommation pourrait être supérieure à celle annoncée. Si elle était inférieure,
on en serait heureux et on n'aurait aucune raison de se plaindre. On choisit donc :
H1: « μ> 8,6 »
Il faut noter, qu'au sens mathématique, une autre formulation de H1 n'est pas mauvaise.
Elle pourrait simplement apporter une conclusion un peu différente si on devait rejeter
H 0.
La suite du test consiste, en gros, à prélever un échantillon, à calculer une moyenne à
partir de cet échantillon, et à décider si cette moyenne est suffisamment supérieure à 8,6
pour rejeter H 0 .
6.1.3 Risques d’erreurs et règle de décision
Supposons que 𝜃 est un paramètre quelconque et que H 0 et H 1 sont des hypothèses ainsi
formulées :
𝑋−11,5
On peut poser 𝑍 = ↝ 𝑁 0; 1 . Sur un même graphique, on représente 𝑋 et Z.
0,3098
Le test est bilatéral, le niveau de signification 𝛼 = 0,050, qui est la probabilité de commettre
une erreur de première espèce, doit être subdivisé en deux parties égales. Selon l'échelle Z,
la zone d'acceptation est l'intervalle [-Z0,025; Z0,025] soit [-1,96; 1,96]. Selon l'échelle 𝑋, la
zone d'acceptation est [a, b] où a et b sont les valeurs de X correspondant à -1,96 et 1,96
respectivement. Le lien entre les variables 𝑋 et Z est donné par :