COURS DE STATISTIQUE ET PROBABILITE, IR KENNEDY, Bac 2

UNIVERSITE LIBERTE
FACULTE DES SCIENCES INFORMATIQUES

DEPARTEMENT DE L’INFORMATIQUE DE GESTION
COURS DE STATISTIQUE DESCRIPTIVE

Destiné aux étudiants de 1è𝑚𝑒 Bachelier ( IG, ISI et RT )
Par Ass. Ir KENNEDY KALENGA KAZADI

(Ingénieur civil Chimiste)
E-mail : [email protected]
Tél : 099 206 53 26
ANNEE ACADEMIQUE 2016 – 2017

INTRODUCTION
1. Objectifs finaux
 Savoir choisir la méthode statistique adaptée sur un cas concret simple et pour une
question donnée simple, et savoir appliquer cette méthode;
 Connaıtre les limites de chaque méthode et interpréter correctement les résultats;
 Prendre conscience de l’importance d’une bonne collecte des données.
Pour bien comprendre et apprécier à sa juste valeur les informations chiffrées qui
nous envahissent quotidiennement, il est important de ne pas laisser quiconque faire,
dire n’importe quoi aux statistiques; on doit plutôt être capable de soutirer soi même
une information juste et objective à partir de données chiffrées.
2. Nature
La statistique est la science qui traite des principes et des méthodes servant à recueillir,
à classer, à organiser, à synthétiser et à présenter des données numériques, puis, avec le
concours du calcul des probabilités, à analyser, à interpréter, à tirer des conclusions et à
prendre des décisions judicieuses à partir de ces données numériques.
Lorsqu'on utilise l'expression « la statistique » au singulier, on fait référence à
la science telle qu'on vient de la définir.
Lorsqu'on parle « des statistiques » au pluriel, on parle de données numériques.
L'expression « une statistique » désigne une donnée numérique.
1. Méthode des sciences exactes
La méthode classique des sciences exactes étudie un phénomène quelconque dans des
conditions idéales et néglige certains écarts aléatoires en décrivant le phénomène étudié
selon un schéma idéal et souvent simplifié.
Cette méthode retient les facteurs fondamentaux intervenant dans un phénomène et ne
porte pas attention à l'influence de facteurs secondaires. Les modèles ainsi obtenus
peuvent être très utiles mais rarement parfaits.
Dans tout phénomène ou expérience interviennent des facteurs aléatoires secondaires
très nombreux et parfois très compliqués, de sorte qu'il est impossible de les enregistrer
tous et, ainsi, de tenir compte de chacun dans l'élaboration d'un modèle. Cependant,
l'ensemble de ces facteurs aléatoires secondaires conduit à la théorie dite théorie des
probabilités.
De nos jours, il est presque impensable de faire une étude sérieuse des statistiques sans
s'adjoindre les éléments de base de la théorie des probabilités.
INTRODUCTION
2. Méthode statistique
Elle fait appel à l’utilisation conjointe des statistiques et de la théorie des probabilités,
c’est-à-dire elle tient compte de l'ensemble des facteurs aléatoires secondaires qui
amène à étudier les lois régissant les dispersions aléatoires de données numériques.
Cette méthode d'étude peut être utilisée dans presque toutes les disciplines.
 Etapes de la méthode statistique
 La reconnaissance du problème;
 La collecte des données;
 Le regroupement, classification et présentation des données;
 La comparaison avec des modèles théoriques;
 L’analyse et interprétation.
INTRODUCTION
1. Reconnaissance du problème
Dans cette étape, il faut délimiter de manière précise :
- la population sur laquelle porte l’étude;
- la / ou les caractéristiques étudiées dans cette population, et
- les objectifs qu’on désire atteindre par cette étude.
Négliger cette étape peut conduire à des résultats inexacts ou déformés (et / ou truqués)
2. Collecte des données
Cette deuxième étape est très importante et elle doit être effectuée méticuleusement.
C'est le défi principal du statisticien « sur le terrain ». L'adéquation entre les objectifs
poursuivis et les résultats obtenus en dépend.
Cette collecte se fait selon l'un des deux modes suivants :
 Le recensement : opération par laquelle on recueille les informations faisant l'objet
d'étude auprès de tous les individus de la population.
 Le sondage : opération par laquelle on recueille les informations requises auprès
d'une partie de la population appelée « échantillon ».
La caractéristique principale de l’échantillon est qu’il doit être représentatif.
La collecte des données est donc une opération clé qui peut s'avérer très délicate dans
son aspect technique.
INTRODUCTION
3. Regroupement, classification et présentation des données
A l'issue du recensement ou du sondage, on a un amas de données appelées données
brutes.
À partir de normes, de définitions, de méthodes et de techniques reconnues, il faut
maintenant synthétiser et organiser cet amas de données pour en faire une présentation
aussi simple et aussi claire que possible. C'est l'objet d'étude de la statistique
descriptive.
4. Comparaison avec des modèles théoriques
A partir de l'étude de phénomènes où intervient le hasard, on élabore des modèles
théoriques de comportement qu'on appelle des lois de probabilités.
Selon la nature et les objectifs du problème étudié, on compare la situation observée
avec l'une ou l'autre des lois de probabilités.
5. Analyse et interprétation
A l'aide des éléments fournis par les deux étapes précédentes, on procède à une analyse
des résultats.
On peut expliquer et interpréter les résultats obtenus, tirer certaines conclusions, faire
une prévision avec une certaine marge d'erreur ou prendre une décision éclairée sur
base de l'interprétation des résultats.
INTRODUCTION
La partie de la statistique qui a pour objet l'étude des méthodes permettant de tirer des
conclusions concernant une population à l'aide de données recueillies dans un
échantillon extrait de cette population s'appelle « l’inférence statistique ».
L’étude des statistiques est subdivisée en 3 grandes parties:
 Statistique descriptive : étudie l’ensemble des méthodes permettant de recueillir, de
classer, de synthétiser, de décrire et de présenter des données numériques.
 Modèles probabilistes: on introduit les modèles mathématiques permettant
d’étudier les phénomènes liés au hasard.
 Inférence statistique: on étudie l’ensemble des méthodes permettant de tirer des
conclusions concernant une population déterminée à partir de données provenant
d’un échantillon choisi dans cette population.
REGROUPEMENT ET EXPOSITION DES DONNEES
1.1 Terminologie de base
1.1.1 Population et échantillon
 On appelle population (ou ensemble statistique) tout ensemble sur lequel porte
une étude statistique.
• Une population peut être formée de personnes, d’animaux, d’objets et même de
faits.
On désigne par « N » le nombre d’éléments dans la population ou la taille de la
population.
 On appelle individu(s) (ou unités statistiques) l(es) élément(s) de l’ensemble sur
lequel porte une étude statistique.
 On appelle échantillon tout sous-ensemble de la population.
On désigne par « n » le nombre d’éléments dans l’échantillon ou la taille de
l'échantillon.
• On procède à l’étude sur un échantillon lorsqu’une étude statistique porte sur une
population très grande ou difficilement accessible dans sa totalité.
Individus Population
Echantillon
Exemple 1
Une usine fabrique des tiges métalliques utilisées dans l’assemblage de certaines
structures. Pour étudier la résistance à la traction de ces tiges, on mesure cette résistance
pour un lot de 100 tiges. On demande de déterminer la propriété étudiée, la population
et l’unité statistique ?
Solution
• Propriété étudiée : la résistance à la traction de tiges métalliques,
• Population : l’ensemble des 100 tiges ou des 100 mesures,
• Unité statistique : chacune des tiges ou chacune des 100 mesures.
1.1.2 Caractères
Un caractère est tout critère sur lequel repose une étude statistique.
Un caractère peut être :
 quantitatif
 qualitatif
 Caractère quantitatif
Un caractère est dit quantitatif lorsque les modalités sont mesurables ou repérables.
Exemple
La taille, poids, âge, composition, nombre des particules, délai de livraison, etc.
 Caractère qualitatif
Un caractère est dit qualitatif lorsque les modalités ne sont pas mesurables.
Exemple
La couleur, marque, sexe, niveau d’études, activité professionnelle, type de logement,
etc.
Lorsqu’on s’intéresse à certaines particularités ou caractères des individus d’une
population statistique, notamment :
un seul caractère étudié série numérique à une dimension.
deux caractères étudiés série numérique à deux dimensions.
plus de deux caractères on utilise les techniques de l’analyse multidimensionnelle
1.1.3 Variables statistiques
Une variable statistique ou aléatoire est un caractère que possède chacun des individus
de l’échantillon ou de la population faisant l’objet d’une étude statistique.
Elle est notée par une lettre majuscule : 𝑋, 𝑌, …
 Modalités
Ce sont les différents états ou différentes valeurs que peut prendre une variable
statistique.
Elles sont notées par le même lettre minuscule d’une variable statistique affectée
d’indices : 𝑥1 , 𝑥2 , … 𝑜𝑢 𝑦1 , 𝑦2 , … .
Une modalité quelconque peut être notée par 𝒙𝒊 .
En effet, on peut pour une même variable statistique avoir des ensembles de modalités
différents.
Par exemple, pour la variable statistique « état civil », comme modalités :
On pourrait se contenter des deux modalités suivantes : marié et non marié.
On peut raffiner davantage en admettant d’autres modalités : marié, en union libre,
séparé, divorcé, célibataire, veuf et religieux.
En effet, l’ensemble de modalités choisi pour une variable statistique donnée dépend
des objectifs de la recherche et de la précision requise. Cependant, ces modalités
devront former un ensemble tel que chaque observation faite sur un individu donne un
résultat qui se situe dans une et une seule de ces modalités.
Exemple 2
Un restaurant désire faire une enquête auprès de sa clientèle. On décide donc qu'à
chaque client qui viendra la semaine suivante, on lui demandera de remplir une petite
carte où celui-ci indiquera son sexe, son degré de satisfaction, son heure d'arrivée, le
nombre de personnes qui l'accompagnent et le montant de l'addition. Indiquer quelle est
la population concernée et l'échantillon choisi, quelles sont les variables statistiques
étudiées et quelles seraient les modalités ou valeurs de celles-ci.
Solution
Population : Ensemble des clients du restaurant.
Echantillon : Ensemble des clients qui viendront au restaurant au cours de la semaine
suivante.
Variables statistiques :
𝑋: sexe
𝑌: degré de satisfaction
𝑇: heure d’arrivée
𝑉: nombre de personnes qui accompagnent le client
𝑊: montant de l’addition
Modalités des variables statistiques :
𝑋: 𝑚𝑎𝑠𝑐𝑢𝑙𝑖𝑛, 𝑓é𝑚𝑖𝑛𝑖𝑛
Pour
𝑌: 𝑡𝑟è𝑠 𝑖𝑛𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑖𝑡, 𝑖𝑛𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑖𝑡, 𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑖𝑡, 𝑡𝑟è𝑠 𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑖𝑡
𝑇: 0, 24
𝑉: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 𝑜𝑢 𝑝𝑙𝑢𝑠
𝑊: 0, 200
Les variables statistiques sont parfois qualifiées de :
 Variable dépendante : variable dont on veut expliquer le comportement.
 Variable indépendante : est celle qui cause la variation du variable dépendante.
 Variable contrôlée : est celle qui peut, au gré du chercheur, prendre la modalité ou
la valeur désirée.
Exemple
Si on énonce l’hypothèse que le revenu d’un Congolais dépend de son âge et de sa
scolarisation, trouver les différentes variables étudiées.
• Variable dépendante : revenu.
• Variable indépendante : âge et le niveau de scolarisation.
• On peut faire de l'âge une variable contrôlée en choisissant des individus d'âge
déterminé à l’avance pour former l’échantillon.
En effet, les variables statistiques sont classifiées en fonction de la nature des modalités
qu’elles peuvent prendre, ainsi on a :
 Les variables statistiques qualitatives, et
 Les variables statistiques quantitatives.
1.2 Etude d’une variable statistique qualitative
On parle d’une variable statistique qualitative lorsque les modalités de la variable ne
sont pas des nombres.
Les variables statistiques peuvent être subdivisées en deux espèces selon l’échelle de
mesure utilisée dans les observations :
 Echelle de mesure nominale : utilisée lorsque les observations recueillies sont
simplement placées dans des modalités mutuellement exclusives décrites par une
propriété. On parle d’une variable statistique qualitative nominale.
Dans l’exemple 2, le caractère 𝑿 fait intervenir une échelle de mesure nominale.
 Echelle de mesure ordinale : utilisée lorsque les observations recueillies sont
classées dans des modalités ordonnées selon un critère bien défini. On parle d’une
variable statistique qualitative ordinale.
Dans l’exemple 2, le caractère 𝒀 fait intervenir une échelle de mesure ordinale.
Bien sûr, on ne peut pas mesurer la différence entre « très insatisfait » et « satisfait »,
mais il y a certainement un peu plus de satisfaction lorsqu’on passe d’une modalité à
la modalité suivante. Il y a donc une certaine mesure relative de la quantité de
satisfaction. On parle de la variable statistique semi-quantitative.
1.2.1 Distribution d’une variable statistique 𝑿
Lorsqu’on mène une étude statistique dans une population formée de N individus ou
dans un échantillon formé de n individus, les premières informations recueillies forment
ce qu’on appelle les données brutes.
L’ensemble des modalités de 𝑋 est : 𝑥1 , 𝑥2 , … , 𝑥𝑖 , … , 𝑥𝑘
Le nombre k de modalités différentes, ne peut pas être supérieur à N ou à n.
Cependant, ces données brutes sont difficilement utilisables et très difficiles à
interpréter. D’où il faut les condenser pour en faire une présentation aussi simple que
possible.
On trace un tableau des données brutes dans lequel pour chaque modalité 𝒙𝒊 , on calcule
le nombre d’individus ayant cette modalité.
Exemple
Soit l'étude de l'état civil des 40 employés de la compagnie SOLID. Ainsi, N = 40, et 𝑋
représente la variable statistique qualitative ou caractère. Admettons pour le caractère 𝑋
les modalités suivantes :
{Marié(e), célibataire, divorcé(e), veuf (ve), religieux (se)}
Les données recueillies se présentent comme suit:
On dresse la liste de toutes les modalités puis, en relisant le tableau des données brutes,
on inscrit une marque verticale en regard d’une modalité sur la liste chaque fois qu’on
rencontre celle-ci dans le tableau.
1.2.2 Fréquence absolue ou effectif 𝒏𝒊
Le nombre d’apparitions de la variable dans la population ou dans l’échantillon, c’est-à-

dire le nombre d’individus associés à chaque modalité.
La somme des effectifs est toujours égale au nombre d’individus dans la population ou
dans l’échantillon.
♠ Sur une population
♠ Sur un échantillon
1.2.3 Fréquence relative ou proportion 𝒇𝒊
On définit la fréquence relative ou proportion d’une modalité 𝒙𝒊 par :
Population Echantillon
La somme des fréquences relatives est toujours égale à 1.
En pratique, on limite la précision des fréquences relatives à trois chiffres après la

virgule décimale.
 Mode : est la modalité à laquelle est associée la plus forte fréquence relative.
1.2.4 Pourcentage %
On appelle pourcentage d’une modalité 𝒙𝒊 le nombre :

En effet, l’ensemble des couples 𝒙𝒊 , 𝒏𝒊 est une fonction que l’on appelle distribution
de fréquences ou simplement distribution de 𝑿.
Un tel ensemble de données est aussi appelé une série statistique simple, c’est-à-dire
ne concernant qu’une seule variable statistique.
Une distribution de fréquences sera généralement donnée sous forme de tableau.
Cependant, lorsqu’il n’y a qu’une seule variable statistique étudiée, on dit qu’il s’agit
d’un tableau à une entrée ou tableau à une dimension.
Bien sûr, il faut toujours donner un titre à un tableau et préciser le contenu de chaque
colonne.
Pour le cas de l’exemple précédent le tableau de distribution de fréquences sera donné
par :
1.2.5 Taux d’une modalité ou d’un évènement
On définit le taux d’une modalité ou le taux d’un évènement par :
Ce taux est généralement multiplié par 100 pour l’exprimer en pourcentage.

Exemple
En considérant l’exemple de la compagnie SOLID, trouver le taux de divorce ?
Solution
taux de divorce = 23,1 %
1.2.6 Présentation graphique
Toute l’information chiffrée que l’on possède se trouve dans le tableau de distribution
de fréquences. Il est cependant bien utile d’illustrer cette information en représentant
graphiquement la distribution de fréquences d’un caractère.
La représentation graphique se fait généralement par plusieurs diagrammes à savoir :
 Un diagramme en colonnes (ou en rectangle, ou en tuyaux d’orgue),
 Un diagramme à secteurs (ou diagramme circulaire), ou
 Un diagramme figuratif (ou pictogramme).
 Diagramme en colonnes
On utilise deux axes perpendiculaires. Sur l’axe horizontal, on indique par des segments
de longueurs égales, séparés l’un de l’autre, les modalités de 𝑋. Sur l’axe vertical, en
choisissant une unité de mesure appropriée, on indique les effectifs (ou les fréquences
relatives).
Chaque couple (𝒙𝒊 , 𝒏𝒊 ) est représenté par un rectangle de hauteur 𝒏𝒊 (ou 𝒇𝒊 ).
 Diagramme à secteurs
On utilise un cercle que l’on subdivise en autant de secteurs qu’il y a de modalités et où
l’aire de chacun de ces secteurs est proportionnelle au pourcentage de la modalité
correspondante.
L’angle au centre pour chacun des secteurs est de 𝒇𝒊 × 𝟑𝟔𝟎 degrés.
Par exemple pour le cas de la compagnie SOLID, on aura :
 Diagramme figuratif ou pictogramme
On utilise diverses illustrations ou images pour donner une synthèse visuelle de la
distribution de fréquences.
En pratique, ces pictogrammes sont surtout utilisés lorsque les fréquences sont des
nombres très grands.
Par exemple pour le cas de la compagnie SOLID :
Exemple
Dans un sondage réalisé auprès d'un échantillon de 450 personnes âgées de 18 ans et
plus et demeurant dans la région métropolitaine de Québec, on a demandé si on croyait
qu'il y a beaucoup de gens mariés ou en union libre qui ne se séparent pas à cause des
enfants. 131 personnes ont répondu «beaucoup», 249 «un peu», 43 de ce nombre, «pas
du tout» et 27 «ne peut pas préciser». (Source: Le Soleil, dimanche 11 septembre 1988.)
Indiquer la population, la variable concernée et le type d'échelle de mesure utilisée.
Construire un tableau de distribution de fréquences en y incluant une colonne de
fréquences relatives. Trouver le mode de la distribution. Représenter graphiquement
cette distribution par un diagramme en colonnes.
Solution
Population : Ensemble des personnes âgées de 18 ans et plus et demeurant dans la
région métropolitaine de Québec. L'échantillon est extrait de cette population.
Variable : Opinion sur l'importance du nombre de gens mariés ou en union libre qui ne
se séparent pas à cause des enfants.
Échelle de mesure : C'est une variable statistique qualitative et les réponses suggérées
indiquent une échelle de mesure ordinale.
Le mode de cette distribution est « un peu », ce qui permet de dire qu'en général les
gens concernés croient qu'il y aurait un peu plus de séparations sans la présence des
enfants dans un couple.
T.D
1.3 Etude d’une variable statistique quantitative
1.3.1 Variable discrète et continue
 Une variable statistique quantitative est dite discrète si les valeurs que peut prendre
cette variable sont des valeurs isolées, généralement entières.
Exemple
Le nombre d’enfants d’une personne, le nombre d’employés d’une usine, etc.
 Une variable statistique quantitative est dite continue si l’ensemble des valeurs
qu’elle peut prendre est un intervalle de l’ensemble des nombres réels.
Exemple
La température (39,107°), les longueurs, les surfaces, le temps, l’espace, la masse, etc.
En effet, la distinction entre une variable statistique discrète et une variable statistique
continue semble claire d’un point de vue théorique. Cependant, en pratique cette
distinction n’est pas toujours aussi nette puisque, rigoureusement, toute mesure est
discrète du fait que la précision d’une mesure est toujours limitée.
Ce n’est pas la nature de l’ensemble, mais le nombre des valeurs d’une variable
statistique quantitative qui nous servira de critère pour distinguer diverses situations.
De ce fait, les données d’une variable statistique quantitative peuvent être représentées
sous trois formes : les données rangées, condensées ou regroupées en classes.
1.3.2 Données rangées
Le nombre 𝑵 d’individus dans la population est petit (𝑵 < 𝟐𝟎)
Cette définition de (𝑵 < 𝟐𝟎) n’a pas de fondement théorique et ne se base que sur
l’expérience pratique. Ce n’est pas une règle stricte mais beaucoup plus une ligne de
conduite. Ce nombre n’est donc pas rigoureux et on pourra s’en écarter à l’occasion.
Par ailleurs, le présent cas s’applique aussi lorsqu’on a un échantillon petit (𝒏 < 𝟐𝟎), si
bien qu’il soit assez rare qu’on considère un tel échantillon.
o Un échantillon trop petit risque de fournir des données qui s’écartent trop des
données réelles dans la population.
Exemple
Carole vient de s’acheter un terrain et elle a noté, en mètres, la hauteur des arbres sur ce
terrain; elle obtient les données brutes suivantes:
12 11 14 7 9 4 21 11 8
Ranger ces données dans un ordre ascendant.
Solution
On a : 4 7 8 9 11 11 12 14 21
De ce fait, il serait peu utile de construire un tableau de distribution de fréquences vu
qu’un diagramme en colonnes ou à secteurs apporterait fort peu d’éléments intéressants.
Cependant, construire un tableau de distribution de fréquences là que tous les effectifs
seraient de 1 sauf celui de la donnée 11 qui serait 2 équivaudrait presque à reproduire la
liste des données rangées dans un ordre ascendant.
Parmi les situations où le nombre d’observations ou de données est petit, on trouve les
séries chronologiques ou série temporelle ou chronique qui est un ensemble de
valeurs d’une variable statistique quantitative observées dans le temps, habituellement à
intervalle égaux.
Pour une série chronologique, il est inutile de construire un tableau de distribution de
fréquences. Cependant, il est intéressant même très révélateur de représenter
graphiquement une série chronologique.
Cette représentation graphique se fait dans un système de coordonnées cartésiennes ;
sur l’axe horizontal ou axe des abscisses, on représente le temps ; sur l’axe vertical ou
axe des ordonnées, on représente la variable statistique quantitative étudiée.
Exemple
Un journaliste sportif étudie la carrière du légendaire joueur de hockey Maurice
Richard. Il relève, notamment, le nombre de buts marqués par le « Rocket » au cours de
chacune des 18 saisons jouées par celui-ci de 1942-1943 à 1959-1960.
On a, dans l'ordre : 5, 32, 50, 27, 45, 28, 20, 43, 42, 27, 28, 37, 38, 38, 33, 15, 17, 19
Représenter graphiquement cette série chronologique.
Solution
1.3.3 Données condensées
Le nombre 𝒌 de valeurs différentes de la variable est petit par rapport à 𝑵 ou 𝒏

(𝑵 𝒐𝒖 𝒏 ≥ 𝟐𝟎)
On construit un tableau de distribution de fréquences en incluant au besoin les colonnes
de fréquences relatives et de pourcentages. On peut cependant calculer de la même
manière des rapports ou des taux selon les besoins.
On représente graphiquement la distribution par un diagramme en bâtons : dans un tel
diagramme, on utilise deux axes perpendiculaires. Sur un des axes, on indique les
diverses valeurs 𝒙𝒊 de la variable 𝑋 et sur l’autre, on indique les effectifs correspondants
𝒏𝒊 (ou les fréquences relatives 𝒇𝒊 ).
Chaque couple (𝒙𝒊 , 𝒏𝒊 ) ou (𝒙𝒊 , 𝒇𝒊 ) est représenté par un segment de droite (dit bâton)
de longueur 𝒏𝒊 (ou 𝒇𝒊 ), selon une graduation convenablement choisie.
Exemple
On a mené une enquête auprès d’un échantillon de 60 ménages de la région d’Ottawa-
Hull. On demandait notamment le nombre d’enfants dans le ménage. On a relevé les
données brutes suivantes :
Déterminer la population et la variable. Construire un tableau de distribution de

fréquences incluant les fréquences relatives et les pourcentages. Construire un
diagramme en bâtons.
Solution
• Population : Ensemble des ménages de la région d’Ottawa-Hull et on a prélevé un
échantillon de 60 d’entre eux.
• Variable 𝑋 : le nombre d’enfants dans un ménage.
 une variable statistique quantitative discrète.
Avec : 𝑛 ≥ 20
Diagramme en bâtons :
A noter que lorsqu’on choisit de porter sur l’un des axes les fréquences relatives en lieu
et place des effectifs, le diagramme garde le même profil.
LOIS DE PROBABILITE
180
On en tire donc : Etendue = 9 – 2 = 7 ; 𝐸𝑀 = 𝑥𝑖 − 𝐸 𝑋 𝑓 𝑥𝑖 = = 1,6667
108
1260
𝑉𝑎𝑟 𝑋 = (𝑥𝑖 − 𝐸 𝑋 )2 𝑓 𝑥𝑖 = = 3,8889 ; 𝜎𝑋 = 𝑉𝑎𝑟(𝑋) = 1,9720
324
LOIS DE PROBABILITE
6.3.5 Variable centrée réduite : Z
Une variable aléatoire centrée réduite est une variable aléatoire dont l'espérance
mathématique est zéro et la variance est 1.
Pour toute variable aléatoire X, la transformation linéaire donne :
6.4 Lois discrètes
Une variable aléatoire discrète est caractérisée par sa fonction de probabilités, ou

distribution de probabilités.
Ces distributions ou fonctions servent de modèles probabilistes pour étudier des
phénomènes aléatoires. On les appelle des lois de probabilités. Parmi lesquelles, les
plus importantes sont la loi binomiale, la loi géométrique, la loi binomiale négative, la
loi hypergéométrique et la loi de Poisson.
Chacune d’elle correspond à un modèle d’expérience aléatoire simple. On étudie ces
lois en précisant le modèle auquel elles correspondent, et on trouve leur fonction de
probabilités, leur espérance mathématique et leur variance.
LOIS DE PROBABILITE
6.4.1 Loi binomiale
On appelle épreuve de Bernoulli une expérience aléatoire qui ne comporte que deux
réalisations possibles, une appelée succès et l'autre échec.
On note la probabilité d'obtenir un succès par p et celle d'obtenir un échec par q ;
évidemment : 𝒒 = 𝟏 − 𝒑
Si on répète n fois, dans les mêmes conditions, une épreuve de Bernoulli où de sorte
que la réalisation de chaque épreuve soit indépendante de la réalisation des autres
épreuves, alors la variable aléatoire X correspondant au nombre de succès enregistrés
lors de ces n épreuves suit une loi binomiale.
On lit « X suit (ou obéit à) une loi binomiale de paramètres n, p »

Pour trouver une formule générale qui définit la fonction de probabilités d’une variable
aléatoire X telle que 𝑋 → 𝐵 𝑛; 𝑝 , il revient de trouver la probabilité d’obtenir un
nombre quelconque 𝒙𝒊 de succès parmi n épreuves de Bernoulli (0 ≤ 𝑥𝑖 ≤ 𝑛).
𝑥
Il y a donc 𝐶𝑛 𝑖 manières de placer ces 𝒙𝒊 succès dans une suite de n épreuves de
Bernoulli, et dans chacune de ces manières, on a 𝒙𝒊 succès avec une probabilité de p et
LOIS DE PROBABILITE
chacun et 𝑛 − 𝑥𝑖 échecs avec une probabilité de q chacun. Ainsi, si 𝑋 → 𝐵 𝑛; 𝑝 la
fonction de probabilités de X est définie par :
Exemple 7
Pour faire une petite enquête dans un quartier de la ville, on envoie par la poste 10
questionnaires à remplir. Si la probabilité de recevoir une réponse à un questionnaire est
1/3 et si on note par X le nombre de questionnaires retournés, trouver la fonction de
probabilités de X.
Solution
En considérant que l'envoi d'un questionnaire et son retour par la poste est une épreuve
de Bernoulli avec une probabilité de succès de 1/3. On a donc ici une suite de n = 10
épreuves de Bernoulli indépendantes avec p = 1/7, alors X↝B (10 ; 1/3).
On a :
0 2 10 1 2 9
0 1 1 1
𝑓 0 = 𝐶10 = 0,0173 𝑓 1 = 𝐶10 = 0,0867
3 3 3 3
2 2 8 3 2 7
2 1 3 1
𝑓 2 = 𝐶10 = 0,1951 𝑓 3 = 𝐶10 = 0,2601
3 3 3 3
LOIS DE PROBABILITE
4 2 6 5 2 5
4 1 5 1
𝑓 4 = 𝐶10 = 0,2276 𝑓 5 = 𝐶10 = 0,1366
3 3 3 3
6 2 4 7 2 10
6 1 7 1
𝑓 6 = 𝐶10 = 0,0569 𝑓 7 = 𝐶10 = 0,0163
3 3 3 3
8 2 2 9 2 1
8 1 9 1
𝑓 8 = 𝐶10 = 0,0030 𝑓 9 = 𝐶10 = 0,003
3 3 3 3
10 2 0
10 1
𝑓 10 = 𝐶10 = 0,00002
3 3
LOIS DE PROBABILITE
Tableau résumant la fonction de probabilités :
LOIS DE PROBABILITE
6.4.2 Loi géométrique
Situons-nous dans le contexte où on effectue une suite d'épreuves de Bernoulli
indépendantes avec une probabilité p d'obtenir un succès à chacune de ces épreuves.
Imaginons qu’on poursuit ces épreuves jusqu’à l’obtention d’un premier succès et
désignons par X la variable aléatoire représentant le nombre d’épreuves nécessaire pour
obtenir ce premier succès. Dans ce cas, on dit que X est une variable aléatoire
géométrique et que sa distribution de probabilités suit une loi géométrique.
Pour trouver une formule générale définissant la fonction de probabilités d’une variable
aléatoire géométrique telle que 𝑿 ↝ 𝑮(𝒑), il revient de trouver la probabilité d'obtenir
un premier succès après 𝒙𝒊 épreuves de Bernoulli indépendantes (1 ≤ 𝑥𝑖 < ∞).
On doit donc obtenir 𝒙𝒊 − 𝟏 échecs avec une probabilité 𝒒 = 𝟏 − 𝒑 chacun, suivi d'un
succès avec une probabilité p.
Ainsi :
LOIS DE PROBABILITE
Exemple 8
Dans un certain territoire, il y a 12 % de la population qui parle l’espagnol. En
choisissant au hasard des personnes dans cette population (on suppose que les choix
sont faits avec remise), quelle est la probabilité que la première personne trouvée
parlant espagnol soit dans les trois premiers choix?
Solution
Considérons chaque choix de personne comme une épreuve de Bernoulli où le fait que
cette personne parle l'espagnol est un succès. Notons que le fait de considérer que les
choix sont faits avec remise assure l'indépendance des épreuves de Bernoulli
successives. Si X représente le nombre requis d'épreuves de Bernoulli pour obtenir un
premier succès, alors X ↝ G (0, 12).
On recherche 𝑃 𝑋 =1 +𝑃 𝑋 =2 +𝑃 𝑋 =3 .
On a : (0,12) + (0,12)(0,88) + (0,12)(0,88)² = 0,3185
LOIS DE PROBABILITE
6.4.3 Loi binomiale négative (ou loi de Pascal)
Situons-nous encore une fois dans le contexte où on effectue une suite d'épreuves de
Bernoulli indépendantes avec une probabilité p d'obtenir un succès à chacune de ces
épreuves.
A l’inverse de la loi binomiale, ici on fixe le nombre de succès r et on s’intéresse au
nombre d’épreuves 𝒙𝒊 nécessaire pour obtenir ces r succès. La variable aléatoire
considérée représente le nombre d’épreuves qu’il faut pour obtenir r succès. On dit que
cette variable aléatoire considérée X est une variable aléatoire binomiale négative et que
sa distribution de probabilités suit une loi binomiale négative ou loi de Pascal.
L’ensemble des réalisations possibles de X est 𝑟, 𝑟 + 1, 𝑟 + 2, 𝑟 + 3, … .

Pour trouver la formule générale définissant la fonction de probabilités d’une variable
aléatoire binomiale négative de paramètres r et p, il revient de trouver la probabilité
qu'on ait besoin de 𝒙𝒊 épreuves de Bernoulli pour obtenir r succès, sachant que la
probabilité d'obtenir un succès à chacune des épreuves est p.
LOIS DE PROBABILITE
Parmi ces 𝒙𝒊 épreuves, il y a r succès et 𝒙𝒊 − 𝒓 échecs. Dans le cas présent, il est certain
que la dernière épreuve (la 𝒙𝒊 ème) est un succès, il reste donc à placer 𝒓 − 𝟏 succès
parmi les 𝒙𝒊 − 𝟏 épreuves qui précèdent la dernière.
Cela peut se faire de 𝐶𝑥𝑟−1
𝑖 −1
manières différentes. Ainsi, la fonction de probabilité de X
est :
Dans le cas où r = 1, on a une loi géométrique.

Exemple 9
Dans le contexte de l’exemple 8, quelle est la probabilité qu’il faille choisir cinq
personnes pour en trouver deux qui parlent l’espagnol ?
Solution
Désignons par Y le nombre de choix de personnes qu’il faut pour en trouver deux
parlant l’espagnol.
𝑌 ↝ 𝐵𝑁(2; 0,12)
𝑃 𝑌 = 5 : 𝑃 𝑌 = 5 = 𝐶41 (0,12)2 (0,88)3 = 4(0,12)2 (0,88)3 = 0,0393
LOIS DE PROBABILITE
Théorème
Si X est une variable aléatoire obéissant à une loi binomiale négative 𝑋 ↝ 𝐵𝑁(𝑟; 𝑝) :
Exemple 10
Dans le contexte de l’exemple 9, trouver E(Y) et Var(Y).
Solution
𝑌 ↝ 𝐵𝑁(2; 0,12)
𝑟 2
𝐸 𝑌 = = = 16,6667
𝑝 12
𝑟(1 − 𝑝) 2(1 − 0,12)
𝑉𝑎𝑟 𝑌 = = = 122,2222 et 𝜎𝑌 = 122,2222 = 11,05
𝑝2 (0,12)2
6.4.4 Loi hypergéométrique

Un modèle mathématique qui est très fréquemment utilisé en statistique est celui qui
consiste à choisir successivement et sans remise, ou encore, ce qui est équivalent,
extraire en un seul tirage, un échantillon de n individus dans une population en
comprenant N.
LOIS DE PROBABILITE
Supposons qu’au départ il y ait k individus qui possèdent une caractéristique que l’on
étudie, évidemment N – k individus n’ont pas cette caractéristique. On désigne par
p=k/N la proportion initiale des individus qui ont la caractéristique étudiée.
Si la variable aléatoire X représente le nombre d’individus dans l’échantillon qui
possèdent cette caractéristique, alors X suit une loi hypergéométrique.
On lit « X suit (ou obéit à) une loi hypergéométrique de paramètres N, n, p »

L’ensemble des réalisations possibles de X est 0, 1, 2, 3, … , 𝑛 .
Illustration graphique :
LOIS DE PROBABILITE
Pour trouver une formule générale définissant la fonction de probabilités d’une variable
aléatoire X telle que 𝑋 ↝ 𝐻(𝑁; 𝑛; 𝑝), il revient de trouver la probabilité de choisir 𝒙𝒊
individus possédant la caractéristique étudiée dans un échantillon de n individus.
Pour obtenir la probabilité cherchée, il faut diviser ce nombre de cas favorables par le
nombre de cas possibles, c’est-à-dire le nombre de manières différentes de choisir n
individus dans une population en comptant N, soit 𝐶𝑁𝑛 .
Ainsi,
La fonction de probabilités de X est définie par :
Exemple 11
Dans un groupe de 15 automobilistes, 6 possèdent une voiture japonaise et les 9 autres,
une voiture américaine. Si on choisit 5 de ces automobilistes, quelle est la probabilité
que 2 d’entre eux soient propriétaires d’une voiture japonaise ? De plus, trouver la
fonction de probabilités de la variable aléatoire X représentant le nombre
d’automobilistes possédant une voiture japonaise et tracer l’histogramme.
LOIS DE PROBABILITE
Solution
On a une population de 15 automobilistes, donc N = 15. Parmi ces automobilistes, 6
possèdent la caractéristique d'avoir une voiture japonaise, donc :
𝑘 6
𝑘 = 6 𝑒𝑡 𝑝 = = = 0,4
𝑁 15
On choisit simultanément (donc sans remise) 5 automobilistes, donc n = 5. Désignons par X
le nombre d'automobilistes choisis possédant une voiture japonaise.
Alors : X↝H(15 ; 5 ; 0,4), On cherche d'abord f (2) :
𝐶62 𝐶93 15 × 84
𝑓 2 = 𝑃(𝑋 = 2) = 5 = 3003 = 0,4196
𝐶15
Pour compléter la fonction de probabilités de X, rappelons que l'ensemble des réalisations
possibles de X est {0, 1, 2, 3, 4, 5} et cherchons les probabilités f (0), f (l), f (2), f (3), f (4),
f (5) :
LOIS DE PROBABILITE
La fonction de probabilités se résume dans le tableau :
LOIS DE PROBABILITE
Théorème
Si X est une variable aléatoire obéissant à une loi hypergéométrique 𝑋 ↝ 𝐻(𝑁; 𝑛; 𝑝),
alors :
Exemple 12
Dans le contexte de l’exemple 11 :
a) Quel nombre d’automobilistes possédant une voiture japonaise peut-on espérer ?
b) Quelle est la probabilité qu’on choisisse plus d’automobilistes possédant une
voiture japonaise que ceux propriétaires d’une voiture américaine ?
Solution
a) E(X) = np = 5(0,4) = 2,0
b) On cherche 𝑃 𝑋 > 2 ; 𝑃 𝑋 > 2 = 𝑃 𝑋 = 3 + 𝑃 𝑋 = 4 + 𝑃 𝑋 = 5
= 0,2398 + 0,0450 + 0,0020 = 0,2868
LOIS DE PROBABILITE
6.4.5 Loi de Poisson
Un autre modèle mathématique fréquemment utilisé en statistique est celui de
1’occurrence de succès dans un certain intervalle de temps, de longueur, d'espace ou de
tout intervalle continu.
Toute variable X résultant d’une expérience aléatoire est dite variable aléatoire ; si, de
plus, elle correspond au nombre de phénomènes observés (comptage) par unité
fondamentale, elle suit en général une loi type, dite loi de Poisson de paramètre λ.
On note
Sa fonction de probabilité est telle que :
Exemple 12
La compagnie TRUITE reçoit en moyenne deux appels téléphoniques à la minute. Si on
admet que le nombre d’appels téléphoniques reçus suit une loi de Poisson, quelle est la
probabilité que la compagnie reçoive cinq appels dans les trois prochaines minutes ?
LOIS DE PROBABILITE
Solution
Désignons par X le nombre d’appels reçus dans un intervalle de trois minutes.
Alors : 𝜆 =3×2=6
𝑋 ↝ 𝑃(6)
65 −6
On cherche P(X=5) 𝑃 𝑋=5 = 𝑒 = 0,1606
5!
6.5 Lois continues
6.5.1 Variable aléatoire continue
La variable aléatoire est dite continue lorsque l'ensemble des réalisations d'une variable
aléatoire X n'est pas dénombrable et que 𝑃 𝑋 = 𝑥𝑖 = 0 pour toute réalisation 𝒙𝒊 .
A une variable aléatoire continue, on peut généralement associer une fonction de
densité, qui est une fonction réelle y = f (x) possédant les deux propriétés suivantes :
a) 𝑓(𝑥) ≥ 0 pour toute valeur de x
∞
b) −∞
𝑓 𝑥 𝑑𝑥 = 1
LOIS DE PROBABILITE
La représentation graphique utilisée dans le cas d’une variable aléatoire continue est
celle de la courbe représentative de la fonction de densité. On peut considérer que c’est
un cas limite de polygone de probabilités lorsque le nombre de réalisations est infini.
Une fonction de densité est toujours positive et l’aire totale sous la courbe (au sens
géométrique d’une intégrale) est égale à 1.
LOIS DE PROBABILITE
Dans le cas d’une variable aléatoire continue, la probabilité est définie par une mesure
et cette mesure, c’est l’aire sous la fonction de densité.
 Fonction de répartition
Elle représente la probabilité que la variable aléatoire X prenne une valeur inférieure à
la valeur x, c’est-à-dire l’aire sous la courbe de y = f (x) entre - ∞ et x.
La représentation graphique d’une fonction de répartition est une ogive. On peut
considérer qu’une ogive est un cas limite d’une courbe de distribution de probabilités
cumulées lorsque le nombre de réalisations est infini.
La propriété principale de la fonction de répartition est :
 Mode
Le mode d’une variable aléatoire continue X est la valeur de X pour laquelle la fonction
de densité y = f (x) atteint son maximum.
LOIS DE PROBABILITE
 Médiane
La médiane d’une variable aléatoire continue X est la valeur de X qui divise l’aire sous
la courbe de y = f (x) en deux parties égales, ce qu’on exprime mathématiquement par :
 Espérance mathématique
Elle est définie par :
 Ecart moyen
Il est défini par :
 Variance
Elle est définie par :

LOIS DE PROBABILITE
6.5.2 Loi uniforme
Une variable aléatoire continue X est dite distribuée uniformément lorsque sa fonction
de densité est une constante non nulle sur un intervalle 𝛼, 𝛽 et zéro partout ailleurs.
Graphiquement, on a :
Puisque l’aire sous la courbe de la fonction de densité doit être égale à 1 et que cette
figure est un rectangle de base 𝛽 − 𝛼, il s’ensuit que la hauteur est 1/(𝛽 − 𝛼).
L’expression mathématique de la fonction de densité d’une variable aléatoire uniforme
est :
On note :
LOIS DE PROBABILITE
Exemple 12
Si X est une variable aléatoire continue distribuée uniformément sur l’intervalle 𝛼, 𝛽 ,
trouver 𝑃(𝑎 < 𝑋 < 𝑏) si a et b ϵ 𝛼, 𝛽 .
Solution
Géométriquement :
La probabilité cherchée est l’aire sous la courbe entre les verticales x = a et x = b. c’est
un rectangle de base b – a et de hauteur 1/(𝛽 - 𝛼)
LOIS DE PROBABILITE
La probabilité 𝑃(𝑎 < 𝑋 < 𝑏) est donc proportionnelle à la longueur de l’intervalle
𝑎, 𝑏 .
Théorème
Si X est une variable aléatoire distribuée uniformément sur 𝑎, 𝑏 , 𝑋 ↝ 𝑈(𝛼, 𝛽), alors :
Exemple 13
A un certain arrêt d’autobus, les autobus passent toutes les 20 minutes. Par exemple, il y
a un autobus qui passe à 17h00, un autre à 17h20, puis à 17h40, à 18h00 et ainsi de
suite. Etienne se présente entre 17h00 et 18h00 à cet arrêt, l’heure exacte de son arrivée
étant une variable distribuée uniformément sur cette période. Trouver la probabilité
qu’Etienne attende moins de 5 minutes.
Solution
Soit X, le nombre de minutes entre 17h00 et l’heure d’arrivée d’Etienne: 𝑋 ↝ 𝑈 0, 60 .
Pour qu’il attende moins de 5 minutes, il faut qu’il arrive entre 17h15 et 17h20, ou entre
17h35 et 17h40 ou entre 17h55 et 18h00. Donc,
LOIS DE PROBABILITE
6.5.3 Loi exponentielle
Une variable aléatoire continue X est dite variable aléatoire exponentielle lorsque la
fonction de densité est de la forme :
On dit alors que cette variable aléatoire obéit à une loi exponentielle de paramètre 𝝀, et
on note :
Le paramètre 𝝀 représente le nombre moyen de succès par unité de temps ou, ce qui est
souvent plus commode à interpréter, 1/𝝀 représente, en moyenne, le temps entre deux
succès consécutifs.
Exemple 14
On sait que la durée moyenne des transactions au guichet automatique de la banque
APITON est de 6 minutes. Vous arrivez au guichet et quelqu’un juste devant vous
commence sa transaction. Si on suppose que la durée d’une transaction obéit à une loi
exponentielle, quelle est la probabilité que vous attendiez plus de 10 minutes ?
LOIS DE PROBABILITE
Solution
Désignons par X la variable aléatoire représentant la durée d’une transaction en
minutes.
1
𝑋 ↝ 𝐸𝑋𝑃( )
6
1
Alors : 𝑓 𝑥 = 𝑒 −𝑥/6 . On cherche 𝑃 𝑋 > 10 :
6
∞ ∞
1 −𝑥/6 ∞
𝑃 𝑋 > 10 = 𝑓 𝑥 𝑑𝑥 = 𝑒 𝑑𝑥 = −𝑒 −𝑥/6 = 𝑒 −10/6 = 0,1889
10 6
10
10
On peut aussi procéder ainsi : 𝑃 𝑋 > 𝑥 = 𝑒 −𝜆𝑥 , donc 𝑃 𝑋 > 10 = 𝑒 −10/6 = 0,1889
Théorème
Si X est une variable aléatoire exponentielle,
Alors :
LOIS DE PROBABILITE
6.5.4 Loi normale
C’est la loi la plus importante en statistique, on l’appelle également la loi de Laplace-
Gauss.
Une variable aléatoire continue X suit une loi de Gauss, dite également loi normale ou
loi gaussienne, si sa fonction de distribution, dite encore fonction de répartition, est telle
que :
Avec :
• e est la notation usuelle de la fonction exponentielle (𝑒 = 2,71828 … ),
• µ et σ sont deux réels, respectivement l’espérance E[X] et la variance Var(X) de la
variable aléatoire X
La loi de Gauss est donc une loi à deux paramètres : on dit que la variable aléatoire X
suit une loi normale de moyenne µ et de variance σ².
Si la moyenne d’une loi de Gauss est nulle, et sa variance égale à l’unité, on obtient une
distribution normale centrée et réduite (ou loi normale standard) donnée par :
LOIS DE PROBABILITE
𝟏 𝒙𝟐
−
𝒇 𝒙 = 𝒆 𝟐
𝟐𝝅
Pour toute variable aléatoire X suivant une loi normale de moyenne µ et de variance σ²,
la variable aléatoire réduite Z, définie par : Z = (x - µ) /σ, suit une loi normale standard.
La représentation graphique de la fonction de densité d’une variable aléatoire X
obéissant à une loi normale a la forme suivante :
LOIS DE PROBABILITE
A partir de la définition et de la représentation graphique, on fait les observations
suivantes :
 La courbe a une forme dite de cloche,
 La courbe est symétrique par rapport à la droite verticale 𝑥 = 𝜇,
1
 La courbe atteint son maximum, lorsque 𝑥 = 𝜇, ce maximum étant ,
𝜎 2𝜋
 Le mode, la médiane et la moyenne ont tous la même valeur : 𝜇,
 La courbe a deux points d’inflexion, c’est-à-dire deux points de changement de
concavité. Ces points sont les points d’abscisses 𝜇 + 𝜎 et 𝜇 − 𝜎,
 La courbe s’étend indéfiniment dans les deux directions, en se collant presque sur
l’axe horizontal. On dit qu’elle a un comportement asymptotique et que l’axe des x
est une asymptote,
 L’aire totale sous la courbe est 1,
+∞
 𝐸 𝑋 = −∞
𝑥𝑓 𝑥 𝑑𝑥 = 𝜇
+∞
 𝑉𝑎𝑟 𝑋 = −∞
𝑥 − 𝜇 2 𝑓 𝑥 𝑑𝑥 = 𝜎²
LOIS DE PROBABILITE
En effet, une loi normale dépend toujours de deux paramètres 𝝁 et 𝝈² qui, lorsqu’ils
sont connus, la loi normale est entièrement connue. Cependant,
• Si 𝝁 change, la courbe se déplace horizontalement et,
• Si 𝝈 𝑜𝑢 𝝈² varie, la courbe devient plus condensée ou plus dispersée.
Quelques exemples graphiques : cas des courbes ayant le même centre mais avec des
dispersions différentes.
LOIS DE PROBABILITE
Calcul d’une probabilité pour une variable obéissant à une loi normale
Supposons que X est une variable aléatoire continue telle que 𝑋 ↝ 𝑁(𝜇; 𝜎 2 ). La
probabilité que X prenne une valeur entre deux nombres a et b est définie par :
C’est l’aire sous la courbe de paramètres 𝝁 et 𝝈𝟐 entre les verticales x = a et x = b.
Pour évaluer la probabilité on ramène toutes les courbes normales à une seule, la courbe
(𝑋−𝜇)
normale centrée réduite, par la transformation linéaire 𝑍 =
𝜎
Il est facile de vérifier que Z est une variable aléatoire centrée réduite.
LOIS DE PROBABILITE
En effet,
Si X est une variable aléatoire obéissant à une loi normale alors Z, la variable aléatoire
centrée réduite obéit également à une loi normale.
Ainsi, lorsque
En faisant cette transformation linéaire sur la variable X et sur toutes les valeurs de X,
on ramène le calcul d’une probabilité sur X à un calcul de probabilités sur Z.
Cette transformation linéaire sur X modifie la distribution mais conserve les

probabilités.
LOIS DE PROBABILITE
En faisant confondre ces deux distributions en une seule courbe. Pour symboliser cette
situation, on utilise deux échelles de mesure différentes sur l’axe horizontal et, on note
l’échelle selon X avec les valeurs touchées puis en dessous, on note l’échelle en Z avec
les valeurs correspondantes :
LOIS DE PROBABILITE
Grace à ces transformations linéaires, il suffit de construire une seule table, celle de la
variable centrée réduite Z. Dans la table II, à la fin du livre, on trouve la valeur de l’aire
sous une courbe normale centrée réduite Z entre la moyenne 0 et une valeur 𝑧𝑖 : P(0 <
𝑍 < 𝑧𝑖 ). Les différentes valeurs de 𝑧𝑖 sont données à une décimale dans la colonne de
gauche alors que la ligne du haut représente la seconde décimale.
Par exemple, pour trouver 𝑃(0 < 𝑍 < 1,34), on cherche la valeur 1,3 dans la colonne
de gauche, puis on se déplace horizontalement jusqu’à la colonne sous le chiffre 4 de la
ligne du haut pour repérer la probabilité cherchée : 𝑃 0 < 𝑍 < 1,34 = 0,4099.
Il sera toujours utile d’esquisser un graphique dans ces calculs de probabilités.
LOIS DE PROBABILITE
Exemple 15
Soit Z, une variable aléatoire normale centrée réduite, 𝑍 ↝ 𝑁(0 ; 1). Trouver :
a) 𝑃(0 < 𝑍 < 0,93) c) 𝑃(−1,35 < 𝑍 < 0)
b) 𝑃(0,36 < 𝑍 < 2,07) d) 𝑃(−0,76 < 𝑍 < 1,57)
Solution
a) La table II donne directement le résultat :
b) Pour trouver la probabilité que Z se situe entre deux valeurs positives, il faut faire
la différence entre deux nombres de la table.
LOIS DE PROBABILITE
En effet, la table donne l’aire entre 0 et 2,07 et l’aire entre 0 et 0,36. La différence sera
l’aire entre 0,36 et 2,07 et, donc, la probabilité cherchée.
𝑃 0,36 < 𝑍 < 2,07 = 𝑃 0 < 𝑍 < 2,07 − 𝑃 0 < 𝑍 < 0,36 = 0,4808 − 0,1406
= 0,3402
c) On peut utiliser la table même pour des valeurs de Z négatives en utilisant le fait
que la courbe est symétrique par rapport à la verticale z = 0
𝑃 −1,35 < 𝑍 < 0 = 𝑃 0 < 𝑍 < 1,35 = 0,4115
d) Si les valeurs 𝑧𝑖 sont situées de part et d’autre de 0, il faut alors additionner deux
valeurs de la table.
LOIS DE PROBABILITE
𝑃 −0,76 < 𝑍 < 1,57 = 𝑃 −0,76 < 𝑍 < 0 + 𝑃 0 < 𝑍 < 1,57
= 𝑃 0 < 𝑍 < 0,76 + 𝑃 0 < 𝑍 < 1,57 = 0,2764 + 0,4418 = 0,7182
Exemple 16
Soit 𝑋 ↝ 𝑁 42 ; 49 . Trouver :
a) 𝑃(𝑋 > 45) b) 𝑃(𝑋 > 40)
Solution
Pour utiliser la table II, il faut transformer la variable aléatoire X en une variable
aléatoire Z centrée réduite.
𝑋 − 42 𝑋 − 42
𝑍= =
49 7
LOIS DE PROBABILITE
a)
On sait que l’aire totale sous la courbe est 1, donc la moitié de cette aire est 0,5000.
b)
LOIS DE PROBABILITE
Dans les calculs de probabilités, on n’a pas à se soucier si les inégalités sont strictes (<)
ou larges (≤) puisque la probabilité qu’une variable aléatoire continue prenne une
valeur réelle précise est nulle.
TD
On considère que l'âge des citoyens d’une ville est une variable aléatoire normale de
moyenne 32 ans et d’écart-type 18 ans. Si on choisit au hasard un citoyen de cette ville,
quelle est la probabilité qu’il soit âgé de moins de 18 ans ?
ECHANTILLONNAGE
7.1 RECENSEMENT – SONDAGE
7.1.1 Enquête ou Recherche
Effectuer une enquête c’est recueillir des données sur certaines personnes ou sur
l’ensemble d’une population dans le but d’estimer certains caractères ou certaines
variables de cette population ou encore dans le but de vérifier des hypothèses ou
analyser les liens entre des caractères ou des variables dans cette population.
On subdivise les recherches ou enquêtes en deux grandes catégories : les recensements
et les sondages.
Recensement : on recueille les informations faisant l'objet d'études auprès de
tous les individus de la population.
Sondage : la collecte d'informations se fait auprès d'un échantillon de la
population.
Théoriquement, on devrait privilégier le recensement comme forme enquête puisqu’elle
donnerait idéalement une information complète et précise.
Cependant, en Pratique, il est rarement possible d’effectuer un recensement sur une
population importante pour l’une ou l’autre des raisons suivantes:
 La population est trop grande.
 La population est non accessible.
 Le recensement entraine des couts trop élevés.
 Le recensement est trop long à effectuer.
 Un grand nombre de recensements deviendrait un fardeau pour une population.
En effet, le recensement a encore sa place lorsque la population est très petite ou
lorsqu’on veut des données détaillées sur de très petites parties de la population.
Cependant, sur de très grandes populations, il peut être utile d’effectuer
occasionnellement un recensement pour bien décrire la population, facilitant ainsi les
sondages qui seront faits par la suite.
L’ensemble des méthodes qui permettent d’obtenir des informations utiles concernant
une population sans avoir effectué un recensement s’appelle « l’inférence statistique. »
Trois étapes de l’inférence statistique :
 Choisir un échantillon représentatif de la population
 Étudier les variables statistiques dans l’échantillon prélevé
 Tirer des conclusions sur le comportement de ces variables statistiques dans la
population.
Les méthodes employées en inférence statistique sont devenues des outils efficaces dans
les processus de prévision et dans ceux de prise de décision.
Méthodes de l’inférence statistique
Les méthodes employées en inférence statistique se regroupent en deux catégories :

 Les estimations, et
 Les tests d’hypothèses
7.1.2 Collecte des données
C’est l’étape clé d’une étude statistique

Première étape : la reconnaissance du problème déterminer les objectifs de la
recherche.
Deuxième étape : la collecte des données choix de l’échantillon
Pour choisir un échantillon et déterminer les relations entre les variables dans une
population ou dans un échantillon, on recourt à la théorie de l’échantillonnage
Etapes de formation d’un échantillon
 Définir la population : il faut bien cerner la population visée de manière à inclure ou

exclure certains individus en fonction des objectifs visés par la recherche.
 Établir une base de sondage : dresser une liste des membres de la population
 Subdiviser la population en unités d’échantillonnage : subdiviser la population en
sous ensembles ou en unités d’échantillonnage
 Déterminer la taille de l’échantillon : la taille est fixée en tenant compte des coûts
liés à cette enquête, des difficultés de rejoindre les individus et de la précision
souhaitée dans les résultats.
 Sélectionner les individus faisant partie de l’échantillon : cette opération peut se
faire selon différentes méthodes que l’on appelle méthodes d’échantillonnage.
7.2 Méthodes d’échantillonnage
7.2.1 Echantillonnage aléatoire simple
1. Echantillon représentatif
En statistique, la qualité essentielle et fondamentale que doit posséder un échantillon est

d’être représentatif de la population. Il doit donc être d’un reflet fidèle, une réplique en
miniature de cette population.
En pratique un échantillon ne peut pas toujours représenter exactement et précisément

une population. Les déviations et les erreurs imputables à l’échantillonnage sont
inévitables.
Pour tenir compte de ces erreurs et, dans certaine mesure, les minimiser on recourt à la
théorie des probabilités qui étudie les phénomènes où intervient le hasard.
o En effet, pour assurer la représentativité d’un échantillon, les méthodes
d’échantillonnage doivent donner à chaque membre de la population la possibilité de
faire partie de l’échantillon.
Un échantillon est dit aléatoire simple si chaque membre de la population à la même
probabilité d’être choisi pour faire partie de cet échantillon de même taille pris dans
cette même population à la même probabilité d’être formé.
2. Formation d’un échantillon aléatoire simple
La technique utilisée pour former un échantillon aléatoire simple est la suivante :
 Chaque individu de la population est représenté par un billet numéroté que l’on
dépose dans une urne.
 On prélève au hasard un nombre de billets égal à la taille désirée de l’échantillon à
former.
 Les individus représentés par ces billets tirés forment l’échantillon aléatoire simple.
Cette technique est appelée le modèle de l’urne. Dans cette technique, le prélèvement
de l’échantillon peut se faire avec remise, c’est-à-dire en remettant dans l’urne le billet
tiré après chaque tirage, ou sans remise, c’est-à-dire en ne remettant pas dans l’urne un
billet tiré.
• Si le prélèvement est fait avec remise alors chaque tirage est indépendant des autres
tirages, ce qui n’est pas le cas lorsque le prélèvement est fait sans remise.
Lorsque la taille de la population est grande et que l’échantillon est petit par rapport à la
taille de la population c’est-à-dire que n < 𝑵/𝟐𝟎, il y a très peu de différence entre un
échantillonnage fait avec remise et un échantillonnage fait sans remise puis que la
probabilité qu’un individu soit choisi plus d’une fois est très faible.
D’un point de vue pratique on fait beaucoup plus souvent l’échantillonnage sans remise
puisqu’il offre l’avantage de donner des résultats un peu plus précis.
• Le modèle de l’urne est une technique assez simple mais elle peut devenir quasi
impraticable si la taille de la population est très grande.
 L’échantillonnage aléatoire simple constitue la méthode de base assurant la
représentativité d’un échantillon.
Cependant, il existe d’autres méthodes d’échantillonnage qui conservent le caractère
représentatif de l’échantillon tout en réduisant les inconvénients pratiques (temps, coûts,
déplacements, etc.) liés à la formation d’un échantillon. C’est notamment les méthodes
probabilistes et les méthodes non probabilistes.
7.2.2 Méthodes probabilistes
La méthode d’échantillonnage probabiliste est une méthode d'échantillonnage dans

laquelle chaque membre de la population a une probabilité mesurable d'être choisi et où
le choix des individus devant faire partie de l'échantillon est fait de manière aléatoire.
L'échantillonnage aléatoire simple est une méthode probabiliste.
Parmi les méthodes probabilistes, on peut citer :
 L'échantillonnage stratifié,
 L'échantillonnage périodique,
 L'échantillonnage par grappes,
 L'échantillonnage à plusieurs degrés,
 L'échantillonnage avec probabilités inégales.
1. Echantillonnage stratifié
Il consiste à subdiviser la population en sous-groupes ou strates, à prélever dans
chacune de ces strates un échantillon aléatoire simple et à regrouper tous ces
échantillons de strates pour former l'échantillon désiré.
Exemple
Si l’on compte faire une enquête concernant le revenu des avocats congolais, on peut
subdiviser la population en strates selon le sexe, c’est-à-dire distinguer le sous groupe des
hommes de celui des femmes, ou encore, stratifier selon l'âge en subdivisant la population
selon les sous groupes [20, 30[, [30, 40[, [40, 50[, [50, 60[, [60 𝑒𝑡 𝑝𝑙𝑢𝑠[.
Cette méthode d’échantillonnage assure à chaque sous-groupe une représentation dans
l’échantillon et, si l’on tient compte du poids de chaque sous-groupe, on peut alors assurer la
représentativité de l’échantillon global.
C’est une méthode qui est souvent utilisée lorsqu’une population possède des sous-groupes à
caractères distincts. On l’utilise beaucoup plus dans le sondage d’opinion. Cependant, cette
méthode exige une connaissance préalable de la population et des groupes qui la composent.
2. Echantillonnage périodique ou systématique
Est utilisé lorsque les individus d'une population sont rangés dans un ordre précis.
Il consiste à choisir un premier individu au hasard, à définir une période fixe appelée pas de
sondage et à choisir dans la population rangée, en utilisant ce pas de sondage, les individus
jusqu'à concurrence du nombre désiré.
Exemple
Sur une ligne de montage de pièces mécaniques, on peut prélever un échantillon
périodique de taille n en choisissant une première pièce au hasard, puis par la suite,
chaque 25è pièce qui suit jusqu’à ce qu’on ait le nombre désiré de pièces.
Cette méthode d’échantillonnage est facile d’application, peu couteuse, et n’exige qu’un
seul nombre aléatoire et un pas de sondage qui sera fixé selon la taille de l’échantillon
désiré ; cependant, elle répartit l’échantillon sur l’ensemble de la population, permet
souvent une grande précision mais l’inconvénient qu’elle possède et qu’elle peut laisser
échapper certains phénomènes de périodicité.
3. Echantillonnage par grappes
Il consiste à subdiviser la population en plusieurs sous-groupes appelés grappes, à

choisir au hasard un certain nombre de grappes et à prélever les observations voulues
chez tous les individus de chacune des grappes sélectionnées.
Exemple
Pour tester auprès des consommateurs un nouveau produit mis sur le marché, on
subdivise la ville en quartiers et les quartiers en rues, puis on choisit au hasard trois ou
quatre rues dans différents quartiers de la ville et on interroge toutes les personnes de
chacune de ces rues.
Pour utiliser cette forme d’échantillonnage, il faut présumer que la population est assez
homogène. Cependant, l’avantage qu’à cette méthode est de réduire les frais de
déplacement des enquêteurs et de ne pas exiger une base de sondage détaillée par
individus.
Par contre, elle est généralement moins précise qu’un échantillonnage aléatoire simple
étant donné qu’à l’intérieur d’une même grappe on retrouve des caractéristiques
semblables. Par ailleurs, pour augmenter la précision, il vaut mieux alors observer un
grand nombre de petites grappes.
4. Echantillonnage à plusieurs degrés
Il consiste à procéder à l’échantillonnage en plusieurs étapes successives appelées
degrés.
 Au premier degré, on subdivise la population en unités d'échantillonnage et on choisit au
hasard un certain nombre de ces unités.
 Au deuxième degré, on subdivise chacune des unités choisies au premier degré, appelées
unités primaires en d'autres unités d'échantillonnage plus raffinées, qu'on appelle unités
du deuxième degré ou unités secondaires, et on choisit au hasard un certain nombre de
ces unités secondaires.
 On poursuit ainsi le processus jusqu'à la sélection des individus formant l'échantillon.
En effet, cette méthode ressemble beaucoup à celle de l'échantillonnage par grappes.
Cependant, l'échantillonnage à plusieurs degrés conserve les avantages de l'échantillonnage
par grappes, mais réduit également l'inconvénient lié à la similitude des individus d'une
même grappe.
Exemple
Imaginons qu’un député veuille sonder l’opinion des électeurs de son comté au sujet d’un
projet de construction d’usine. Au premier degré, il divise son comté en secteurs de tailles
sensiblement égales, il choisit au hasard quelques secteurs ; au deuxième degré, chacun de
ces secteurs choisis est subdivisé en ilots à peu d’égales tailles ; il choisit au hasard quelques
ilots dans chacun des secteurs choisis.
Au troisième degré, dans chacun de ces ilots, il choisit un certain nombre de personnes
qui formeront l’échantillon.
Cette forme d’échantillonnage s’approche de celle de l’échantillonnage aléatoire
simple; si, à chaque degré, les probabilités de choisir les diverses unités de ce degré sont
égales, alors les deux formes sont équivalentes.
5. Echantillonnage avec probabilités inégales
Consiste à prélever aléatoirement un échantillon d'unités ou d'individus qui ont des

probabilités inégales d'être choisies ; on assigne d'abord à chaque unité ou individu une
probabilité proportionnelle à sa taille, puis on laisse le hasard choisir l'unité ou
l'individu qui doit faire partie de l'échantillon
Exemple
Considérons un échantillon dont les unités sont cinq syndicats de 56, 264, 131, 202 et
176 membres. Pour choisir au hasard deux de ces syndicats, on attribue à chacun une
probabilité, au premier 56/829, au deuxième 264/829, au troisième 131/829, au
quatrième 202/829 et au cinquième 176/829.
Pour choisir aléatoirement deux de ces cinq syndicats, on choisit deux nombres
aléatoires entre 001 et 829 ; si un des nombres choisis est entre 001 et 056, on inclut le
premier syndicat dans l’échantillon ; si un des nombres choisis est entre 057 et 320, on
inclut le deuxième syndicat dans l’échantillon ; de même, l’intervalle 320 à 451
correspond au troisième syndicat, l’intervalle 452 à 653, au quatrième et l’intervalle 654
à 829, au cinquième.
7.2.3 Méthodes non probabilistes
La méthode non probabiliste est une méthode d'échantillonnage dans laquelle les
éléments sont choisis de manière arbitraire et où on ne connaît pas la probabilité qu'a un
élément de faire partie de l'échantillon.
En effet, ces méthodes ne sont pas scientifiques, et parmi elles on trouve :
 L'échantillonnage à l'aveuglette,
 L'échantillonnage de volontaires,
 L'échantillonnage au jugé et
 L'échantillonnage par la méthode des quotas.
1. Echantillonnage à l’aveuglette
Consiste à prélever un échantillon de façon totalement arbitraire, sans préparation, sans

planification, « comme ça vient ».
C’est la cas des sondages sur la rue, des prélèvements sanguins, des analyses de l’air de
la ville, des études sur des loups capturés par des chasseurs, etc.
En effet, cette forme d'échantillonnage peut donner des résultats acceptables si la
population a une grande homogénéité. Toutefois, ces résultats risquent d'être entachés
de sérieuses erreurs.
2. Echantillonnage de volontaires
Consiste à recruter les personnes faisant partie de l'échantillon en appelant des
volontaires.
C’est le cas de certaines enquêtes sur la consommation, de certaines expériences
médicales ou autres.
En effet, cette méthode d'échantillonnage amène souvent des résultats biaisés puisque
les personnes qui se portent volontaires ont souvent des idées préconçues en rapport
avec le sujet étudié.
3. Echantillonnage au jugé
Consiste à prélever un échantillon en se basant sur le jugement d'une ou de plusieurs

personnes qui connaissent bien la population étudiée.
L’avantage de la méthode est d’être rapide, peu couteuse, et fait appel à l’expertise de
spécialistes.
Cependant, on l'utilise dans des travaux expérimentaux ou dans des enquêtes rapides ou
préparatoires à de plus vastes études.
4. Echantillonnage par la méthode des quotas
Appelé aussi échantillonnage à choix raisonné, consiste à décomposer la population
en sous-groupes et à laisser l'enquêteur choisir à son gré un nombre déterminé
d'individus, dit quota, dans chacun de ces sous-groupes.
Cette méthode à l’inconvénient d’ être soumise, au moins en partie, à l’arbitraire de
l’enquêteur. On l’utilise beaucoup dans les études de marché et sondages d’opinions.
Cette méthode réduit les frais d'enquête, ne nécessite pas de base de sondage, facilite le
travail de l'enquêteur et peut se faire assez rapidement. Toutefois, la représentativité de
l'échantillon n'est pas assurée.
7.2.4 Erreurs d’échantillonnage
Lorsqu’on forme un échantillon, on vise à ce que celui-ci représente le plus fidèlement

possible la population.
Cependant, on conçoit facilement que cette représentation ne sera pas parfaite et que
certaines erreurs, attribuables aux aspects aléatoires de l’échantillonnage, s’infiltreront
dans les résultats d’un sondage. On les appelle erreurs d’échantillonnage.
Si on ne peut pas éviter ces erreurs, on peut en revanche les mesurer, ce qui donne une
certaine forme de contrôle sur cet aspect de l’échantillonnage.
7.2.5 Erreurs d’observation
Ce sont des erreurs attribuables à l’imperfection humaine à l’une ou l’autre des phases
du sondage. Elles contribuent à fausser les résultats d’un sondage.
Les principales sources de ces erreurs sont :
 Échantillon mal choisi représentativité d’un échantillon
 Termes mal définis termes bien compris et facile à interpréter
 Mauvaise base de sondage bien cerner et bien décrire la population visée
 Question mal posée question claire et sans ambiguïté
 Réponses ou renseignements inexacts données recueillies méticuleusement
 Biais imputables aux relations entre des personnes éviter en tant que sondeur
de diriger ou influencer les réponses. La personne qui répond ne doit pas être
indisposée par le sondeur ou par la méthode utilisée.
 Absences de réponses peu importe le soin qu’on apporte dans la conduite
d’un sondage, on se retrouve toujours avec des taux plus ou moins importants de
non-réponses, c’est-à-dire d’indécis, de refus de répondre, d’absences ou de manque
d’informations. On peut imputer des réponses aux non-répondants en s’appuyant sur
des données extérieures au sondage.
 Mauvais traitement des données éviter les erreurs d’ordre technique allant
de la banale erreur de calcul à l’utilisation erronée de concepts et de formules.
En bref, les statistiques menteuses ou trompeuses ne viennent pas des mathématiques
mais bien des personnes qui manipulent ou lisent ces chiffres.
Le chercheur, l’enquêteur et le statisticien doivent impérativement mettre beaucoup de
soins dans la formation de l’échantillon et prendre toutes les mesures possibles pour
assurer le caractère représentatif de celui-ci.
7.3 Distributions d’échantillonnage
7.3.1 Paramètre et statistique
Considérant une population de taille N sur laquelle on étudie une variable statistique
quantitative X. Pour décrire une population, on a défini certaines caractéristiques
numériques intrinsèques telles la moyenne, la variance, une proportion ou fréquence
relative, etc.
• Paramètres de la population : valeurs numériques qui décrivent une population.
• Une statistique : valeur numérique décrivant une caractéristique d’un échantillon.
Le problème fondamental de l’étude des statistiques consiste à trouver les valeurs des
paramètres et statistiques correspondantes.
L’inférence statistique utilise une pour tirer des conclusions concernant un paramètre.
7.3.2 Distribution d’échantillonnage
C’est la distribution de probabilités d’une variable aléatoire dont les réalisations sont
des statistiques associées aux échantillons.
Si on veut avoir un certain contrôle sur les variations d’une statistique d’un échantillon
à l’autre, il faut connaitre le comportement de cette statistique lorsqu’elle est soumise
aux variations attribuables à l’échantillonnage. En somme, il faut connaitre la
distribution d’échantillonnage de la variable dont les réalisations sont ces statistiques
d’échantillons.
Par ailleurs, on décrit généralement une distribution d’échantillonnage comme toute
autre distribution de probabilités, par deux mesures importantes : sa moyenne et sa
variance (ou son écart-type).
7.4 Distribution d’échantillonnage de la moyenne 𝑿
7.4.1 Echantillonnage avec remise
Lorsqu’on prélève un échantillon de taille n, on obtient n variables aléatoires

𝑋1 , 𝑋2 , … , 𝑋𝑖 , … 𝑋𝑛 . Puisque le tirage est fait avec remise, ces n variables aléatoires sont
indépendantes et on connait la distribution de probabilités de chacune de ces variables.
Théorème
Soit une population sur laquelle on étudie une variable statistique 𝑋 de moyenne 𝝁 et de
variance 𝝈𝟐 , et soit 𝑋, la variable aléatoire représentant la moyenne d’un échantillon de taille
n prélevé avec remise dans cette population.
Alors :
et
Exemple
Le pépiniériste du voisinage sait que la hauteur de ces cèdres est une variable X dont la
moyenne est 120 cm et la variance est 30 cm². Si 𝑋 est la variable aléatoire représentant la
hauteur moyenne des cèdres dans un échantillon de taille n = 20 prélevé avec remise dans la
population, trouver 𝐸(𝑋) et Var 𝑋 .
Solution
On a 𝜇𝑋 = 120, 𝜎𝑋2 = 30 et n = 20
Le théorème donne :
On remarque que la distribution de 𝑋 est centrée au même endroit que la distribution de 𝑋

mais qu’elle est beaucoup moins dispersée.
7.4.2 Echantillonnage sans remise
Lorsque les échantillons sont prélevés sans remise, alors les variables aléatoires 𝑋𝑖 ne
sont plus indépendantes.
Cela ne modifie pas le résultat en ce qui a trait à l’espérance mathématique, mais la
variance doit dans ce cas être affectée d’un facteur de correction (N – n)/(N – 1).
Théorème
Soit une population de taille N sur laquelle on étudie une variable statistique 𝑋 de
moyenne 𝝁 et de variance 𝝈𝟐 , et soit 𝑋, la variable aléatoire représentant la moyenne
dans un échantillon de taille n prélevé sans remise dans cette population.
Alors : et
Exemple
Dans un grand centre commercial, on a disposé 33 distributrices à breuvages. On sait
qu’en moyenne une distributrice offre 48 breuvages différents avec une variance de
11,4. Si on note par 𝑋 la variable aléatoire représentant le nombre moyen de breuvages
différents offerts par une distributrice dans un échantillon de 12 distributrices prélevé
sans remise dans ce centre commercial. Trouver 𝐸 𝑋 𝑒𝑡 𝑉𝑎𝑟(𝑋)
Solution
𝑋 est la variable représentant le nombre de breuvages différents offerts par une
distributrice dans ce centre commercial. On a 𝜇𝑋 = 48, 𝜎𝑋2 = 11,4, 𝑁 = 33 𝑒𝑡 𝑛 =
12. L’échantillon étant prélevé sans remise, on a :
D’un point de vue pratique, lorsque la taille de la population N est grande et lorsque
l’échantillon n est petit par rapport à N (𝑛 < 𝑁/20), le facteur de correction est
tellement près de 1 qu’il n’y a presque plus de différence entre les deux résultats de
calcul de variance. Dans ces circonstances, on peut négliger ce facteur de correction.
La variance 𝑉𝑎𝑟(𝑋) mesure la dispersion des moyennes échantillonnales autour de la
moyenne 𝝁 de la population. Plus n est grand, moins les moyennes échantillonnales
𝒙𝒊 s’écartent de 𝝁.
7.4.3 Distribution de probabilités de 𝑿
Pour avoir une indication sur la forme de la distribution de probabilités de 𝑋, on
recourt aux théorèmes suivants :
Théorème 1
Soit une population de taille N sur laquelle on étudie une variable X telle que 𝑋 ↝
𝑁 𝜇; 𝜎 2 . Si 𝑋 est la variable aléatoire représentant la moyenne dans un échantillon de
taille n prélevé dans cette population, alors pour toute valeur de n on a :
• Si l’échantillon est prélevé avec remise :
• Si l’échantillon est prélevé sans remise :
Graphiquement, on peut illustrer par :
En effet, lorsqu’une variable 𝑋 obéit à une loi normale, la variable aléatoire 𝑋 obéit
également, cependant, on peut trouver son espérance et sa variance.
Le fait de connaitre la distribution de 𝑋 permet de calculer la probabilité qu’une
moyenne échantillonnale se situe dans un intervalle donné.
Exemple
Une brûlerie offre des sacs de café torréfié. La masse de ces sacs est une variable
obéissant à une loi normale de moyenne 250 g et de variance 14,3 g². Si on prélève un
échantillon de 32 de ces sacs, quelle est la probabilité que la masse moyenne dans cet
échantillon soit comprise entre 249 g et 251 g ?
Solution
On note par 𝑋 la variable représentant la masse des sacs de café de cette brûlerie. Vu
qu’on ne connait pas la taille de la population, on peut supposer que cette taille est très
grande, c’est-à-dire on considère que N est quasi infini. De ce fait, on constate qu’il n’y
a aucune différence entre un échantillon prélevé sans remise et un échantillon prélevé
avec remise.
Par ailleurs, en traitant l’échantillon comme s’il était prélevé avec remise, on aura :
Si 𝑋 est la variable aléatoire représentant la masse moyenne des sacs de café dans un
échantillon de taille 𝑛 = 32, alors :
On cherche maintenant : 𝑃(249 < 𝑋 < 251)
T.D
Le prix de vente d’une calculatrice offerte par 58 commerces de la région
métropolitaine est une variable obéissant à une loi normale de moyenne 19,65$ avec un
écart type de 1,16$. Si on prélève (sans remise) un échantillon de 10 commerces de la
région métropolitaine offrant cette calculatrice, quelle est la probabilité que le prix de
vente moyen soit supérieur à 20$ ?
Le théorème 1 est fort utile puisqu’il nous fait connaitre la distribution de 𝑋 à partir des
paramètres connus de 𝑋. Cependant, ce théorème exige que 𝑋 obéit à une loi normale.
Par ailleurs, on a observé que, même si 𝑋 n’obéit pas à une loi normale lorsqu’on
considère des échantillons de taille assez grande, 𝑋 obéit presque à une loi normale.
Cette observation trouve son fondement théorique dans un théorème appelé théorème
central limite.
 Théorème central limite
Si 𝑋1 , 𝑋2 , … , 𝑋𝑖 , … , 𝑋𝑛 sont des variables aléatoires indépendantes ayant la même
distribution de probabilités et si 𝑺 est une variable aléatoire représentant la somme des
variables aléatoires 𝑋𝑖 , 𝑆 = 𝑋𝑖 , alors, lorsque n devient infiniment grand (𝑛 ↝ ∞),
Il permet de déduire un résultat analogue au théorème 1 même si la variable 𝑋 n’obéit

pas à une loi normale.
Théoriquement, lorsque 𝒏 → ∞, ce théorème est donné par :
En pratique, on observe que pour ∶ 𝒏 ≥ 𝟑𝟎
Où :
𝝈²
• 𝝈𝒙 = si l’échantillon est prélevé avec remise.
𝒏
𝝈𝟐 𝑵−𝒏
• 𝝈𝒙 = si l’échantillon est prélevé sans remise.
𝒏 𝑵−𝟏
Exemple
Une compagnie fabrique des patins à roues alignées. On sait que les roues utilisées font
en moyenne 1340 km avec un écart-type de 280 km. Trouver la probabilité que dans un
échantillon de 75 patins, les roues fassent en moyenne moins de 1300 km.
Solution
Soit 𝑋, la distance que font les roues d’un patin. En considérant, également que la
population de patins est très grande et que le prélèvement de l’échantillon se fait avec
remise. Rien ne permet de présumer que 𝑋 obéit à une loi normale.
On a :
Puisque l’échantillon est grand (𝑛 = 75 ≥ 30), on peut utiliser le théorème central
limite et affirmer que 𝑋 est approximé par une loi normale :
On cherche 𝑃 𝑋 < 1300 :
7.5 Distribution d’échantillonnage d’une proportion 𝑷

7.5.1 Proportion dans un échantillon
Soit une population de taille 𝑁, dans laquelle on trouve une proportion 𝝅 d’individus
ayant une certaine caractéristique. Si 𝑃 est la variable aléatoire représentant la
proportion des individus dans un échantillon de taille 𝒏 ayant la caractéristique étudiée,
si 𝒏 ≥ 𝟑𝟎, 𝒏𝝅 ≥ 𝟓, 𝒏 𝟏 − 𝝅 ≥ 𝟓, alors l’approximation suivante est valable :
Où :
𝝅(𝟏−𝝅)
• 𝝈𝑷 = si l’échantillon est prélevé avec remise.
𝒏
𝝅(𝟏−𝝅) 𝑵−𝒏
• 𝝈𝑷 = si l’échantillon est prélevé sans remise.
𝒏 𝑵−𝟏
Exemple
L’été dernier, 23% des Montréalais ont pris des vacances à l’extérieur du Québec. Si on
prélève avec remise un échantillon de 60 Montréalais, quelle est la probabilité que dans
cet échantillon on trouve entre 20% et 25% de Montréalais ayant pris des vacances à
l’extérieur du Québec ?
Solution
Soit 𝜋, la proportion de Montréalais ayant pris des vacances à l’extérieur du Québec ;
𝜋 = 0,23.
On a :
Si 𝑃 représente la proportion des Montréalais ayant pris des vacances à l’extérieur du
Québec dans un échantillon de taille 𝑛 = 60, alors :
On cherche 𝑃(0,20 < 𝑃 < 0,25).
Dans ce cas-ci, on a 𝑃 = 𝑋/𝑛. On sait que 𝑋 obéit à une loi binomiale et qu’on
l’approxime par une loi normale. Il faut donc tenir compte de la correction de continuité
et, selon le cas, ajouter ou soustraire 0,5 à 𝑋, c’est-à-dire 0,5/𝑛 à la variable 𝑃.
Ainsi,
T.P
Parmi les 450 personnes qui assistent au spectacle du groupe AUCUBE ce soir, 288 ont
acheté leur billet à l’avance. Si on prélève un échantillon de 40 personnes assistant au
spectacle, quelle est la probabilité que dans cet échantillon au moins 30 personnes aient
acheté leur billet à l’avance ?
ESTIMATION
8.1 Estimateur
8.1.1 Théorie de l’estimation
Est l’ensemble des méthodes utilisées pour évaluer un paramètre d’une population à
l’aide d’une statistique prise dans un échantillon extrait de cette population.
Exemple
On veut estimer le revenu moyen des médecins américains sans avoir à faire un
recensement qui s’avérait sans doute pénible, long et couteux.
Solution
La méthode statistique consiste à prélever un échantillon de taille 𝑥, à calculer le revenu
moyen 𝑥 dans cet échantillon et à utiliser cette statistique 𝑥 pour remplacer 𝜇. On
s’attend cependant que 𝑥 soit une valeur assez près de 𝜇.
Pour s’en assurer il faut étudier la distribution d’échantillonnage de la variable aléatoire
𝑋.
On dit que 𝒙 est un estimé de 𝝁 et que 𝑿 est un estimateur de 𝝁.
ESTIMATION
On dira d’une estimation et, par extension, d’un sondage qu’il est valide si l’estimation
est sans biais, c’est-à-dire si la moyenne de tous les estimés provenant de tous les
échantillons possibles est égale à la valeur du paramètre dans la population.
En effet, un sondage valide ne donne certainement pas des résultats parfaits. Cependant
il y aura certainement des erreurs attribuables à l’échantillonnage.
Pour mesurer la précision ou la fiabilité des résultats, on étudie la distribution
d’échantillonnage, c’est-à-dire la distribution des estimés provenant de tous les
échantillons possibles ; plus précisément, on étudie l’écart-type de cette distribution
d’échantillonnage que l’on appelle erreur-type.
Plus l’erreur-type est petite, plus le sondage est fiable. Dans un sondage fiable, l’erreur-
type diminue à mesure que la taille de l’échantillon augmente.
8.1.2 Qualité d’un estimateur
D’une manière générale, on considère un paramètre inconnu 𝜃 dans une population

quelconque. En revanche, ce symbole 𝜃 peut représenter 𝜇, 𝜎, 𝜎 2 , 𝜋, ou tout autre.
Pour estimer la valeur de 𝜃 on prélève dans la population un échantillon de taille 𝒏.
ESTIMATION
Toute statistique calculée dans l’échantillon et pouvant être utilisée pour approximer 𝜃
s’appelle un estimé de 𝜽. Par exemple, 𝑥 est un estimé de 𝜇 , 𝑝 est un estimé de 𝜋.
La variable aléatoire dont les réalisations sont les différents estimés retrouvés dans les
différents échantillons s’appelle un estimateur de 𝜽 que l’on note par 𝜽. Par exemple,
𝑋 est un estimateur de 𝜇, 𝑃 est un estimateur de 𝜋.
En théorie de l’estimation, on utilise un estimateur si celui-ci rencontre certains critères
de qualité, à savoir qu’il soit sans biais, convergent et efficace.
 Estimateur sans biais
Un estimateur 𝜃 d’un paramètre inconnu 𝜃 est sans biais si son espérance est égale à 𝜃.
Si la moyenne de toutes les estimations possibles est égale à la valeur réelle du

paramètre inconnu. Cela nous assure que les estimés sont distribués autour du
paramètre 𝜃.
ESTIMATION
𝜃1 est un estimateur sans biais de 𝜃 alors que 𝜃2 est un estimateur biaisé de 𝜃. Il est
facile de comprendre que les estimés provenant de 𝜃1 seront en général plus près de 𝜃
que les estimés provenant de 𝜃2 .
La variable aléatoire 𝑋 est un estimateur sans biais de 𝜇 car 𝐸 𝑋 = 𝜇. De même, 𝑃 est
un estimateur sans biais de 𝜋 car 𝐸 𝑃 = 𝜋.
La valeur d’un estimateur calculée dans un échantillon est donnée par :
Constitue un estimé sans biais de la variance 𝜎 2 .

 Estimateur convergent
Un estimateur 𝜃 d’un paramètre inconnu 𝜃 est convergent si la probabilité qu’il diffère
de 𝜃 décroit à mesure que la taille de l’échantillon augmente.
Pour un estimateur sans biais 𝜃, si 𝑛 → ∞, 𝑉𝑎𝑟(𝜃) → 0, alors 𝜃 est convergent.
𝜎²
Ainsi, 𝑋 est un estimateur convergent de 𝜇 car 𝑉𝑎𝑟 𝑋 =
𝑛
et si 𝑛 → ∞, alors 𝑉𝑎𝑟(𝑋) → 0
ESTIMATION
 Estimateur efficace
Un estimateur sans biais 𝜃 d’un paramètre inconnu 𝜃 est efficace si la variance de 𝜃 est
inférieure à la variance de tout autre estimateur de 𝜃.
Choisir un estimateur efficace c’est donc choisir le meilleur estimateur, c’est-à-dire
celui qui fournira des estimés le plus près possible de la valeur réelle du paramètre.
Les principaux paramètres d’une population correspondant aux estimateurs :
Pour estimer un paramètre inconnu d’une population à partir de données recueillies

dans un échantillon, on utilise deux méthodes :
 L’estimation ponctuelle, et
 L’estimation par intervalle
ESTIMATION
8.1.3 Estimation ponctuelle
Elle consiste à attribuer au paramètre inconnu une valeur approchée, la plus

vraisemblable possible que l'on appelle estimé.
L'estimé utilisé est la valeur de l'estimateur mesurée sur un échantillon particulier. Pour
les paramètres 𝜇, 𝜋, 𝜎 2 𝑒𝑡 𝜎 , les estimés utilisés se calculent selon les formules
suivantes:
ESTIMATION
Exemple
Pour étudier l'âge des clients d’un centre de conditionnement physique, on a prélevé un
échantillon de 15 de ces clients et on a obtenu les données suivantes:
Estimer de façon ponctuelle la moyenne et l’écart-type de l'âge des clients de ce centre

de conditionnement physique.
Solution
Désignons par 𝑋 l'âge des clients de ce centre. Pour estimer 𝜇𝑥 on utilise 𝑥
𝑥𝑖 753
𝑥= = = 50,2
𝑛 15
Pour estimer 𝜎𝑥 on utilise s.
𝑛 𝑥𝑖2 15 40677 2
𝑠= − 𝑥² = − 50,2 = 14,3338
𝑛−1 𝑛 14 15
ESTIMATION
Exemple
Pour connaitre l’opinion des Américains concernant le programme d’aide sociale, on
prélève un échantillon de 460 personnes parmi lesquelles on en trouve 167 qui
approuvent ce programme. Estimer de façon ponctuelle la proportion d’Américains
approuvant le programme d’aide sociale.
Solution
Désignons par 𝜋 la proportion d’Américains approuvant le programme d’aide sociale.
On peut estimer 𝜋 par 𝑝.
𝑛𝑖 167
𝑃= = = 0,3630
𝑛 460
On peut donc estimer qu’environ 36% des Américains approuvent le programme d’aide
sociale.
L’estimation ponctuelle est simple à effectuer et commode puisqu’elle fournit une
valeur qui peut jouer le rôle du paramètre inconnu. Elle présente cependant un
inconvénient, soit celui de ne pas donner d’indications sur l’erreur possible entre
l’estimé et le paramètre.
La connaissance de la distribution de probabilités permet de juger l’écart possible entre,
l’estimé et le paramètre. Cela nous amène à l’estimation par intervalle.
8.1.4 Estimation par intervalle
Elle consiste à construire autour de l'estimé un intervalle qui aura une grande
probabilité de contenir la valeur du paramètre. Cet intervalle, qui varie d'un échantillon
à l'autre, s'appelle un intervalle de confiance et la probabilité qu'un tel intervalle
contienne la valeur du paramètre s'appelle le niveau de confiance.
On note le niveau de confiance par 1 − 𝛼; 𝛼 devient alors le risque d'erreur, c'est-à-dire
la probabilité qu'un intervalle de confiance ne contienne pas la valeur du paramètre. Si
𝜃 est le paramètre à estimer alors un intervalle de confiance de la forme [a,b]doit être
tel que P a ≤ θ ≤ b = 1 − α.
On dit alors que [a,b] est un intervalle de confiance du paramètre 𝜃 au niveau de
confiance 1 − α. Ce niveau de confiance que l'on peut associer à un degré de certitude
est souvent exprimé en pourcentage.
Si on imagine qu’à l’aide d’un grand nombre d’échantillons différents, on construit un
grand nombre d’intervalles de confiance, 1 − α représente la proportion de ces
intervalles de confiance qui contiennent le paramètre .
Pour les paramètres 𝜇, 𝜋 𝑒𝑡 𝜎 2 , on a comme intervalles de confiance :
8.2 Intervalle de confiance pour la moyenne 𝜇
8.2.1 Distribution de l’estimateur
Pour construire un intervalle de confiance pour la moyenne 𝝁, il semble naturel

d’utiliser les connaissances acquises concernant la distribution de probabilités de
l'estimateur 𝑋.
Selon la connaissance ou non de la variance 𝜎 2 , selon la connaissance de la distribution
de 𝑋 ou la taille de l'échantillon, on distingue quatre cas d'intervalles de confiance pour
𝜇:
 premier cas : 𝜎 2 connue et 𝑋 ↝ 𝑁 (pour tout n)
 deuxième cas : 𝜎 2 connue et n ≥ 30
 troisième cas : 𝜎 2 inconnue et 𝑋 ↝ 𝑁(n <30)
 quatrième cas : 𝜎 2 inconnue et n ≥ 30
8.2.2 Premier cas: connue 𝜎 2 et 𝑋 ↝ 𝑁 (𝑝𝑜𝑢𝑟 𝑡𝑜𝑢𝑡 𝒏)
Considérons une population sur laquelle on étudie une variable X qui obéit à une loi
normale : 𝑋 ↝ 𝑁 𝜇; 𝜎 2
On suppose 𝜎 2 connue et on veut estimer la moyenne 𝜇par un intervalle de confiance.
On prélève avec remise un échantillon de taille n. On calcule 𝑥 ce qui constitue une
estimation ponctuelle de 𝝁.
Graphiquement, on peut représenter Z et 𝑋 par une même courbe mais avec des échelles
différentes selon l'axe horizontal puisque l'une est une transformation linéaire de l'autre.
Avec :
• 𝟏 − 𝜶, le niveau de confiance désiré qui représente la probabilité que 𝑋 se situe dans
la partie centrale de la distribution.
• 𝜶 : le risque d’erreur, doit être divisé en deux parties égales 𝛼/2 puisqu’on peut
s’éloigner de 𝜇 aussi bien à gauche qu’à droite.
ESTIMATION
En considérant la courbe normale centrée réduite de la variable 𝑍.
Avec 𝑍𝛼/2 la valeur de 𝑍 telle que l’aire sous la courbe normale centrée réduite, à droite
de cette valeur, est 𝛼/2 c’est-à-dire 𝑃 𝑍 > 𝑧𝛼/2 = 𝛼/2.
On peut écrire 𝑃 −𝑧𝛼/2 ≤ 𝑍 ≤ 𝑧𝛼/2 = 1 − 𝛼.
𝑋−𝜇 𝑋−𝜇
En remplaçant 𝑍 par on obtient 𝑃 −𝑧𝛼/2 ≤ ≤ 𝑧𝛼/2 = 1 − 𝛼.
𝜎² 𝜎²
𝑛 𝑛
Par des transformations algébriques, on isole 𝜇 au milieu :
L’équation finale montre que, selon les diverses valeurs de la variable aléatoire 𝑋, on a
une proportion 1 − 𝛼 des intervalles contenant 𝜇 de la forme :
On l’appelle intervalle de confiance de 𝜇 au niveau de confiance 1 − 𝛼.

Cet intervalle est centré sur 𝑥 et non sur 𝜇, ce qui est naturel car 𝜇 n’est pas connu.
SUITE PAGE 333 A PHOTOCOPIER DU LIVRE VOIR PROF
ESTIMATION
8.2.3 Troisième cas: 𝜎 2 inconnue et 𝑋 ↝ 𝑁 (𝒏 < 𝟑𝟎)
Considérons une population sur laquelle on étudie une variable 𝑋 qui obéit à une loi
normale.
Dans les deux premiers cas étudiés, la variance 𝜎² de la distribution de la variable 𝑋
était connue. Or dans la plus part des cas où on veut estimer une moyenne, la variance
de la variable 𝑋 dans la population n'est pas connue.
Cependant, on en fait une estimation ponctuelle en utilisant :
Avec :
o 𝒙𝒊 : donnée recueillie dans un échantillon de taille 𝑛.
o 𝒙 : la moyenne dans cet échantillon.
La statistique 𝑆² est une valeur de l’estimateur :
Difficile dans ces conditions d’affirmer que la variable obéit à une loi
normale.
ESTIMATION
Cette variable, ce n'est plus Z. Les variations de Z sont attribuables uniquement aux
variations de 𝑋.
𝑋−𝜇
La nouvelle variable a des variations qui sont imputables aux variations de deux
𝑆2
𝑛
variables 𝑋 et 𝑆² qui sont indépendantes.
En effet, 𝑋 peut prendre une valeur très grande par rapport à 𝝁 alors que 𝑺² peut
prendre une valeur très petite par rapport à 𝝈² et inversement. De ce fait, on doit donc
s’attendre à ce que cette variable ait une plus grande dispersion que 𝑍 ; de plus cette
dispersion diminue à mesure que 𝑛 augmente.
La variable n’est donc pas la même d’une valeur de 𝒏 à l’autre. On a donc un ensemble
de variables qu’on note 𝑻𝒏−𝟏 ∶
Avec :
o 𝒏 − 𝟏 : le nombre de degrés de liberté.
ESTIMATION
La courbe représentative ressemble à une courbe de loi normale. Elle est symétrique par
rapport à 0, elle a une forme de cloche mais elle est plus aplatie qu’une courbe normale.
A mesure que 𝒏 augmente, la courbe de 𝑇𝑛−1 s’approche de plus en plus de la courbe
de 𝑍.
Une autre distribution est celle de W.S. Gosset, appelée distribution de Student ou
distribution t, que l’on note par :
A l’aide d’un raisonnement analogue à celui utilisé dans le premier cas, on trouve qu’un
intervalle de confiance au niveau de confiance 1 − 𝛼 a la forme :
ESTIMATION
o Lorsque l’échantillonnage est fait avec remise :
o Lorsque l’échantillonnage est fait sans remise :
En pratique,
 Les lois de Student sont utilisées pour de petits échantillons 𝑛 < 30 .
 La loi normale centrée réduite pour de grands échantillons 𝑛 > 30 .
Exemple
Un fabricant de piles veut estimer la durée de vie de ses piles. Pour ce faire il prélève un
échantillon de 20 piles et vérifie leur durée de vie. Il obtient les résultats suivants en
heures :
35 41 46 38 37 34 41 37 39 41 42 43 49 35 42 40 48 32 36 44
En supposant que la durée de vie obéit à une loi normale, construire un intervalle de
confiance au niveau de confiance de 95 % pour estimer la durée de vie moyenne de ces
piles.
ESTIMATION
Solution
Soit 𝑋, la variable représentant la durée de vie d’une pile. On a 𝑋 ↝ 𝑁(𝜇 ; 𝜎 2 ).
On a 𝑛 = 20 et, à partir des données brutes, on calcule 𝑥 = 40,0 et 𝑠 = 4,62.
𝛼
On désire un niveau de confiance de 95%, donc 1 − 𝛼 = 0,950 et = 0,025.
2
Selon la table IV, 𝑡0,025 𝑝𝑜𝑢𝑟 20 − 1 = 19 degrés de liberté vaut 2,09.
L’intervalle de confiance cherchée a la forme :
𝑆2 𝑆²
𝑥 − 𝑡𝛼/2 ; 𝑥 + 𝑡𝛼/2
𝑛 𝑛
On aura :
4,622 4,62²
40 − 2,09 ; 40 + 2,09 = 37,8 ; 42,2
20 20
Donc 𝜇 𝜖 37,8ℎ ; 42,2ℎ à un intervalle de confiance de 95 %.

ESTIMATION
8.2.4 Quatrième cas: 𝜎 2 inconnue et 𝒏 ≥ 𝟑𝟎
Considérons maintenant une population dans laquelle on étudie une variable 𝑋 dont on
ne connaît ni la distribution, ni la variance σ².
Dans ce cas, on ne peut utiliser ni la distribution de Student, ni le théorème de
distribution normale.
L'expérience démontre que pour 𝒏 très grand, la variable : peut être approximée
par la variable 𝑍.
Cette approximation est valable pour des valeurs de 𝒏 très grandes, soit 𝑛 ≥ 100.
En pratique, on utilise cette approximation pour 𝑛 ≥ 30 puisqu’il n’y a pas d’autres
résultats à utiliser dans ces circonstances ; il faut garder à l’esprit le fait qu’alors
l’approximation peut être beaucoup moins bonne.
On trouve qu’un intervalle de confiance au niveau de confiance 1 − 𝛼 a la forme :
o Lorsque l’échantillonnage est fait avec remise :
o Lorsque l’échantillonnage est fait sans remise dans une population de taille 𝑁 :
ESTIMATION
Exemple
Julie possède une collection de 320 timbres rares. Pour estimer la valeur moyenne de
ces timbres, elle prélève sans remise un échantillon de 60 timbres et trouve une valeur
moyenne de 12,61$ avec un écart-type échantillonnal de 3,46$. Construire un intervalle
de confiance au niveau de confiance de 99% pour estimer la valeur moyenne des
timbres de Julie.
Solution
Soit 𝑋, la valeur des timbres de la collection de Julie. On ne connait rien de la
distribution de 𝑋. On prélève un échantillon de taille 𝑛 = 60 et on trouve 𝑥 = 12,61 et
𝑠 = 3,46. On a 𝑁 = 320.
𝛼
On désire un niveau de confiance de 99%, 1 − 𝛼 = 0,990 et = 0,005 ;
2
On trouve 𝑍0,005 = 2,58.
L’intervalle de confiance cherché a la forme :
Avec les données du problème, on a :
ESTIMATION
On résume dans le tableau de synthèse les quatre cas d’estimation par intervalle de la
moyenne 𝜇 d’une population.
ESTIMATION
8.3 Intervalle de confiance pour une proportion 𝝅
8.3.1 Distribution de l’estimateur 𝑷
Pour estimer une proportion 𝜋 des membres d’une population possédant une certaine
caractéristique, on peut utiliser la proportion 𝑝 trouvée dans un échantillon et ainsi
obtenir une estimation ponctuelle.
Si on veut ajouter des indications sur l’écart possible entre 𝑝 et 𝜋, on doit alors faire
une estimation par intervalle. La méthode utilisée est en tout point semblable à celle
utilisée dans le cas d’une moyenne.
Considérons une population dans laquelle on trouve une proportion 𝜋 d’individus ayant
une certaine caractéristique. La variable aléatoire représente la proportion des individus
ayant cette caractéristique dans un échantillon de taille 𝑛.
Soit 𝒏 ≥ 𝟑𝟎, 𝒏𝝅 ≥ 𝟓 et 𝒏(𝟏 − 𝝅) ≥ 𝟓.
D’après le théorème de proportion dans un échantillon, l’approximation suivante est
valable :
ESTIMATION
8.3.2 Estimation de 𝝅 par un intervalle
Soit 1 − 𝛼, le niveau de confiance désiré. Les variables 𝑃 et 𝑍 sont reliées par la

transformation linéaire :
Si on considère la courbe normale centrée réduite de la variable 𝑍, on peut écrire :

𝑃 −𝑧𝛼/2 ≤ 𝑍 ≤ 𝑧𝛼/2 = 1 − 𝛼
Après transformation, l’intervalle de confiance au niveau de confiance 1 − 𝛼 pour
estimer une proportion 𝜋 a la forme :
ESTIMATION
o Lorsque l’échantillonnage se fait avec remise :
o Lorsque l’échantillonnage se fait sans remise dans une population de taille 𝑁 :
Exemple
Pour connaitre la popularité d’une émission de radio, on prélève avec remise un
échantillon de 650 personnes et on en trouve 182 qui écoutent cette émission.
Construire un intervalle de confiance au niveau de confiance de 95% pour estimer la
proportion de la population qui écoute cette émission.
Solution
Dans ce contexte, on suppose qu’on a une très grande population.
Désignons par 𝜋 la proportion de la population qui écoute cette émission.
On trouve :
182
𝑝= = 0,28
650
ESTIMATION
A l’aide de cet estimé ponctuel 𝑝 on vérifie les conditions :
𝑛𝑝 = 650 0,28 = 182 ≥ 5 et 𝑛 1 − 𝑝 = 650 0,72 = 468 ≥ 5.
𝛼
On désire un niveau de confiance de 95 % donc 1 − 𝛼 = 0,95, = 0,025 𝑒𝑡 𝑧0,025 =
2
1,96.
L’intervalle de confiance cherché a la forme :
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑝 − 𝑧𝛼/2 ; 𝑝 + 𝑧𝛼/2
𝑛−1 𝑛−1
Dans ce cas :
0,28 0,72 (0,28)(0,72)
0,28 − 1,96 ; 0,28 + 1,96 = 0,245 ; 0,315
649 649
Donc , 𝜋 ∈ 0,245 ; 0,315 à un niveau de confiance de 95 %.

ESTIMATION
On résume dans un tableau de synthèse les formules utilisées pour construire un
intervalle de confiance pour estimer une proportion.
ESTIMATION
8.4 Précision de l’estimation et taille de l’échantillon
La taille de l’échantillon a une influence sur la précision d’une estimation, c’est-à-dire
que plus l’échantillon est de grande taille plus l’estimation sera précise.
On traduit cela algébriquement par la présence de 𝒏 au dénominateur dans toutes les
formules d’intervalles de confiance définissant la demi-largeur de l’intervalle.
8.4.1 Taille de l’échantillon pour estimer la moyenne d’une population
Considérons d’abord le premier cas de calcul d’un intervalle de confiance pour 𝜇 où 𝜎²

est connue, 𝑋 ↝ 𝑁 et l’échantillonnage se fait avec remise.
L’intervalle de confiance a alors la forme :
Cet intervalle est centré sur le point 𝑥 et a comme demi-largeur :

ESTIMATION
La moyenne 𝜇 est située dans cet intervalle avec un niveau de confiance 1 − 𝛼.
En estimant 𝜇 de façon ponctuelle par 𝑥, l’erreur commise est 𝑥 − 𝜇 .
On appelle cette demi-largeur de l’intervalle de confiance, l’erreur d’estimation
maximale à un niveau de confiance 1 − 𝛼, et on la note par 𝐸𝐸𝑀:
𝜎²
𝐸𝐸𝑀 = 𝑧𝛼/2
𝑛
Cette erreur d’estimation maximale appelée aussi marge d’erreur.
A partir de cette formule, on déduit que, pour une marge d’erreur spécifiée, la taille de
l’échantillon est donnée par :
En pratique, avant de faire une estimation, on doit se demander quelle est la marge
d’erreur acceptable ?
Cette marge d’erreur acceptable que l’on utilise ensuite comme erreur d’estimation
maximale permet de déterminer la taille de l’échantillon à prélever.
ESTIMATION
Exemple
Pour connaitre la recette journalière moyenne d’un théâtre, on veut prélever un
échantillon d’un certain nombre de jours dans le but d’estimer cette recette journalière
moyenne. Si on suppose que la recette journalière est une variable obéissant à une loi
normale d’écart-type 100$ et qu’on accepte une marge d’erreur de 40$ au niveau de
confiance de 95%, quelle doit être la taille de l’échantillon prélevé ?
Solution
Soit 𝑋, la recette journalière de ce théâtre.
On sait que 𝑋 ↝ 𝑁 et que 𝜎 = 100. On accepte 𝐸𝐸𝑀 = 40 et, à un niveau de
confiance de 95%, 𝑧0,025 = 1,96.
La taille de l’échantillon est de :
2
1,96 × 100
𝑛= = 24,01
40
Donc, un échantillon de taille 𝑛 = 25 ou plus répond aux exigences posées.
ESTIMATION
Si l’échantillonnage se fait sans remise dans une population de taille 𝑁, alors 𝒏 s’exprime
par :
En pratique, il ne faut pas oublier que la détermination de la taille de l’échantillon est une
opération préalable au calcul de l’intervalle de confiance et au prélèvement même de
l’échantillon.
En fait, ce que l’on veut connaitre avant de procéder au calcul d’un intervalle de confiance,
c’est l’ordre de grandeur de la taille de l’échantillon afin d’avoir une erreur d’estimation
acceptable.
En effet, la formule donnée pour déterminer 𝒏 suppose que 𝑋 obéit à une loi normale
(l’approximation est valable dès que 𝒏 ≥ 𝟑𝟎) et que 𝝈 est connu.
Or, en général, 𝝈 n’est pas connu. On peut l’estimer et remplacer 𝝈 par son estimé 𝒔 dans la
formule :
En pratique, on commence à prélever l’échantillon ; lorsqu’on au moins 30 données, un

calcul préliminaire permet de trouver 𝒔. Avec cet estimé s et l’EEM désirée, on peut alors
déterminer n, c’est-à-dire la taille que l’échantillon doit avoir.
On poursuit alors l’échantillonnage jusqu’à ce qu’on ait n données.
ESTIMATION
Exemple
On fait un sondage pour déterminer le nombre d’années de scolarité moyen des
résidents du Saguenay-Lac-Saint-Jean. On accepte une marge d’erreur de 0,2 année à
un niveau de confiance de 98%. Après un prélèvement préliminaire de 30 personnes de
cette région, on estime que l’écart-type de la variable considérée est de 3,7 années.
Quelle doit être la taille de l’échantillon prélevé ?
Solution
Soit 𝑋, le nombre d’années de scolarité d’un résident du Saguenay-Lac-Saint-Jean.
On sait que 𝑛 ≥ 30, on peut donc approximer 𝑋 par une loi normale et on estime 𝜎 par
𝑠 = 3,7. on accepte 𝐸𝐸𝑀 = 0,2 à un niveau de confiance de 98%, donc 𝑧0,010 = 2,33.
La taille de l’échantillon est de :
2
2,33 × 3,7
𝑛= = 1858,04
0,2
Il faut donc un très grand échantillon de taille 𝑛 = 1859 ou plus pour répondre aux
exigences posées.
ESTIMATION
8.4.2 Taille de l’échantillon pour estimer une proportion
Comme dans le cas de l’estimation par intervalle de la moyenne, la taille de
l’échantillon est liée à la précision de l’estimation par intervalle d’une proportion.
o En effet, avant de procéder à l’échantillonnage nécessaire pour établir un intervalle
de confiance, il faut décider de quelle taille sera l’échantillon prélevé. Cette taille est
fonction de la précision désirée.
Pour une population dans laquelle on trouve une proportion 𝜋 d’individus ayant une
certaine caractéristique : 𝑛 ≥ 30, 𝑛𝜋 ≥ 5 𝑒𝑡 𝑛 1 − 𝜋 ≥ 5, on peut affirmer que :
Si l’échantillonnage se fait avec remise, alors l’intervalle de confiance au niveau de

confiance 1 − 𝛼 a la forme :
L’intervalle centré sur le point 𝑝 a comme demi-largeur :

ESTIMATION
La proportion 𝜋 se situe dans cet intervalle avec un niveau de confiance 1 − 𝛼. La
marge d’erreur ou l’erreur d’estimation maximale 𝐸𝐸𝑀 à un niveau de confiance 1 − 𝛼
est donnée par :
En isolant 𝑛 on obtient :
En pratique la proportion 𝑝 n’est pas connue au début du processus, ou lorsqu’on doit

déterminer la taille de l’échantillon.
De ce fait, trois considérations sont prises en compte :
 On peut estimer 𝒑 grâce à certaines informations. On utilise l’estimé ponctuel dans
la formule et on détermine ainsi la taille de l’échantillon 𝒏.
 On commence à prélever l’échantillon ; lorsqu’on a au moins 30 données, on fait un
calcul préliminaire de 𝑝 que l’on utilise comme estimé ponctuel pour calculer de
façon précise 𝑛, grâce à la formule.
ESTIMATION
 Si on n’a aucune idée de la valeur de 𝑝. On choisit alors celle qui exigera la plus
grande taille d’échantillon, soit 𝑝 = 1/2. En remplaçant 𝑝(1 − 𝑝) par 1/4, on est
certain d’avoir la taille d’échantillon nécessaire, et sans doute plus que nécessaire.
Si la proportion 𝑝 s’éloigne beaucoup de 1/2, cette taille 𝑛 donnera surement une

meilleure précision que celle exigée par 𝐸𝐸𝑀.
Exemple
On veut faire une enquête auprès des jeunes étudiants du collégial pour connaitre la
proportion de ceux qui ont un travail rémunéré en surplus de leurs études. On croit que
cette proportion est d’environ 25%. Quelle taille d’échantillon devrait-on utiliser si on
veut estimer cette proportion avec marge d’erreur de 2% à un niveau de confiance de
95% ?
Solution
Désignons par 𝜋 la proportion des jeunes étudiants du collégial qui ont un travail
rémunéré en surplus de leurs études. On estime sommairement 𝑝 = 0,25.
ESTIMATION
On veut 𝐸𝐸𝑀 = 0,02 et un niveau de confiance de 95%, donc 𝑧0,025 = 1,96.
𝑧²𝛼/2 𝑝(1−𝑝) (1,96)²(0,25)(0,75)
On trouve : 𝑛= +1= + 1 = 1801,75
(𝐸𝐸𝑀) (0,02)²
Une taille d’échantillon 𝑛 = 1802 répond aux exigences.
8.5 Intervalle de confiance pour la variance 𝝈²
8.5.1 Loi du Khi-carré χ²
La loi du χ² décrit le comportement de la somme de carrés de variables aléatoires
obéissant à des lois normales.
Théorème
Si 𝑋1 , 𝑋2 , … , 𝑋𝑛 sont 𝒏 variables indépendantes obéissant à des lois normales de même
moyenne 𝜇 et de même variance 𝜎², alors la variable aléatoire 𝐾𝑛−1 , définie par :
obéit à une loi du χ² à 𝑛 − 1 degrés de liberté.

ESTIMATION
8.5.2 Estimation par intervalle de 𝝈²
Considérons une population sur laquelle on étudie une variable 𝑋 qui obéit à une loi
normale 𝑋 ↝ 𝑁 𝜇 ; 𝜎 2 .
La variable aléatoire :
obéit à une loi du χ² à 𝑛 − 1 degrés de liberté. Pour estimer la variance 𝜎 2 par un

intervalle de confiance, on prélève avec remise un échantillon de taille n dans lequel on
calcule s².
Soit 1 − 𝛼, le niveau de confiance désiré. Le risque d’erreur 𝛼 est divisé en deux parties
égales 𝛼/2.
ESTIMATION
Si on considère la courbe de distribution de la variable 𝐾𝑛−1 obéissant à une loi du χ² à
𝑛 − 1 degrés de liberté, on peut écrire :
𝑃 𝑘1−𝛼/2 ≤ 𝐾𝑛−1 ≤ 𝑘𝛼/2 = 1 − 𝛼
C’est-à-dire :
𝑛 − 1 𝑆²
𝑃 𝑘1−𝛼/2 ≤ ≤ 𝑘𝛼/2 = 1 − 𝛼
𝜎²
On note par 𝑘𝛼/2 la valeur de la variable 𝐾𝑛−1 telle que l’aire sous la courbe à droite de
cette valeur est 𝛼/2, c’est-à-dire 𝑃 𝐾𝑛−1 > 𝑘𝛼/2 = 𝛼/2.
De même : 𝑃 𝐾𝑛−1 > 𝑘1−𝛼/2 = 1 − 𝛼/2
Après transformations algébriques, on a :
Un tel intervalle représente un intervalle de confiance pour 𝜎² au niveau de confiance

1 − 𝛼.
ESTIMATION
Exemple
Une firme spécialisée fait une étude de marché concernant les dépenses annuelles des
familles québécoises en matière de produits pharmaceutiques. On prélève un
échantillon de 20 familles québécoises et on calcule une variance échantillonnale s² =
1764$². En supposant que la dépense annuelle d’une famille en matière de produits
pharmaceutiques est une variable qui obéit à une loi normale, construire un intervalle de
confiance au niveau de confiance de 95% pour estimer la variance de cette variable.
Solution
Soit X, la dépense annuelle d’une famille québécoise en matière de produits
pharmaceutiques.
On a 𝑋 ↝ 𝑁 𝜇 ; 𝜎 2 . On prélève un échantillon de taille n = 20 et on calcule s² = 1764.
On désire un niveau de confiance de 95%, donc 𝛼/2 = 0,025 et 1 − 𝛼/2 = 0,975.
Selon la table V pour 20 – 1 = 19 degrés de liberté, on a 𝑘0,025 = 32,85 et 𝑘0,975 =
8,91. L’intervalle de confiance est de :
19 (1764) 19 (1764)
; = 1020,27 ; 3761,62
32,85 8,91
TEST D’HYPOTHESE
6.1 Théorie d’un test d’hypothèse
6.1.1 Méthode d’un test d’hypothèse
La méthode scientifique utilisée par l'être humain pour établir une connaissance quelconque
peut se résumer en trois grandes étapes :
 Observation d'un fait ou d'un phénomène.
 Formulation d'une explication de ce fait ou de ce phénomène sous la forme d'une hy-
pothèse ou d'une loi.
 Vérification de l'hypothèse au moyen d'une expérience quelconque ou d'un test.
Le processus utilisé ici permet de valider ou d’invalider l’hypothèse posée, et c’est avec une
très grande probabilité. Ce qu’on fait lorsque, par une expérience quelconque, on arrive à
confirmer ou à infirmer une hypothèse s’appelle un test d’hypothèse.
Cette forme de vérification constitue la deuxième grande catégorie de problèmes abordés en
inférence statistique.
On appelle hypothèse statistique un énoncé, une affirmation concernant une ou plusieurs
populations. Cette hypothèse est dite paramétrique, si c’est un énoncé quantitatif concernant
un paramètre de la ou des populations. Autrement, elle est dite non paramétrique.
Un test d'hypothèse est un processus permettant de confirmer ou d'infirmer une
hypothèse statistique concernant une ou plusieurs populations en examinant un
échantillon dans la ou les populations.
Un test d'hypothèse est dit paramétrique si l'hypothèse à vérifier est paramétrique.
Si un test d'hypothèse est un instrument très utile dans le processus de prise de
décision, il faut comprendre qu'en aucun cas il ne donne de certitude absolue. La
confirmation ou l'infirmation d'une hypothèse est toujours faite avec une certaine
probabilité que l'on voudra cependant aussi forte que possible.
6.1.2 Hypothèses à confronter
Dans tout test d'hypothèse, on établit deux hypothèses mutuellement exclusives qui
sont, en quelque sorte, confrontées. Une et une seule d'entre elles sera acceptée.
 Hypothèse nulle, 𝑯𝟎 .
C'est l'hypothèse qui sera rejetée uniquement s'il y a suffisamment d'évidence contre
elle. C’est l’hypothèse qui n’amène pas de changement, qui n’amène pas d’action à
entreprendre. C'est l'hypothèse du statu quo, appelée hypothèse de l’incrédule ou
hypothèse prudente.
Cette hypothèse nulle sera rejetée uniquement si la preuve présentée montre, hors de
tout doute raisonnable, que cette hypothèse nulle est fausse.
• Dans tout test d’hypothèse, on considère que l’hypothèse nulle est l’hypothèse à
vérifier.
Dans un test paramétrique, l’hypothèse nulle doit être simple, c’est-à-dire ne
mentionner qu’une seule valeur du paramètre étudié. Par exemple une hypothèse nulle
pourrait avoir la forme: « 𝜋 = 0,50 »
 Hypothèse alternative ou contre-hypothèse : H1
C'est l'hypothèse qui sera acceptée si H 0 est rejetée. C'est l'hypothèse qui amène un
changement, qui implique généralement une action à entreprendre.
Dans un test paramétrique, l’hypothèse alternative est généralement composée, c’est-à-
dire qu’elle mentionne plusieurs valeurs du paramètre étudié. Par exemple, une
hypothèse alternative pourrait avoir la forme: « 𝜋 > 0,50 »
Soit 𝜃, un paramètre quelconque et soit H 0 , une hypothèse nulle ainsi formulée : H 0 :
«𝜃 = 𝜃0 » où 𝜃0 est une valeur fixe du paramètre.
L'hypothèse alternative peut prendre l'une ou l'autre des formes suivantes:
⇰ 𝐻1 : 𝜃 ≠ 𝜃0 le test est dit bilatéral
⇰ 𝐻1 : 𝜃 < 𝜃0 le test est dit unilatéral à gauche
⇰ 𝐻1 : 𝜃 > 𝜃0 le test est dit unilatéral à droite
Le choix de la forme de l'hypothèse alternative peut dépendre du point de vue de
la personne qui construit le test ou encore de ce qu'on cherche à établir avec ce test.
Exemple
La compagnie BELTOTO affirme que ses nouvelles voitures consomment 8,6 litres par
100 km. Un chroniqueur automobile met en doute cette affirmation. Pour vérifier cette
affirmation, le Club Automobile élabore un test d'hypothèse. Formuler une hypothèse
nulle H 0 et une hypothèse alternative H 1 pour ce test d'hypothèse.
Solution
La variable étudiée 𝑋 est la consommation en litres par 100 km des nouvelles voitures
BELTOTO. Le test porte sur la moyenne de 𝑋. À moins de preuve du contraire, on
accepte l'affirmation de la compagnie.
Ainsi, H 0 : « 𝜇 = 8,6 »
L'hypothèse alternative pourrait prendre l'une ou l'autre des trois formes suivantes:
𝜇 ≠8,6 ou 𝜇<8,6 ou 𝜇>8,6.
Dans le contexte, si on met en doute l'affirmation de la compagnie, c'est qu'on pense
que la consommation pourrait être supérieure à celle annoncée. Si elle était inférieure,
on en serait heureux et on n'aurait aucune raison de se plaindre. On choisit donc :
H1: « μ> 8,6 »
Il faut noter, qu'au sens mathématique, une autre formulation de H1 n'est pas mauvaise.
Elle pourrait simplement apporter une conclusion un peu différente si on devait rejeter
H 0.
La suite du test consiste, en gros, à prélever un échantillon, à calculer une moyenne à
partir de cet échantillon, et à décider si cette moyenne est suffisamment supérieure à 8,6
pour rejeter H 0 .
6.1.3 Risques d’erreurs et règle de décision
L’étape finale d’un test d’hypothèse consiste à prendre la décision de rejeter ou

d’accepter 𝐻0 . De ce fait, on doit étudier le processus menant à une décision.
Cette décision sera basée sur un estimé du paramètre étudié et cet estimé est calculé à
partir de données recueillies dans un échantillon. On ne doit donc pas s’attendre à ce
qu’un estimé ait exactement la valeur prévue par 𝐻0 .
Deux cas sont à considérer :
• Si l’estimé du paramètre est relativement près de la valeur du paramètre prévue par
𝐻0 on dit que l’écart n’est pas significatif, le bénéfice du doute est donné à
l’hypothèse nulle.
• Si l’estimé du paramètre est loin de la valeur du paramètre prévue par 𝐻0 , on
rejettera 𝐻0 car l’écart est alors significatif, c’est-à-dire on considère qu’il n’est pas
imputable uniquement au hasard de l’échantillonnage.
Question : A partir de quelle grandeur un tel écart est-il significatif et justifie-t-il le
rejet de 𝐻0 ?
Répondre à cette question, c’est établir une règle de décision qui doit être établie avant
de faire les calculs sur l’échantillon et de prendre la décision.
Pour établir cette règle de décision, il faut tenir compte de la distribution
d'échantillonnage de l'estimateur du paramètre étudié et des risques d'erreurs que cette
distribution entraîne. Logiquement, on a quatre situations selon que H 0 est vraie ou
fausse et selon qu'on accepte ou rejette H 0 . Le tableau suivant résume ces quatre
situations logiques.
Dans deux de ces situations, on prend une bonne décision:

 On dit qu'on commet une erreur de première espèce si on rejette H 0 alors que
H 0 est vraie.
On note par 𝛼la probabilité de commettre une erreur de première espèce :
 On dit qu'on commet une erreur de deuxième espèce si on accepte H 0 alors que
H 0 est fausse.
On note par 𝜷la probabilité de commettre une erreur de deuxième espèce
Zone d’acceptation et zone de rejet
Supposons que 𝜃 est un paramètre quelconque et que H 0 et H 1 sont des hypothèses ainsi
formulées :
Supposons de plus qu'on connaisse la distribution de l'estimateur (non biaisé,

convergent, efficace) du paramètre étudié. Cette distribution pourrait être une loi
normale, une loi de Student ou une loi du x2par exemple.
Sous l'hypothèse nulle, c'est-à-dire dans le cas où H0est vraie, cette distribution est
centrée sur la valeur 𝜃0 du paramètre étudié.
La probabilité 𝛼de commettre une erreur de première espèce s'appelle le niveau de
significationdu test. C'est la probabilité de rejeter H 0 même si H 0 est vraie.
Généralement, le niveau de signification est fixé à priori suivant la nature du problème
et les conséquences pratiques d'une erreur de première espèce. Dans l'industrie ou dans
le commerce, on fixe en général 𝜶 = 0,050, alors qu'en médecine, on préfère, par
exemple, 𝜶 = 0,010. Ce choix de 𝛼 divise l'ensemble des valeurs de 𝜃en deux zones :
 Zone d’acceptation
a) L’intervalle 𝑎, 𝑏 dans le cas d’un test bilatéral
b) L’intervalle 𝑎, +∞ dans le cas d’un test unilatéral à gauche
c) L’intervalle  − ∞, 𝑏 dans le cas d’un test unilatéral à droite

 Zone de rejet ou région critique
a) les intervalles  − ∞, 𝑎 et 𝑏, +∞ dans le cas d'un test bilatéral ;
b) l'intervalle  − ∞, 𝑎 dans le cas d'un test unilatéral à gauche ;
c) l'intervalle 𝑏, +∞ dans le cas d'un test unilatéral à droite.
Ces zones d'acceptation et de rejet définissent la règle de décision qu'on formule ainsi,
selon la forme du test :
1. test bilatéral :« rejeter H 0 si 𝜃> b ou 𝜃< a » ou « accepter H 0 s i a ≤ 𝜃≤ b »
2. test unilatéral à gauche : « rejeter H0 si 𝜃< a » ou « accepter H0 si 𝜃 ≥ a » ;
3. test unilatéral à droite : « rejeter H 0 si 𝜃> b » ou « accepter H 0 si 𝜃 ≤ b ».
Exemple
Le vétérinaire du quartier affirme que la durée de vie des chats siamois est de 11,5 ans
avec un écart-type de 2,4 ans. Pour vérifier cette affirmation, on prélève un échantillon
de 60 chats siamois et on note leur durée de vie. Dans le but de construire un test
d'hypothèse:
a) Formuler H 0 et H 1 .
b) Au niveau de signification 𝛼=0,050, définir la régie de décision.
Solution
Désignons par X la variable représentant la durée de vie d'un chat siamois et notons par
𝜇la durée de vie moyenne de ceux-ci.
b) On a 𝜎=2,4 et n=60. On s'intéresse à l'estimateur 𝑋.Puisque 𝜎 est connu et que

n ≥ 30. l'approximation suivante est valable:
𝑋−11,5
On peut poser 𝑍 = ↝ 𝑁 0; 1 . Sur un même graphique, on représente 𝑋 et Z.
0,3098
Le test est bilatéral, le niveau de signification 𝛼 = 0,050, qui est la probabilité de commettre
une erreur de première espèce, doit être subdivisé en deux parties égales. Selon l'échelle Z,
la zone d'acceptation est l'intervalle [-Z0,025; Z0,025] soit [-1,96; 1,96]. Selon l'échelle 𝑋, la
zone d'acceptation est [a, b] où a et b sont les valeurs de X correspondant à -1,96 et 1,96
respectivement. Le lien entre les variables 𝑋 et Z est donné par :
Ainsi : a = 11,5 + (0,3098) (-1,96) = 10,89

b = 11,5 + (0,3098) (1,96) = 12,11
Si on note par 𝑥la moyenne qu'on trouvera dans l'échantillon prélevé, alors la règle de déci-
sion s'écrit:
« rejeter H 0 si 𝑥<10,89 ou x >12,11 » ou « accepter Ho si 10,89 <x<12,11 »
Il est fréquent qu'on écrive la règle de décision en utilisant la valeur Z ( x),c'est-à-dire la
valeur de la variable Z correspondant à la valeur de la statistique x. Ainsi, on écrit : « rejeter
H 0 si Z ( x ) < - 1,96 ou Z ( x ) > 1,96 » ou
« accepter H 0 si -1,96 <Z ( x ) < 1,96 »
6.1.4 Puissance du test
FIN DU COURS
MERCI POUR VOTRE ATTENTION

COURS DE STATISTIQUE ET PROBABILITE, IR KENNEDY, Bac 2

Transféré par

Droits d'auteur :

Formats disponibles

COURS DE STATISTIQUE ET PROBABILITE, IR KENNEDY, Bac 2

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

COURS DE STATISTIQUE ET PROBABILITE, IR KENNEDY, Bac 2

Transféré par

Droits d'auteur :

Formats disponibles

UNIVERSITE LIBERTE

FACULTE DES SCIENCES INFORMATIQUES

COURS DE STATISTIQUE DESCRIPTIVE

Par Ass. Ir KENNEDY KALENGA KAZADI

ANNEE ACADEMIQUE 2016 – 2017

Modalités des variables statistiques :

1.2.2 Fréquence absolue ou effectif 𝒏𝒊

Le nombre d’apparitions de la variable dans la population ou dans l’échantillon, c’est-à-

La somme des fréquences relatives est toujours égale à 1.

En pratique, on limite la précision des fréquences relatives à trois chiffres après la

On appelle pourcentage d’une modalité 𝒙𝒊 le nombre :

Ce taux est généralement multiplié par 100 pour l’exprimer en pourcentage.

taux de divorce = 23,1 %

1.2.6 Présentation graphique

Le nombre 𝒌 de valeurs différentes de la variable est petit par rapport à 𝑵 ou 𝒏

Déterminer la population et la variable. Construire un tableau de distribution de

6.4 Lois discrètes

Une variable aléatoire discrète est caractérisée par sa fonction de probabilités, ou

On lit « X suit (ou obéit à) une loi binomiale de paramètres n, p »

L’ensemble des réalisations possibles de X est 𝑟, 𝑟 + 1, 𝑟 + 2, 𝑟 + 3, … .

Dans le cas où r = 1, on a une loi géométrique.

6.4.4 Loi hypergéométrique

On lit « X suit (ou obéit à) une loi hypergéométrique de paramètres N, n, p »

La fonction de probabilités de X est définie par :

Sa fonction de probabilité est telle que :

6.5 Lois continues

6.5.1 Variable aléatoire continue

Elle est définie par :

Il est défini par :

Elle est définie par :

C’est l’aire sous la courbe de paramètres 𝝁 et 𝝈𝟐 entre les verticales x = a et x = b.

Cette transformation linéaire sur X modifie la distribution mais conserve les

Méthodes de l’inférence statistique

Les méthodes employées en inférence statistique se regroupent en deux catégories :

7.1.2 Collecte des données

C’est l’étape clé d’une étude statistique

 Définir la population : il faut bien cerner la population visée de manière à inclure ou

En statistique, la qualité essentielle et fondamentale que doit posséder un échantillon est

En pratique un échantillon ne peut pas toujours représenter exactement et précisément

La méthode d’échantillonnage probabiliste est une méthode d'échantillonnage dans

2. Echantillonnage périodique ou systématique

3. Echantillonnage par grappes

Il consiste à subdiviser la population en plusieurs sous-groupes appelés grappes, à

5. Echantillonnage avec probabilités inégales

Consiste à prélever aléatoirement un échantillon d'unités ou d'individus qui ont des

7.2.3 Méthodes non probabilistes

Consiste à prélever un échantillon de façon totalement arbitraire, sans préparation, sans

Consiste à prélever un échantillon en se basant sur le jugement d'une ou de plusieurs

Lorsqu’on forme un échantillon, on vise à ce que celui-ci représente le plus fidèlement

7.2.5 Erreurs d’observation

Lorsqu’on prélève un échantillon de taille n, on obtient n variables aléatoires

On remarque que la distribution de 𝑋 est centrée au même endroit que la distribution de 𝑋

• Si l’échantillon est prélevé sans remise :

Graphiquement, on peut illustrer par :

Il permet de déduire un résultat analogue au théorème 1 même si la variable 𝑋 n’obéit

On cherche 𝑃 𝑋 < 1300 :

7.5 Distribution d’échantillonnage d’une proportion 𝑷

8.1.2 Qualité d’un estimateur

D’une manière générale, on considère un paramètre inconnu 𝜃 dans une population