Cours Statistique Inferentielle
Cours Statistique Inferentielle
Cours Statistique Inferentielle
Cours :
STATISTIQUE
INFERENTIELLE
2. Distributions de probabilités
2-7 Lois des variables aléatoires liées à des variables aléatoires normales
1- Echantillonnage.
1- Notion d’estimateur
3- Estimation ponctuelle
1
Z.BENABBOU EDITION : 2020
Chapitre IV : Les tests d’hypothèse
1- Tests paramétriques
2
Z.BENABBOU EDITION : 2020
Chapitre I :
1-1 Terminologies
événements simples
produit.
l’autre : P (B) ≠ 0 et P (B | A) = 0
Dans le cas contraire, ces événements sont dits non mutuellement exclusifs :
P (B) ≠ 0 et P (B | A) ≠ 0
3
Z.BENABBOU EDITION : 2020
➢ Evénements indépendants : Deux événements sont dits indépendants si la
Espérance
probabilité ; supposons qu'on lui associe également une « valeur » (donnée par la
variable aléatoire).
La question est alors de savoir quelle « valeur », à long terme, peut-on obtenir.
possible par sa probabilité d'apparition et on fait la somme de tous les produits ainsi
obtenus. En formule
n
E ( X ) = xi p ( xi )
i =1
4
Z.BENABBOU EDITION : 2020
où E(X) = l'espérance mathématique de la variable X
P( xi ) = la probabilité de la valeur xi
( )
2
n n
V ( X ) = EX − E ( X )2 = E X 2 − E ( X )2 = xi2 . pi − xi . pi
i =1 i =1
2- Distributions de probabilités
Une distribution de probabilités est une énumération de tous les résultats possibles d'une
On remarque que la somme de toutes les probabilités est 1;ce qui est le cas pour toutes les
distributions de probabilités
Définition : Une variable aléatoire X suit une loi de Bernoulli si elle prend les
P (X = 1) = p
P (X = 0) = 1 – p = q
Espérance et variance :
1
E(X) = x P(X=x) = p
x =0
5
Z.BENABBOU EDITION : 2020
1
V(x) = (X – E(X))2 P(X=x)
x =0
1
= x2P(X=x) - p2
x =0
= p - p2 = p(1-p) = pq
Présentation :
Soit une épreuve aléatoire à deux issues, que l’on peut appeler « succès » et
Définition :
Une v.a suit une loi binomiale B(n,p) si elle prend les n +1 valeurs0,1,…..,n
P(X=k) = Cnk p k q n − k
n!
Cnk =
k!(n − k )!
Remarque :
La loi binomiale est la loi discrète rencontrée le plus fréquemment car elle sert à
variables de Bernoulli.
6
Z.BENABBOU EDITION : 2020
Espérance et variance :
n n n
E(X) = E ( X i ) = E ( X i ) = p =np
i =1 i =1 i =1
n
V(x) = V ( X i ) = npq
i =1
succession des dates auxquelles se produit une panne dans une usine.
Définition :
La variable aléatoire X de Poisson est une variable discrète qui prend les valeurs
− k
P(X=k) = e
k!
Espérance et variance : E(X) = V(X) =
Démonstration :
k
On utilise la propriété : e =
k = 0 k!
e − k
E(X) = kp( X = k ) = k
k =0 k =0 k!
7
Z.BENABBOU EDITION : 2020
Le premier terme de la somme étant nul, on peut alors la débuter à 1 et mettre en
facteur :
e − k −1
E(X) =
k =1 (k − 1)!
e − k
'
k'
E(X) = = e − = e − e =
' '
k ' =0 k ! k ' =0 k !
V(X) = E(X2) – [E(X)] 2
Calculant :
2 2 e − k − 2
k
E (X2) = k p( X = k ) = k =e k
k =0 k =0 k ! k =0 k!
− k −1
=e k
k =1 ( k − 1)!
k'
−
E (X2) = e
'
( k + 1)
k ' =0 k '!
k' k'
−
=e [ k' + ]
' '
k =0 k ! k =0 k !
' '
= e − [ e + e ]
= 2 +
D’où : V(X) = 2 + − 2 =
8
Z.BENABBOU EDITION : 2020
Propriété :
paramètre = 1 + 2
L’expérience aléatoire de cette loi consiste à tirer une boule dans une urne qui
nombres au hasard.
La variable aléatoire X associe à cette expérience est égale au numéro obtenu sur
1
Les nombres entiers de 1 à n ont ainsi tous la même probabilité d’apparition soit
n
Définition :
1
Pk = P (X = k) =
n
Remarque :
Au lieu de faire varie les résultats possibles de 1 à n, il est possible de faire varier
les résultats de n’importe quel réel, même négatif, avec un pas quelconque.
n +1 n2 − 1
Espérance et variance : E(X) = et V(X) =
2 12
9
Z.BENABBOU EDITION : 2020
4-b Loi uniforme continue :
Modèle aléatoire
intervalle. Souvent il s’agit d’un intervalle de temps, la probabilité d’un intervalle est
proportionnelle à sa longueur.
Définition :
Une variable aléatoire X continue suit une loi uniforme sur un intervalle [a,b] si X est
1
f ( x) = si x [ a, b]
b−a
f ( x ) = 0 sinon
Espérance et variance :
a+b (b − a ) 2
E(X) = et V(X) =
2 12
Démonstration :
b
+ b x x2 a+b
E(X) = xf ( x ) dx = dx = =
− ab − a 2(b − a) a 2
2
b x 1
E(X ) =
2 dx = (b 2 + ab + a 2 )
ab − a 3
Par conséquence :
(b − a ) 2
V (X) =
12
10
Z.BENABBOU EDITION : 2020
2-5 Loi normale ou loi de Laplace-Gauss
2-5.1 Objectifs :
des probabilités et en statistique car c’est une loi limite vers laquelle tendent les
autres lois de probabilités pour des conditions que l’on rencontre fréquemment
dans la pratique. C’est pour cette raison qu’il est d’usage de la désigner par le
• Cette loi a été introduite pour rendre compte des fluctuations « normales »
éloigne.
2-5-2 Définition :
X suit une loi normale N (µ, ) si sa fonction de densité est donnée par :
1 x− 2
−
1 2
f ( x) = e
2
On a alors : E(X) = µ et V(X) = 2
x2
1 −
f ( x) = e 2
2
11
Z.BENABBOU EDITION : 2020
Elle est notée par N (0,1).
• On montre que l’on peut se ramener, par un changement de variable, d’une loi
X −
Si X → N (µ, ) alors Z = → N(0,1)
La fonction de répartition de la loi normale centrée réduite est tabulée. Elle sert,
2-5-4Utilisation pratique
X −m a−m
P(X<a) = P ( < ) = P (Z a − m )
a−m
Soit : F(b) = P(Z<b) avec b =
2- on cherche b dans la table N(0,1) . Deux cas peuvent se présenter :
• b<0. La table ne donne que les valeurs de F pour b >0, il faut exploiter la
F(-b) = 1 – F(b)
Résultats pratiques :
- P(Z>-a) = P(Z<a)
- P(-a<Z<a) = P ( Z a) = [2P(Z<a)] – 1
12
Z.BENABBOU EDITION : 2020
- Somme de deux lois normales indépendantes
X1 → N ( 1 , 1 )
X2 → N (2 , 2 )
- Si
X , indépendants
1 X2
alors X 1 + X 2 → N ( 1 + 2 ; 12 + 22 )
2-6-1 Objectif :
Les calculs avec la loi de poisson, et encore plus avec la loi binomiale, sont
souvent pénibles à effectuer. Lorsque n est assez grand, il est possible de remplacer
ces lois par des lois normales de même variance et de même moyenne.
X = X1 + X2 +….+ Xi +….+ Xn .
X − np
→ N (0,1) En posant µ = np et = npq
npq
−1 k −
2
1
k k n−k 2
C p q e
2
P (X = k) =
n
n
13
Z.BENABBOU EDITION : 2020
2-6-3 Approximation de la loi binomiale par la loi de Poisson :
Théorème:
Soit (Xn) une suite de variable aléatoire qui obéissent à une loi binomiale de
paramètre n et pn.
Si pn tend vers 0 de manière que npn tende vers alors Xn → X (en loi).
k
C'est-à-dire :
k k n−k
P (Xn= k) = Cn p q e−
k!
2-6-4 Approximation de la loi de Poisson par la loi normale :
Si X suit une loi de Poisson de paramètre , X converge vers une loi normale et
si est assez grand, X peut être approximée par une variable de moyenne et
d’écart-type .
Les statisticiens admettent que l’approximation est très bons dès que est supérieur
ou égal à 20.
Puisque : E(X) = et X = on a :
−1 k − 2
k
− 1
P(X= k) = e e 2
k! 2
14
Z.BENABBOU EDITION : 2020
2-7 Loi des variables aléatoires liées à des variables aléatoires
normales.
Définition :
E ( n ) = n et V( n ) = 2n
2 2
Espérance et variance :
Remarque :
Définition :
U
Tn = suit une loi de Student à n degrés de libertés.
Y
n
Espérance et variance :
n
E ( Tn ) = 0 et V ( Tn ) =
n−2
Remarque :
1 : Echantillonnage
La population est l'ensemble des unités qui définissent l'objet d'étude. Les
« unités » peuvent être des individus tels que des travailleurs, des patrons, des
étudiants, etc. Ils peuvent être aussi des objets tels que des organisations, des
recueillir des données de toute la population. Cela à cause des coûts élevés que
Méthode s d'échantillonnage
L'échantillonnage est une partie importante des statistiques. Elle nous permet de
comprendre ce qui se passe dans une population sans avoir à interroger chacun des
d'une population de manière à ce que les conclusions obtenues avec cet échantillon
se généralisent à la population
16
Z.BENABBOU EDITION : 2020
Le problème vient du fait qu'il faut avoir une liste valable et complète de la
Echantillonnage aléatoire
Une fois ces conditions remplies, on prend au hasard des échantillons. Les
dans la population, au hasard, de telle sorte que tous les échantillons possibles
de même taille ont la même chance d’être obtenu. Les résultats obtenus par cette
l'autre, vous allez introduire une distorsion statistique qui invalidera votre
L'échantillonnage en grappes
Imaginons que vous fassiez une enquête sur la productivité des travailleurs de
sexe féminin. Comme aucune liste de travailleurs n'existe pour votre ville, vous
devrez vous promener d'usine en usine pour faire la liste et ensuite faire votre
17
Z.BENABBOU EDITION : 2020
Pour faire un échantillonnage en grappes, vous pouvez sélectionner au hasard des
quartiers dans la ville et dans ses quartiers sélectionner des usines au hasard et
Une grappe est un ensemble d'unités d'une population qu'on constitue à l'aide de
Échantillonnage en strate
Population Echantillon
Echantillonnage systématique:
Exemple :
Le logement n°9, le n°16, le n°23, .Les numéros forment une suite arithmétique de
raison 7.
18
Z.BENABBOU EDITION : 2020
Echantillonnage non aléatoires :
des personnes dont le nom commence par une certaine lettre, etc. Il est bien évident
* La méthode la plus célèbre et la plus employée, est celle des quotas. Cette
méthode ressemble à la méthode par stratification, mais elle diffère par le mode de
2-1 Définition
Remarque :
sont : N, µ et
n,x et s
19
Z.BENABBOU EDITION : 2020
Dans le cas où la population suit une loi Normale
Distribution de la population :
Moyenne = µ
Écart type =
fixe
Distribution d’échantillon
Moyenne = x
Écart type = S
Distribution d’échantillonnage
Moyenne = X
Écart type =
X
n2 < n3)
2-2- Exemple :
d’un certain quartier précise que pour 30 d’entre elle il y a une voiture, pour les 20
autres 2 voitures.
20
Z.BENABBOU EDITION : 2020
c- Prélever l’ensemble des échantillons de taille 3 de la variable X.
2-3- Propriété :
X 1 + X 2 + ..... + X n
X = ( X 1 , X 2 ,......, X n ) . La moyenne X = est elle-même une V.A,
n
* E( X ) = X =
* X = si le tirage est avec remise ou la population infinie.
n
N −n
* X = si le tirage est sans remise et la population est finie.
n N −1
3-1- Propriété :
pq
E ( p) = p V ( p) =
n
21
Z.BENABBOU EDITION : 2020
Démonstration :
aléatoire à l’intérieur de l’échantillon. Alors Y suit une loi B(n,p) telle que E(Y) = np et
V(Y) = npq.
Y
Soit p la proportion de succès à l’intérieur de l’échantillon. p=
n
Y 1 np
E ( p ) = E = E (Y ) = =p
n n n
Y 1 npq pq
V ( p) = V = V (Y ) = =
n n 2
n 2 n
3. 2 Forme de la distribution: Théorème centrale limite
np 5 pq
alors p → N p,
Si :
nq 5 n
22
Z.BENABBOU EDITION : 2020
Chapitre III : Estimation
Objectifs :
concernant une population ne peut généralement être faite sur l’ensemble des
individus qui composent la population. Par exemple, pour connaître les intentions de
vote d’une population qui comporte des millions d’électeurs, il est impossible de
procéder, hormis le jour des élections, autrement que par un sondage c'est-à-dire par
donner les propriétés de ces fonctions qui sont appelés estimateurs. Ce sont les
23
Z.BENABBOU EDITION : 2020
1- Notion d’estimateur :
Définition : Soient X une variable aléatoire dont la loi de probabilité dépend d’un
dispersion.
On dit que l’estimateur Tn est sans biais (ou sans distortion) si E(Tn ) = .
L’estimateur est alors centré sur la vraie valeur , quel que soit l’effectif de
l’échantillon.
Xi 1
E ( X ) = E = E( X ) = 1 n =
n n i
n
Un estimateur Tn est d’autant meilleur qu’il comporte une plus faible erreur
24
Z.BENABBOU EDITION : 2020
De deux estimateurs sans biais, le plus efficace est, par définition, celui qui
3. Estimation ponctuelle :
usuels de µ, 2 et de p sont :
2
Puisque E( X ) = V(X) =
n
(X i − )2
S n2 = i =1
n 2
(Xi − X )
S n2 = i =1
n −1
25
Z.BENABBOU EDITION : 2020
n 2
( xi − x)
sn2 = s = i =1
n −1
Ce n’est pas tout à fait la variance de l’échantillon car on divise par n-1 au
lieu de n. Ces estimateurs ont été choisis parce qu’ils sont sans biais et
convergents.
3- c- Estimateur usuel de p :
Yi
pn = p = Y = Où Yi suit une loi de Bernoulli de paramètre p.
n
pq
Puisque E ( pn ) = p et V ( pn ) = tend vers zéro quand n tend
n
vers l’infini, alors pn converge en probabilité vers p.
Exemple 1:
certain urbain pour cela elle veut déterminer la loi de probabilité de la valeur
n
Les résultats obtenus sont : X = 475,25 DH (x
i =1
i − X ) 2 = 154250,93( DH ) 2
26
Z.BENABBOU EDITION : 2020
Exemple 2 :
prélevé chez les clients d’un magasin est de 2,28 et la variance est de 4, 362 cartes.
Quelle sont la moyenne, la variance des cartes de crédits utilisées par l’ensemble
des clients du magasin et la proportion de l’ensemble des clients qui utilisent plus de
2 cartes.
Nous venons de voir comment on peut estimer à partir d’un échantillon les
sont pas assorties d’un niveau de confiance qu’on pourrait leur accorder. Il est donc
4-1 Définition :
prédéterminé (en général : 90%, 95% ou 99%), que la vraie valeur du paramètre de
27
Z.BENABBOU EDITION : 2020
4-2 Estimations par intervalle de confiance
Paramètre
d’application
2 connu
X −
X → N (0,1)
X z1− / 2
normale
ou
n 30
n
n
2 inconnu
X −
→ Tn−1 sn
X t )
n
sn
( n−1)(1− / 2
X
normale n
n 30
2 inconnu
X −
→ N (0,1)
sn
Sn
n 30 (TCL) n X z1− / 2
n
connue et X
(X i − )2
→ n2
( X i − )2 ( X − )
i
2
2 ;
2 normale 2 1
inconnu et X (n − 1) sn2 (n − 1) sn2 (n − 1) sn2
→ 2
n −1 ;
normale 2 2 1
n 30, p− p pq
→ N (0,1)
p
pq p z1− / 2
np >5 et nq >5 n n
ou npq>15
28
Z.BENABBOU EDITION : 2020
p− p p− p
Dans la pratique on utilise l’approximation suivante :
pq / n pq / n
4-3 Exemples :
à estimer µ
des piles.
Remarque :
Les intervalles de confiance donnés pour m doit être obligatoirement centrés sur
X.
certitude.
29
Z.BENABBOU EDITION : 2020
4-3-3 Cas où µ est connue et qu’on cherche à estimer 2
On analyse le PH d’un parfum, variable ayant un aspect « normal » de
X =3 et ( X i − ) 2 = 0,0625 .
4-3-5- Estimation de p :
Une enquête faite sur un échantillon de 1000 adultes révèle que 110 d’entre eux
30
Z.BENABBOU EDITION : 2020
Chapitre III : Tests d’hypothèses :
1-Tests paramétriques
d’un sondage aléatoire à une norme fixé a priori, ou encore à comparer les
de test d’hypothèses.
Un test consiste à :
paramètre de X,
statistique
31
Z.BENABBOU EDITION : 2020
Les risques d’erreur dans un test
réalité
Erreur α
Erreur β
Remarque :
Principe du test
32
Z.BENABBOU EDITION : 2020
Population inconnue Population connue
X → N(μ,σ) X → N(μ0, σ0)
Echantillonnage aléatoire
Echantillon
n, X , s 2
Hypothèses
H0 : μ = μ0 H1: μ ≠ μ0
58
Méthode de résolution
Étape 1: H0 : µ = µ0 H1: µ ≠ µ 0
X − 0
Z obs =
2
n
33
Z.BENABBOU EDITION : 2020
Remarque
X − 0
Z =
sn / n
• Si n < 30 et X suit une loi normale, Z est remplacé par T, T suit une loi
Tests unilatéraux
H0: µ = µ0 H0 : µ = µ0
H1 : µ > µ0 H1 : µ < µ0
Méthode de résolution :
ou H1: µ < µ 0
34
Z.BENABBOU EDITION : 2020
Étape 2 : Déterminer le risque d’erreur α
X − 0
Z obs =
2
n
Exemple :
consultés par les étudiants au cours d’une visite a augmenté. Dans le passé une
35
Z.BENABBOU EDITION : 2020
1-2-1 Test relatif à une proportion
H0 : p = p0 H0 : p = p0 H0 : p = p0
H1 : p p0 H1 : p > p0 H1 : p < p0
que :
pn − p0
Z =
p0 (1 − p0 ) / n
n1 n1 le nombre de succès
suit la loi normale centrée réduite. Avec
pn = et
n
Méthode de résolution
Étape 1 : H0 : p = p0 H1: p ≠ p0
p − p0
Z obs =
p0 (1 − p0 )
n
suit une loi normale centrée réduite N(0, 1) si n >30, np0 ≥ 5 et nq0 ≥ 5
moyenne p0.
Zseuil = Z1-α/2
36
Z.BENABBOU EDITION : 2020
1-3. Tests d’homogénéité
Les tests d’homogénéité, destinés à comparer deux populations à l’aide d’un nombre
couramment utilisés. Dans ce cas la loi théorique du paramètre étudié (par exemple
Méthode de résolution :
n1
^ s12
2
n1 − 1
Fobs = ^
1
=
n2
22 s 22
n2 − 1
37
Z.BENABBOU EDITION : 2020
Étape 4 : Règle de décision
Exemple :
Méthode A Méthode B
1,30 1,30
1,32 1,40
1,40 1,48
1,45 1,48
1,50 1,50
1,51 1,60
1,55 1,76
1,56 1,88
1,92
2,20
Principe du test
Soit X un caractère quantitatif continu observé sur 2 populations suivant une loi
38
Z.BENABBOU EDITION : 2020
a-Variances des populations connues
Conditions d’application :
1 2
X 1 → N 1 , et X → N 2 ,
n1 2
n2
12 22
donc X1 − X → N 1 − 2 , +
n2
2
n1
ou Z =
(X 1 − X 2 ) − ( 1 − 2 )
→ N (0,1)
12 22
+
n1 n2
Méthode de résolution :
Sous H0 : µ 1= µ 2
X1 − X 2
Z obs =
12 22
+
n1 n2
39
Z.BENABBOU EDITION : 2020
Exemple
On a effectué une étude, en milieu urbain et en milieu rural, sur le rythme cardiaque
Moyenne de l’échantillon 80 77
Peut-on affirmer qu’il existe une différence significative entre les rythmes
Conditions d’application:
➢ Les variances des populations n’étant pas connues, on fait l’hypothèse que
Variances)
Méthode de résolution
Étape 1 : H0 : µ 1= µ 2 H1: µ 1 ≠ µ 2
Sous H0 : µ 1= µ 2 et σ 1 = σ 2 = σ
40
Z.BENABBOU EDITION : 2020
X1 − X 2 n1s12 + n2 s22
^
Tobs = avec = 2
^
1 1 n1 + n2 − 2
2 +
n1 n2
Suit la loi de Student de degrés n1 + n2 -2
Remarque
Dans le cas où les échantillons sont de taille plus importante (n1 ou n2 >30) , on
Exemple :
déposé par ces machines dans des flacons destinés à la vente a été mesuré en ml.
dépendante de la machine.
Machine 1 47 53 49 50 46
Machine 2 54 50 51 51 49
Qu’en pensez-vous ?
Conditions d’application :
41
Z.BENABBOU EDITION : 2020
et si leurs estimations à partir des échantillons sont significativement différentes (
Méthode de résolution :
Étape 1 : H0 : µ 1= µ 2 H1: µ 1 ≠ µ 2
Sous H0 : µ 1= µ 2 et σ 1 ≠ σ 2
X1 − X 2 X1 − X 2
zobs = =
^2 ^
s12 s22
1 22 +
+ n1 − 1 n2 − 1
n1 n2
Soit X une variable qualitative prenant deux modalités (succès X=1, échec X=0)
42
Z.BENABBOU EDITION : 2020
Hypothèses H0 : p1= p2 H1: p1 ≠ p2
Conditions d’application :
• Échantillons indépendants
Sous H0 : p1= p2
p1 − p2 n1 p1 + n2 p 2
Z obs = avec p =
1 1 n1 + n2
p q +
n1 n2
43
Z.BENABBOU EDITION : 2020
Exemple
On veut tester l’impact des travaux dirigés dans la réussite à l’examen de statistique.
Groupe 1 Groupe 2
Nombre d’heures de TD 20 h 30 h
Qu’en concluez-vous ?
Effectifs observés :
Y Fumeurs Non-fumeurs
X
Hommes 17 8
Femmes 9 14
44
Z.BENABBOU EDITION : 2020
Effectifs marginaux:
Hommes 17 8 25
Femmes 9 14 23
Total 26 22 48
Effectifs théoriques:
Total 26 22 48
25 26
n11 = = 13,54
48
45
Z.BENABBOU EDITION : 2020
2- Test d’indépendance : Test de 2
2.1 Principe du test
… yj … Total
… … … … …
xi … nij … ni.
… … … … …
Total … n.j … n
… yj … Total
… … … … …
n i .n.j
xi … … ni.
n
… … … … …
Total … n.j … n
proches :
46
Z.BENABBOU EDITION : 2020
2.2 Méthode de résolution
H1 : X et Y sont dépendantes
tromper, la valeur lue est 3.841. Donc 2 obs = 4,02 > 2 seuil = 3,841
Nous pouvons conclure qu'il existe une liaison statistiquement significative entre ces
deux variables.
47
Z.BENABBOU EDITION : 2020