Presentation Cours Stat Master 1
Presentation Cours Stat Master 1
Presentation Cours Stat Master 1
Bel-Abbes
Faculté des Sciences Exactes
Département de Probabilité-Statistique
Master SA-PA.
Cours: Statistique 1.
Cours de Statistique
Présentée par
Pr. ATTOUCH Mohammed Kadi
Master SA-PA
Module. Statistique 1 & Semestre. S1
du 07/02 au 06/03 année 2021
Objectif
1
Objectif
La statistique Inférentielle est un terme regroupe les
méthodes dont l’objectif principal est de préciser un
phénomène sur une population globale, à partir de son
observation sur un échantillon de cette population. Ce passage
ne se fait que moyennant des hypothèses de type probabiliste.
Echantillonage
Echantillonnage d’une moyenne
Echantillonnage d’une variance
Echantillonnage d’une proportion
Echantillonage
Echantillonnage d’une moyenne
Echantillonnage d’une variance
Echantillonnage d’une proportion
Estimation paramétrique
Notion de vraisemblance
Echantillonage
Echantillonnage d’une moyenne
Echantillonnage d’une variance
Echantillonnage d’une proportion
Estimation paramétrique
Notion de vraisemblance
Tests statistique
Echantillonage
Echantillonnage d’une moyenne
Echantillonnage d’une variance
Echantillonnage d’une proportion
Estimation paramétrique
Notion de vraisemblance
Tests statistique
Intervalle de Confiance
Intervalle de confiance d’une moyenne
Intervalle de confiance d’une variance
Echantillonage
Echantillonnage d’une moyenne
Echantillonnage d’une variance
Echantillonnage d’une proportion
Estimation paramétrique
Notion de vraisemblance
Tests statistique
Intervalle de Confiance
Intervalle de confiance d’une moyenne
Intervalle de confiance d’une variance
Tables Statistique
Echantillonage
POPULATION ÉCHANTILLON
DÉFINITION C’est l’ensemble des unités C’est un sous-ensemble de la
considérées par le statisticien. population choisie pour étude.
CARACTÉRISTIQUES Ce sont les paramètres Ce sont les statistiques
NOTATIONS N = taille de la population n = taille de l’échantillon
(si elle est finie)
Si on étudie un moyenne de la population moyenne de l’échantillon
caractère quantitatif m = N1 ∑N i =1 xi x̄ = n1 ∑ni=1 xi
écart-type
q de la population écart-type
q de l’échantillon
σpop = N1 ∑N i =1 (xi − m )
2 σech = n1 ∑ni=1 (xi − x̄ )2
Si on étudie un proportion dans la population proportion dans l’échantillon
qualitatif p f
Définition
X1 , . . . , Xn sont n v.a. indépendantes et de même loi (celle de X
); il est appelé n -échantillon ou échantillon de taille n de X .
Une réalisation (x1 , . . . , xn ) de l’échantillon (X1 , . . . , Xn ) est
l’ensemble des valeurs observées.
Définition
Une statistique Y sur un échantillon (X1 , . . . , Xn ) est une v.a.,
fonction mesurable des Xk :
Y = ϕ (X1 , . . . , Xn ) .
Définition
1 n
n k∑
La statistique X = Xk est appelée moyenne empirique de
=1
X.
Remarque
La moyenne empirique est une variable aléatoire qui prend des
valeurs différentes sur chaque échantillon appelées moyennes
observées.
Proposition
Soit X une variable aléatoire de moyenne µ et de variance σ2
et soit (X1 , X2 , . . . , Xn ) un n-échantillon de X . Alors
- E(X̄ ) = µ.
2
- Var(X̄ ) = σn .
Proposition
La distribution d’échantillonnage de la moyenne est donnée
par:
I Si X suit une loi normale N ( µ, σ ), alors X ∼ N µ, √σ .
n
I Si la loi de X est quelconque avec n ≫ 30, le théorème
central limite nous permets d’affirmer que X suit une loi
normale N (µ, σ).
Pr. M. Attouch | Cours de Master SA-PA - Module :Statistique 1
Distribution d’échantillonnage d’une variance
11
Alors
1
E S2 = 1 − σ2 .
n
Remarque
Remarque Comme 1 − n1 < 1; alors E S 2 < σ2 .
Proposition
Proposition Si le caractère X à étudier suit une loi normale
2
N (µ, σ) alors n Sσ2 suit une loi de khi-deux à (n − 1) degrés de
liberté càd
S2
n 2 ∼ χ2 (n − 1).
σ
Définition
Kn
La variable aléatoire p̂ = s’appelle la fréquence empirique.
n
Sa réalisation f est la proportion d’individus dans l’échantillon
ayant la modalité A.
Proposition
I Si n 30, np ≥ 5 ou n (1 − p ) ≥ 5, par le théorème
central limite,
r !
p (1 − p )
P̂ ∼ N p, .
n
Estimation Paramétrique
Ces estimations peuvent s’exprimer par une seule valeur (estimation ponctuelle), soit
par un intervalle (estimation par intervalle de confiance). Bien sûr, comme l’échantillon
ne donne qu’une information partielle, ces estimations seront accompagnées d’une
certaine marge d’erreur.
p 6 (1 − p )4 2.6 × 10−5 1.8 × 10−4 5.3 × 10−4 9.8 × 10−4 1.2 × 10−3 9.5 × 10−4 4.2 × 10−4
Définition
Supposons que pour toute valeur (x1 , . . . , xn ), la fonction qui à θ
associe L(x1 , . . . , xn , θ ) admette un maximum unique. La valeur
θb pour laquelle ce maximum est atteint dépend de (x1 , . . . , xn ) :
T = τ ( X1 , . . . , Xn ) ,
∑ni=1 xi
L(x1 , . . . , xn , λ) = −n log(λ) − .
λ
On montre alors immédiatement en annulant la fonction score
que :
1 n
λ̂ = ∑ xi = X .
n i =1
Ainsi l’estimateur du maximum de vraisemblance (EMV) d’une
loi exponentielle est la moyenne empirique.
Théorème de Neyman-Pearson
Le théorème de Neyman-Pearson est un théorème qui permet
lors de test d’hypothèses simples, de construire le "meilleur"
test à risque fixé. On suppose donc qu’on a une variable
aléatoire dépendant d’un paramètre et (x1 , . . . , xn ) un
échantillon de valeurs observées de X . La vraisemblance de
l’échantillon pour le paramètre est défini par
n
∏ P(xi /θ ) siXestv .a.dicr te
L(x1 , . . . , xn , θ ) = i = 1
n
∏ f (xi ; θ ) siXestv .a.continue
i =1
Théorème de Neyman-Pearson
Alors le test de puissance maximum pour un risque de première
espèce a fixé est celui dont la région critique est définie par
n L(x1 , . . . , xn , θ0 )
W = (x1 , . . . , xn ) ∈ R / ≤k
L(x1 , . . . , xn , θ1 )
On calcule :
x̄ − µ0
t=
√s
n
Corrigé: On calcule :
x̄ − µ0 15 − 12
t= = = 1.67.
√s √9
n 25
On calcule :
x̄ − µ0
u=
√s
n
et on décide que :
(1) Si u ∈] − zα ; zα [, on ne peut rejeter H0 .
(2) Sinon, on rejette H0 avec une probabilité α de se tromper.
n−1 2
y2 = s
σ02
Exemple
H0 : σ2 = σ02 = 90
Test bilatéral :
H0 : σ2 6= σ02 = 90
n−1 2 30
y2 = 2
s = × 100 = 33.34
σ0 90
On calcule :
p̄ − p0
u= q
p0 (1−p0 )
n
et on décide que :
(1) Si u ∈] − zα ; zα [, on ne peut rejeter H0 .
(2) Sinon, on rejette H0 avec une probabilité α de se tromper.
Corrigé: On calcule :
p̄ − p0 0.515 − 0.5
u= q = q = 0.6.
p0 (1−p0 ) 0.5(1−0.5)
n 400
Reprendre l’exemple
Dans notre exemple du tableau, pour α = 0.05, on a le ddl est
(3 − 1) × (2 − 1) = 2, qα = 5, 99 et la valeur de Q est :
×502 2 ×345 2 ×153 2
( 4951000 −210) ( 4951000 −194) ( 4951000 −91)
Q= 495×502 + 495×345 + 495×153 +
1000 1000 1000
×502 2 ×345 2 ×153 2
( 5051000 −292) ( 5051000 −151) ( 5051000 −62)
505×502 + 505×345 + 505×153 = 24, 15.
1000 1000 1000
Intervalles de Confiance
P (LI ≤ θ ≤ LS ) = 1 − α,
où
I LI est la limite inférieure de l’intervalle de confiance.
I LS est la limite supérieure de l’intervalle de confiance.
I S est la probabilité associée à l’intervalle d’encadrer la
vraie valeur du paramètre.
Pr. M. Attouch | Cours de Master SA-PA - Module :Statistique 1
IC de la moyenne µ de la population
51
Exemple:
On a observé la taille de n = 200 hommes Algériens adultes.
Après calcul, on a obtenu une moyenne de µ = 168cm. Si on
suppose que la variance connue vaut σ2 = 1. Donnez un
intervalle de confiance à 95% de la vraie moyenne de la
population.
Corrigé:
Puisque α = 0, 05(5%), alors P(zα ) = 1 − 2α = 0, 975, par suite
zα = 1, 96.
Finalement
IC95% = [167, 86; 168, 14], i.e., P(µ ∈ [167, 86; 168, 14]) = 0, 95
Exemple:
Un échantillon de 10 appartements (trois et demi) dans un
rayon de 1 km de l’université a permis d’estimer le coût moyen
du loyer mensuel à 350 par mois et un écart type de 30. Quel
est l’intervalle de confiance de 95% pour la moyenne des loyers
mensuels? Supposons que les loyers suivent une loi normale.
Corrigé:
pour un coefficient de confiance de 0, 95, on a α = 0, 05, et
donc 2α = 0, 025. On a n − 1 = 10 − 1 = 9 degrés de liberté,
alors la table de la distribution Student nous donne tα = 2, 262.
Finalement, après calcul
IC95% = [328, 54 ; 371, 46].
Donc, nous sommes confiants à 95% que la moyenne des
loyers mensuels (le vrai paramètre de la population µ), se
trouve entre 328.54 et 371.46.
Pr. M. Attouch | Cours de Master SA-PA - Module :Statistique 1
IC de la variance σ2 de la population
56
(n − 1)s 2 (n − 1)s 2
IC(1−α)% = ; .
a b
Exemple:
Pour n = 31, s2 = 100, on a le ddl = 31 − 1 = 30. Pour
α = 0, 05, on a 2α = 0, 025, ce qui donne a = 46, 98 et
1 − 2α = 0, 975, ce qui donne b = 16, 80.
Finalement,
IC95% = [0, 3965 ; 0, 4835].
Exemple:
Le Conseil Electoral (CE) est une instance qui s’occupe des
sondages politiques. À l’aide de sondages téléphoniques, les
interviewers demandent aux citoyens pour qui ils voteraient si
les élections avaient lieu aujourd’hui. Récemment, CE a trouvé
que 220 votants sur 500 voterait pour un candidat particulier.
Le CE veut estimer l’intervalle de confiance à 95% pour la
proportion des votants qui sont en faveur de ce candidat.
Corrigé:
On a n = 500, p = 220/500 = 0, 44 et zα = 1, 96 obtenue à
partir de la table de la loi gaussienne, donc
i.e., SPI est confiant à 95% que la proportion des votants qui
favoriseront ce candidat est entre 0.3965 et 0.4835.
Pr. M. Attouch | Cours de Master SA-PA - Module :Statistique 1
Table Loi de Gauss
60
! (t)
0
t
Figure: La table donne Φ(t ) = P (0 < X < t ).
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
4.0 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
Pr. M. Attouch | Cours de Master SA-PA - Module :Statistique 1
Table de Khi deux
64
# 2!,"
ν\α 0.99 0.98 0.95 0.9 0.8 0.2 0.1 0.05 0.02 0.01
1 0.000 0.001 0.004 0.016 0.064 1.642 2.706 3.841 5.412 6.635
2 0.020 0.040 0.103 0.211 0.446 3.219 4.605 5.991 7.824 9.210
3 0.115 0.185 0.352 0.584 1.005 4.642 6.251 7.815 9.837 11.345
4 0.297 0.429 0.711 1.064 1.649 5.989 7.779 9.488 11.668 13.277
5 0.554 0.752 1.145 1.610 2.343 7.289 9.236 11.070 13.388 15.086
6 0.872 1.134 1.635 2.204 3.070 8.558 10.645 12.592 15.033 16.812
7 1.239 1.564 2.167 2.833 3.822 9.803 12.017 14.067 16.622 18.475
8 1.646 2.032 2.733 3.490 4.594 11.030 13.362 15.507 18.168 20.090
9 2.088 2.532 3.325 4.168 5.380 12.242 14.684 16.919 19.679 21.666
10 2.558 3.059 3.940 4.865 6.179 13.442 15.987 18.307 21.161 23.209
11 3.053 3.609 4.575 5.578 6.989 14.631 17.275 19.675 22.618 24.725
12 3.571 4.178 5.226 6.304 7.807 15.812 18.549 21.026 24.054 26.217
13 4.107 4.765 5.892 7.042 8.634 16.985 19.812 22.362 25.472 27.688
14 4.660 5.368 6.571 7.790 9.467 18.151 21.064 23.685 26.873 29.141
15 5.229 5.985 7.261 8.547 10.307 19.311 22.307 24.996 28.259 30.578
16 5.812 6.614 7.962 9.312 11.152 20.465 23.542 26.296 29.633 32.000
17 6.408 7.255 8.672 10.085 12.002 21.615 24.769 27.587 30.995 33.409
18 7.015 7.906 9.390 10.865 12.857 22.760 25.989 28.869 32.346 34.805
19 7.633 8.567 10.117 11.651 13.716 23.900 27.204 30.144 33.687 36.191
20 8.260 9.237 10.851 12.443 14.578 25.038 28.412 31.410 35.020 37.566
21 8.897 9.915 11.591 13.240 15.445 26.171 29.615 32.671 36.343 38.932
22 9.542 10.600 12.338 14.041 16.314 27.301 30.813 33.924 37.659 40.289
23 10.196 11.293 13.091 14.848 17.187 28.429 32.007 35.172 38.968 41.638
24 10.856 11.992 13.848 15.659 18.062 29.553 33.196 36.415 40.270 42.980
25 11.524 12.697 14.611 16.473 18.940 30.675 34.382 37.652 41.566 44.314
26 12.198 13.409 15.379 17.292 19.820 31.795 35.563 38.885 42.856 45.642
27 12.879 14.125 16.151 18.114 20.703 32.912 36.741 40.113 44.140 46.963
28 13.565 14.847 16.928 18.939 21.588 34.027 37.916 41.337 45.419 48.278
29 14.256 15.574 17.708 19.768 22.475 35.139 39.087 42.557 46.693 49.588
30 14.953 16.306 18.493 20.599 23.364 36.250 40.256 43.773 47.962 50.892
Table de Student
!%! " %!
#$ #$
Figure: La table donne tα/2 tel que P (|Tν | > tα/2 ) = α.
ν\α 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.05 0.02 0.01 0.001
1 0.158 0.325 0.510 0.727 1.000 1.376 1.963 3.078 6.314 12.706 31.82 63.65 636.6
2 0.142 0.289 0.445 0.617 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 31.59
3 0.137 0.277 0.424 0.584 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 12.92
4 0.134 0.271 0.414 0.569 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 8.610
5 0.132 0.267 0.408 0.559 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.869
6 0.131 0.265 0.404 0.553 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 5.959
7 0.130 0.263 0.402 0.549 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 5.408
8 0.130 0.262 0.399 0.546 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 5.041
9 0.129 0.261 0.398 0.543 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 4.781
10 0.129 0.260 0.397 0.542 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 4.587
11 0.129 0.260 0.396 0.540 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 4.437
12 0.128 0.259 0.395 0.539 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 4.318
13 0.128 0.259 0.394 0.538 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 4.221
14 0.128 0.258 0.393 0.537 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 4.140
15 0.128 0.258 0.393 0.536 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 4.073
16 0.128 0.258 0.392 0.535 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 4.015
17 0.128 0.257 0.392 0.534 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.965
18 0.127 0.257 0.392 0.534 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.922
19 0.127 0.257 0.391 0.533 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.883
20 0.127 0.257 0.391 0.533 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.850
21 0.127 0.257 0.391 0.532 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.819
22 0.127 0.256 0.390 0.532 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.792
23 0.127 0.256 0.390 0.532 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.768
24 0.127 0.256 0.390 0.531 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.745
25 0.127 0.256 0.390 0.531 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.725
26 0.127 0.256 0.390 0.531 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.707
27 0.127 0.256 0.389 0.531 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.690
28 0.127 0.256 0.389 0.530 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.674
29 0.127 0.256 0.389 0.530 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.659
30 0.127 0.256 0.389 0.530 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.646
40 0.126 0.255 0.388 0.529 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704 3.551
60 0.126 0.254 0.387 0.527 0.679 0.848 1.045 1.296 1.671 2.000 2.390 2.660 3.460
120 0.126 0.254 0.386 0.526 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617 3.373
∞ 0.126 0.253 0.385 0.524 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 3.291