Psycho Slides Stat L3 S6
Psycho Slides Stat L3 S6
Psycho Slides Stat L3 S6
Christian Lavergne
n
1 X n grand
X = Xi → µ
n
i=1
E (X ) = µ
• sa variance
σ2
V (X ) =
n
• son écart-type
σ
σ(X ) = √
n
La dispersion de la moyenne se réduit quand n grandit : c’est la loi des
grands nombres
E (Tn ) = θ
E (T3 ) = θ et V (T3 ) = λ
Donner les propriétés :
de biais ( "estimateur sans biais" ; "son biais diminue quand n, le
nombre d’observations grandit")
et de variance ("sa variance diminue quand n, le nombre
d’observations grandit")
Lequel des 3 est il raisonnable de garder ?
P(X = 1) = p ; P(X = 0) = 1 − p
n
1 X n grand
X = Xi → p
n
i=1
X −µ n grand
r → N (0, 1)
σ2
n
X −p n grand
r → N (0, 1)
p(1 − p)
n
P(−1.96 < Z < 1.96) = .95 P(−2.576 < Z < 2.576) = .99
Donc [−1.96 ; 1.96] (resp. [−2.576 ; 2.576]) est un intervalle de dispersion
de Z à 95% (resp. 99% )
Sn − np0
P(−` α2 < p < ` α2 ) ≈ 1 − α
np0 (1 − p0 )
p p
Et, P np0 − ` α2 np0 (1 − p0 ) < Sn < np0 + ` α2 np0 (1 − p0 ) ≈ 1 − α
Xn h p p i
ID1−α ( Xi ) = np0 − ` α2 np0 (1 − p0 ) , np0 + ` α2 np0 (1 − p0 )
i=1
X − µ0 n −nµ0
P(−` α2 < q 2 < ` α2 ) ≈ 1 − α P(−l α2 < Sq < ` α2 ) ≈ 1 − α
σ0 2
nσ0
rn r !
σ02 σ02
P µ0 − ` 2
α < X < µ0 + ` α2 ≈1−α
n n
q q
σ02 σ02
ID1−α (X ) = µ0 − ` α2 n , µ0 + ` 2
α
n
q q
2 2
P nµ0 − ` 2 nσ0 < Sn < nµ0 + ` 2 nσ0 ≈ 1 − α
α α
n
X q q
ID1−α ( 2 2
Xi ) = nµ0 − ` α2 nσ0 , nµ0 + ` α2 nσ0
i=1
X −p n grand
r → N (0, 1)
p(1 − p)
n
Et comme pour Z v.a. N(0,1) on sait que P(−` α2 < Z < ` α2 ) = 1 − α ; on a
X −p
P(−` α2 < r < ` α2 ) ≈ 1 − α
p(1 − p)
n
q q
p(1−p) p(1−p)
Et, P X − ` α2 n < p < X + ` α2 n ≈1−α
D’où s s
X (1 − X ) X (1 − X )
IC 1−α (p) = X − ` α2 , X + ` α2
n n
q n = 1000
x(1−x)
x n IC à 95% IC à 99%
.2 .01265 [0.1752 , 0,2248] [0.1674 , 0.2326]
.5 .01581 [0.4690 , 0.5310] [0.4593 , 0.5407]
.9 .00949 [0.8814 , 0.9186] [0.8756 , 0.9244]
X −µ
r ∼ N (0, 1)
σ2
n
Et comme pour Z v.a. N(0,1) on sait que P(−` α2 < Z < ` α2 ) = 1 − α ; on a
X −µ
P(−` α2 < r < ` α2 ) = 1 − α
σ2
n
q q
2 2
Et P X − ` α2 σn < µ < X + ` α2 σn =1−α
Le test statistique :
1 Introduction et Vocabulaire
2 Un test dans le cas continu
3 Un test dans le cas du sondage
Choix de H0 Choix de H1
H0 vraie Décision juste Erreur de
1re espèce
H1 vraie Erreur de Décision juste
2e espèce
On construira le test de :
• l’hypothèse H0 : µgroupe = 100
• l’hypothèse alternative H1 : µgroupe > 100.
X − µ0
r ∼ N (0, 1)
σ2
n
Donc, r !
σ2
P X < µ0 + `α =1−α
n
σ
x > µ0 + `α √
n
X − µ0
s ∼ Sn−1
σ
c 2
Rejet de H0 si
r r
σ2 σ2
x < µ0 − ` α2 ou x > µ0 + ` α2
n n
X − p0 n grand
Si H0 est vraie alors : r → N (0, 1)
p0 (1 − p0 )
n
r r !
p0 (1 − p0 ) p0 (1 − p0 )
D’où, P p0 − ` α2 < X < p0 + ` α2 ≈1−α
n n
Donc rejet de H0 si
r r
p0 (1 − p0 ) p0 (1 − p0 )
x < p0 − ` α2 ou x > p0 + ` α2
n n
r
Rejet de H0 si p0 (1 − p0 )
x > p0 + `α
n
Construction de tests
en présence de 2 distributions :
X − E (X ) Y − E (Y )
ρXY = E ( × )
σX σY
et on a −1 ≤ ρ̂XY ≤ 1.
Plus ce coefficient se rapproche de 1, plus les variables sont corrélées
positivement, c’est-à-dire qu’elles varient dans le même sens. Plus il se
rapproche de -1, plus elles varient en sens opposé. S’il se rapproche de 0,
leurs variations ne sont pas liées linéairement.
(UPV) StatL3S6 2013/2014 48 / 75
Exemple 1 : Deux séries de notes observées sur 12 individus
X : 14 13 17 15 14 15 16 12 14 12 13 13
Y : 13 11 16 15 12 13 15 10 14 12 13 12
Ex1 : ρ̂ = 0.874.
` α2
|ρ̂| > √
n−1
d écimale 0 1 2 3 4 5 6 7 8 9
effectifs 968 1026 1021 974 1012 1046 1021 970 948 1014
Cette distance sera donc d’autant plus grande que le tableau des
observations sera loin du tableau sous l’hypothèse du modèle
1 - Introduction
Objectif : Étudier l’effet d’une ou plusieurs variables qualitatives sur une
variable quantitative
Le cas d’une variable qualitatitive : on observe sur des individus à la
fois une variable quantitative et une une variable qualitative. On cherhche
alors à "savoir" si les différentes modalités de la variable qualitative
influencent la variable quantitative.
1 2 3 4 5 6
1602 1472 1548 1435 1493 1585
1615 1477 1555 1438 1498 1592
1624 1485 1559 1448 1509 1598
1631 1493 1563 1449 1516 1604
1496 1575 1454 1521 1609
1504 1458 1523 1612
1510 1467
1475
I
i n
1 XX
• ȳ.. = yik : moyenne globale
n
i=1 k=1
! ! ! Attention
La moyenne des observations ȳ.. n’est pas égale à la moyenne des moyennes
par niveau du facteur ȳi.
µi = µ + αi i = 1, . . . , I (2)
µ = µ1 et α i = µi − µ1