Cours Slides 2
Cours Slides 2
Cours Slides 2
Statistique et Calcul
des Probabilités
Les probabilités sont définies sur des intervalles par la fonction de répartition
aire sous la courbe de densité 𝑓.
𝑃 Ω =1
𝑥
𝐹 𝑥 =𝑃 𝑋≤𝑥 = 𝑓 𝑡 𝑑𝑡
−∞
𝑓 𝑥 = 𝐹′ 𝑥
𝑏
𝑃 𝑎≤𝑋≤𝑏 = 𝑓 𝑡 𝑑𝑡
𝑎
𝑃 𝑎 ≤𝑋 ≤𝑏 =𝑃 𝑋 ≤𝑏 −𝑃 𝑋 ≤𝑎
𝑃 𝑋 ≥𝑎 =1−𝑃 𝑋 ≤𝑎
____________________________________
STA401 / Carole DURAND-DESPREZ
𝐸 𝑋 =μ= 𝑥 𝑓 𝑥 𝑑𝑥
2
𝑉 𝑋 = σ2 = 𝐸 𝑋 − 𝐸 𝑋 = 𝐸 𝑋2 − 𝐸 𝑋 2
𝑉𝑋 = 𝑥−μ 2𝑓 𝑥 𝑑𝑥 = 𝑥 2 𝑓 𝑥 𝑑𝑥 − μ2
𝑉 𝑎𝑋 + 𝑏 = 𝑎2 𝑉 𝑋
𝐸 𝑋
Inégalité de Markov : X v.a. positive, pour tout a > 0 : 𝑃 𝑋≥𝑎 ≤
𝑎
∞ 𝑎 ∞ ∞
Dém : 𝐸 𝑋 = 𝑥 𝑓 𝑥 𝑑𝑥 = 𝑥 𝑓 𝑥 𝑑𝑥 + 𝑥 𝑓 𝑥 𝑑𝑥 ≥ 𝑥 𝑓 𝑥 𝑑𝑥
0 ∞ 0 𝑎 𝑎
𝐸 𝑋 ≥𝑎 𝑓 𝑥 𝑑𝑥 ≥ 𝑎𝑃 𝑋 ≥ 𝑎
𝑎
𝑎+𝑏 𝑏−𝑎 2
Espérance et variance : 𝐸𝑋 = 𝑉𝑋 =
2 12
1 1
Espérance : 𝐸𝑋 = Variance : 𝑉𝑋 = 2 ( 2 IPP )
λ λ
∞ t
t
Démo : 𝐸𝑋 = λ𝑥𝑒 −λ𝑥 𝑑𝑥 = lim −𝑥𝑒 −λ𝑥 0 + lim 𝑒 −λ𝑥 𝑑𝑥 𝐼𝑃𝑃
0 𝑡→∞ 𝑡→∞ 0
t 1 t 1
𝐸 𝑋 = lim −𝑥𝑒 −λ𝑥 − lim 𝑒 −λ𝑥 =
𝑡→∞ 0 λ 𝑡→∞ 0 λ
1 𝑥−μ 2
−
Densité : 𝑓 𝑥 = 𝑒 2σ2
σ 2π
Espérance : 𝐸 𝑋 =μ
Variance : 𝑉 𝑋 = σ2
1 −𝑥 2
Densité : 𝑓 𝑥 = 𝑒 2
2π
Espérance : 𝐸 𝑋 =0
Variance : 𝑉 𝑋 =1
____________________________________
STA401 / Carole DURAND-DESPREZ
Notation importante :
𝑥𝑝 𝑞𝑢𝑎𝑛𝑡𝑖𝑙𝑒 𝑑 ′ 𝑜𝑟𝑑𝑟𝑒 𝑝 ∶ 𝐹 𝑥𝑝 = 𝑃 𝑋 ≤ 𝑥𝑝 = 𝑝
Convention – Notation :
Propriétés :
Si X suit N(m1 ;s1²) et Y suit N(m2 ;s2²) indépendantes X+Y suit N(m1 +m2 ; s1²+s2²)
X-Y suit N(m1 - m2 ; s1²+s2²)
Exemples :
Si X suit N(3;4) 2X-1 suit N(5 ; 16)
● Si X suit la loi N(3 ;4) alors Y = (X- 3)/2 suit la loi N(0;1) :
Si P(X < 4) = p P( Y < (4 - 3)/2 ) = p P( Y < 1/2 ) = p p = 0,6915
3. Théorème Central Limite : (Tous les théorèmes de convergence seront vus en L3)
𝑌 − 𝑛μ
𝑠𝑢𝑖𝑡 𝑙𝑎 𝑙𝑜𝑖 𝑁 0; 1 𝑜𝑢 𝑌 𝑠𝑢𝑖𝑡 𝑙𝑎 𝑙𝑜𝑖 𝑁 𝑛μ; 𝑛σ²
σ 𝑛
Cas particulier :
Approximation d'une loi Binomiale par une loi Gaussienne
Moivre-Laplace
Soient 𝑋𝑖 de loi B(p) indépendantes, alors m = p et s² = p(1-p)
On sait que 𝑌 = 𝑋𝑖 suit 𝐵 𝑛; 𝑝
𝑖
Si n est grand, alors 𝑌 suit approx. 𝑁 𝑛𝑝; 𝑛𝑝 1 − 𝑝
𝐵 𝑛; 𝑝 ≈ 𝑁 𝑛𝑝; 𝑛𝑝 1 − 𝑝
Démo : Soit (Xi) un échantillon de taille n de loi P( l/n), alors Y= S Xi suit une loi P(l)
– cf chapitre pécédent -. De plus, E(Xi) = V(Xi) = l/n. D'après le TCL, Y suit une loi 𝑁 λ; λ
Exemple d'approximation :
Une certaine boîte mail affirme que la probabilité qu'un courriel soit classé en tant que 'spam'
alors qu'il ne l'est pas réellement est p=1%.
On prend un échantillon de 1000 mails. X suit la loi Binomiale (1000; 1%)
1000 1000
𝑃 𝑋 ≤ 15 = 0,010 0,99 1000 +. . . . . . . . . . . . . . . . . . . + 0,0115 0,99 985 =? ? ?
0 15
Si n est grand, alors F suit approximativement une loi N(p, p(1-p)/n) – TCL (conditions).
𝑃 𝑎−𝑝 𝑝 1−𝑝 𝑛 ≤ 𝐹−𝑝 𝑝 1−𝑝 𝑛 ≤ 𝑏−𝑝 𝑝 1−𝑝 𝑛 = 1−α
−𝑢1−α 2 𝑢1−α 2
Exemple :
Dans une boîte mail un courriel a une probabilité de1% d'être classé comme un spam à tort. On
prend un échantillon de taille 1000 mails. Soit X le nombre de mails classés „spam“ à tort. On repère
14 mails mal classés dans cet échantillon.
L'échantillon est-il ' bon', 'conforme' ? L'échantillon est-il “représentatif de la population totale“ ?
On cherche à savoir si le nombre de mails mal classés X est cohérent, donc si la fréquence F est
bien dans l'intervalle de fluctuation à 95% :
Pour 14 mails mal classés dans l'échantillon, on a F= 0,014. On remarque que F est bien dans
l'intervalle I. Ou bien : 14 ∈ 3,83; 16,17
𝑋
𝑃 𝑎 ≤ 𝑋 ≤𝑏 = 1−α [ 1-a
]
a b
𝑋−μ
Raisonnement analogue à l'intervalle de fluctuation de la proportion : suit
une loi N(0;1). Donc, σ 𝑛
−𝑢1−α 2 𝑢1−α 2
Idem pour l'intervalle de
fluctuation asymptotique
σ σ - n grand - dans le cas où
𝑎; 𝑏 = μ − 𝑢1−α 2 ; μ + 𝑢1−α 2 X ne serait pas Gaussienne
𝑛 𝑛
(à faire en exo)
____________________________________
STA401 / Carole DURAND-DESPREZ
Exemple :
Le temps de compilation d'une page de codes avec la version 1 d'un logiciel était en moyenne de 0,2
seconde avec un écart type de 0,09 seconde. On suppose que ce temps suit une loi Normale.
On s'intéresse à la version 2 du même logiciel. On prend un échantillon de 150 pages, la moyenne
de compilation est de 0,18. Calculer l'intervalle de fluctuation de la moyenne à un niveau de confiance
de 0,98, puis conclure si le temps de compilation moyen a varié entre les deux versions.
Dans la version 1, les paramètres sont connus. On cherche à savoir si cette nouvelle version est
'conforme' ou pas à l'ancienne.
Intervalle de fluctuation à 98% de la moyenne :
𝐼 = 0,2 − 2,3263 ∗ 0,09 150 ; 0,2 + 2,3263 ∗ 0,09 150 = 0,183; 0,217
On remarque que la moyenne 𝑥 = 0,18 n'est pas dans l'intervalle I, par valeur inférieure.
On conclut que le temps moyen de compilation a varié depuis l'ancienne version, il a diminué avec
un niveau de confiance de 98%.
____________________________________
STA401 / Carole DURAND-DESPREZ
𝑋
𝑇= 𝑠𝑢𝑖𝑡 𝑙𝑎 𝑙𝑜𝑖 𝑑𝑒 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 𝑇 𝑛
𝑌 𝑛
𝑋 𝑛
𝐹= 𝑠𝑢𝑖𝑡 𝑙𝑎 𝑙𝑜𝑖 𝑑𝑒 𝐹𝑖𝑠ℎ𝑒𝑟 𝐹 𝑛;𝑝
𝑌 𝑝