Seance - 5 - Distributions de Probabilités

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 45

DISTRIBUTIONS DE

PROBABILITÉS
Dr Ivlabèhirè Bertrand MEDA

https://orcid.org/0000-0002-9717-3770
Notion de variable aléatoire 1/2
• Une variable aléatoire est une fonction qui attribue des probabilités à
différents événements dans un espace d’échantillonnage.

• Une variable aléatoire pour laquelle il existe une série de valeurs


numériques discrètes avec des probabilités spécifiées est une variable
aléatoire discrète.
Exemple: L’otite moyenne est un motif fréquent de consultation au
cours des deux premières années de vie. Considérons X comme le
nombre d’épisodes d’otite moyenne au cours des 2 premières années
de vie. X est une variable aléatoire discrète qui peut prendre les valeurs
0, 1, 2 et ainsi de suite.
Notion de variable aléatoire 2/2
• Une variable aléatoire dont les valeurs possibles ne peuvent pas être
énumérées est une variable aléatoire continue.
Exemple: supposons qu’on soit intéresser à mesurer l’exposition
cumulée aux radiations des travailleurs des services d’imagerie au
cours de leurs carrières. On peut les faire porter un dosimètre qui
mesurera les doses annuelles absorbées et qu’on sommera après. Les
valeurs possibles peuvent être considérées comme infinies car ne
pouvant pas être énumérées.
• La fréquence d’occurrence (absolue ou relative) des valeurs d’une
variable aléatoire peut être représenter par un graphique appelé
distribution.

• Une distribution de probabilité est la répartition de la probabilité


d’occurrences des valeurs d’une variable aléatoire.

• Il existe une multitude de distributions de probabilités, certaines


empiriques et d’autres théoriques.

• Une distribution empirique donne les résultats d’un échantillon


• Une distribution théorique repose sur les résultats d’une population
ou encore une généralisation mathématiques de plusieurs
phénomènes.

• Nous verrons les distributions de probabilités pour variables discrètes


et les distributions pour variables continues.
Distributions de probabilités pour
variables discrètes
• Une distribution de probabilité d’une variable discrète est un tableau,
un graphique ou une formule spécifiant toutes les valeurs possibles
de cette variable et leur probabilité d’occurrence respective.

• Soit X la variable «nombre d’effets secondaires » associé à la prise


d’un médicament.

• X est une variable numérique discrète pouvant prendre les valeurs de


1 à 8.
Tableau 1: Distribution de probabilité empirique du nombre d’effets secondaires

Nombre d’effets Fréquence Probabilité Probabilité


secondaires 𝑷(𝑿 = 𝒙𝒊 ) cumulée
1 20 0,40 0,40
2 12 0,24 0,64
3 9 0,18 0,82
4 4 0,08 0,90
5 1 0,02 0,92
6 3 0,06 0,98
8 1 0,02 1,00
Total 50 1,00
Propriétés d’une distribution de probabilités
#!
• 𝑃 𝑋 = 𝑥" =
#

• 0 < 𝑃 𝑋 = 𝑥" ≤ 1

• ∑&"$% 𝑃 𝑋 = 𝑥" = 1
Figure 1: Distribution de probabilité empirique du nombre d’effets secondaires
Espérance d’une variable aléatoire discrète 1/2
• La distribution de probabilité n’est pas un résumé utile si une variable
aléatoire a un nombre important de valeurs avec des probabilités
positives.

• Ce serait comme si on résumait un échantillon en énumérant chaque


valeur observée.

• Comme pour un échantillon, on a développé des mesures de position


et des mesures de dispersion pour une variable aléatoire.
Espérance d’une variable aléatoire discrète 2/2
• L’espérance de X ou moyenne populationnelle est la valeur moyenne
attendue de X.
'

𝐸 𝑋 = 𝜇 = 0 𝑥" 𝑃𝑟(𝑋 = 𝑥" )


"$%
Exemple 1: Trouvez la valeur attendue du nombre d’effets secondaires
du tableau 1. Interpréter.

Exemple 2: Considérons que le tableau 2 de la diapositive suivante


représente la distribution de probabilité du nombre d’épisodes d’otite
moyenne des deux premières années de vie. Quel est le nombre moyen
attendu d’otites moyennes au cours des deux premières années de vie?
Tableau 2: Distribution de probabilités du nombre d’épisodes
d’otite moyenne au cours des deux premières années de vie.
Variance d’une variable aléatoire discrète
• La variance d’une variable aléatoire ou variance populationnelle représente la
dispersion de toutes les valeurs qui ont une probabilité positive autour de la
valeur attendue.
%
𝑉𝑎𝑟 𝑋 = 𝜎 ! = '(𝑥" − 𝜇)!Pr(𝑋 = 𝑥" )
"#$
Ou
%
𝜎 ! = 𝐸(𝑋 − 𝜇)!= ' 𝑥"! Pr 𝑋 = 𝑥" − 𝜇!
"#$
Exercices: Calculer les variances pour les deux exemples précédents.
Fonction de distribution cumulative
• Il peut être plus utile de représenter les probabilités cumulées plutôt
que les probabilités de valeurs individuelles.

• La fonction de distribution cumulative d’une variable aléatoire X est


dénotée F(X) et, pour toute valeur spécifique x de X, elle est définie
par Pr(X ≤ x).

• Pour une variable discrète, la fonction de distribution cumulative


ressemble à une courbe en escaliers et est appelée souvent fonction
en escaliers alors que pour une variable continue, c’est une courbe
lisse.
Figure 2: Ogive de probabilité cumulée empirique du nombre d’effets secondaires
Permutations et combinaisons 1/3
Supposons que nous avons identifié 5 hommes âgés de 50 à 59 ans
avec une schizophrénie dans une communauté et que nous voulons les
apparier avec 5 contrôles du même âge et même sexe de la
communauté. Nous avons 10 contrôles éligibles.
Combien de manières pouvons-nous choisir les contrôles si un contrôle
ne peut pas être utiliser plus d’une fois?
Permutations et combinaisons 2/3
• Le nombre de permutations de n choses prises k à la fois est:

• Il représente le nombre de façons de sélectionner k éléments parmi n


où l’ordre de sélection est important.
Permutations et combinaisons 3/3
• Supposons maintenant les cas et témoins ne sont plus appariés.
Combien de façons peut-on choisir les 5 témoins?

• Le nombre de combinaisons de n choses prises k à la fois est:

• Il représente le nombre de façons de sélectionner k objets parmi n où


l’ordre de sélection ne compte pas.
Distributions de probabilité
théoriques courantes
La loi binomiale
• Certaines variables ne peuvent prendre que deux valeurs mutuellement
exclusives: sexe (H, F), statut vital (Mort ou vivant). Pour des questions de
simplicité, on désigne souvent ces valeurs échec et succès.

• On appelle ces variables des variables aléatoires dichotomiques et ce type


de variable est connu comme une variable de Bernoulli

• La probabilité d’une des valeurs est dénotée p tandis que la probabilité de


l’autre dénotée q est donnée par 1 – p.

• Exemple: on est intéressé par la carie dentaire sur la première molaire


inférieure droite chez des adolescents de 12 à 14 ans.

• Soit C l’événement «la première molaire inférieure droite est cariée » et


notons p sa probabilité avec p=0,70
• L’événement S « la première molaire inférieure droite est saine » et sa
probabilité q.

• Si on choisit au hasard 4 enfants dans cette population, quelle est la


probabilité que 3 aient cette dent cariée?

• Le nombre de séquences possibles de 3 dents cariées parmi 4 est donné


! !! % %'&'(')
par: " = = & = =4
"! !$" ! &'(')())

• La probabilité de chaque séquence est: 𝑝& 𝑞

• La probabilité d’avoir 3 enfants avec cette dent cariée parmi 4 est donc:
4𝑝& 1 − 𝑝 = 4 0,70 & 1 − 0,70 = 0,4116
• La distribution de probabilité de la fréquence d’un événement particulier
(nombre de dents cariées) parmi n (nombre de dents dans l’échantillon choisi) est
connue sous le nom de distribution binomiale. C’est le nombre de succès dans n
essais indépendants.

&
𝑃(𝑋 = 𝑥) = ' 𝑝 ' 𝑞(&)') pour x=0, 1, 2, …., N

Pour toute autre valeur de x, P(X=x)=0

• Loi binomiale est une famille de distributions avec les paramètres n et p c’est-à-
dire que chacune des paires de valeurs (n , p) désigne un membre de cette
famille.

• La moyenne d’une distribution binomiale est µ=np

• Sa variance est 𝜎 ! = 𝑛𝑝𝑞 = 𝑛𝑝(1 − 𝑝)


• Si une variable n’a que deux valeurs possibles et que n est petit par
rapport à la taille de la population, le modèle théorique de la
distribution binomiale est généralement applicable.

• Pour certains auteurs n est petit si N/n > 10

• Des tables donnant les probabilités pour chacune des valeurs de n, X


et p existent pour faciliter les calculs.

• Ces tables existent pour n <= 20 et p <= 0,50

• Si p > 0,50 on a :
Propriétés de la distribution binomiale
• Un échantillon a un nombre fixe d’essais, chacun ayant deux résultats
possibles mutuellement exclusifs.

• Chaque essai a une probabilité constante de succès

• Le résultat de chaque essai est indépendant.

• La distribution binomiale est asymétrique sauf pour p=0,5 qui est une
distribution symétrique
Distributions de probabilités pour
variables continues
• Distribution de probabilité de variable continue est souvent représentée
par un graphique ou une formule.

• Il existe une infinité de valeurs intermédiaires entre n’importe quelles deux


valeurs d’une variable continue.

• Il est donc plus utile de s’intéresser aux probabilités associées à des


groupes de valeurs plutôt qu’à une seule.

• Le graphique d’une distribution de probabilité pour une variable continue


est encore appelé une fonction de densité.

• Cette fonction de densité prendra des valeurs élevées dans les régions de
haute probabilité et basses dans les régions de faible probabilité.
Figure 5: distribution de fréquences pour une variable continue (Poids à
la naissance, N=45)
Figure 6: Fonction de densité de la variable X (poids à la naissance)
Figure 7: Distribution de probabilité cumulée d’une variable continue.
• On a une grande variété de fonctions de densité: fonctions
exponentielles, gamma, uniformes, etc.

• La distribution de probabilité la plus utilisée pour variable continue


est la distribution normale.
La distribution normale
• Beaucoup de phénomènes naturels suivent une distribution qui
ressemble à la distribution dite «normale » ou gaussienne (en forme
de cloche).

• La distribution dite normale est une fonction de densité symétrique


avec la majorité des observations gravitant autour d’une valeur
centrale (μ) et des quantités égales mais moindres de part et d’autre
de ce centre.

• La symétrie implique que la moyenne, la médiane et le mode (ou la


classe modale) sont tous égaux.
Figure 8: Distribution de la pression artérielle diastolique chez des
hommes de 35 à 44 ans.
• La distribution normale est un modèle théorique

• C’est une famille de distributions théoriques où chaque distribution est


unique à chaque combinaison de (𝜇, 𝜎 ( )

• Une distribution normale avec les paramètres 𝜇 et 𝜎 ( se représente par


l’expression générale N(𝜇, 𝜎 ( ).

• La moyenne détermine la position de la distribution sur l’abscisse alors que


la variance détermine la dispersion des observations autour de la
moyenne.

! #$%
) $"( & )"
•𝑓 𝑥 = , (-
𝑒 où −∞ ≤ 𝑥 ≤ ∞, 𝜎 > 0, 𝜋 = 3,1416 𝑒𝑡 𝑒 = 2,718
Figure 9: Deux distributions normales de moyennes différentes et de même variance
Figure 10: Deux distributions normales de même moyenne mais avec des variances
différentes
Propriétés de la distribution normale
• La distribution normale étant une distribution de probabilités , la
surface totale (aire totale) sous la courbe égale 1

• 𝑃 𝜇 − 𝜎 < 𝑋 < 𝜇 + 𝜎 = 0,68

• 𝑃 𝜇 − 1,96𝜎 < 𝑋 < 𝜇 + 1,96𝜎 = 0,95

• 𝑃 𝜇 − 2,58𝜎 < 𝑋 < 𝜇 + 2,58𝜎 = 0,99


• La probabilité que la variable X prenne une valeur entre 𝑥$ 𝑒𝑡 𝑥! est donnée par
l’aire sous la courbe entre ces deux valeurs.

• L’aire sous la courbe entre les deux valeurs est l’intégrale entre les deux valeurs
suivant la formule: '"
1 '),
)$+!( - )"
𝑃 𝑥$ < 𝑋 < 𝑥! = 9 𝑒 𝑑𝑥
𝜎 2𝜋
'!
• Le calcul des probabilités associées à différentes valeurs d’une distribution
normale peut devenir lourd.

• Heureusement, toute distribution normale peut être transformée en une


distribution normale spéciale dont les probabilités ont été calculées afin de servir
de référence dans le calcul des probabilités.

• C’est la distribution normale standard ou centrée réduite ou distribution z.


La distribution normale
standard
• La distribution normale standard se note N(0, 1) c’est-à-dire que sa
moyenne est 0 et sa variance 1.

• En transformant une distribution normale quelconque en distribution


normale standard, on peut calculer toute probabilité associée aux
valeurs de la distribution originale.

• Standardiser la variable originale X pour créer une variable centrée


réduite Z revient à centrer la variable originale pour lui donner une
moyenne de 0 et concentrer la distribution pour lui donner une
variance de 1.

()*
𝑍=
+
• Si 𝑋~𝑁(𝜇, 𝜎 , ) alors 𝑃 𝑥% ≤ 𝑋 ≤ 𝑥, = 𝑃 𝑧% ≤ 𝑍 ≤ 𝑧,

-" )* -# )*
Où 𝑧% = et 𝑧, =
+ +

Exemple: La distribution de notes à l’examen final d’un cours de


biostatistiques suit une distribution normale de moyenne 70 et de
variance 25. Quelle est la probabilité qu’un étudiant ait une note entre
72 et 75?
Figure 11: Propriétés de la distribution normale standard
Approximations des distributions binomiale par la distribution
normale
• Une distribution binomiale de paramètres n et p peut être
approximée par une distribution normale de paramètres np et npq si
npq >= 5

Vous aimerez peut-être aussi