Résumé de L'information en SP

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 56

Nature et Résumé de l’information en

Biostatistique

5e année de Pharmacie
UCAD, FMPO
Objectifs éducationnels
1. Définir la statistique
2. Décrire une variable qualitative et une variable quantitative
3. Calculer la moyenne et l’écart type d’une série statistique
4. Décrire les propriétés de la moyenne et de la médiane d’une série
statistique
5. Interpréter les valeurs de l’écart type d’une série statistique
1. Généralités
Plan
2. Variabilité en santé
3. Nature de l’information
– Variables qualitatives
– Variables quantitatives
q Paramètres de position
– Valeurs centrales
• Moyenne
• Médiane
• Mode
– Les quantiles
• Quartiles
q Paramètres de dispersion
– Amplitude ou étendue
– Ecarts interquartiles
– Variance, Ecart type
– Coefficient de variation
Généralités (1)
– Statistiques (latin « status » état)
• Ensemble cohérent de données numériques relatives à un groupe
d'individus.
– Statistiques démographiques
– Statistiques du chômage
– Statistiques de santé
» État de santé de la population
» Activité : Statistiques d’activité hospitalière
Généralités (1)
– Statistiques (latin « status » état)
• Ensemble cohérent de données numériques relatives à un groupe
d'individus.
– Statistiques démographiques
– Statistiques du chômage
– Statistiques de santé
» État de santé de la population
» Activité : Statistiques d’activité hospitalière
– Statistique
• Ensemble des méthodes qui permettent de rassembler et d'analyser
les données numériques
• Paramètre tel que moyenne... calculé à partir d'un ensemble de
données
Généralités (1)
– Statistiques (latin « status » état)
• Ensemble cohérent de données numériques relatives à un groupe
d'individus.
– Statistiques démographiques
– Statistiques du chômage
– Statistiques de santé
» État de santé de la population
» Activité : Statistiques d’activité hospitalière
– Statistique
• Ensemble des méthodes qui permettent de rassembler et d'analyser
les données numériques
• Paramètre tel que moyenne... calculé à partir d'un ensemble de
données
– Biostatistique
• Application des statistiques en médecine
Généralités (2)
La statistique constitue, en médecine, l’outil permettant de répondre
à de nombreuses questions qui se posent en permanence au
médecin :
1. Quelle est la valeur normale d’une grandeur biologique: taille,
poids, glycémie ?
2. Quelle est la fiabilité d’un examen complémentaire ?
3. Quel est le risque de complication d’un état pathologique, et quel
est le risque d’un traitement ?
4. Le traitement A est-il plus efficace que le traitement B ?
Généralités (3)
• Différents types de statistique
– Descriptive
• a pour but de résumer et de présenter les données
observées pour que l'on puisse en prendre connaissance
facilement : tableaux, graphiques ...
– Inférencielle
• permet d'étendre ou de généraliser dans certaines conditions
les conclusions obtenues. Cette phase comporte certains
risques d'erreur qui peuvent être mesurés en faisant appel à
la théorie des probabilités.
Variabilité en santé (1)
• Cette variabilité est la somme d’une variabilité expérimentale (liée
au protocole de mesure) et d’une variabilité proprement biologique.
On peut ainsi décomposer la variabilité d’une grandeur mesurée en
deux grandes composantes :

Variabilité totale = variabilité biologique + variabilité métrologique


Variabilité en santé (2)
• La variabilité biologique peut être elle-même décomposée en deux
termes :
– la variabilité intra-individuelle,
– la variabilité inter-individuelle.
• En général, la variabilité intra est moindre que la variabilité inter.
• Ex: performance d’un athlète
Variabilité en santé (3)
• La variabilité métrologique peut être elle aussi décomposée en deux
termes:
– d’une part les conditions expérimentales dont les variations
entraînent un facteur d’aléas ;
– et d’autre part les erreurs induites par l’appareil de mesure
utilisé.
• variabilité métrologique = variabilité expérimentale + variabilité
appareil de mesure
• Ex: HTA
Nature de l’information
Variable
– Caractéristique mesurable à laquelle on peut attribuer plusieurs valeurs
différentes
• Variable aléatoire: variable dont la valeur est déterminée en
fonction du résultat d’une expérience aléatoire (ex: poids d’un
individu)
• Variable contrôlée: variable dont on fixe les valeurs à priori (ex:
dosage d’un médicament)
• Variables qualitatives
• Variables quantitatives
Variables qualitatives (1)
Caractérisent des attributs ou des catégories. Les modalités
peuvent être représentées sur une échelle nominale ou ordinale
• Nominales
– sexe: homme ou femme
– Couleur des cheveux: noire, blanche, etc…
• Ordinales:
– Les catégories sont classées suivant un ordre de grandeur
– Consommation de tabac: jamais, autrefois, actuellement
• Binaires ou dichotomiques
– Ne prend que deux valeurs possibles
– Issue maladie: vivant ou décédé
Variables quantitatives (2)
– Variables dont les modalités ont des valeurs numériques
• Discrètes
– Les variables ne peuvent prendre que des valeurs entières:
– nbr d’enfants, de grossesses
• Continues
– Elle peuvent prendre toutes les valeurs comprises entre deux extrêmes
– Poids, taille, glycémie
• Regroupement des données
• Cas discret
– On dispose d’une liste de 1 000 familles avec le nbr d’enfants chacune

Nbr d’enfants 0 1 2 3 4 5 6 7

Nbr de familles 26 305 403 199 54 7 5 1

Fréquence 2.6 30.5 40.3 19.9 5.4 0.7 0.5 0.1


Variables quantitatives (3)
• Cas continus
– Si la précision de la mesure est grande, on aura aucune mesure identique
– Classe définie par ses deux bornes: inférieure et supérieure
• Ex: mesure en cm de la longueur d’un organe
• 8.2 10.8 8.3 9.8 8.6 9.4 8.5 9.3 10.2 10.3 10.4 8.9 9.2 9.7 9.5 10
• Ex classe d’intervalle 0.5
• 8.0 à 8.5 signifie que 8.0 est inclu dans la classe alors que 8.5 est exclu
• Notation mathématique: [8.0 à 8.5[
• Dans la série statistique ci-dessus on dénombre:
– [8.0 à 8.5[ → 2
– [8.5 à 9.0[ → 3
– [9.0 à 9.5[ → 3
– .
– .
Transformation des variables

– Utile en cas de comparaison des populations, facilite l’utilisation des


tests statistiques.
– Doit être fait au moment de l’analyse et non le recueil
• Variable quantitative en variable qualitative
– Poids: maigre, normal, obèse
– Taille: petite, moyenne, grande
• Variable qualitative en quantitative
– Opération dangereuse à éviter
Résumé de l’information
• Meilleure appréhension de l’information
• Simplifier l’information
• Bonne description de l’information
• Perte d’information
Variables qualitatives
• Soit une population où la vraie proportion de
malades est P et soit un échantillon tiré au sort
dans cette population comprenant n sujets
dont k malades.
• L’estimation de P à partir de cet échantillon est
k
p0 =
n
• L’intervalle de confiance à 95%

pq
p0 ± ea / 2 N
Variables qualitatives
Exemple
• Dans un échantillon de 60 malades séropositifs
sous ARV, on observe 18 malades ayant une
charge virale normale. Calculer l’intervalle de
confiance de la proportion de malade ayant une
charge virale normale.
Variables qualitatives
Exemple
• Dans un échantillon de 60 malades séropositifs
sous ARV, on observe 18 malades ayant une
charge virale normale. Calculer l’intervalle de
confiance de la proportion de malade ayant une
charge virale normale.
• On a donc : p0=0,30 et
p0 q0 0,30 * 0,70
= = 0,0035.
n 60
• L’intervalle de confiance à 95% :

0,30 ± 1,96 0,0035 = 0,30 ± 0,12 [0,18 ; 0,42].


Variables quantitatives
1. Paramètres de position
– Valeurs centrales
• Moyenne
• Médiane
• Mode
– Les quantiles
• Quartiles
2. Paramètres de dispersion
– Amplitude ou étendue
– Ecarts interquartiles
– Variance, Ecart type
– Coefficient de variation
Paramètres de position

– Valeurs centrales
• Moyenne
• Médiane
• Mode
– Les quantiles
• Quartiles
Moyenne arithmétique
Population m (mean) Echantillon x (average)

• Appelée moyenne notée x


– Paramètre central qui concerne uniquement les
variables quantitatives.
– Calculable quelque soit la loi qui régit la distribution.
– Somme des valeurs (T) divisée par le nombre de
mesures (N).
– Suivant la forme de présentation des observations,
différentes formules de calcul peuvent être
employées.
La moyenne arithmétique
• Propriétés :
– Centre de gravité de la distribution.
– La somme des écarts à la moyenne est nulle.
– La moyenne contrairement à la médiane est très sensible aux
valeurs extrêmes.
– Si la distribution de la variable suit une loi normale, la moyenne
et la médiane et le mode sont confondus.
– La moyenne de l'échantillon est le meilleur estimateur de la
moyenne de la population.
La moyenne arithmétique
• La somme de n valeurs x1+x2+….xn s’écrit
• Propriété
où a est une constante

où a est une constant

– Exemple
La moyenne arithmétique
• Pour un ensemble

• Exemple
• Soit la série statistique correspondant au tailles (cm) de 6 étudiants
– 140; 140; 150; 150; 160.160
– N=6, T=900
– X=900/6=150
La moyenne arithmétique
• Distribution de fréquence discrète
– Avec les valeurs x1 x2 …….xk
– Avec les effectifs n1 n2……..nk
– Avec les fréquences f1 f2………fk

• or donc


La moyenne arithmétique
• Dans une population on a regroupé les familles en fonction du nombre d’enfants

valeurs 0 1 2 3 4
effectifs 20 60 30 10 0
fréquence 0,166 0,50 0,25 0,083 0
La moyenne arithmétique
• Dans une population on a regroupé les familles en fonction du nombre d’enfants

valeurs 0 1 2 3 4
effectifs 20 60 30 10 0
fréquence 0,166 0,50 0,25 0,083 0
La moyenne arithmétique
• Dans une population on a regroupé les familles en fonction du nombre d’enfants

valeurs 0 1 2 3 4
effectifs 20 60 30 10 0
fréquence 0,166 0,50 0,25 0,083 0
La moyenne arithmétique
• Distribution de fréquence continue
– On ne peut prendre les valeurs de xi
– On utilise alors la valeur moyenne de la classe
Valeur Nbr de malade Valeur moyenne
1 2 X 3
2 3
2,5 à 3 3 2,75 8,25
3 à 3,5 21 3,25 68,25
3,5 à 4 11 3,75 41,25
4 à 4,5 6 4,25 25,50
4,5 à 5 4 4,75 19
5 à 5,5 1 5,25 5,25
La moyenne arithmétique
• Distribution de fréquence continue
– On ne peut prendre les valeurs de xi
– On utilise alors la valeur moyenne de la classe
Valeur Nbr de malade Valeur moyenne
1 2 X 3
2 3
2,5 à 3 3 2,75 8,25
3 à 3,5 21 3,25 68,25
3,5 à 4 11 3,75 41,25
4 à 4,5 6 4,25 25,50
4,5 à 5 4 4,75 19
5 à 5,5 1 5,25 5,25
Les autres moyennes
• Moyenne géométrique d'une série de valeurs
positives est la racine Nième du produit des N
valeurs. Elle est toujours inférieure ou égale à la
moyenne arithmétique.
• Moyenne harmonique d'une série de valeurs
positives est égale à l'inverse de la moyenne
des inverses.
• Moyenne quadratique est la racine carré de la
moyenne arithmétique des carrés.
La médiane
• La médiane notée (tilde) est telle que la moitié des
observations lui sont inférieure (ou égale) et la moitié
supérieure (ou égale) : xi tel que Fi = 0,5.
– Sur les distributions symétriques (normales par exemple) la
médiane est égale à la moyenne et au mode.
– Paramètre peu sensible aux valeurs extrêmes
• Exemple
• 32; 28; 35; 42; 30; 27; 34; 26; 102
• Moyenne= 39,56
• 7 valeurs sur 9 sont situées sous la moyenne
• 26; 27; 28; 30; 32; 34; 35; 42; 102
La médiane

• Pour un ensemble
– Si N impair, la médiane est l'observation de rang (N+1)/2
• 26; 27; 28; 30; 32; 34; 35; 42; 102

– Si N est pair, tout nombre entre xN/2 et xN/2+1


convient. On prend la moyenne (pondérée en cas d'ex
aequo) entre ces deux valeurs.
– 26; 27; 28; 30; 32; 35; 42; 102
– Médiane=(30+32)/2= 31
La médiane

Distribution de fréquence
– Avec les effectifs n1 n2……..nk
– Avec les valeurs x1 x2 …….xk

– C’est la valeur de rang


x 0 1 2 3 4 5 6
n 5 5 10 20 30 20 10
n 5 10 20 40 70 90 100
Le mode
• Mode encore appelé valeur dominante
– Correspond à la valeur la plus fréquente. xi
correspondant au ni (ou fi)maximum.

– Dans les distributions unimodales symétriques, mode médiane


et moyenne sont confondus (distribution normale par exemple)

– Pour un histogramme on parle de classe modale

– Hétérogénéité de la population
Les quantiles

• Quartiles
– Q1: xi tel que Fi = 0,25 => 1/4 des valeurs lui sont
inférieures, 3/4 lui sont supérieures.

– Q2 = Médiane

– Q3 : xi tel que Fi = 0,75 => 3/4 des valeurs lui sont


inférieures, 1/4 lui sont supérieures.
Paramètres de dispersion

– Amplitude ou étendue
– Ecarts interquartiles
– Variance, Ecart type
– Coefficient de variation
Amplitude ou étendue
• Amplitude ou étendue
– Ecart entre la valeur de l'observation maximale et
celle de l'observation minimale.

– Non définie pour les distributions groupées


Ecart interquartiles
– Q3 -Q1
– Englobe 50% des observations
– On utilise parfois l'écart semi-interquartile
(Q3-Q1)/2
– Donne naissance à la représentation en « box
plot »
Q1 médiane Q3
Variance

– La variance d'une série ou d'une distribution de


fréquence est la moyenne arithmétique des carrés
des écarts à la moyenne.
– C'est par rapport à la moyenne que la somme des
carrés des écarts est la plus faible.
– La variance de l'échantillon est notée S2. Ce n'est pas
un bon estimateur de la variance de la population
notée s2.
– Le numérateur de la variance est appelé somme des
carrés des écarts et noté SCE.
Variance
• Variance de la population

• Variance de l’échantillon

• Calcul sans la moyenne


Écart type
– L'écart type est la racine carré de la variance
– On l'appelle également déviation standard
(standard deviation).
– Il est dans l'unité de la variable.
– Intérêt
• Précision de la mesure
• Comparaison de l’évolution d’un groupe
– Écart type de la moyenne (erreur type)
– Distribution des moyennes de plusieurs
échantillons
Écart type

68% sujets

95% sujets

99.7 % sujets

µ - 3s µ - 2s µ - s µ µ + s µ + 2s µ + 3s
Écart type
Example: Age ~Normal,
Moyenne = 40,
Ecart-type= 10.

La médiane égale 40

68% 30 et 50 ans

95% entre 20 et 60 ans

Presque tous entre 10 et 70 10 20 30 40 50 60 70


ans.
Variance
• Variance de la population

• Variance de l’échantillon

• Calcul sans la moyenne


Écart type
• Ex1
• 3; 4; 6; 2
Écart type
• Ex1
• 3; 4; 6; 2 d’où la moyenne
Écart type
• Ex1
• 3; 4; 6; 2 d’où la moyenne
Écart type
• Ex2

Milieu classe f f.x f.


2,45-2,55 2,5 3 7,5 18,75

2,55-2,65 2,6 9 23,4 60,84

2,65-2,75 2,7 11 29,7 80,19

2,75-2,85 2,8 8 22,4 62,72

2,85-2,95 2,9 4 11,6 33,64


Écart type
• Ex2

Milieu classe f f.x f.


2,45-2,55 2,5 3 7,5 18,75

2,55-2,65 2,6 9 23,4 60,84

2,65-2,75 2,7 11 29,7 80,19

2,75-2,85 2,8 8 22,4 62,72

2,85-2,95 2,9 4 11,6 33,64

• et
Coefficient de variation
• Un ratio entre l’écart-type et la moyenne
• Il mesure la variation relative dans
l’échantillon
s *100
CV =
µ
Coefficient de variation
• Un ratio entre l’écart-type et la moyenne
• Il mesure la variation relative dans
l’échantillon
s *100
CV =
µ
• Inférieur à 16%: faible dispersion
• Entre 16% et 33% dispersion moyenne
• Plus de 33% grande dispersion
Coefficient de variation
• Série 1
– Moyenne= 281,8
– Écart-type= 18,86
– CV1= 6,69%
• Série 2
– Moyenne= 6,5
– Ècart-type=1,2
– CV2=18,46%
Bibliographie
• Dodge Y. Statistique: dictionnaire encyclopédique. Edition Springer,
Paris 2007, 634p.
• Falissard B. Comprendre et utiliser les statistiques dans les
sciences de la vie. Edition Masson, Paris 2005, 372p.
• Garnier P. Module épidemiologie. ISED, 1994, 118p.
• Golmard JL, Mallet A, Morice V. Université Paris VI cours
biostatistique.
• Lemort JP. Initiation à la statistique médicale. ISED, 2003, 137p.
• Logiciel R. http://cran.r-project.org
• Valleron AJ. Introduction à la biostatistique. Edition Masson, Paris
1998, 422p.

Vous aimerez peut-être aussi