Projet Tut

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 19

Université Paris Est Créteil-IUT de Sénart

Département Génie Industriel et Maintenance


LP Technique Avancées en Maintenance

Rapport de projet Tuteuré


Test de Kolmogorov-Smirnov

Réalisé par : ZINBI Youssef

BOUZIDI Mohammed

Encadré par : Mr. SFAXI Youssef

1
PLAN

1. Introduction

2. Test de Kolmogorov-Smirnov

 Description du test

 Application du test

3. Données et Calculs

 Présentation des données

 Calcul de la moyenne et de l'écart-type

4. Réalisation de Test Kolmogorov-Smirnov sur Exécution en Programmation VBA

 Étape 1 : Étendre les données selon leurs fréquences

 Étape 2 : Calculer la moyenne

 Étape 3 : Calculer l'écart-type

 Étape 4 : Appliquer le test de Kolmogorov-Smirnov

5. Tutoriel

 Guide détaillé pour réaliser le projet en VBA

 Code VBA Utilisé

6. Résultats et Interprétation

 Résumé des résultats

 Interprétation des résultats

 Conclusion sur la normalité des données

7. Conclusion

2
Introduction

Le but de ce projet est d'évaluer la normalité d'une série de données statistiques en


utilisant le test de Kolmogorov-Smirnov. La normalité des données est une
hypothèse fondamentale dans de nombreuses méthodes statistiques, et plusieurs
modèles de régression. Vérifier cette hypothèse permet de s'assurer que les
conclusions tirées des analyses statistiques sont valides et fiables.

Le test de Kolmogorov-Smirnov est un test non paramétrique utilisé pour comparer


la distribution cumulative empirique d'un échantillon de données avec une
distribution théorique, telle qu'une distribution normale. Ce test mesure la distance
maximale entre ces deux distributions, fournissant une statistique D qui peut être
utilisée pour déterminer si les différences observées sont statistiquement
significatives.

L'objectif final est de fournir une évaluation claire et précise de la normalité des
données et de démontrer l'utilisation pratique du test de Kolmogorov-Smirnov
dans un environnement de tableur. Le rapport détaillera chaque étape du
processus, les résultats obtenus et leur interprétation, ainsi que les scripts VBA
utilisés pour automatiser l'analyse. Cette approche permet de renforcer les
compétences en statistiques et en programmation VBA, tout en fournissant des
outils pratiques pour l'analyse de données.

3
2. Test de Kolmogorov-Smirnov

o Principe du test de Kolmogorov-Smirnov

Le test de Kolmogorov-Smirnov (K-S) est un test statistique non paramétrique utilisé pour
déterminer si un échantillon de données suit une distribution théorique spécifique, telle
qu'une distribution normale. Le test compare la distribution cumulative empirique des
données avec la distribution cumulative théorique et mesure la distance maximale entre ces
deux distributions.

La statistique de Kolmogorov-Smirnov, notée 𝐷D, est définie comme la plus grande


différence absolue entre les distributions cumulatives empirique et théorique :

𝐷=max|(𝐹𝑛(𝑥)−𝐹(𝑥)|
4
Où 𝐹𝑛(𝑥) est la distribution cumulative empirique de l'échantillon et 𝐹(𝑥) est la distribution
cumulative théorique.

o Hypothèses du test

Le test de Kolmogorov-Smirnov est basé sur les hypothèses suivantes :

 Hypothèse nulle (𝐻0) : L'échantillon de données suit la distribution théorique spécifiée


(par exemple, une distribution normale).
 Hypothèse alternative (𝐻𝑎) : L'échantillon de données ne suit pas la distribution théorique
spécifiée.

La p-value associée au test de Kolmogorov-Smirnov indique la probabilité que la


différence observée (ou une différence plus grande) entre les distributions cumulatives
empirique et théorique se produise par hasard si l'hypothèse nulle est vraie. Une p-value
faible (généralement inférieure à 0,05) conduit au rejet de l'hypothèse nulle, indiquant que
l'échantillon ne suit pas la distribution théorique spécifiée.

Étapes de l'application du test

Les étapes pour appliquer le test de Kolmogorov-Smirnov sont les suivantes :

Calculer la distribution cumulative empirique 𝐹𝑛(𝑥)

Organiser les données en les classant par ordre croissant.

Calculer la fréquence cumulative pour chaque valeur de données.

Calculer la distribution cumulative théorique (𝐹(𝑥)F(x)) :

5
Utiliser la distribution théorique spécifiée (par exemple, une distribution
normale avec la moyenne et l'écart-type calculés).

Calculer la statistique D :

Calculer la différence absolue entre les distributions cumulatives empirique et


théorique pour chaque valeur de données.

Identifier la différence maximale.

Déterminer la p-value :

Utiliser la statistique D pour calculer la p-value associée, en se référant à des


tables de valeurs critiques ou en utilisant un logiciel statistique.

Calcul de la distribution cumulative empirique 𝐹𝑛(𝑥)

Pour les données étendues :

Calcul de la distribution cumulative théorique (𝐹(𝑥)F(x))

Utilisation de la distribution normale avec la moyenne X=4.2122 et l'écart-type 𝜎=2.43. Les


valeurs théoriques de la distribution cumulative sont calculées pour chaque valeur de
données.

Détermination de la p-value

En utilisant la statistique D obtenue et se référant à des tables de valeurs critiques du test de


Kolmogorov-Smirnov ou en utilisant un logiciel statistique, nous trouvons que la p-value
est extrêmement faible, 2.805514×10−312.805514×10−31.

Résultats obtenus

Statistique D : 0.310263

6
p-value : 2.805514×10−312.805514×10−31

Avec une p-value extrêmement faible, nous rejetons l'hypothèse nulle selon laquelle la
variable suit une loi normale. Cela indique que les données ne suivent pas une distribution
normale avec une forte certitude.

3. Données et Calculs

a. Présentation des données

Les données utilisées dans ce projet représentent des valeurs de la variable aléatoire 𝑋(par exemple,
des durées de vie en années) et leurs fréquences n Ces données sont collectées et organisées dans un
tableau, comme illustré ci-dessous :

Chaque valeur X est associée à une fréquence n, qui indique combien de fois cette valeur apparaît dans
l'ensemble de données.

b. Calcul de la moyenne et de l'écart-type


Pour analyser les données, nous devons d'abord calculer deux statistiques clés : la moyenne (𝑋) et
l'écart-type (𝜎). Ces calculs nécessitent l'utilisation des formules statistiques appropriées pour les
données pondérées par leurs fréquences.

7
Étape 1 : Calcul de la moyenne

La moyenne (𝑋) est calculée en utilisant la formule suivante :

où :

 𝑋𝑖 représente chaque valeur unique de la variable aléatoire 𝑋X,


 𝑛𝑖 représente la fréquence de chaque valeur 𝑋𝑖Xi,
 ∑(𝑋𝑖⋅𝑛𝑖)∑(Xi⋅ni) est la somme des produits des valeurs et de leurs fréquences,
 ∑𝑛𝑖∑ni est la somme totale des fréquences.

Calcul détaillé :

∑(𝑋𝑖⋅𝑛𝑖)=(0,57*14)+(1*27)+(5*35)+(5,2*37)+(5,7*43)+(6*49)+(6,5*44)+(6,4*38)+(0,77*32)+(0,51*26)+
(0,52*15)=1516,3

∑(Xi⋅ni)=(0,57*14)+(1*27)+(5*35)+(5,2*37)+(5,7*43)+(6*49)+(6,5*44)+(6,4*38)+(0,77*32)+(0,51*26)+
(0,52*15)=1516,38

∑𝑛𝑖=14+27+35+37+43+49+44+38+32+26+15=360

∑ni=14+27+35+37+43+49+44+38+32+26+15=360

Ainsi, la moyenne est :

 Calcul de l'écart-type

L'écart-type (𝜎) est calculé en utilisant la formule suivante :

8
où :

 𝑋𝑖 : représente chaque valeur unique de la variable aléatoire 𝑋,


 𝑋 : est la moyenne des valeurs,
 𝑛𝑖 : représente la fréquence de chaque valeur 𝑋𝑖,
 ∑𝑛𝑖(𝑋𝑖−𝑋) ^2 est la somme des produits des fréquences et des carrés des écarts par rapport à la
moyenne,
 ∑𝑛𝑖 est la somme totale des fréquences.

Calcul détaillé des écarts au carré et de leur somme :

Ainsi, l'écart-type est :

Ces calculs de la moyenne et de l'écart-type constituent la base de l'application du test de


Kolmogorov-Smirnov pour évaluer la normalité des données.

9
4. Réalisation de Test Kolmogorov-Smirnov sur Exécution
en Programmation VBA

Dans cette section, nous décrivons comment automatiser les calculs et l'application du test
de Kolmogorov-Smirnov en utilisant VBA (Visual Basic for Applications) dans Excel.
L'utilisation de VBA permet de simplifier et d'accélérer le processus, rendant l'analyse des
données plus efficace.

Étape 1 : Étendre les données selon leurs fréquences

La première étape consiste à étendre les données en répétant chaque valeur 𝑋X selon sa
fréquence 𝑛n. Cela permet de créer un ensemble de données complet à partir des valeurs et
de leurs fréquences, facilitant ainsi les calculs ultérieurs.

Code VBA pour étendre les données :

10
Étape 2 : Calculer la moyenne

Une fois les données étendues, nous pouvons calculer la moyenne en utilisant la formule
suivante :

Code VBA pour calculer la moyenne :

11
Étape 3 : Calculer l'écart-type

Code VBA pour calculer l'écart-type

12
Étape 4 : Appliquer le test de Kolmogorov-Smirnov

Pour appliquer le test de Kolmogorov-Smirnov, nous comparons la distribution cumulative


empirique des données étendues avec la distribution cumulative théorique d'une loi normale.
Nous calculons la statistique D en prenant la distance maximale entre ces deux distributions.

Code VBA pour appliquer le test de Kolmogorov-Smirnov :

13
14
Ce code VBA réalise les étapes suivantes :

1. Étend les données selon leurs fréquences.


2. Calcule la moyenne et l'écart-type des données étendues.
3. Trie les données étendues.
4. Calcule les distributions cumulatives observées et attendues.
5. Calcule la statistique D en prenant la différence maximale entre les distributions
cumulatives observées et attendues.
6. Affiche les résultats de la moyenne, de l'écart-type et de la statistique D.

15
5. Tutoriel

Dans cette section, nous fournirons un guide détaillé pour réaliser le projet en utilisant
VBA dans Excel, ainsi que le code VBA utilisé pour automatiser les calculs et
l'application du test de Kolmogorov-Smirnov.

Guide détaillé pour réaliser le projet en VBA

Étape 1 : Préparation des données

1. Organisez vos données :


 Ouvrez Excel et entrez vos données dans deux colonnes : une pour les valeurs
X et une pour les fréquences 𝑛. Par exemple :
 Colonne A : 𝑋
 Colonne B : 𝑛
2. Étiquetez les colonnes :
 Mettez des en-têtes pour vos colonnes. Par exemple, "Valeurs" pour X et
"Fréquences" pour n.

Étape 2 : Écrire le code VBA

3. Accédez à l'éditeur VBA :


 Appuyez sur ALT + F11 pour ouvrir l'éditeur VBA.
4. Insérez un nouveau module :
 Allez dans Insert > Module pour créer un nouveau module.
5. Copiez et collez le code VBA :
 Copiez le code VBA suivant dans le module nouvellement créé.

Étape 3 : Code VBA Utilisé

Voici le code VBA utilisé pour automatiser les calculs et l'application du test de
Kolmogorov-Smirnov : déjà donner

Étape 4 : Exécuter le code VBA

16
6. Exécutez les macros VBA :
 Retournez à Excel en fermant l'éditeur VBA.
 Appuyez sur ALT + F8 pour ouvrir la boîte de dialogue "Macro".
 Sélectionnez la macro à exécuter (par exemple, ExtendData, CalculateMean,
CalculateStdDev, ou TestKolmogorovSmirnov) et cliquez sur "Exécuter".

Chaque macro exécute une partie spécifique de l'analyse :

 ExtendData : Étend les données selon leurs fréquences.


 CalculateMean : Calcule la moyenne des données étendues.
 CalculateStdDev : Calcule l'écart-type des données étendues.
 TestKolmogorovSmirnov : Applique le test de Kolmogorov-Smirnov et affiche les
résultats.

6. Résultats et Interprétation

Résumé des résultats

Après avoir appliqué les étapes de l'analyse des données et le test de Kolmogorov-
Smirnov, nous avons obtenu les résultats suivants :

1. Moyenne (𝑋) : 4.212167


2. Écart-type (𝜎) : 2.433588
3. Statistique D : 0.310263
4. p-value : 2.805514×10−312.805514×10−31

Ces résultats ont été obtenus à l'aide de la programmation VBA dans Excel, permettant
une automatisation efficace du calcul de la moyenne, de l'écart-type, et de l'application
du test de Kolmogorov-Smirnov.

17
Interprétation des résultats

Moyenne et Écart-type :

 La moyenne des données est de 4.212167, ce qui représente la valeur centrale autour de
laquelle les données sont distribuées.
 L'écart-type de 2.433588 indique la dispersion des données autour de la moyenne. Un
écart-type plus élevé signale une plus grande variabilité dans les données.

Test de Kolmogorov-Smirnov :

 La statistique D de 0.310263 représente la distance maximale entre la distribution


cumulative empirique des données et la distribution cumulative théorique d'une loi
normale.
 La p-value associée est extrêmement faible (2.805514×10−312.805514×10−31), ce qui
signifie que la probabilité que cette distance maximale soit due au hasard est quasi
nulle.

Conclusion sur la normalité des données

L'objectif du test de Kolmogorov-Smirnov est de déterminer si les données suivent


une distribution normale. Les hypothèses du test sont les suivantes :

 Hypothèse nulle (𝐻0H0) : Les données suivent une distribution normale.


 Hypothèse alternative (𝐻𝑎Ha) : Les données ne suivent pas une distribution normale.

Les résultats obtenus montrent une statistique D élevée et une p-value extrêmement
faible. Par conséquent, nous rejetons l'hypothèse nulle avec un niveau de confiance
élevé. Cela signifie que les données ne suivent pas une distribution normale.

18
7. Conclusion

This project demonstrated the application of the Kolmogorov-Smirnov test to


assess the normality of a data set. Using VBA programming techniques in
Excel, we automated the necessary calculations, allowing the data to be
analyzed efficiently and accurately.

This project allowed us to strengthen our skills in statistics and programming,


while providing practical tools for data analysis. It highlights the importance of
checking normality assumptions in statistical analyzes to ensure the validity
and reliability of conclusions drawn.

19

Vous aimerez peut-être aussi