TP SPSS Reéchantillonnage

Télécharger au format pptx, pdf ou txt
Télécharger au format pptx, pdf ou txt
Vous êtes sur la page 1sur 34

Application des méthodes de rééchantillonnage dans SPSS

Membres du groupe: Enseignant

AGBATI Martial Prof. Epiphane SODJINOU

AGBANGBATIN Ange Rodrigue

CODJO Alexis

GNANCADJA Eric

OYATOLA sam
INTRODUCTION

Les méthodes de ré-échantillonnage sont utilisées pour réaliser des estimations lorsqu’on ne
connaît pas les lois de probabilité des variables à analyser. Ces méthodes consistent à partir
d’un échantillon initial, qui a été réellement prélevé, et à y prélever un ou plusieurs
nouveaux échantillons afin d’estimer un paramètre donné. Elles sont très performantes sont
gourmandes en temps de calcul, mais l’accroissement de la vitesse des calculateurs permet
de plus en plus fréquemment leur mise en œuvre. Au nombre de ces méthodes, nous avons :
le bootstrap, la technique de Jackknife, tests de permutations et de randomisation, la
validation croisée…Quelles sont alors les méthodes de rééchantillonnage disponible dans
SPSS ?
Echantillonnage aléatoire simple avec remise

L’échantillonnage aléatoire avec remise suit le même principe que l’échantillonnage probabiliste
sans remise, mais la différence est que, à chaque étape l’élément tiré est retourné dans l’ensemble
avant le tirage suivant. Autrement dit, au premier tirage, l’individu choisi au hasard est simplement
enregistré et retourné dans l’ensemble avant le 2ème tirage .On effectue la même opération au 2ème
tirage et on procède ainsi jusqu’au n ième tirage. Il faut donc remarquer ici qu’à chaque tirage on
dispose de N possibilités. Le nombre total d’échantillon différent de taille n que l’on peut ainsi
prélever par tirage successif avec remise à partir de N individus de la population mère est égale à N’’
qui est par définition le nombre total d’arrangement éventuellement avec répétition d’ordre n
susceptible d’être formé à partir de N individus distincts.
Comment l’appliquer dans SPSS

A partir des menus, sélectionnez :

1. Analyse > Echantillons complexes > Sélectionner un échantillon...

2. Sélectionnez Concevoir un échantillon et choisissez le nom de fichier de plan sous lequel

enregistrer le plan d'échantillonnage.

3. Cliquez sur Suivant pour poursuivre la procédure avec l'assistant.

4. A l'étape Variables du plan, vous pouvez éventuellement définir des strates, des clusters et des

pondérations d'échantillon d'entrée. Une fois ces éléments définis, cliquez sur Suivant.

5. A l'étape Méthode d'échantillonnage, vous pouvez éventuellement choisir une méthode de

sélection des éléments pour réaliser l'échantillon.


Sinon, cliquez sur Suivant, puis effectuez les opérations suivantes :

6. A l'étape Taille de l'échantillon, spécifiez le nombre ou la proportion d'unités à échantillonner.

Vous pouvez désormais cliquer sur Fin pour réaliser l'échantillon.


Les méthodes de rééchantillonnage disponible dans SPSS

Méthode Bootstrap

Le bootstrap est une méthode d'estimation de la distribution d'échantillonnage


fondée sur le prélèvement de plusieurs échantillons avec remise à partir d'un
échantillon unique. On appelle ces échantillons répétés des rééchantillonnages.
Chaque rééchantillonnage est de la même taille que l'échantillon d'origine.
Son application dans SPSS
Analyse > Analyse descriptive > Boostrap
Technique de Jackknife

Méthode qui consiste à renouveler une analyse statistique au cours de laquelle on omet de considérer
à chaque fois l’une des observations. Ainsi, elle permet notamment de détecter l’élément parasitaire
qui aurait une influence anormalement importante sur les résultats. Elle est particulièrement utile
lorsque l’on ne dispose que d’un petit nombre d’observations. On utilise parfois le terme de «
méthode du canif. »
Validation croisée

La validation croisée consiste à fractionner l'échantillon en plusieurs sous-échantillons ou niveaux. Les


arbres sont générés en excluant à tour de rôle les données de chaque sous-échantillon. Le premier arbre
est basé sur toutes les observations excepté celles du premier sous-échantillon, le deuxième arbre est
basé sur toutes les observations excepté celles du deuxième sous-échantillon, etc. Le risque de mauvaise
réaffectation est estimé pour chaque arbre en appliquant l'arbre au sous-échantillon exclu lors de la
génération de l'arbre

Dans SPSS:
A partir des menus, sélectionner:
Analyse - Classification - Arbre
Dans la boite de dialogue validation, sélectionner validation croisée.
Randomisation

Les tests de randomisation sont une autre méthode non-paramétrique basée sur le ré-échantillonnage.
Ces tests visent à approximer la distribution d'une statistique dans le cas où une certaine hypothèse
nulle (ex.: indépendance entre deux variables) est vraie.

Sous SPSS :

Analyse > Modèle linéaire généralisé > Univarié/ Bivarié


CONCLUSION
Le rééchantillonnage est un processus couramment utilisé en
statistiques et en analyse de données pour modifier la fréquence ou la
résolution des données. Il peut être utilisé pour agrandir ou réduire un
échantillon de données, ajuster la fréquence d'échantillonnage
temporel, ou encore équilibrer un jeu de données déséquilibré. Il existe
plusieurs méthodes de rééchantillonnage dont le bootstrap, la
technique de Jackknife, tests de permutations et de randomisation, la
validation croisée. Chacune des ces méthodes a ses propres avantages et
inconvénients en fonction de l'objectif de l'analyse

Vous aimerez peut-être aussi