TP SPSS Reéchantillonnage
TP SPSS Reéchantillonnage
TP SPSS Reéchantillonnage
CODJO Alexis
GNANCADJA Eric
OYATOLA sam
INTRODUCTION
Les méthodes de ré-échantillonnage sont utilisées pour réaliser des estimations lorsqu’on ne
connaît pas les lois de probabilité des variables à analyser. Ces méthodes consistent à partir
d’un échantillon initial, qui a été réellement prélevé, et à y prélever un ou plusieurs
nouveaux échantillons afin d’estimer un paramètre donné. Elles sont très performantes sont
gourmandes en temps de calcul, mais l’accroissement de la vitesse des calculateurs permet
de plus en plus fréquemment leur mise en œuvre. Au nombre de ces méthodes, nous avons :
le bootstrap, la technique de Jackknife, tests de permutations et de randomisation, la
validation croisée…Quelles sont alors les méthodes de rééchantillonnage disponible dans
SPSS ?
Echantillonnage aléatoire simple avec remise
L’échantillonnage aléatoire avec remise suit le même principe que l’échantillonnage probabiliste
sans remise, mais la différence est que, à chaque étape l’élément tiré est retourné dans l’ensemble
avant le tirage suivant. Autrement dit, au premier tirage, l’individu choisi au hasard est simplement
enregistré et retourné dans l’ensemble avant le 2ème tirage .On effectue la même opération au 2ème
tirage et on procède ainsi jusqu’au n ième tirage. Il faut donc remarquer ici qu’à chaque tirage on
dispose de N possibilités. Le nombre total d’échantillon différent de taille n que l’on peut ainsi
prélever par tirage successif avec remise à partir de N individus de la population mère est égale à N’’
qui est par définition le nombre total d’arrangement éventuellement avec répétition d’ordre n
susceptible d’être formé à partir de N individus distincts.
Comment l’appliquer dans SPSS
4. A l'étape Variables du plan, vous pouvez éventuellement définir des strates, des clusters et des
pondérations d'échantillon d'entrée. Une fois ces éléments définis, cliquez sur Suivant.
Méthode Bootstrap
Méthode qui consiste à renouveler une analyse statistique au cours de laquelle on omet de considérer
à chaque fois l’une des observations. Ainsi, elle permet notamment de détecter l’élément parasitaire
qui aurait une influence anormalement importante sur les résultats. Elle est particulièrement utile
lorsque l’on ne dispose que d’un petit nombre d’observations. On utilise parfois le terme de «
méthode du canif. »
Validation croisée
Dans SPSS:
A partir des menus, sélectionner:
Analyse - Classification - Arbre
Dans la boite de dialogue validation, sélectionner validation croisée.
Randomisation
Les tests de randomisation sont une autre méthode non-paramétrique basée sur le ré-échantillonnage.
Ces tests visent à approximer la distribution d'une statistique dans le cas où une certaine hypothèse
nulle (ex.: indépendance entre deux variables) est vraie.
Sous SPSS :