Analyse Spatiale L2 - 2014 - 2

RÉPUBLIQUE DU TCHAD UNITÉ - TRAVAIL -
‫جمهوريــــة تشــــاد‬
*********** PROGRÈS *********
PRÉSIDENCE DE LA RÉPUBLIQUE *********
‫رئاســـة الجمهورية‬
*********** – ‫وحـدة – عمـل‬ *********
PRIMATURE ‫تقـدم‬ ‫رئاســـــــة الوزراء‬
******** *********
MINISTÈRE DE L’ENSEIGNEMENT SUPÉRIEUR ‫ البحـــث العلمـــي‬،‫وزارة التعليــم العالـي‬
************
SECRÉTARIAT GENERAL ‫والتكويــن المهنــي‬
**********
***********
UNIVERSITÉ DE MOUNDOU ‫أمانــــة‬
*********
***********
FACULTÉ DES ARTS, LETTRES ET SCIENCES ‫األمانـــــة العامـــــــة‬
*********
HUMAINES
*********** ‫جامعة مند‬
DÉPARTEMENT DE GÉOGRAPHIE
************
Licence 2
ANALYSE SPATIALE :
Distribution statistique et
distribution spatiale
Chargé de Cours : RATNAN Ngadoum, Géographe-Géomaticien
2
INTRODUCTION
L’analyse spatiale renvoie à l’un des principaux emplois du terme d’espace, commun aux géographes,
aux spécialistes d’économie spatiale ou de science régionale. L’espace est ici un espace relatif,
produit, défini par les relations entre les lieux qui s’établissent du fait des interactions entre des
acteurs sociaux localisés. Ce concept est distinct des concepts plus englobant de milieu et de
territoire ou de région. L’espace qui entre dans le projet explicatif de l’analyse spatiale ne se confond
pas avec la totalité de l’interface terre/atmosphère/sociétés humaines, qui est l’objet d’étude des
géographes.
Schématiquement, par rapport à la problématique de la géographie classique qui analysait les

relations " verticales " entre des milieux naturels et des sociétés, l’analyse spatiale s’intéresse
principalement aux interactions " horizontales " entre les lieux. La spatialité serait ainsi une partie,
un sous-ensemble, de la géographicité.
Le développement de théories et de modèles spécifiques dans ce cadre s’appuie sur une position
épistémologique qui suppose d’une part une certaine autonomie du fait spatial, une spécificité de
cette composante de l’organisation de la vie sociale, et d’autre part l’existence de lois ou de règles
générales de la spatialité, qui permettent d’expliquer, dans les distributions ou les systèmes
géographiques, ce qui relève surtout de dispositions sociales, indépendamment de la variabilité des
conditions offertes par les milieux naturels. Les modèles de l’analyse spatiale peuvent résumer des
structures des systèmes géographiques, qui en décrivent les configurations stables, ce sont des
modèles statiques, ou simuler les processus de la genèse et de l’évolution de ces systèmes, il s’agit
alors de modèles dynamiques.
La position théorique générale de l'analyse spatiale consiste à proposer une explication partielle, et
des possibilités de prévision, quant à l'état et à l'évolution probable des objets/unités géographiques,
à partir de la connaissance de leur situation par rapport à d'autres objets géographiques.
Le projet de l’analyse spatiale serait ainsi d’étudier cette " spatialisation " ou mise en espace de la
surface de la terre par les sociétés humaines. A l’origine, en réaction contre une tradition
idiographique de la géographie, préoccupée d’illustrer et d’expliquer l’unicité de chaque lieu,
l’analyse spatiale s’est posée comme une approche , orientée par la recherche de modèles et de lois
générales.
3
1 - LES VALEURS CENTRALES D’UNE DISTRIBUTION SPATIALE (X ;Y)
1.1 - Point moyen

1.1.1 – Le point moyen non-pondéré
Le point moyen non pondéré est noté G(mX,mY)
Selon la propriété géométrique : est minimum si j=G
Le paramètre de dispersion associée est la distance-type δD qui est la
Le paramètre de dispersion associé est la distance-type δD qui est la racine carré de la moyenne du
carré des distances, c’est-à-dire la racine carrée de la somme des variances de X et de Y.
G est le barycentre des points, ce qui signifie qu’il minimise la somme des distances euclidiennes
élevées au carré à tous les points.
1.1.2 – Point moyen pondéré
Le point moyen pondéré est Gp (mXP,mYP)
Selon la propriété géométrique :
4
Le paramètre de dispersion associé est la distance-type pondérée δD,P qui est égale à la racine carrée
de la moyenne du car ré des distances à tous les membres de la population P. Si l’on note X,P l’écart
type de X pondéré par P et δY,P l’écart type de Y pondéré par P, on a :
G est le barycentre de la population P, ce qui signifie qu’il minimise la somme des distances
euclidiennes élevées au carrée à tous les habitants de la population P.
1.2 – Le point médian

1.2.1 – Le point médian non-pondéré
Le point médian non pondéré est le point M minimisant la somme des distances à tout point
Propriété :
est minimum si j=M
ei- ei –1
Me-ei-1
Extrémité des
ei –1 Me ei classe
Fi-1 50%
Fi Fréquences
cumulées
50% - Fi-1 Fi- Fi-1 croissantes
En isolant Me, on aboutit finalement à une définition algébrique de la médiane
(50% Fi 1)(ei ei 1)

M e ei 1 
Fi  Fi 1
Les paramètres de dispersion associés sont les quantiles D M,% de la distribution des points en fonction
de la distance au point médian.
Ex : La distance médiane DM,50% est le rayon du cercle centré sur le point M permettant de rassembler
50% des points de la distribution.
5
En distance rectilinéaire, les cordonnées de M sont [médiane(X), médiane (Y)]. En distance
euclidienne, elles ne peuvent être obtenues que par approximations successives.
1.2.2 – Point médian pondéré
Le point médian pondéré est le point MP minimisant les distances à l’ensemble de la population P.
Propriété :
est minimum si j=MP.
Les paramètres de dispersion associés sont les quantiles DM,P% de la distribution de la population en
fonction de la distance au point médian.
Ex : La distance pondérée D M,P% est le rayon du cercle centré sur le point médian M permettant de
rassembler 50% de la population P.
En distance rectiligne, les coordonnées de Mp correspondent au point de croisement des deux lignes
horizontales et verticales qui partage le plan en quatre quartiers de population égale. En distance
euclidiennes, le point médian pondéré ne peut être obtenue que par approximations successives.
Pratique :
Exemple de calcul
i Xi Yi Pi
1 10 40 500
2 60 10 200
3 70 50 100
4 80 30 100
5 90 40 100
6
- En distance euclidienne,
o Le point moyen G a pour coordonnées (62,34) avec une distance-type de 31 ;
o Le point moyen pondéré Gp a pour coordonnées (41,34) avec une distance-type
de 34,5 .
- En distance rectilinéaire
o Le point médian M a pour coordonnées (70,40) avec une distance médiane de
40 ;
o Le point médian pondéré Mp a pour coordonnées (35,40) avec une distance
médiane de 30.
1.3 – Détermination de pic de concentration d’une

distribution spatiale (points modaux)
1.3.1 – Détermination des points modaux à l’aide d’un maillage territorial
1.3.1.1 – Le cas unidimensionnel

Dans le cas d’une distribution statistique (ou d’une distribution spatiale unidimensionnelle), le
mode correspond au centre de la classe qui a la fréquence moyenne (Effectif/amplitude) la plus
élevée, c’est-à-dire à la zone de la distribution où les valeurs sont les plus concentrées. Si
l’histogramme comporte plusieurs pics séparés par des creux, la distribution est multimodale.
Figure 1 : Cas multimodal
7
1.3.1.2 – Le cas bidimensionnel
Dans le cas d'une distribution spatiale (bidimensionnelle), les classes correspondent à des unités
territoriales, l'amplitude correspond à la surface et la fréquence moyenne à la densité spatiale
(effectif/surface). Les points modaux correspondent alors aux pics de densité séparés par des
espaces moins denses.
1.3.2 – Détermination des points modaux sans maillage territorial (lissage)

Pour éviter les inconvénients liés aux différences de forme ou de taille des unités spatiales, on peut
recourir à des méthodes de lissage pour trouver les points nodaux. Ces méthodes sont très
nombreuses.
La méthode la plus simple consiste à utiliser une fenêtre mobile avec un diamètre fixé par
l'utilisateur:
8
On obtient alors une carte lissée de la densité de population dans le voisinage en corrigeant les effets
de bordure
Densité dans le voisinage = population du voisinage/surface du voisinage
Densité dans un voisinage de 10 Densité dans un voisinage de 20
20
1.3.3 - Méthode d’analyse de densité

Les méthodes d’analyse de densité permettent de déterminer les concentrations dans un espace. Les
usuels sont la densité par rapport à un point et la densité par rapport à un axe.
9
1.3.3.1 – Densité par rapport à un point
10
1.3.3.2 –Densité par rapport à un axe
11
2 – POINTS CENTRAUX ET RÉGRESSION LINÉAIRE
2.1 –Rappel de dépendance, indépendance de deux

variables
2.1.1 – In dépendance de deux variables
Deux variables sont dites indépendantes si la variation de l’un ne joue pas sur la variation de l’autre.
Le graphique présente un nuage de points dispersé dans tous les sens.
2.2.2 – Dépendance de deux variables

Deux variables sont dépendantes si la variation de l’une joue sur la variation de l’autre. Ce qui peut se
présenter par plusieurs fonctions (logarithme, exponentiel, linéaire).
Ce qui intéresse les géographes est la fonction linéaire qui permet d’y placer une droite
d’ajustement. La fonction est
2.2 – La droite de régression

Dans les cas où le diagramme de dispersion montre l'existence d'une relation linéaire, on désire
déterminer la droite qui décrira le «mieux» cette relation.
Cependant, le choix de cette droite dépend d'un critère qu'il faudra fixer. Le critère mathématique
habituel est celui des moindres carrés. Selon ce critère, on cherche à minimiser
la somme des carrés des écarts (= variance) entre les valeurs estimées et les valeurs observées de la
variable dépendante.
En formule, la droite de régression (comme toute droite) sera donnée par
où
X = la valeur de la variable indépendante
Yc = la valeur estimée (calculée) de la variable dépendante
a = l'ordonnée à l'origine, i.e. la valeur de Y c lorsque X = 0
b = la pente, i.e. la variation de Yc pour une variation d'une unité de X
12
Propriétés de la droite de régression
Par définition, la somme
est minimale.
De plus
i.e. que les écarts «positifs» sont compensés par des écarts «négatifs» équivalents
Pour calculer a et b
(attention: on prend ici la notation «pour échantillon»)
où n = le nombre de paires de valeurs observées
où = la moyenne de la variable X et = la moyenne de la variable Y
Emplacement X Y XY X2 Y2
Rue Barbe 3 100 300 9 10 000
Rue Brique 4 112 448 16 12 544
Rue Gueuse 5 150 750 25 22 500
Avenue Anse 7 210 1 470 49 44 100
Rue Elle 2 60 120 4 3 600
Chemin Sire 3 85 255 9 7 225
Chemin Soeur 2 77 154 4 5 929
26 794 3 497 116 105 898
13
2.2.1 - PRÉDICTION À L'AIDE DE LA DROITE DE RÉGRESSION
On utilise la droite de régression pour estimer la valeur de la variable dépendante
sachant une valeur (réelle ou potentielle) de la variable indépendante
Pour faire la prédiction, il s'agit simplement de substituer la valeur donnée à X

dans l'équation de régression et de calculer la valeur de Y c
Exemple
La droite obtenue par les calculs précédents est
Supposons que, lors d'un détournement de circulation, on a une augmentation du

trafic sur la Rue Gueuse; on évalue qu'il passe désormais 8 (cent) voitures.
On estime alors le nombre de litres (milliers) vendus en posant X = 8:
De même, supposons que l'on désire ouvrir une nouvelle station sur une petite rue
où il ne passe que cent voitures, donc on pose X = 1 et on calcule
Graphiquement, on a
2.2.2 - LE COEFFICIENT DE DÉTERMINATION

Objectif
Évaluer le degré d'association entre les deux variables i.e. juger de la qualité de l'ajustement des
14
points par la droite de régression. Mais en géographie et en analyse spatiale dans la plus part de cas,
ce n’est qu’une variable évolue en fonction de l’autre et non l’inverse.
Définitions
Soit
= la moyenne des valeurs de la variable dépendante
et Y* = une donnée en particulier
alors
Y* - = l'écart total
Yc - = l'écart expliqué
Y* - Yc = l'écart inexpliqué
Et pour toute Y*
En additionnant tous les écarts ainsi obtenus,

on a (suite à quelques manipulations)
Définition: le coefficient de détermination, noté ρ2 (population) ou r2 (échantillon)

est une mesure de la proportion de la variation de la variable Y
qui s'«explique» par les variations de la variable X
En formule
Exemple
X Y Yc (Yc- ) (Yc- )2 (Y- ) (Y- )2
15
3 100 93,29 -20,14 405,62 -13,43 180,36
4 112 121,49 8,06 64,96 -1,43 2,04
5 150 149,69 36,26 1 314,79 36,57 1 337,36
7 210 206,09 92,66 8 585,88 96,57 9 325,76
2 60 65,09 -48,34 2 336,76 -53,43 2 854,76
3 85 93,29 -20,14 405,62 -28,43 808,26
2 77 65,09 -48,34 2 336,76 -36,43 1 327,14
26 794 794,03 0 15 450,39 0 15 835,68
D'où
On peut aussi utiliser la formule «simplifiée»
2.2.3 - LE COEFFICIENT DE CORRÉLATION

Définition: le coefficient de corrélation (de Pearson), noté ρ ou r, est tout
simplement la racine carré du coefficient de détermination;
son signe (±) donne le sens de la relation.
En formule
On peut calculer
en décidant du signe selon le signe de la pente (b)
On peut aussi utiliser directement la formule
ou sa forme «simplifiée»
Exemple
En appliquant la dernière formule
16
et on a bien
Note
Plus la valeur de r se rapproche de ±1, plus la relation linéaire est forte,
et plus la valeur de r est voisine de 0, plus la relation linéaire est faible.
2.2.4 - INTERPRÉTATION ET LIMITES

Ne pas oublier que le coefficient de détermination donne un pourcentage
de variation (ou variance) de la variable dépendante «expliquée»
par la présence de la variable indépendante.
Cette notion de «pourcentage de variance expliquée» est fondamentale...

et reviendra dans nombre d'analyses subséquentes
malheureusement, en pratique, beaucoup de gens l'oublient.
2.2.5 - ERREURS FRÉQUENTES

° Utiliser, à tort, l'analyse de corrélation pour établir une relation de cause à effet
° Interpréter le coefficient de corrélation comme un pourcentage
° Mal interpréter le coefficient de détermination, i.e. comme un «% de cause»
° Faire des estimations, via la droite de régression, au-delà des valeurs observées
° Ne pas respecter le postulat d'indépendance des observations
etc...
17
TABLE DE MATIÈRE
Introduction...........................................................................................................................................3
1 - Les valeurs centrales d’une distribution spatiale (X ;Y).....................................................................4
1.1 - Point moyen...............................................................................................................................4
1.1.1 – Le point moyen non-pondéré.............................................................................................4
1.1.2 – Point moyen pondéré.........................................................................................................4
1.2 – Le point médian.........................................................................................................................5
1.2.1 – Le point médian non-pondéré............................................................................................5
1.2.2 – Point médian pondéré........................................................................................................5
1.3 – Détermination de pic de concentration d’une distribution spatiale (points modaux)...............6
1.3.1 – Détermination des points modaux à l’aide d’un maillage territorial..................................6
1.3.2 – Détermination des points modaux sans maillage territorial (lissage).................................8
1.3.3 - Méthode d’analyse de densité............................................................................................8
2 – Points centraux et régression linéaire............................................................................................10
2.1 –Rappel de dépendance, indépendance de deux variables........................................................10
2.1.1 – In dépendance de deux variables.....................................................................................10
2.2.2 – Dépendance de deux variables.........................................................................................10
2.2 – La droite de régression............................................................................................................10
2.2.1 - PRÉDICTION À L'AIDE DE LA DROITE DE RÉGRESSION.......................................................12
2.2.2 - LE COEFFICIENT DE DÉTERMINATION................................................................................12
2.2.3 - LE COEFFICIENT DE CORRÉLATION....................................................................................14
2.2.5 - ERREURS FRÉQUENTES......................................................................................................15
Table de matière..................................................................................................................................16
18

Analyse Spatiale L2 - 2014 - 2

Transféré par

Droits d'auteur :

Formats disponibles

Analyse Spatiale L2 - 2014 - 2

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Analyse Spatiale L2 - 2014 - 2

Transféré par

Droits d'auteur :

Formats disponibles

RÉPUBLIQUE DU TCHAD UNITÉ - TRAVAIL -

Chargé de Cours : RATNAN Ngadoum, Géographe-Géomaticien

Schématiquement, par rapport à la problématique de la géographie classique qui analysait les

1.1 - Point moyen

Selon la propriété géométrique : est minimum si j=G

Le paramètre de dispersion associée est la distance-type δD qui est la

1.1.2 – Point moyen pondéré

Le point moyen pondéré est Gp (mXP,mYP)

Selon la propriété géométrique :

1.2 – Le point médian

est minimum si j=M

En isolant Me, on aboutit finalement à une définition algébrique de la médiane

(50% Fi 1)(ei ei 1)

1.2.2 – Point médian pondéré

est minimum si j=MP.

1.3 – Détermination de pic de concentration d’une

1.3.1.1 – Le cas unidimensionnel

Figure 1 : Cas multimodal

1.3.2 – Détermination des points modaux sans maillage territorial (lissage)

Densité dans le voisinage = population du voisinage/surface du voisinage

Densité dans un voisinage de 10 Densité dans un voisinage de 20

1.3.3 - Méthode d’analyse de densité

2.1 –Rappel de dépendance, indépendance de deux

2.2.2 – Dépendance de deux variables

2.2 – La droite de régression

En formule, la droite de régression (comme toute droite) sera donnée par

où n = le nombre de paires de valeurs observées

où = la moyenne de la variable X et = la moyenne de la variable Y

Rue Barbe 3 100 300 9 10 000

Rue Brique 4 112 448 16 12 544

Rue Gueuse 5 150 750 25 22 500

Avenue Anse 7 210 1 470 49 44 100

Rue Elle 2 60 120 4 3 600

Chemin Sire 3 85 255 9 7 225

Chemin Soeur 2 77 154 4 5 929

26 794 3 497 116 105 898

Pour faire la prédiction, il s'agit simplement de substituer la valeur donnée à X

Supposons que, lors d'un détournement de circulation, on a une augmentation du

2.2.2 - LE COEFFICIENT DE DÉTERMINATION

En additionnant tous les écarts ainsi obtenus,

Définition: le coefficient de détermination, noté ρ2 (population) ou r2 (échantillon)

X Y Yc (Yc- ) (Yc- )2 (Y- ) (Y- )2

4 112 121,49 8,06 64,96 -1,43 2,04

5 150 149,69 36,26 1 314,79 36,57 1 337,36

7 210 206,09 92,66 8 585,88 96,57 9 325,76

2 60 65,09 -48,34 2 336,76 -53,43 2 854,76

3 85 93,29 -20,14 405,62 -28,43 808,26

2 77 65,09 -48,34 2 336,76 -36,43 1 327,14

26 794 794,03 0 15 450,39 0 15 835,68

On peut aussi utiliser la formule «simplifiée»

2.2.3 - LE COEFFICIENT DE CORRÉLATION

en décidant du signe selon le signe de la pente (b)

On peut aussi utiliser directement la formule

2.2.4 - INTERPRÉTATION ET LIMITES

Cette notion de «pourcentage de variance expliquée» est fondamentale...

2.2.5 - ERREURS FRÉQUENTES

° Interpréter le coefficient de corrélation comme un pourcentage

° Mal interpréter le coefficient de détermination, i.e. comme un «% de cause»

° Ne pas respecter le postulat d'indépendance des observations