AplicacionesSIG Captulo

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 20

6.

SISTEMAS DE INFORMACIÓN GEOGRÁFICA PARA


EL ANÁLISIS SOCIOECONÓMICO
Autores: Beatriz Sánchez Reyes y Coro Chasco Yrigoyen

Objetivos:

§ Conocer algunas de las principales funcionalidades que ofrecen los Sistemas


de Información Geográfica en el análisis de datos socioeconómicos.
§ Conocer las herramientas que nos permiten obtener distancias mínimas entre
capas de puntos a través de Quantum GIS
§ Conocer las herramientas que nos permiten obtener distancias mínimas entre
una capa de puntos y una de polígonos a través de Quantum GIS
§ Aprender las principales técnicas del análisis exploratorio de datos espacia-
les a través de GeoDa.
§ Conocer los distintos tipos de matrices de pesos espaciales, así como su
función en el análisis de datos.
§ Saber identificar la existencia de autocorrelación espacial global y local en
una variable.

6.1. Introducción
Los Sistemas de Información Geográfica ofrecen numerosas posibilidades en
el ámbito del análisis socioeconómico, fundamentalmente en el contexto de lo que
conocemos como econometría espacial.
Estas posibilidades pueden ser agrupadas en dos categorías, por un lado, las
que tienen que ver con el análisis exploratorio de datos espaciales (AEDE) estrecha-
mente vinculado con el concepto de econometría espacial; y por otro lado, aquellas
que nos ayudan en la generación de variables que serán utilizadas posteriormente
en modelos de regresión.
Las técnicas de análisis exploratorio espacial podríamos asimilarlas a las téc-
nicas de estadística descriptiva trasladadas al ámbito geográfico. Así, entre las
herramientas que nos permiten llevar a cabo este análisis encontramos desde la
representación de las variables en mapas hasta la construcción de estadísticos que
nos permiten conocer si los datos presentan autocorrelación espacial (relación entre
una observación y las observaciones vecinas).
En cuanto a la generación de variables, el cálculo de distancias entre distintos
elementos geográficos o la construcción de matrices de vecindad resultan de gran
utilidad al incorporarse como variables explicativas en modelos de regresión.
162 Beatriz Sánchez Reyes y Coro Chasco Yrigoyen

En este capítulo se detallarán diferentes técnicas de análisis espacial a través


de dos programas de software libre: Quantum GIS y GeoDa. En el primer epígrafe
Coordinadores
se tratará el cálculo de distancias entre los elementos de dos capas de puntos, y
entre los elementos de una capa de puntos y otra de polígonos, todo ello con Quan-
Javier Velázquez Saornil
Ana Hernando Gallego
tum GIS. En el segundo epígrafe, a través de GeoDa, se tratará de conocer si una
variable referida al ámbito municipal presenta autocorrelación espacial mediante la
utilización de diversas herramientas de análisis exploratorio de datos espaciales.

6.2. Generación de variables de distancia con Quantum GIS


En el contexto de los modelos de regresión con datos socioeconómicos, los sis-
temas de información geográfica son una herramienta fundamental en la construc-
ción de variables. En este apartado se expone cómo obtener dos variables que se
utilizarán como explicativas en un modelo de regresión de precios hedónicos. Dicho
modelo tiene como finalidad explicar los precios de la vivienda en la almendra cen-
tral del municipio de Madrid a través de una serie de variables como la superficie
de la vivienda, el número de habitaciones, la distancia a la estación de metro más
cercana o la distancia al parque más cercano, entre otras.
A través del software Quantum GIS obtendremos dos de las variables anteriores:
la distancia de cada vivienda a la estación de metro más cercana y la distancia míni-
ma de cada vivienda a un parque. Para ello partimos de tres capas de información:
la capa con los puntos en los que se ubican las viviendas, la capa relativa a las es-
taciones de metro y la capa con los parques. En las siguientes capturas de pantalla
podemos ver, en primer lugar las capas de puntos que representan a las viviendas
(en amarillo) y las estaciones de metro (en azul) y en segundo lugar la capa de po-
lígonos correspondiente a los parques.
Sistemas de información geográfica para el análisis socioeconómico 163

Coord
Javier Velá
Ana Herna

6.3.2. Distancias entre una capa de puntos y una capa de polígonos

En primer lugar, calculamos la distancia de cada vivienda al parque más cerca-


no. Para ello, en primer lugar debemos transformar la capa de parques que tene-
mos como capa vectorial, en una capa raster a través de la herramienta “v.to.rast.
value” que podemos localizar a través de la búsqueda en la caja de herramientas.
Debemos indicar cuál es la capa que queremos transformar y la ubicación en la que
queremos guardarla:
164 Beatriz Sánchez Reyes y Coro Chasco Yrigoyen

Coordinadores
Javier Velázquez Saornil
Ana Hernando Gallego

En segundo lugar, partiendo de la nueva capa de parques, generamos una capa


ráster de distancia a través de la opción “r.grow.distance”.

De esta nueva capa ráster debemos asignar a cada vivienda el punto que le co-
rresponde, que coincide con la distancia al parque más cercano. Para ello, a través
de la opción “Add raster values to points”, marcamos que la capa de puntos a la
que le queremos asignar los valores del ráster es la de viviendas y marcamos en la
opción de Interpolation “[0] Nearest neighbor”:
Sistemas de información geográfica para el análisis socioeconómico 165

Coord
Javier Velá
Ana Herna

Vemos en la siguiente captura de pantalla que en el panel de capas se nos ha


generado “d_viv_verde” como resultado de la operación anterior. Si abrimos su ta-
bla de atributos, podemos ver cómo se ha generado una columna que contiene la
variable de distancia que queríamos generar.
166 Beatriz Sánchez Reyes y Coro Chasco Yrigoyen

Coordinadores
Javier Velázquez Saornil
Ana Hernando Gallego

7.3.2. Distancias entre capas de puntos

Para hallar la mínima distancia de cada vivienda a una estación de metro nece-
sitamos obtener las distancias de la capa de viviendas a la de estaciones de metro.
Para ello utilizamos la opción de cálculo de la matriz de distancia:
Sistemas de información geográfica para el análisis socioeconómico 167

En la ventana que nos aparece a continuación tenemos que identificar la capa


de entrada (en nuestro caso la de viviendas) y la capa objetivo (en nuestro caso las
Coord
estaciones de metro), indicando en cada caso cuál es el campo identificativo de las
viviendas y estaciones respectivamente. Posteriormente indicamos el nombre del Javier Velá
Ana Herna
archivo en el que queremos que se nos guarde la matriz y damos a aceptar. La ope-
ración en este caso en el que disponemos de un gran número de puntos en ambas
capas requerirá un tiempo considerable de proceso.

Puesto que hemos marcado la opción “Matriz de distancia lineal”, obtendremos


como resultado un Excel con una matriz con N*k filas (donde N es el número de
viviendas y k el número de estaciones de metro) y 3 columnas con los identificado-
res de la vivienda, de la estación de metro y la distancia. Para generar la variable
deseada (distancia mínima a una estación de metro) basta con utilizar una tabla
dinámica en Excel que nos dé como resultado el mínimo valor de la columna de
distancias para cada vivienda.
168 Beatriz Sánchez Reyes y Coro Chasco Yrigoyen

Coordinadores
Javier Velázquez Saornil
Ana Hernando Gallego

6.3. Análisis exploratorio espacial con GeoDa


En este apartado se van a aplicar diversas técnicas de análisis exploratorio es-
pacial sobre una base de datos municipal –para todos los municipios de España– en
la que tendremos como variable de análisis la variación de la población en el perio-
do 2010-2016. El objetivo será conocer si la base de datos presenta algún tipo de
correlación en el espacio, es decir, si la variación poblacional de los municipios tiene
relación y en qué sentido con la variación poblacional de los municipios del entorno
más próximo –de los municipios vecinos–.El análisis se llevará a cabo a través del
software libre GeoDa.

6.3.2. Descarga del programa

GeoDa es un programa libre cuya principal funcionalidad es el análisis explora-


torio espacial de los datos. En muchas ocasiones en el área socioeconómica dicho
análisis exploratorio es el paso previo a la aplicación de técnicas econométricas
espaciales. Si bien GeoDa permite también realizar regresiones espaciales, para un
análisis de econometría espacial más profundo resulta de gran utilidad el programa
GeoDaSpace, también de libre descarga.
El programa se puede descargar desde la página de “The Center for Spatial Data
Science” de la Universidad de Chicago (https://spatial.uchicago.edu/).
Sistemas de información geográfica para el análisis socioeconómico 169

Coord
Javier Velá
Ana Herna

6.3.2. Representación de variables

Para la representación de variables, los mapas de polígonos de los municipios


que servirán como base de análisis se pueden descargar de la página del Instituto
Geográfico Nacional (www.ign.es), y los datos de población del Padrón Municipal de
Habitantes que publica el Instituto Nacional de Estadística en su web (www.ine.es).
Una vez se incorporan los datos de población al archivo .dbf, abrimos GeoDa y
nos aparecerá un menú de opciones:

Para abrir el archivo .shp, debemos abrir un nuevo proyecto en la pestaña “File”
y marcar la opción “ESRI Shapefile”. A continuación buscamos el archivo .shp en
nuestro ordenador.
170 Beatriz Sánchez Reyes y Coro Chasco Yrigoyen

Coordinadores
Javier Velázquez Saornil
Ana Hernando Gallego

Como análisis exploratorio inicial vamos a representar en el mapa la variable que


contiene la variación de la población en el periodo 2010-2016 y que hemos llamado
previamente “varpob”. Para ello, tal y como sucede en otros Sistemas de Informa-
ción Geográfica, disponemos de varias opciones de intervalo. Aunque según los ob-
jetivos del estudio debemos elegir una u otra opción, en este caso vamos a utilizar
la opción de cuatro intervalos iguales –con el mismo rango o recorrido–, para lo cual
vamos a la opción “Map” y dentro de ésta a “Equal Intervals Map” señalando el valor
“4”, con lo que se crearán cuatro intervalos con el mismo recorrido.
Sistemas de información geográfica para el análisis socioeconómico 171

A continuación seleccionamos la variable que queremos representar (“varpob”)


y le damos a “ok”.
Coord
Javier Velá
Ana Herna

Haciendo zoom sobre el mapa obtenemos lo siguiente:


172 Beatriz Sánchez Reyes y Coro Chasco Yrigoyen

Tal y como indica la leyenda, los colores más claros se corresponden con los
municipios con peor evolución poblacional (en el primer intervalo, todos los munici-
Coordinadores
pios pierden población en el periodo 2010-2016). Parece además que los colores
se distribuyen en el espacio siguiendo cierto patrón, es decir, hay grandes zonas de
Javier Velázquez Saornil
Ana Hernando Gallego
municipios con evoluciones poblacionales similares, lo que indicaría la existencia de
dependencia espacial entre municipios próximos o vecinos.

6.3.3. Análisis de la dependencia o autocorrelación espacial

No obstante, para un análisis más específico de la dependencia o autocorrela-


ción espacial, GeoDa ofrece otras herramientas útiles que parten de la construcción
de matrices de interacciones espaciales, o expresado de una forma más general,
de matrices de pesos espaciales. Si, como se ha mencionado anteriormente, quere-
mos conocer si existe relación entre el comportamiento de un municipio y el de sus
vecinos, lo primero que tenemos que abordar es la definición de vecindad, es decir,
cuándo consideramos que dos municipios son vecinos. En este sentido, podemos
considerar varios criterios que se detallarán más adelante. No obstante, para abor-
dar el concepto de matriz de interacciones espaciales, podemos partir de la matriz
más básica que sería una matriz de vecindad como la que se muestra en la tabla si-
guiente, en la que los valores iguales a 1 indicarían que los municipios son vecinos,
mientras que los valores iguales a 0 indicarían que los municipios no son vecinos.

  Mun 1 Mun 2 Mun 3 Mun 4 … Mun n


Mun 1 0 1 0 1 0 0
Mun 2 1 0 0 0 0 0
Mun 3 0 0 0 0 0 0
Mun 4 1 0 0 0 0 0
… 0 0 0 0 0 0
Mun n 0 0 0 0 0 0

Para crear matrices de pesos o interacciones espaciales seleccionamos la op-


ción “W” del menú y en la ventana que nos aparece seleccionamos “Create”.
Mun n 0 0 0 0 0 0

Sistemas de información geográfica para el análisis socioeconómico 173


Para crear matrices de pesos o interacciones espaciales seleccionamos la opción “W”
del menú y en la ventana que nos aparece seleccionamos “Create”.

Coord
Javier Velá
Ana Herna

A continuación podemos ver todas las opciones disponibles para crear matrices
de pesos espaciales:

Página 14 de 92

– Queen contiguity o criterio de la reina: Para crear la matriz de pesos espa-


ciales se considera que dos municipios serían vecinos según este criterio si
comparten un borde o un vértice de sus respectivos límites territoriales. Como
se ha indicado anteriormente, en la matriz W, las celdas correspondientes
174 Beatriz Sánchez Reyes y Coro Chasco Yrigoyen

a municipios vecinos tomarían el valor 1, mientras que el resto de la matriz


sería igual a 0.
Coordinadores
– Rook contiguity o criterio de la torre: En este caso dos municipios se consi-
Javier Velázquez Saornil
Ana Hernando Gallego
deran vecinos sólo si tienen bordes territoriales (pero no vértices) en común.
También en este caso las casillas de la matriz W correspondientes a munici-
pios vecinos, tomarían el valor 1, mientras que el resto de la matriz sería igual
a 0.
– Distance weight: A partir de las coordenadas XY de los centroides de los
municipios, se obtendría una matriz de distancias entre todos los municipios.
No obstante, tenemos la opción de especificar un punto de corte para de-
terminar la distancia mínima a partir de la cuál consideramos vecinos a dos
municipios.
– k-Nearest Neighbors: Con este criterio debemos especificar el número de
vecinos que queremos que tenga cada municipio, de forma que en la matriz
resultante se considerarían vecinos sólo los “K” indicados más próximos.

Si en el caso que estamos tomando como ejemplo elegimos el criterio de vecin-


dad de primer orden de la reina, al aceptar y crear la matriz de pesos espaciales
(que se guarda como un archivo con extensión *.gal), veremos la siguiente adver-
tencia que nos indica que hay municipios sin vecinos, es decir, municipios que no
tienen ningún límite territorial común con otro, como sería el caso de las Ciudades
Autónomas de Ceuta y Melilla, que no comparten límite territorial con ningún otro
municipio español.

Si quisiésemos que todos los municipios tuviesen al menos un vecino, debería-


mos acudir a otro criterio de vecindad; podríamos por ejemplo identificar la distancia
mínima a la que todos los municipios tienen al menos un vecino.
No obstante, si continuamos el análisis con el criterio seleccionado, una vez
aceptemos la advertencia anterior, nos aparecerá una ventana en la que tenemos la
opción de crear un histograma y un mapa de conectividad.
aceptemos la advertencia anterior, nos aparecerá una ventana en la que tenemos la
opción de crear un histograma y un mapa de conectividad.
No obstante, si continuamos el análisis con el criterio seleccionado, una vez
Sistemas
aceptemosde
la información geográfica
advertencia anterior, para el análisis
nos aparecerá socioeconómico
una ventana en la que tenemos175
la
opción de crear un histograma y un mapa de conectividad.

Coord
Javier Velá
Ana Herna

El histograma nos muestra la distribución de frecuencias del número de vecinos que


El El
histograma
histograma nosnos
muestra la distribución
muestra de frecuencias
la distribución de frecuenciasdel número de vecinos
del número que
de vecinos
tienen
quelos
tienen municipios
tienen de España
los municipios
los municipios con
de España
de España el criterio seleccionado.
con elseleccionado.
con el criterio Así,
criterio seleccionado. podemos
Así, podemosAsí,hacerhacer
click click
podemos
sobrehacer
alguna
sobre click de
alguna las
sobre barras
alguna
de las del histograma
barrasdedel
lashistograma y nos aparecerán
barras dely histograma
nos aparecerány nos marcados
aparecerán
marcados en mapamapa
el
en elmarcados en en
en
amarillo eltodos
mapa
amarillo en amarillo
los
todos municipios
los todosque
municipios los municipios
quetengan
tengan el que tengan
número
el número elvecinos
número
devecinos
de de vecinos selec-
seleccionados.
seleccionados. En laEn la
cionados.
siguiente En la
captura siguiente
de captura
pantalla de
podemos pantalla
ver podemos
que hay un ver
total
siguiente captura de pantalla podemos ver que hay un total de 1.748 municipios que
de hay
1.748 un total de
municipios 1.748
que que
municipios
tienen que
5 vecinos; tienen 5
siendo vecinos;
éstoslos siendo
losque éstos
que aparecen los
aparecen de que aparecen de color amarillo
de en
tienen 5 vecinos;
elderecha.
siendo
mapa de la derecha.
éstos decolor
coloramarillo en en
amarillo el mapa
el mapa lade la
derecha.

Página 16 de 92

Página 16 de 92
176 Beatriz Sánchez Reyes y Coro Chasco Yrigoyen

Si marcamos la opción “Connectivity map”, moviendo en cursor sobre el mapa


Si marcamos la opción “Connectivity map”, moviendo en cursor sobre el mapa
podemos ver el conjunto de vecinos de cada municipio:
podemos
Coordinadores ver el conjunto de vecinos de cada municipio:
Javier Velázquez Saornil
Ana Hernando Gallego

Volviendo al concepto de dependencia o autocorrelación espacial y habiendo creado


ya Volviendo al concepto
la matriz de de dependencia
pesos espaciales o autocorrelación
con el criterio espacial y podemos
indicado anteriormente, habiendo
creado
obtener el estadístico I de Moran que nos permite detectar la presencia po-
ya la matriz de pesos espaciales
1 con el criterio indicado anteriormente, de
demos obtener el
autocorrelación estadístico
espacial I de
global enMoran
1
que nos
el conjunto de permite detectar la presencia
datos. Seleccionamos de
la opción
autocorrelación espacial global en el conjunto de datos. Seleccionamos la opción
“Space” del menú y después “Univariate Moran´s I”. A continuación nos aparece una
“Space” del menú y después “Univariate Moran´s I”. A continuación nos aparece
ventana en la que tenemos que seleccionar la variable para la que queremos analizar
una ventana en la que tenemos que seleccionar la variable para la que queremos
la autocorrelación espacial (“varpob”) y la matriz de pesos espaciales que queremos
analizar la autocorrelación espacial (“varpob”) y la matriz de pesos espaciales que
tomar como
queremos base,como
tomar para lo que nos
base, paraservirá
lo quelanos
matriz creada
servirá la en los pasos
matriz previos.
creada en los pasos
previos.

1  Si bien existen otros estadísticos para la detección de autocorrelación espacial global (c de Geary, Γ
de Mantel, G(d) de Getis y Ord, empleamos la I de Moran por ser el más utilizado.

1
Si bien existen otros estadísticos para la detección de autocorrelación espacial global (c de Geary , Γ de
Sistemas de información geográfica para el análisis socioeconómico 177

Coord
Javier Velá
Ana Herna

El estadístico I de Moran es un valor estandarizado que se distribuye asintó-


ticamente como una normal de forma que –tomando un nivel de significación del
5%– cuando se calcula sobre una variable territorial como la población y obtiene
un valor superior a 1,96 quiere decir que dicha variable tiene autocorrelación global
positiva (municipios que ganan –o pierden– población estarían rodeados de muni-
cipios que ganan –o pierden– población), cuando obtiene un valor inferior a -1,96
tendremos autocorrelación global negativa en la variable (municipios que ganan
población estarían rodeados de municipios que pierden población, o al revés), y
cuando se encuentra dentro del intervalo (-1,96; 1,96) la variable tendrá ausencia de
autocorrelación global. En este caso, como podemos observar en el gráfico anterior,
el estadístico toma el valor 0,2889, lo que nos llevaría a rechazar la existencia de
autocorrelación para el ámbito global de los municipios de España.
No obstante, que no se haya detectado presencia de autocorrelación espacial
a nivel global para todo el conjunto de datos, no significa que no se dé esta cir-
cunstancia a nivel local (de hecho, en la representación de la variable “varpob” en
intervalos iguales realizada al principio del epígrafe se podía intuir la existencia de
este fenómeno). Para saber si hay autocorrelación espacial a nivel local, necesita-
mos obtener el estadístico I de Moran a nivel local. Llevamos a cabo dicho análisis
en “Space” -> “Univariate Local Moran’s I”. Nos aparecerá una ventana en la que
tenemos que marcar “Significance Map” y “Cluster Map”.
178 Beatriz Sánchez Reyes y Coro Chasco Yrigoyen

Con esta operación obtendremos los mapas LISA (Local Indicators of Spatial
Association). El LISA Significance Map que se muestra a continuación presenta los
Coordinadores
municipios en los que el estadístico I de Moran es significativo a nivel local, es decir,
en un ámbito territorial situado en un determinado radio de distancia. El nivel de sig-
Javier Velázquez Saornil
Ana Hernando Gallego
nificación estadística de la autocorrelación espacial local es mayor en los municipios
en los que el color verde es más oscuro.

Por otro lado, el LISA ClusterMap representa agrupaciones o clusters de muni-


cipios donde el nivel de autocorrelación espacial es estadísticamente significativo
a nivel local. Así, por ejemplo, los municipios que están coloreados de rojo –cluster
High-High (913), según la leyenda– son aquellos municipios que presentando va-
lores excepcionalmente altos de la variable “varpob” están rodeados de municipios
que también presentan valores excepcionalmente elevados en dicha variable. Es
decir, serían municipios que habiendo ganado mucha población en el período consi-
derado tienen a su alrededor, en un determinado radio de distancia, municipios que
también han experimentado un crecimiento poblacional excepcionalmente elevado.
En cambio, los municipios coloreados en azul claro –en total 103 según la leyen-
da– serían municipios que habiendo perdido población, de forma excepcional en el
período, están rodeados de municipios que han experimentado una ganancia media
de población excepcionalmente elevada.
Sistemas de información geográfica para el análisis socioeconómico 179

6.3.4. Histograma y diagrama de caja


Coord
Si el objetivo fuese únicamente conocer la distribución de la variable y detectar
valores atípicos, GeoDa permite representar el histograma y el diagrama de caja de Javier Velá
Ana Herna
la variable de interés a través de las opciones “Explore”-> “Histogram” y “Explore” ->
“Box Plot” respectivamente.
180 Beatriz Sánchez Reyes y Coro Chasco Yrigoyen

El histograma que se muestra a continuación nos permite conocer la distribu-


ción de la variable “varpob” de forma que podríamos concluir que gran parte de los
Coordinadores
municipios de España se encuentran en una situación de pérdida de población, de
hecho, tal y como se indica en la representación del diagrama de caja, la media de
Javier Velázquez Saornil
Ana Hernando Gallego
la variable toma el valor -6,26. El valor Q3=-0,2926 nos indicaría que un 75% de
los municipios presenta cifras de variación de la población negativas y por debajo
de -0,2926. Adicionalmente, podemos decir que todos los municipios que se sitúan
fuera de las barras señaladas, registran datos de variación de población atípicos;
es decir, fuera de los límites que podemos considerar como normales dentro del
conjunto de datos con el que trabajamos.

Coro Chasco agradece la financiación del proyecto ECO2015-65758-P


del Ministerio de Economía y Competitividad.

También podría gustarte