Manual OpenGeoDa
Manual OpenGeoDa
Manual OpenGeoDa
Se abre la ventana, que muestra el mapa de base para los análisis, como en la
Figura 2.
La principal diferencia con las versiones anteriores es que la ventana muestra por
defecto
Figure 2: Opening window after loading the SIDS2 sample data set
Menú Herramientas
una red regular o rejilla, sobre la base de la entrada del usuario sencilla, tales
como las coordenadas
Métodos Menu
El menú de métodos sólo está disponible cuando no hay ningún archivo forma se
ha cargado en
Hay una gran diferencia entre el uso de la regresión funcionalidad a través del
menú que se muestra en la Figura 5 y a través de la regresión en el menú
principal en la Figura 3. Cuando se invoca sin un archivo de forma con los
métodos menú, el análisis de regresión lee los datos directamente desde el
archivo de dBase, sin mostrar el contenido de la tabla en la ventana. Esto evita la
sobrecarga necesaria para la vinculación y el cepillado y normalmente es la única
manera práctica de analizar grandes conjuntos de datos ( 10.000 observaciones y
más).
Figure 6: Map menu
Explore Menu
The Explore menú incluye tres nuevos elementos: el CoordinatePlot paralelo (ver
pág. 29), la dispersión 3D Plot (ver pág. 33) y el ConditionalPlot (ver p. 38), como
se muestra en la figura 8. El analysisitems de autocorrelación espacial y la tabla
se han movido a su propio menú (ver p. 12). TheExplore barra de herramientas,
figura 9, contiene los iconos para las seis funciones EDA, así como un botón para
activar los datos Table.Figure 8: explorar menuFigure 9: explorar toolbar
Figure 8: Explore menu
Table Menu
The tabla menú (Figura 10) contiene todas las operaciones en elementos de la
tabla.Figura 10: La mesa menú item11
Tenga en cuenta que los elementos del menú de la tabla son idénticos a lo que se
obtiene cuando se hace clic derecho en un
tabla activa.
Menú espacio
El menú del espacio es nuevo y los grupos de funciones para llevar a cabo el
análisis de autocorrelación espacial, como
ilustrado en la Figura 11. En versiones anteriores, estos se incluyen en el menú
Explorar. la
juego botones de la barra (Figura 12) se combinan en una barra de herramientas
acoplable separado.
49,POLYID
1,14
8.62413,14.237
8.5597,14.7424
8.80945,14.7344
...
8.6429,14.0897
8.63259,14.1706
8.62583,14.2237
2,46
...
Figure 20: Columbus shape and table from text boundary file
12
Creación de pesos espaciales
Herramientas> Pesas> Crear invoca el diálogo habitual. Hay una nueva casilla de
verificación debajo de la selección de
el orden de contigüidad, como se muestra en la Figura 21. Al seleccionar esta
opción incluye todos los menores
ordenar los vecinos hasta el orden especificado. El valor por defecto (casilla de
verificación no se controla) sólo calcula
Mayor contigüidad orden "pura", que no incluye a los vecinos de orden inferior.
13
El cálculo de los pesos distancia ahora utiliza la métrica de distancia correcta,
tanto en la interfaz de usuario
así como en el archivo de pesos resultante. Las unidades de distancia dependen
de las unidades para el coordenadas del mapa base. Cuando los puntos se
almacenan como desproyecta lat-lon grados decimales, la distancia resultante
estará en millas. Anteriormente, la distancia mostrada se reajustarán y no lo hizo
tener una interpretación significativa.
14
Figure 22: Distance cutoff in
miles
Figure 23: Distance in k near- est
neighbor weights files
Características Pesos.
Polígonos Thiessen
16
Figure 25: Bounding box option for Thiessen polygons
17
Figure 26: Default bounding box for Thiessen polygons
18
Mapping
cartograma
20
Figure 28: Circular cartogram for North Carolina Sids rates (SIDR74)
Save I ma,;Je as
Save Selected Obs.
Background Color
21
Figure 30: Outliers in Sids rate cartogram using a hinge of 3
Save Image as
Save :OelectEod
Background
22
Figure 31: Improving the layout of the cartogram
Mapa Movie
23
El Mapa de la película es un intento de proporcionar una forma simple de mapa
animación en GeoDa. es
realizada por lugares destacando según su orden para una variable dada, de baja
a
alta. Esto le da el mismo efecto que cuando un gráfico de caja se cepillado de la
parte inferior a la parte superior,
una observación a la vez. El Mapa de película se lleva a cabo ya sea en una forma
acumulativa o en un
Forma individual. En la versión acumulativa, se añaden las observaciones a un
conjunto de selección acumulativa,
que en última instancia cubre todo el mapa. En contraste, en forma individual, sólo
se muestra una ubicación
en cualquier momento.
El Mapa de películas se invoca desde el menú principal, seleccione Mapa> Mapa
Película> acumulativa, o Map> Map Movie> Single o haciendo clic en el
25
Figure 34: Pausing a cumulative map movie
28
Donotnclude lrdJde
AREA PERIMETER COLUMBUS_ COLUMBUS_! POLY10
NEIG HOVAL INC
OPEN PLUMB OISCBD X
28
•Parallel Coordinate Plot [Q)[8]
HOVAL LL -- ----
(17.90,96.40)
29
en el gráfico, se ilustra en la Figura 40. Los tres primeros
de estos son las opciones estándar para cualquier
Gráfico: guardar la imagen como un archivo de mapa de
bits, añadiendo las observaciones seleccionadas como una
variable ficticia para
la mesa, y cambiando el color de fondo. El último es a
menudo útil para una mejor visibilidad de los
observaciones seleccionadas, ya que el color de la
selección por defecto de color amarillo no es fácil de ver en
el
fondo blanco por defecto en la trama.
El pasado dos de las opciones de cinco opciones PCP no
son estándar. Que pertenecen a la escala utilizada para
los ejes horizontales. El valor predeterminado es mantener
las variables en sus escalas originales (esto no es
necesariamente una buena idea cuando las escalas son
muy diferentes). La alternativa es la de convertir la
Las variables a las unidades deviational estándar, que se
obtiene con la opción Set Estandarizar datos.
Se trata de un interruptor de palanca, por lo que uno de los
dos está siempre seleccionado. La Figura 41 ilustra la
estandarización sobre un fondo gris oscuro.
El PCP puede ser cepillado como cualquier otro gráfico.
Una selección rectangular se puede mover sobre las líneas
como en la Figura 42. Esto selecciona las observaciones a
juego en todos los otros gráficos abiertos y mapas.
30
Figure 39: PCP change vari- able order
31
•Parollcl Coordln•tc Plot ':: [D[X
• •c
' """ "
.......'
(S,OU:))
32
Figwe 42: Brushing the PCP
32
3D Gráfico de dispersión
33
Figure 43: Variable selection for 3D scatter plot
35
dimensiones, como se muestra en la Figura 46. Los puntos seleccionados
(esferas) se resaltan en amarillo.
36
Los puntos seleccionados en el gráfico de dispersión 3D se vinculan a todos los
demás
gráficos y mapas. Esto es ligeramente diferente del enfoque estándar, en el
sentido de que
la dirección de los asuntos de selección. Cuando la casilla de verificación
Seleccionar se activa en 3D
trama, los puntos seleccionados se resaltan en las otras parcelas. Sin embargo,
esto no es
continua (como en otra cepillado), pero la selección se actualiza cada vez que el
cepillo se detiene,
es decir, cada vez que el cuadro rojo en la trama deja de moverse. Esto se ilustra
en la figura
49. Alternativamente, cuando el cepillado se lleva a cabo en un mapa o un gráfico
diferente, este
invalida la casilla Seleccionar en el terreno 3D. La selección de los otros gráficos
es
resaltado en amarillo en el gráfico 3D, pero sin la caja de selección de rojo, como
se muestra enFigura 50.
37
Figure 48: Free form brushing of the 3D scatter plot
38
Figure 49: Linking between 3D scatter plot and other windows
Terreno condicional
Las parcelas condicionales son otra manera de llevar a cabo la
exploración de datos multivariados.
El principio fundamental detrás de estas parcelas es utilizar dos
acondicionado
39
variables al subconjunto de la muestra de datos en distintas
categorías. las observaciones
en cada una de estas categorías caen en un rango específico
para el acondicionamiento
variables. Un gráfico o mapa separado se extrae de una tercera
variable en cada
de los subconjuntos. Las ideas fundamentales detrás de este
enfoque se describen en
Becker et al. (1996) y Carr et al. (2002), entre otros.
En GeoDa, cada una de las variables acondicionado puede tener
tres subconjuntos,
dando un total de nueve subgrafos. Hay cuatro tipos de parcelas
condicionales son compatibles:
un mapa condicional, diagramas de caja condicionales,
histograma condicional y
gráficos de dispersión condicionales.
Las parcelas condicionales se invocan como Explora> Terreno
condicional de
En el menú, o pulsando el botón correspondiente barra de
herramientas. Esto nos lleva a una simple
diálogo para seleccionar el tipo de gráfico, como en la Figura 51.
Con el botón de opción
marcada al lado del tipo de gráfico deseado, hacer clic en
Aceptar aparecerá la selección de variables
de diálogo.
41
Figure 52: Conditional plot variable selection
42
forma de condicionamiento. El eje X es para las coordenadas X y el eje Y de las
coordenadas Y.
En otras palabras, los nueve tramas secundarias son para lugares seleccionados
que se ajustan a la gama especificada XY. este
se muestra en la Figura 54 para un mapa de coropletas del crimen variable. Tenga
en cuenta que una rampa de color continuo
se utiliza para el mapa de coropletas.
Las categorías de las variables condicionantes se pueden cambiar al mover los
controles del eje X
la derecha oa la izquierda, y en el eje Y hacia arriba o hacia abajo. Esto alterará el
número de observaciones que caen
en cada célula y por lo tanto de alta la luz cómo el patrón de la variable en
consideración los cambios en
diferentes subconjuntos de los datos. Por ejemplo, en la Figura 55, se incluyen los
barrios adicionales
en el segundo nivel de Y moviendo la Y mango inferior. Esto es más fácil de ver en
el segundo
más alta de células en el lado de la mano izquierda, que estaba vacío en la Figura
54. También, moviendo las asas a la
derecha (eje X) o hacia arriba (eje Y) se colapsa las categorías juntas. Si esto se
hace para todos los mangos,
la trama en la esquina inferior izquierda será para el conjunto completo de datos.
43
Figure 55: Moving the handles in the conditional plot
44
Figure 56: Conditional box plot
45
Figure 57: Conditional histogram
44 071)(10
2496000---
47
we me me
'" '".
.
we we we
Histograma
El histograma ahora utiliza un esquema de color diferente para las barras del
histograma. en lugar de
asignación de colores al azar, se utiliza una rampa de color continuo, como se
ilustra en la Figura 59.
Box Plot
48
CRI"'E
Interfaz de regresión
La función Regress comienza con un diálogo para establecer algunos parámetros
básicos para
los resultados y de salida, como se ilustra en la Figura 61. El Título del informe
puede
ser ignorado, el nombre del archivo de salida es el nombre del archivo de texto al
que el
51
resultados serán escritos. El valor predeterminado es Regression.OLS, que será el
nombre de archivo utilizado a menos que se especifique un nombre diferente,
incluso cuando el análisis
es un retraso o modelo de error.
Los siguientes tres artículos determinar alguna información adicional que puede
se incluirán en el archivo de salida:
• el valor predicho y Residual: tenga en cuenta que esto no es lo mismo
como la opción de guardar estos valores a la tabla de datos, sino que sólo afecta a
la
producción que figuran en el archivo de salida
• el coeficiente de varianza Matrix: tenga en cuenta que el (asintótica) norma
los errores son reportados a las estimaciones de los coeficientes; esta opción
se refiere a la matriz de varianza-covarianza completa (incluyendo las
covarianzas)
• la I de Moran valor z: el valor predeterminado es que este valor no se informó
ya que los cálculos involucrados son sustancialmente más lenta que las de los
las estadísticas del multiplicador de Lagrange (en la figura 61 esta opción ha sido
marcada).
52
Al hacer clic en el botón OK invocará el diálogo de especificación de la variable
para el modelo de regresión.
El cuadro de diálogo de selección de variables es aún rudimentaria. Utiliza los>,
>>, <y << para mover
variables de la lista desplegable para el cuadro variable dependiente y las
variables independientes
lista, como se muestra en la Figura 62.
53
de diálogo. También tenga en cuenta que el término constante se incluye por
defecto. Sólo en casos muy raros
¿tendría sentido que desmarcar la casilla correspondiente.
El proceso descrito anteriormente es la misma para los tres regresión mode-los:
primero especificar la salida
opciones, a continuación, seleccione las variables, y cerca de elegir el archivo de
ponderaciones espaciales.
54
La especificación del modelo se concluye mediante la selección de uno de los tres
botones de opción en el diálogo
y haciendo clic en Ejecutar para iniciar el análisis. Por ejemplo, para el modelo de
regresión clásico de esto es como
se muestra en la Figura 64. Tras el análisis ha terminado, hay tres opciones
importantes. El botón Guardar
(Figura 65) es añadir valor y residuos prevé que la tabla de datos (por ejemplo,
para la cartografía o
análisis exploratorio). Esto debe hacerse antes de escoger cualquier otra opción.
Haciendo clic en este
botón abre un cuadro de diálogo para seleccionar los nombres de variables de
estos dos elementos, como en la figura 66. Al hacer clic en
Aceptar terminado este proceso y las nuevas variables se agregan a la tabla de
datos (Figura 67).
Models
t+ Classic Spatial EriO!
Don
56
••••••••••••••••• • • •
S av e [
Cancel Reset OK
57
Figure 65: Saving predicted values and residuals, classic model
Figure 66: Selecting variable names for saved predicted values and residuals, classic
model
58
Figure 67: Predicted values and residuals added to table
59
Data set
Dependent Variab:'_e
Nean depends:!"!"":: vs.r
S.D. depende:!l't var
COLUMBUS
CRIME
3s.::_zcs
16. 56CS
R-zquared
Jtdjusted R squac.sd
Sum squared res::.iual:
Sigma-sqUEirS
s. E. of n:gress::.;:r. Sigma-square NL
S, E of cegressior_ I{.:;:,:
0.5524(4
0.532043
60:4. E9
l3J.!'.::9
::: 4::35
1:22.!53
1l.Qf')ij
F-st2t-:..stis
60
Frob tF- stac:isz::. -::}
28.3856
:9.34074e 009
-187.377
380.754
386.43
IlJC
HOVAL
-L-5?7311
-0,273'?315 1].1031'?37
7804?£
z.D544J9
iJ.0000183
0.0108745
:2RO:S
Jarque-Bera
61
2 0.3993663
TEST
ErEusch Pagan tEst
Koenker-Bassett test-
CF IAI/liE:
0G;J442
5.
?ROB
0.]::;._92505
0. J5BC156
TEST
Whlte
CF ViLLUE ?R03
O.:JJ12792
Gl!L
MI/DF
62
Moran's I (eru>r) J-24'?:862
Lagrange Mul'!:.iJ:.::-le:: !le;:vz1
Robust U1 1
Lagrange \ecrc:::} 1
woights)
VALUE PROB
2.9375 73 C.G033076
.7590"]71 c. 0030792
.C72:?37 C.0796429
5.8143?99 C.0158911
.7214092
. G87JS36
.0117544
63
Figure 69: Results, classic model
64
Máxima verosimilitud en el modelo de retardo espacial
65
Figure 70: Spatial regression analysis, lag model
66
Figure 71: Results, spatial lag model
67
Figure 72: Spatial regression analysis, error model
68
•Regression.OLS
REGRESSION
SUMMARY OF OUTPUT: SPATIAL ERROR MODEL - MAXIMUM LIKELIHOOD ESTIMATION Data
set COLUMBUS
Spatial Weight Dependent Variable Mean dependent var S.D. dependent var Lag coeff. (Lambda)
colrook.GAL
CRIME Number of Observations: 49
35. 128824 Number of Variables 3
16.560476 Degree of Freedom 46
0.548474
R-squared
Sq. Correlation
Sigma-square
S.E of regression
-181.894632
369.789
375.464725
Probability
69
HOVAL -0.3031981 0.09264126 -3.27282 0. 0010649
LAMBDA 0.548474 0. 1313791 4.174744 0. 0000299
REGRESSION DIAGNOSTICS
DIAGNOSTICS FOR HETEROSKEDASTICITY RANDOM COEFFICIENTS
TEST
Breusch-Pagan test
DF VALUE
2 18 10319
0
PROB
0. 0001172
PROB
0. 0009284
Bibliography
Anselin, L. (2003). GeoDa 0.9 User’s Guide. Spatial Analysis Laboratory
(SAL). Department of Agricultural and Consumer Economics, University
of Illinois, Urbana-Champaign, IL.
Anselin, L. and Bera, A. (1998). Spatial dependence in linear regression
models with an introduction to spatial econometrics. In Ullah, A. and
Giles, D. E., editors, Handbook of Applied Economic Statistics, pages 237–
289. Marcel Dekker, New York.
Becker, R. A., Cleveland, W., and Shyu, M.-J. (1996). The visual design
and control of Trellis displays. Journal of Computational and Graphical
Statistics, 5:123–155.
Carr, D. B., Chen, J., Bell, S., Pickle, L., and Zhang, Y. (2002). Interactive
linked micromap plots and dynamically conditioned choropleth maps. In
Anselin, L. and Rey, S., editors, New Tools for Spatial Data Analysis: Proceedings
of the Specialist Meeting. Center for Spatially Integrated Social
Science (CSISS), University of California, Santa Barbara. CD-ROM.
Dorling, D. (1996). Area Cartograms: Their Use and Creation. CATMOG
70
59, Institute of British Geographers.
Inselberg, A. (1985). The plane with parallel coordinates. Visual Computer,
1:69–91.
Smirnov, O. (2003). Computation of the information matrix for models of
spatial interaction. Technical report, Regional Economics Applications
Laboratory (REAL), University of Illinois, Urbana-Champaign, IL.
Smirnov, O. and Anselin, L. (2001). Fast maximum likelihood estimation
of very large spatial autoregressive models: A characteristic polynomial
approach. Computational Statistics and Data Analysis, 35:301–319.
57
Wegman, E. J. (1990). Hyperdimensional data analysis using parallel coordinates.
Journal of the American Statistical Association, 85:664–675.
58
71