Practica Nº2

CARRERA DE POSGRADO
ESPECIALIZACIÓN EN TECNOLOGÍAS DE LA INFORMACIÓN GEOGRÁFICA (TIG)
------------------------------------------------------------------------------------------------------------------------MODULO 3 – TEMA 2
ESTADÍSTICA ESPACIAL Y GEOESTADÍSTICA
-------------------------------------------------------------------------------------------------------------------------
PRACTICA Nº 2
-------------------------------------------------------------------------------------------------------------------------
ANÁLISIS EXPLORATORIO DE DATOS ESPACIALES
Ejercicio 1: Realizar el Análisis Exploratorio de Datos Espaciales.
A.) Ejecutar el software GeoDa.
Al ejecutar Geoda, sólo dos íconos están activados. Ellos son utilizados para ABRIR y CERRAR un
proyecto.
B.) Añadir capa vectorial > G:\MODULO III\TEMA 2\GEODATOS >RMS_CHILE_2014.shp
C.) Ejecutar Menú Map. Realice cuatro mapas utilizando los siguientes métodos: Cuantiles (quantile),
Percentiles (percentile), Mapa de caja (box-map) y Desvíos Estándar (Std Dev).
D.) Elija la Variable POBREZA.
Map / Quantile. Este método definirá las clases de tal manera que el número de valores en cada una
son los mismos. Seleccionar la variable y mapear con intervalos por defecto = 4, cuartiles.
Nota:
Los Cuartiles, que dividen a la distribución en cuatro partes (corresponden a los cuantiles 0,25; 0,50 y
0,75);
Los Quintiles, que dividen a la distribución en cinco partes (corresponden a los cuantiles 0,20; 0,40;
0,60 y 0,80);
Los Deciles, que dividen a la distribución en diez partes.
Ojo: La distancia interna entre los valores dentro de cada categoría no es observable en los mapas de
cuantiles.
Map / Percentile. Indica, una vez ordenados los datos de menor a mayor, el valor de la variable por
debajo del cual se encuentra un porcentaje dado de observaciones en un grupo de observaciones.
Map / Box-Map (hinge = 1.5). Se basa en la misma metodología del diagrama de caja y bigotes,
que pueden ser utilizados para detectar valores atípicos en un sentido más estricto. Los valores del
grupo mapas Box como recuentos o tasas en seis categorías fijas: Cuatro cuartiles (1-25%, 25-50%,
50-75% y 75-100%), además de dos categorías de valores atípicos en el extremo de baja y alta de la
distribución.
Los valores se clasifican como valores atípicos si son 1. 5 veces mayor que el rango intercuartil, que es
la diferencia entre el percentil 75 (Q3) y el percentil 25 (Q1) o Q3-Q1.
Map / Std Dev. Distancia de un valor en relación al valor central o la media. Útil para reconocer los
valores sobre y bajo la desviación estándar.
E.) Visualizar conjuntamente los cuatro mapas realizados:
F.) Responder las siguientes preguntas:
¿Cuántas unidades espaciales quedan incluidas en cada área?
¿Qué tipo de representación le permite conocer dónde se ubican la mayoría de las unidades espaciales
que tienen un valor de POBREZA por debajo de la media?
Tarea en clases:
Realice el mismo procedimiento para las variables:
INGRESO (Ingreso Monetario del Hogar).
REPRUEBA (% de estudiantes que reprueba en la educación obligatoria).
EMZADO (% de Embarazo Adolescente).
SUICID (% de Suicidios en el total de defunciones)
Ejercicio 2: Realizar el Análisis Exploratorio de Datos Espaciales.
A.) Ejecutar el software GeoDa.
Al ejecutar Geoda, sólo dos íconos están activados. Ellos son utilizados para ABRIR y CERRAR un
proyecto.
B.) Añadir capa vectorial > G:\MODULO III\TEMA 2\GEODATOS >RMS_CHILE_2014.shp
C.) Ejecutar Menú Explore.
Accediendo al menú de exploración (explore) se tendrá la posibilidad de realizar diversos
procedimientos de Análisis Exploratorio de Datos Espaciales. El protocolo metodológico definido para el
análisis de las desigualdades territoriales, sugiere la utilización de tres de ellos: Histogram (histograma
de frecuencias) y Box-Plot (diagrama de caja) para el análisis de una única variable, y Scatter Plot
(diagrama de dispersión) para el análisis entre dos variables.
D.) Elija la Variable POBREZA.
E.) Explore > Histogram
Cuando se accede a Histogram se debe seleccionar sobre que variable se quiere trabajar. Cada una de
las barras del histograma (por defecto son 7, pero haciendo click con el botón derecho del mouse se
pueden definir los intervalos), presenta un color y es posible realizar una selección en el histograma
para ver sobre el mapa las observaciones a las que corresponde.
En la figura, en donde se han seleccionado las 2 barras del histograma de frecuencias con mayor
porcentaje de POBREZA (en amarillo), de forma que quedan destacados en el mapa los municipio de la
Región Metropolitana que corresponde.
F.) Explore > Box-Plot
Cuando se accede a Box-Plot aparece el diagrama de caja, que es un gráfico representativo de las
distribuciones de un conjunto de datos en cuya construcción se usan cinco medidas descriptivas de los
mismos, a saber: mediana, primer cuartil, tercer cuartil, valor máximo y valor mínimo, en los cuales es
posible identificar la ubicación de las unidades espaciales en cada cuartel y los datos extremos
(outliers). Al igual que en el ejercicio anterior, se pueden explorar diferentes sectores del gráfico para
ir describiendo las correspondientes configuraciones espaciales.
En la figura, donde se han seleccionado las unidades espaciales que corresponden al 25% inferior de
POBREZA.
G.) Explore > Scatter Plot
Cuando se accede a Scatter Plot se debe seleccionar sobre que variables se quiere realizar la
exploración en la búsqueda de la asociación espacial. En el protocolo metodológico se definió la
siguiente opción: año inicial en el eje X y su variación absoluta en la década en el eje Y. Una vez
realizado el diagrama de dispersión, se pueden presentar las siguientes correlaciones:
Correlación Alta Positiva: El valor de la variable "Y" (eje vertical) aumenta claramente con el valor
de la variable "X" (eje horizontal).
Correlación Alta Negativa: El valor de "Y" disminuye claramente cuando "X" aumenta.
Correlación Baja Positiva: El valor de la variable "Y" (eje vertical) tiende a aumentar cuando
aumenta el valor de la variable "X" (eje horizontal)
Correlación Baja Negativa: El valor de "Y" tiende a disminuir cuando aumenta el valor de "X".
Elegir variables POBREZA Y EMZADO (Embarazo Adolescente)
Responder:
- Cual es el sentido de la relación entre ambas variables
- Que intensidad tiene la relación
Tarea en clases:
Realice el mismo procedimiento para las variables:
INGRESO (Ingreso Monetario del Hogar).
REPRUEBA (% de estudiantes que reprueba en la educación obligatoria).
EMZADO (% de Embarazo Adolescente).
SUICID (% de Suicidios en el total de defunciones)