Clase 14 - Ejemplo de Libro de Códigos y Matriz de Datos
Clase 14 - Ejemplo de Libro de Códigos y Matriz de Datos
Clase 14 - Ejemplo de Libro de Códigos y Matriz de Datos
RELIGIOSIDAD Prácticas religiosas Asistencia a cultos ¿Con qué frecuencia asiste usted a cultos
religiosos?
- Nunca (1)
- Una vez a la semana (2)
- Más de una vez a la semana (3)
- Todos los días de la semana (4)
- No sabe (8)
- No contesta (9)
respuestas
031 Juan codificadas 4 5
Supongamos ahora que tenemos que volcar en
la Matriz una pregunta de opción múltiple
Pregunta 15 Marque las prácticas de oración que usted realiza (seleccione todas las respuestas que considere
apropiadas):
respuestas
31 Juan codificadas 4 5 1
Supongamos ahora que tenemos una pregunta
abierta…
Pregunta 16 Defina en no más de 15 palabras qué significa la palabra “Dios” para usted:
En estos casos, antes de volcar las respuestas en la matriz hay que codificar las respuestas. Es decir, crear
categorías de respuesta cerrada, donde se agrupen las respuestas dadas por los encuestados. Ayudan los
softwares de análisis de Contenido (ATLAS.ti, WordStat, MAXQDA, etc..)
- Nominales
Se consideran variables CUALITATIVAS
- Ordinales
- De intervalo Se consideran variables CUANTITATIVAS
- De razón
- Nominales: Designan la existencia de un determinado atributo en una persona, sin
especificar el valor o jerarquía que tienen los distintos valores que puede presentar
ese atributo .
- En la parte inferior:
o Indicar si es elaboración propia o si proviene de otra investigación
o Si es de elaboración propia, indicar a continuación la fuente de procedencia de los datos
(menor tamaño de letra).
o Indicar si son datos efectivamente medidos o si son estimados
o Aclarar cualquier irregularidad o ajuste que se haya realizado a los datos
PARA ELABORAR TABLAS O GRÁFRICOS es fundamental identificar cual es la
información más relevante.
Para ello es necesario tener una especialización teórica e investigativa (nos permite
“VER” los problemas)
Extraído de:Verger et al, La Privatización educativa en AL (2017). URL:
http://disde.minedu.gob.pe/bitstream/handle/MINEDU/5417/La%20privatizaci%C3%B3n%20educativa%20en%20Am%C3%A9rica%20Latina%20una%20cartograf%C3%ADa%20de%20pol%C3%ADticas%2c%20tendencias%20y%20trayectorias.pdf?sequence=
1&isAllowed=y
Otra posibilidad muy utilizada en el análisis UNIVARIABLE, mediante técnicas de la estadística
descriptiva es la elaboración de ÍNDICES.
L@s sociólog@s jugamos un papel importante como especialistas para definir cuáles deben
ser los indicadores a considerar en un índice específico.
Un gran atractivo de los ÍNDICES es que nos permiten hacer COMPARACIONES Y RANKINGS
Una cuestión importante a la hora de conformar los ÍNDICES es de qué fuentes vamos a
extraer la información que nos demandan los distintos indicadores que lo conforman:
encuestas propias, estadísticas oficiales, estadísticas privadas…CONOCER A FONDO LA
METODOLOGÍA POR LA CUAL FUE RECOPILADA ESA INFORMACIÓN!!!
El Índice de Desarrollo humano (IDH) del Programa de
las Naciones Unidas para el Desarrollo (PNUD).
Sus fuentes de información son encuesta desarrolladas por terceros, que ha sido clasificada como poco fiable
(cuál es la representatividad de la encuesta, poca transparencia de la metodología utilizada).
Transparencia internacional sólo les exige a las consultorías desarrollar una encuesta mediante escalas que
indague la percepción sobre:
• Soborno • Desvío de fondos públicos • Uso de la función pública para beneficio personal • Nepotismo en la
administración pública • Captura del Estado • La percepción de los mecanismos públicos existentes para evitar la
corrupción.
Las consultorías diseñan libremente las preguntas y otros detalles de la aplicación de las encuestas.
El segundo problema es que los datos no son comparables entre los año analizados, a causa de que la propia
organización ha ido utilizando diferentes metodologías. Esto hace que sea difícil evaluar el resultado de las
nuevas políticas llevadas a cabo por los actuales gobiernos o simplemente controlar su misma evolución.
Los autores del índice de percepción de corrupción se defienden delante de estas críticas recordando que el
índice está destinado para medir la percepción de la corrupción no la realidad
El Índice de Letalidad se estima a partir de información
estadística oficial…SOLICITADA (LAIF).
Para efectuar un Análisis estadístico, es
fundamental también distinguir cuántas
variables intervienen en nuestras hipótesis
Una sola Más de dos
Dos variables
variable variables
• Análisis • Análisis • Análisis
univariable bivariado multivariado
• Análisis • Análisis • De
estadístico- estadístico de correlaciones
descriptivo correlaciones y de
o de causalidad
causalidad
Para estimar la correlación o causalidad, es
fundamental distinguir qué tipo de variables
tenemos (se diferencian según la medición
que permiten)
Se estiman de forma INDIRECTA: primero
- Nominales se elabora una TABLA DE CONTINGENCIA,
Se consideran variables CUALITATIVAS
- Ordinales luego se aplican mediante medidas
estadísticas como la Chi cuadrado.
Si en dicha hipótesis se combina una variable cualitativa con una cuantitativa, también
corresponde realizar una tabla de contingencia para estimar el nivel de correlación. En
este caso, se debe agrupar la variable cuantitativa en rangos (Ej Edad. Rangos de 0 -15
años, de 15-69 años, más de 69 años)
I. Lo primero es distribuir cuantas personas cumplen con las características que implica cada celda.
Masculino Femenino Total
marginal
de
Columna
Preferencia 10 4 14
por la
música
Preferencia 3 7 10
por las artes
plásticas
Preferencia 2 4 6
por la
literatura
Total 15 15 30
marginal de Total
columna 100% 100% 100%
Variable independiente: Sexo
Variable dependiente: preferencias artísticas
OJO: importante que los totales marginales (fila y columna) y totales cuadren.
II. Lo segundo es calcular los porcentajes, siempre en sentido de las columnas!
Preferencia 3 7 10
por las artes 20% 47% 33%
plásticas
Preferencia 2 4 6
por la 13% 27% 20%
literatura
Total marginal 15 15 30
de columna Total
100% 100% 100%
III. Interpretar/analizar los datos
Primer nivel de análisis: Las tablas de contingencia se leen fila por fila y de derecha a izquierda, y se
interpretan los porcentajes.
Masculino Femenino Total
marginal de
Columna
Preferencia 10 4 14
por la música 67% 27% 47%
Preferencia 3 7 10
por las artes 20% 47% 33%
plásticas
Preferencia 2 4 6
por la 13% 27% 20%
literatura
Total marginal 15 15 30
de columna Total
100% 100% 100%
Ejemplo de lectura: Del total de los encuestados, 47% manifestó preferencia por la música. Fue la
manifestación artística de mayor preferencia. De los que prefieren la música, un 67% son mujeres, y
sólo un 27% hombres.
Segundo nivel de análisis: analizamos si varían los porcentajes entre las categorías de la variable
independiente (la que está en columnas).
Masculino Femenino Total marginal
de Columna
Preferencia por la 10 4 14
música 67% 27% (DIF 40%) 47
Preferencia por 3 7 10
las artes plásticas 20% 47% (DIF 27%) 33
Preferencia por la 2 4 6
literatura 13% 27 % (DIF 40%) 20
Total marginal de 15 15 30
columna Total
100% 100% 100%
A más diferencia de porcentajes en cada fila (entre las categorías de la variable en columnas), más fuerte es la
relación entre las variables.
DIF ENTRE EL 27 Y EL 40%, ES MARCADA LA OCSILACIÓN, POR TANTO, SÍ PARECE HABER INFLUENCIA DE LA VARIABLE
INDEPENDIENTE (SEXO) SOBRE LA DEPENDIENTE (LAS PREFERENCIAS ARTÍSTICAS)
Ejemplo de lectura: Como promedio, la VARIACIÓN EN LAS PREFERENCIAS POR MANIFESTACIONES ARTÍSTICAS SEGÚN EL
SEXO FUE DEL 37%, por lo tanto, estos estudios indican que las preferencias artísticas parecen estar fuertemente
influenciadas por el sexo.
La asociación captada a través de la lectura de los porcentajes
es una forma “intuitiva” de constatación, absolutamente
necesaria y relevante.
Trabajo en 3 7 10
horario de 20 47 33
oficinas
Personas 2 4 6
desempleadas 13 27 20
Total marginal de 15 15 30
columna Total
100% 100% 100%
Se pueden realizar tablas de Contingencia en
Excel, de forma sencilla, utilizando la función
Insertar → Tabla dinámica o Pivot Table
Tutoriales:
https://www.youtube.com/watch?v=awBkfxyk
1fM
https://www.youtube.com/watch?v=ccIFxxXCK
ks
Para efectuar un Análisis estadístico, es
fundamental también distinguir cuántas
variables intervienen en nuestras hipótesis
Una sola Más de dos
Dos variables
variable variables
• Análisis • Análisis • Análisis
univariable bivariado multivariado
• Análisis • Análisis • De
estadístico- estadístico de correlaciones
descriptivo correlaciones y de
o de causalidad
causalidad
ANÁLISIS DE TABLAS DE CONTINGENCIA MULTIVARIADAS + ANÁLISIS Y LOG-LINEAL
Este tipo de análisis se utiliza para cuando tenemos hipótesis multivariadas de hasta 5 variables
1) Para el análisis log-lineal, lo primero es codificar nuestras variables
2) Luego se crean modelos que suponen las distintas posibilidades de asociación entre estas variables
Modelo 1: ST, E (el salario se asocia al tipo de trabajo, la edad es independiente de ambas variables)
Modelo 2: SE, T
Modelo 4: S, T, E
Modelo 5: STE
Valores elevados de G² reflejan un mal ajuste del modelo a los datos, lo que corresponderá a un valor de
probabilidad bajo.
Modelo G² Probabilidad
Modelo 1: ST, E 2097.7 0.0000
Modelo 2: SE, T 877.1 0.0000
Modelo 3: SE, ST, TE 21.7 0.0014
Modelo 4: S, T, E 20.2 0.0011
Modelo 5: STE 36.8 0.0002
EL ANÁLISIS FACTORIAL
Trata de encontrar patrones de asociación entre las variables que no se observan pero que se
encuentran latentes en los datos recogidos sobre una población determinada.
Explicar las correlaciones entre las variables observadas (indicadores) en términos de un número
menor de variables no observadas llamadas factores (conceptos más abstractos)
Se buscó entonces una metodología de análisis que relacionara los distintos aspectos medidos
por los test daban cuenta de ciertas dimensiones comunes de la inteligencia
análisis factorial = análisis de las dimensiones (nuevas variables o factores) subyacentes a un
conjunto de información
Las dimensiones encontradas nos ayudan a definir mejor una problemática compleja, donde la
asociación de sus características no es directamente observable.
Las técnicas de análisis factorial nos permiten corroborar si la información recabada por diversos
indicadores a través de diversas técnicas, apunta a la medición de cierto rasgo común.
Si esta coincidencia se demuestra, las técnicas de análisis factorial nos permiten asociar esas
informaciones en una “dimensión" o “variables factoriales” (resultado del análisis previo, no es una
dimensión directamente medible)
Concepto de clase social
Variables originales
3- Nivel de ahorros
Dimensión
4- Inversiones realizadas en bienes raíces
Consumo
5- Estructura de gastos (básicos, intermedios,
bienes suntuarios)
Según los objetivos de investigación podemos distinguir entre:
- El Análisis Factorial Exploratorio que pretende descubrir los factores a partir de la tarea
sobre los factores subyacentes y que se somete a confirmación con los datos observados.
Por Análisis de Clasificación (cluster analysis) identificamos una serie de procedimientos cuyo objetivo es
clasificar un conjunto de individuos o unidades en grupos lo más homogéneos internamente y los más
heterogéneos o diferentes entre ellos.
A partir de ello se calculará mediante un algoritmo un patrón de similitud o distancia para ir conformando los
grupos en función de los puntajes que obtienen en las distintas variables.
Es una técnica de análisis estadístico para la construcción de TIPOLOGÍAS. En esencia nos permite combinar
diferentes indicadores y crear patrones que nos permitan clasificar ciertos fenómenos.
Se aplica por ejemplo para los estudios de zonificación urbana, de estratificación social, de niveles de
desarrollo.