Analisis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

MÓDULO 4: ANÁLISIS DE LA INFORMACIÓN 25

Módulo 4
Análisis
de la información
El análisis de la información en el proceso investigativo, depende del
enfoque y del tipo de investigación que se haya seleccionado, como tam-
bién de los objetivos que se hayan planteado.

La estadística se constituye en una herramienta fundamental para el


análisis de la información. Sin embargo es necesario precisar y seleccio-
nar el tratamiento estadístico dependiendo del enfoque cuantitativo o cua-
litativo, de la escala de medición de las variables, de las hipótesis y de los
objetivos.

La estadística es fundamental para resolver problemas de descripción


de datos, análisis de muestras, contrastación de hipótesis, medición de
relaciones y predicciones.

1. NATURALEZA DE LA ESTADÍSTICA
La estadística es una rama de la ciencia, encargada del diseño y apli-
cación de métodos para recolectar, organizar, analizar y hacer deduccio-
nes a partir de ellos.

Aunque los orígenes de la estadística se remontan a los estudios de


los juegos de azar del siglo XVIII, sólo en los últimos 60 años se han desa-
26 SERIE: APRENDER A INVESTIGAR

rrollado las aplicaciones de los métodos estadísticos en casi todos los


campos de la ciencia (social, comportamental y física). La mayor parte de
las primeras aplicaciones de la estadística consistieron principalmente en
la presentación de datos en forma de tablas y gráficas. Este campo se
desarrolló con rapidez llegando a incluir gran variedad de métodos para
ordenar, resumir y expresar en alguna forma las características de un con-
junto de números. Hoy estas técnicas cubren lo que es sin duda la más
visible aplicación de la estadística: la masa de información cuantitativa
que se recopila y se publica todos los días en nuestra sociedad. Las tasas
de natalidad, de mortalidad, los índices de precios, los promedios de go-
les obtenidos en las fechas semanales de fútbol, son algunas de las mu-
chas «estadísticas» que nos resultan familiares.

Además de expresar las características de la información cuantifica-


ba, estas medidas proporcionan una base importante para el análisis en
casi todas las disciplinas académicas, especialmente en las ciencias so-
ciales y del comportamiento, donde la conducta humana no puede gene-
ralmente ser descrita con la precisión que se consigue en las ciencias
exactas. Las medidas estadísticas de satisfacción, inteligencia, aptitud
para el trabajo y capacidad de liderazgo, que sirven para ampliar nuestro
conocimiento de las motivaciones y del rendimiento humano, son ejem-
plos de lo dicho. Del mismo modo, los índices de precios, productividad,
producto nacional bruto, empleo, reservas disponibles y exportaciones son
elementos útiles tanto para el gerente como para el gobernante cuando se
trata de trazar una política encaminada a lograr el desarrollo y la estabili-
dad económica a largo plazo.

La estadística proporciona una metodología para evaluar y juzgar las


discrepancias entre la realidad y la teoría. Además de su papel instrumen-
tal, el estudio de la estadística es importante para entender las posibilida-
des y limitaciones de la investigación experimental, para diferenciar las
conclusiones que pueden obtenerse de los datos de aquellas que carecen
de base empírica y en definitiva para desarrollar un pensamiento crítico y
antidogmático ante la realidad.

En la actualidad con la ayuda de la informática y la tecnología el trata-


miento estadístico de la información se hace más sencillo.

Para el análisis de datos cuantitativos, tenemos en la actualidad progra-


mas como el SAS, SPSS, MINITAB, SVSTAT, RESAMPLING, STATGRA-
PHIS. Para el análisis de datos cualitativos existen programas como el
QUALPRO, ETHNOGRAPH, NUDIST, AQUAD.
MÓDULO 4: ANÁLISIS DE LA INFORMACIÓN 27

2. DIVISIÓN DE LA ESTADÍSTICA
La estadística se divide en dos grandes ramas, dependiendo del méto-
do empleado para manejar la información y hacer que tenga sentido: esta-
dística descriptiva y estadística inferencial.

Población

Muestra
Estadística inferencial
Estadística K
descriptiva
K

Gráfica 1.

2.1 Estadística descriptiva. Permite describir resumir y analizar la


información obtenida de la muestra.

Para tal fin se recolecta la información, se tabula, se grafica y en mu-


chos casos en vez de trabajar con todas las observaciones, es preferible
tener unas medidas que resuman los datos.

Básicamente hay tres tipos de medidas de resumen: medidas de ten-


dencia central, medidas de dispersión o variabilidad de los datos y medi-
das de ubicación.

La gráfica 1 se interpreta así: con los datos de la muestra se aplica la


estadística descriptiva; con los resultados de la estadística descriptiva se
hacen análisis de estadística inferencial referidos a la población.
28 SERIE: APRENDER A INVESTIGAR

MAPA CONCEPTUAL DE ESTADÍSTICA DESCRIPTIVA

TABLAS DE FRECUENCIAS
TABULACIÓN
TABLAS DE CONTINGENCIA

PUNTOS
GRÁFICAS O LÍNEAS
DIAGRAMAS BARRAS HISTOGRAMAS
CÍRCULO
CAJA

MEDIA
MEDIDAS DE MEDIANA
TENDENCIA MODA
CENTRAL MEDIA GEOMÉTRICA

RANGO
MEDIDAS MEDIDAS DE DESVIACIÓN ESTÁNDAR
DE DISPERSIÓN VARIANZA
RESUMEN ÍNDICE DE DISPERSIÓN
CATEGÓRICO

CUARTILES
MEDIDAS DE QUINTILES
UBICACIÓN DECILES
PERCENTILES
MÓDULO 4: ANÁLISIS DE LA INFORMACIÓN 29

2.1.1 Descripción de datos, técnicas de representación gráfica

El concepto de la descripción está asociada a la distribución de fre-


cuencias, que consiste en el ordenamiento o clasificación de los valores
observados en una variable, de acuerdo con su magnitud numérica. Per-
mite al investigador identificar la forma como ciertos puntos o caracterís-
ticas están distribuidos.

La distribución de frecuencia se puede construir a partir de variables


medidas a cualquier nivel, desde nominal hasta de razón.

Podríamos suponer que queremos ver cuántos productores agrícolas


en una vereda son grandes, medianos o pequeños productores.

Entrevistamos a los productores de la vereda y les preguntamos la


extensión de su explotación y la clasificamos de acuerdo con el tamaño
(magnitud) en una de las tres categorías.

Se construye la distribución de frecuencias que muestre cuántos pro-


ductores son grandes, cuántos medianos y cuántos pequeños. El recuen-
to será:

Tabla 1 - Tipo de productor agrícola

Tipo de productor Frecuencia

Pequeño 7
Mediano 12
Grande 9
Total 28

En el cuadro sólo se ha agrupado el número de agricultores pertene-


cientes a cada categoría. El número de agricultores se denomina obser-
vaciones o frecuencia (f).

Para el caso de variables medidas a nivel intervalo o de razón, pode-


mos hacer exactamente el mismo ejercicio.

Si se tiene, por ejemplo, la información acerca del número de cajas de


madera que construyen al día unos carpinteros en un taller, podríamos
clasificarlos por su productividad.
30 SERIE: APRENDER A INVESTIGAR

Tabla 2 - Número de cajas construidas por 15 carpinteros

N° de cajas
Carpinteros construidas

1 11
2 10
3 8
4 12
5 12
6 10
7 7
8 8
9 10
10 11
11 10
12 9
13 9
14 10
15 11

A partir de esta información podemos aclarar aún más la naturaleza de


la producción por carpintero y se podría entrar a comparar esta productivi-
dad con la de otro tipo de taller o fábrica.

En la tabla 3 introducimos un mayor significado y ordenamiento a la


información que se está analizando.

Tabla 3 - Número de cajas construidas por 15 carpinteros

Nº de carpinteros
Nº de cajas que construyen X F
construidas Nº de cajas

7 I 1
8 II 2
9 II 2
10 5
11 III 3
12 II 2

Hasta ahora los ordenamientos que se han hecho son bastante simples,
pero en la vida real muchas veces la información analizada es más compleja
y la distribución de frecuencias debe ser construida a partir de un mayor
número de puntajes.
MÓDULO 4: ANÁLISIS DE LA INFORMACIÓN 31

2.1.2 Distribuciones de frecuencias

La distribución de frecuencias es un método para organizar y resumir


datos. Bajo este método los datos que componen una serie, se clasifican
y ordenan, indicándose el número de veces en que se repite cada valor.

Los caracteres de los elementos de una población pueden ser: cualita-


tivos y cuantitativos.

Los datos cualitativos, denominados también atributos, son todos aque-


llos fenómenos que pueden ser descritos cualitativamente, es decir me-
diante palabras; son ejemplos de atributos: la clasificación de los alum-
nos de una universidad por departamento de origen, clasificación de un
grupo de personas por ocupación, por sexo, por cargo, etc.

Los caracteres cuantitativos, denominados variables, son todos aque-


llos fenómenos susceptibles de ser expresados cuantitativamente, es decir
mediante números. Por ejemplo: peso, estatura, edad, número de hijos,
salarios, etc.

Las variables se dividen en: discretas y continuas, teniendo en cuenta


que ésta clasificación tiene más valor teórico que práctico.

Las variables discretas son aquellas que admiten solamente valores


enteros, es decir no tienen valores intermedios; por ejemplo el número de
hijos por familia, ya que no se puede decir que una familia tiene dos hijos
y medio.

Las variables continuas, son aquellas que admiten valores fraccionar-


los, pudiéndose establecer intervalos. Por ejemplo, la estatura de una per-
sona que mide un metro con setenta centímetros, que pesa sesenta kilos,
una libra y cuatro onzas, etc.

2.1.3 Elaboración de una tabla de frecuencias

Tomemos como ejemplo una muestra de 20 alumnos, determinando


su peso en kilos; para facilitar el trabajo redondeamos las cifras.

X1 = 74 X5 = 69 X9 = 47 X13 = 65 X17 = 76
X2 = 67 X6 = 61 X10 = 85 X14 = 88 X18 = 57
X3 = 94 X7 = 71 X11 = 82 X15 = 52 X19 = 72
X4 = 70 X8 = 79 X12 = 55 X16 = 58 X20 = 66
32 SERIE: APRENDER A INVESTIGAR

El primer paso a seguir consiste en determinar el valor máximo y el


mínimo.

En el ejemplo tenemos:

Xmáximo = 94; Xmínimo = 47

La diferencia entre el valor máximo y el mínimo se denomina recorrido


o rango.

94 - 47 = 47

El rango, será entonces de 47.

Introducimos dos nuevos símbolos que son:

m = número de intervalos (o clase de la distribución)

c = amplitud de intervalo (o de clase de la distribución)

El valor de m, o sea, el número de intervalos se puede obtener me-


diante la siguiente fórmula:

m = 1 + 3.3 log n , donde n es el número de datos

Es de anotar que la anterior fórmula es poco conocida, por consiguien-


te, es poco usual. Sin embargo, se recomienda que el número de interva-
los, hasta donde sea posible, no sea menor de 5 ni mayor de 16.

Para el cálculo de amplitud del intervalo se puede aplicar la siguiente


fórmula:

Xmax. - Xmin. o sea rango


C= C=
m m

En el caso de nuestro ejemplo, el número de intervalos será:

m = 1 + 3.3 log2O de donde m = 1 + 3.3,x 1,30

m = 1 + 4,29

m = 5.29 ≅ 5 intervalos.
MÓDULO 4: ANÁLISIS DE LA INFORMACIÓN 33

La amplitud del intervalo de clase será:

Rango R =47

Número de intervalos m = 5

R 47
C= de donde C= = 9.4
m 5

Redondeando y para mejor manejo de los datos, se puede considerar


que la amplitud del intervalo sea de 9.

La tabla de frecuencias nos quedará en la siguiente forma,

Tabla 4 - Distribución de frecuencias del peso de 20 alumnos

Peso Frecuencias (f) Frecuencia Relativa Fr

46 - 55 3 3/20 = 0.15 = 15%


56 - 65 4 4/20 = 0.20 = 20%
66 - 75 7 7/20 = 0.35 = 35%
76 - 85 4 4/20 = 0.20 = 20%
86 - 95 2 2/20 = 0.10 = 10%
Total 20 20/20 = 1 = 100%

Frecuencia relativa (Fr)

Es su frecuencia dividida por el total de datos y se expresa general-


mente como un porcentaje:

f
__
Fr =
n

2.1.4 Presentación gráfica

Aunque las tablas sean ya el resultado de una concentración de datos,


pueden ser, sin embargo, demasiado amplias y complejas, de modo que
pierden una buena parte de lo que debería ser su cualidad primordial, la
claridad.

Entonces, podemos recurrir a la presentación gráfica, para la mejor


comprensión y análisis de los datos. En las variables discretas se hace la
representación mediante diagramas de frecuencias; para ello, en el eje hori-
34 SERIE: APRENDER A INVESTIGAR

zontal, se colocan los distintos valores de las frecuencias absolutas o rela-


tivas. Si la representación se refiere a las frecuencias absolutas o relativas
acumuladas se denomina: Diagrama de frecuencias acumuladas, colocán-
dose los valores de la variable en el eje horizontal y las frecuencias Fr, en el
vertical.

2.1.4.1 Histogramas y polígonos de frecuencias

Una distribución de frecuencias, se puede describir por medio de histo-


gramas de frecuencias, que son gráficos que representan la información
contenida en una distribución de frecuencias.

El ejemplo de la tabla 4, sobre el peso de los alumnos, se puede pre-


sentar en un histograma que representa exactamente lo mismo.

Gráfica 1.
Peso en kilos de 20 alumnos de un colegio

Otra manera de describir la distribución de la información obtenida, es


por medio del polígono de frecuencias.

Estos son gráficos en la forma de una serie de líneas rectas conecta-


das entre sí y que unen puntos medios de intervalos a lo largo del eje
horizontal.

El caso del peso de los alumnos, puede servirnos para ilustrar la técnica
de los polígonos de frecuencia. Para construirlo se siguen los mismos pa-
sos que para construir un histograma, pero en lugar de construir los rectán-
gulos a partir de los límites superior e inferior de los intervalos, se calcula el
punto medio del mismo y se unen, por medio de una línea recta que se
conecta a los puntos medios de los demás intervalos.
MÓDULO 4: ANÁLISIS DE LA INFORMACIÓN 35

Así por ejemplo en el gráfico 1 podemos trazar el polígono de frecuen-


cias, uniendo los puntos medios del histograma de frecuencias.

2.1.4.2 Gráficas de barras

La gráfica de barras es fácil de construir y su interpretación es de


gran utilidad. Una gráfica diseñada para mostrar magnitudes absolu-
tas deberá tener su inicio en cero y una escala de cantidades conti-
nuas. Las gráficas de barras pueden construirse en forma vertical u
horizontal.

Las gráficas de barras pueden dividirse en tres tipos:

a. Gráficas de barras con partes componentes. En esta gráfica cada ba-


rra ha sido segmentada en dos partes componentes; así, por ejemplo,
en la siguiente gráfica se tiene que la población de estudiantes de 100
semestre de la facultad X, de la Universidad Y, se distribuye según el
sexo y la edad así:

Distribución de los estudiantes de décimo semestre de la Facultad X,


de la Universidad Y, por sexo y edad

1 5 -1 9

2 0 -2 4
Edad

2 5 -2 9 h o m b re s

m u je re s
3 0 -3 4

0 10 20 30 40
N ú m e ro d e E s tu d ia n te s

En la gráfica se muestra el número de estudiantes clasificados por


sexo y edades, en cada barra se presentan los dos componentes, los
hombres y las mujeres.

b. Gráficas de barras agrupadas. En esta gráfica, se presentan los mis-


mos datos de estudiantes, excepto que los componentes por sexo se
muestran separadamente así:
36 SERIE: APRENDER A INVESTIGAR

Distribución de los estudiantes de décimo semestre de la Facultad X,


de la Universidad Y, según el sexo y la edad

1 5 -1 9

2 0 -2 4
Edad

m u je r e s
h o m b re s
2 5 -2 9

3 0 -3 4

0 5 10 15 20 25 30
N ú m e r o d e E s tu d ia n te s

c. Gráficas de barras bidireccionales. Cuando se desea graficar cantida-


des positivas y negativas, tales como pérdidas y ganancias en la pro-
ducción de una empresa, por tipo de producto. Así, en la gráfica de
producción de la empresa X, se tiene que las pérdidas y ganancias por
tipo de producto son:

Utilidad o pérdida en la producción de la Empresa X

Estufas

Calentadores de agua

Secadores
utilidad o
Enfriadores pérdida
Planchas

-40 -20 0 20 40 60
Producción

2.1.4.3 Gráficas lineales

Cuando debe presentarse una serie que cubre un gran número de pe-
ríodos de tiempo, los datos graficados por medio de barras se ven dema-
siado acumulados; entonces, éstas pueden ser reemplazadas por una
línea, ya que las líneas son más efectivas que las barras, cuando existen
marcadas fluctuaciones en las series, o cuando deben presentarse varias
series sobre la misma gráfica. Por ejemplo, el número de estudiantes de
la facultad X, matriculados por sexo, en el período 1990-1998.
MÓDULO 4: ANÁLISIS DE LA INFORMACIÓN 37

Número de estudiantes de la Facultad X, matriculados por sexo,


en el período 1990-1998
Número de Estudiante

600
500 Hom bres
400
300 M ujeres
200
100 Total
0
90 91 92 93 94 95 96 97 98
Años

2.1.4.4 Gráficas circulares

Las gráficas circulares, llamadas también de tipo pastel, se usan para


mostrar los tamaños relativos de los componentes de un total. Son utiliza-
dos, para indicar cosas tales como participación de cada facultad en el
total de estudiantes matriculados de determinada universidad, en perío-
dos diferentes.

El proceso para realizar el diagrama consiste en una regla de tres.

Para conocer el ángulo de cada sector se debe relacionar los 3600


que tiene una circunferencia con el tamaño de la muestra y con cada una
de sus frecuencias absolutas, así:

360° n
X F1

Por ejemplo, si la siguiente tabla representa el número de docentes de


una universidad, clasificados por modalidad educativa.

Modalidad

Técnica 5
Tecnología 25
Universitaria 80
Post-grado 15
N = 125

El diagrama circular se construirá así:

360° 125 Donde 125 es el tamaño de la muestra y


X 5 5 la frecuencia en la primera modalidad.
38 SERIE: APRENDER A INVESTIGAR

Luego X = 360° x 5
125

En el siguiente ejemplo, se muestra la distribución porcentual del nú-


mero de estudiantes matriculados en 5 facultades de una universidad X,
en los años de 1990 y 1998.

c e a
d
13% 23% 15%
27%

b b
14% 18%

c
e d 8%
15% 36%
a
31%

DESCRIPCIÓN DE DATOS, TÉCNICA DE REPRESENTACIÓN


GRÁFICA - AUTOEVALUACIÓN N° 1

Lea cuidadosamente cada uno de los siguientes enunciados y seña-


le la respuesta correcta.

1. El
propósito principal de la estadística descriptiva es:
a)Representar los datos por medio de histogramas.
b)Obtener la información necesaria para la investigación.
c)Medir en escalas nominales, ordinales e intervalos.
d)Conocer las características generales de una distribución de
frecuencias.
e) Todas las anteriores.

2. Una distribución de frecuencias sólo se puede construir a partir de


variables medidas en escalas intervalos.

Sí _______ No _______
MÓDULO 4: ANÁLISIS DE LA INFORMACIÓN 39

¿Por qué? _______________________________________________


_________________________________________________________

3. Si clasificamos 220 municipios en grandes, medianos y peque-


ños, de acuerdo con el número de habitantes, de forma tal que
tenemos 49 grandes, 63 medianos y 108 pequeños, ¿cómo los
representaría en un histograma de frecuencias como en un diagra-
ma circular?

4. Para construir un histograma de frecuencias, primero es necesa-


rio construir un polígono de frecuencias.

Sí _______ No _______

5. En un examen general de matemáticas los 30 alumnos de un cur-


so obtuvieron las siguientes calificaciones:

Calificación N° de alumnos

78 1
77 1
76 0
75 2
74 1
73 0
72 2
71 2
70 4
69 5
68 3
67 0
66 3
65 2
64 0
63 1
62 2
61 1

Represente la misma información en una distribución de frecuencias,


basada en intervalos. Determine el rango, el número de intervalos y
la amplitud de los intervalos. Represente los resultados por medio de
un histograma y un polígono de frecuencias.
1. d

2. No

3. Gráfico

4. No

5. Rango = 17; número de intervalos = 6; amplitud de intervalo = 3

Calificaciones F Frecuencia
Relativa %

61-63 4 13.3
64-66 5 16.7
67-69 8 26.7
70-72 8 26.7
73-75 3 10.0
76-78 30 100.0

Graficar

RESPUESTAS A LA AUTOEVALUACIÓN N° 1

SERIE: APRENDER A INVESTIGAR 40

También podría gustarte