Apuntes Sobre Estadistica
Apuntes Sobre Estadistica
Apuntes Sobre Estadistica
Santo domingo, D. N.
Junio 2010
I. INTRODUCCION
Estadstica: Es una metodologa cientfica que permite recolectar, organizar y
procesar datos que proporcionen informacin que sirvan de base
para la
toma de decisin. Por ejemplo aplicar una encuesta para conocer la preferencia
del electorado, aplicar un tratamiento especial a un grupo de personas y
observar el resultado, buscar datos sobre la matrcula estudiantil, u otro tema
en particular. En cambio, cuando hablamos de Estadsticas nos referimos a
un conjunto de medidas o indicadores que describen el comportamiento de
un fenmeno de inters en
un momento determinado. Por ejemplo, el
porcentaje de lectores que prefieren a un candidato en particular, el tiempo
necesario para realizar unas tarea, las unidades producidas diariamente por
una empresa, las ventas de una empresa, etc.
Es decir que las estadsticas representan el fin u objetivo que buscamos y
la Estadstica el medio para conseguirlo.
1.1
DIVISION DE LA ESTADISTICA
Wayne W., Daniel & James C. Terrell: Estadstica para Administracin y Economa Tomo I. Editora
McGraw-Hill. 7. Edicin. Junio 2000.
Diseo del
Estudio
Planeacin
Anlisis y
presentacin
Recoleccin
de datos
Procesamiento
Aunque estos pasos pueden y varan atendiendo a los criterios del investigador
en trminos generales estos pasos representan el proceso lgico de una
investigacin aunque reciban diferentes nombres. A continuacin se hace una
descripcin breve de cada uno de estos.
1. Planeacin: Es la fase en la cual se definen los aspectos administrativo y
operativos de la investigacin. Esta fase comprende entre otras actividades, el
establecimiento de los objetivos: general y especficos, alcance de la
investigacin, poblacin de estudio, presupuesto necesario, cronograma de
actividades y plan de anlisis o resultados esperados.
2. Diseo del estudio: En esta fase se define y se disea el instrumento de
recoleccin de datos (cuestionario, entrevistas, observacin, entre otros) y se
3
Ver a Lincoln L. Chao: Estadstica para las Ciencias Administrativas. Tercera Edicin. Editora
McGraw-Hill
10
3. Sexo:
1. Masculino
2. Femenino
1. Pblica
2. Privada
2. Repitiente
11
2. Edad 15
2. Edad 12
3. Sexo: 1. Masculino
3. Sexo: 1. Masculino
2. Femenino
1. Pblica
2. Privada
2. Femenino
1. Pblica
2. Privada
2. Edad 10
2. Edad 11
3. Sexo: 1. Masculino
2. Femenino
3. Sexo: 1. Masculino
1. Pblica
2. Femenino
2. Repitiente
5. Tipo de escuela:
1. Pblica
2. Privada
2. Repitiente
2. Edad 9 aos
2. Edad 13 aos
3. Sexo: 1. Masculino
2. Femenino
1. Pblica
2. Privada
2. Repitiente
3. Sexo: 1. Masculino
2. Femenino
1. Pblica
2. Privada
2. Repitiente
12
2. Edad 11 aos
2. Edad 10 aos
2. Femenino
3. Sexo: 1. Masculino
1. Pblica
2. Privada
2. Repitiente
3. Sexo: 1. Masculino
2. Femenino
1. Pblica
2. Privada
2. Repitiente
2. Edad 13 aos
2. Edad 11 aos
3. Sexo: 1. Masculino
2. Femenino
1. Pblica
2. Privada
2. Repitiente
3. Sexo: 1. Masculino
2. Femenino
1. Pblica
2. Privada
2. Repitiente
13
14
El proceso de edicin de los datos sera imprimir los datos digitados y luego
verificar si el proceso de digitacin se ha hecho correctamente.
Una vez que se ha realizado el proceso de digitacin y edicin de los datos, se
procede a obtener los cuadros y tablas, as como las medidas estadsticas que
nos permitan dar respuesta a los objetivos del trabajo de investigacin, pero
sobre este particular volveremos a tratarlo en los captulos siguientes.
15
2.2
2.3
2.4
2.5
2.6
16
3.2
3.3
SEXO
MASCULINO
FEMENINO
No.
9
25
TOTAL
34
%
26.5
73.5
100.0
de la que se trate.
4) Presentacin grfica:
es aquella en la cual los resultados de una
investigacin se
presentan en forma de grfico. La importancia de la
presentacin grfica es que permite observar el comportamiento de una
variable sin entrar en detalles, solo con observar el cuadro.
17
Se x o d e l o s e s t u d i a n t e s d e Es t -x x x , s e c c i n
00
26.5%
73.5%
MASCU LIN O
F EMEN IN O
Por ejemplo, al
observar un recibo
de la facturacin
de la electricidad,
se muestra un
grfico como el que
vemos a nuestra
derecha,
observamos como
ha
variado
el
consumo, si se ha
consumido ms o
se ha consumido
menos.
18
73.8
68.3
85.5
70.8
81.8
77.0
79.5
87.8
78.8
87.3
73.8
84.5
83.3
71.8
81.3
80.8
90.8
71.0
70.5
73.0
60.5
60.0
69.5
64.8
67.5
72.3
67.0
67.0
62.0
66.5
69.0
66.0
71.3
65.8
69.8
72.8
61.3
64.8
76.8
71.0
81.3
61.3
71.5
82.0
71.5
81.3
76.0
83.5
84.0
68.5
84.3
82.8
92.5
72.5
70.5
78.5
67.0
81.5
77.5
82.0
78.8
71.0
84.5
69.5
72.8
72.8
78.5
69.3
72.0
67.8
70.3
70.3
89.8
70.5
77.8
90.8
79.5
63.0
81.0
62.8
75.0
82.3
84.8
69.8
67.0
68.8
65.3
58.0
66.8
56.5
63.8
70.0
72.0
56.8
84.3
67.8
70.5
61.0
61.8
68.8
71.8
67.3
71.0
69.0
91.8
67.8
61.5
63.0
83.5
81.8
66.8
77.8
64.5
63.5
19
65.3
65.8
66.0
66.5
66.8
66.8
67.0
67.0
67.0
67.0
67.3
67.5
67.8
67.8
67.8
68.3
68.5
68.8
68.8
69.0
69.0
69.3
69.5
69.5
69.8
69.8
70.0
70.3
70.3
70.5
70.5
70.5
70.5
70.8
70.8
71.0
71.0
71.0
71.0
71.3
71.5
71.5
71.8
71.8
72.0
72.0
72.3
72.5
72.8
72.8
72.8
73.0
73.8
73.8
75.0
75.0
76.0
76.8
77.0
77.5
77.8
77.8
77.8
78.0
78.5
78.5
78.8
78.8
79.0
79.5
79.5
80.3
80.8
81.0
81.0
81.3
81.3
81.3
81.5
81.8
81.8
82.0
82.0
82.0
82.3
82.5
82.8
83.3
83.5
83.5
84.0
84.3
84.3
84.5
84.5
84.8
85.0
85.0
85.0
85.5
86.3
87.3
87.8
88.0
88.5
88.5
88.5
88.8
89.8
90.8
90.8
91.3
91.8
92.5
20
M
F
M
F
F
F
F
F
F
F
F
F
F
F
M
F
M
F
F
F
M
F
M
F
F
F
F
M
F
F
F
F
F
F
F
M
F
M
F
F
F
F
F
F
F
F
M
F
F
M
Para estos datos, el dato masculino, (M) se repite 11 veces por lo tanto esa es
su frecuencia y el dato femenino, (F) se repite 39 veces, que es su frecuencia.
2.3 TIPOS DE FRECUENCIA
Existen cuatro tipos de frecuencias: la absoluta simple, la relativa simple, la
absoluta acumulada y la absoluta relativa acumulada.
2.3.1 Frecuencia absoluta simple, (fi): se define como el nmero de veces que
se repite un dato u observacin. Comnmente se le denomina con el nombre de
frecuencia. Por ejemplo, en el cuadro anterior el dato masculino tiene una
frecuencia absoluta simple de 11, mientras que el dato femenino presenta una
frecuencia absoluta simple de 39.
2.3.2 Frecuencia absoluta acumulada, (FA): consiste en la suma continua y
subsecuente de la
frecuencia absoluta simple. La frecuencia absoluta
acumulada expresa la cantidad de elementos que se encuentra por debajo de
un valor especfico.
2.3.3 Frecuencia relativa simple, (fr o %): consiste en expresar la frecuencia
absoluta simple, (fi) como una proporcin con aspecto al total de frecuencia.
2.3.4 Frecuencia relativa acumulada, (FRA o % acumulado): Expresa la
frecuencia absoluta acumulada, (FA) como un porcentaje con respecto al total
de frecuencia y representa la proporcin de elementos que se encuentran por
debajo de un valor determinado. La FRA se puede obtener de dos formas:
a) Sumando de manera continua y subsecuente la frecuencia relativa simple.
b) Dividiendo cada frecuencia absoluta acumulada entre el total de frecuencia.
2.4 Clase: Es un rango de valor en el cual se incluye un conjunto de datos que
para fines de anlisis se consideras homogneos.
Veamos un ejemplo sobre como se obtienen las diferentes frecuencias que
conforma una distribucin de frecuencia. Para la ilustracin vamos a tomar la
calificacin obtenida por 50 estudiantes en una prueba parcial de Estadstica,
los datos se ilustran en la tabla nmero dos a continuacin.
21
14
14
18
16
12
19
8
10
13
19
15
16
14
17
10
10
14
16
16
8
12
16
10
9
17
13
16
19
13
6
14
12
19
17
18
9
18
13
11
14
12
15
15
11
16
12.0
12.0 13.9
14.0 15.9
16.0 17.9
18.0 20.0
TOTAL
El segundo paso es determinar la cantidad de estudiantes que cae dentro de
cada una de estas categoras o clases. Para esto, sencillamente se cuenta en la
tabla dos, la cantidad de calificaciones que est dentro de cada uno de los
lmites de cada categora o clase.
Para determinar la cantidad de datos en cada categora o clase se puede hacer
contando de manera directa cada valor o a partir de un proceso de conteo
detallado, colocando una raya, un punto o un smbolo en cada categora cada
vez que aparece un valor que se corresponda con esta.
Al observar los datos sueltos de la tabla dos, en la primera categora, las
calificaciones menores de 12 puntos, hay 11 estudiantes, con calificacin
22
fi
12.0
11
12.0 13.9
10
14.0 15.9
10
16.0 17.9
12
18.0 20.0
TOTAL
50
fi
12.0
11
22.0
12.0 13.9
10
20.0
14.0 15.9
10
20.0
16.0 17.9
12
24.0
18.0 20.0
14.0
TOTAL
50 100.0
23
fi
12.0
11
22.0
11
12.0 13.9
10
20.0
21
14.0 15.9
10
20.0
31
16.0 17.9
12
24.0
43
18.0 20.0
14.0
50
50
100.0
TOTAL
FA
24
fi
FA
FRA
12.0
11
22.0
11
22.0
12.0 13.9
10
20.0
21
42.0
14.0 15.9
10
20.0
31
62.0
16.0 17.9
12
24.0
43
86.0
18.0 20.0
14.0
50
100.0
50
100.0
TOTAL
Una vez que han calculado las frecuencias se procede a completar el cuadro
de manera adecuada, es decir, poner el ttulo, se elimina la columna del
conteo, (si se ha incluido), y se coloca la fuente de los datos.
Cuadro No : Calificacin de 50 estudiantes de
un curso de estadstica en una prueba parcial
Calificacin
fi
%
FA
FRA
12.0
11
22.0
11
22.0
12.0 13.9
10
20.0
21
42.0
14.0 15.9
10
20.0
31
62.0
16.0 17.9
12
24.0
43
86.0
18.0 20.0
14.0
50
100.0
50
100.0
TOTAL
Fuente: Tabla 2
25
fi
Ambos padres
Con la madre
Con el padre
Otro familiar
Total
%
106
79.7
15
5
11.3
3.8
5.3
133
100.0
5
3
4
5
2
3
4
1
5
2
3
2
2
4
3
2
3
1
1
0
El dato menor que aparece en los datos es el valor cero y el mayor es el cinco
de forma tal que esta variable en esta muestra toma seis valores diferentes:
cero, uno, dos, tres, cuatro y cinco. Para organizar los datos en una
distribucin de frecuencia simple o tipo I colocamos los diferentes valores de
26
2.5.3 Distribucin Frecuencia con Clase o Tipo II: Este tipo de distribucin
se utiliza para variables cuantitativas continuas y para aquellas variables
cuantitativas discretas, cuyo rango de valor sea mayor de diez.
Siempre que se trate de datos cuantitativos continuos se hace necesario el
uso de este tipo de distribucin. La razn para ello es que los datos
cuantitativos continuos pueden diferir uno del otro por milsima de datos, lo
que, de tener los diferentes valores con sus respectivas frecuencias se podra
tener tantas clases como valores individuales se tenga, perdindose de esta
manera la esencia de la agrupacin de los datos, proporcionar informacin
sobre las caractersticas de las variables estudiadas
Un ejemplo de este tipo de distribucin de frecuencia se muestra a
continuacin
Cuadro No : Calificacin de 50 estudiantes de
un curso de estadstica en una prueba parcial
Calificacin
fi
%
FA
FRA
12.0
11
22.0
11
22.0
12.0 13.9
10
20.0
21
42.0
14.0 15.9
10
20.0
31
62.0
16.0 17.9
12
24.0
43
86.0
18.0 20.0
14.0
50
100.0
50
100.0
TOTAL
Fuente: Tabla 2
27
Los pasos que se presentan a continuacin son solo una gua de cmo
organizar los datos en una distribucin de frecuencia con clase, puesto que la
forma de presentar los datos muchas veces depende de lo que se quiera
mostrar en la distribucin. Pero cuando no se tiene una idea de cmo agrupar
los datos, los siguientes pasos son una buena gua y estos pasos son:
1. Calcular el rango de la variable: El rango de una variable se define como la
diferencia entre dato mayor y el dato menor y el mismo indica los diferentes
valores posibles que puede tomar la variable
RV = Xmayor - Xmenor
2. Calcular el intervalo o ancho de la clase: El intervalo o ancho de la clase
es la diferencia que existe entre el lmite inferior y el lmite superior de cada
clase y el mismo se puede obtener por tanteo o se puede establecer de acuerdo
a los objetivos de quien est presentado la informacin. Una forma de obtener
el intervalo de cada clase es a partir de la regla sugerida por Sturges4 la cual
establece que el ancho o intervalos de clases en una distribucin de frecuencia
puede aproximarse a partir de la siguiente frmula:
RV
, n representa el total de datos o tamao de la muestra
1 (3.322x log n)
Herbert A. Sturges: The Choice of a Class Interval, Journal of the American Statistical
Association. Marzo 1926
28
24
33
29
35
26
26
25
44
32
40
21
31
28
20
26
21
33
32
41
22
20
22
23
43
50
47
45
26
38
26
22
24
39
38
35
20
46
20
25
2.
RV
1 ( 3 . 322 log n )
30
30
30
30
4.75 5
1 (3 .322 log 40 ) 1 (3.322 1.6021) 1 5.3221 6.3221
29
fi
FA
% Acum.
20-24
13
32.5
13
32.5
25-29
22.5
22
55.0
30-34
12.5
27
67.5
35-39
12.5
32
80.0
40-44
10.0
36
90.0
45-50
10.0
40
100.0
Total
40
100.0
30
36
25
17
33
29
6
19
40
28
28
17
26
32
20
20
22
6
8
18
30
31
30
19
20
4
5
19
34
32
31
3.53
3.06
2.42
3.09
3.00
2.22
3.85
2.47
3.71 2.25
3.20 3.02
2.96
2.00
3.00 3.00
2.05 3.60
13
14
12
12
15
12
16
15
14
14
16
13
17
17
44
38
38
16
22
32
29
28
27
60
48
10
31
23
30
12
27
17
21
24
37
18
42
Administracin
Economa
Contabilidad
Contabilidad
Mercadeo
Economa
Mercadeo
11. Indeciso
12. Indeciso
13. Economa
14. Mercadeo
15. Indeciso
16. Administracin
17. Economa
21. Administracin
22. Computacin
23. Mercadeo
24. Economa
25. Indeciso
26. Administracin
27. Computacin
32
18. Mercadeo
19. Indeciso
20. Computacin
28. Mercadeo
29. Economa
30. Mercadeo
33
TABULACIN CRUZADA
Y1
Y2
Y3
TOTAL
X1
C12
C22
.
.
C52
C13
C23
.
.
C53
Total X1
X5
C11
C21
.
.
C51
TOTAL
Total Y1
Total Y2
Total Y3
X2
X3
X4
Total X2
.
.
Total X5
Total
general
El cuadro indica dos renglones para el total, esto es debido a que estamos
presentando solo dos variables, as, en el total de la ltima fila representa el
34
Sexo
1 Masc.
2
3
4
5
6
7
8
9
10
Fem
Masc.
Masc.
Masc.
Fem
Fem
Fem
Masc.
Masc.
Calif.
No.
Sexo
Calif.
68
11 Masc.
70
21 Fem
87
86
74
72
72
85
66
79
70
72
12
13
14
15
16
17
18
19
20
91
72
70
65
82
68
86
71
82
22
23
24
25
26
27
28
29
30
76
81
77
77
73
60
60
71
73
Fem
Masc.
Fem
Masc.
Fem
Fem
Masc.
Masc.
Fem
No.
Sexo
Masc.
Masc.
Masc.
Fem
Masc.
Fem
Masc.
Masc.
Masc.
Calif.
Para este caso tenemos dos variables, una variable cuantitativa, (calificacin
matemtica) y una cualitativa, (sexo de los/as estudiantes). La variable sexo
tiene dos categoras, masculino y femenino, y la calificacin en matemtica es
continua y su rango es mayor de 10 por lo tanto hay que hacer una
distribucin con clases. Para ello vamos a dividir esta variable en cuatro
categoras, los estudiantes con menos de 70 puntos, los que tienen entre 70 y
80 puntos, los que tienen entre 80 y 90 y los que tienen 90 o ms puntos.
Luego de esta clasificacin el cuadro queda como se ilustra a continuacin:
Como se muestra en el cuadro siguiente, el primer alumno es de sexo
masculino y tiene una calificacin de 68 puntos, por lo tanto se coloca en la
columna de masculino y en la primera fila, ya que aqu de colocan los que
tienen calificacin entre 60 y 69 puntos. El segundo estudiante es una
estudiante y tiene una calificacin de 86 puntos, por lo tanto se coloca en la
columna de sexo femenino y en la tercera fila, ya que aqu se deben colocar los
estudiantes que tienen entre 80 y 89 puntos.
El tercer estudiante es sexo masculino y tiene una calificacin de 72 puntos,
por lo que se coloca en la columna de masculino y en la segunda fila, ya que en
35
Masculino
Femenino
60 - 69
///
///
70 - 79
///////////// ///
80 - 89
//
Total
/////
90 - 100
Total
Luego del conteo de las frecuencias, los datos son
Calificacin
60 - 69
70 - 79
80 - 89
90 - 100
Total
Sexo
Masculino Femenino
3
3
13
3
2
5
0
1
18
12
Total
6
16
7
1
30
Preguntas
1.
2.
3.
4.
5.
Ejercicio:
Con los datos que se presentan en la tabla siguiente crear un pequeo reporte
indicando la relacin entre el rendimiento acadmico y el sexo de los
estudiantes, entre el nmero de asignatura por sexo, as como el gasto en
transporte por sexo y nmero de asignaturas cursadas. Finalmente incluya un
pequeo anlisis de la relacin entre la edad de los estudiantes y el nmero de
asignaturas cursadas.
36
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
EDAD
SEXO
# DE
ASIG.
INDICE
ACAD.
GASTO EN
TRANSP.
22
24
23
25
21
25
22
21
28
28
29
25
20
30
28
24
28
24
21
24
35
21
24
22
21
26
25
24
29
25
M
F
M
M
M
F
M
F
F
F
M
F
M
F
F
F
F
F
F
M
M
F
M
F
F
F
F
M
M
F
3
3
4
5
3
3
3
6
3
4
5
3
4
2
3
4
3
6
4
3
2
4
3
3
4
3
4
5
3
5
80.0
77.8
75.6
74.6
82.1
74.3
77.7
80.1
70.3
70.3
73.5
74.3
79.8
73.3
81.5
74.4
78.6
76.7
77.7
79.4
75.7
83.0
81.2
76.8
80.7
70.8
71.3
74.9
82.6
80.6
20
50
60
30
30
50
40
40
40
40
40
20
40
20
40
40
40
40
20
20
40
40
50
60
30
50
20
80
30
20
37
38