Estadística Básica
Estadística Básica
Estadística Básica
Mtodo Cientfico
Presenta diferentes definiciones debido a la complejidad de una conceptualizacin exacta. As
podemos encontrar los siguientes:
MC es la sucesin de pase que debemos dar para descubrir nuevos conocimientos o para
comprobar o desaprobar hiptesis que implican o predican conductas de fenmenos desconocidos
hasta el momento.
Cohen y Nagel dicen que el MC es la persistente aplicacin de la lgica para poner a prueba
nuestras impresiones u opiniones, examinando las mejores evidencias disponibles a favor y en
contra de ellas. Podemos decir entonces que el MC es un conjunto de procedimientos por los que
se plantean los problemas cientficos y se ponen a prueba las hiptesis y los instrumentos de la
investigacin.
Lo importante en el MC no es el descubrimiento de las verdades, sino determinar cul fue el
procedimiento para demostrar un determinado enunciado, debido a que segn la naturaleza de
los hechos estudiados y de los problemas propios de cada ciencia, podran imponer diferentes
mtodos y tcnicas segn el objeto de estudio. Lo importante es que lo que hagamos tiene que
estar regulado por el mtodo cientfico.
El MC permite eliminar lo subjetivo en la interpretacin de la realidad y su objetivo. El MC opera
con conceptos, definiciones, hiptesis, variables e indicadores que son los elementos que
brindarn los recursos e instrumentos intelectuales que permitirn contraer el sistema terico de
la ciencia.
Francis Bacon defini el mtodo cientfico de la siguiente manera: Observacin, que significa
observar, es decir, aplicar atentamente los sentidos a un objeto o fenmeno para estudiarlo tal
como se presentan en la realidad.
Induccin: accin y efecto de extraer a partir de determinadas observaciones o experiencias
particulares, en principio particular de cada uno de ellos.
Hiptesis: planteamiento mediante la observacin, siguiendo las normas establecidas por el
mtodo cientfico.
Probar la hiptesis por experimentacin, demostracin, o refutacin de la hiptesis.
Tsis/teora cientfica/ conclusin: entonces podemos afirmar que el mtodo cientfico comprende
una serie de etapas que comienzan con el planteamiento del problema, la formulacin de una
hiptesis, la comprobacin de la hiptesis, y finalmente la interpretacin de los resultados y
conclusiones.
Segn Berthand Russel las etapas del mtodo cientfico son.1) Exacta observacin del fenmeno que se estudia.
2) Formulacin de una hiptesis que explique el hecho observado.
3) Verificacin de la hiptesis mediante nuevas observaciones.
Estadstica y mtodo cientfico: mientras que la formulacin de la hiptesis es resultado de la
imaginacin o de la intuicin del investigador, en la observacin y en la verificacin de la hiptesis
interviene la estadstica, proporcionando un mtodo que permite observaciones y fidedignas,
disminuyendo as las posibilidades de error.
Estadstica y medicina: llegas a la experiencia por medio de experiencia y conocimientos previos.
Pronstico: aplicacin del clculo de probabilidades a un enfermo determinado. El tratamiento
tambin ha llegado por medio de estudios y ensayos.
Usos en medicina colectiva: solo mediante procedimientos estadsticos se podr conocer la
composicin y caractersticas de la poblacin a servirse. Los riesgos y necesidades de la poblacin.
La planificacin, control y evaluacin de programas.
Mtodo Estadstico
Los principios generales del mtodo estadstico son de utilizacin universal, sin importar cul sea
la investigacin que se emprenda, o el rea del conocimiento humano al que se aplique. De
manera general podemos decir que el Mtodo Estadstico tiene 4 etapas bien definidas:
Planificacin de estudio
Recoleccin de la informacin
Elaboracin de los datos recogidos
Anlisis e interpretacin
La planificacin tiene por objeto el estudio de todos los detalles referentes a la recoleccin,
elaboracin, y anlisis de la informacin. Evidentemente para realizar la planificacin debe
definirse perfectamente la naturaleza y objetivos de la investigacin, y una adecuada evaluacin
de los conocimientos que al momento se poseen sobre el problema en estudio, y de las hiptesis
planteadas.
Pasos de la planificacin:
Reduccin de los errores: consiste en usar la mejor tcnica para evitar las causas que
puedan provocar errores.
Medicin de los errores: consiste en estimar el margen de error que se est cometiendo.
UNIVERSO Y MUESTRA
Una poblacin o universo que es objeto de una investigacin estadstica, es la totalidad de
individuos o elementos en los cuales se presenta una caracterstica susceptible de ser estudiada.
El universo puede ser finito o infinito. Finito cuando tiene una cantidad limitada de elementos, es
decir que pueden contarse los elementos a estudiarse. Infinito cuando est constituido por una
cantidad ilimitada de elementos.
La muestra son los elementos del universo que van a ser estudiados, los trminos universo y
muestra son relativos, porque un universo visto desde otra perspectiva puede ser una muestra.
Ventajas y desventajas del uso de la muestra.Ventaja: grupo pequeo, ahorro de tiempo, trabajo, recursos. Mayor eficiencia y exactitud para
obtener la informacin.
Desventaja: error por muestreo que es la variabilidad que pudiera darse ntrela muestra y el
universo, que de ser muy grande, esta podra dar resultados no tan reales.
El error por muestreo puede ser medido o disminuido estadsticamente porque provienen del
objeto observado, del observador y del mtodo de observacin.
Condiciones de una buena muestra: una buena muestra debe ser adecuada en cantidad y calidad.
Que sea adecuada en cantidad significativa que el nmero de individuos que conforma a la
muestra deben estar en relacin al tamao del universo y tambin a la importancia que se realiza.
Una muestra tiene calidad cuando es representativa y fiel reflejo del universo.
Clases de muestra: hay muestras probabilsticas y no probabilsticas, pero solo las primeras nos
permiten, utilizando procedimientos estadsticos, inferir a partir de la muestra o la poblacin de
estudiantes.
1) Muestras no probabilsticas/por conveniencia: aquella muestra en la que algn elemento
del universo tiene probabilidad nula de pertenecer a la muestra.
2) Muestras probabilsticas: es una muestra extrada del universo, de tal manera que todo
elemento de su universo tienen probabilidad conocida y diferente de cero, de pertenecer
a la muestra. Tipos de muestra probabilstica:
Muestras por azar simple: Mtodo de lotera y Tabla de nmeros aleatorios.
Muestras sistemticas: N (tamao universo), n(tamao de muestra), n/K (intervalo), 1er
elemento de la muestra es r. sorteo entre 1 y K es R, 2do elemento r+K, 3er elemento
r+2K, ltimo elemento [r+(n-1)].
Muestras estratificadas: para obtenerlas se divide el universo en estratos o sectores, y de
cada estrato se obtiene aleatoriamente los elementos para la muestra.
Muestra conglomerada: en lugar de tomar elementos individuales, se toman
aleatoriamente grupos de elementos.
Muestra por producto combinado: combinacin de los 2 anteriores.
DISEO DE FORMULARIO
Los datos para la investigacin son recogidos y registrados en formularios. Formulario es toda
forma impresa destinada a la recoleccin de datos.
Formulario debe ser til planeando cuidadosamente, facilitar la recoleccin de datos. Debe
recogerse los datos nicamente necesarios para la investigacin.
Datos que se recogen en el formulario:
a) Datos administrativos/de identificacin: ayudan a identificar las unidades en estudio u
observacin.
b) Datos sobre problema de estudio/del propio formulario.
Elaboracin de formularios:
No hay reglas fijas para elaboracin de formularios, debes saber armarlos de acuerdo a lo que
quieres.
Decidir sobre los datos que se recogern:
Decidir sobre el orden en el que se asentarn las preguntas: primero los datos administrativos y
luego los otros.
Debe ser exhaustiva, o sea que permite clasificar cualquier elemento que se estudia.
Debe tener clases o subdivisiones mutuamente excluyentes, de tal manera que no
debe caber duda de donde incluir un elemento o individuo.
Cuadros estadsticos
Su finalidad tiene como objetivo presentar de forma rpida, inteligible y resumida, determinado
material numrico. La forma y exposicin del cuadro es de libertad del investigador. Elementos del
cuadro:
o Ttulo
o Cuadro propiamente dicho
o Notas explicativas
1) Ttulo: tiene que ser completo, lo ms conciso y breve posible, debe contestar 4
preguntas: qu, como, cuando y donde estudiamos?
2) Cuadro propiamente dicho: consta de columna matriz y cuerpo de la tabla. Cada columna
tiene que tener un ttulo o encabezado de las columnas y tiene que ser bien claro y
explcito. Ejemplo edad (aos o mese), peso (libras, onzas), especificar unidad.
3) Notas explicativas: son anotaciones que se inscriben en la parte inferior del cuadro, y
contribuye a entender mejor el cuadro.
Notal al calce: contribuyen a entender la tabla.
Fuente: de donde son obtenidos los datos de la tabla.
Signos, abreviaturas, smbolos, etc.
El total siempre se anota al final y a la derecha. El redondeo de la cifra no siempre es bueno.
Clases de tablas.
De referencia/de consulta: contienen datos tiles que el usuario emplea para aplicar a
algn trabajo.
De trabajo/de muestra: se utiliza cuando simultneamente queremos recolectar y
clasificar datos.
De anlisis: facilitan anlisis e interpretacin de los datos recogidos.
Clases de tablas segn el nmero de variables.Cuando las dos entradas son cualitativas, tabla de asociacin.
Cuando las dos entradas son cuantitativas, tabla de correlacin.
Cuando una entrada es cualitativa y la otra cuantitativa, tabla mixta.
GRFICOS ESTADSTICOS
Permiten que de una manera rpida y sencilla, se pueda entender la evolucin de un determinado
fenmeno.
Grfico propiamente dicho y notas explicativas.
Un grfico es correspondiente a un cuadro, y un cuadro es correspondiente a un grfico.
Para elaborar un grfico hay que tener en cuenta lo siguiente:
1) Generalmente la forma del grfico es rectangular, a excepcin del pastel.
2) En la abscisa (eje x) se anota las diferentes clases de escala que se utilizan.
3) En la ordenada (eje y) se anota las frecuencias o nmero de veces que se observa
el fenmeno estadstico.
4) Ambos ejes, deben tener la misma longitud, pero el eje horizontal tiene permitido
ser mayor al vertical.
5) Para evitar interpretaciones incorrectas, las escalas deben comenzar en cero, pero
si los valores a ser representados son muy elevados y tienen pequeas
fluctuaciones, con fines estticos y para una mejor comprensin, debe partirse en
grficos.
6) Cada escala debe ser rotulada exactamente. Ejem (edad en ao, meses, etc.)
7) Como el grfico no da idea matemtica exacta de las fluctuaciones del fenmeno
estudiado, las escalas no deben tener muchas subdivisiones. Ejem poner de 10 en
10, mas no en cantidades exactas.
Cada escala debe ser rotulada. Como el grfico no da una idea matemtica exacta, no se hacen
tantas divisiones en el grfico. Si se desean ver cantidades exactas, habr que recurrir al cuadro, y
si solo se quiere conocer la evolucin del fenmeno de manera rpida, recurrir al grfico.
CMO
DONDE
CUANDO
Principales Grficos.-
Mujeres Hombres
200
150
150
120
250
200
200
250
200
150
100
50
0
1
900
800
700
600
500
400
300
200
100
0
1
# DE COSAS
501
453
605
431
499
218
3207
AMPLITUD
5
10
10
20
20
20
PROMEDIO DE CASOS
100 (501/5)
45
60
46
25
11
Edad
0-4
5-14
15-24
25-44
45-64
65-84
H
275
288
519
835
400
115
2432
M
226
165
86
96
99
103
775
amplitud
5
10
10
20
20
20
H
55 (275/5)
29
52
42
20
6
M
45
17
9
5
5
5
60
50
40
Series1
30
Series2
20
10
0
0-4
may-14
15-24
25-44
45-64
65-84
Edad
0-9
10-19
20-29
30-39
40-49
50-59
60-69
70-79
80-89
10
20
748
457
642
466
340
241
156
76
81
3207
30
Frecuencias
acumuladas
748
1205
1847
2313
2653
2894
3050
3126
3207
40
50
FR en %
23.3
37.6
57.6
72.1
82.7
90.2
95.1
97.5
100
60
70
80
90
6) Diagrama semilogaritmico
7) Diagrama de puntos
X
f
18
1
22
1
25
1
27
1
34
1
36
1
27
1
43
1
47
1
49
1
53
1
58
1
449
12
X
18
22
25
f
1
2
2
Xf
18
44
50
X= 645/18= 35.83
27
3
54
34
1
34
36
1
36
27
2
54
43
1
43
47
1
47
49
1
49
53
1
53
58
2
116
449
18
X= Ex449/12= 37.41
1 ao =12 meses
0.41= 4.92 meses
X= 37aos 4meses
X= 35aos 9meses
Edad
20-29
30-39
40-49
50-59
60-69
F
2
28
20
18
16
84
X
24.5
34.5
44.5
59.5
64.5
Xf
49
966
890
981
1032
3918
X= 3918/84= 46.64
X=46aos 7u8meses (verificar xq)
Ejemplo:
Aos
# de casos
2005
25
2006
13
2007
30
2008
18
2009
6
Serie cuantitativa discontinua IMPAR
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
120
98
100
78
150
135
140
102
80
54
110
130
54-78-80-98-100-102-110-120-130-135-140-150
12/2= 6; 12+2/2= 7. El 102 y 110 ocupan los puestos
6 y 7 por lo tanto entre esos dos est el valor M.
102+110/2= 106 casos = M.
Ejercicio:
Edad
20-29
30-39
40-49
50-59
60-69
70-79
80-89
# casos
2
13
23
24
12
4
2
80
HACIENDO UN PARENTESIS CON ESTE MISMO EJEMPLO, LA MEDIANA PODRIA SER 42 Y ESTAR
UBICADA EN LA PRIMERA FILA. La solucin sera: si en 10 aos hay 42 casos, cuantos hubo solo en
40. 400/42= 9.52, el lmite inferior de la clase ah sera 20, por lo tanto: 29 aos 6 meses
Mo = L + t * f2/f1+f2
Con respecto a la tabla del ejercicio pasado: Mo= 50+10* 12/23+12. 50+120/35 = 50 +3.42 =
53.42. Respuesta: 53 aos 5 meses
MEDIDAS DE DISPERSIN
Los datos recogidos dependiendo del tamao que tenga la muestra se manejarn de forma
agrupada o no agrupada. Cuando se obtienen muchos datos diferentes, es mejor agruparlos en
clases, ya que de otro modo su distribucin de frecuencias y grficos resultara complicada y
confusa. Sin embargo, debe recordarse que el agrupamiento significa prdida de la informacin y
por lo tanto, prdida de la exactitud de las medidas objetivas. Dos caractersticas importantes de
los datos son:
1) la tendencia de los valores a agruparse alrededor de unos valores promedio llamados
medidas de tendencia central.
2) La tendencia de los valores a alejarse y dispersarse entre s. Por lo tanto, adems de
conocer las medidas de tendencia central, es necesario saber cunto se dispersan o varan
los elementos, estas se conocen como medidas de dispersin o de variabilidad.
Ejemplo:
Edad (a)
20-29
30-39
40-49
50-59
60-69
70-79
Total
# pacientes
2
4
12
24
23
15
80 (n)
Q3 = 3n/4
Q3= 60 casos
2do grupo
M=10
Q1=3
Q3=18
Amplitud Semicuartil: esta medida se basa en la posicin ocupada por el 50% central
de la distribucin.
Desviacin Standard (DS): mide la variacin que presentan los elementos de una
muestra alrededor de su promedio.
Das
#
hospitalizacin pacientes
1
1
2
1
3
1
4
1
5
1
6
1
7
1
7
Xf (X*f)
1
2
3
4
5
6
7
28
X X con
rayita
-3
-2
-1
0
1
2
3
9
4
1
0
1
4
9
9
4
1
0
1
4
9
28
Peso (Kg)
20-24
25-29
30-34
35-39
40-44
45-49
50-54
# casos
4
8
9
10
7
6
6
50 (n)
X
22
27
32
37
42
47
52
Coeficiente de variacin:
Xf
88
216
288
370
294
282
312
1850
(X-X raya)
-15
-10
-5
0
5
10
15
(X-Xraya)2
225
100
25
0
25
100
225
(X-Xraya)2 * f
900
800
225
0
175
600
1350
4050