Separata de Bioestadistica - Ferly Urday Luna
Separata de Bioestadistica - Ferly Urday Luna
Separata de Bioestadistica - Ferly Urday Luna
=
=
n
i
i
N f
1
N
f
h
i
i
=
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 3 de 25
2.2 Tipos de datos a analizarse.
a) Datos de tipo I.- Aqu por ser la informacin bastante pequea no existen
tablas de frecuencia y nicamente los datos presentados, ya sea en filas o en
columnas. Esto debido a que el dato solo presenta una observacin.
Ejemplo 1 Variable cuantitativa discreta
La sgte. informacin representa la edad en aos de 6 individuos sujetos a una
prueba de absorcin de vitamina B17 contenida en pepitas de albaricoque.
Edad 17 20 16 23 21 28
Solucin:
Los datos se ordenan ascendentemente.
En una fila:
Edad 16 17 20 21 23 28
En una columna:
Tabla N 1.- Edad de individuos sometidos a una prueba de absorcin de vitamina B17.
Centro experimental VITASUR Octubre del 2007
Nombre Edad
N1 16
N2 17
N3 20
N4 21
N5 23
N6 28
FUENTE: Elaboracin propia
Interpretacin: Como se puede apreciar en la tabla Nro 1, el individuo de
menor edad tiene 16 aos y el de mayor edad tiene 28 aos.
b) Datos de tipo II.- Se realiza lo siguiente:
Identificar la variable que se est estudiando;
Asignarle una letra cuales quiera a la variable en estudio;
Ordenar los datos ya sea en forma ascendente o descendente;
Efectuar la respectiva tabulacin de los datos;
Calcular los elementos de la tabla de frecuencia; e
Interpretar los resultados del cuadro.
Las tablas de distribucin de frecuencias de tipo II, sirven para presentar las
variables cualitativas y las variables cuantitativas discretas.
Ejemplo 2.- Variable cuantitativa discreta
Se encuesto a una muestra de 42 estudiantes de la UCSM que fueron
atendidos por problemas respiratorios, a los que se les pregunto el numero de
veces que presentaron dichos problemas durante el ao 2007, obtenindose lo
siguientes resultados:
Tablas de frecuencias
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 4 de 25
Nro de veces que presentaron males respiratorios
2 3 2 4 6 6 1
5 4 3 2 2 2 6
4 5 2 2 3 2 3
7 4 3 2 3 2 1
3 3 2 4 1 4 2
1 1 4 5 5 1 3
Solucin:
Tabulacin de datos
Tabulacin de datos
Nro de veces que
presentaron
problemas
Clsica En Excel
1
6
2 12
3
9
4 7
5 4
6 3
7
1
Tabla N 2
Cantidad de veces que un estudiante de la UCSM presento
problemas respiratorios durante el ao 2007
Nro. Veces f
i
h
i
h
i
(%) F
i
H
i
H
i
(%) Grados
1 6 0,1429 14,29% 6 0,1429 14,29%
51.43
2 12 0,2857 28,57% 18 0,4286 42,86%
102.86
3 9 0,2143 21,43% 27 0,6429 64,29% 77.14
4 7 0,1667 16,67% 34 0,8095 80,95%
60
5 4 0,0952 9,52% 38 0,9048 90,48%
34.29
6 3 0,0714 7,14% 41 0,9762 97,62%
25.71
7 1 0,0238 2,38% 42 1,0000 100,00%
8.57
42 1,0000 100,00%
360.00
FUENTE.- Elaborado en base a la encuesta realizada.
Interpretacin: En la presente tabla estadstica que se refiere a la cantidad de veces que un
estudiante de la UCSM presento problemas respiratorios durante el ao 2007, observamos
claramente que el 28.57% de los estudiantes tuvo 2 veces problemas y el 21.43% presento
3 veces, siendo los dems porcentajes de menor incidencia. Esto significa que el 50% de los
estudiantes tuvo de 2 a 3 veces molestias respiratorias durante el ao 2007. Adems de lo
anterior, se puede apreciar tambin que el 80.95% de los alumnos presento entre 1 y 4
veces problemas respiratorios durante el ao 2007.
Resumen de frmulas en Excel para el ejemplo 2
Abra Excel
y escriba
los datos en
A1:G7
Coloque
estos datos
en el rango
A10:B17
Utilizar la frmula:
=CONTAR.SI($A$2:$G$7;A11)
Esta tabla esta en el rango:
A10:H18
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 5 de 25
En B11
=CONTAR.SI($A$2:$G$7,A11)
En B18
=SUMA(B11:B17)
En C11
=B11/$B$18
En C18
=SUMA(C11:C17)
En D11
=C11, rellenar hasta D18 y aplicar el formato de porcentaje
En E11
=B11
En E12
=B12+E11 y rellenar hasta E17
En F11
=C11
En F12
=F11+C12 y rellenar hasta F17
En G11
=F11, rellenar hasta G17 y aplicar el formato de porcentaje
En H11
=REDONDEAR(C11*360,2) y rellenar hasta H17
En H18
=SUMA(H11:H17)
Ejemplo 3.- Variable cualitativa
Se ha tomado una muestra de 68 trabajadores de los registros del departamento de
personal correspondiente a las enfermeras, acerca del distrito donde viven dichos
trabajadores, con el fin de analizar la ruta probable que debe tomar el nuevo mnibus que se
ha adquirido. Se tienen los siguientes resultados
Cerro Colorado Characato J.L.B.y R. Paucarpata Cerro Colorado J.L.B.y R. Paucarpata
J.L.B.y R. Selva Alegre Selva Alegre Paucarpata Cayma Cayma Cerro Colorado
J.L.B.y R. Selva Alegre J.L.B.y R. J.L.B.y R. Paucarpata Cerro Colorado Cerro Colorado
Cayma Miraflores Miraflores Selva Alegre Paucarpata Miraflores Cerro Colorado
Paucarpata Cerro Colorado Cerro Colorado Miraflores J.L.B.y R. Miraflores Selva Alegre
Selva Alegre J.L.B.y R. Cayma Paucarpata Cerro Colorado Paucarpata Miraflores
Miraflores J.L.B.y R. J.L.B.y R. Cerro Colorado J.L.B.y R. Cerro Colorado Paucarpata
J.L.B.y R. J.L.B.y R. Cerro Colorado J.L.B.y R. J.L.B.y R. Paucarpata J.L.B.y R.
Miraflores Cerro Colorado Paucarpata Miraflores J.L.B.y R. Paucarpata
Selva Alegre Miraflores J.L.B.y R. Paucarpata Cerro Colorado Characato
Tabla N 3.- Distrito de procedencia de las enfermeras de la clnica Monte Bello
Octubre del 2007
Distrito f
i
F
i
h
i
h
i
(%) Grados
Cayma 4 4 0,0590 5,90% 21,24
J.L.B.y R. 18 22 0,2650 26,50% 95,40
Miraflores 10 32 0,1470 14,70% 52,92
Paucarpata 13 45 0,1910 19,10% 68,76
Selva Alegre 7 52 0,1030 10,30% 37,08
Cerro Colorado 14 66 0,2060 20,60% 74,16
Characato 2 68 0,0290 2,90% 10,44
68 1,0000 100,00% 360,00
FUENTE.- Archivos del registro del Dpto. de personal.
Interpretacin.- La mayor parte de los trabajadores viven en Cerro Colorado,
Paucarpata y en J. L.B.y R.
Nota.- Para trabajar este ejercicio en Excel se procede de la misma manera que en el
ejemplo 2.
c) Datos de tipo III.- Se siguen los siguientes pasos:
Identificar la variable que se est estudiando;
Asignarle una letra cualesquiera a la variable en estudio;
Ordenar los datos ya sea en forma ascendente o descendente;
Tablas de frecuencias
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 6 de 25
Calcular el rango de los datos, mediante.
Rango = Dato mayor- Dato menor
Determinar el nmero de clases o intervalos
Regla de STURGES k = 1+3,322 log (N)
Regla de Joule N k =
Regla o mtodo del experto se considera un nmero arbitrario de clases,
teniendo en cuenta: 5 k 20
El nmero de clases o intervalos siempre debe ser un valor entero, por lo
tanto se puede redondear al nmero superior o inferior entero ms prximo.
Calcular la amplitud de los intervalos, mediante:
Se determina el cambio mnimo, el cual se define como la mnima variacin
que puede llegar a existir para los valores de la variable, para determinar el
cambio mnimo se observa los datos y se sigue procede as:
Si los datos son enteros el cambio mnimo es 1.
Si los datos tienen un decimal el cambio mnimo es 0.1
Si los datos tienen dos decimales el cambio mnimo es 0.01
Si los datos tienen tres decimales el cambio mnimo es 0.001
Constituir los intervalos;
Efectuar el proceso de tabulacin;
Calcular cada uno de los elementos de la tabla de frecuencias; e
Interpretar los resultados.
Ejemplo 4.- Variable cuantitativa discreta
A continuacin se presenta los sueldos (en dlares) de 60 doctores del hospital 2 de mayo
del mes de octubre del 2010.
440 560 335 587 613
453 650 407 376 470
570 430 618 537 409
440 340 558 460 560
450 530 501 471 660
574 500 462 380 518
400 424 466 565 383
560 321 500 528 526
600 550 432 591 428
607 382 667 512 482
470 364 634 580 450
480 625 507 645 382
Solucin
FORMULA EN EXCEL
Valor menor : 321 En D16 =MIN(B2:F13)
Valor mayor : 667 En D17 =MAX(B2:F13)
Rango : 346 En D18 =D17-D16
Total Datos : 60 En D19 =CONTAR(B2:F13)
Nm Clases : 7 En D20 =REDONDEAR.MAS(1+3.322*LOG(D19);0)
Amplitud de clase : 50 En D21 =REDONDEAR.MAS(D18/D20;0)
Cambio mnimo: 1
n
R
C c i A
i
= = = =
Se redondea al nmero superior,
considerando el cambio mnimo.
Rango:
B2:F13
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 7 de 25
Como son datos discretos, se debera de crear intervalos cerrados, para ello se procede as:
Clases Lim
Inf
Lim
Sup
1 321 370
2 371 420
3 421 470
4 471 520
5 521 570
6 571 620
7 621 670
Tabla N 4.- Sueldos($) de los doctores del hospital 2 de mayo
octubre - 2010
Clase Intervalo f
i
h
i
h
i
(%) F
i
H
i
X
i
1 [321 370] 4 0,067 6,67% 4 0,067 345,50
2 [371 420] 8 0,133 13,33% 12 0,200 395,50
3 [421 470] 14 0,233 23,33% 26 0,433 445,50
4 [471 520] 9 0,150 15,00% 35 0,583 495,50
5 [521 570] 11 0,183 18,33% 46 0,767 545,50
6 [571 620] 8 0,133 13,33% 54 0,900 595,50
7 [621 670] 6 0,100 10,00% 60 1,000 645,50
60 1.000
FUENTE: Departamento de contabilidad Hospital 2 de mayo
Nota: X
i
es la marca de clase y se define como el valor central de cada intervalo, se halla
sumado el lmite inferior ms el lmite superior de cada intervalo y el resultado se divide
entre dos.
Interpretacin.- En la tabla estadstica N 4, que se refiere al sueldo en dlares de 60
doctores del hospital 2 de mayo, observamos que el 23,33% ganan entre 421 y 470 dlares,
el 18,33% ganan entre 521 y 570 dlares y el 15% ganan entre 471 y 520 dlares, siendo
los dems porcentajes de menor incidencia, esto significa que se trata de trabajadores que
ganan por encima del sueldo mnimo vital.
Resumen de formulas en Excel para el ejemplo 4
En C27
=D16
En D27
=C27+$D$21-$D$22 y rellenar hasta D33
En C28
=D27+$D$22 y rellenar hasta C33
En E27
=C27-$D$22/2 y rellenar hasta E33
En F27
=D27+$D$22/2 y rellenar hasta F33
En G27
="["&C27&" - "&D27&"]" y rellenar hasta G33
Para encontrar la frecuencia absoluta simple, primero se debe seleccionar el rango
H27:H33 y luego escribir la funcin: =FRECUENCIA($B$2:$F$13;$D$27:$D$33) y
presionar la combinacin de teclas Ctrl + Shift + Enter . Se ha creado una frmula
matricial. Se debe tener en cuenta que la funcin FRECUENCIA solo va a devolver un
resultado satisfactorio cuando se trabaje con los limites superiores de intervalo cerrado
o con los lmites reales.
En M27
=PROMEDIO(C27:D27) y rellenar hasta M33
El resto de frmulas son anlogas al ejemplo 2
Para el primer intervalo, el lmite inferior es el
valor mnimo de todos los datos y el lmite
superior se obtiene sumado al lmite inferior la
amplitud y restando un cambio mnimo.
Para el segundo intervalo, el lmite inferior es el
lmite superior de la clase 1 ms un cambio
mnimo y el lmite superior se obtiene igual que
el lmite superior de la clase 1. Se repite el
mismo procedimiento para todas las clases.
Tablas de frecuencias
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 8 de 25
Visualizacin en Excel
Ejemplo 5.- Variable cuantitativa continua
A continuacin se presenta la talla de los trabajadores de la empresa de vigilancia privada
Resguardo Total S.A., se pide elaborar una tabla de distribucin de frecuencias de dato
continuo.
1.90 1.73 1.65 1.65 1.95
1.85 1.75 1.73 1.68 1.83
1.70 1.77 1.75 1.73 1.77
1.75 1.79 1.77 1.69 1.74
1.59 1.93 1.98 1.73 1.70
1.67 1.90 1.85 1.77 1.75
1.75 1.79 1.79 1.87 1.79
1.77 1.82 1.80 1.83 1.80
FORMULA EN EXCEL
Valor menor : 1.58 En D16 =MIN(TALLAS)
Valor mayor : 1.98 En D17 =MAX(TALLAS)
Rango : 0.4 En D18 =D17-D16
Total Datos : 40 En D19 =CONTAR(TALLAS)
Nm Clases : 7 En D20 =REDONDEAR.MAS(1+3.322*LOG(D19);0)
Amplitud de clase : 0.06 En D21 =REDONDEAR.MAS(D18/D20;2)
Cambio mnimo : 0.01
Como son datos continuos, se debera de crear intervalos semiabiertos, para ello se procede
as:
Rango B3:F10,
definido con el
nombre TALLAS
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 9 de 25
Para el primer intervalo terico, el lmite inferior
es el valor mnimo de todos los datos y el lmite
superior se obtiene sumado al lmite inferior la
amplitud, para el segundo intervalo, el lmite
inferior es el lmite superior de la clase 1 y el
lmite superior se obtiene como en el caso
anterior. Se repite el mismo procedimiento para
todas las clases. Para crear lo limites reales se
restan la mitad del cambio mnimo a todos los
lmites tericos.
TEORICOS REALES
Clases Lim
Inf
Lim
Sup
Lim
Inf
Lim
Sup
1 1.58 1.64 1.575 1.635
2 1.64 1.70 1.635 1.695
3 1.70 1.76 1.695 1.755
4 1.76 1.82 1.755 1.815
5 1.82 1.88 1.815 1.875
6 1.88 1.94 1.875 1.935
7 1.94 2.00 1.935 1.995
Tabla N 5.- Talla de los trabajadores de la empresa Resguardo Total S.A.
Agosto - 2007
Marca de clase
TEORICOS REALES
Terico Real
i Lim
Inf
Lim
Sup
Lim
Inf
Lim
Sup
Intervalo f
i
h
i
h
i
(%) F
i
H
i
X
i
Xi
1 1.58 1.64 1.575 1.635 [ 1.58 - 1.64 > 1 0.025 2.50% 1 0.025 1.61 1.605
2 1.64 1.70 1.635 1.695 [ 1.64 - 1.70 > 5 0.125 12.50% 6 0.150 1.67 1.665
3 1.70 1.76 1.695 1.755 [ 1.70 - 1.76 > 12 0.300 30.00% 18 0.450 1.73 1.725
4 1.76 1.82 1.755 1.815 [ 1.76 - 1.82 > 11 0.275 27.50% 29 0.725 1.79 1.785
5 1.82 1.88 1.815 1.875 [ 1.82 - 1.88 > 6 0.150 15.00% 35 0.875 1.85 1.845
6 1.88 1.94 1.875 1.935 [ 1.88 - 1.94 > 3 0.075 7.50% 38 0.950 1.91 1.905
7 1.94 2.00 1.935 1.995 [ 1.94 - 2.00 > 2 0.050 5.00% 40 1.000 1.97 1.965
40 1.000 100.00%
FUENTE: Dpto de personal.
Notas de la tabla anterior
a) Los limites reales siempre resultan el mismo valor as se calcule los lmites tericos como
datos discretos o continuos
b) La marca de clase sufre una variacin se calcula con limites tericos y reales, cuando se
trabaja con intervalos cerrados no existe dicha variacin. Por cuestiones prcticas, la marca
de clase se trabaja generalmente con los lmites tericos.
c) El resto de frmulas de la tabla anterior son idnticas al ejemplo Nro. 3
V
i
s
u
a
l
i
z
a
c
i
n
e
n
E
x
c
e
l
Tablas de frecuencias
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 10 de 25
2.3 Frecuencias MAYORES QUE Y MENORES QUE.
Las frecuencias menores que corresponden a las frecuencias acumulas y para
encontrar las frecuencias mayores que, se debe tomar el total de los datos para la
primera frecuencia mayor que restando las frecuencias absolutas acumuladas y
luego ir haciendo el mismo procedimiento para todas las clases
Tabla N6.- Cantidad de inspecciones de un grupo de 80 productos
Agosto del 2010
i Lim
Inf
Lim
Sup
f
i
F < Que F > Que
1 4 6 10 10 70
2 7 9 14 24 56
3 10 12 24 48 32
4 13 15 16 64 16
5 16 18 9 73 7
6 19 21 5 78 2
7 22 24 2 80 0
80
FUENTE: Dpto de Produccin del laboratorio FARMILAB S.A.
Resumen de formulas en Excel para la tabla N6
En F5
=E5
En F6
=F5+E6 y rellenar hasta F11
En G6
=$E$12-F5 y rellenar hasta G11
Responda las siguientes preguntas
a) A cuntos productos se les hizo 16 o mas inspecciones?
La respuesta se puede leer en la columna F > Que, siendo la respuesta 7.
b) A cuntos productos se les hizo 11 o menos inspecciones?
Se busca la columna F < Que, y encuentra que la clase 10-12 tiene por
frecuencia absoluta simple el valor 24, entonces dividimos este valor entre 3,
obtenindose 8, luego este valor se lo restamos a 48, resultando que la
respuesta final es 40.
Actividades
1. Responder las siguientes interrogantes:
a) Que es la estadstica descriptiva.?
b) Describa detalladamente los diferentes tipos de clasificacin que existen para
las variables estadsticas.
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 11 de 25
c) Cmo es el proceso de investigacin estadstica?
2. La siguiente tabla clasifica en categoras 10614000 visitas al consultorio de
especialistas en enfermedades cardiovasculares de pacientes en un pas, segn la
duracin de cada visita, una duracin de cero minutos indica que el paciente no tuvo
contacto directo con el especialista.
Duracin
(Minutos)
Cantidad de visitas
(miles)
0
1-5
6-10
11-15
16-30
31-60
61+
390
227
1023
3390
4431
968
185
a) Cul es la mayor frecuencia relativa?
b) Elabore una tabla de distribucin de frecuencias e interprete los resultados.
3. A continuacin aparecen las frecuencias relativas de concentraciones de plomo en la
sangre de dos grupos de trabajadores mineros, uno examinado en 1979 y otro en
1993.
Plomo en la sangre
( g/dl)
1979
(%)
1993
(%)
< 20
20 29
30 39
40 49
50 59
60 69
70 79
80
11.5
12.1
13.9
15.4
16.5
12.8
8.4
9.4
37.8
14.7
13.1
15.3
10.5
6.8
1.4
0.4
a) En cual de los dos aos tienden los trabajadores a presentar niveles mas
bajos de plomo en la sangre?
b) Calcule las frecuencias relativas acumuladas de trabajadores. Construya
polgonos de frecuencias acumuladas con los datos de la tabla anterior.
4. Cantidad de miligramos de una sustancia contaminante encontrada en 75 muestras
recogidas de diferentes calles de la ciudad de Arequipa el 19 de noviembre del 2010
a las 13:00 horas.
11,0 7,1 7,0 11,7 7,4 4,5 10,9 10,4 4,9 5,1 12,8 8,4 8,7 13,0 13,0
5,1 5,7 8,7 6,6 5,2 8,4 7,0 9,9 7,5 4,4 11,4 9,5 5,8 11,3 13,7
8,3 9,4 11,1 6,0 10,2 7,5 7,2 10,5 6,3 5,9 10,1 7,2 8,8 9,8 11,9
11,6 10,0 2,1 3,4 5,8 9,1 9,5 4,0 7,5 8,4 8,1 12,9 7,8 9,9 5,0
9,0 10,2 2,7 12,3 5,0 13,7 8,4 14,9 15,7 11,7 7,1 13,0 12,8 7,4 7,5
a) Elabore una tabla de distribucin de frecuencias.
Grficos estadsticos
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 12 de 25
Grficos estadsticos
Objetivo
Crear los principales grficos estadsticos en Excel.
1 Presentacin grafica de datos
A pesar de la gran ayuda que prestan las tablas y cuadros con informacin organizada,
no todos los pblicos alcanzan a comprenderla o no disponen del tiempo suficiente para
analizarla. Es por ello que la mayora de los investigadores acostumbran a reforzar la
descripcin a travs de dibujos, generalmente con formas geomtricas, que ayudan a
visualizar el comportamiento de las variables tratadas.
Los grficos son una de la maneras de presentar un resumen de datos, por ejemplo
cuando un gerente desea analizar la informacin de la ventas de un determinado
producto en varias zonas y comparar el posicionamiento que tiene, es probable que el
primer vistazo que se de a los datos sea el de un grafico para hacerse una idea inicial de
cmo esta su participacin en el mercado y de all recin se harn algunos anlisis
posteriores, demostrndose de esta manera la importancia de los grficos.
En esta seccin se proceder a trabajar directamente en la creacin de graficos
estadsticos haciendo uso de Microsoft Excel XP.
1.1 Grafico circular
Se creara un grafico circular con los datos de la tabla Nro 3
Tabla N 3.- Distrito de procedencia de los trabajadores de la empresa DITESSUR SRL
Octubre del 2010
Distrito f
i
F
i
h
i
h
i
(%) Grados
Cayma 4 4 0,0590 5,90% 21,24
J.L.B.y R. 18 22 0,2650 26,50% 95,40
Miraflores 10 32 0,1470 14,70% 52,92
Paucarpata 13 45 0,1910 19,10% 68,76
Selva Alegre 7 52 0,1030 10,30% 37,08
Cerro Colorado 14 66 0,2060 20,60% 74,16
Characato 2 68 0,0290 2,90% 10,44
68 1,0000 100,00% 360,00
FUENTE.- Archivos del registro del Dpto. de personal.
2
Grficos estadsticos
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 13 de 25
Para crear este grafico, se proceder primero a realizar lo siguiente:
1. Crear una copia de la hoja Frecuencias_Cualitativo, haciendo clic derecho
en la hoja Frecuencias_Cualitativo, y escoger mover o copiar.
2. Grabar el archivo creado con el nombre Grafico Circular.
3. Seleccionar B14:C20.
Activar esta
casilla de
verificacin.
Escoger la
opcin nuevo
libro.
Presionar Aceptar
1
2
3
Grficos estadsticos
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 14 de 25
4. Iniciar el asistente para grficos y seleccionar las opciones mostradas y
presionar el boton Finalizar.
5. Finalmente dar el formato al grafico, segn se desee.
1.2 Histograma con su polgono de frecuencias
Un histograma se construye dibujando barras contiguas que tienen como base la
amplitud de cada intervalo y como alturas las frecuencias respectivas, sin ninguna
separacin entre las respectivas clases.
Un polgono de frecuencias, es un grafico de lneas que une las marcas de clase
de cada intervalo a la altura de la frecuencia simple, ya sea absoluta o acumulada.
Grafico Nro 1: Distrito de Procedencia de los trabajadores de la empresa
DITESSUR
J.L.B.y R.
26.47%
Miraflores
14.71%
Paucarpata
19.12%
Cayma
5.88% Characato
2.94%
Cerro Colorado
20.59%
Selva Alegre
10.29%
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 15 de 25
Se crear, un grafico con los datos de la hoja F>Que y F<Que, para ello cree una
copia a dicha hoja en un libro nuevo de la misma manera como se procedi con el
grafico circular y realice lo siguiente.
1. Seleccionar D4:E12
2. Iniciar el asistente para grficos, y presionar el botn finalizar.
3. Hacer clic derecho sobre cualquiera de las barras y escoger la opcin
sealada.
0
5
10
15
20
25
30
[ 01 -
03 ]
[ 04 -
06 ]
[ 07 -
09 ]
[ 10 -
12 ]
[ 13 -
15 ]
[ 16 -
18 ]
[ 19 -
21 ]
[ 22 -
24 ]
[ 25 -
27 ]
Serie1
A partir de este
grafico se
personalizar, hasta
que tenga la
apariencia correcta.
Grficos estadsticos
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 16 de 25
4. Luego en la ficha opciones, en ancho de rango colocar 0 (cero) y aceptar.
5. Hacer clic derecho sobre cualquiera de las barras y escoger la opcin datos
de origen.
6. En la ficha serie, presionar el botn agregar.
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 17 de 25
7. De la opcin valores, presionar el botn seleccionar celdas.
8. Seleccionar el rango E4:E12 y presionar el botn
9. Aceptar el cuadro de dialogo.
10. Clic derecho sobre cualquiera de las nuevas barras creadas y escoger la
opcin tipo de grafico.
11. Seleccionar el tipo de grafico lneas y aceptar.
0
5
10
15
20
25
30
[
0
1
-
0
3
]
[
0
4
-
0
6
]
[
0
7
-
0
9
]
[
1
0
-
1
2
]
[
1
3
-
1
5
]
[
1
6
-
1
8
]
[
1
9
-
2
1
]
[
2
2
-
2
4
]
[
2
5
-
2
7
]
Grficos estadsticos
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 18 de 25
1.3 Ojiva
Una ojiva en un grafico de lneas que se crea con las frecuencias acumuladas.
Como ejercicio, se deja crear la ojiva de porcentajes de la tabla Nro 5
1.4 Pictogramas
Un pictograma es un grafico en el que se representan imgenes de la variable en
estudio es el eje cartesiano, como ejemplo aplicativo, se tiene una pregunta de una
encuesta realizada en la ciudad de Arequipa acerca del consumo de carne de pollo
en 5 distritos, tenindose como resultados lo siguientes:
Tabla Nro 7.- Consumo de Carne de pollo (en Kg por familia en un mes)
Ao Cantidad
Cayma 29
JLByR 18
Yanahuara 21
Selva Alegre 32
Yura 14
Para elaborar el pictograma, se procede de la siguiente manera:
1. Se copian los datos en Excel.
2. Se crea un grafico de tipo columnas simples.
0
5
10
15
20
25
30
35
Cayma JLByR Yanahuara Selva
Alegre
Yura
Serie1
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
1 2 3 4 5 6 7
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 19 de 25
3. Hacer doble clic izquierdo en cualquiera de las columnas y en la ficha
tramas presionar el botn efectos de relleno.
4. En la ficha imagen presionar el botn seleccionar imagen y buscar la
imagen apropiada a la variable en estudio
5. Una vez escogida la imagen, presionar el botn aceptar.
Actividades
Elabore dos grficos para cada uno de los problemas del capitulo anterior.
Antes de crear este
grafico, se debe tener
imgenes guardadas
en el ordenador.
Buscar la imagen:
Gallina.wmf la que se
encuentra en su
carpeta de trabajo.
0
5
10
15
20
25
30
35
Cayma JLByR Yanahuara Selva
Alegre
Yura
Serie1
Medidas Estadsticas
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 20 de 25
Medidas Estadsticas
Objetivo
Calcular las principales medidas estadsticas en Excel, haciendo uso de la diversas
funciones y complementos que posee este programa, para datos no agrupados.
Encontrar las medidas estadsticas en Excel para datos agrupados.
1 Medidas Estadsticas para datos no agrupados.
Consideremos los siguientes datos que se refieren al movimiento mensual en dlares de
250 clientes del Banco de Crdito del Per para sus clientes que pertenecen al estrato
alto de la ciudad de Arequipa en el mes de octubre del 2006
5263 7803 4631 5688 5393 6969 7848 7024 2692 2702
6904 4479 5274 7379 5508 5130 9354 5551 5811 5667
9355 5500 7273 5728 4609 5416 2559 7056 6012 6587
5370 7647 4708 4350 4545 8043 4818 5743 6095 6509
5096 5669 7221 3673 6227 4153 5717 6989 4162 6300
5857 7304 4798 7724 5091 6551 7814 6286 6262 4002
7907 6000 6233 3640 6370 5415 4847 2948 2179 5411
5211 6133 4393 7884 6693 4301 6266 5875 3671 7144
7291 4774 5943 6411 3762 4398 6215 5487 3341 5061
4348 6606 7155 7856 4462 4192 6897 5357 5201 3886
7258 6071 5380 5161 5652 5607 3411 6496 6594 4883
6779 4937 7451 5683 4305 5059 5675 7205 6997 6663
5457 4662 5751 5760 6919 5463 7722 6830 7059 6930
6427 6463 5007 5712 6281 5369 7912 6415 7012 4115
6703 2479 6554 6233 7699 5535 4925 5488 6439 3960
6640 5757 6753 3854 6265 5685 7690 6736 5881 5112
8138 4757 6845 5688 5674 7645 6920 7306 6065 5149
4195 4068 3703 7959 7824 9268 6632 4208 8519 6809
6353 5927 7803 3857 8582 6224 7849 7192 7638 4987
5182 6797 5924 4419 5652 5160 9133 4600 5311 6199
4230 8186 6085 5639 6586 5763 5133 5355 8880 6138
7072 5158 7028 8949 7253 6708 3569 4879 3781 8461
7887 6490 6103 6881 6682 8515 6825 4985 4685 7920
6172 8554 6309 4332 7251 8528 8942 5767 5407 3633
6383 6108 5578 4352 4140 8248 6269 4159 7518 5834
3
Medidas Estadsticas
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 21 de 25
Para encontrar las diversas medidas estadsticas en Excel, se debe introducir los datos
en una hoja de clculo, considerando que estos deben estar en una sola columna.
Vamos a suponer que hemos introducido los datos tal como estn en la tabla anterior, la
pregunta es: Cmo hara para pasar los datos de una tabla de 25 filas por 10 columnas,
a una tabla de 250 filas por una columna?
Los datos han sido introducidos en el rango A7:J31, entonces se procede de la siguiente
manera:
Se selecciona la opcin complementos del men herramientas, y se activa la opcin
Herramientas para Anlisis.
Seleccionar del men Herramientas el comando Anlisis de Datos, seleccionar la
opcin muestra y aceptar.
Escoger las opciones que a continuacin se muestran y presionar aceptar.
Seleccionar los
datos.
Activar la opcin
peridico y como
periodo colocar 1.
Colocar el nombre
para la hoja nueva
donde aparecern
los datos.
Medidas Estadsticas
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 22 de 25
Una vez que los datos estn en una hoja nueva, activar el comando Anlisis de Datos
del men herramientas, seleccionar la opcin Estadstica Descriptiva y aceptar.
Escoger las opciones que a continuacin se muestran y presionar aceptar.
Finalmente los resultados hallados son:
Columna1
Media 5973.78
Error tpico 89.8641721
Mediana 5935
Moda 7803
Desviacin estndar 1420.877319
Varianza de la muestra 2018892.357
Curtosis -0.221722878
Coeficiente de asimetra -0.022460424
Rango 7176
Mnimo 2179
Mximo 9355
Suma 1493445
Cuenta 250
Nivel de confianza(95.0%) 176.990795
Comentarios acerca de los resultados obtenidos:
a) La Media, es la media aritmtica de los datos de la muestra y se halla con la frmula:
Seleccionar los
datos.
Colocar un rango
de salida, para que
el resultado salga
en esta hoja.
Activar las
opciones
mostradas.
1
2
3
i
X
X
N
=
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 23 de 25
La interpretacin seria que el movimiento promedio mensual en dlares de 250 clientes
del Banco de Crdito del Per para sus clientes que pertenecen al estrato alto de la
ciudad de Arequipa en el mes de octubre del 2006 es de $ 5973.78
b) El error tpico, se calcula con la formula:
El error tpico es la desviacin estndar de la distribucin muestral de medias.
c) Recordemos que la mediana es el valor que divide a la muestra en dos subconjuntos
con el mismo numero de elementos cada uno. Para nuestra muestra podemos decir
que el 50% de los clientes realiz movimientos entre $2179 y $5935, 50% de los
clientes realizo movimientos entre $5935 y $9355.
d) La moda es el valor que mas se repite, en nuestro datos existen 4 valores que se
repiten dos veces, el Excel lo que ha hecho es ordenar los datos en forma
descendente y el primer valor que se repeta mas veces (2, en nuestro caso), lo ha
tomado como si fuera la moda, siendo el valor 7803. Si es que no hubiese ningn
valor que se repita dos o mas veces, Excel devolvera el valor #!N/A, a la altura de la
moda. Los otros dos valores son 6233, 5688 y 5652. Para encontrar dichos valores
se debe hacer lo siguiente:
e) Para la desviacin estndar se puede utilizar cualquiera de estas formulas
El movimiento mensual en dlares de los clientes del Banco de Crdito del Per que
pertenecen al estrato alto de la ciudad de Arequipa en el mes de octubre del 2006 se
dispersa en promedio $1420.88 con respecto al valor central.
f) Recordemos que la varianza es la desviacin estndar elevada al cuadrado. Se
pueden usar estas formulas alternativas para su calculo.
X
N
=
a) Ordenar los datos en forma
descendente.
b) En la Celda B1, escribir esta funcin y
rellenar hasta la celda B250.
( )
2
1
n
i
i
X X
n
( )
2
1
1
n
i
i
X X
s
n
=
Medidas Estadsticas
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 24 de 25
g) La curtosis es el estadgrafo de asimetra que mide el grado de apuntamiento o
elevacin de una curva estadstica comparada con la curva normal. Una curtosis
positiva indica una distribucin relativamente elevada, mientras que una curtosis
negativa indica una distribucin relativamente plana. La formula para calcularla es:
En nuestro una curtosis de -0.223, nos indica que la distribucin de datos es platicurtica,
es decir, es mas achatada que la curva normal.
h) El coeficiente de asimetra o grado de asimetra de una distribucin, es la
inclinacin que adopta una curva estadstica respecto de la media aritmtica. Esta
inclinacin se llama cola, que puede ser ms prolongada a la izquierda o derecha
de sus media aritmtica. La formula para calcularla es:
En nuestra muestra el coeficiente de -0.022 nos indica que la cola de los datos se
presenta ligeramente a la izquierda de la media aritmtica.
i) El rango es la diferencia entre el mayor y menor de todos los valores, para nuestro
caso el rango ha sido calculado 7176 = 9355 - 2179.
j) El nivel de confianza, sirve para calcular un intervalo de confianza para la media
poblacional, dicho intervalo, de manera manual se calcula con la formula:
Entonces el intervalo de confianza seria:
I = [5796.79 ; 6150.77]
2 Medidas estadsticas para datos agrupados.
Los datos agrupados que analizaremos, sern aquellos que se vieron en las tablas de
distribucin de frecuencias para datos tipo 3. Se presentara un ejemplo a manera de
realizar un anlisis de sensibilidad con los datos presentados, recordemos que un
anlisis de sensibilidad responde a la pregunta: Qu pasara si?. Para ello se
presentar un modelo creado en Excel.
2 2
2
1
n x ( x )
s
n( n )
=
2 2
2
2
n x ( x )
n
=
4
2
1 3 1
1 2 3 2 3
i
X X n( n ) ( n )
Curtosis
( n )( n )( n ) s ( n )( n )
| |
+
=
| `
\
)
3
1 2
i
X X n
Sesgo
( n )( n ) s
| |
=
|
\
2 /
s
x z
n
=
Bioestadstica
Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Pgina 25 de 25
Considere el siguiente modelo:
Los siguientes datos se refieren a una muestra del nmero de ventas realizadas por los
trabajadores de la tienda Estilos durante la primera quincena del mes de mayo del 2006.
56 12 62 68 56 75 52 73
60 66 29 60 73 39 59 72
73 54 62 42 62 33 40 65
55 19 23 57 78 68 82 76
37 65 17 36 15 79 33 66
66 52 56 80 17 28 63 83
88 66 60 47 92 65 AB XY
AB y XY, pueden tomar cualquier valor de dos dgitos, para un caso practico puede
considerar lo siguiente, AB representa los dos ltimos dgitos de su cdigo de ingreso y
XY representa los dos ltimos dgitos de su DNI (Si fuese menor de edad colocar el da
de su cumpleaos). Si se tratase de un examen que se le toma a un grupo de alumnos.
Los valores AB y XY, harn que se cree intervalos de diferentes frecuencias absolutas
simples. Se proceder a crear una tabla de distribucin de frecuencias de cinco clases.
Para trabajar este ejemplo abrir el archivo
Actividades
a) Resolver los problemas correspondientes al capitulo 2 del libro_1 de
Bioestadstica proporcionado en el desarrollo del presente curso. (Paginas 68 a
72).
b) Encontrar las diferentes medidas estadsticas estudiadas con cada uno de los
datos del archivo e interpretar los resultados.