Libro de Estadística Saraza
Libro de Estadística Saraza
Libro de Estadística Saraza
UNISARC
TABLA DE CONTENIDO
Pág.
INTRODUCCIÓN 7
UNIDAD I. DEFINICIONES GENERALES 9
INTRODUCCIÓN 9
1.1 Definición de estadística 10
1.2 Población 10
1.3 Muestra 10
1.4 Estadístico 11
1.5 Parámetro 11
1.6 Variable 12
1.7 Notación con subíndices 13
INTRODUCCIÓN 14
INTRODUCCIÓN 30
INTRODUCCIÓN 36
4.2.4. Mediana 51
4.2.4.1 Cálculo de la mediana para datos que no están en intervalos 51
4.2.4.2 Mediana para datos agrupados en intervalos 53
4.2.5 Cuartiles 55
4.2.5.1 Cálculo de los cuartiles 55
4.2.6 Deciles 55
4.2.6.1 Cálculo de los deciles 56
4.2.7 Percentiles 56
4.2.7.1 Cálculo de los percentiles 57
4.2.8 Moda 58
4.2.8.1 Moda para datos agrupados en intervalos 59
4.2.9 Uso de las medidas de centralización 60
INTRODUCCIÓN 63
INTRODUCCIÓN 88
INTRODUCCIÓN 93
INTRODUCCIÓN
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 7
De esta manera la estadística hace presencia en todos los campos del saber, su
aporte avanza desde sencillas aplicaciones relacionadas con la interpretación de
la información y la elaboración de gráficos hasta la obtención de conclusiones
relacionadas con estudios de mercado, proyección de compras y ventas, análisis
de comportamientos futuros, análisis de diferencias significativas entre
tratamientos, (manejo de diferentes materias primas, insumos, comportamiento e
incidencia de la temperatura, optimización de procesos, entre otros).
8 CARLOS HERNAN SARAZA NARANJO
UNIDAD I
DEFINICIONES GENERALES
INTRODUCCIÓN
1.2 Población
Es todo conjunto de datos del cual se quiere realizar un estudio. Por ejemplo: se
quiere realizar un estudio referente a la edad de los animales tratados por consulta
general en una clínica veterinaria. Entonces la población son todos los animales
tratados por consulta general en la clínica. El tamaño de la población se nota N.
Por ejemplo, si en la clínica se trataron 140 animales entonces N=140
1.3 Muestra
Es todo subconjunto tomado de una población de tal manera que pueda ser
representativo de esta. Por ejemplo: una muestra de animales tratados por
consulta general en una clínica. El tamaño de la muestra se nota n.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 11
Una de las características principales para que una muestra sea representativa de
una población es que ella sea obtenida al azar, es decir, que el investigador no
participe, con su propia decisión, al momento de elegir los elementos de la
población que harán parte de la muestra. (Los textos de estadística, las
calculadoras y las aplicaciones estadísticas en computador reproducen tablas de
números aleatorios para facilitar este trabajo).
Aunque un estudio sería más confiable tomando todos los datos de la población
en la mayoría de los casos esto resulta imposible por la dificultad del estudio, así
como por los costos. Entonces el estadístico generalmente trabaja con muestras.
1.4 Estadístico
1.5 Parámetro
1.6 Variable
Es toda cantidad que puede tomar diferentes valores en un estudio. Por ejemplo:
el número de huevos recolectados por día en las fincas del eje cafetero; el valor de
los salarios asignados a los empleados de clínicas; las variedades de pastos que
se cultivan en una región; la temperatura diaria que se registra en una hacienda
ganadera.
VARIABLES
CUALITATIVA CUANTITATIVA
Estrato social;
Color, raza, sexo tamaño dado Cantidad de Peso de guayabas
como cualidad trabajadores
contratados por finca
Figura No. 1. Clasificación de las variables
El símbolo Xi se lee equis sub i, representa el valor i-ésimo que toma una variable
en una muestra. Así, por ejemplo, el símbolo X3 representa el tercer dato de la
variable en la muestra. Es necesario aclarar que los subíndices no representan
mayor o menor valor, sólo indican ubicación.
El primer trabajador encuestado es Rafael quien afirma que tiene 5 hijos; Alberto
responde que tiene 6 hijos; Teresa dice que tiene 4 hijos; Oscar responde que
tiene 7 hijos y Mariela afirma que tiene 3 hijos.
UNIDAD II
DISTRIBUCIÓN DE FRECUENCIAS
INTRODUCCIÓN
Definición
142 145 140 142 143 144 142 145 140 148 138 146
144 143 138 140 142 147 144 140 142 145 138 140
138 138 138 140 140 140 140 140 142 142 142 142
142 143 143 144 144 144 145 145 145 146 147 148
Los datos, que constituyen la variable de estudio, se notan Xi, con ellos se
construye la distribución de frecuencias para lo cual se definen a continuación
cuatro tipos de frecuencias: frecuencia absoluta, frecuencia absoluta acumulada,
frecuencia relativa y frecuencia relativa acumulada
Se simboliza fi. Se define como el número de veces que se repite cada valor de la
variable. La suma de las frecuencias absolutas es igual a n. (Tabla No. 1)
16 CARLOS HERNAN SARAZA NARANJO
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 17
fi
hi .100
n
Se simboliza Hi. Es el peso relativo que cada frecuencia absoluta acumulada tiene
con relación al tamaño de la muestra. Se obtiene dividiendo cada frecuencia
absoluta acumulada entre n. En forma práctica se obtiene sumando
sucesivamente la columna de frecuencias relativas. La última frecuencia relativa
acumulada es igual a 1 o a 100%. (Tabla No. 1).
Con base en las definiciones dadas para cada tipo de frecuencias, se obtiene la
distribución de frecuencias que se observa en la tabla No 1.
18 CARLOS HERNAN SARAZA NARANJO
Tabla No. 1.
INTERPRETACIÓN DE LA TABLA
A continuación se formulan algunas preguntas referentes a la tabla, cada una con
su respuesta correspondiente, trate de resolver los enunciados antes de consultar
las respuestas:
RESPUESTAS
El procedimiento de construcción de
intervalos también se utiliza para
variable discreta cuando la variable
toma muchos valores diferentes
Es necesario aclarar que los métodos para construir intervalos son variados. Aquí
se expone uno de tantos métodos, lo que se hará utilizando un ejemplo.
El primer paso para iniciar el estudio consiste en ordenar los datos en forma
ascendente, procedimiento que aparece a continuación
1,5 1,5 1,5 1,7 1,7 1,7 1,7 1,7 1,8 1,9 1,9 1,9 2,0 2,0 2,0 2,0
2,0 2,0 2,0 2,0 2,0 2,4 2,4 2,5 2,5 2,6 2,6 2,7 2,8 2,8 2,8 2,8
2,8 2,8 2,8 2,9 2,9 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,1 3,1 3,3 3,3
3,4 3,4 3,4 3,5 3,5 3,5 3,6 3,6 3,6 3,6 3,6 3,6 3,6 3,6 3,6 3,6
3,7 3,7 3,7 3,8 3,8 3,8 3,8 3,8 3,8 3,9 3,9 3,9 4,0 4,0 4,1 4,1
Una vez ordenados los datos se procede a construir los intervalos de clase.
Aunque para la construcción de los intervalos existen diversos métodos una regla
general utilizada por los autores consiste en asegurar que todos los intervalos
tengan igual tamaño. En el presente libro se desarrolla uno de tantos métodos
para la construcción de intervalos así:
R = DM – Dm
m= 1+ 3,3 log n
Para el ejemplo m= 1+3,3 log 80; m= 7,28; entonces m= 7 intervalos
C = R/m
Para el ejemplo
C = 2,6/6 C = 0,4333
De tal manera que, aproximando con un solo decimal, resulta que C = 0,5
El límite inferior del primer intervalo resulta de restar la diferencia entre los
rangos al dato menor de la muestra que es 1,5.
Para obtener el siguiente límite inferior se pasa al valor siguiente al límite superior,
dependiendo de los decimales que se están utilizando, es decir, si se trabaja con
unidades se pasa a la unidad siguiente, si se trabaja con décimas a la décima
siguiente, si con centésimas, a la centésima siguiente. A este límite inferior se
suma el tamaño del intervalo.
3,5 – 4,0
4,1 – 4,6
Al terminar la construcción de los intervalos es necesario comprobar que todos los
datos de la muestra queden incluidos en ellos. Es decir, que los intervalos inicien
en un valor menor o igual que el dato menor de la muestra y que terminen en un
valor mayor o igual que el dato mayor de la muestra. En algunos casos el último
intervalo sobrepasa al dato mayor, entonces se omite este intervalo y se trabaja
con los intervalos restantes.
li ls
Xi
2
También se pueden obtener dividiendo el tamaño del intervalo entre dos, este
cociente se le suma a los límites inferiores o se le resta a los límites superiores.
Para la muestra de longitudes de pulgas se calcula la primera marca de clase y se
obtiene
1,1 1,6
X1 1,35
2
fi. Es el número de datos de la muestra que son mayores o iguales que cada límite
inferior pero menores o iguales que cada límite superior, es decir, corresponde al
número de datos de la muestra que están comprendidos en cada intervalo. La
suma de frecuencias absolutas es igual a n.
Fi. Es el número de datos de la muestra que son mayores o iguales que el dato
menor de la muestra y a su vez menores o iguales que el límite superior del
intervalo al cual corresponde la frecuencia que se está calculando, es decir, son
los datos comprendidos entre el dato menor de la muestra y el límite superior de
cada intervalo. La última frecuencia absoluta acumulada es igual a n. Las
frecuencias absolutas acumuladas pueden obtenerse sumando sucesivamente la
columna de frecuencias absolutas.
hi. Es el peso relativo que cada frecuencia absoluta tiene sobre el tamaño de la
muestra. Se expresa en porcentaje o en decimales. Se obtiene dividiendo cada
frecuencia absoluta entre n. Si se desea el valor en porcentaje, el cociente
obtenido se multiplica por cien. La suma de frecuencias relativas es igual a 1 si los
valores son decimales o a 100% si los valores se dan en porcentaje.
f 16
h 4 .100 .100 20%
Ejemplo: 4 n 80
Hi. Es el peso relativo que cada frecuencia absoluta acumulada tiene sobre el
tamaño de la muestra. Se obtiene dividiendo cada frecuencia absoluta acumulada
entre n y multiplicando por cien. También puede obtenerse sumando
sucesivamente la columna de frecuencias relativas. La última frecuencia relativa
acumulada es igual a 1 o 100%.
F4 51
H4 .100 .100 63,75%
Ejemplo: n 80
Para construir los intervalos reales se resta un límite inferior y el límite superior
inmediatamente anterior, la diferencia se divide entre dos, este cociente se resta a
los límites inferiores y se suma a los límites superiores. Por ejemplo: 1,7-1,6=0,1;
0,1/2=0,05. Este valor se le resta a 1,1; 1,7; 2,3;…4,1. Este mismo valor se le
suma a 1,6; 2,2; 2,8…4,6)
INTERPRETACIÓN DE LA TABLA
A continuación se formulan algunas preguntas referentes a la tabla, cada una con
su respuesta correspondiente, trate de resolver los enunciados antes de consultar
las respuestas:
RESPUESTAS
13. Se pregunta por pulgas con longitud mayor que 3,4 milímetros y, a su vez,
menor que 2,3 milímetros: no existen pulgas con esas condiciones, 0%.
Con estos datos es posible construir una tabla sencilla en los siguientes términos
Interpretación de la tabla
Los datos de la encuesta se resumen en la figura No. 2 (Para tener claridad sobre
el gráfico que se ha construido, consulte la unidad 3.
80
NÚMERO DE JÓVENES
70
60
50
40 74 67
30 49 56 58
20 34
10
0
do
s
llo
es
jo
Re
rd
ne
a
on
Po
sc
Ce
Co
ar
Pe
m
Ca
TIPO DE CARNE
UNIDAD III
REPRESENTACIÓN GRÁFICA
INTRODUCCIÓN
Los gráficos tienen varias ventajas sobre los datos que contiene la tabla: en primer
lugar, su estética los hace llamativos y motivan a la lectura; en segundo lugar
permiten visualizar fácilmente los valores que sobresalen en una muestra así
como aquellos que se presentan con menor frecuencia.
De igual manera, cada vez es más común que en los seminarios y conferencias
alrededor del mundo, los conferenciantes utilicen gráficos para presentar
argumentos de sus hipótesis y para dejar planteados sus presupuestos sobre
diferentes temas. Condensar en cifras y en gráficos una información constituye un
elemento de confianza para los oyentes de los conferenciantes.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 33
El gráfico más efectivo es aquél que resulte más simple y por lo tanto sólo
debe contemplar la información necesaria.
Todo gráfico requiere un título que identifique el objeto de estudio.
Si el gráfico utiliza ejes, cada uno de los ejes debe estar identificado con la
variable que maneja.
Cada vez que sea necesario, se debe aclarar el contenido del gráfico por
medio de convenciones.
Un gráfico debe ser tan claro que pueda ser interpretado en ausencia de los
datos que lo originaron.
Los gráficos que hacen parte del mismo documento deben ser numerados.
3.2 Histograma
O gráfico de barras. Está compuesto por rectángulos cuyas bases, de igual longitud,
se colocan sobre el eje X y sus alturas, coincidentes con las frecuencias absolutas, se
ubican sobre el eje Y. Se pueden utilizar intervalos reales (barras unidas) o intervalos
de clase (barras separadas). La Figura No. 3 muestra el histograma correspondiente a
la muestra de las longitudes de pulgas de perro, utilizada en la unidad II.
LONGITUD DE PULGAS DE
Longitudes fi
milímetros
PERRO
30
Cantidad de pulgas
27
1,1 – 1,6 3 25
20 18 1,1 – 1,6
1,7 – 2,2 18 15 14
16
1,7 – 2,2
2,3 – 2,8 14 10 2,3 – 2,8
2,9 – 3,4 16 5 3 2 2,9 – 3,4
3,5 – 4,0 27 0 3,5 – 4,0
1 4,1 – 4,6
4,1 – 4,6 2
Longitudes (mm)
La figura muestra que la longitud que más se presenta (barra más alta), es la
longitud comprendida entre 3,5 y 4,0 milímetros; la longitud que menos se
presenta (barra más baja), es la longitud comprendida entre 4,1 y 4,6 milímetros;
la menor longitud encontrada fue 1,1 milímetros mientras que la mayor fue 4,6
milímetros. De igual manera se pueden obtener muchas otras conclusiones.
27
Cantidad de pulgas
30
Longitudes fi
25 18
Milímetros 16
20 14
1,35 3 15
1,95 18 10 3 2
2,55 14 5
0
3,15 16 1.35 1.95 2.55 3.15 3.75 4.35
3,75 27
Longitudes (mm)
4,35 2
Figura No.4. Polígono de frecuencias
El gráfico muestra, por ejemplo, que hubo 18 pulgas con una longitud media de
1,95 milímetros; hay 14 pulgas con longitud media de 2,55 milímetros (nota: el
concepto de media puede ser consultado en la unidad referente a medidas de
centralización, en este caso, la marca de clase es la media de cada intervalo)
Es un gráfico que relaciona los intervalos con las frecuencias relativas. Analiza
porcentualmente la distribución partiendo de la relación que existe entre la
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 35
El gráfico muestra, por ejemplo, que hay 33,75% de pulgas con longitud entre 3,5
y 4,0 milímetros; hay 3,75% de pulgas con longitud entre 1,1 y 1,6 milímetros; hay
20% de pulgas con longitud entre 2,9 y 3,4 milímetros.
Longitudes hi
Milímetros 3%4%
1,1 – 1,6 3,75
1,7 – 2,2 22,50 1,1 – 1,6
2,3 – 2,8 17,50 34%
23% 1,7 – 2,2
2,3 – 2,8
2,9 – 3,4 20,00 2,9 – 3,4
3,5 – 4,0 33,75 18% 3,5 – 4,0
20%
4,1 – 4,6 2,50 4,1 – 4,6
3.5 Ojivas
1,05 80
1,65 77
2,25 59
2,85 45
3,45 29
4,05 2
4,65 0
59
60 51
45
50
35
40 29 Ojiva >
30 21 Ojiva <
20
10 3 2
0
1.05 1.65 2.25 2.85 3.45 4.05 4.65
Longitudes (mm)
El gráfico muestra, por ejemplo, que hay 80 pulgas con longitud mayor que 1,05
milímetros, mientras que no hay pulgas con longitud menor que 1,05 milímetros;
hay 59 pulgas con longitud mayor que 2,25 milímetros en tanto que 21 pulgas
tienen longitud menor que 2,25 milímetros.
38 CARLOS HERNAN SARAZA NARANJO
UNIDAD IV
INTRODUCCIÓN
El análisis que la estadística hace de los datos no puede quedarse sólo en contar
cuántos elementos del conjunto cumplen con cierta característica, es necesario ir
más allá, se requiere realizar mediciones que permitan establecer relaciones entre
los elementos del conjunto y que ayuden a determinar puntos desde los cuales se
miren los valores para dar solidez a los resultados obtenidos.
Para facilitar la comprensión de las fórmulas que se requieren para los diferentes
cálculos, la unidad se inicia con una explicación acerca de la notación sumatoria.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 39
El símbolo
Xi
i 1 se lee sumatoria desde i=1 hasta n de los Xi y representa la
4
X i
a. i 2 = X2+X3+X4+X5 = 4+2+5+(-2) = 9
X
2
i
b. i 1 = X12+X22+X32+X42 = 9+16+4+25 = 54
NOTA: Cuando se requiere simbolizar la suma de n valores, desde i=1 hasta i=n,
Xi
para simplificar el símbolo se escribe
Xi X 1 X 2 X 3 ....... X n
Es decir,
X X i
X X i
30 40 20 50 12 152
30,4
n 5 5
X
X i 8,5 8,2 9,9 9,1 9,4 9,8 9,5 9,7 74,1 9,2655 g/dl
n 8 8
Cuando al querer calcular una media ocurre que uno o más datos se repiten
(frecuencias absolutas), la fórmula a utilizar para el cálculo es:
X
f .x
i i
n
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 41
fi
Donde n=
Nótese que la fórmula indica que se debe multiplicar cada valor de fi por el valor
correspondiente de la variable. Los productos obtenidos se suman y el resultado
de la sumatoria se divide entre n.
Ejemplo:
X
fi . X i 54(22,5) 28(23,4) 72(24,5) 53(25,2) 12(25,5) 5(25,8) 5504,8 24,1285 milímetros
n 224 224
La muestra de perros presentó un diámetro biparietal medio de 24,1285
milímetros.
El cálculo anterior se facilita si se utiliza una tabla con una tercera columna como
se muestra a continuación
42 CARLOS HERNAN SARAZA NARANJO
Se realizó un estudio para determinar el tiempo medio requerido para hacer una
intervención quirúrgica en caballos. Se trabajó con una muestra de 36
intervenciones similares. En la tabla siguiente aparece el registro de los tiempos
en minutos.
Tiempos (minutos) fi xi fi . xi
40,2-40,8 8 40,5 324,0
40,9-41,5 5 41,2 206,0
41,6-42,2 3 41,9 125,7
42,3-42,9 11 42,6 468,6
43,0-43,6 9 43,3 389,7
n =36 1514
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 43
1514
X 42,05 minutos
36
183
X 36,6
5
El cálculo de las desviaciones es el siguiente:
di= 0
28 28 28 28 28 140
X 28
5 5
52 58 81 28 38 257
X1 51,4
5 5
44 CARLOS HERNAN SARAZA NARANJO
64 70 93 40 50 317
X2 63,4
5 5
Ejemplo aplicado:
El tempo medio requerido por los médicos veterinarios para las diferentes
consultas que atienden en una clínica, ha sido registrado en 0,342 horas. Sin
embargo, cuando los médicos tienen en sus consultorios estudiantes en práctica,
cada tiempo de consulta se incrementa en 4,5 minutos. ¿Cuál es el tiempo medio
requerido para las consultas con la presencia de estudiantes practicantes?.
El nuevo tiempo medio es: X 2 20,52 4,5 25,02 minutos que equivalen a 0,417 horas
52 58 81 28 38 257
X1 51,4
5 5
Ejemplo aplicado:
El peso medio de los gazapos que resultan de conejas que reciben la dieta es
33,925 gramos.
X1 =4 X2=9 X3=2
La media de todos los valores, incluidas las tres variables, está dada por:
12 18 11 14 16 4 9 2 2 7 3 4 102
X2 8,5
12 12
46 CARLOS HERNAN SARAZA NARANJO
71 15 16
X1 14,2 X2 5 X3 4
5 3 4
Ejemplos aplicados:
X H 54.500 X M 53.900 X ¿?
3. Para realizar un estudio acerca del tiempo que requieren las peces para
alcanzar el peso de uso en procesos agroindustriales se utilizan dos muestras,
una en una región con temperatura media de 22 °C y otra en una región con
temperatura media de 25°C. Se analizan en total 100 animales. Se obtiene un
tiempo medio de 142,44 días. Los peces de la región con temperatura de 22 °C
arrojaron un tiempo medio de 144 días mientras que los peces de la región con
temperatura de 25 °C arrojaron un tiempo medio de 138 días. ¿Cuántos peces se
manejaron en cada región?
156 6.n 25
156 26 n 25
n 25
6
n22 = 100 – 26
n22 = 74
Se manejaron 74 peces en la región con temperatura de 22 °C.
La media geométrica se calcula por medio de la raíz n-ésima del producto de los n
datos de la muestra, es decir:
n
G n xi
i 1
n
Donde el símbolo i 1 representa la productoria (multiplicación) de los valores de xi
desde i=1 hasta i=n
Ejemplo: los siguientes datos corresponden al precio del dólar, en pesos, durante
8 días.
n
G n xi 8 (1768)(1772)(1820)(1824)(1800)(1850)(1920)(1972)
i 1
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 49
G 8 1,31128x10 26
G 1839,55095
La media geométrica del precio del dólar durante los 8 días fue $1839,55
4.2.2.2 Cálculo de la media geométrica para datos con frecuencias
La media geométrica se calcula por medio de la raíz n-ésima del producto de los n
datos de la muestra, elevado, cada uno de ellos, a la frecuencia correspondiente,
es decir
x
fi
Gn i
i 1
Ejemplo
Variació No. de
n días
0,2 7
0,4 9
0,5 6
0,6 5
0,7 3
n
f
G xi i 30 (0,2) 7 (0,4) 9 (0,5) 6 (0,6) 5 (0,7) 3
n
i 1
G 30 1,39836x10 -12
G 0,402581682
x
fi
Gn i
i 1
Expresando la raíz como potencia se tiene:
1
n n
fi
G xi
i1
Aplicando logaritmos en ambos lados de la igualdad se obtiene
1
n n
fi
log G log xi
i 1
n
1 fi
log G log xi
n i1
Como el logaritmo de un producto se puede separar como la suma de los
logaritmos entonces tenemos que
1 n
log xi i Aplicando de nuevo regla de la potencia para logaritmos se
f
log G
n i1
obtiene
1 n
log G fi log xi
n i1
Para volver al valor de G, obtenemos
1 n
G anti log fi log xi
n i1
Aplicando esta fórmula al ejemplo anterior se obtiene la siguiente tabla:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 51
Variación No. de
% días
0,2 7 -
-0,69897 4,89279003
0,4 9 - -
0,39794001 3,58146008
0,5 6 -
-0,30103 1,80617997
0,6 5 - -
0,22184875 1,10924375
0,7 3 - -
0,15490196 0,46470588
-
11,8543797
1
G anti log (-11,8543797)
30
G anti log - 0,39514599
G 0,402581682
La media geométrica de la variación del interés bancario es 0,4%
n
H n
1
x
i 1 i
52 CARLOS HERNAN SARAZA NARANJO
Ejemplo
Los siguientes datos corresponden al precio del dólar durante 8 días, dado en
pesos:
8
H
1 1 1 1 1 1 1 1
1812 1900 1850 1878 2010 1698 1920 1674
8
H
0,0043558
H 1836,63
n
H n
fi
x
i 1 i
Ejemplo
Variación No. de
% días
0,2 7
0,4 9
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 53
0,5 6
0,6 5
0,7 3
Variació No. de f i / xi
n días
0,2 7 35,00
0,4 9 22,50
0,5 6 12,00
0,6 5 8,33
0,7 3 4,28
82,11
30
H
82,11
H 0,36
4.2.4 Mediana
M e X n 1
2
Ejemplo:
Ordenando los datos se obtiene 37,9; 38,2; 38,4; 38,8; 39,2; 39,8; 40,3
M e X n 1 X 7 1 X 4
2 2
X n X n2
Me 2 2
2
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 55
Ejemplo:
Se toma el dato de la temperatura de 10 perros atendidos en una clínica
veterinaria durante un día. Los datos obtenidos son los siguientes:
Ordenando los datos 37,9; 38,2; 38,4; 38,6; 38,8; 39,1; 39,2; 39,8; 40,3; 41,0
38,8 39,1
Me 38,95 C
2
X n X n2 X 10 X 10 2
X5 X6
Me 2 2
2 2
2 2 2
Lo anterior indica que la mediana es la media de los datos que ocupan el quinto y
el sexto lugares en el conjunto ordenado de valores, en consecuencia,
38,8 39,1
Me 38,95 C
2
n
Fi 1
M e li 2 Cr
fi
56 CARLOS HERNAN SARAZA NARANJO
n 213
106,5
Se calcula 2 = 2
n 106,5 84
Fi 1 M e 242,5 .43
M e li 2 Cr 56
fi
M e 259,77 kilogramos
4.2.5 Cuartiles
Son medidas de posición que dividen una distribución en cuatro partes iguales de
tal manera que cada cuartil corresponde a 25%. Se notan Q1, Q2 y Q3.
El 25% de los datos de la muestra son menores que el cuartil 1 mientras que el
75% de los datos son mayores que el cuartil 1.
El 50% de los datos de la muestra son menores que el cuartil 2 mientras que el
50% de los datos son mayores que el cuartil 2, es decir, el cuartil 2 coincide con
la mediana.
Para calcular uno cualquiera de los cuartiles se procede de igual manera que en el
caso de la mediana utilizando la siguiente fórmula:
r.n
Fi 1
Qr li 4 C r
fi
4.2.6 Deciles
Son medidas de posición que dividen una distribución en diez partes iguales de tal
manera que cada decil corresponde a 10%. Se notan D1, D2, D3,..., D9
El 10% de los datos de la muestra son menores que el decil 1 mientras que el
90% de los datos son mayores que el decil 1.
El 20% de los datos de la muestra son menores que el decil 2 mientras que el 80%
de los datos son mayores que el decil 2; el decil 5 coincide con la mediana
Para calcular uno cualquiera de los deciles se procede de igual manera que en el
caso de la mediana utilizando la siguiente fórmula:
r.n
Fi 1
Dr li 10 Cr
fi
4.2.7 Percentiles
Son medidas de posición que dividen una distribución en cien partes iguales de
tal manera que cada percentil corresponde a 1%. Se notan P1, P2, P3,...,P99
0% P5 P10 P99
5% 10% 99%
Para calcular uno cualquiera de los percentiles se procede de igual manera que en
el caso de la mediana utilizando la siguiente fórmula:
r.n
Fi 1
Pr li 100 Cr
fi
Ejemplo: Se tomó el peso de un lote de pollos que han sido alimentados con una
dieta alternativa. Los pesos encontrados se registran en la siguiente tabla. Se
requiere determinar el peso del 18% de los pollos más livianos; el peso del 25%
de los pollos más pesados y el peso del 40% de los pollos más pesados.
Pesos (Libras) fi Fi Pesos (Libras)
2,0 - 2,6 42 42 1,95 - 2,65
2,7 - 3,3 24 66 2,65 – 3,35
3,4 - 4,0 78 144 3,35 - 4,05 P18
4,1- 4,7 124 268 4,05 - 4,75
4,8 - 5,4 221 489 4,75 - 5,45 Q3;D6
5,5 - 6,1 125 614 5,45 – 6,15
n=614
Nótese que se pidió calcular el 40% de los pollos más pesados, sin embargo, NO
se utilizó el decil 4. Tomando como referencia los animales más pesados y desde
allí marcar el 40%, nos queda por debajo el 60%. Los cálculos se hacen con el
dato que se encentre a la izquierda. Por esta misma razón cuando requerimos
calcular el 25% de los pollos más pesados NO se utilizó el cuartil 1 sino el cuartil
3.
4.2.8 Moda
Se nota mo. Se define como el dato que más se repite en la muestra, es decir, el
dato de mayor frecuencia absoluta. En una muestra puede ocurrir que haya una
moda, en este caso se dice que la muestra es unimodal; puede ocurrir que haya
más de una moda, en este caso la muestra se denomina multimodal; también
puede ocurrir que no haya moda, en este caso la muestra se denomina amodal.
Xi fi X fi Xi f i
1 de
La tabla 1 la izquierda corresponde
i 1 1unimodal, tiene una
a una muestra
2m 218 1 1 2 2
moda 0 ; la tabla del centro
2 2 corresponde a una
1 1
muestra amodal, NO
1 1
tiene moda,
5 5 porque todos los1valores1 de la variable
5 se5 repiten igual número
de veces;
1 2la tabla de la derecha5 2 corresponde a 1una2muestra multimodal
8 4tiene 2 modas: 01 1 181, m0 2 22
(bimodal), m 8 5
1 f i f i 1
M o li C r
M o li Cr
1 2
( f
i i 1f ) ( f i f )
i 1
Ejemplo:
8,8-9,3 41 8,75-9,35
42 13
M o 8,15 .0,6
(42 13) (42 41)
29
M o 8,15 .0,6
29 1)
M o 8,73 metros
La longitud que más se presenta en los trozos de tenia expulsados por bovinos es
8,73 metros.
Xi fi
1 2 X 20,92
2 M e 22
1 5
5
1 4
8
2 1
64 CARLOS HERNAN SARAZA NARANJO
M o 22
M e 20
M o 22
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 65
De acuerdo con este resultado se debe concluir que las ocho personas reciben un
salario medio mensual de $888.000.
De acuerdo con este resultado se debe concluir que las personas de la finca
reciben un salario medio mensual de $767.714. Si se comparan los dos resultados
se podrá concluir que este último es más adecuado para interpretar el salario
medio (está más cercano a todos los datos).
UNIDAD V
MEDIDAS DE DISPERSIÓN Y DE FORMA
INTRODUCCIÓN
5.2 Rango
R = DM - D m
Ejemplo:
X1= 46,62; X2=47,75; X3=47,48; X4=47,58; X5=48,52; X6=50,54; X7= 40,5; X8=43,8
Como puede observarse, el rango es una medida muy fácil de calcular pero a su
vez presenta el inconveniente de que no proporciona buena información acerca
del comportamiento de la muestra; esto ocurre porque el rango sólo considera dos
datos de la muestra olvidándose de los demás.
xi x
M .D.
n Cuando los datos de la muestra se presentan sin frecuencias
f i xi x
M .D.
n Cuando los datos de la muestra se presentan con frecuencias
68 CARLOS HERNAN SARAZA NARANJO
Ejemplo 1:
Ejemplo 2:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 69
Se realiza un estudio sobre el peso de una muestra de camuros que han recibido
una dieta de forraje + concentrado comercial. Se toma el peso de 120 camuros.
Los datos obtenidos en kilogramos se registran en la siguiente tabla:
f i .xi 5613
46,775 kilogramos
Calculando la media resulta n 120
370,65
M .D. 3,08 kilogramos
120
5.4 Varianza
( xi x )2
S2
n Cuando los datos se presentan sin frecuencias
f i .( xi x )2
S2
n Cuando los datos se presentan con frecuencias
Entonces las fórmulas para el cálculo de la varianza corregida son las siguientes:
2 ( xi x ) 2
S n1
n 1 Cuando los datos se presentan sin frecuencias
2 f i .( xi x ) 2
S n1
n 1 Cuando los datos se presentan con frecuencias
Ejemplo 1:
6 7 7 7 9 8 8 8 6 6
9 2 3 5 0 4 7 1 5 6
701,6
S2 77,9555 mmHg 2
9
La presión arterial invasiva sistólica de los cerdos tiene una varianza de 77,9555
mmHg2.
Ejemplo 2
La clínica Veterinaria “Caninos y Felinos” lleva registro de la longitud de los gatos
adultos que recibe para consulta. En la siguiente tabla se resume una muestra de
tales longitudes expresadas en metros.
Longitud fi xi f i .x i xi x ( xi x ) 2 f i .( xi x ) 2
(m)
0,64-0,70 4 0,67 2,68 -0,26 0,0676 0,2704
0,71-0,77 3 0,74 2,22 -0,19 0,0361 0,1083
0,78-0,84 7 0,81 5,67 -0,12 0,0144 0,1008
0,85-0,91 15 0,88 13,2 -0,05 0,0025 0,0375
0,92-0,98 26 0,95 24,7 0,02 0,0004 0,0104
0,99-1,05 32 1,02 32,64 0,09 0,0081 0,2592
n=87 81,11 0,7866
f i .xi 81,11
x 0,93 metros
n 87
0,7866
S2 0,009 metros 2
87
La longitud media de los gatos machos es 0,93 metros. Las longitudes tienen una
varianza de 0,009 metros2.
Si se calculan las desviaciones de cada uno de los datos con respecto a la media,
estas son iguales a cero, por lo tanto resulta que:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 73
0
S2 0
5
Ejemplo:
xi 21
x1 3,5
Calculando la media se obtiene: n 6
Sumando una constante K=5 a cada uno de los datos se obtiene la serie
2 2
Por medio del ejemplo se comprueba que S1 S 2 3,5
74 CARLOS HERNAN SARAZA NARANJO
Ejemplo:
Multiplicando cada valor por una constante arbitraria, por ejemplo K=3, se obtiene
la serie
Entonces las fórmulas para el cálculo de la desviación estándar corregida son las
siguientes:
( xi x ) 2
sn1
n 1 Cuando los datos se presentan sin frecuencias
f i .( xi x ) 2
sn1
n 1 Cuando los datos se presentan con frecuencias
NOTA: debe quedar claro que para obtener la desviación estándar basta con
calcular la raíz cuadrada positiva de la varianza.
Ejemplo 1:
6 7 7 7 9 8 8 8 6 6
9 2 3 5 0 4 7 1 5 6
76 CARLOS HERNAN SARAZA NARANJO
Para calcular la desviación estándar se empieza por hallar la media de la presión arterial
xi 762
x 76,2 mmHg
n 10
701,6
S2 77,9555 mmHg 2
9
La presión arterial invasiva sistólica de los cerdos tiene una desviación estándar de 8,829
mmHg.
Ejemplo 2:
La clínica Veterinaria “Caninos y Felinos” lleva registro de la longitud de los gatos adultos que
recibe para consulta. En la siguiente tabla se resume una muestra de tales longitudes
expresadas en metros.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 77
Longitud fi xi f i .x i xi x ( xi x ) 2 f i .( xi x ) 2
(m)
0,64-0,70 4 0,67 2,68 -0,26 0,0676 0,2704
0,71-0,77 3 0,74 2,22 -0,19 0,0361 0,1083
0,78-0,84 7 0,81 5,67 -0,12 0,0144 0,1008
0,85-0,91 15 0,88 13,2 -0,05 0,0025 0,0375
0,92-0,98 26 0,95 24,7 0,02 0,0004 0,0104
0,99-1,05 32 1,02 32,64 0,09 0,0081 0,2592
n=87 81,11 0,7866
f i .xi 81,11
x 0,93 metros
n 87
0,7866
S2 0,009 metros 2
87
La longitud de los gatos machos tiene una desviación estándar es 0,094 metros.
La temperatura rectal media de una muestra de conejos es 38,9 °C con desviación estándar
de 0,12 °C.
Resulta importante saber qué significa este valor de la desviación estándar. Para hacerlo
existen dos posibilidades.
Este intervalo muestra que analizado el 68,27% de los conejos, es posible encontrar conejos
con temperatura de 38,78 °C mientras que otros tienen temperatura superior a 38,78 °C
pudiendo llegar hasta 39,02 °C.
Este intervalo muestra que analizado el 95,45% de los conejos, es posible encontrar conejos
con temperatura de 38,66 °C mientras que otros tienen temperatura superior a 38,66 °C
pudiendo llegar hasta 39,14 °C.
Este intervalo muestra que analizado el 99,73% de los conejos, es posible encontrar conejos
con temperatura de 38,54 °C mientras que otros tienen temperatura superior a 38,54 °C
pudiendo llegar hasta 39,26 °C.
Es importante notar que para analizar el 99,73% de una muestra simétrica es posible restar y
sumar a la media tres veces la desviación estándar de los datos.
Ejemplo:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 79
Los siguientes datos corresponden al peso, en gramos, de una muestra de loritos, que ha
sido registrado en una clínica veterinaria especializada en aves silvestres.
80 CARLOS HERNAN SARAZA NARANJO
fi xi f i .x i xi x ( xi x ) 2 f i .( xi x ) 2
Peso (g)
f i .xi 22368,6
x 43,35 gramos
n 516
274,56
S2 0,532 g 2
516
S 0,532 g 2 0,729 g
Las loritos tienen un peso medio de 43,35 gramos, con varianza de 0,532 gramos2 y
desviación estándar de 0,729 gramos.
de la muestra afirmamos que el 95,45% de los loritos tienen peso entre 41,892 y
44,808 gramos
El teorema permite escoger cualquier número mayor que 1 y con este número calcular el
porcentaje de la muestra que se va a describir y el intervalo en el que se ubica ese
porcentaje de datos de la muestra:
Ejemplo:
Porcentaje de
fi xi f i .x i xi x ( xi x ) 2 f i .( xi x ) 2
82 CARLOS HERNAN SARAZA NARANJO
grasa
f i .xi 1.004,73
x 3,06%
n 328
14,9561
S2 0,0455 % 2
328
S 0,0455 % 2 0,21 %
Los muestras de leche tienen un contenido medio de grasa de 3,06%, con varianza de
0,0455 %2 y desviación estándar de 0,21%.
a. Para K=3
1 1 8
1 2 % 1 - % % 88,88%
3 9 9
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 83
Entonces se puede concluir que por lo menos el 88,88% de las muestras de leche tienen un
contenido de grasa en el intervalo X 3.S , es decir, por lo menos el 88,88% de las muestras
de leche tienen contenido de grasa en el intervalo 3,06 3(0,21)
Por lo menos el 88,88% de las muestras de leche tienen una cantidad de grasa que oscila
entre 2,43% y 3,69 %.
NOTA: Tenga en cuenta que tanto la campana de Gauss como el teorema de Tchebysheff
calculan tan sólo una aproximación al comportamiento de la desviación estándar, por lo tanto
no le debe extrañar si al hacer los cálculos algunos de los resultados quedan por fuera de la
tabla de datos.
b. Para K=3,5
1 1
1 2
% 1 - % 91,83%
3,5 12,25
Entonces se puede concluir que por lo menos el 91,83% de las muestras de leche tienen un
contenido de grasa en el intervalo X 3,5S , es decir, por lo menos el 91,83% de las muestras
de leche tienen un contenido de grasa en el intervalo 3,06 3,5(0,21)
Por lo menos el 91,83% de las muestras de leche tienen un contenido de grasa entre 2,32%
y 3,79%.
84 CARLOS HERNAN SARAZA NARANJO
5.6 Coeficiente de variación
Se simboliza C.V., es una medida de dispersión relativa que relaciona la desviación estándar
y la media de una muestra. Tiene la propiedad de ser una medida sin unidades razón por lo
cual resulta muy útil para comparar la dispersión de dos o más muestras aunque estas
manejen diferentes unidades. El coeficiente de variación se expresa en porcentaje.
Aunque no existe un valor exacto para indicar cuándo el coeficiente de variación es bueno o
malo, se puede afirmar que valores del coeficiente menores o iguales que 10% indican un
buen grado de homogeneidad en los datos mientras que valores por encima del 10%
corresponden a datos heterogéneos.
Ejemplo 1: los registros de una clínica muestran los valores de temperatura y ritmo cardíaco
en caballos. Los datos obtenidos, en grados centígrados y número de latidos por minuto,
respectivamente, se resumen en las siguientes tablas. Se requiere determinar cuál de las
dos variables: temperatura o ritmo cardíaco resulta más heterogénea.
Temperatura registrada para una muestra de caballos
Temperatura Xi fi f i .X i (X i X )2 f i .( X i X ) 2
°C
36,5-36,7 36,6 24 878,4 0,7056 16,9344
36,8-37,0 36,9 32 1180,8 0,2916 9,3312
37,1-37,3 37,2 55 2046 0,0576 3,168
37,4-37,6 37,5 78 2925 0,0036 0,2808
37,7-37,9 37,8 43 1625,4 0,1296 5,5728
38,0-38,2 38,1 48 1828,8 0,4356 20,9088
n=28
10484,
56,196
0 4
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 85
f i .xi 10484,4
x 37,44 C
n 280
56,196
S 0,44 C
280
0,44
C.V . X 100 1,17%
37,44
Los caballos registraron una temperatura media de 37,44 °C, con desviación estándar de
0,44 °C, para un coeficiente de variación de 1,17%.
Ritmo cardíaco de una muestra de caballos
Ritmo (latidos Xi fi f i .X i (X i X )2 f i .( X i X ) 2
por minuto)
30-31 30,5 14 427 42,5104 595,1456
32-33 32,5 22 715 20,4304 449,4688
34-35 34,5 40 1380 6,3504 254,016
36-37 36,5 78 2847 0,2704 21,0912
38-39 38,5 53 2040,5 2,1904 116,0912
40-41 40,5 73 2956,5 12,1104 884,0592
n=28
10366 2319,872
0
f i .xi 10366
x 37,02 latidos por minuto
n 280
2319,872
S 2,87 latidos por minuto
280
2,87
C.V . X 100 7,75%
37,02
El ritmo cardiaco de los caballos tiene un valor medio de 37,02 latidos por minuto con
desviación estándar de 2,87 latidos por minuto, para un coeficiente de variación de 7,75%.
86 CARLOS HERNAN SARAZA NARANJO
Con los datos obtenidos de las dos tablas se puede concluir que la temperatura de los
caballos tiene menor dispersión que el ritmo cardíaco de estos. Es decir, el ritmo cardíaco
resulta ser más heterogéneo que la temperatura.
Ejemplo 2
Un informe estadístico indica que la altura media de un lote de caballos es 1,62 metros con
desviación estándar de 23,5 centímetros, en tanto que la longitud media es 2,05 metros con
desviación estándar de 27,2 centímetros. Se busca determinar cuál de las dos medidas
resulta más homogénea.
0,235
C.V . X 100 14,5%
1,62
0,272
C.V . X 100 13,26%
2,05
La dispersión de una muestra se puede analizar teniendo en cuenta dos criterios diferentes:
i) la distribución de los datos alrededor de la media; ii) la forma como los datos se alzan en
un gráfico de frecuencias formando picos más o menos pronunciados. Para el primer caso se
utiliza el denominado coeficiente de sesgo, mientras que para el segundo caso se calcula el
coeficiente de curtosis.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 87
Tanto el coeficiente de sesgo como el de curtosis son adimensionales, es decir, no tienen
unidades y se calculan utilizando el concepto de momentos con respecto a la media, los que
se definen a continuación:
Si una variable x que toma valores xi tiene una media X , se define el momento de orden r
con respecto a la media, por medio de la siguiente relación:
m
fi * ( xi x ) r
r n
m1
f i * ( xi x )
Entonces se tiene que n de acuerdo con las propiedades de la
media se tiene que el momento de orden 1 es igual a cero; m1 0 .
m2
f i * ( xi x ) 2
n De acuerdo con las fórmulas ya estudiadas en este libro se tiene que el
momento de orden 2 es la varianza m2 S 2 .
m3
f i * ( xi x ) 3
n Momento de orden tres.
Los momentos 3 y 4 son útiles para analizar el comportamiento de una muestra; el momento
3 permite determinar el sesgo de una muestra mientras que el momento 4 permite determinar
la curtosis.
5.7.2 Sesgo
88 CARLOS HERNAN SARAZA NARANJO
El sesgo es una medida de forma que analiza la simetría o asimetría de una muestra con
relación a un punto central. Si la muestra es simétrica se dice que los datos son normales y
por lo tanto se comportan de igual manera a derecha e izquierda del punto de simetría (ver
figura No. 8); si la muestra tiene una cola más alargada que la otra se trata de una muestra
sesgada a la izquierda (figura No. 9) o sesgada a la derecha (figura No. 10)
En presencia del gráfico resulta fácil determinar si una muestra tiene sesgo o si es simétrica,
pero no es posible determinar de qué magnitud es el sesgo que presenta, para conocer este
elemento se debe calcular el denominado coeficiente de sesgo
Es un valor que permite medir el sesgo de una muestra, se simboliza a3 y está definido así:
m3
a3
s 3 Donde m3 es el tercer momento con relación a la media; s3 es la desviación estándar
elevada al cubo.
El coeficiente de sesgo puede ser negativo, positivo o cero, el valor del coeficiente se
interpreta de la siguiente manera:
29810
x 248,42 muestras de sangre
120
309199,168
s2 2576,66 muestras de sangre2
120
5.7.3 Curtosis
La curtosis es una medida de forma que analiza la manera como los datos se elevan con
respecto a un punto medio de la muestra. Es decir, determina el grado de concentración que
presentan los valores en la región central de la distribución. De acuerdo con la curtosis que
presente una muestra se puede decir que esta es leptocúrtica si existe una gran
concentración de valores; mesocúrtica si hay una concentración normal o Platicúrtica si hay
una baja concentración. (Figura No. 11)
Figura No. 11
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 91
En presencia del gráfico resulta fácil determinar si una muestra es leptocúrtica, mesocúrtica
o platicúrtica, pero no es posible determinar de qué magnitud es la curtosis, para conocer
este elemento se debe calcular el denominado coeficiente de curtosis
Es un valor que permite medir la curtosis de una muestra, se simboliza a4 y está definido así:
m4
a4
s4 Donde m4 es el cuarto momento con relación a la media; s4 es la desviación
estándar elevada a la cuarta potencia.
De acuerdo con esta fórmula de cálculo, el coeficiente de curtosis no puede ser negativo
(potencias pares siempre son positivas o cero), el valor del coeficiente se interpreta de la
siguiente manera:
29810
x 248,42 muestras de sangre
120
309199,168
s2 2576,66 muestras de sangre2
120
92 CARLOS HERNAN SARAZA NARANJO
INTRODUCCIÓN
Las técnicas de conteo permiten hacer este tipo de cálculos estableciendo diferencias
significativas relacionadas con las condiciones que conducen a encontrar el resultado
buscado.
Sea S un suceso que tiene un número constante de resultados (K) y sea n el número de
veces que se repite el suceso.
El número total de resultados posibles en las n veces que se repite el suceso está dado por:
número de resultados K n
Ejemplo: en una preparación de 6 animales para una cirugía cuántos resultados se pueden
presentar referidos a que los animales tengan normal la temperatura.
El número total de resultados posibles de que ocurra S1; y que ocurra S2; y que ocurra S3;
……y que ocurra Sk está dado por:
Ejemplo: Una dieta para un animal que ha sido tratado de cierta enfermedad sugiere el uso
de un tipo de cereal, un tipo de harina, un tipo de carne, un tipo de azúcar y un tipo de
líquido. Para atender la dieta del animal, un productor dispone de 3 tipos de cereal, 5 tipos
de harina, 3 tipos de carne, 4 tipos de azúcar y 2 tipos de líquido. ¿De cuántas formas se
puede variar la dieta?
Ejemplo: un lote de insumos disponibles en un laboratorio debe ser codificado de tal manera
que cada caja tenga un código que la distinga de las demás. Cada código está conformado
por una letra elegida entre la P (Polvo) y L (Líquido); y dos números elegidos entre el 0 y el 9.
Teniendo en cuenta que el primer número no puede ser cero y que los números se pueden
repetir, ¿Cuántos códigos diferentes se pueden diseñar?.
Ejemplos:
Número de rotaciones= 4! = 24
n=15
6.4 Permutación
n!
nPx
( n x )!
Ejemplo: Cuántas permutaciones de 2 elementos cada una pueden obtenerse con los
números 1,2,3,4
n=4 x=2
4! 24
4 P2 12 permutaciones
( 4 2)! 2
n=12 x=3
12! 12!
12 P3 1320
(12 3)! 9!
6.5 Combinación
Ejemplo: Cuántas combinaciones de 2 elementos cada una pueden obtenerse con los
números 1,2,3,4
n=4 x=2
4! 24
4 C2 6 combinaciones
( 4 2)!* 2! 2 * 2
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 97
Las combinaciones que se obtienen son:
Ejemplo: de cuántas maneras se pueden seleccionar tres personas de una clínica para que
reciban un curso de actualización teniendo en cuenta que en la clínica hay 8 hojas de vida
disponibles de personas capacitadas para asistir al curso.
n=8 x=3
8! 40320
8 C3 56
(8 3)!*3! 120 * 6
Se trata, entonces, de un concepto utilizado pero que requiere cuantificación para que pueda
contribuir a solucionar diferentes situaciones del quehacer profesional. De esta manera será
posible establecer resultados tales como cuál es la probabilidad de que una dieta sea
favorable para un animal; qué probabilidad de éxito o de fracaso tiene una producción; que
probabilidad tiene el nacimiento de un macho o de una hembra; cuál es la probabilidad de
que un negocio reporte utilidades, entre otros.
Ejemplos:
x 1
p ( m) 0,5
n 2
2. Una jaula contiene conejos distribuidos así: 8 conejos blancos, 7 conejos negros y 5
conejos grises. Si se extrae un conejo al azar entonces la probabilidad de obtener un
conejo negro está dada por:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 99
x 7
p ( n) 0,35
n 20
n x 13
p(n ) 0,65
n 20
n x 13
q ( n) 0,65 Observe, de los dos resultados
n 20
anteriores, que p(n)+q(n)=1
Propiedad
Ejemplo:
2
p ( m) 0,1111 11,11%
a. 18 Suceso inverosímil
14
p (h m) 0,7777 77,77%
b. 18 Suceso verosímil
4
p ( H ) 0,2222 22,22%
c. 18 Suceso inverosímil
18
p (h H m) 1 100%
d. 18 Suceso cierto
0
p ( h m) 0 0%
e. 180 Suceso imposible
Ejemplos: elegir una hembra y un animal negro; obtener un macho en el primer intento y
obtener una hembra en el segundo intento; elegir tres conejos: el primero blanco, el segundo
blanco y el tercero gris
Antes de definir las operaciones con probabilidades se hace necesario definir dos clases de
muestreo.
7.4.1 Muestreo
Es una técnica que permite obtener muestras representativas de una población. La primera
condición para que una muestra sea representativa es que esta sea obtenida al azar.
Una muestra se puede obtener con remplazamiento o sin remplazamiento. En el primer caso
cada elemento de la población que aparece en una muestra es devuelto a la población antes
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 101
de obtener el siguiente elemento; cuando el muestreo se hace sin remplazamiento un
elemento que aparece en una muestra es retirado de la población antes de extraer el
siguiente elemento.
N constante N variable
Un elemento de Un elemento
la población de la
puede aparecer población
más de una vez sólo aparece
en la muestra una vez en la
muestra
P (A.B) = p(A).p(B/A)
P (A.B.C) = p(A).p(B/A).p(C/A.B)
Ejemplos:
1. Suponga que se tienen 20 conejos en una jaula. 3 de los conejos son blancos, 8 son
grises y los demás son negros. Se escogen dos conejos al azar, sin remplazamiento,
determine la probabilidad de obtener:
3 blancos (b)
20 conejos 8 grises (g) Se extraen 2 sin remplazamiento
9 negros (n)
102 CARLOS HERNAN SARAZA NARANJO
3 8 24
p (b.g ) 0,0631 6,31%
a. 20 19 380
9 8 72
p (n.n) 0,1894 18,94%
b. 20 19 380
9 3 27
p (n.b) 0,071 7,1%
c. 20 19 380
11 10 110
p (n .n ) 0,2894 28,94%
d. 20 19 380
Obsérvese que dado que el muestreo es sin remplazamiento, cada vez que se analiza el
segundo suceso se deben hacer los cambios ocasionados por la aparición del primer suceso
los que en algunos casos sólo afectan el denominador como en a. y c. mientras en otros
afectan numerador y denominador como en b. y d.
2. Un lote de animales está compuesto por 5 terneros y 3 potros. Se toman tres animales al
azar, sin remplazamiento, determine las siguientes probabilidades:
5 terneros (t)
8 animales Se extraen 3 animales sin remplazamiento
3 potros (p)
3 2 1 6
p( p. p. p) 0,0178 1,78%
a. 8 7 6 336
3 2 5 30
p( p. p.t ) 0,0892 8,92%
b. 8 7 6 336
5 3 4 60
p(t. p.t.) 0,1785 17,85%
c. 8 7 6 336
5 4 3 60
p( p. p. p ) 0,1785 17,85%
d. 8 7 6 336
Dos o más sucesos son mutuamente excluyentes si la aparición de uno de ellos impide la
aparición de los demás
Ejemplos:
Los sucesos macho y hembra son excluyentes porque un animal macho no puede ser
hembra
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 103
Los sucesos caballo café y caballo macho no son excluyentes porque se puede tener un
caballo macho de color café
Los sucesos perro y gato son excluyentes porque un perro no puede ser gato
Los sucesos perro y animal enfermo no son excluyentes porque se puede tener un perro que
esté enfermo.
Propiedad
P(A.B)=0
Sean A y B dos sucesos. La probabilidad de que ocurra el suceso A o que ocurra el suceso
B o que ocurran ambos sucesos está dada por:
Ejemplo:
Un lote de animales está compuesto por 8 conejos y 7 aves. 2 de los conejos y 3 de las aves
son hembras. Se toma un animal al azar, determine la probabilidad de obtener:
SEXO
HEMBRA (H) MACHO (M) Total
Conejo (C) 2 6 8
ANIMAL
Ave (A) 3 4 7
TOTAL 5 10 15
104 CARLOS HERNAN SARAZA NARANJO
Tenga en cuenta que se toma un animal, al azar.
8 10 6 12
p(C M ) 0,8 80%
a. 15 15 15 15
7 5 3 9
p( A H ) 0,6 60%
b. 15 15 15 15
8 7 15
p(C A) 1 100%
c. 15 15 15
6
p (C.M ) 0,4 40%
d. 15
e. p ( M .H ) 0
18 con influenza
50 caballos Se revisan 3 caballos sin remplazamiento
32 sin influenza
18 17 16 4896
p (i.i.i ) 0,0416
a. 50 49 48 117600
32 31 30 29760
p (i .i .i ) 0,2531
b. 50 49 48 117600
18 17 32 18 32 17 32 18 17 29376
p (i.i.i i.i .i i .i.i ) 0,2498
c. 50 49 48 50 49 48 50 49 48 117600
Nótese que en el cálculo anterior los resultados de los tres casos que componen el suceso
son todos iguales, de acuerdo con esta apreciación se puede realizar un cálculo abreviado
de la probabilidad así:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 105
18 17 32 9792 29376
p(i.i.i i.i .i i .i.i ) 3 p(i.i.i ) 3 * 3 * 0,2498
50 49 48 117600 117600
d. p ( x 1i ) p(x 1i x 2i x 3i)
De acuerdo con lo anotado en el literal anterior, las tres probabilidades iniciales son iguales
entre sí y las tres siguientes son iguales entre sí, entonces el cálculo se reduce a:
32 31 30 29760
p ( x 1i ) 1 p ( x 0i ) 1 p (i .i .i ) 1 1 0,7469
50 49 48 117600
Observe que el resultado obtenido es el mismo obtenido por el método extenso utilizado
inicialmente para resolver el enunciado del literal d
18 17 16 18 17 32
p( x 1i ) 3 0,2914
50 49 48 50 49 48
5 negocios (n)
20 empleados 8 producción (p) Se eligen 3 empleados sin remplazamiento
7 control s. (c)
5 4 3 8 7 6 7 6 5
p(n.n.n p. p. p. c.c.c) 0,0886
20 19 18 20 19 18 20 19 18
5 4 15 5 4 3
p( x 2n) p(n.n.n n.n .n n .n.n n.n.n) 3 0,1404
20 19 18 20 19 18
13 12 11 7 13 12
p ( x 1c) p (c .c .c c.c .c c .c.c c .c .c) 3 0,7298
20 19 18 20 19 18
12 11 10
p ( x 1 p ) 1 p ( x 1 p ) 1 p ( x 0 p ) 1 p ( p. p. p ) 1 0,807
20 19 18
e. Que no más de dos de ellos sean expertos en negocios
5 4 3
p ( x 2n) 1 p ( x 2n) 1 p ( x 3n) 1 p (n.n.n) 1 0,9912
20 19 18
3. Una empresa ganadera realiza una encuesta sobre el consumo de carne res. Consulta a
120 personas entre hombres adultos, mujeres adultas y jóvenes (Hombres y mujeres), los
resultados obtenidos se resumen en la siguiente tabla.
Suponga que se consultan 3 personas al azar sin remplazamiento, determine las siguientes
probabilidades:
30 29 28
p ( x 2m) 1 p ( x 3m) 1 (m.m.m) 1 0,9855
120 119 118
28 27 26
p ( x 2n) (n.n.n) 0,0116
120 119 118
Si a una variable x se le consideran todos los valores posibles (x1,x2,x3,…,xn) y a cada uno de
los valores se le calcula la probabilidad de ocurrencia, se obtiene para x la distribución de
probabilidades correspondiente
p ( xi ) 1
Ejemplo:
Los resultados de p(xi) se obtuvieron con los procedimientos ya conocidos que se describen
a continuación:
108 CARLOS HERNAN SARAZA NARANJO
4 3 2
p( x 0v ) p(v.v.v) 0,03333
10 9 8
6 4 3
p( x 1v ) 3. p(v .v.v) 3. 0,3
10 9 8
6 5 4
p( x 2v ) 3. p(v .v .v) 3. 0,5
10 9 8
6 5 4
p( x 3v ) p(v .v .v ) 0,16667
10 9 8
Nótese en la tabla que la suma de las probabilidades es igual a 1, con lo que se cumple la
propiedad de una distribución de probabilidades. (p ( xi )) 1
Media = ( x) xi. p ( xi )
Varianza= p ( xi )( xi )
2 2
Desviación estándar= ( p ( xi )( xi )
2
Para los datos correspondientes al número de perros libres de virus los cálculos son los
siguientes:
( x) 1,79998
2 ( x) 0,55997
( x) 0,55997 0,74832
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 109
Para los cálculos de la varianza y de la desviación estándar la media se aproximó a 1,8
110 CARLOS HERNAN SARAZA NARANJO
7.5.2 Representación gráfica de la distribución de probabilidades
0.4
Probabilidad
0.3
0.3
0.2 0.16666
0.1
0.03333
0
0 1 2 3
valor de x
Distribución de probabilidad para variable discreta. Solo admite dos resultados: éxito o
fracaso. Los sucesos deben ser independientes (muestreo con remplazamiento).
n = número de ensayos
x = número de éxitos buscados
n - x = número de fracasos buscados
Nótese que P está asociado al número de éxitos y q está asociado al número de fracasos.
b. P (x 2C) =P (x=2+x=3+X=4+…+X=12)=1–P(X2)=1–P(X=0+X=1)
c. P (X 2C) = P (X=0C+X=1C)
P (X=0C) = 0,0138
P (X=1C) = 0,0711 Resultados obtenidos en el literal anterior
0,0849
P (X 2C) = 0,0849
d . P( X 3C ) P( X 0C X 1C X 2C X 3C )
Nótese que los valores de P y q se invirtieron porque la pregunta busca clientes que no
compran.
La variable x= número de perros que no tienen fiebre tiene una media de 3,2 lo cual significa
que de un total de 4 perros examinados se pueden esperar 3 perros sin fiebre y uno con
fiebre.
x .e
P( X )
x!
Donde: = n.p
e = 2,71828…..
Ejemplo: datos estadísticos indican que 4 de cada de 500 perros examinados presentan
cataratas. En un lote de 600 perros determine la probabilidad de encontrar:
4
P(C ) 0,008
500
n=600 = 600(0,008)=4,8
4,83.e 4,8
a. P( X 3C ) 0,1517
3!
b. P( X 1C ) P( X 1C X 2C X 3C ...... X 600C ) 1 P( X 0C )
4,80 e 4,8
P( X 0C ) 0,0082
0!
c. P (X 2C) = P (X=0C+X=1C+X=2C)
4,80 e 4,8
P( X 0C ) 0,0082
0!
114 CARLOS HERNAN SARAZA NARANJO
4,8e 4,8
P( X 1C ) 0,0395
1!
4,82 e 4,8
P( X 2C ) 0,0948
2!
Nota especial: La distribución de Poisson se puede utilizar en los casos en que se conoce la
media. Para lograr esta aplicación, teniendo en cuenta que (x)=n.p=, es posible remplazar
a por y, en consecuencia, la fórmula de la distribución de Poisson se transforma en la
siguiente:
x .e
P( x)
x!
35.e 3
a. P( x 5) 0,1008
5!
6 0.e 6
a. P( x 0) 0,0024
0!
6.e 6
P( x 1) 0,0148
1!
La probabilidad de que en dos minutos se pierdan por lo menos dos hongos es 98,28%.
Se dice que una variable ha sido normalizada, tipificada o estandarizada cuando se expresa
en términos de la desviación estándar. La variable normalizada se nota z
xx
Z
s
X1 = 74 X2 = 81 X3 = 76 X4 = 72 X5 = 79
xi
X ( Xi X ) 2
n S
n 1 Corregida porque n<30
74 76,4 81 76,4
Z1 0,66 Z2 1,26
3,65 3,65
76 76,4
Z4
72 76,4
1,21
79 76,4
Z3 0,11 Z5 0,71
3,65 3,65 3,65
Nótese que hay valores de Z positivos y negativos. Cuando el valor que se quiere normalizar
es igual a la media, entonces Z=0.
116 CARLOS HERNAN SARAZA NARANJO
Cuando Z es positiva el valor que se está normalizando es mayor que la media mientras que
una Z negativa aparece cuando se normalizan valores menores que la media.
1
1 2 z2
P( x) e
2
Un gráfico aproximado de la curva normal es el siguiente:
0.3
A = 0,5 A = 0,5
0.2
0.11
Z
-3 -2 -1 1 2 3
68,27%
95,45%
99,73%
El gráfico de la campana muestra que de acuerdo con la distribución normal el 68,27% de los
datos de una muestra se ubican en el intervalo S; el 95,45% de los datos se ubican en el
intervalo 2S y el 99.73% de los datos se ubican en el intervalo 3 S.
Ejemplo: Una producción de huevos presentó un peso medio de 45,3 gramos con desviación
estándar de 1,01 gramos. De la curva normal obtenemos:
En este ejemplo se ha trabajado con tres porcentajes fijos utilizando constantes enteras (1,2
y 3). En las aplicaciones de la distribución normal se podrá mostrar cómo es posible obtener
información para diferentes valores de porcentaje en los que las constantes no son enteras.
Tenga en cuenta que existen diferentes tipos de tablas para el cálculo de probabilidades bajo
la curva normal, algunas informan el valor acumulado de la probabilidad mientras otras
(como la que se incluye en los anexos), solo incluye valores a partir de CERO, es decir, a
partir de la media de la muestra.
En los siguientes ejemplos se describe la manera de utilizar la tabla de áreas bajo la curva
normal. Se pide hallar el área bajo la curva normal en cada caso:
A = 0,5 - 0, 3531
A = 0,1469
A = (0,5-0,2704) + (0,5–0,0832)
A = 0,2296 + 0,4168
A = 0,6464
1. Un lote de cerdos presenta un peso medio de 3,42 @ con desviación estándar de 0,16 @.
Encuentre la probabilidad de que un cerdo pese:
3,5 3,42
z 0,5
0,16
P (X 350) = 0,3085
3,75 3,42
z 2,06
0,16
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 119
P (X 3) + P (X 3,8)
3 3,42
z3 2,62
0,16
21
3,8 3,42
z 3,8 2,37
0,16
21
2. Una muestra de 1250 peces presenta una longitud media de 8,7 centímetros con
desviación estándar de 0,45 centímetros. Determine:
P (X 9)
9 8,7
z 0,66
0,45
P (X 9) = 0,5 – 0,2454
P (X 9) = 0,2546
P (X 8) + P (X 7,8)
8 8,7
z8 1,55
0,45
120 CARLOS HERNAN SARAZA NARANJO
7,8 8,7
z 2
0,45
Como la media es 8,7 centímetros, para que la longitud de un pez la supere en 0,5
centímetros debe medir 9,2 centímetros y para superarla en 0,5 centímetros o más (por lo
menos) debe medir 9,2 centímetros o más.
P (X 9,2)
9,2 8,7
z 1,11
0,45
El 13,35% de las longitudes de los peces superan a la media por lo menos en 0,5
centímetros.
3. Una muestra de lombrices tiene una longitud media de 3,8 centímetros con desviación
estándar 0,39 centímetros. ¿Cuál es la longitud del 38,5% de las lombrices más cortas?.
XX X Z .S X
Z
S
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 121
4. Una muestra de huevos súper presenta un peso medio de 52 gramos con desviación
estándar 9,2 gramos. Encuentre el peso del 74,5% de los huevos más livianos.
Algunos de los cálculos estadísticos que se han manejado en el presente libro pueden
hacerse de manera directa utilizando los programas que incluyen las calculadoras científicas
o las hojas de cálculo. También existen programas como Statgraphics, Minitab o SPSS.
El manejo de este tipo de herramientas facilita los cálculos, ahorra tiempo y permite dar
mayor precisión a los resultados, sin embargo, su uso requiere de buen conocimiento y buen
manejo. Recuerde que las calculadoras y los computadores hacen lo que se les ordene y que
de la información que reciban y la forma como la reciban, depende la confiabilidad de los
resultados que puedan entregar.
Verificar si la calculadora tiene datos, consiste en leer el valor de n el cual debe ser igual a
cero. En caso que esto no sea cierto, siga la secuencia SHIFT, CLR, 1,= (Figura No. 12).
Una vez se asegure que la calculadora no tiene datos en la memoria, proceda a introducir los
datos de la muestra. Si los datos se presentan sin frecuencias introduzca cada dato
escribiéndolo en pantalla para luego presionar la tecla DT (que aparece donde se encuentra
M+); si usted necesita incluir datos con frecuencias entonces escriba el primer dato en
pantalla, escriba el signo ;, escriba el valor de la frecuencia y presione DT.
En cualquiera de los dos casos, cuando termine de introducir los datos verifique el valor de n
el cual debe coincidir con el tamaño de la muestra.
Para leer los resultados utilice la opción SHIFT y las teclas 1 y 2 (marcadas con s- sum),
escriba el número que corresponde a la opción buscada (media, n, desviación estándar o
desviación estándar corregida) y presione el signo =. Para hallar la varianza eleve al
cuadrado los valores de la desviación estándar.
124 CARLOS HERNAN SARAZA NARANJO
Figura No. 12. Calculadora CASIO FX-82
Modo SD
Para borrar
información
SHIFT;
CLR; 1 =
Cálculo de n,
sumatoria de los DT
valores de x y
sumatoria de los
cuadrados de los
valores de x ;
Cálculo de la media, la
desviación estándar y la
desviación estándar
corregida
En una celda en la que no hay información se puede escribir la medida que se desee
calcular, en seguida se da la orden de cálculo escribiendo la palabra clave con la que Excel
accede a calcular cada valor requerido, esta orden debe ir precedida del signo igual o del
signo más. En la siguiente tabla se reproducen 5 columnas de una hoja de cálculo en Excel.
La primera columna corresponde al número de la fila; la segunda columna corresponde a los
datos de la muestra; la tercera columna indica el cálculo que se quiere realizar; la cuarta
columna muestra la orden que se da para que Excel entregue los cálculos requeridos. (Note
que para el caso del percentil el número se da en decimal correspondiente al porcentaje del
percentil a calcular, por ejemplo, percentil 23 =0,23; percentil 9=0,09. La quinta columna
contiene los resultados obtenidos en cada uno de los cálculos realizados.
A B C D
No. de fila Datos Medida Procedimiento Resultado
1 12
2 13
3 14
4 15
5 20
6 24
7 25
8 25
9 25
10 29
11 MEDIA =PROMEDIO(A1:A10) 20,1
12 MEDIANA =MEDIANA(A1:A10) 22
13 MODA =MODA(A1:A10) 25
14 PERCENTIL 23 =PERCENTIL(A1:A10;0,23) 14,07
15 DESV. ESTÁNDAR =DESVESTP(A1:A10) 5,73
16 VARIANZA =VARP(A1:A10) 32,89
17 DESV. ESTANDAR =DESVEST(A1:A10) 6,04
CORREGIDA
18 VARIANZA CORRE. =VAR(A1:A10) 36,54
GLOSARIO
CHAO, Lincoln L. Estadística para las Ciencias Administrativas. Mc Graw Hill. México. 1982.
472 p.
GRISALES G., Arbey F. y ZULUAGA R., Antonio. Estadística Práctica. REAL. Armenia, 1990.
163 p.
HILLS, Richard L. et all. Estadística para economía y administración. Mc Graw Hill. México.
1981. 597 p.
HOEL, Paul G. Estadística Básica para negocios y Economía. Continental. México. 1978. 452
p.
MURRAY SPIEGEL. Estadística. Serie Schaum. Mc. Graw Hill. México. 1983. 357 p.
PORTUS GOVIDEN, Lincoyán. Curso Práctico de Estadística. MacGraw – Hill. México, 1990.
192 p.
SI NO SI NO NO SI NO SI NO SI NO SI NO
SI NO SI NO SI NO SI NO NO SI NO NO NO
NO SI NO SI NO SI NO SI NO NO SI SI NO
SI SI NO NO NO NO NO SI SI NO SI SI SI
6. Se realiza una encuesta socioeconómica entre las familias del municipio La Peña. La
encuesta tiene el objetivo de determinar los siguientes aspectos: distribución de los
habitantes del municipio por sexos y por estratos; ingreso promedio familiar por mes;
edades de las personas económicamente activas; tipo de comida que prefieren las
familias; actividades que han sido relegadas a causa de la condición económica de la
familia; alternativas que ha diseñado la familia para mejorar las condiciones
económicas; respuesta acerca de estar de acuerdo o no con las políticas económicas
del país; evaluación de la gestión del gobierno en términos de excelente, aceptable,
buena o mala.
Para el estudio que se describe identifique las variables que intervienen y clasifique
cada una de ellas.
7. Determine cuáles de las siguientes afirmaciones son verdaderas o falsas. Para las
afirmaciones falsas justifique la respuesta
TALLER UNIDAD II
1.
Número de hijos en las familias de los empleados de la empresa Tus Mascotas
Xi fi Fi hi% Hi%
1 12
2 45
3 23
4 9
5 1
Organice los datos en una tabla de distribución de frecuencias y responda los siguientes
enunciados:
3. Se realiza un estudio para determinar el tiempo que tardan los perros para recuperarse de la
anestesia que han recibido en una cirugía. Se registra el tiempo, en horas, de 80 perros que
fueron anestesiados con el mismo medicamento. Los datos encontrados son los siguientes:
0,9 0,9 0,9 0,9 0,9 0,8 0,8 1,0 0,9 0,9 0,8 0,8 0,8 0,8
2 5 5 6 4 5 2 1 0 0 0 0 4 3
0,9 0,9 0,9 0,9 0,9 0,9 0,9 1,0 0,7 0,7 0,7 0,7 0,9 0,9
0 4 2 3 0 5 2 0 2 4 8 8 4 3
0,7 0,7 0,7 1,0 0,9 0,8 0,5 0,6 0,6 0,9 0,9 0,6 0,7 0,7
5 8 7 2 4 0 0 3 0 2 3 2 1 8
0,4 0,4 0,5 0,6 0,6 0,8 0,5 0,8 0,8 0,9 0,7 0,7 0,8 0,8
5 8 7 2 4 0 6 3 0 2 1 2 1 8
1,0 1,0 0,4 0,8 0,6 0,5 0,6 0,5 0,4 0,5 0,5 0,4 0,6 0,5
5 8 9 7 4 9 4 3 8 2 3 9 1 6
0,9 0,9 0,8 0,7 0,7 0,7 0,6 0,7 0,6 0,5
9 8 4 2 2 8 5 1 0 2
5.1 f8 = 120
5.2 F4 = f3 + f4
5.3 H4= H3 + h4
5.4 H8=120
5.5 f1+f2+f3=F3
5.6 h3 < h4
5.7 H5 > H4
5.8 F3 = H3
6. Se realiza un estudio para determinar el estrato social de las mujeres que laboran en
empresas que distribuyen alimentos para mascotas. Los datos obtenidos se resumen en la
siguiente tabla:
3 1 2 3 4 2 4 3 1 6 2 4 3 2 1 6 4 3 2 4 1 2 4 3 2
2 2 3 6 2 3 4 2 6 4 3 2 1 6 4 3 2 1 4 3 2 4 4 3 2
9. Se realiza un estudio de mercado para determinar el valor mensual que las familias de
zona rural destinan para comprar alimento para mascotas. Los datos, en miles de pesos,
se registran en la siguiente tabla:
8,5 8,5 8,5 8,8 8,8 8,8 8,8 8,8 9.0 9,0 9,0 9,3 9,5 9,5
10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12,
0 0 0 0 0 0 0 0 5 8 5 7 0 5
12, 12, 13, 13, 14, 14, 14, 14, 14, 14, 14, 14, 15, 15,
5 8 7 9 0 4 7 7 7 7 7 7 2 8
16, 16, 17, 18, 20, 20, 20, 25, 27, 27, 28, 29, 29, 29,
4 9 8 2 1 4 9 7 4 9 1 3 5 8
10. Se realiza un estudio para determinar el valor pagado por familias colombianas por
concepto de juguetes para mascotas, adquiridos en diferentes empresas. Los datos
obtenidos se resumen en la siguiente tabla:
Gasto (millones de $) fi
0,45-0,62 11
0,63-0,80 14
0,81-0,98 13
0,99-1,16 9
1,17-1,34 5
1,35-1,52 3
3. Refiérase al ejercicio 3 del taller de la unidad II, construya el polígono de frecuencias y las
ojivas.
4. Refiérase al ejercicio 4 del taller de la unidad II, construya la ojiva mayor que y el
histograma.
136 CARLOS HERNAN SARAZA NARANJO
5. Establezca diferencias y semejanzas entre el histograma y el polígono de frecuencias de
una muestra.
6.
Altura de terneros
90 82
80 74
No. de terneros
70 62
60 56 1,2-1,3
50 45 1,4-1,5
40
30 1,6-1,7
20 14 1,8-1,9
10 2,0-2,1
0
2,2-2,3
1
Tomando como referencia el gráfico responda los siguientes enunciados:
Alturas(m)
6.1 Describa el estudio y determine el tamaño de la muestra
6.2 Cuántos terneros tienen altura de por lo menos 1,8 metros
6.3 Porcentaje de terneros que tienen altura entre 1,4 y 1,9 metros
6.4 Cuántos terneros tienen altura entre 1,8 y 2,1 metros
6.5 Porcentaje de terneros que tienen altura a lo sumo de 1,9 metros
6.6 Mayor altura encontrada en los terneros
6.7 Altura que menos se presenta
6.8 Cantidad de terneros que no logran superar 1,7 metros de altura
50 1,4-1,7
1,8-2,1
40 75 2,2-2,5
30 56 2,6-2,9
52
46 3,0-3,3
20
32 3,4-3,7
10 24 25
3,8-4,1
0
1
Pesos (libras)
TALLER UNIDAD IV
1. Tomando como referencia la siguiente tabla, Encuentre el valor de cada una de las
sumatorias dadas:
1 2 3 4 5 6 7 8
Xi 2 3 5 8 -1 4 3 6
Yi 4 2 10 3 8 -3 -4 7
Zi 0 11 12 -5 11 9 8 8
5 7 2
1.1
Xi
2 1.6
X
4
i
4 8
1.2
7Yi
1 1.7
6Y 8Z
5
i i
7 4
9Xi
1.3
3( X i Zi )
3 1.8
12
1
3 5
8 Zi Yi
1.4
(Y Z )
5
i i
1.9
84
4
4 8
Xi i 3(Z
Y
i 2Yi ) 4Z i
1.5 1 1.10 1
2. Encuentre el valor medio de los números pares mayores o iguales que 2 y menores o
iguales que 8
3. Encuentre la mediana de los números impares mayores que 3 y menores que 15.
138 CARLOS HERNAN SARAZA NARANJO
4. Una clínica odontológica canina ha registrado la cantidad de tubos de resina utilizados
durante 10 meses encontrando los datos que se registran en la siguiente tabla
340 342 298 298 340 345 298 354 302 311
Encuentre.
7. El propietario de la finca “La Esperanza” paga salarios mensuales cuya media asciende a
$812.300
7.1 Si el propietario decide incrementar cada salario en $32.800, ¿cuál es el nuevo salario
medio?
7.2 Si el propietario decide incrementar cada salario en el 6%, ¿cuál es el nuevo salario
medio?
8. Los siguientes datos corresponden a una muestra del gasto mensual en medicamentos
para aves en fincas de la vereda Los Micos
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 139
Gasto (miles de $) fi
10 - 15 35
16 - 21 20
22 - 27 18
28 - 33 35
34 - 39 15
40 - 45 13
Determine: gasto medio, gasto que más se presenta; gasto en el 15% de las fincas que
presentan mayores gastos; gasto en el 25% de las fincas que reportan los mayores gastos;
gasto en el 30% de las fincas que reportan los menores gastos; gasto en el 50% de las fincas
que presentan los mayores gastos.
Longitudes (cm) fi
12,5-12,9 35
12,9-13,3 32
13,3-13,7 42
13,7-14,1 23
14,1-14,5 15
14,5-14,9 13
10. En la tabla siguiente se registra el valor del salario mínimo en Colombia durante 9 años
consecutivos. Calcule el incremento porcentual anual del salario mínimo para los años entre
el 2011 y el 2019. Con los valores calculados obtenga la media geométrica y la media
armónica.
AÑO SALARIO
2011 535.600
2012 566.700
2013 589.500
2014 616.000
2015 644.350
2016 689.455
140 CARLOS HERNAN SARAZA NARANJO
2017 737.717
2018 781.242
2019 828.116
11.
Edad de las personas económicamente
activas en las familias campesinas del
departamento de Risaralda
60
52
Número de personas
50 45 44
40 17-22
34 34
23-28
30 27 28
29-34
20 35-40
Con base en el histograma determine: 41-46
10
47-52
0 53-58
11.1 Cuántas personas componen la muestra 1
11.2 Edad media de las personas Edades
TIEMPOS(horas) fi
0,38 – 0,52 14
0,53 - 0,67 18
0,68 - 0,82 22
0,83 - 0,97 45
0,98 - 1,12 32
1,13 - 1,27 25
1,28 - 1,42 20
TALLER UNIDAD V
1. Los siguientes datos corresponden al valor de los gastos mensuales en pago de
servicio de agua en clínicas odontológicas de animales. El gasto está expresado en
miles de pesos.
Gasto fi
43 – 50 21
51 - 58 14
59 - 66 12
67 - 74 18
75 - 82 15
Determine:
2. Dos fincas vecinas crían conejos. En el último año se tomó el peso de 10 conejos de
cada finca. Determine cuál de las dos fincas presentó la producción más homogénea.
Finca Ensueño Finca Calamar
Pesos (g) Pesos (g)
320 320
330 450
340 320
360 310
325 270
380 470
370 270
390 400
350 370
330 315
142 CARLOS HERNAN SARAZA NARANJO
3. La empresa “Mascotas y alimentos” paga impuestos mensuales por diferentes
conceptos cuyo valor medio asciende a $485.000 y su varianza es $21.200.000.
3.2 Si el gobierno decide incrementar cada impuesto en el 5,8%, ¿cuál es el nuevo impuesto
medio y cuál es la nueva varianza?
7. Se pregunta a empleados de la empresa “El Encanto” acerca del número de personas que
conforman sus familias. Los datos obtenidos se registran en la siguiente tabla:
7 4 5 8 6 7 9 2
5 7 5 7 5 7 8 7
Cantidad de 10 10 10
92 94 95 96 98
consultas 0 5 8
Número de clínicas 3 4 5 2 4 6 2 8
10. Se realiza un estudio para determinar el valor de las acciones que manejan empresas
colombianas. Los resultados del estudio se muestran en la siguiente tabla:
Valor acciones No. de empresas (fi)
(millones de $)
1,5-2,4 2
2,5-3,4 4
3,5-4,4 16
4,5-5,4 5
5,5-6,4 11
6,5-7,4 22
7,5-8,4 34
144 CARLOS HERNAN SARAZA NARANJO
Calcule la varianza, la desviación estándar y el coeficiente de variación
11. Se realiza un estudio para determinar el valor de los gastos mensuales de publicidad de
empresas pecuarias. Los datos obtenidos se resumen en la siguiente tabla:
Valor gastos No. de empresas (fi)
(millones de $)
0,62-0,84 10
0,85-1,07 18
1,08-1,30 24
1,31-1,53 35
1,54-1,76 24
1,77-1,99 18
2,00-2,22 10
12. En un estudio que pretende determinar el valor de las remesas procedentes del extranjero
que reciben mensualmente 52 familias campesinas del departamento de Risaralda se
obtienen los siguientes datos:
X i 34.970.000 X X 10.559.250.000
2
i
13. Determine cuáles de las afirmaciones siguientes son verdaderas o falsas. Para las
afirmaciones falsas corrija la afirmación o explique por qué es falsa
13.4 Para que una distribución sea simétrica se requiere que el momento de orden 3 sea
igual a cero
13.5 Cuando el rango de una muestra es 25000 se puede afirmar que la muestra es
heterogénea
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 145
TALLER UNIDAD VI
1. Un investigador recibe 8 muestras de sangre para las que dispone de igual número de
cajas petri. ¿De cuántas formas puede asignar las cajas a las muestras?
2. En una prueba psicotécnica aplicada a Médicos Veterinarios que aspiran a gerenciar una
clínica se exponen 5 dibujos de animales en un salón y se pide a cada entrevistado que
elija, a su gusto, uno de los cinco dibujos y se pare al lado de él. A la prueba se
presentan 6 candidatos. ¿De cuántas formas puede ocurrir la elección de los dibujos?
6. En un laboratorio se toma la decisión de marcar cada caja petri con un código compuesto
por dos letras y dos números. La primera letra es una C o una K para distinguir si la caja
es clara u opaca; la segunda letra puede ser cualquiera del alfabeto sin repetir la primera
letra; los números se pueden repetir. El laboratorio tiene 5400 cajas petri disponibles.
¿Es posible, con este tipo de código, marcar todas las cajas disponibles?.
10. Se lanzan a rodar 5 lápices que tienen marcados en sus lados los números del 1 al 4.
¿Cuántos resultados posibles hay?
13. El grupo de estudiantes del programa de Medicina Veterinaria está conformado por 25
personas. Se requiere escoger 5 personas para que asistan a un seminario. De cuántas
formas se puede hacer la selección en los casos siguientes:
TEORÍA DE LA PROBABILIDAD
1. Se extraen dos hámster al azar, sin remplazamiento, de una jaula que contiene 10
hámster blancos, 30 hámster crema y 20 hámster naranja. Determine la probabilidad de
que los hámster extraídos sean:
a.
b. A un perro
c. A un perro o a un animal recuperado
d. A un ave y que no se haya recuperado
e. A un perro o a un gato
f. A un animal que no se haya recuperado o a un gato
11.
4. Tomando los datos de la tabla No. 1 asuma que se toman tres registros al azar, sin
remplazamiento, determine la probabilidad de obtener:
a.
b. Tres registros del mismo tipo de animal
c. Tres registros de animales no recuperados
d. Por lo menos un animal recuperado
e. Menos de dos gatos
B B B M B B B B M M
B B B B B B M B B B
6. El 92,72% de las operaciones que realiza una clínica resultan exitosas. Si se realizan 3
operaciones, encuentre la probabilidad de obtener:
a.
b. Ninguna exitosa
c. Menos de una que no sea exitosa
d. Más de 1 que sea exitosa
e.
11.
7. La tabla No. 3 corresponde a la revisión del proceso de atención al cliente en
40 consultas recibidas en la clínica “Risaralda”. Los cuadros marcados con √
corresponden a excelente atención, mientras que los marcados con X
requieren mejora en los procedimientos.
√ X √ X √ X √ √ √ √ √ √ √ √ √ √ √ √ √ X
X √ √ √ √ √ √ √ √ √ √ X √ X √ X X √ X √
9. Con base en la tabla No. 4 asuma que se escogen 3 registros al azar con
reemplazamiento. Encuentre la probabilidad de que correspondan:
DISTRIBUCIÓN BINOMIAL
13. Se sabe que el 32% de las clínicas del eje cafetero tienen inversiones en
bienes raíces. Para una muestra de 12 clínicas determine las siguientes
probabilidades:
14. Las estadísticas tomadas en una muestra de peso de perros callejeros indican
que el 64% de los perros tienen peso superior a 7 libras. Para una muestra de
9 perros callejeros determine la probabilidad de:
a. 5 de mala calidad
b. 14 de buena calidad
c. Más de dos de mala calidad
d. A lo sumo 13 de buena calidad
e. Encuentre la media, la desviación estándar y la varianza para la variable
x=cantidad de guantes de buena calidad
DISTRIBUCIÓN DE POISSON
17. Una empresa aseguradora ofrece una póliza para cubrir a clínicas veterinarias
contra el riesgo de que un paciente muera como resultado de una cirugía; la
empresa conoce estadísticas según las cuales el 0,023% de los animales
intervenidos quirúrgicamente mueren como resultado de la cirugía. Si la
empresa asegura una clínica que realiza 1360 cirugías, determine las
siguientes probabilidades:
DISTRIBUCIÓN NORMAL
20. La altura de una muestra de caballos tienen distribución normal con media
154,5 centímetros y desviación estándar 4,1 centímetros. Determine la
probabilidad de que un caballo tomada al azar tenga altura de:
21. Los pesos de una muestra de conejos que se pone a la venta están
distribuidos normalmente con media 3,2 kilogramos y desviación estándar 0,56
libras. Determine la probabilidad de que un cliente que solicita un conejo al
azar obtenga una animal con peso:
26. Las longitudes de una muestra de gatos tienen distribución normal con media
78,64 centímetros y desviación estándar 3,5 centímetros. Determine: