Libro de Estadística Saraza

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 154

CARLOS HERNÁN SARAZA NARANJO

ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA

UNISARC

SANTA ROSA DE CABAL


2021
2 CARLOS HERNAN SARAZA NARANJO

TABLA DE CONTENIDO
Pág.
INTRODUCCIÓN 7
UNIDAD I. DEFINICIONES GENERALES 9
INTRODUCCIÓN 9
1.1 Definición de estadística 10
1.2 Población 10
1.3 Muestra 10
1.4 Estadístico 11
1.5 Parámetro 11
1.6 Variable 12
1.7 Notación con subíndices 13

UNIDAD II. DISTRIBUCIÓN DE FRECUENCIAS 14

INTRODUCCIÓN 14

2.1 Distribución de frecuencias. Definición 14


2.2 Distribución de frecuencias para variable discreta 15

2.2.1 Frecuencia absoluta 15


2.2.2 Frecuencia absoluta acumulada 16
2.2.3 Frecuencia relativa 16
2.2.4 Frecuencia relativa acumulada 16
2.3 Distribución de frecuencias para variable continua 18
2.3.1 Marcas de clase 22
2.3.2 Frecuencia absoluta 23
2.3.3 Frecuencia absoluta acumulada 23
2.3.4 Frecuencia relativa 24
2.3.5 Frecuencia relativa acumulada 24
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 3

2.4 Distribución de frecuencias para un estudio de variable cualitativa 27

UNIDAD III. REPRESENTACIÓN GRÁFICA 30

INTRODUCCIÓN 30

3.1 Condiciones generales de los gráficos 31


3.2 Histograma 31
3.3 Polígono de frecuencias 32
3.4 Gráfico circular 32
3.5 Ojivas 33
3.5.1 Ojiva mayor que 33
3.5.2 Ojiva menor que 34

UNIDAD IV. MEDIDAS DE CENTRALIZACIÓN Y DE POSICIÓN 36

INTRODUCCIÓN 36

4.1 Notación sumatoria 37


4.2 Medidas de centralización 37
4.2.1 Media aritmética 37
4.2.1.1 Media para datos con frecuencias 38
4.2.1.2 Media para datos agrupados en intervalos 40
4.2.1.3 Propiedades de la media 41
4.2.2 Media geométrica 46
4.2.2.1 Cálculo de la media geométrica para datos sin frecuencias 46
4.2.2.2 Cálculo de la media geométrica para datos con frecuencias 47
4.2.2.3 Cálculo de la media geométrica utilizando logaritmos 47
4.2.3 Media armónica 49
4.2.3.1 Cálculo de la media armónica para datos sin frecuencias 49
4 CARLOS HERNAN SARAZA NARANJO

4.2.3.2 Cálculo de la media armónica para datos con frecuencias 50

4.2.4. Mediana 51
4.2.4.1 Cálculo de la mediana para datos que no están en intervalos 51
4.2.4.2 Mediana para datos agrupados en intervalos 53

4.2.5 Cuartiles 55
4.2.5.1 Cálculo de los cuartiles 55
4.2.6 Deciles 55
4.2.6.1 Cálculo de los deciles 56
4.2.7 Percentiles 56
4.2.7.1 Cálculo de los percentiles 57
4.2.8 Moda 58
4.2.8.1 Moda para datos agrupados en intervalos 59
4.2.9 Uso de las medidas de centralización 60

UNIDAD V. MEDIDAS DE DISPERSIÓN Y DE FORMA 63

INTRODUCCIÓN 63

5.1 Definición: medidas de dispersión 63


5.2 Rango 63
5.3 Desviación media 64
5.4 Varianza 66
5.4.1 Propiedades de la varianza 69
5.5 Desviación estándar 71
5.5.1 Interpretación de la desviación estándar 74
5.5.1.1 Campana de Gauss 74
5.5.1.2 Teorema de Tchebysheff 77
5.6 Coeficiente de variación 80
5.6.1 Cálculo del coeficiente de variación 80
5.7 Análisis de dispersión (medidas de forma) 82
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 5

5.7.1 Momentos con respecto a la media 83


5.7.2 Sesgo 83
5.7.2.1 Coeficiente de sesgo 84
5.7.3 Curtosis 85
5.7.3.1 Coeficiente de curtosis 86

UNIDAD VI. TÉCNICAS DE CONTEO 88

INTRODUCCIÓN 88

6.1 Regla de la potencia 88


6.2 Regla de la multiplicación 88
6.3 Número factorial 89
6.4 Permutación 90
6.5 Combinación 91

UNIDAD VII. TEORÍA DE LA PROBABILIDAD 93

INTRODUCCIÓN 93

7.1 Definición de probabilidad 93


7.2 Clasificación de suceso según su probabilidad 94
7.3 Sucesos simples y sucesos compuestos 95
7.4 Probabilidad para sucesos compuestos (Operaciones con
probabilidades) 95
7.4.1 Muestreo 95
7.4.2 Muestreo con remplazamiento y muestreo sin remplazamiento 95
7.4.3 Intersección de probabilidades 96
7.4.4 Sucesos mutuamente excluyentes 97
7.4.5 unión de probabilidades 98
6 CARLOS HERNAN SARAZA NARANJO

7.5 Distribución de probabilidades 102


7.5.1 Media, desviación estándar y varianza de una
distribución de probabilidades 103
7.5.2 Representación gráfica de una distribución de probabilidades 104
7.6 Distribución binomial 104
7.6.1 Media, desviación estándar y varianza de una distribución binomial 105
7.7 Distribución de Poisson 106
7.7.1 Media, desviación estándar y varianza de una
distribución de poisson 108
7.8 Variable normalizada 109
7.9 Distribución normal 110
7.9.1 Cálculo de probabilidades utilizando distribución normal 111
7.9.2 Uso de la tabla de áreas bajo la curva normal 111
7.9.3 Aplicaciones de la distribución normal 112
8. Cálculos sistematizados 116
8.1 Cálculo de medidas estadísticas utilizando calculadora
CASIO FX-82 116
8.2 Calculo de medidas estadísticas utilizando EXCEL 117
GLOSARIO 119
BIBLIOGRAFÍA 120
TALLER UNIDAD I 121
TALLER UNIDAD II 123
TALLER UNIDAD III 127
TALLER UNIDAD IV 129
TALLER UNIDAD V 132
TALLER UNIDAD VI 137
TALLER UNIDAD VII 139

INTRODUCCIÓN
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 7

El manejo de información resulta importante para todo profesional en la búsqueda


de ampliar las posibilidades de aplicar los conocimientos al desarrollo de la ciencia
propia de su desempeño. Los avances de la ciencia se facilitan cuando los
resultados se sustentan en argumentos comprobables a través de nuevos ensayos
y de conclusiones que permitan determinar, en contexto, cuándo, dónde y en qué
condiciones es posible llevarlos a campo.

Los argumentos que requieren los resultados de las investigaciones están


relacionados con un buen trabajo de campo, pero también con la confiabilidad de
las conclusiones obtenidas a través de este. La estadística constituye el medio
expedito para dar sustento a las conclusiones derivadas de los trabajos de
investigación. Por medio de esta área de estudio es posible obtener muestras
representativas de una población para iniciar el análisis de las variables que han
sido definidas de importancia para los objetivos trazados.

Una buena muestra se constituye en elemento fundamental de la confiabilidad de


los resultados, entendiendo que resulta impracticable la posibilidad de trabajar con
todos los elementos de la población. A través de los resultados obtenidos en la
muestra es posible sacar conclusiones del comportamiento que tendrá la
población. Para ello la estadística se vale de técnicas tales como el manejo de las
probabilidades, la estimación de parámetros, la formulación y comprobación de
hipótesis, la regresión y la correlación.

De esta manera la estadística hace presencia en todos los campos del saber, su
aporte avanza desde sencillas aplicaciones relacionadas con la interpretación de
la información y la elaboración de gráficos hasta la obtención de conclusiones
relacionadas con estudios de mercado, proyección de compras y ventas, análisis
de comportamientos futuros, análisis de diferencias significativas entre
tratamientos, (manejo de diferentes materias primas, insumos, comportamiento e
incidencia de la temperatura, optimización de procesos, entre otros).
8 CARLOS HERNAN SARAZA NARANJO

La era moderna ha sido bien llamada la de la información al punto de afirmarse sin


mayor riesgo de equívoco que quien tiene la información tiene una riqueza
inconmensurable. En el manejo de la información la estadística ocupa
primerísimos lugares como excelente complemento para argumentar con cifras las
observaciones derivadas de trabajos de campo.

Bienvenidos, entonces, al fascinante mundo de la estadística que está por


descubrir para quienes apenas llegan a su morada, o para servir como estimulante
complemento a los que ya han incursionado por ella. Los ejemplos se han
estructurado con casos simulados relacionados con la medicina veterinaria y con
las variables que la rodean de tal manera que sea más agradable, para quienes
están interesados en el área, acceder a los conocimientos que a lo largo del libro
se desarrollan.

El libro condensa contenidos relacionados con la estadística descriptiva, las


técnicas de conteo y los fundamentos del cálculo de probabilidades y de
distribuciones de probabilidad, elementos fundamentales en la tarea de facilitar el
proceso de análisis de conjuntos de datos y de inferir con base en los resultados
obtenidos de estos.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 9

UNIDAD I

DEFINICIONES GENERALES

INTRODUCCIÓN

La estadística se constituye, cada día más, en herramienta indispensable para


todos los profesionales de cualquiera de las diferentes ramas del conocimiento.
Se utiliza la estadística en derecho, en medicina, en contaduría, en sociología, en
psicología, en ingeniería, en administración, en las labores productivas, en fin, en
todas las carreras profesionales.

Los datos estadísticos son herramientas que permiten tomar decisiones a


presente y a futuro en las pequeñas, en las medianas y en las grandes empresas.
Unas y otras, con mayor o menor profundidad, se apoyan en datos históricos o
presentes para decidir los momentos actuales y los que vendrán luego de cierto
período de tiempo.

En este capítulo se definen algunos términos que resultan indispensables para


comprender el proceso estadístico y para obtener de él resultados veraces y
confiables. Los conceptos generales hacen referencia a marcar los límites a los
que se quiere llegar con el trabajo estadístico.
10 CARLOS HERNAN SARAZA NARANJO

1.1 Definición de estadística

Rama de la matemática que se ocupa de la selección, ordenación, clasificación y


análisis de un conjunto de datos con el fin de sacar conclusiones sobre él o de
obtener conclusiones de un grupo mayor de datos.

Cuando la estadística se ocupa de obtener conclusiones sobre el conjunto de


datos analizado, se denomina estadística descriptiva, cuando por el contrario la
estadística se ocupa de obtener conclusiones sobre un conjunto mayor de datos,
se denomina estadística inferencial.

Por ejemplo, si durante una jornada de vacunación de 350 perros y gatos se


analizan 45 animales con el objetivo de observar el peso y con los datos se
obtienen conclusiones acerca de lo que ocurre con los 45 animales, estamos
ubicados en el campo de la estadística descriptiva; si con el dato que se obtiene
de la observación de los 45 animales se concluye cuál es el peso que alcanzan los
350 animales que han sido vacunados, hemos pasado al campo de la estadística
inferencial.

1.2 Población
Es todo conjunto de datos del cual se quiere realizar un estudio. Por ejemplo: se
quiere realizar un estudio referente a la edad de los animales tratados por consulta
general en una clínica veterinaria. Entonces la población son todos los animales
tratados por consulta general en la clínica. El tamaño de la población se nota N.
Por ejemplo, si en la clínica se trataron 140 animales entonces N=140

1.3 Muestra

Es todo subconjunto tomado de una población de tal manera que pueda ser
representativo de esta. Por ejemplo: una muestra de animales tratados por
consulta general en una clínica. El tamaño de la muestra se nota n.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 11

Por ejemplo, si en la clínica se decide el estudio con 40 animales tratados por


consulta general y se toman sus edades, entonces n=40.

Una de las características principales para que una muestra sea representativa de
una población es que ella sea obtenida al azar, es decir, que el investigador no
participe, con su propia decisión, al momento de elegir los elementos de la
población que harán parte de la muestra. (Los textos de estadística, las
calculadoras y las aplicaciones estadísticas en computador reproducen tablas de
números aleatorios para facilitar este trabajo).

Aunque un estudio sería más confiable tomando todos los datos de la población
en la mayoría de los casos esto resulta imposible por la dificultad del estudio, así
como por los costos. Entonces el estadístico generalmente trabaja con muestras.

Si regresamos a la clasificación de la estadística con al ánimo de precisar


diferencias se tiene que la estadística descriptiva analiza los resultados de una
muestra y toma decisiones acerca de estos resultados. La estadística inferencial
se apoya en los resultados aportados por la muestra para obtener conclusiones
acerca de lo que puede estar ocurriendo en la población de la cual fue extraída la
muestra.

1.4 Estadístico

Un estadístico es cualquier resultad que se obtiene de una muestra, por ejemplo,


la media de una muestra, la desviación estándar de una muestra, la varianza de
una muestra, el rango de una muestra.

1.5 Parámetro

Un parámetro es cualquier resultado que se obtiene de una muestra, por ejemplo,


la media de una muestra, la desviación estándar de una muestra, la varianza de
una muestra, el rango de una muestra.
12 CARLOS HERNAN SARAZA NARANJO

1.6 Variable

Es toda cantidad que puede tomar diferentes valores en un estudio. Por ejemplo:
el número de huevos recolectados por día en las fincas del eje cafetero; el valor de
los salarios asignados a los empleados de clínicas; las variedades de pastos que
se cultivan en una región; la temperatura diaria que se registra en una hacienda
ganadera.

Una cantidad que no es variable se


llama constante

Las variables se pueden clasificar en dos tipos: cualitativas o cuantitativas.

Una variable cualitativa es aquella que estudia cualidades presentes en los


elementos de una muestra, por ejemplo: tipos de huevo (C, B, A, AA); tipos de

enfermedades registradas en una clínica; concepto sobre el servicio de un médico.

Las variables cualitativas pueden ser nominales u ordinales. Una variable


cualitativa nominal es aquella que observa cualidades de los elementos de la
muestra que no pueden ser ordenados de manera alguna, por ejemplo: el color de
las aves, las razas de conejos que se producen en Colombia.

Una variable cualitativa ordinal es aquella que observa cualidades de los


elementos de la muestra que responden a un orden establecido, por ejemplo:
estrato social de las familias de un municipio, los tipos de huevos que se
recolectan en la finca Miracampos.

Una variable cuantitativa es aquella que estudia cantidades referentes a los


elementos en una muestra, por ejemplo: cantidad de mascotas atendidas por mes,
peso de caballos que han entrado a cirugía.
Las variables cuantitativas pueden ser de dos tipos: discretas y continuas. Una
variable cuantitativa es discreta cuando resulta de hacer conteos, de esta manera
sólo puede tomar valores enteros, por ejemplo: el número de frascos disponibles
en los laboratorios, el número de empleados en clínicas.
Una variable cuantitativa es continua cuando resulta de hacer mediciones, este
tipo de variable puede tomar cualquier valor, entero o decimal, por ejemplo, el
peso de las vacas lecheras de la finca Cantabria, el valor de los insumos
requeridos para una sala de cirugía.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 13

En resumen, las variables se clasifican como se muestra en la figura No. 1

VARIABLES

CUALITATIVA CUANTITATIVA

Nominal Ordinal Discreta Continua

No clasifica Clasifica Cuenta Mide

Estrato social;
Color, raza, sexo tamaño dado Cantidad de Peso de guayabas
como cualidad trabajadores
contratados por finca
Figura No. 1. Clasificación de las variables

1.7 Notación con subíndices

El símbolo Xi se lee equis sub i, representa el valor i-ésimo que toma una variable
en una muestra. Así, por ejemplo, el símbolo X3 representa el tercer dato de la
variable en la muestra. Es necesario aclarar que los subíndices no representan
mayor o menor valor, sólo indican ubicación.

Ejemplo, se pregunta a cinco trabajadores de la empresa Alimentos del café


acerca del número de hijos que tienen:

El primer trabajador encuestado es Rafael quien afirma que tiene 5 hijos; Alberto
responde que tiene 6 hijos; Teresa dice que tiene 4 hijos; Oscar responde que
tiene 7 hijos y Mariela afirma que tiene 3 hijos.

Entonces se escribe que X1=5 X2=6 X3=4 X4=7 X5=3


14 CARLOS HERNAN SARAZA NARANJO

UNIDAD II
DISTRIBUCIÓN DE FRECUENCIAS

INTRODUCCIÓN

El trabajo estadístico requiere orden y estética. Esta condición exige que la


persona encargada de manejar datos estadísticos tenga habilidad para ordenar
conjuntos de datos y para clasificarlos en tablas que permitan resumir la
información.

La habilidad para construir tablas se adquiere por medio de ejemplos basados en


una teoría que los guía y que les da la forma que cada aplicación requiere. Sin
embargo, más allá de la construcción de una tabla está la capacidad para
interpretar la información que se encuentra en ella de tal manera que sea posible
obtener conclusiones acerca de la muestra analizada.

En la presente unidad se trabajan los conceptos de tablas de distribución de


frecuencias para variable discreta y para variable continua. Igualmente se
introduce un ejemplo de una distribución para variable cualitativa.

Cada concepto tratado se ilustra con ejemplos aplicados a diferentes situaciones


relacionadas con la medicina veterinaria.

2.1. Distribución de frecuencias

Definición

Una distribución de frecuencias es un cuadro que permite resumir, ordenar y


clasificar los datos de una muestra con el fin de facilitar su estudio. Por tener
algunos elementos diferentes, se hace referencia primero a la distribución de
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 15

frecuencias para variable discreta y después a la distribución para variable


continua. Con el fin de facilitar la comprensión de los procedimientos que se
siguen para la construcción de las distribuciones, los conceptos se ilustran con un
ejemplo.

2.2 Distribución de frecuencias para variable discreta

Los siguientes datos corresponden a una muestra del número de jeringas


utilizadas durante un día, en 24 clínicas veterinarias.

142 145 140 142 143 144 142 145 140 148 138 146
144 143 138 140 142 147 144 140 142 145 138 140

Se pide construir la distribución de frecuencias


correspondiente.

El primer paso de la construcción consiste en ordenar los datos de la muestra; la


ordenación queda así:

138 138 138 140 140 140 140 140 142 142 142 142
142 143 143 144 144 144 145 145 145 146 147 148

Los datos, que constituyen la variable de estudio, se notan Xi, con ellos se
construye la distribución de frecuencias para lo cual se definen a continuación
cuatro tipos de frecuencias: frecuencia absoluta, frecuencia absoluta acumulada,
frecuencia relativa y frecuencia relativa acumulada

2.2.1 Frecuencia absoluta

Se simboliza fi. Se define como el número de veces que se repite cada valor de la
variable. La suma de las frecuencias absolutas es igual a n. (Tabla No. 1)
16 CARLOS HERNAN SARAZA NARANJO
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 17

2.2.2 Frecuencia absoluta acumulada

Se simboliza Fi. Se define como el número acumulado de elementos de la muestra


que son menores o iguales que el dato correspondiente. Se obtiene sumando
sucesivamente la columna de frecuencias absolutas. La última frecuencia absoluta
acumulada es igual a n. (Tabla No. 1)

2.2.3 Frecuencia relativa

Se simboliza hi. Es el peso relativo, es decir, la importancia, que cada frecuencia


absoluta tiene con relación al tamaño de la muestra. Se expresa en decimales o
en porcentajes.

Se obtiene dividiendo cada frecuencia absoluta entre n; si el valor se desea en


porcentaje, el cociente obtenido se multiplica por cien. La suma de frecuencias
relativas es igual a 1 o a 100%. (Tabla No. 1)

fi
hi  .100
n

2.2.4 Frecuencia relativa acumulada

Se simboliza Hi. Es el peso relativo que cada frecuencia absoluta acumulada tiene
con relación al tamaño de la muestra. Se obtiene dividiendo cada frecuencia
absoluta acumulada entre n. En forma práctica se obtiene sumando
sucesivamente la columna de frecuencias relativas. La última frecuencia relativa
acumulada es igual a 1 o a 100%. (Tabla No. 1).

Con base en las definiciones dadas para cada tipo de frecuencias, se obtiene la
distribución de frecuencias que se observa en la tabla No 1.
18 CARLOS HERNAN SARAZA NARANJO

Tabla No. 1.

NÚMERO DE JERINGAS UTILIZADAS EN UN


DÍA – CLÍNICAS VETERINARIAS
Xi fi Fi hi% Hi%
138 3 3 12,50 12,50
140 5 8 20,83 33,33
142 5 13 20,83 54,16
143 2 15 8,33 62,49
144 3 18 12,50 74,99
145 3 21 12,50 87,49
146 1 22 4,17 91,66
147 1 23 4,17 95,83
148 1 24 4,17 100,00
n=24

INTERPRETACIÓN DE LA TABLA
A continuación se formulan algunas preguntas referentes a la tabla, cada una con
su respuesta correspondiente, trate de resolver los enunciados antes de consultar
las respuestas:

1. ¿En cuántas clínicas se utilizaron 145 jeringas?.

2. ¿Cuál es el porcentaje de clínicas en las que se utilizaron por lo menos 144


jeringas?.

3. Halle el valor e interprete f6; F3; h4; H5.

4. ¿Cuál fue el menor número de jeringas reportado?.

5. ¿Cuál fue el número de jeringas más se presentó en la muestra?.

RESPUESTAS

1. Se pregunta por la frecuencia absoluta correspondiente a x6=145. La respuesta


es 3 clínicas.
2. Se pregunta por el porcentaje correspondiente a las xi mayores o iguales que
144. En la tabla corresponde a la suma de las frecuencias relativas desde la
h5 hasta la última frecuencia relativa. La respuesta es 37,51%.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 19

3. f6 = 3 En 3 clínicas se utilizaron 145 jeringas.


F3 = 13 En 13 clínicas se utilizaron entre 138 y 142 jeringas.
h4 = 8,33% En el 8,33% de las clínicas se utilizaron 143 jeringas.
H5 = 74,99% En el 74,99% de las clínicas se utilizaron entre 138 y 144 jeringas.
4. El menor número de jeringas encontrado fue 138.
5. El número de jeringas que más se presentó en la muestra fue 140 y 142
jeringas. Apareció en 5 clínicas (mayores frecuencias absolutas).

2.3 Distribución de frecuencias para variable continua

Cuando la variable es continua, con el objetivo de facilitar el análisis, se


acostumbra ordenar los datos de la muestra en intervalos. Un intervalo es un
conjunto de números comprendidos entre un límite inferior (Li) y un límite superior
(Ls). El procedimiento de construcción de los intervalos y su respectiva distribución
de frecuencias se expone a continuación.

El procedimiento de construcción de
intervalos también se utiliza para
variable discreta cuando la variable
toma muchos valores diferentes

Es necesario aclarar que los métodos para construir intervalos son variados. Aquí
se expone uno de tantos métodos, lo que se hará utilizando un ejemplo.

Se desea estudiar la longitud, en milímetros, de pulgas de perro. Se mide la


longitud de 80 pulgas. Los resultados obtenidos son los siguientes:
3,0 1,7 2,7 3,3 1,9 3,7 3,6 2,0 3,4 3,8 3,8 3,9 3,6 4,1 3,8 2,8
3,6 4,0 3,6 2,4 2,0 3,4 1,5 3,9 3,5 1,7 3,6 3,9 2,8 1,5 3,8 1,9
2,0 2,6 2,0 1,7 2,9 2,0 2,5 2,8 2,0 3,0 3,0 2,5 3,5 3,0 3,6 3,7
3,8 3,6 2,8 3,0 2,8 3,1 3,3 1,8 3,6 2,0 1,5 2,8 2,9 3,8 1,7 4,1
2,0 3,5 1,7 2,6 3,0 2,0 2,8 3,4 2,4 3,6 3,1 3,7 1,9 3,0 3,6 4,0
20 CARLOS HERNAN SARAZA NARANJO

El primer paso para iniciar el estudio consiste en ordenar los datos en forma
ascendente, procedimiento que aparece a continuación
1,5 1,5 1,5 1,7 1,7 1,7 1,7 1,7 1,8 1,9 1,9 1,9 2,0 2,0 2,0 2,0
2,0 2,0 2,0 2,0 2,0 2,4 2,4 2,5 2,5 2,6 2,6 2,7 2,8 2,8 2,8 2,8
2,8 2,8 2,8 2,9 2,9 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,1 3,1 3,3 3,3
3,4 3,4 3,4 3,5 3,5 3,5 3,6 3,6 3,6 3,6 3,6 3,6 3,6 3,6 3,6 3,6
3,7 3,7 3,7 3,8 3,8 3,8 3,8 3,8 3,8 3,9 3,9 3,9 4,0 4,0 4,1 4,1

Una vez ordenados los datos se procede a construir los intervalos de clase.
Aunque para la construcción de los intervalos existen diversos métodos una regla
general utilizada por los autores consiste en asegurar que todos los intervalos
tengan igual tamaño. En el presente libro se desarrolla uno de tantos métodos
para la construcción de intervalos así:

 Se determina el rango de la muestra; el rango se nota R y se define como


la diferencia que existe entre el dato mayor y el dato menor de la muestra:

R = DM – Dm

Para el ejemplo que estamos siguiendo tenemos


R = 4,1-1,5 R = 2,6 milímetros
 Se decide el número de intervalos que se van a construir. El número de
intervalos se nota m. El número recomendado oscila entre 5 y 15 intervalos.
El número se escoge a voluntad teniendo en cuenta si los datos presentan
un rango grande o pequeño, a mayor tamaño del rango se recomienda
mayor número de intervalos.

También existe una regla empírica para determinar el número de intervalos,


conocida como regla de Sturges, aunque no es necesario utilizarla, se deja
para conocimiento de los lectores:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 21

m= 1+ 3,3 log n
Para el ejemplo m= 1+3,3 log 80; m= 7,28; entonces m= 7 intervalos

De igual manera otros autores definen el número de intervalos como


m n

Para el ejemplo m  80 ; por lo tanto, m=8,94; m=9 intervalos

Para el ejemplo se optará por escoger de manera libre y se construirán


6 intervalos. Entonces m=6

 Se determina el tamaño de cada intervalo. El tamaño se nota C y está dado


por:

C = R/m

Se recomienda que el tamaño del intervalo tenga el mismo número de cifras


decimales que los datos de la muestra, para el ejemplo se requiere que el
tamaño aparezca con décimas, es decir, con una sola cifra decimal. Para
realizar el ajuste se procede siempre por exceso, es decir, a la décima
siguiente.

Para el ejemplo

C = 2,6/6 C = 0,4333

De tal manera que, aproximando con un solo decimal, resulta que C = 0,5

 Se determina el nuevo rango, dado por el producto m.C = 6 (0,5) = 3,0


22 CARLOS HERNAN SARAZA NARANJO

 Se calcula la diferencia entre los rangos 3,0 – 2,6 = 0,4

 Se procede a construir los intervalos siguiendo las instrucciones siguientes:

El límite inferior del primer intervalo resulta de restar la diferencia entre los
rangos al dato menor de la muestra que es 1,5.

Primer límite inferior = 1,5 – 0,4 = 1,1

El límite superior del primer intervalo se obtiene sumando al límite inferior, el


tamaño del intervalo.

Primer límite superior= 1,1 + 0,5 =1,6

Para obtener el siguiente límite inferior se pasa al valor siguiente al límite superior,
dependiendo de los decimales que se están utilizando, es decir, si se trabaja con
unidades se pasa a la unidad siguiente, si se trabaja con décimas a la décima
siguiente, si con centésimas, a la centésima siguiente. A este límite inferior se
suma el tamaño del intervalo.

El procedimiento se continúa hasta obtener el número de intervalos buscado.

La construcción de los 6 intervalos para el ejemplo que nos ocupa es la siguiente:


El dato menor de la muestra es 1,5. Se le resta la diferencia entre rangos (0,4), se
obtiene 1,5 – 0,4 = 1,1. El primer límite inferior es 1,1, se le suma C=0,5 y se
obtiene el primer límite superior: 1,1 + 0,5 = 1,6. Se pasa al decimal siguiente, 1,7
y se suma 0,5.
Longitudes
(milímetros)
1,1 – 1,6
1,7 – 2,2
2,3 – 2,8
2,9 – 3,4
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 23

3,5 – 4,0
4,1 – 4,6
Al terminar la construcción de los intervalos es necesario comprobar que todos los
datos de la muestra queden incluidos en ellos. Es decir, que los intervalos inicien
en un valor menor o igual que el dato menor de la muestra y que terminen en un
valor mayor o igual que el dato mayor de la muestra. En algunos casos el último
intervalo sobrepasa al dato mayor, entonces se omite este intervalo y se trabaja
con los intervalos restantes.

2.3.1 Marcas de clase

En el trabajo con intervalos resulta importante determinar un número que


represente al intervalo, puesto que, como se observa, cada intervalo está
conformado por muchos números, por ejemplo, el intervalo 1,1-1,6 está
conformado por todos los números comprendidos entre 1,1 y 1,6 (1,1; 1,21; 1,22;
…1,54; 1,55; ….1,6). Las marcas de clase son los puntos medios de cada
intervalo. Se notan Xi. Para cálculos estadísticos las marcas de clase representan
a cada uno de los intervalos. Las marcas de clase se obtienen sumando los límites
de cada intervalo y dividiendo el resultado entre 2.

li  ls
Xi 
2
También se pueden obtener dividiendo el tamaño del intervalo entre dos, este
cociente se le suma a los límites inferiores o se le resta a los límites superiores.
Para la muestra de longitudes de pulgas se calcula la primera marca de clase y se
obtiene

1,1  1,6
X1   1,35
2

Todas las marcas de clase se observan en la tabla No. 2.


24 CARLOS HERNAN SARAZA NARANJO

Construcción de la distribución de frecuencias

A continuación se redefine cada una de las frecuencias definidas para variable


discreta y se calcula, para cada caso, una de las frecuencias; al final aparece la
tabla resumen de la distribución de frecuencias. (Tabla No. 2)

2.3.2 Frecuencia absoluta

fi. Es el número de datos de la muestra que son mayores o iguales que cada límite
inferior pero menores o iguales que cada límite superior, es decir, corresponde al
número de datos de la muestra que están comprendidos en cada intervalo. La
suma de frecuencias absolutas es igual a n.

Ejemplo: f1 contiene los datos de la muestra mayores o


iguales que 1,1 y menores o iguales que 1,6 de esta
manera f1 es igual a 3

2.3.3 Frecuencia absoluta acumulada

Fi. Es el número de datos de la muestra que son mayores o iguales que el dato
menor de la muestra y a su vez menores o iguales que el límite superior del
intervalo al cual corresponde la frecuencia que se está calculando, es decir, son
los datos comprendidos entre el dato menor de la muestra y el límite superior de
cada intervalo. La última frecuencia absoluta acumulada es igual a n. Las
frecuencias absolutas acumuladas pueden obtenerse sumando sucesivamente la
columna de frecuencias absolutas.

Ejemplo: F3 contiene los datos mayores o iguales que 1,1


y menores o iguales que 2,8, de esta forma F3 es igual a
35. (Ver tabla No. 2)
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 25

2.3.4 Frecuencia relativa

hi. Es el peso relativo que cada frecuencia absoluta tiene sobre el tamaño de la
muestra. Se expresa en porcentaje o en decimales. Se obtiene dividiendo cada
frecuencia absoluta entre n. Si se desea el valor en porcentaje, el cociente
obtenido se multiplica por cien. La suma de frecuencias relativas es igual a 1 si los
valores son decimales o a 100% si los valores se dan en porcentaje.

f 16
h  4 .100  .100  20%
Ejemplo: 4 n 80

2.3.5 Frecuencia relativa acumulada

Hi. Es el peso relativo que cada frecuencia absoluta acumulada tiene sobre el
tamaño de la muestra. Se obtiene dividiendo cada frecuencia absoluta acumulada
entre n y multiplicando por cien. También puede obtenerse sumando
sucesivamente la columna de frecuencias relativas. La última frecuencia relativa
acumulada es igual a 1 o 100%.

F4 51
H4  .100  .100  63,75%
Ejemplo: n 80

Tabla de frecuencias: aplicando las definiciones vistas resulta la distribución de


frecuencias que se presenta en la tabla No. 2.
26 CARLOS HERNAN SARAZA NARANJO

Tabla No. 2. Distribución de frecuencias


LONGITUD DE PULGAS DE PERRO

Longitudes Xi fi Fi hi% Hi% Longitudes


(Milímetros) (Milímetros)

1,1 – 1,6 1,35 3 3 3,75 3,75 1,05 – 1,65


1,7 – 2,2 1,95 18 21 22,50 26,25 1,65– 2,25
2,3 – 2,8 2,55 14 35 17,50 43,75 2,25 – 2,85
2,9 – 3,4 3,15 16 51 20,00 63,75 2,85 – 3,45
3,5 – 4,0 3,75 27 78 33,75 97,5 3,45 – 4,05
4,1 – 4,6 4,35 2 80 2,50 100,00 4,05 – 4,65

Además de la distribución de frecuencias se han construido unos intervalos


nuevos denominados intervalos reales (última columna en la tabla 2). Son
intervalos que permiten conseguir que la distribución sea continua, es decir, que
entre un límite superior y el límite inferior siguiente no exista espacio. Estos
intervalos son necesarios para realizar cálculos estadísticos y para obtener
algunos de los gráficos correspondientes a la muestra.

Para construir los intervalos reales se resta un límite inferior y el límite superior
inmediatamente anterior, la diferencia se divide entre dos, este cociente se resta a
los límites inferiores y se suma a los límites superiores. Por ejemplo: 1,7-1,6=0,1;
0,1/2=0,05. Este valor se le resta a 1,1; 1,7; 2,3;…4,1. Este mismo valor se le
suma a 1,6; 2,2; 2,8…4,6)

INTERPRETACIÓN DE LA TABLA
A continuación se formulan algunas preguntas referentes a la tabla, cada una con
su respuesta correspondiente, trate de resolver los enunciados antes de consultar
las respuestas:

1. ¿Cuántas pulgas fueron medidas?


2. ¿Cuál fue la mayor longitud encontrada?
3. ¿Cuál fue la longitud que más se presentó?
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 27

4. ¿Cuál fue la menor longitud encontrada?


5. ¿Cuál fue la longitud que menos se presentó?
6. Determine el valor e interprete f2, F5, h3, H4
7. ¿Cuántas pulgas midieron por lo menos 2,9 milímetros?
8. ¿Cuántas pulgas midieron entre 2,9 y 4,0 milímetros?
9. ¿Cuál es el porcentaje de pulgas que midieron más de 2,8 milímetros?
10. ¿Cuál es el porcentaje de pulgas que midieron a lo sumo 3,4 milímetros?
11. ¿Cuántas pulgas midieron por lo menos 3,5 milímetros o a lo sumo 2,2
milímetros?
12. ¿Cuántas pulgas midieron por lo menos 2,3 milímetros y a lo sumo 4,0
milímetros?
13. ¿Cuál es el porcentaje de pulgas que midieron más de 3,4 milímetros y menos
de 2,3 milímetros?

RESPUESTAS

1. Se pregunta por el tamaño de la muestra. Fueron medidas 80 pulgas.


2. De acuerdo con la tabla, la mayor longitud encontrada fue 4,6 milímetros.
3. La longitud que más se presentó es aquella que tiene mayor frecuencia
absoluta. Corresponde a la longitud entre 3,5 y 4,0 milímetros.
4. De acuerdo con la tabla, la menor longitud encontrada fue 1,1 milímetros.
5. La longitud que menos se presentó es aquella que tiene menor frecuencia
absoluta. Corresponde a la longitud entre 4,1 y 4,6 milímetros.
6. f2 es la segunda frecuencia absoluta. Su valor es 18. Significa que 18 pulgas
midieron entre 1,7 y 2,2 milímetros.

F5 es la quinta frecuencia absoluta acumulada. Su valor 78. Significa que 78


pulgas midieron entre 1,1 y 4,0 milímetros.

h3 es la tercera frecuencia relativa. Su valor 17,5%. Significa que el 17,5% de


las pulgas midieron entre 2,3 y 2,8 milímetros.
28 CARLOS HERNAN SARAZA NARANJO

H4 es la cuarta frecuencia relativa acumulada. Su valor 63,75%. Significa que el


63,75% de las pulgas midieron entre 1,1 y 3,4 milímetros.

7. Se pregunta por el número de pulgas cuyas longitudes fueron iguales o


superiores a 2,9 milímetros: 45 pulgas.

8. Se pregunta por el número de pulgas del cuarto y quinto intervalos: 43 pulgas.


9. Se pregunta por el porcentaje de pulgas con longitud mayor que 2,8
milímetros: 56,25%
10. Se Pregunta por el porcentaje de pulgas con longitud menor o igual a 3,4
milímetros: 63,75%

11. Es necesario tener en cuenta que la conjunción o, significa


unión. Se pregunta por todas las pulgas que cumplan con una
cualquiera de las condiciones dadas, es decir, se pregunta por
pulgas con longitud mayor o igual que 3,5 o menor o igual que 2,2
milímetros: 50 pulgas.

12. Es necesario tener en cuenta que la conjunción y, significa


intersección. Se pregunta por todas las pulgas que cumplan con
las dos condiciones dadas, es decir, se pregunta por pulgas con
longitud mayor o igual que 2,3 milímetros y que al mismo tiempo
tengan longitud menor o igual que 4,0 milímetros, es decir, pulgas
con longitud entre 2,3 y 4,0 milímetros: 57 pulgas.

13. Se pregunta por pulgas con longitud mayor que 3,4 milímetros y, a su vez,
menor que 2,3 milímetros: no existen pulgas con esas condiciones, 0%.

2.4 Distribución de frecuencias para un estudio de variable


cualitativa
Las variables cualitativas se expresan en palabras (color, especie, comida
preferida, etc.). Sin embargo, ellas dan origen a números a través de los cuales es
posible estudiar su comportamiento en determinada situación.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 29

Es importante mostrar, por medio de un ejemplo, cómo se analizan las variables


cualitativas. El ejemplo es el siguiente:
Un estudio realizado entre jóvenes que estudian en universidades del Eje Cafetero
planteó, como una de las variables, indicar cuáles son los tipos de carne que
prefieren comer. En el estudio participaron 80 jóvenes a quienes se les indicó que
podían marcar más de una opción. Los resultados se resumen en la siguiente
tabla:
Tipo de carne No. de respuestas
Res 49
Cerdo 56
Pescado 74
Pollo 58
Camarones 67
Conejo 34

Con estos datos es posible construir una tabla sencilla en los siguientes términos

Tipo de carne fi hi%/80


Res 49 61,25
Cerdo 56 70
Pescado 74 92,5
Pollo 58 72,5
Camarones 67 83,75
Conejo 34 42,5

Es importante tener en cuenta varios aspectos que ocurren en la tabla anterior:


 No se construyen frecuencias acumuladas porque no se trata de una variable
que tenga una sola respuesta, ni de una variable que esté expresada en
números.
30 CARLOS HERNAN SARAZA NARANJO

 Lo único que se hace es contar, a manera de una frecuencia absoluta, cuántos


jóvenes eligieron cada uno de los tipos de carne.
 La frecuencia relativa, a diferencia de lo que ocurre en la variable cuantitativa,
no suma 100%, porque se trata de un estudio en el que un mismo joven puede
dar varias respuestas a la vez, de tal manera que el interés es saber qué
porcentaje de los 80 jóvenes elige cada una de los tipos de carne. Las
frecuencias relativas, en consecuencia, se han calculado sobre n=80 jóvenes,
valor que no coincide con la suma de frecuencias absolutas.

Interpretación de la tabla

De igual manera, como la tabla es muy sencilla, su interpretación presenta esta


misma característica, sin embargo, es posible dar respuesta a preguntas como las
siguientes:
1. ¿Cuántos jóvenes prefieren carne de res?
2. ¿Cuál es el porcentaje de jóvenes que prefieren el pescado?
3. ¿Cuál es el porcentaje de jóvenes que prefieren los camarones?
4. ¿Cuál es el tipo de carne menos mencionado por los jóvenes?
5. ¿Cuáles son los tres tipos de carne más comunes entre los jóvenes?
6. ¿Cuántos tipos de carne logran ser preferidos por lo menos por el 50% de
los jóvenes?
RESPUESTAS
1. 49 jóvenes prefieren carne de res
2. El 92,5% de los jóvenes prefieren el pescado
3. El 83,75% de los jóvenes prefieren los camarones
4. El tipo de carne menos mencionado por los jóvenes es la carne de conejo
5. Los tres tipos de carne más comunes entre los jóvenes son el pescado, los
camarones y el pollo
6. 5 tipos de carne (res, cerdo, pescado, pollo, camarones) logran ser
escogidos por lo menos por el 50% de los jóvenes.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 31

Los datos de la encuesta se resumen en la figura No. 2 (Para tener claridad sobre
el gráfico que se ha construido, consulte la unidad 3.

TIPO DE CARNE PREFERIDO POR LOS JÓVENES QUE


ESTUDIAN EN UNIVERSIDADES DEL EJE CAFETERO

80
NÚMERO DE JÓVENES
70
60
50
40 74 67
30 49 56 58
20 34
10
0

do
s

llo

es

jo
Re

rd

ne
a

on
Po
sc
Ce

Co
ar
Pe

m
Ca
TIPO DE CARNE

Figura No. 2. Histograma. Tipo de carne


preferido por jóvenes matriculados en
universidades del Eje Cafetero
32 CARLOS HERNAN SARAZA NARANJO

UNIDAD III

REPRESENTACIÓN GRÁFICA
INTRODUCCIÓN

Una distribución de frecuencias puede ser graficada de diversas maneras. En el


presente libro se abordan los siguientes gráficos: histograma, polígono de
frecuencias, gráfico circular y ojivas.

Cada gráfico tiene su propia interpretación y permite relacionar diferentes


elementos de una tabla de frecuencias.

Los gráficos tienen varias ventajas sobre los datos que contiene la tabla: en primer
lugar, su estética los hace llamativos y motivan a la lectura; en segundo lugar
permiten visualizar fácilmente los valores que sobresalen en una muestra así
como aquellos que se presentan con menor frecuencia.

Muchas publicaciones de libros, revistas, periódicos, y similares, utilizan los


gráficos para hacer más agradable y entendible la lectura, de tal manera que más
lectores quieran y puedan acceder a estos medios de comunicación.

De igual manera, cada vez es más común que en los seminarios y conferencias
alrededor del mundo, los conferenciantes utilicen gráficos para presentar
argumentos de sus hipótesis y para dejar planteados sus presupuestos sobre
diferentes temas. Condensar en cifras y en gráficos una información constituye un
elemento de confianza para los oyentes de los conferenciantes.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 33

3.1 CONDICIONES GENERALES DE LOS GRÁFICOS

Los gráficos estadísticos tienen el doble objetivo de recrear la información y de


facilitar el análisis de la misma. Cualquiera sea el gráfico que se elija para
representar una muestra, este debe cumplir con ciertas condiciones:

 El gráfico más efectivo es aquél que resulte más simple y por lo tanto sólo
debe contemplar la información necesaria.
 Todo gráfico requiere un título que identifique el objeto de estudio.

 Si el gráfico utiliza ejes, cada uno de los ejes debe estar identificado con la
variable que maneja.

 Cada vez que sea necesario, se debe aclarar el contenido del gráfico por
medio de convenciones.

 Un gráfico debe ser tan claro que pueda ser interpretado en ausencia de los
datos que lo originaron.

 Los gráficos que hacen parte del mismo documento deben ser numerados.

3.2 Histograma

O gráfico de barras. Está compuesto por rectángulos cuyas bases, de igual longitud,
se colocan sobre el eje X y sus alturas, coincidentes con las frecuencias absolutas, se
ubican sobre el eje Y. Se pueden utilizar intervalos reales (barras unidas) o intervalos
de clase (barras separadas). La Figura No. 3 muestra el histograma correspondiente a
la muestra de las longitudes de pulgas de perro, utilizada en la unidad II.
LONGITUD DE PULGAS DE
Longitudes fi
milímetros
PERRO
30
Cantidad de pulgas

27
1,1 – 1,6 3 25
20 18 1,1 – 1,6
1,7 – 2,2 18 15 14
16
1,7 – 2,2
2,3 – 2,8 14 10 2,3 – 2,8
2,9 – 3,4 16 5 3 2 2,9 – 3,4
3,5 – 4,0 27 0 3,5 – 4,0
1 4,1 – 4,6
4,1 – 4,6 2
Longitudes (mm)

Figura No.3. Histograma


34 CARLOS HERNAN SARAZA NARANJO

La figura muestra que la longitud que más se presenta (barra más alta), es la
longitud comprendida entre 3,5 y 4,0 milímetros; la longitud que menos se
presenta (barra más baja), es la longitud comprendida entre 4,1 y 4,6 milímetros;
la menor longitud encontrada fue 1,1 milímetros mientras que la mayor fue 4,6
milímetros. De igual manera se pueden obtener muchas otras conclusiones.

3.3 Polígono de frecuencias

Es un gráfico que relaciona las marcas de clase, ubicadas sobre el eje X de un


plano cartesiano, con las frecuencias absolutas, ubicadas sobre el eje Y. La Figura
No. 4 muestra el polígono de frecuencias correspondiente a la muestra de las
longitudes de pulgas de perro. Los datos correspondientes al gráfico se consignan
la tabla a la izquierda del mismo.

27
Cantidad de pulgas

30
Longitudes fi
25 18
Milímetros 16
20 14
1,35 3 15
1,95 18 10 3 2
2,55 14 5
0
3,15 16 1.35 1.95 2.55 3.15 3.75 4.35
3,75 27
Longitudes (mm)
4,35 2
Figura No.4. Polígono de frecuencias

El gráfico muestra, por ejemplo, que hubo 18 pulgas con una longitud media de
1,95 milímetros; hay 14 pulgas con longitud media de 2,55 milímetros (nota: el
concepto de media puede ser consultado en la unidad referente a medidas de
centralización, en este caso, la marca de clase es la media de cada intervalo)

3.4 Gráfico circular

Es un gráfico que relaciona los intervalos con las frecuencias relativas. Analiza
porcentualmente la distribución partiendo de la relación que existe entre la
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 35

circunferencia (360º) y el 100% de las frecuencias relativas. Para cada frecuencia


relativa se establece, por medio de una regla de tres simple directa, el valor de
grados que le corresponden. El gráfico se completa con convenciones que aclaren
su contenido. La Figura No. 5 muestra el gráfico circular correspondiente a la
muestra de la longitud de pulgas de perro. Los Datos correspondientes al gráfico
se consignan la tabla a la izquierda del mismo.

El gráfico muestra, por ejemplo, que hay 33,75% de pulgas con longitud entre 3,5
y 4,0 milímetros; hay 3,75% de pulgas con longitud entre 1,1 y 1,6 milímetros; hay
20% de pulgas con longitud entre 2,9 y 3,4 milímetros.

Longitudes hi
Milímetros 3%4%
1,1 – 1,6 3,75
1,7 – 2,2 22,50 1,1 – 1,6
2,3 – 2,8 17,50 34%
23% 1,7 – 2,2
2,3 – 2,8
2,9 – 3,4 20,00 2,9 – 3,4
3,5 – 4,0 33,75 18% 3,5 – 4,0
20%
4,1 – 4,6 2,50 4,1 – 4,6

Figura No. 5. Gráfico circular

3.5 Ojivas

Son gráficos que muestran el crecimiento o decrecimiento acumulado de la


distribución. Las ojivas pueden graficarse de dos formas diferentes: ojiva mayor
que y ojiva menor que.

3.5.1 Ojiva mayor que

Se construye respondiendo a la pregunta ¿Cuántos datos son mayores que cada


límite real?. Con la pregunta se construye una columna de frecuencias
acumuladas, en forma descendente, así:
36 CARLOS HERNAN SARAZA NARANJO

1,05 80
1,65 77
2,25 59
2,85 45
3,45 29
4,05 2
4,65 0

En la tabla No. 2 se puede observar de dónde resultan las frecuencias. Cuando se


pregunta cuántos datos de la muestra son mayores que 1,05, resultan ser todos
(80); cuando se pregunta cuántos datos son mayores que 1,65 resultan ser todos
menos los que corresponden al primer intervalo (80-3=77); cuando se pregunta
cuántos datos son mayores que 2,25 resultan ser todos menos los que
corresponden al primer y segundo intervalos (80-21=59); así sucesivamente.

3.5.2 Ojiva menor que

Se construye respondiendo a la pregunta ¿Cuántos datos son menores que cada


límite real?. Con la pregunta se construye una columna de frecuencias
acumuladas, en forma ascendente, así:
1,05 0
1,65 3
2,25 21
2,85 35
3,45 51
4,05 78
4,65 80
En la tabla No. 2 se puede observar de dónde resultan las frecuencias. Cuando se
pregunta cuántos datos de la muestra son menores que 1,05, resulta ninguno (0);
cuando se pregunta cuántos datos son menores que 1,65 resultan ser los que
corresponden al primer intervalo (3); cuando se pregunta cuántos datos son
menores que 2,25 resultan ser los que corresponden al primer y segundo
intervalos (21); así sucesivamente. Nótese que si se unen las dos tablas (ojiva
mayor que y ojiva menor que, las frecuencias correspondientes a cada fila suman
80 (0+80=80; 3+77=80; 21+59=80). La Figura No. 6 muestra las ojivas
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 37

correspondientes a la muestra de la longitud de pulgas de perro utilizado en la


unidad II. Los datos se han descrito en los renglones anteriores.

LONGITUD DE PULGAS DE PERRO


90 80 80
77 78
80
70
Cantidad de pulgas

59
60 51
45
50
35
40 29 Ojiva >
30 21 Ojiva <
20
10 3 2
0
1.05 1.65 2.25 2.85 3.45 4.05 4.65
Longitudes (mm)

Figura No.6. Ojivas

El gráfico muestra, por ejemplo, que hay 80 pulgas con longitud mayor que 1,05
milímetros, mientras que no hay pulgas con longitud menor que 1,05 milímetros;
hay 59 pulgas con longitud mayor que 2,25 milímetros en tanto que 21 pulgas
tienen longitud menor que 2,25 milímetros.
38 CARLOS HERNAN SARAZA NARANJO

UNIDAD IV

MEDIDAS DE CENTRALIZACIÓN Y DE POSICIÓN

INTRODUCCIÓN

La estadística descriptiva tiene, como objetivo general, el análisis de conjuntos de


datos para aportar a la estadística inferencial en la búsqueda de conclusiones
acerca de conjuntos mayores de los cuales se han extraído los datos analizados.

El análisis que la estadística hace de los datos no puede quedarse sólo en contar
cuántos elementos del conjunto cumplen con cierta característica, es necesario ir
más allá, se requiere realizar mediciones que permitan establecer relaciones entre
los elementos del conjunto y que ayuden a determinar puntos desde los cuales se
miren los valores para dar solidez a los resultados obtenidos.

En la presente unidad se entregan los elementos conceptuales necesarios para


hacer mediciones a lo largo de la ordenación del conjunto de datos, que traten de
informar el punto donde se ubica el centro del conjunto, para obtener diversas
conclusiones según la medida que se esté utilizando.

De igual manera se hacen mediciones que permiten ubicar diferentes valores en la


muestra que están relacionados con porcentajes de interés dentro de la misma.

Para facilitar la comprensión de las fórmulas que se requieren para los diferentes
cálculos, la unidad se inicia con una explicación acerca de la notación sumatoria.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 39

4.1 Notación sumatoria

El símbolo
 Xi
i 1 se lee sumatoria desde i=1 hasta n de los Xi y representa la
4

suma de los valores de Xi desde i=1 hasta i=n, por ejemplo,


 Xi
i 1 representa la
suma X1 + X2 + X3 + X4.

Ejemplo: Sean X1 =3 X2=4 X3=2 X4=5 X5=-2

Halle el valor de las sumatorias dadas:


5

X i
a. i 2 = X2+X3+X4+X5 = 4+2+5+(-2) = 9

X
2
i
b. i 1 = X12+X22+X32+X42 = 9+16+4+25 = 54

NOTA: Cuando se requiere simbolizar la suma de n valores, desde i=1 hasta i=n,

 Xi
para simplificar el símbolo se escribe

 Xi  X 1  X 2  X 3  .......  X n
Es decir,

4.2. Medidas de centralización

Son medidas de centralización aquellas que tienden a ubicar el centro de una


distribución. Las medidas de centralización son variadas, en el presente libro se
definen la media aritmética, la media geométrica, la media armónica, la mediana y
la moda. Además se definen los cuartiles, los deciles y los percentiles que reciben,
junto con la mediana, el nombre de medidas de posición por cuanto permiten
ubicar diferentes puntos dentro de la distribución.

4.2.1 Media aritmética

También se le denomina media. Se nota X cuando se calcula para una muestra


y se nota μ cuando se calcula para una población. La media de un conjunto de n
40 CARLOS HERNAN SARAZA NARANJO

valores se define como la sumatoria de los valores dividida entre el número de


valores, es decir,

X X i

Ejemplo: Sean X1 =30 X2=40 X3=20 X4=50 X5=12

La media está dada por:

X X i

30  40  20  50  12 152
  30,4
n 5 5

La media de los valores es igual a 30,4

Ejemplo: en el Laboratorio Universo Animal, dedicado a la realización de


exámenes clínicos a animales, se entrega el registro de lectura de hemoglobina
realizada a 8 gatos. Los resultados obtenidos, en g/dl (Gramos por decilitro),
fueron los siguientes:

X1 = 8,5 X2 = 8,2 X3 = 9,9 X4 = 9,1


X5 = 9,4 X6 = 9,8 X7 = 9,5 x8 = 9,7

El valor medio de hemoglobina en los gatos está dado por:

X
 X i  8,5  8,2  9,9  9,1  9,4  9,8  9,5  9,7  74,1  9,2655 g/dl
n 8 8

El valor medio de la hemoglobina para la muestra de gatos es 9,2655 g/dl.

4.2.1.1 Media para datos con frecuencias

Cuando al querer calcular una media ocurre que uno o más datos se repiten
(frecuencias absolutas), la fórmula a utilizar para el cálculo es:

X 
 f .x
i i

n
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 41

 fi
Donde n=
Nótese que la fórmula indica que se debe multiplicar cada valor de fi por el valor
correspondiente de la variable. Los productos obtenidos se suman y el resultado
de la sumatoria se divide entre n.

Ejemplo:

Se realiza un estudio para determinar el diámetro biparietal (distancia que existe


entre los huesos parietales del cráneo) en una muestra de perros pequinés. Los
datos obtenidos, en milímetros, se resumen en la siguiente tabla

Diámetros No. de perros


(centímetros) fi
Xi
22,5 54
23,4 28
24,5 72
25,2 53
25,5 12
25,8 5
n=224

Para determinar el diámetro biparietal medio de los perros se aplica la fórmula


obteniendo:

X
 fi . X i  54(22,5)  28(23,4)  72(24,5)  53(25,2)  12(25,5)  5(25,8)  5504,8  24,1285 milímetros
n 224 224
La muestra de perros presentó un diámetro biparietal medio de 24,1285
milímetros.

El cálculo anterior se facilita si se utiliza una tabla con una tercera columna como
se muestra a continuación
42 CARLOS HERNAN SARAZA NARANJO

Diámetro No. de fi.xi


(mm) perros
Xi fi
22,5 54 1215,0
23,4 28 655,2
24,5 72 1764,0
25,2 53 1335,6
25,5 12 306,0
25,8 5 129,0
n=224 5504,8

Obtenida la tabla, el cálculo se reduce a:


5504,8
X   24,1285 milímetros
224
4.2.1.2 Media para datos agrupados en intervalos

Cuando los datos se han agrupado en intervalos, la fórmula para el cálculo de la


media es:
Nótese que esta fórmula es
X  f .X
i i
similar a la que se ha venido
n utilizando, lo importante es
recordar que cuando se
trata de intervalos las Xi
corresponden a las marcas
de clase
Ejemplo:

Se realizó un estudio para determinar el tiempo medio requerido para hacer una
intervención quirúrgica en caballos. Se trabajó con una muestra de 36
intervenciones similares. En la tabla siguiente aparece el registro de los tiempos
en minutos.

Tiempos (minutos) fi xi fi . xi
40,2-40,8 8 40,5 324,0
40,9-41,5 5 41,2 206,0
41,6-42,2 3 41,9 125,7
42,3-42,9 11 42,6 468,6
43,0-43,6 9 43,3 389,7
n =36 1514
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 43

1514
X  42,05 minutos
36

El tiempo medio requerido para hacer la intervención quirúrgica es 42,05 minutos.

4.2.1.3 Propiedades de la media

La media tiene diversas propiedades que se enuncian en los siguientes renglones

1. La suma algebraica de las desviaciones de un conjunto de datos con


respecto a su media es igual a cero.

Se entiende por desviaciones con respecto a la media, la diferencia que existe


entre cada dato de la muestra y la media.

Ejemplo: Sean X1 =28 X2=30 X3=36 X4=42 X5=47

183
X   36,6
5
El cálculo de las desviaciones es el siguiente:

d1 = 28 - 36,6 = - 8,6 d2=30 - 36,6 = - 6,6 d3=36 - 36,6 = - 0,6


d4= 42 - 36,6 = 5,4 d5=47 - 36,6 = 10,4

di= 0

2. La media de una constante es igual a la constante

Ejemplo: Sean X1 =28 X2=28 X3=28 X4=28 X5=28

28  28  28  28  28 140
X    28
5 5

3. La media de una variable más una constante es igual a la media de la


variable más la constante.

Ejemplo: Sean X1 =52 X2=58 X3=81 X4=28 X5=38

52  58  81  28  38 257
X1    51,4
5 5
44 CARLOS HERNAN SARAZA NARANJO

A cada valor de la muestra se le suma una constante arbitraria K, para el ejemplo


se suma K = 12 (el valor de la constante ha sido elegido libremente)

Los datos originales quedan convertidos en:

X1 =64 X2=70 X3=93 X4=40 X5=50

64  70  93  40  50 317
X2    63,4
5 5

Se muestra, con el ejemplo, que: X 2  X 1  k X 2  51,4  12 X 2  63,4

Ejemplo aplicado:

El tempo medio requerido por los médicos veterinarios para las diferentes
consultas que atienden en una clínica, ha sido registrado en 0,342 horas. Sin
embargo, cuando los médicos tienen en sus consultorios estudiantes en práctica,
cada tiempo de consulta se incrementa en 4,5 minutos. ¿Cuál es el tiempo medio
requerido para las consultas con la presencia de estudiantes practicantes?.

Los datos del ejercicio son: X1  0,342horas K  4,5 minutos


Para poder hacer los cálculos es necesario igualar unidades.
X1  0,342(60) minutos  20,52 minutos

El nuevo tiempo medio es: X 2  20,52  4,5  25,02 minutos que equivalen a 0,417 horas

4. La media de una variable por una constante es igual a la media de la


variable por la constante.

Ejemplo: Sean X1 =52 X2=58 X3=81 X4=28 X5=38

52  58  81  28  38 257
X1    51,4
5 5

Cada valor de la muestra se multiplica por una constante aleatoria K, para el


ejemplo K = 5

Los datos originales quedan convertidos en:

X1 =260 X2=290 X3=405 X4=140 X5 =190


ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 45

260  290  405  140  190 1285


X2    257
5 5

Se muestra, con el ejemplo, que: X 2  X 1.k X 2  51,4(5) X 2  257

Ejemplo aplicado:

En la finca Resplandor se llevan registros que determinan que el peso medio de


los conejos al nacer es 29,5 gramos. Se ha establecido que una dieta especial
sobre las madres gestantes puede incrementar en un 15% el peso de los gazapos
al nacer. Si una muestra de conejas recibe la dieta, ¿Cuál es el peso medio que
se puede esperar en los gazapos?

Los datos del ejercicio son: X 1  29,5 gramos K  1,15

NOTA ACLARATORIA: para hacer un incremento porcentual se multiplica la


cantidad base por la unidad más el incremento escrito en decimal. En este caso
15% es 15/100=0,15 y por lo tanto la constante es 1+0,15=1,15

El nuevo valor medio es: X 2  29,5(1,15)  33,925 gramos

El peso medio de los gazapos que resultan de conejas que reciben la dieta es
33,925 gramos.

5. Si n1 datos tienen media X 1 ; n2 datos tienen media X 2 ; n3 datos tienen


media X 3 ; ...; nK datos tienen media X k , entonces la media de todos los
datos está dada por:

ni . Xi n1. X 1  n2 . X 2  n3 . X 3  .....  nk . X k


X 
n n

Ejemplo: Sean X1 =12 X 2=18X3=11 X4=14 X5=16

X1 =4 X2=9 X3=2

X1 =2 X2=7 X3=3 X4=4

La media de todos los valores, incluidas las tres variables, está dada por:

12  18  11  14  16  4  9  2  2  7  3  4 102
X2    8,5
12 12
46 CARLOS HERNAN SARAZA NARANJO

La media anotada puede conseguirse calculando la media de cada serie y


aplicando la fórmula indicada en la propiedad así:

71 15 16
X1   14,2 X2  5 X3  4
5 3 4

n1=5 n2=3 n3=4 n=12

14,2(5)  5(3)  4(4) 102


X    8,5
12 12

Ejemplos aplicados:

1. Esteban es propietario de explotaciones porcícolas en diferentes fincas en


municipios del Eje Cafetero. Ha solicitado que se le entregue un registro de los
pesos de los animales en 3 de las explotaciones. Los registros que recibe indican
que en La Estrella se pesaron 80 animales que entregan un peso medio de 84,7
kilogramos; en El Paso se pesaron 105 animales con un peso medio de 79,2
kilogramos; mientras que en La Palmilla el peso medio de 92 cerdos fue 64,8
kilogramos. ¿Cuál es el peso medio de los cerdos en las 3 explotaciones?.

Los datos del ejercicio son:

X 1  84,7 kilogramos X 2  79,2 kilogramos X 3  64,8 kilogramos


n1 =80 n2 =105 n3=92 n=277

84,7(80)  79,2(105)  64,8(92) 21053,6


X    76 kilogramos
277 277
El peso medio de los cerdos en las 3 explotaciones es 76 kilogramos

2. Los 50 trabajadores de la clínica Senderos se distribuyen entre hombres y


mujeres. Los 38 hombres ganan en promedio $54.500 diarios en tanto que las
mujeres ganan en promedio $53.900 diarios. ¿Cuál es el salario medio diario de
los trabajadores de la clínica?

Los datos del ejercicio son:

X H  54.500 X M  53.900 X  ¿?

n Hombres =38 n Mujeres=12 n=50


ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 47

54.500(38)  53.900(12) 2.717.800


X   54.356
50 50

El salario medio diario de los trabajadores de la clínica Senderos es $54.356

3. Para realizar un estudio acerca del tiempo que requieren las peces para
alcanzar el peso de uso en procesos agroindustriales se utilizan dos muestras,
una en una región con temperatura media de 22 °C y otra en una región con
temperatura media de 25°C. Se analizan en total 100 animales. Se obtiene un
tiempo medio de 142,44 días. Los peces de la región con temperatura de 22 °C
arrojaron un tiempo medio de 144 días mientras que los peces de la región con
temperatura de 25 °C arrojaron un tiempo medio de 138 días. ¿Cuántos peces se
manejaron en cada región?

Los datos del ejercicio son:

X 22  144 días X 25  138 días X  142,44 días

n22 =¿ ? n25=¿ ? n=100

Para resolver el ejercicio se parte de la base que n=n22+ n25

Por lo tanto 100=n22+ n25

Se tiene que n22 =100 – n25

Remplazando en la fórmula se tiene

(100 - n 25 )(144)  n 25 (138)


142,44 
100 Pasando el 100 a multiplicar resulta

14.244  14.400  144. n 25  138.n 25 Pasando 14.400 a restar resulta

14.244  14.400  144. n 25  138.n 25

 156  6.n 25

 156 26  n 25
 n 25
6

En la región con temperatura de 25 °C se manejaron 26 peces

Para hallar el número de peces manejados en la región con temperatura de 22 °C


48 CARLOS HERNAN SARAZA NARANJO

n22 = 100 – n25

n22 = 100 – 26

n22 = 74
Se manejaron 74 peces en la región con temperatura de 22 °C.

4.2.2 Media geométrica

El uso de la media geométrica no es muy común. Esta medida se utiliza cuando se


desea dar importancia a valores pequeños de la variable o cuando los datos se
presentan en forma similar a una progresión geométrica (se llama progresión
geométrica a un conjunto de números para los cuales un número se consigue
multiplicando el anterior por una constate, por ejemplo: 2, 6, 18, 54, 162…..).

La media geométrica es muy útil cuando se desea promediar el crecimiento o


decrecimiento de una variable.

La media geométrica se nota G.

4.2.2.1 Cálculo de la media geométrica para datos sin frecuencias

La media geométrica se calcula por medio de la raíz n-ésima del producto de los n
datos de la muestra, es decir:

n
G  n  xi
i 1
n

Donde el símbolo i 1 representa la productoria (multiplicación) de los valores de xi
desde i=1 hasta i=n

Ejemplo: los siguientes datos corresponden al precio del dólar, en pesos, durante
8 días.

176 177 182 182 180 185 192 197


8 2 0 4 0 0 0 2

Se pide hallar la media geométrica del precio del dólar

n
G  n xi  8 (1768)(1772)(1820)(1824)(1800)(1850)(1920)(1972)
i 1
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 49

G  8 1,31128x10 26

G  1839,55095

La media geométrica del precio del dólar durante los 8 días fue $1839,55
4.2.2.2 Cálculo de la media geométrica para datos con frecuencias
La media geométrica se calcula por medio de la raíz n-ésima del producto de los n
datos de la muestra, elevado, cada uno de ellos, a la frecuencia correspondiente,
es decir

x
fi
Gn i
i 1

Ejemplo

Los siguientes datos corresponden a la variación del interés bancario durante 30


días de un mes:

Variació No. de
n días
0,2 7
0,4 9
0,5 6
0,6 5
0,7 3

Se pide hallar la media geométrica de la variación del interés bancario

n
f
G  xi i  30 (0,2) 7 (0,4) 9 (0,5) 6 (0,6) 5 (0,7) 3
n
i 1

G  30 1,39836x10 -12

G  0,402581682

La media geométrica de la variación del interés bancario es 0,4

4.2.2.3 Cálculo de la media geométrica utilizando logaritmos


50 CARLOS HERNAN SARAZA NARANJO

Dado que el cálculo de la media geométrica se realiza utilizando el producto de los


valores de la muestra, en ocasiones este producto se hace muy grande y resulta
ser un cálculo difícil e imposible, aun para las calculadoras. Por esta razón se
recomienda utilizar las propiedades de los logaritmos para hacer el cálculo
correspondiente. El procedimiento de uso de logaritmos se muestra para el
ejemplo que se acaba de resolver, deduciendo primero la fórmula a utilizar así:

x
fi
Gn i
i 1
Expresando la raíz como potencia se tiene:
1
 n n
 fi 
G    xi 
 i1 
  Aplicando logaritmos en ambos lados de la igualdad se obtiene
1
 n n
 fi 
log G  log   xi 
 i 1 
 

Aplicando propiedad de la potencia en un logaritmo se obtiene

 n 
1  fi 
log G  log   xi 
n  i1 
 
Como el logaritmo de un producto se puede separar como la suma de los
logaritmos entonces tenemos que

1 n
 log xi i Aplicando de nuevo regla de la potencia para logaritmos se
f
log G 
n i1
obtiene
1 n
log G   fi log xi
n i1
Para volver al valor de G, obtenemos
1 n
G  anti log  fi log xi
n i1
Aplicando esta fórmula al ejemplo anterior se obtiene la siguiente tabla:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 51

Variación No. de
% días
0,2 7 -
-0,69897 4,89279003
0,4 9 - -
0,39794001 3,58146008
0,5 6 -
-0,30103 1,80617997
0,6 5 - -
0,22184875 1,10924375
0,7 3 - -
0,15490196 0,46470588
-
11,8543797

 1 
G  anti log  (-11,8543797)
 30 
G  anti log - 0,39514599
G  0,402581682
La media geométrica de la variación del interés bancario es 0,4%

4.2.3 Media armónica

El uso de la media armónica, al igual que el de la media geométrica, no es muy


común. Por esta razón estas dos medidas se definen y se calculan sólo a manera
de información para los estudiantes. Esta medida se utiliza cuando se desean
promediar cantidades que tienen comportamientos inversamente proporcionales o
cantidades que están expresadas como tasas (de crecimiento, de decrecimiento,
de población, etc.).

La media armónica se nota H.

4.2.3.1 Cálculo de la media armónica para datos sin frecuencias

La media armónica se define como el inverso de la media de los inversos de los


datos de la muestra, es decir:

n
H n
1
x
i 1 i
52 CARLOS HERNAN SARAZA NARANJO

Ejemplo

Los siguientes datos corresponden al precio del dólar durante 8 días, dado en
pesos:

181 190 185 187 201 169 192 167


2 0 0 8 0 8 0 4

Se pide hallar la media armónica del precio del dólar

8
H
1 1 1 1 1 1 1 1
      
1812 1900 1850 1878 2010 1698 1920 1674

8
H
0,0043558

H  1836,63

La media armónica del precio del dólar fue $1836,63

4.2.3.2 Cálculo de la media armónica para datos con frecuencias

Cuando los datos aparecen con frecuencias, la media armónica se calcula


utilizando la siguiente relación

n
H n
fi
x
i 1 i

Ejemplo

Los siguientes datos corresponden a la variación del interés bancario durante 30


días de un mes:

Variación No. de
% días
0,2 7
0,4 9
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 53

0,5 6
0,6 5
0,7 3

Se pide hallar la media armónica de la variación del interés bancario

Vamos a aplicar la fórmula para lo cual construimos una tabla de valores

Variació No. de f i / xi
n días
0,2 7 35,00
0,4 9 22,50
0,5 6 12,00
0,6 5 8,33
0,7 3 4,28
82,11

30
H
82,11

H  0,36

La media armónica de la variación del interés bancario es 0,36 %.

4.2.4 Mediana

Se nota me. La mediana es una medida de centralización y de posición. La


mediana es una medida que divide un conjunto de datos en dos partes iguales de
tal manera que ubica el 50% de los datos a su izquierda (menores que la mediana)
y el 50% de los datos a su derecha (mayores que la mediana).

La mediana de un conjunto ORDENADO de valores se define como el dato medio


o como el promedio de los dos datos medios del conjunto. Esta definición está
dejando claro que para calcular la mediana se requiere ORDENAR previamente
los datos.
54 CARLOS HERNAN SARAZA NARANJO

4.2.4.1 Cálculo de la mediana para datos que no están en intervalos

a. Si el número de datos es impar, la mediana es el dato medio del conjunto


ordenado de valores y se puede ubicar utilizando la relación:

M e  X n 1
2

Ejemplo:

Se toma el dato de la temperatura (°C) de 7 perros atendidos en una clínica


veterinaria durante un día. Los datos obtenidos son los siguientes:

X1 =39,2 X2 =38,2 X3 =37,9 X4 =38,4 X5 =38,8 X6 =40,3 X7 =39,8

Ordenando los datos se obtiene 37,9; 38,2; 38,4; 38,8; 39,2; 39,8; 40,3

La mediana es el dato medio, es decir, me=38,8 ° C

El 50% de los perros mostraron temperatura mayor de 38,8 °C y el otro 50%


mostraron temperatura menor de 38,8 °C.

Aplicando la fórmula anotada para ubicar la mediana, se obtiene:

M e  X n 1  X 7 1  X 4
2 2

Lo anterior indica que la mediana es el dato que ocupa el cuarto lugar en el


conjunto ordenado de valores, en consecuencia, me =38,8 °C

b. Si el número de datos es par, la mediana es la media de los dos datos que


ocupan el centro del conjunto ordenado de valores y se puede ubicar
utilizando la relación:

X n  X n2
Me  2 2
2
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 55

Ejemplo:
Se toma el dato de la temperatura de 10 perros atendidos en una clínica
veterinaria durante un día. Los datos obtenidos son los siguientes:

X1 =39,2 X2 =38,2 X3 =37,9 X4 =38,4 X5 =38,8 X6 =40,3 X7 =39,8

X8 =41,0 X9 =38,6 X10 =39,1

Ordenando los datos 37,9; 38,2; 38,4; 38,6; 38,8; 39,1; 39,2; 39,8; 40,3; 41,0

La mediana es la media de los dos datos que ocupan el centro, es decir,

38,8  39,1
Me   38,95 C
2

En el 50% de los perros mostraron temperatura mayor de 38,95 °C y el otro 50%


mostraron temperatura menor de 38,95 °C.
.

Aplicando la fórmula anotada para ubicar la mediana, se obtiene:

X n  X n2 X 10  X 10  2
X5  X6
Me  2 2
 2 2

2 2 2

Lo anterior indica que la mediana es la media de los datos que ocupan el quinto y
el sexto lugares en el conjunto ordenado de valores, en consecuencia,

38,8  39,1
Me   38,95 C
2

4.2.4.2 Mediana para datos agrupados en intervalos

Cuando los datos han sido agrupados en intervalos, la mediana se obtiene


utilizando la siguiente relación:

n 
  Fi 1 
M e  li   2 Cr
 fi 

 
56 CARLOS HERNAN SARAZA NARANJO

Donde li = Límite real inferior del intervalo de clase mediana


n
2 =Tamaño de la muestra dividido entre dos
Fi-1 = Frecuencia absoluta acumulada del intervalo de clase anterior al intervalo de
clase mediana
fi = Frecuencia absoluta del intervalo de clase mediana.
Cr = Tamaño del intervalo real donde se encuentra la mediana (límite real superior
menos límite real inferior

Para calcular la mediana es necesario determinar el intervalo en el cual se ubicará


(intervalo de clase mediana). El intervalo de clase mediana es aquel cuya
n
frecuencia absoluta acumulada (Fi) contiene el valor del cociente 2 .
Ejemplo: Los siguientes datos corresponden a una muestra del peso de bovinos
en la Finca Campoamor:

Peso (Kg) fi Fi Peso (Kg)


200 – 242 84 84 199,5-242,5
243- 285 56 140 242,5-285,5
286 – 328 35 175 285,5-328,5
329 – 371 22 197 328,5-371,5
372- 414 11 208 371,5-414,5
415 - 457 5 213 414,5-457,5
n=213

n 213
 106,5
Se calcula 2 = 2

Este valor se ubica en la columna de frecuencias absolutas acumuladas Fi. La


frecuencia que contiene a 106,5 es F2, de acuerdo con ello la mediana se ubica en
el segundo intervalo. Al terminar el cálculo se debe verificar que el valor
encontrado se ubique entre 242,5 y 285,5 Kg.

Remplazando valores en la fórmula se obtiene:


ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 57

n   106,5  84 
  Fi 1  M e  242,5   .43
M e  li   2 Cr  56 
 fi 

 
M e  259,77 kilogramos

El 50% de los bovinos en la finca Campoamor tienen peso superior a 259,77


kilogramos y el 50% tienen peso inferior a ese valor.
58 CARLOS HERNAN SARAZA NARANJO

4.2.5 Cuartiles

Son medidas de posición que dividen una distribución en cuatro partes iguales de
tal manera que cada cuartil corresponde a 25%. Se notan Q1, Q2 y Q3.

0% Q1 = 25% Q2= 50% Q3 = 75% 100%

El 25% de los datos de la muestra son menores que el cuartil 1 mientras que el
75% de los datos son mayores que el cuartil 1.

El 50% de los datos de la muestra son menores que el cuartil 2 mientras que el
50% de los datos son mayores que el cuartil 2, es decir, el cuartil 2 coincide con
la mediana.

4.2.5.1 Cálculo de los cuartiles

Para calcular uno cualquiera de los cuartiles se procede de igual manera que en el
caso de la mediana utilizando la siguiente fórmula:

 r.n 
  Fi 1 
Qr  li   4 C r
 fi 
 
 

r representa el cuartil que se quiere calcular. La ubicación del intervalo en el cual


r.n
se encuentra el cuartil se hace por medio del cociente 4

4.2.6 Deciles

Son medidas de posición que dividen una distribución en diez partes iguales de tal
manera que cada decil corresponde a 10%. Se notan D1, D2, D3,..., D9

0% D1 =10% D3=30% D5=50% D9=90% 100%


ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 59

El 10% de los datos de la muestra son menores que el decil 1 mientras que el
90% de los datos son mayores que el decil 1.

El 20% de los datos de la muestra son menores que el decil 2 mientras que el 80%
de los datos son mayores que el decil 2; el decil 5 coincide con la mediana

4.2.6.1 Cálculo de los deciles

Para calcular uno cualquiera de los deciles se procede de igual manera que en el
caso de la mediana utilizando la siguiente fórmula:

 r.n 
  Fi 1 
Dr  li   10 Cr
 fi 
 
 

r representa el decil que se quiere calcular. La ubicación del intervalo en el cual se


r.n
encuentra el decil se hace por medio del cociente 10

4.2.7 Percentiles

Son medidas de posición que dividen una distribución en cien partes iguales de
tal manera que cada percentil corresponde a 1%. Se notan P1, P2, P3,...,P99

0% P5 P10 P99
5% 10% 99%

El 1% de los datos de la muestra son menores que el percentil 1 mientras que el


99% de los datos son mayores que el percentil 1

El 5% de los datos de la muestra son menores que el percentil 5 mientras que el


95% de los datos son mayores que el percentil 5; el percentil 50 coincide con la
mediana
60 CARLOS HERNAN SARAZA NARANJO

4.2.7.1 Cálculo de los percentiles

Para calcular uno cualquiera de los percentiles se procede de igual manera que en
el caso de la mediana utilizando la siguiente fórmula:

 r.n 
  Fi 1 
Pr  li   100 Cr
 fi 
 
 

r representa el percentil que se quiere calcular. La ubicación del intervalo en el


r.n
cual se encuentra el percentil se hace por medio del cociente 100

Ejemplo: Se tomó el peso de un lote de pollos que han sido alimentados con una
dieta alternativa. Los pesos encontrados se registran en la siguiente tabla. Se
requiere determinar el peso del 18% de los pollos más livianos; el peso del 25%
de los pollos más pesados y el peso del 40% de los pollos más pesados.
Pesos (Libras) fi Fi Pesos (Libras)
2,0 - 2,6 42 42 1,95 - 2,65
2,7 - 3,3 24 66 2,65 – 3,35
3,4 - 4,0 78 144 3,35 - 4,05 P18
4,1- 4,7 124 268 4,05 - 4,75
4,8 - 5,4 221 489 4,75 - 5,45 Q3;D6
5,5 - 6,1 125 614 5,45 – 6,15
n=614

Se están pidiendo el P18, el Q3 y el D6. Los cálculos aparecen a continuación:


18(614)
 110,52
P18 se encuentra en el intervalo que corresponde a 100
Por lo tanto el P18 se encuentra en el tercer intervalo y su cálculo es el siguiente:

 110,52  66  P18  3,35  0,3995 P18  3,74 Libras


P18  3,35   .0,7
 78 
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 61

El 18% de los pollos más livianos pesan menos de 3,74 libras.


3(614)
 460,5
Q3 se encuentra en el intervalo que corresponde a 4
Por lo tanto el Q3 se encuentra en el quinto intervalo y su cálculo es el siguiente:

 460,5  268  Q3  4,75  0,6097 Q3  5,35 libras


Q3  4,75   .0,7
 221 
El 25% de los pollos más pesados pesan más de 5,35 libras.
6(614)
 368,4
D6 se encuentra en el intervalo que corresponde a 10
Por lo tanto el D6 se encuentra en el quinto intervalo y su cálculo es el siguiente:

 368,4  268  D6  4,75  0,318 D6  5,06 libras


D6  4,75   .0,7
 221 
El 40% de los pollos más pesados pesan más de 5,06 libras.

Nótese que se pidió calcular el 40% de los pollos más pesados, sin embargo, NO
se utilizó el decil 4. Tomando como referencia los animales más pesados y desde
allí marcar el 40%, nos queda por debajo el 60%. Los cálculos se hacen con el
dato que se encentre a la izquierda. Por esta misma razón cuando requerimos
calcular el 25% de los pollos más pesados NO se utilizó el cuartil 1 sino el cuartil
3.

4.2.8 Moda

Se nota mo. Se define como el dato que más se repite en la muestra, es decir, el
dato de mayor frecuencia absoluta. En una muestra puede ocurrir que haya una
moda, en este caso se dice que la muestra es unimodal; puede ocurrir que haya
más de una moda, en este caso la muestra se denomina multimodal; también
puede ocurrir que no haya moda, en este caso la muestra se denomina amodal.

Estas tres situaciones se ilustran a continuación:


62 CARLOS HERNAN SARAZA NARANJO

Xi fi X fi Xi f i
1 de
La tabla 1 la izquierda corresponde
i 1 1unimodal, tiene una
a una muestra
2m 218 1 1 2 2
moda 0 ; la tabla del centro
2 2 corresponde a una
1 1
muestra amodal, NO
1 1
tiene moda,
5 5 porque todos los1valores1 de la variable
5 se5 repiten igual número
de veces;
1 2la tabla de la derecha5 2 corresponde a 1una2muestra multimodal
8 4tiene 2 modas: 01 1 181, m0 2  22
(bimodal), m 8 5

4.2.8.1 Moda para datos agrupados en intervalos


Cuando los datos han sido agrupados en intervalos, la moda está dada por:

 1   f i  f i 1 
M o  li   C r
 M o  li   Cr
 1  2
  ( f 
 i i 1f )  ( f i  f )
i 1 

li Límite real inferior del intervalo de clase modal.

∆1= f i  f i 1 Diferencia entre la frecuencia absoluta del intervalo de clase modal y


la frecuencia absoluta del intervalo inmediatamente anterior.

∆2= f i  f i 1 Diferencia entre la frecuencia absoluta del intervalo de clase modal y


la frecuencia absoluta del intervalo inmediatamente posterior.

Cr Tamaño del intervalo real modal.

El intervalo modal es aquel que presenta mayor frecuencia absoluta.

Ejemplo:

Los siguientes datos corresponden a una muestra de la longitud de trozos de tenia


(metros) expulsados por bovinos.

Longitud (metros) fi Longitud (metros)


5,2-5,7 12 5,15-5,75
5,8-6,3 20 5,75-6,35
6,4-6,9 33 6,35-6,95
7,0-7,5 24 6,95-7,55
7,6-8,1 13 7,55-8,15
8,2-8,7 42 8,15-8,75
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 63

8,8-9,3 41 8,75-9,35

El intervalo de clase modal es el sexto porque allí se encuentra la mayor


frecuencia absoluta; el cálculo de la moda es como sigue:

 42  13 
M o  8,15   .0,6
 (42  13)  (42  41) 

 29 
M o  8,15   .0,6
 29  1) 

M o  8,73 metros

La longitud que más se presenta en los trozos de tenia expulsados por bovinos es
8,73 metros.

Si al construir la distribución de frecuencias resultan


dos o más intervalos con la mayor frecuencia absoluta,
se trata de una muestra con dos o más modas y debe
calcularse cada una de ellas.

4.2.9 Uso de las medidas de centralización

En un estudio estadístico se pueden utilizar, según el caso, la media, la mediana o


la moda. La decisión acerca del uso de una u otra medida debe tomarse
atendiendo algunas observaciones.

 Cuando la distribución presente mucha asimetría (la mayoría de los datos


estén a un extremo de la muestra) debe utilizarse la mediana o la moda.

Xi fi
1 2 X  20,92
2 M e  22
1 5
5
1 4
8
2 1
64 CARLOS HERNAN SARAZA NARANJO

M o  22

Note la diferencia entre las medidas. Resultan más adecuadas la Me y la Mo

 Cuando la distribución tiene una o varias frecuencias absolutas muy diferentes


de las demás, debe utilizarse la moda.
Xi fi
1 2
2 X  20,42
1 5
M e  20
5
M o  22
1 1
8 5 Resulta más adecuada la Mo
2 1
 En una distribución en la que los valores extremos no estén definidos debe
calcularse la mediana o la moda.
Xi fi Como X1 y X6 no están definidas,
<1 2 no es posible calcular la media
2
15 5
18 1
5
20 1
1

M e  20

M o  22


ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 65

 La media se deja afectar fácilmente por valores extremos, en presencia de


estos es preferible utilizar la mediana. Si, de todas maneras, resulta necesario
calcular la media, es preferible retirar de la muestra aquellos datos que se
encuentren muy alejados

Ejemplo: un investigador de mercados pregunta a 8 empleados de una finca, cuál


es su salario mensual. Los datos obtenidos, en miles de pesos, se resumen en la
siguiente tabla:
72 83 83 83 173 72 71 71
0 2 4 5 0 0 5 8
El investigador calculó el salario medio por mes de las ocho personas así:

720  832  834  835  1730  720  715  718


X  888
8

De acuerdo con este resultado se debe concluir que las ocho personas reciben un
salario medio mensual de $888.000.

El investigador analiza el resultado y observa que supera a todos los salarios


excepto a uno de ellos que corresponde al agregado de la finca. Entonces decide
excluir este dato de la muestra y volver a calcular el salario medio obteniendo:

720  832  834  835  720  715  718


X  767,714
7

De acuerdo con este resultado se debe concluir que las personas de la finca
reciben un salario medio mensual de $767.714. Si se comparan los dos resultados
se podrá concluir que este último es más adecuado para interpretar el salario
medio (está más cercano a todos los datos).

 Cuando el tamaño de los intervalos en la distribución no es constante, no debe


utilizarse la moda
66 CARLOS HERNAN SARAZA NARANJO

UNIDAD V
MEDIDAS DE DISPERSIÓN Y DE FORMA

INTRODUCCIÓN

El cálculo de medidas de centralización resulta importante para el análisis de una


muestra, sin embargo no es suficiente. Existen variados ejemplos de muestras,
claramente diferentes entre sí, que conducen al mismo resultado referente a las
medidas de centralización. Se hace, en consecuencia, imprescindible determinar
en qué grado los datos de la muestra se alejan de dichas medidas.

Medir la dispersión permite, de un lado, determinar cómo se ajusta una medida de


centralización al conjunto del cual fue obtenida y, del otro, establecer grados de
alejamiento entre los datos de la muestra.

En el presente capítulo se aborda el cálculo de medidas de dispersión absoluta y


de medidas de dispersión relativa permitiendo con ello un mayor acercamiento al
análisis de muestras.

5.1 Definición de medidas de dispersión

Son medidas que permiten determinar el grado de alejamiento que un conjunto de


datos tiene con respecto a una medida de centralización. Algunas medidas de
dispersión son: el rango, la desviación media, la varianza, la desviación estándar y
el coeficiente de variación.

5.2 Rango

El rango R, es la diferencia que existe entre el dato mayor y el dato menor de un


conjunto de valores.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 67

R = DM - D m

Ejemplo:

Los siguientes datos corresponden al peso en kilogramos de una muestra de


camuros

X1= 46,62; X2=47,75; X3=47,48; X4=47,58; X5=48,52; X6=50,54; X7= 40,5; X8=43,8

El rango de los pesos está dado por:

R = 50,54 – 40,5 R = 10,04 kilogramos.

Como puede observarse, el rango es una medida muy fácil de calcular pero a su
vez presenta el inconveniente de que no proporciona buena información acerca
del comportamiento de la muestra; esto ocurre porque el rango sólo considera dos
datos de la muestra olvidándose de los demás.

5.3 Desviación media

La desviación media, M.D., de un conjunto de datos se define como la media de


los valores absolutos de las desviaciones del conjunto de datos con relación a la
media.

En consecuencia, la desviación media viene dada por las siguientes relaciones

 xi  x
M .D. 
n Cuando los datos de la muestra se presentan sin frecuencias
f i xi  x
M .D. 
n Cuando los datos de la muestra se presentan con frecuencias
68 CARLOS HERNAN SARAZA NARANJO

Nota importante: las fórmulas incluyen el concepto de valor absoluto. El valor


absoluto de un número es el valor del número considerándolo siempre positivo, es
decir:
7  7 y 7 7

Ejemplo 1:

Se realiza un estudio sobre el crecimiento de 8 semillas de pasto estrella


manejadas in vitro. Los datos obtenidos en centímetros son los siguientes:

X1=14,5 X2=15,5 X3=18,4 X4=10,2 X5=10,8 X6=17,3 X7=16,7 X8=19,4

Se requiere hallar la desviación media del crecimiento de las plantas.

Para hacer el cálculo es necesario calcular, en primera instancia, la media del


crecimiento de las semillas.
xi 122,8
x   15,35 centímetros
n 8

Con esta media se calculan las desviaciones correspondientes


14,5  15,35  ,15,5  15,35  18,4  15,35  10,2  15,35  10,8  15,35  17,3  15,35  16,7  15,35  19,4  15,35
M .D. 
8

0,85  0,15  3,05  5,15  4,55  1,95  1,35  4,05 21,1


M .D.  M .D.   2,6375 centímetros
8 8

El crecimiento de las plantas de pasto estrella manejadas in vitro muestra una


longitud media de 15,35 centímetros con una desviación media de 2,63
centímetros.

Ejemplo 2:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 69

Se realiza un estudio sobre el peso de una muestra de camuros que han recibido
una dieta de forraje + concentrado comercial. Se toma el peso de 120 camuros.
Los datos obtenidos en kilogramos se registran en la siguiente tabla:

Pesos (Kg) fi xi f i .xi xi  x f i . xi  x


40-42 22 41 902 5,775 127,05
43-45 21 44 924 2,775 58,275
46-48 36 47 1692 0,225 8,1
49-51 26 50 1300 3,225 83,85
52-54 15 53 795 6,225 93,375
n=12 5613 370,65
0

f i .xi 5613
  46,775 kilogramos
Calculando la media resulta n 120
370,65
M .D.   3,08 kilogramos
120

El peso medio de los camuros alimentados con forraje + concentrado comercial


es 46,78 kilogramos. Los pesos tienen una desviación media de 3,08 kilogramos.

5.4 Varianza

La varianza de un conjunto de datos se simboliza S2 cuando se calcula para una


muestra y se simboliza σ2 cuando se calcula para una población.

La varianza de un conjunto de datos se define como la media de los cuadrados de


las desviaciones del conjunto de datos, con relación a la media.

En consecuencia, la varianza viene dada por las siguientes relaciones


70 CARLOS HERNAN SARAZA NARANJO

( xi  x )2
S2 
n Cuando los datos se presentan sin frecuencias
f i .( xi  x )2
S2 
n Cuando los datos se presentan con frecuencias

Cuando el tamaño de la muestra es menor que 30 datos se recomienda calcular la


varianza corregida. La corrección se consigue utilizando en el denominador de las
fórmulas el valor n-1.

Entonces las fórmulas para el cálculo de la varianza corregida son las siguientes:

2 ( xi  x ) 2
S n1 
n 1 Cuando los datos se presentan sin frecuencias
2 f i .( xi  x ) 2
S n1 
n 1 Cuando los datos se presentan con frecuencias

La varianza se expresa en unidades


cuadradas

Ejemplo 1:

El registro de la presión arterial invasiva sistólica en una muestra de 10 cerdos,


expresada en mmHg, se muestra en la siguiente tabla:

6 7 7 7 9 8 8 8 6 6
9 2 3 5 0 4 7 1 5 6

Para calcular la varianza se empieza por hallar la media de la presión arterial


xi 762
x   76,2 mmHg
n 10
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 71

Luego se hallan las desviaciones y estas se elevan al


cuadrado
xi xi  x ( xi  x ) 2
65 -11,2 125,44
66 -10,2 104,04
69 -7,2 51,84
72 -4,2 17,64
73 -3,2 10,24
75 -1,2 1,44
81 4,8 23,04
84 7,8 60,84
87 10,8 116,64
90 13,8 190,44
701,6

701,6
S2   77,9555 mmHg 2
9

La presión arterial invasiva sistólica de los cerdos tiene una varianza de 77,9555
mmHg2.

Nótese que se calculó la


varianza corregida porque n<30
72 CARLOS HERNAN SARAZA NARANJO

Ejemplo 2
La clínica Veterinaria “Caninos y Felinos” lleva registro de la longitud de los gatos
adultos que recibe para consulta. En la siguiente tabla se resume una muestra de
tales longitudes expresadas en metros.
Longitud fi xi f i .x i xi  x ( xi  x ) 2 f i .( xi  x ) 2
(m)
0,64-0,70 4 0,67 2,68 -0,26 0,0676 0,2704
0,71-0,77 3 0,74 2,22 -0,19 0,0361 0,1083
0,78-0,84 7 0,81 5,67 -0,12 0,0144 0,1008
0,85-0,91 15 0,88 13,2 -0,05 0,0025 0,0375
0,92-0,98 26 0,95 24,7 0,02 0,0004 0,0104
0,99-1,05 32 1,02 32,64 0,09 0,0081 0,2592
n=87 81,11 0,7866

f i .xi 81,11
x   0,93 metros
n 87

0,7866
S2   0,009 metros 2
87

La longitud media de los gatos machos es 0,93 metros. Las longitudes tienen una
varianza de 0,009 metros2.

5.4.1 Propiedades de la varianza

1. La varianza de una constante es igual a cero

Ejemplo: Sean x1 =3 x2=3 x3=3 x4=3 x5=3 x6=3

De acuerdo con las propiedades de la media, la media de una constante es igual a


la constante, en consecuencia, x  3

Si se calculan las desviaciones de cada uno de los datos con respecto a la media,
estas son iguales a cero, por lo tanto resulta que:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 73

0
S2  0
5

2. La varianza de una variable más una constante es igual a la varianza de la


variable

Ejemplo:

Sean x1 =3 x2=4 x3=6 x4=2 x5=5 x6=1

xi 21
x1    3,5
Calculando la media se obtiene: n 6

Calculando la varianza se obtiene:

2 (3  3,5) 2  (4  3,5) 2  (6  3,5) 2  (2  3,5) 2  (5  3,5) 2  (1  3,5) 2


S1   3,5
5

Sumando una constante K=5 a cada uno de los datos se obtiene la serie

x1 =8 x2=9 x3=11 x4=7 x5=10 x6=6

Calculando la nueva media se obtiene: x  3,5  5 x 2  8,5 (aplicando


propiedades de la media)

Calculando la nueva varianza se obtiene


2 (8  8,5) 2  (9  8,5) 2  (11  8,5) 2  (7  8,5) 2  (10  8,5) 2  (6  8,5) 2
S2   3,5
5

2 2
Por medio del ejemplo se comprueba que S1  S 2  3,5
74 CARLOS HERNAN SARAZA NARANJO

3. La varianza de una variable por una constante es igual al producto del


cuadrado de la constante por la varianza de la variable.

Ejemplo:

Sean x1 =3 x2=4 x3=6 x4=2 x5=5 x6=1

Calculando la varianza se obtiene que S21 = 3,5

Multiplicando cada valor por una constante arbitraria, por ejemplo K=3, se obtiene
la serie

x1 =9 x2=12 x3=18 x4=6 x5=15 x6=3

Hallando la nueva varianza se obtiene S22 = 31,5

S22 = K2. S21 = (3) 2(3,5) = 9(3,5) = 31,5

5.5 Desviación estándar

Para evitar la presentación de los resultados en unidades cuadradas, unidades


que hacen ilógicos los análisis de los mismos, se utiliza una nueva medida que se
denomina desviación estándar o desviación típica. (Es necesario anotar que la
varianza es muy importante en cálculos estadísticos y en la comparación de
parámetros de diferentes poblaciones).

La desviación estándar se nota S cuando el cálculo se hace para una muestra y se


nota σ cuando el cálculo se hace para una población, la desviación estándar se
define como la raíz cuadrada positiva de la varianza, de esta manera se obtiene:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 75

s  s2 En términos de las fórmulas se tiene que


( xi  x ) 2
s
n Cuando los datos se presentan sin frecuencias
f i .( xi  x ) 2
s
n Cuando los datos se presentan con frecuencias

Para calcular la desviación estándar de una muestra se pueden utilizar las


fórmulas anteriores, sin embargo, cuando el tamaño de la muestra es menor que
30 datos, se recomienda calcular la desviación estándar corregida. La corrección
se consigue utilizando en el denominador de las fórmulas el valor de n-1.

Entonces las fórmulas para el cálculo de la desviación estándar corregida son las
siguientes:

( xi  x ) 2
sn1 
n 1 Cuando los datos se presentan sin frecuencias
f i .( xi  x ) 2
sn1 
n 1 Cuando los datos se presentan con frecuencias

NOTA: debe quedar claro que para obtener la desviación estándar basta con
calcular la raíz cuadrada positiva de la varianza.

Ejemplo 1:

El registro de la presión arterial invasiva sistólica en una muestra de 10 cerdos, expresada en


mmHg, se muestra en la siguiente tabla:

6 7 7 7 9 8 8 8 6 6
9 2 3 5 0 4 7 1 5 6
76 CARLOS HERNAN SARAZA NARANJO
Para calcular la desviación estándar se empieza por hallar la media de la presión arterial
xi 762
x   76,2 mmHg
n 10

Luego se hallan las desviaciones y estas se elevan al cuadrado


xi xi  x ( xi  x ) 2
65 -11,2 125,44
66 -10,2 104,04
69 -7,2 51,84
72 -4,2 17,64
73 -3,2 10,24
75 -1,2 1,44
81 4,8 23,04
84 7,8 60,84
87 10,8 116,64
90 13,8 190,44
701,6

701,6
S2   77,9555 mmHg 2
9

S  77,9555mmHg 2  8,829 mmHg

La presión arterial invasiva sistólica de los cerdos tiene una desviación estándar de 8,829
mmHg.

Ejemplo 2:

La clínica Veterinaria “Caninos y Felinos” lleva registro de la longitud de los gatos adultos que
recibe para consulta. En la siguiente tabla se resume una muestra de tales longitudes
expresadas en metros.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 77

Longitud fi xi f i .x i xi  x ( xi  x ) 2 f i .( xi  x ) 2
(m)
0,64-0,70 4 0,67 2,68 -0,26 0,0676 0,2704
0,71-0,77 3 0,74 2,22 -0,19 0,0361 0,1083
0,78-0,84 7 0,81 5,67 -0,12 0,0144 0,1008
0,85-0,91 15 0,88 13,2 -0,05 0,0025 0,0375
0,92-0,98 26 0,95 24,7 0,02 0,0004 0,0104
0,99-1,05 32 1,02 32,64 0,09 0,0081 0,2592
n=87 81,11 0,7866

f i .xi 81,11
x   0,93 metros
n 87

0,7866
S2   0,009 metros 2
87

S  0,009 metros 2  0,09486 metros

La longitud de los gatos machos tiene una desviación estándar es 0,094 metros.

5.5.1 Interpretación de la desviación estándar

La temperatura rectal media de una muestra de conejos es 38,9 °C con desviación estándar
de 0,12 °C.

Resulta importante saber qué significa este valor de la desviación estándar. Para hacerlo
existen dos posibilidades.

5.5.1.1 Campana de Gauss

Si la distribución de los datos es simétrica, es decir, si las frecuencias absolutas ascienden


hacia el centro y luego descienden guardando la misma proporción, se pueden hacer las
siguientes afirmaciones derivadas de los valores de áreas bajo la curva normal (Campana de
Gauss). (El tema hace parte de los contenidos de un curso de Estadística Inferencial)

 El 68,27% de los datos de la muestra quedan incluidos en el intervalo X  S


78 CARLOS HERNAN SARAZA NARANJO

 El 95,45% de los datos de la muestra quedan incluidos en el intervalo X  2.S


 El 99,73% de los datos de la muestra quedan incluidos en el intervalo X  3.S

Aplicado al ejemplo tenemos


 El 68,27% de los datos de la muestra quedan incluidos en el intervalo 38,9 0,12; es
decir, el 68,27% de los datos de la muestra quedan incluidos en el intervalo (38,78; 39,02)
°C.

Este intervalo muestra que analizado el 68,27% de los conejos, es posible encontrar conejos
con temperatura de 38,78 °C mientras que otros tienen temperatura superior a 38,78 °C
pudiendo llegar hasta 39,02 °C.

 El 95,45% de los datos de la muestra quedan incluidos en el intervalo 38,9 0,24; es


decir, el 95,45% de los datos de la muestra quedan incluidos en el intervalo (38,66;39,14)
°C.

Este intervalo muestra que analizado el 95,45% de los conejos, es posible encontrar conejos
con temperatura de 38,66 °C mientras que otros tienen temperatura superior a 38,66 °C
pudiendo llegar hasta 39,14 °C.

 El 99,73% de los datos de la muestra quedan incluidos en el intervalo 38,9 0,36; es


decir, el 99,73% de los datos de la muestra quedan incluidos en el intervalo (38,54;39,26)
°C

Este intervalo muestra que analizado el 99,73% de los conejos, es posible encontrar conejos
con temperatura de 38,54 °C mientras que otros tienen temperatura superior a 38,54 °C
pudiendo llegar hasta 39,26 °C.

Es importante notar que para analizar el 99,73% de una muestra simétrica es posible restar y
sumar a la media tres veces la desviación estándar de los datos.

Ejemplo:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 79

Los siguientes datos corresponden al peso, en gramos, de una muestra de loritos, que ha
sido registrado en una clínica veterinaria especializada en aves silvestres.
80 CARLOS HERNAN SARAZA NARANJO

fi xi f i .x i xi  x ( xi  x ) 2 f i .( xi  x ) 2
Peso (g)

42,0 - 42,3 54 42,15 2276,1 -1,2 1,44 77,76


42,4 – 42,7 72 42,55 3063,6 -0,8 0,64 46,08
42,8 – 43,1 84 42,95 3607,8 -0,4 0,16 13,44
43,2 – 43,5 96 43,35 4161,6 0 0 0
43,6 - 43,9 84 43,75 3675 0,4 0,16 13,44
44,0 - 44,3 72 44,15 3178,8 0,8 0,64 46,08
44,4 – 44,7 54 44,55 2405,7 1,2 1,44 77,76
n=516 22368,6 274,56

Al calcular la media y la desviación estándar de los pesos se obtiene

f i .xi 22368,6
x   43,35 gramos
n 516

274,56
S2   0,532 g 2
516

S  0,532 g 2  0,729 g

Las loritos tienen un peso medio de 43,35 gramos, con varianza de 0,532 gramos2 y
desviación estándar de 0,729 gramos.

Para la muestra se cumple que:

 El 68,27% de los datos quedan incluidos en el intervalo x  S , es decir, el 68,27% de


los datos quedan en el intervalo 43,350,729  (42,621; 44,079) gramos. En términos
de la muestra afirmamos que el 68,27% de los loritos tienen peso entre 42,621 y
44,079 gramos.
 El 95,45% de los datos quedan incluidos en el intervalo x  2S , es decir, el 95,45% de
los datos quedan en el intervalo 43,351,458  (41,892; 44,808) gramos. En términos
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 81

de la muestra afirmamos que el 95,45% de los loritos tienen peso entre 41,892 y
44,808 gramos

 El 99,73% de los datos quedan incluidos en el intervalo x  3S , es decir, el 99,73% de


los datos quedan en el intervalo 43,352,187  (41,163; 45,537) gramos. En términos
de la muestra afirmamos que el 99,73% de los loritos tienen peso entre 41,163 y
45,537 gramos.

5.5.1.2 Teorema de Tchebysheff

Para aproximar una interpretación de la desviación estándar, cuando la distribución de la


muestra no es simétrica, el matemático ruso Tchebysheff enunció el siguiente teorema:

“Dado un número K mayor que 1 y un


conjunto de n observaciones
 1 
1  2  %
X1,X2,X3,...,Xn, por lo menos  k  de las
observaciones se encuentran en el
intervalo X  K .S ”

El teorema permite escoger cualquier número mayor que 1 y con este número calcular el
porcentaje de la muestra que se va a describir y el intervalo en el que se ubica ese
porcentaje de datos de la muestra:

Ejemplo:

Los siguientes datos corresponden al porcentaje de grasa encontrada en diferentes muestras


de leche entera.

Porcentaje de

fi xi f i .x i xi  x ( xi  x ) 2 f i .( xi  x ) 2
82 CARLOS HERNAN SARAZA NARANJO
grasa

2,70 - 2,82 38 2,76 104,88 -0,30 0,0900 3,4200


2,83 - 2,95 85 2,89 245,65 -0,17 0,0289 2,4565
2,96 - 3,08 70 3,02 211,4 -0,04 0,0016 0,1120
3,09 - 3,21 62 3,15 195,3 0,09 0,0081 0,5022
3,22 - 3,34 21 3,28 68,88 0,22 0,0484 1,0164
3,35 - 3,47 42 3,41 143,22 0,35 0,1225 5,1450
3,48 - 3,60 10 3,54 35,4 0,48 0,2304 2,3040
n=328 1.004,73 14,9561

Al calcular la media y la desviación estándar de los datos se obtiene

f i .xi 1.004,73
x   3,06%
n 328

14,9561
S2   0,0455 % 2
328

S  0,0455 % 2  0,21 %

Los muestras de leche tienen un contenido medio de grasa de 3,06%, con varianza de
0,0455 %2 y desviación estándar de 0,21%.

Aplicando el teorema de Tchebysheff y escogiendo K=3 y K= 3,5 encontramos:

a. Para K=3

 1   1 8
1  2 %  1 -  %   %  88,88%
 3   9 9
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 83
Entonces se puede concluir que por lo menos el 88,88% de las muestras de leche tienen un
contenido de grasa en el intervalo X  3.S , es decir, por lo menos el 88,88% de las muestras
de leche tienen contenido de grasa en el intervalo 3,06  3(0,21)

Realizando la multiplicación y procediendo primero a restar y después a sumar se obtiene el


intervalo (2,43 ; 3,69)%

Por lo menos el 88,88% de las muestras de leche tienen una cantidad de grasa que oscila
entre 2,43% y 3,69 %.

NOTA: Tenga en cuenta que tanto la campana de Gauss como el teorema de Tchebysheff
calculan tan sólo una aproximación al comportamiento de la desviación estándar, por lo tanto
no le debe extrañar si al hacer los cálculos algunos de los resultados quedan por fuera de la
tabla de datos.

b. Para K=3,5

 1   1 
1  2
%  1 -  %  91,83%
 3,5   12,25 

Entonces se puede concluir que por lo menos el 91,83% de las muestras de leche tienen un
contenido de grasa en el intervalo X  3,5S , es decir, por lo menos el 91,83% de las muestras
de leche tienen un contenido de grasa en el intervalo 3,06  3,5(0,21)

Realizando la multiplicación y procediendo primero a restar y después a sumar se obtiene el


intervalo (2,325 ; 3,795)%

Por lo menos el 91,83% de las muestras de leche tienen un contenido de grasa entre 2,32%
y 3,79%.
84 CARLOS HERNAN SARAZA NARANJO
5.6 Coeficiente de variación

Se simboliza C.V., es una medida de dispersión relativa que relaciona la desviación estándar
y la media de una muestra. Tiene la propiedad de ser una medida sin unidades razón por lo
cual resulta muy útil para comparar la dispersión de dos o más muestras aunque estas
manejen diferentes unidades. El coeficiente de variación se expresa en porcentaje.

El coeficiente de variación permite mostrar la homogeneidad de un conjunto de datos. En


tanto el valor del coeficiente sea más cercano a cero, los datos son más homogéneos,
mientras que su alejamiento de cero indica alta heterogeneidad en los datos.

Aunque no existe un valor exacto para indicar cuándo el coeficiente de variación es bueno o
malo, se puede afirmar que valores del coeficiente menores o iguales que 10% indican un
buen grado de homogeneidad en los datos mientras que valores por encima del 10%
corresponden a datos heterogéneos.

5.6.1 Cálculo del coeficiente de variación


S
C.V .  X 100
X

Ejemplo 1: los registros de una clínica muestran los valores de temperatura y ritmo cardíaco
en caballos. Los datos obtenidos, en grados centígrados y número de latidos por minuto,
respectivamente, se resumen en las siguientes tablas. Se requiere determinar cuál de las
dos variables: temperatura o ritmo cardíaco resulta más heterogénea.
Temperatura registrada para una muestra de caballos
Temperatura Xi fi f i .X i (X i  X )2 f i .( X i  X ) 2

°C
36,5-36,7 36,6 24 878,4 0,7056 16,9344
36,8-37,0 36,9 32 1180,8 0,2916 9,3312
37,1-37,3 37,2 55 2046 0,0576 3,168
37,4-37,6 37,5 78 2925 0,0036 0,2808
37,7-37,9 37,8 43 1625,4 0,1296 5,5728
38,0-38,2 38,1 48 1828,8 0,4356 20,9088
n=28
10484,
56,196
0 4
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 85

f i .xi 10484,4
x   37,44 C
n 280

56,196
S  0,44 C
280
0,44
C.V .  X 100  1,17%
37,44

Los caballos registraron una temperatura media de 37,44 °C, con desviación estándar de
0,44 °C, para un coeficiente de variación de 1,17%.
Ritmo cardíaco de una muestra de caballos
Ritmo (latidos Xi fi f i .X i (X i  X )2 f i .( X i  X ) 2

por minuto)
30-31 30,5 14 427 42,5104 595,1456
32-33 32,5 22 715 20,4304 449,4688
34-35 34,5 40 1380 6,3504 254,016
36-37 36,5 78 2847 0,2704 21,0912
38-39 38,5 53 2040,5 2,1904 116,0912
40-41 40,5 73 2956,5 12,1104 884,0592
n=28
10366 2319,872
0

f i .xi 10366
x   37,02 latidos por minuto
n 280

2319,872
S  2,87 latidos por minuto
280
2,87
C.V .  X 100  7,75%
37,02

El ritmo cardiaco de los caballos tiene un valor medio de 37,02 latidos por minuto con
desviación estándar de 2,87 latidos por minuto, para un coeficiente de variación de 7,75%.
86 CARLOS HERNAN SARAZA NARANJO
Con los datos obtenidos de las dos tablas se puede concluir que la temperatura de los
caballos tiene menor dispersión que el ritmo cardíaco de estos. Es decir, el ritmo cardíaco
resulta ser más heterogéneo que la temperatura.

Ejemplo 2

Un informe estadístico indica que la altura media de un lote de caballos es 1,62 metros con
desviación estándar de 23,5 centímetros, en tanto que la longitud media es 2,05 metros con
desviación estándar de 27,2 centímetros. Se busca determinar cuál de las dos medidas
resulta más homogénea.

ALTURA DE LOS CABALLOS

X  1,62 metros S  23,5 centímetros  0,235 metros

0,235
C.V .  X 100  14,5%
1,62

LONGITUD DE LOS CABALLOS

X  2,05 metros S  27,2 centímetros  0,272 metros

0,272
C.V .  X 100  13,26%
2,05

Resulta más homogénea la longitud de los caballos

5.7 Análisis de dispersión (medidas de forma)

La dispersión de una muestra se puede analizar teniendo en cuenta dos criterios diferentes:
i) la distribución de los datos alrededor de la media; ii) la forma como los datos se alzan en
un gráfico de frecuencias formando picos más o menos pronunciados. Para el primer caso se
utiliza el denominado coeficiente de sesgo, mientras que para el segundo caso se calcula el
coeficiente de curtosis.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 87
Tanto el coeficiente de sesgo como el de curtosis son adimensionales, es decir, no tienen
unidades y se calculan utilizando el concepto de momentos con respecto a la media, los que
se definen a continuación:

5.7.1 Momentos con respecto a la media

Si una variable x que toma valores xi tiene una media X , se define el momento de orden r
con respecto a la media, por medio de la siguiente relación:

m 
 fi * ( xi  x ) r
r n

m1 
f i * ( xi  x )
Entonces se tiene que n de acuerdo con las propiedades de la
media se tiene que el momento de orden 1 es igual a cero; m1  0 .

m2 
f i * ( xi  x ) 2
n De acuerdo con las fórmulas ya estudiadas en este libro se tiene que el
momento de orden 2 es la varianza m2  S 2 .

m3 
f i * ( xi  x ) 3
n Momento de orden tres.

Así sucesivamente se puede calcular cualquier momento con respecto a la media de la


muestra.

Los momentos 3 y 4 son útiles para analizar el comportamiento de una muestra; el momento
3 permite determinar el sesgo de una muestra mientras que el momento 4 permite determinar
la curtosis.

5.7.2 Sesgo
88 CARLOS HERNAN SARAZA NARANJO

El sesgo es una medida de forma que analiza la simetría o asimetría de una muestra con
relación a un punto central. Si la muestra es simétrica se dice que los datos son normales y
por lo tanto se comportan de igual manera a derecha e izquierda del punto de simetría (ver
figura No. 8); si la muestra tiene una cola más alargada que la otra se trata de una muestra
sesgada a la izquierda (figura No. 9) o sesgada a la derecha (figura No. 10)

Curva normal Sesgo a la izquierda Sesgo a la derecha


Figura No. 8 Figura No. 9 Figura No. 10

En presencia del gráfico resulta fácil determinar si una muestra tiene sesgo o si es simétrica,
pero no es posible determinar de qué magnitud es el sesgo que presenta, para conocer este
elemento se debe calcular el denominado coeficiente de sesgo

5.7.2.1 Coeficiente de sesgo

Es un valor que permite medir el sesgo de una muestra, se simboliza a3 y está definido así:
m3
a3 
s 3 Donde m3 es el tercer momento con relación a la media; s3 es la desviación estándar
elevada al cubo.

El coeficiente de sesgo puede ser negativo, positivo o cero, el valor del coeficiente se
interpreta de la siguiente manera:

Si a3<0 entonces la muestra se encuentra sesgada a la izquierda


Si a3=0 entonces la muestra es simétrica
Si a3>0 entonces la muestra se encuentra sesgada a la derecha
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 89
Ejemplo: el registro de la cantidad diaria de muestras de sangre tomadas en el laboratorio
“tus mascotas” durante 120 días, se presenta en la siguiente tabla:
90 CARLOS HERNAN SARAZA NARANJO
Laboratorio “Tus Mascotas”
Muestra del número diario de muestras de sangre

No. fi fi .xi xi  x xi  x 2 fi. xi  x  xi  x 3 fi. xi  x 


2 3
Muestra
s
180 12 2160 -68,42 4681,2964 56175,5568 -320294,3 -3843531,6
190 15 2850 -58,42 3412,8964 51193,446 -199381,408 -2990721,12
210 18 3780 -38,42 1476,0964 26569,7352 -56711,6237 -1020809,23
230 20 4600 -18,42 339,2964 6785,928 -6249,83969 -124996,794
280 28 7840 31,58 997,2964 27924,2992 31494,6203 881849,369
300 15 4500 51,58 2660,4964 39907,446 137228,404 2058426,06
340 12 4080 91,58 8386,8964 100642,757 768071,972 9216863,67
n=120 29810 309199,168 4177080,37

29810
x  248,42 muestras de sangre
120
309199,168
s2   2576,66 muestras de sangre2
120

s  2576,66  50,76 muestras de sangre


El coeficiente indica que la muestra
tiene sesgo a la derecha, como el valor m  4177080,37 34809,00308 34809,00308
 03,26 es
a3 34809,00308 muestras de sangre
3 3
cercano a cero, se concluye que la 120 50,76 130787,079
muestra es poco sesgada.

5.7.3 Curtosis

La curtosis es una medida de forma que analiza la manera como los datos se elevan con
respecto a un punto medio de la muestra. Es decir, determina el grado de concentración que
presentan los valores en la región central de la distribución. De acuerdo con la curtosis que
presente una muestra se puede decir que esta es leptocúrtica si existe una gran
concentración de valores; mesocúrtica si hay una concentración normal o Platicúrtica si hay
una baja concentración. (Figura No. 11)

Figura No. 11
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 91
En presencia del gráfico resulta fácil determinar si una muestra es leptocúrtica, mesocúrtica
o platicúrtica, pero no es posible determinar de qué magnitud es la curtosis, para conocer
este elemento se debe calcular el denominado coeficiente de curtosis

5.7.3.1 Coeficiente de curtosis

Es un valor que permite medir la curtosis de una muestra, se simboliza a4 y está definido así:
m4
a4 
s4 Donde m4 es el cuarto momento con relación a la media; s4 es la desviación
estándar elevada a la cuarta potencia.

De acuerdo con esta fórmula de cálculo, el coeficiente de curtosis no puede ser negativo
(potencias pares siempre son positivas o cero), el valor del coeficiente se interpreta de la
siguiente manera:

Si a4<3 entonces la muestra es platicúrtica


Si a4=3 entonces la muestra es mesocúrtica
Si a4>3 entonces la muestra es leptocúrtica

Ejemplo: el registro de la cantidad diaria de muestras de sangre tomadas en el laboratorio


“tus mascotas” durante 120 días, se presenta en la siguiente tabla:

Laboratorio “Tus Mascotas”


Muestra del número diario de muestras de sangre

No. fi fi .xi xi  x xi  x 2 fi. xi  x  xi  x 4 fi. xi  x 4


2
Muestra
s
180 12 21914535,98
2160 -68,42 4681,2964 56175,5568 262974431,80
0
190 15 11647861,84
2850 -58,42 3412,8964 51193,446 174717927,60
0
210 18 3780 -38,42 1476,0964 26569,7352 2178860,582 39219490,48
230 20 4600 -18,42 339,2964 6785,928 115122,047 2302440,94
280 28 7840 31,58 997,2964 27924,2992 994600,109 27848803,05
300 15 4500 51,58 2660,4964 39907,446 7078241,094 106173616,40
340 12 70340031,22
4080 91,58 8386,8964 100642,757 844080374,70
0
n=120 29810 309199,168 1457317085

29810
x  248,42 muestras de sangre
120
309199,168
s2   2576,66 muestras de sangre2
120
92 CARLOS HERNAN SARAZA NARANJO

s  2576,66  50,76 muestras de sangre


El coeficiente indica que la muestra
tiene curtosis menor que 3 y por lo m  1457317085 12144309,04 12144309,04
a3  12144309 ,04muestras de sangre 4
 1,82
4 4
tanto se trata de una muestra 120 50,76 6638752,129
platicúrtica.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 93
UNIDAD VI
TÉCNICAS DE CONTEO

INTRODUCCIÓN

En muchos trabajos de investigación resulta importante y necesario determinar el número de


resultados que puede tener un suceso o un conjunto de sucesos. Por ejemplo, determinar de
cuántas maneras pueden rotarse 4 ingredientes en 4 recetas diferentes; determinar de
cuántas formas se puede presentar el resultado de una premiación; determinar de cuántas
formas pueden atenderse los animales que llegan a una clínica.

Las técnicas de conteo permiten hacer este tipo de cálculos estableciendo diferencias
significativas relacionadas con las condiciones que conducen a encontrar el resultado
buscado.

6.1 Regla de la potencia

Sea S un suceso que tiene un número constante de resultados (K) y sea n el número de
veces que se repite el suceso.

El número total de resultados posibles en las n veces que se repite el suceso está dado por:

número de resultados  K n
Ejemplo: en una preparación de 6 animales para una cirugía cuántos resultados se pueden
presentar referidos a que los animales tengan normal la temperatura.

Como cada animal puede mostrar o no temperatura normal, entonces el suceso de


temperatura normal tiene 2 resultados, K=2. Se van a evaluar 6 animales, por lo tanto n=6

número de resultados  26  64 resultados


Ejemplo: En una prueba de habilidad para el uso de implementos de laboratorio los
participantes pueden ser evaluados en las categorías A, B, C o D según la calidad y rapidez
de su trabajo. Si en la prueba participan 5 personas, cuántos resultados posibles hay para
la habilidad en de uso de implementos de laboratorio.

K= 4 (Siempre hay 4 categorías de evaluación)


n= 5 personas

número de resultados  45  1024 resultados


6.2 Regla de la multiplicación
94 CARLOS HERNAN SARAZA NARANJO
Sea S1 un suceso que tiene n1 resultados; S2 un suceso que tiene n2 resultados; S3 un suceso
que tiene n3 resultados…..; Sk un suceso que tiene nk resultados.

El número total de resultados posibles de que ocurra S1; y que ocurra S2; y que ocurra S3;
……y que ocurra Sk está dado por:

número de resultados  n1 * n2 * n3 * ....nk

Ejemplo: Una dieta para un animal que ha sido tratado de cierta enfermedad sugiere el uso
de un tipo de cereal, un tipo de harina, un tipo de carne, un tipo de azúcar y un tipo de
líquido. Para atender la dieta del animal, un productor dispone de 3 tipos de cereal, 5 tipos
de harina, 3 tipos de carne, 4 tipos de azúcar y 2 tipos de líquido. ¿De cuántas formas se
puede variar la dieta?

Organizando los datos se encuentra que

S1: tipos de cereal n1= 3


S2: tipos de harina n2= 5
S3: tipos de carne n3= 3
S4: tipos de azúcar n4= 4
S5: tipos de líquido n5= 2

número de formas  3 * 5 * 3 * 4 * 2 número de formas  360 formas de variar la dieta

La persona puede variar la dieta de 360 formas diferentes.

Ejemplo: un lote de insumos disponibles en un laboratorio debe ser codificado de tal manera
que cada caja tenga un código que la distinga de las demás. Cada código está conformado
por una letra elegida entre la P (Polvo) y L (Líquido); y dos números elegidos entre el 0 y el 9.
Teniendo en cuenta que el primer número no puede ser cero y que los números se pueden
repetir, ¿Cuántos códigos diferentes se pueden diseñar?.

S1: letra del código n1= 2


S2: primer número del código n2= 9
S3: segundo número del código n3= 10

Número de resultados  2 * 9 * 10 Número de resultados  180 códigos

Se pueden diseñar 180 códigos

6.3 Número factorial

El número n! se denomina número factorial, se define como el factorial de n y representa las


diferentes formas en que un grupo de n elementos se puede organizar en n espacios
disponibles. Por ejemplo, determinar de cuántas maneras pueden ubicarse 4 gatos en 4
cubículos disponibles en una clínica. Nótese que el número de gatos es igual al número de
cubículos, entonces, las diferentes formas para rotar los gatos están dadas por 4!.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 95

Definición: número factorial= n! = n(n-1)(n-2)(n-3)….(1)

Ejemplos:

5!= 5*4*3*2*1= 120


9!= 9*8*7*6*5*4*3*2*1= 362.880

Por definición se tiene que 0!=1

Volviendo al ejemplo de la rotación de gatos

Número de rotaciones= 4! = 24

Ejemplo: De cuántas formas pueden asignarse 15 establos a 15 novillos.

n=15

Número de formas= 15! = 1,30767*1012 formas de asignar los establos.

6.4 Permutación

El concepto de número factorial se aplica para grupos de n elementos tomados todos a la


vez. Sin embargo, en muchos sucesos se requiere tomar solamente una parte de los
elementos.

Una permutación de n elementos organizados en grupos de x elementos (donde x  n ) es


una selección de x de los n elementos teniendo en cuenta la ubicación de cada elemento
en la selección. Es decir, la permutación 3,4,5 es diferente de la permutación 5,3,4.

El número de permutaciones de n elementos organizados en grupos de x elementos está


dado por:

n!
nPx 
( n  x )!

Ejemplo: Cuántas permutaciones de 2 elementos cada una pueden obtenerse con los
números 1,2,3,4

n=4 x=2

4! 24
4 P2    12 permutaciones
( 4  2)! 2

Las permutaciones que se obtienen son:


96 CARLOS HERNAN SARAZA NARANJO

1,2 1,3 1,4


2,1 2,3 2,4
3,1 3,2 3,4
4,1 4,2 4,3

Ejemplo: De cuántas maneras se pueden seleccionar el gerente, el administrador y el


contador de una clínica si la elección se hace sobre 12 hojas de vida disponibles de personas
capacitadas para cualquiera de los tres cargos.

Para entender el concepto de permutación es necesario analizar si el orden es importante.


Para una persona es relevante ser elegida pero también es importante el cargo para el cual
se le elige. Supongamos que al final la elección es Pedro, Alberto, Gonzalo; una elección
diferente sería Alberto, Gonzalo, Pedro.

La diferencia radica en que en la primera elección Pedro es el Gerente mientras que en la


segunda es el contador; en la primera Alberto es el administrador pero en la segunda es el
gerente.

Para desarrollar el ejercicio se procede así:

n=12 x=3

12! 12!
12 P3    1320
(12  3)! 9!

Las tres personas pueden ser seleccionadas de 1320 maneras diferentes.

6.5 Combinación

Una combinación de n elementos organizados en grupos de x elementos (donde x  n ) es


una selección de x de los n elementos sin tener en cuenta la ubicación de cada elemento
en la selección. Es decir, la combinación 3,4,5 es igual a la combinación 5,3,4.

El número de combinaciones de n elementos organizados en grupos de x elementos está


dado por:
n!
nCx 
( n  x )!* x!

Ejemplo: Cuántas combinaciones de 2 elementos cada una pueden obtenerse con los
números 1,2,3,4

n=4 x=2
4! 24
4 C2    6 combinaciones
( 4  2)!* 2! 2 * 2
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 97
Las combinaciones que se obtienen son:

1,2 1,3 1,4


2,3 2,4 3,4

Ejemplo: de cuántas maneras se pueden seleccionar tres personas de una clínica para que
reciban un curso de actualización teniendo en cuenta que en la clínica hay 8 hojas de vida
disponibles de personas capacitadas para asistir al curso.

Para entender el concepto de combinación es necesario analizar si el orden es importante.


Para una persona es relevante ser elegida para asistir a la capacitación pero no es
importante si se le elige de primera, de segunda o de tercera.

n=8 x=3

8! 40320
8 C3    56
(8  3)!*3! 120 * 6

Las tres personas pueden ser seleccionadas de 56 maneras diferentes.


98 CARLOS HERNAN SARAZA NARANJO
UNIDAD VII
TEORÍA DE LA PROBABILIDAD
INTRODUCCIÓN

Muchas situaciones de la cotidianidad están relacionadas con el uso desprevenido del


concepto de probabilidad. En efecto, a diario se escucha decir, es probable que hoy llueva,
es posible que apruebe el examen, voy a comprar la lotería porque es posible que me la
gane, posiblemente me darán el puesto.

Se trata, entonces, de un concepto utilizado pero que requiere cuantificación para que pueda
contribuir a solucionar diferentes situaciones del quehacer profesional. De esta manera será
posible establecer resultados tales como cuál es la probabilidad de que una dieta sea
favorable para un animal; qué probabilidad de éxito o de fracaso tiene una producción; que
probabilidad tiene el nacimiento de un macho o de una hembra; cuál es la probabilidad de
que un negocio reporte utilidades, entre otros.

7.1 DEFINICIÓN DE PROBABILIDAD

Suponga que A es un suceso que se puede presentar en x veces de un total de n veces


posibles, entonces la probabilidad de que ocurra el suceso A está dada por:

Número de casos favorables x


P ( A)  
Número total de casos n

La probabilidad de que el suceso A no ocurra está dada por:

Número de casos desfavorables nx


P( A )  q(A)  
Número total de casos n

De las dos definiciones anteriores se deduce que p(A)+q(A) = 1

Ejemplos:

1. En el sexo de un animal se pueden presentar dos opciones: macho o hembra. De tal


manera que la probabilidad de que un animal elegido al azar sea macho está dada por:

x= casos favorables para macho= 1


n= número total de casos= 2

x 1
p ( m)    0,5
n 2

2. Una jaula contiene conejos distribuidos así: 8 conejos blancos, 7 conejos negros y 5
conejos grises. Si se extrae un conejo al azar entonces la probabilidad de obtener un
conejo negro está dada por:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 99

x= casos favorables para conejo negro = 7


n= número total de casos= 20

x 7
p ( n)    0,35
n 20

La probabilidad de NO obtener un conejo negro está dada por

n  x 13
p(n )    0,65
n 20

Este último resultado también se puede escribir de la forma

n  x 13
q ( n)    0,65 Observe, de los dos resultados
n 20
anteriores, que p(n)+q(n)=1

7.2 Clasificación de sucesos según su probabilidad

Propiedad

Para cualquier suceso A se cumple que 0  p(A)  1

La probabilidad siempre es un valor entre cero y uno

Teniendo en cuenta la propiedad se puede hacer una clasificación de los sucesos de


acuerdo con el valor que tiene su probabilidad de ocurrencia

VALOR DE PROBABILIDAD NOMBRE DEL SUCESO


p ( A)  0 Imposible
0  p( A)  0,5 Inverosímil
p ( A)  0,5 Dudoso
0,5  p( A)  1 Verosímil
p ( A)  1 Cierto

Ejemplo:

En una empresa laboran 12 hombres jóvenes, 4 hombres adultos y 2 mujeres jóvenes. Se


escoge un empleado al azar, calcule y clasifique las siguientes probabilidades:

a. Escoger una mujer


b. Escoger un hombre joven o una mujer
c. Escoger un hombre adulto
100 CARLOS HERNAN SARAZA NARANJO
d. Escoger un hombre o una mujer
e. Escoger un hombre joven y una mujer

12 hombres jóvenes (h)


18 empleados 4 hombres adultos (H)
2 mujeres (m)

2
p ( m)   0,1111  11,11%
a. 18 Suceso inverosímil
14
p (h  m)   0,7777  77,77%
b. 18 Suceso verosímil
4
p ( H )   0,2222  22,22%
c. 18 Suceso inverosímil
18
p (h  H  m)   1  100%
d. 18 Suceso cierto
0
p ( h  m)   0  0%
e. 180 Suceso imposible

Nota:  es un símbolo que significa o  es un símbolo que significa y

7.3 Sucesos simples y sucesos compuestos

Un suceso es simple cuando busca la aparición de un solo resultado

Ejemplos: elegir un conejo; elegir una hembra; elegir un animal sano

Un suceso es compuesto cuando busca la aparición de dos o más resultados

Ejemplos: elegir una hembra y un animal negro; obtener un macho en el primer intento y
obtener una hembra en el segundo intento; elegir tres conejos: el primero blanco, el segundo
blanco y el tercero gris

7.4 Probabilidad para sucesos compuestos (operaciones con probabilidades)

Antes de definir las operaciones con probabilidades se hace necesario definir dos clases de
muestreo.

7.4.1 Muestreo

Es una técnica que permite obtener muestras representativas de una población. La primera
condición para que una muestra sea representativa es que esta sea obtenida al azar.

7.4.2 Muestreo con remplazamiento y muestreo sin remplazamiento

Una muestra se puede obtener con remplazamiento o sin remplazamiento. En el primer caso
cada elemento de la población que aparece en una muestra es devuelto a la población antes
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 101
de obtener el siguiente elemento; cuando el muestreo se hace sin remplazamiento un
elemento que aparece en una muestra es retirado de la población antes de extraer el
siguiente elemento.

N constante N variable

Un elemento de Un elemento
la población de la
puede aparecer población
más de una vez sólo aparece
en la muestra una vez en la
muestra

Muestreo con Muestreo sin


Remplazamiento Remplazamiento

7.4.3 Intersección de probabilidades

Sean A y B dos sucesos. La probabilidad de que ocurran el suceso A y el suceso B al mismo


tiempo está dada por:

P (A.B) = p(A).p(B/A)

La probabilidad de que ocurran A y B es igual a la probabilidad de que ocurra A multiplicada


por la probabilidad de que ocurra B teniendo en cuenta que ya ocurrió A

Para tres sucesos A, B y C se tiene:

P (A.B.C) = p(A).p(B/A).p(C/A.B)

Ejemplos:

1. Suponga que se tienen 20 conejos en una jaula. 3 de los conejos son blancos, 8 son
grises y los demás son negros. Se escogen dos conejos al azar, sin remplazamiento,
determine la probabilidad de obtener:

a. El primer conejo blanco y el segundo gris


b. Los dos conejos negros
c. El primer conejo negro y el segundo blanco
d. Los dos conejos que no sean negros

3 blancos (b)
20 conejos 8 grises (g) Se extraen 2 sin remplazamiento
9 negros (n)
102 CARLOS HERNAN SARAZA NARANJO
 3  8   24 
p (b.g )         0,0631  6,31%
a.  20  19   380 
 9  8   72 
p (n.n)         0,1894  18,94%
b.  20  19   380 
 9  3   27 
p (n.b)         0,071  7,1%
c.  20  19   380 
 11  10   110 
p (n .n )         0,2894  28,94%
d.  20  19   380 

Obsérvese que dado que el muestreo es sin remplazamiento, cada vez que se analiza el
segundo suceso se deben hacer los cambios ocasionados por la aparición del primer suceso
los que en algunos casos sólo afectan el denominador como en a. y c. mientras en otros
afectan numerador y denominador como en b. y d.

2. Un lote de animales está compuesto por 5 terneros y 3 potros. Se toman tres animales al
azar, sin remplazamiento, determine las siguientes probabilidades:

a. Que los tres sean potros


b. Que los dos primeros sean potros y el tercero sea ternero
c. Que el primero sea ternero, el segundo potro y el tercero ternero
d. Que ninguno de los tres sea potro

5 terneros (t)
8 animales Se extraen 3 animales sin remplazamiento
3 potros (p)

 3  2  1   6 
p( p. p. p)          0,0178  1,78%
a.  8  7  6   336 

 3  2  5   30 
p( p. p.t )          0,0892  8,92%
b.  8  7  6   336 
 5  3  4   60 
p(t. p.t.)          0,1785  17,85%
c.  8  7  6   336 
 5  4  3   60 
p( p. p. p )          0,1785  17,85%
d.  8  7  6   336 

7.4.4 Sucesos Mutuamente excluyentes

Dos o más sucesos son mutuamente excluyentes si la aparición de uno de ellos impide la
aparición de los demás

Ejemplos:

Los sucesos macho y hembra son excluyentes porque un animal macho no puede ser
hembra
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 103

Los sucesos caballo café y caballo macho no son excluyentes porque se puede tener un
caballo macho de color café

Los sucesos perro y gato son excluyentes porque un perro no puede ser gato

Los sucesos perro y animal enfermo no son excluyentes porque se puede tener un perro que
esté enfermo.

Propiedad

Si A y B son sucesos mutuamente excluyentes entonces se cumple que:

P(A.B)=0

7.4.5 Unión de probabilidades:

Sean A y B dos sucesos. La probabilidad de que ocurra el suceso A o que ocurra el suceso
B o que ocurran ambos sucesos está dada por:

P (A+B) = p(A) + p(B) - p(A.B)

La probabilidad de que ocurra A o B o que ocurran ambos es igual a la probabilidad de que


ocurra A más la probabilidad de que ocurra B menos la probabilidad de que ocurran los dos.

NOTA: Si A y B son sucesos mutuamente excluyentes, la probabilidad de A o B está dada


por: P(A+B)=P(A)+P(B)

Ejemplo:

Un lote de animales está compuesto por 8 conejos y 7 aves. 2 de los conejos y 3 de las aves
son hembras. Se toma un animal al azar, determine la probabilidad de obtener:

a. Un conejo o un animal macho


b. Un ave o un animal hembra
c. Un conejo o un ave
d. Un conejo que sea macho
e. Un macho y una hembra

SEXO
HEMBRA (H) MACHO (M) Total
Conejo (C) 2 6 8
ANIMAL
Ave (A) 3 4 7
TOTAL 5 10 15
104 CARLOS HERNAN SARAZA NARANJO
Tenga en cuenta que se toma un animal, al azar.

 8   10   6   12 
p(C  M )              0,8  80%
a.  15   15   15   15 

7  5  3 9
p( A  H )              0,6  60%
b.  15   15   15   15 
 8   7   15 
p(C  A)           1  100%
c.  15   15   15 
 6
p (C.M )     0,4  40%
d.  15 
e. p ( M .H )  0

Ejemplos en los que se combinan la intersección y la unión de probabilidades:

1. En un análisis a una muestra de caballos para detectar la presencia de influenza equina


se realiza una inspección a 50 caballos, 18 de ellos tienen síntomas de influenza equina.
Para tres caballos de la muestra, tomados al azar, sin remplazamiento, determine las
siguientes probabilidades:

a. Que los tres presenten influenza equina


b. Que ninguno de las tres presente influenza equina
c. Que dos presenten influenza equina
d. Que por lo menos uno presente influenza equina
e. Que a lo sumo uno no presente influenza equina

18 con influenza
50 caballos Se revisan 3 caballos sin remplazamiento
32 sin influenza

 18  17  16   4896 
p (i.i.i )          0,0416
a.  50  49  48   117600 

 32  31  30  29760
p (i .i .i )        0,2531
b.  50  49  48  117600

 18  17  32   18  32  17   32  18  17  29376
p (i.i.i  i.i .i  i .i.i )                  0,2498
c.  50  49  48   50  49  48   50  49  48  117600

Nótese que en el cálculo anterior los resultados de los tres casos que componen el suceso
son todos iguales, de acuerdo con esta apreciación se puede realizar un cálculo abreviado
de la probabilidad así:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 105
 18  17  32  9792 29376
p(i.i.i  i.i .i  i .i.i )  3 p(i.i.i )  3 *      3 *   0,2498
 50  49  48  117600 117600

d. p ( x  1i )  p(x  1i  x  2i  x  3i)

p (i.i .i  i .i.i  i .i .i  i.i.i  i.i .i  i .i.i  i.i.i )

De acuerdo con lo anotado en el literal anterior, las tres probabilidades iniciales son iguales
entre sí y las tres siguientes son iguales entre sí, entonces el cálculo se reduce a:

p(i.i .i  i .i.i  i .i .i  i.i.i  i.i .i  i .i.i  i.i.i )  3 p(i.i .i )  3 p(i.i.i )  p(i.i.i )


 18  32  31   18  17  32   18  17  16 
3 p(i.i .i )  3 p(i.i.i )  p(i.i.i )  3.     3.          0,7469
 50  49  48   50  49  48   50  49  48 

Al iniciar el tema de probabilidad quedó expresado que p(A)+q(A)=1 de donde se deduce,


realizando un despeje matemático que p(A)=1-q(A). La aplicación de esta propiedad es muy
útil para calcular probabilidades como la anterior en las que el proceso resulta muy extenso.

La propiedad sugiere que una probabilidad se puede calcular


restando de la unidad los casos que no se incluyen en la
probabilidad buscada

Es decir, para el presente literal tendremos que:

p( x  1i )  p(x  1i  x  2i  x  3i)  1 - p(x  1i)  1  p( x  0i )

Entonces la probabilidad buscada se obtiene calculando la probabilidad de que ninguno de


los caballos tenga influenza y restando este resultado de uno

 32  31  30   29760 
p ( x  1i )  1  p ( x  0i )  1  p (i .i .i )  1       1     0,7469
 50  49  48   117600 

Observe que el resultado obtenido es el mismo obtenido por el método extenso utilizado
inicialmente para resolver el enunciado del literal d

e. p( x  1i )  p(x  0 i  x  1 i )  p(i.i.i  i .i.i  i.i .i  i.i.i )  p(i.i.i)  3 p(i.i.i )

 18  17  16   18  17  32 
p( x  1i )       3     0,2914
 50  49  48   50  49  48 

2. Una empresa agropecuaria tiene contratados 5 expertos en negocios, 8 expertos


producción y 7 expertos control sanitario. Se requiere conformar un comité de 3
empleados, elegidos al azar. determine las probabilidades siguientes:

a. Que los tres empleados sean expertos en el mismo tema


106 CARLOS HERNAN SARAZA NARANJO
b. Que por lo menos dos de ellos sean expertos en negocios
c. Que a lo sumo 1 de ellos sea experto en control sanitario
d. Que por lo menos 1 de ellos sea experto en producción
e. Que no más de dos de ellos sean expertos en negocios

5 negocios (n)
20 empleados 8 producción (p) Se eligen 3 empleados sin remplazamiento
7 control s. (c)

a. Que los tres empleados sean expertos en el mismo tema

 5  4  3   8  7  6   7  6  5 
p(n.n.n  p. p. p.  c.c.c)                 0,0886
 20  19  18   20  19  18   20  19  18 

b. Que por lo menos dos de ellos sean expertos en negocios

 5  4  15   5  4  3 
p( x  2n)  p(n.n.n  n.n .n  n .n.n  n.n.n)  3          0,1404
 20  19  18   20  19  18 

c. Que a lo sumo 1 de ellos sea experto en control sanitario

 13  12  11   7  13  12 
p ( x  1c)  p (c .c .c  c.c .c  c .c.c  c .c .c)       3     0,7298
 20  19  18   20  19  18 

d. Que por lo menos 1 de ellos sea experto en producción

 12  11  10 
p ( x  1 p )  1  p ( x  1 p )  1  p ( x  0 p )  1  p ( p. p. p )  1       0,807
 20  19  18 
e. Que no más de dos de ellos sean expertos en negocios

 5  4  3 
p ( x  2n)  1  p ( x  2n)  1  p ( x  3n)  1  p (n.n.n)  1       0,9912
 20  19  18 
3. Una empresa ganadera realiza una encuesta sobre el consumo de carne res. Consulta a
120 personas entre hombres adultos, mujeres adultas y jóvenes (Hombres y mujeres), los
resultados obtenidos se resumen en la siguiente tabla.

CONSUMO HOMBRE (h) MUJER (m) JÓVENES (j) TOTALES


SI (s) 32 19 41 92
NO (n) 8 11 9 28
TOTALES 40 30 50 120

Suponga que se consultan 3 personas al azar sin remplazamiento, determine las siguientes
probabilidades:

a. Que las tres consuman carne de res


ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 107
 92  91  90 
p ( s.s.s )       0,4471
 120  119  118 

b. Que al menos 1 de ellas consuma carne de res


 28  27  26 
p ( x  1s )  1  p ( x  0 s )  1  (n.n.n)  1       0,9883
 120  119  118 

c. Que a lo sumo 2 sean mujeres

 30  29  28 
p ( x  2m)  1  p ( x  3m)  1  (m.m.m)  1       0,9855
 120  119  118 

d. Que más de 2 no consuman carne de res

 28  27  26 
p ( x  2n)  (n.n.n)       0,0116
 120  119  118 

7.5 Distribución de probabilidades

Si a una variable x se le consideran todos los valores posibles (x1,x2,x3,…,xn) y a cada uno de
los valores se le calcula la probabilidad de ocurrencia, se obtiene para x la distribución de
probabilidades correspondiente

La distribución de probabilidades cumple con la siguiente propiedad:

p ( xi )  1

Ejemplo:

En una muestra de 10 perros, se encuentra la presencia de una virosis en 4 de ellos. Si Se


toman tres perros al azar sin remplazamiento, construya la distribución de probabilidad para
la variable X=número de perros libres de la virosis.

La tabla de distribución de probabilidad pedida es la siguiente:

xi (número de perros libres de la virosis) P(xi)


0 0,03333
1 0,30000
2 0,50000
3 0,16667
Total 1,00000

Los resultados de p(xi) se obtuvieron con los procedimientos ya conocidos que se describen
a continuación:
108 CARLOS HERNAN SARAZA NARANJO
 4  3  2 
p( x  0v )  p(v.v.v)       0,03333
 10  9  8 

 6  4  3 
p( x  1v )  3. p(v .v.v)  3.     0,3
 10  9  8 

 6  5  4 
p( x  2v )  3. p(v .v .v)  3.     0,5
 10  9  8 

 6  5  4 
p( x  3v )  p(v .v .v )       0,16667
 10  9  8 

Nótese en la tabla que la suma de las probabilidades es igual a 1, con lo que se cumple la
propiedad de una distribución de probabilidades. (p ( xi ))  1

7.5.1 Media, desviación estándar y varianza de una distribución de probabilidades

La estadística descriptiva permite calcular medidas de centralización (como la media) y de


dispersión (como la varianza y la desviación estándar) para una distribución de frecuencias,
de igual manera es posible calcular la media, la desviación estándar y la varianza para una
distribución de probabilidades. Los cálculos se realizan atendiendo las siguientes relaciones:

Media =  ( x)  xi. p ( xi )

Varianza=   p ( xi )( xi   )
2 2

Desviación estándar= ( p ( xi )( xi   )
2

Para los datos correspondientes al número de perros libres de virus los cálculos son los
siguientes:

xi (número de perros P(xi) xi.p(xi) ( xi   ) ( xi   ) 2 P(xi) ( xi   ) 2


libres de virus
0 0,03333 0,00000 -1,8 3,24 0,10798
1 0,30000 0,30000 -0,8 0,64 0,19200
2 0,50000 1,00000 0,2 0,04 0,02000
3 0,16666 0,49998 1,2 1,44 0,23999
 0,99999 1,79998 0,55997

De acuerdo con los resultados de la tabla se obtiene:

 ( x)  1,79998
 2 ( x)  0,55997
 ( x)  0,55997  0,74832
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 109
Para los cálculos de la varianza y de la desviación estándar la media se aproximó a 1,8
110 CARLOS HERNAN SARAZA NARANJO
7.5.2 Representación gráfica de la distribución de probabilidades

La distribución de probabilidades se puede representar utilizando un histograma en el cual


los valores de la variable se ubican en el eje x mientras los valores de probabilidad se ubican
en el eje y

PROBABILIDAD DE PERROS LIBRES DE


VIROSIS CON n=10 x=3
0.6
0.5
0.5

0.4
Probabilidad

0.3
0.3

0.2 0.16666

0.1
0.03333
0
0 1 2 3
valor de x

7.6 Distribución Binomial

Distribución de probabilidad para variable discreta. Solo admite dos resultados: éxito o
fracaso. Los sucesos deben ser independientes (muestreo con remplazamiento).

Si P es la probabilidad de que un suceso ocurra, en un solo ensayo (Éxito) y q=1–P es la


probabilidad de que el suceso no ocurra, en un solo ensayo (Fracaso), la probabilidad de que
el suceso ocurra X veces en n ensayos está dada por:

P (x) = nCX Px qn-X

n = número de ensayos
x = número de éxitos buscados
n - x = número de fracasos buscados

Nótese que P está asociado al número de éxitos y q está asociado al número de fracasos.

Ej: Una venta de mascotas presenta un 30% de efectividad. Si se visitan 12 clientes,


encuentre la probabilidad de lograr:

a. 3 clientes que compran


b. Por lo menos 2 clientes que compran
c. Menos de 2 clientes que compran
d. A lo sumo 3 clientes que NO compran
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 111

P(C )  30%  0,3 P(C )  70%  0,7

a. P (X =3C) = 12C3 (0.3)³ (0.7)9 = 0,2397

En el 23,97% de las muestras de 12 clientes se logran 3 ventas.

b. P (x  2C) =P (x=2+x=3+X=4+…+X=12)=1–P(X2)=1–P(X=0+X=1)

P (X=0)= 12C0 (0.3)0 (0.7)12 = 0,0138


P (X=1)= 12C1 (0.3) (0.7)11 = 0,0711.
 0,0849

 P (X  2C) = 1 – 0,0849 = 0,9151

En el 91,51% de las muestras de 12 clientes se logran al menos 2 ventas

c. P (X  2C) = P (X=0C+X=1C)

P (X=0C) = 0,0138
P (X=1C) = 0,0711 Resultados obtenidos en el literal anterior
 0,0849

 P (X  2C) = 0,0849

En el 8,49% de las muestras de 12 clientes Se logran menos de 2 ventas

d . P( X  3C )  P( X  0C  X  1C  X  2C  X  3C )

P (X = 0) = 12C0 (0.7)0 (0.3)12 = 5,3144 x 10-7


P (X = 1) = 12C1 (0.7) (0.3)11 = 1, 488 x 10-5
P (X = 2) = 12C2 (0.7)2 (0.3)10 = 1,9096 x 10-4
P (X = 3) = 12C3 (0.7)3 (0.3)9 = 1, 4852 x 10-3
 = 1,6915 x 10-3
P (X ≤ 3)= 1,6915 x 10-3

En el 0,16% de las muestras de 12 clientes se presentan a lo sumo 3 clientes que no


compran.

Nótese que los valores de P y q se invirtieron porque la pregunta busca clientes que no
compran.

7.6.1 Media, desviación estándar y varianza de una distribución binomial:

Si X es una variable que se comporta siguiendo el modelo binomial, entonces para la


distribución de probabilidad se tienen los siguientes cálculos:
112 CARLOS HERNAN SARAZA NARANJO

 (X) = n.p Media


² (X) = n.p.q Varianza
 (X) = n. p.q Desviación estándar

Ejemplo: En una clínica se ha determinado que 2 de cada 10 perros atendidos presentan


síntomas de fiebre. Si se examinan 4 perros, construya la distribución de probabilidad para la
variable X=número de perros que no tienen fiebre. Encuentre la media, la desviación
estándar y la varianza.
8 2
P( F )   0,8 P( F )   0,2
n=4 10 10
xi (número de perros que no P(xi)
tienen fiebre)
0 0,0016
1 0,0256
2 0,1536
3 0,4096
4 0,4096

Los datos de P(xi) se obtuvieron con el siguiente procedimiento:

P (X = 0) = 4C0 (0,8)0 (0,2)4 = 0,0016


P (X = 1) = 4C1 (0,8) (0,2)3 = 0,0256
P (X = 2) = 4C2 (0,8)2 (0,2)2 = 0,1536
P (X = 3) = 4C3 (0,8)3 (0,2) = 0,4096
P (X = 4) = 4C4 (0,8)4 (0,2)0 = 0,4096

 (X) = n.p = 4 (0,8) = 3,2


 (X) = (n. p.q )  (4)(0,8)(0,2))  0,8
² (X) = 4 (0,8) (0,2) = 0,64

La variable x= número de perros que no tienen fiebre tiene una media de 3,2 lo cual significa
que de un total de 4 perros examinados se pueden esperar 3 perros sin fiebre y uno con
fiebre.

La variable presenta una desviación estándar de 0,8 y una varianza de 0,64

7.7 Distribución de Poisson

Distribución de probabilidad para variable discreta. Se utiliza cuando n es grande,


generalmente mayor que 50 y p es muy pequeño, cercano a CERO.

También se utiliza cuando se trabajan probabilidades en función del tiempo.

Si P es la probabilidad de que un suceso ocurra en un solo ensayo, entonces la probabilidad


de obtener X éxitos en n ensayos está dada por:
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 113

 x .e 
P( X ) 
x!

Donde:  = n.p
e = 2,71828…..

Ejemplo: datos estadísticos indican que 4 de cada de 500 perros examinados presentan
cataratas. En un lote de 600 perros determine la probabilidad de encontrar:

a. 3 perros con cataratas


b. Por lo menos 1 perro con cataratas
c. A lo sumo 2 perros con cataratas

4
P(C )   0,008
500

n=600  = 600(0,008)=4,8

4,83.e 4,8
a. P( X  3C )   0,1517
3!

En el 15,17% de las muestras de 600 perros se encontrarán 3 animales con cataratas.

b. P( X  1C )  P( X  1C  X  2C  X  3C  ...... X  600C )  1  P( X  0C )

4,80 e 4,8
P( X  0C )   0,0082
0!

Entonces P (X  1C) = 1 – 0,0082 = 0,9918

En el 99,18% de las muestras de 600 perros se encontrará al menos 1 animal con


cataratas.

c. P (X  2C) = P (X=0C+X=1C+X=2C)

4,80 e 4,8
P( X  0C )   0,0082
0!
114 CARLOS HERNAN SARAZA NARANJO

4,8e 4,8
P( X  1C )   0,0395
1!

4,82 e 4,8
P( X  2C )   0,0948
2!

Entonces P (X  2C) = 0,0082 + 0,0395 + 0.0948 = 0,1425

En el 14,25% de las muestras de 600 perros se encontrarán a lo sumo 2 animales con


cataratas.

7.7.1 Media, desviación estándar y varianza para una distribución de Poisson:

Si X es una variable que sigue el modelo de Poisson, entonces para la distribución de


probabilidad se tienen los siguientes cálculos:

 (x) = n.p =  Media


 (x) = n.p   Desviación estándar
² (x) = n.p =  Varianza

Nota especial: La distribución de Poisson se puede utilizar en los casos en que se conoce la
media. Para lograr esta aplicación, teniendo en cuenta que (x)=n.p=, es posible remplazar
a  por  y, en consecuencia, la fórmula de la distribución de Poisson se transforma en la
siguiente:

 x .e  
P( x) 
x!

Ejemplo: Ante la aparición de un virus en un cultivo de hongos en laboratorio, se comprueba


que en promedio se pierden 3 hongos por minuto. Encuentre la probabilidad de que:

a. En un minuto se pierdan 5 hongos.


b. En dos minutos se pierdan por lo menos 2 hongos.

35.e 3
a. P( x  5)   0,1008
5!

La probabilidad de que en un minuto se pierdan 5 hongos es 10,08%.

b. P (X  2) = 1 – P (X=0+X=1) Para este caso se va a utilizar  = 6 porque la media es 3


hongos minuto de tal manera que para dos minutos la media será 6 hongos.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 115

6 0.e 6
a. P( x  0)   0,0024
0!
6.e 6
P( x  1)   0,0148
1!

P( x  0  x  1)  0,0024  0,0148  0,0172


P (X  2) = 1 – 0,0172 = 0,9828

La probabilidad de que en dos minutos se pierdan por lo menos dos hongos es 98,28%.

7.8 Variable normalizada

Se dice que una variable ha sido normalizada, tipificada o estandarizada cuando se expresa
en términos de la desviación estándar. La variable normalizada se nota z

xx
Z
s

Ejemplo: Se evalúa el rendimiento de cinco médicos y se obtienen los siguientes puntajes:

X1 = 74 X2 = 81 X3 = 76 X4 = 72 X5 = 79

La variable normalizada requiere el cálculo de la media, X , y la desviación estándar, S,


recordemos las fórmulas correspondientes:

xi
X  ( Xi  X ) 2
n S
n 1 Corregida porque n<30

Realizando los cálculos se obtiene

X  76,4 puntos S = 3,65 puntos

La variable normalizada se calcula para cada valor de la variable x así:

74  76,4 81  76,4
Z1   0,66 Z2   1,26
3,65 3,65

76  76,4
Z4 
72  76,4
 1,21
79  76,4
Z3   0,11 Z5   0,71
3,65 3,65 3,65

Nótese que hay valores de Z positivos y negativos. Cuando el valor que se quiere normalizar
es igual a la media, entonces Z=0.
116 CARLOS HERNAN SARAZA NARANJO
Cuando Z es positiva el valor que se está normalizando es mayor que la media mientras que
una Z negativa aparece cuando se normalizan valores menores que la media.

7.9 Distribución normal

Es una distribución de probabilidad para variable continua. Utiliza la variable normalizada


para el cálculo de probabilidades. La distribución tiene forma de campana (Campana de
Gauss), el área debajo de la campana y sobre el eje X es igual a 1. La campana es simétrica
con relación al eje Y de tal manera que el área a la izquierda y a la derecha del eje Y vale
0.5. La distribución normal define la probabilidad de X utilizando una fórmula en la que
intervienen la desviación estándar de la muestra y los valores de la variable normalizada z.
La fórmula correspondiente es la siguiente:

1
1  2 z2
P( x)  e
 2
Un gráfico aproximado de la curva normal es el siguiente:

0.3
A = 0,5 A = 0,5
0.2

0.11

Z
-3 -2 -1 1 2 3
68,27%

95,45%

99,73%

El gráfico de la campana muestra que de acuerdo con la distribución normal el 68,27% de los
datos de una muestra se ubican en el intervalo   S; el 95,45% de los datos se ubican en el
intervalo  2S y el 99.73% de los datos se ubican en el intervalo   3 S.

Ejemplo: Una producción de huevos presentó un peso medio de 45,3 gramos con desviación
estándar de 1,01 gramos. De la curva normal obtenemos:

El 68,27% de los huevos presentan peso en el intervalo   S.

 45,3  1,01 = (44,29; 46,31) gramos.


ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 117
El 95,45% de los huevos presentan peso en el intervalo   2 S.

 45,3  2 (1,01) = 45,3 2,02 = (43,28; 47,32) gramos.

El 99,73% de los huevos presentan peso en el intervalo   3 S.

 45,3  3 (1,01) = 45,3  3,03 = (42,27; 48,33) gramos.

En este ejemplo se ha trabajado con tres porcentajes fijos utilizando constantes enteras (1,2
y 3). En las aplicaciones de la distribución normal se podrá mostrar cómo es posible obtener
información para diferentes valores de porcentaje en los que las constantes no son enteras.

7.9.1 Cálculo de probabilidades utilizando la distribución normal

Dada la complejidad de la fórmula de la distribución normal se han diseñado tablas que


permiten hallar probabilidades (ver tabla de áreas bajo la curva normal, al final del libro)

7.9.2 Uso de la tabla de áreas bajo la curva normal:


Todas las lecturas en la tabla corresponden a un área entre 0 y Z. Como la curva es
simétrica, las lecturas hacia los valores positivos de Z son iguales que las lecturas hacia los
valores negativos de Z, por esta razón la tabla no tiene información sobre valores negativos.

Tenga en cuenta que existen diferentes tipos de tablas para el cálculo de probabilidades bajo
la curva normal, algunas informan el valor acumulado de la probabilidad mientras otras
(como la que se incluye en los anexos), solo incluye valores a partir de CERO, es decir, a
partir de la media de la muestra.

En los siguientes ejemplos se describe la manera de utilizar la tabla de áreas bajo la curva
normal. Se pide hallar el área bajo la curva normal en cada caso:

a. Área entre Z = 0 y Z = 1,32 b. Área entre –0,92 y 1,36

A = 0,4066 A = 0,3212 + 0,4131


A = 0,7343

c. Área entre Z = -0,94 y Z = 0 d. Área entre Z = 1,44 y Z = 1,92

A = 0,3264 A = 0,4726 - 0,4251


A = 0,0475

e. Área para Z  -0,43 o Z  -1,99


118 CARLOS HERNAN SARAZA NARANJO

A = (0,5+0,1664) + (0,5 – 0,4767) h. Área para Z  2,37


A = 0,6664 + 0,0233
A = 0,6897

f. Área para Z  1,05 A = 0,5 + 0,4911


A = 0,9911

A = 0,5 - 0, 3531
A = 0,1469

g. Área para Z  0,21 o Z  -0,74

A = (0,5-0,2704) + (0,5–0,0832)
A = 0,2296 + 0,4168
A = 0,6464

7.9.3 Aplicaciones de la distribución normal:

1. Un lote de cerdos presenta un peso medio de 3,42 @ con desviación estándar de 0,16 @.
Encuentre la probabilidad de que un cerdo pese:

a. Más de 3,5 @ P (X  3,5)

3,5  3,42
z  0,5
0,16

P (X  3,5) = 0,5 – 0,1915

P (X  350) = 0,3085

El 30,85% de los cerdos pesan más de 3,5 @.

b. Menos de 3,75 @ P (X  3,75)

3,75  3,42
z  2,06
0,16
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 119

P (X  3,75) = 0,5 + 0,4803


P (X  3,75) = 0,9803

El 98,03% de los cerdos pesan menos de 3,75 @.

c. Más de 3,8 @ o menos de 3 @

P (X  3) + P (X  3,8)

3  3,42
z3   2,62
0,16
21

3,8  3,42
z 3,8   2,37
0,16
21

P (X  3) + P (X  3,80) = (0,5 – 0,4987) + (0,5 – 0,4911)


= 0,0013 + 0,0089
= 0,0102

El 1,02% de los cerdos pesan más de 3,8 @ o menos de 3 @.

2. Una muestra de 1250 peces presenta una longitud media de 8,7 centímetros con
desviación estándar de 0,45 centímetros. Determine:

a) Probabilidad de que un pez mida por lo menos 9 centímetros

P (X  9)

9  8,7
z  0,66
0,45

P (X  9) = 0,5 – 0,2454

P (X  9) = 0,2546

El 25,46% de los peces miden por lo menos 9 centímetros.

b) Cuántos peces miden más de 8 centímetros o menos de 7,8 centímetros

P (X  8) + P (X  7,8)

8  8,7
z8   1,55
0,45
120 CARLOS HERNAN SARAZA NARANJO

7,8  8,7
z  2
0,45

P (X  8) + P (X  7,8) = (0,5 + 0,4394) + (0,5 – 0,4772)


= 0,9622

Probabilidad de que un pez cumpla con la longitud pedida

Para hallar el número de peces se calcula n.p

 n.p = 1.250 (0,9622) = 1202,75  1203

1203 peces miden más de 8 centímetros o menos de 7,8 centímetros.

c) Probabilidad de que la longitud de un pez supere la media por lo menos en 0,5


centímetros:

Como la media es 8,7 centímetros, para que la longitud de un pez la supere en 0,5
centímetros debe medir 9,2 centímetros y para superarla en 0,5 centímetros o más (por lo
menos) debe medir 9,2 centímetros o más.

P (X  9,2)

9,2  8,7
z  1,11
0,45

P (X  9,2 kg) = 0,5 – 0,3665


= 0,1335

La probabilidad de que la longitud de un pez supere a la media por lo menos en 0,5


centímetros es 0,1335.

El 13,35% de las longitudes de los peces superan a la media por lo menos en 0,5
centímetros.

3. Una muestra de lombrices tiene una longitud media de 3,8 centímetros con desviación
estándar 0,39 centímetros. ¿Cuál es la longitud del 38,5% de las lombrices más cortas?.

Para este ejercicio se pide hallar el valor de X (longitud). Despejando X de la fórmula de Z


se obtiene:

XX X  Z .S  X
Z
S 
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 121

El valor de S es conocido S = 0,39 cm; el valor de X es conocido X  3,8cm . Se


requiere hallar el valor de Z para lo cual se utiliza el porcentaje conocido.

Para hallar Z tenemos que 0,5–0,385=0,115. En la tabla de


Z se busca el valor de Z que corresponde a un área de
0,115 (o el valor más cercano).
En la tabla se encuentran áreas de 0,1141 y 0,1179, la más
cercana a 0,115 es 0,1141 que corresponde a un Z de 0,29.
Como Z está a la izquierda de X entonces su valor es
negativo; y por tanto Z = -0,29.
Reemplazando en la fórmula de X se obtiene:

X = -0,29 (0,39) + 3,8


X = -0,1131 + 3,8
X = 3,68 cm

El 38,5% de las lombrices más cortas miden 3,68


centímetros o menos.

4. Una muestra de huevos súper presenta un peso medio de 52 gramos con desviación
estándar 9,2 gramos. Encuentre el peso del 74,5% de los huevos más livianos.

Siguiendo los pasos de ejemplo anterior:

En la tabla se halla 0,745–0,5= 0,245 que


corresponde a un Z de 0,66.

X = 0,66 (9,2) + 52 = 58,07 gramos

El 74,5% de los huevos más livianos pesan 58,07 gramos o menos

5. La temperatura de una muestra de bacterias sometidas a trabajos de laboratorio tiene


distribución normal con media 39,4 °C y desviación estándar 6,1°C. Encuentre la
temperatura del 21,38% de las bacterias que alcanzan mayores temperaturas.

En la tabla se busca 0,5–0,2138=0,2862 que


corresponde a un Z de 0,79.

X = 0,79 (6,1) + 39,4


X = 44,21 °C
122 CARLOS HERNAN SARAZA NARANJO
El 21,38% de las bacterias que alcanzan mayores
temperaturas presentan temperatura de 44,21 °C o
más.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 123
8. Cálculos sistematizados

Algunos de los cálculos estadísticos que se han manejado en el presente libro pueden
hacerse de manera directa utilizando los programas que incluyen las calculadoras científicas
o las hojas de cálculo. También existen programas como Statgraphics, Minitab o SPSS.

El manejo de este tipo de herramientas facilita los cálculos, ahorra tiempo y permite dar
mayor precisión a los resultados, sin embargo, su uso requiere de buen conocimiento y buen
manejo. Recuerde que las calculadoras y los computadores hacen lo que se les ordene y que
de la información que reciban y la forma como la reciban, depende la confiabilidad de los
resultados que puedan entregar.

Además, resulta más importante la interpretación que se da a un resultado que el resultado


mismo.

En esta última parte del libro se explica brevemente el funcionamiento de la calculadora


CASIO FX-82 (los diversos modelos de calculadora tienen diferentes formas de
funcionamiento para los programas estadísticos), y de la hoja de cálculo de Excel.

8.1 Cálculo de medidas estadísticas utilizando calculadora CASIO FX-82


Para iniciar el trabajo con su calculadora colóquela en el modo SD (figura No. 12), en
pantalla aparecerá SD. Verifique si la calculadora tiene datos en la memoria, esta operación
es necesaria porque las calculadoras mantienen la información estadística aun cuando son
apagadas.

Verificar si la calculadora tiene datos, consiste en leer el valor de n el cual debe ser igual a
cero. En caso que esto no sea cierto, siga la secuencia SHIFT, CLR, 1,= (Figura No. 12).

Una vez se asegure que la calculadora no tiene datos en la memoria, proceda a introducir los
datos de la muestra. Si los datos se presentan sin frecuencias introduzca cada dato
escribiéndolo en pantalla para luego presionar la tecla DT (que aparece donde se encuentra
M+); si usted necesita incluir datos con frecuencias entonces escriba el primer dato en
pantalla, escriba el signo ;, escriba el valor de la frecuencia y presione DT.

En cualquiera de los dos casos, cuando termine de introducir los datos verifique el valor de n
el cual debe coincidir con el tamaño de la muestra.

Para leer los resultados utilice la opción SHIFT y las teclas 1 y 2 (marcadas con s- sum),
escriba el número que corresponde a la opción buscada (media, n, desviación estándar o
desviación estándar corregida) y presione el signo =. Para hallar la varianza eleve al
cuadrado los valores de la desviación estándar.
124 CARLOS HERNAN SARAZA NARANJO
Figura No. 12. Calculadora CASIO FX-82

Modo SD

Para borrar
información
SHIFT;
CLR; 1 =

Cálculo de n,
sumatoria de los DT
valores de x y
sumatoria de los
cuadrados de los
valores de x ;

Cálculo de la media, la
desviación estándar y la
desviación estándar
corregida

De igual manera la calculadora le informa valores de n!, de combinaciones y de


permutaciones.

8.2 Calculo de medidas estadísticas utilizando EXCEL


ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 125
Si en un libro de Excel se copian los datos correspondientes a una muestra es posible
obtener, de manera directa, las diferentes medidas que se han explicado a lo largo del libro,
a continuación se explica uno de los procedimientos para obtener los cálculos indicados:

En una celda en la que no hay información se puede escribir la medida que se desee
calcular, en seguida se da la orden de cálculo escribiendo la palabra clave con la que Excel
accede a calcular cada valor requerido, esta orden debe ir precedida del signo igual o del
signo más. En la siguiente tabla se reproducen 5 columnas de una hoja de cálculo en Excel.
La primera columna corresponde al número de la fila; la segunda columna corresponde a los
datos de la muestra; la tercera columna indica el cálculo que se quiere realizar; la cuarta
columna muestra la orden que se da para que Excel entregue los cálculos requeridos. (Note
que para el caso del percentil el número se da en decimal correspondiente al porcentaje del
percentil a calcular, por ejemplo, percentil 23 =0,23; percentil 9=0,09. La quinta columna
contiene los resultados obtenidos en cada uno de los cálculos realizados.

A B C D
No. de fila Datos Medida Procedimiento Resultado
1 12
2 13
3 14
4 15
5 20
6 24
7 25
8 25
9 25
10 29
11 MEDIA =PROMEDIO(A1:A10) 20,1
12 MEDIANA =MEDIANA(A1:A10) 22
13 MODA =MODA(A1:A10) 25
14 PERCENTIL 23 =PERCENTIL(A1:A10;0,23) 14,07
15 DESV. ESTÁNDAR =DESVESTP(A1:A10) 5,73
16 VARIANZA =VARP(A1:A10) 32,89
17 DESV. ESTANDAR =DESVEST(A1:A10) 6,04
CORREGIDA
18 VARIANZA CORRE. =VAR(A1:A10) 36,54

Los valores referidos también se pueden obtener utilizando la opción de fórmulas


estadísticas de la hoja de cálculo, que se encuentra presionando la techa fx la cual da
paso a la opción insertar función. Para el uso de las fórmulas se elige la categoría
estadísticas. Luego se busca la fórmula correspondiente. Por ejemplo, para calcular
126 CARLOS HERNAN SARAZA NARANJO
la media se busca la opción promedio y luego se marca el rango de datos que
componen la muestra. De igual manera se procede con las demás funciones que se
encuentran con los mismos nombres que han sido descritos en la tabla anterior.

GLOSARIO

Aleatoria: Dependiente de algún suceso fortuito. Perteneciente o relativa al azar. Se dice


que un valor es aleatorio cuando se elige libremente, es decir, sin seguir regla alguna.
A lo sumo: menor o igual que, expresión que se utiliza para designar a todos los datos que
son menores o iguales que un valor dado.
Convención: nota que permite aclarar el contenido de un esquema o de un gráfico.
Curtosis: concepto que analiza la manera como los datos se elevan con respecto a un punto
medio de la muestra.
Diagnóstico: que sirve para reconocer las condiciones de una persona o de una acción.
Estadístico: cualquier dato o resultado que se toma de una muestra
Excluyente: que excluye, deja afuera, rechaza
Financiero: relativo a la hacienda pública, a la banca o a los grandes negocios mercantiles.
Inferencia: conclusión que se toma a futuro o sobre un grupo mayor, como resultado de un
estudio.
Insumos: conjunto de bienes empleados en la producción de otros bienes.
Intersección: operación entre dos o más conjuntos que reúne los elementos que son
comunes a todos los conjuntos (Elementos que están en cada uno de los conjuntos)
Normal: tipo de distribución de probabilidades para variable continua, fundamenta los
cálculos en el uso de la variable normalizada z
Notación: representación por medio de signos convencionales.
Parámetro: cualquier dato o resultado que se toma de una población
Por lo menos: mayor o igual que, expresión que se utiliza para designar a todos los datos
que son mayores o iguales que un valor dado.
Remesa: envío que se hace de una cosa de una parte a otra.
Sesgo: concepto que analiza la simetría o asimetría de una muestra con relación a un punto
central.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 127
Unión: operación entre dos o más conjuntos que reúne los elementos de todos los
conjuntos, sin repetir los elementos que son comunes a los conjuntos.
128 CARLOS HERNAN SARAZA NARANJO
BIBLIOGRAFÍA

BERENSON, Mark L. Et all. Estadística básica en Administración. Prentice Hall. Englewood.


1992. 946 p.C

CHAO, Lincoln L. Estadística para las Ciencias Administrativas. Mc Graw Hill. México. 1982.
472 p.

GRISALES G., Arbey F. y ZULUAGA R., Antonio. Estadística Práctica. REAL. Armenia, 1990.
163 p.

HILLS, Richard L. et all. Estadística para economía y administración. Mc Graw Hill. México.
1981. 597 p.

HOEL, Paul G. Estadística Básica para negocios y Economía. Continental. México. 1978. 452
p.

LEVIN, Richard I. Estadística para Administradores. PRENTICE HALL. Englewood. 1981.


572 P.

MARTÍNEZ B., Ciro. Estadística, 614 problemas resueltos.ECOE. Bogotá.1978. 713 p.

MENDENHALL, William. Estadística para Administradores. Editorial IBEROAMÉRICA.


México. 1990. 817 p.

MURRAY SPIEGEL. Estadística. Serie Schaum. Mc. Graw Hill. México. 1983. 357 p.

PORTUS GOVIDEN, Lincoyán. Curso Práctico de Estadística. MacGraw – Hill. México, 1990.
192 p.

SARAZA N., Carlos H. Manual de Estadística. UNISARC. 1999. 101p.

SPIEGEL, Murray R. Estadística. MacGraw – Hill. México, 1983. 357 p.

WONNACOTT, Tomás H. et all. Fundamentos de Estadística para Administración y


Economía. LIMUSA. México, 1981
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 129
TALLER UNIDAD I

1. Teniendo en cuenta la clasificación de las variables proponga un ejemplo de cada uno


de los cuatro tipos definidos de variable.
2. Se realiza un estudio para identificar las personas que trabajan en una clínica, a cada
una de ellas se le pide que llene un formato que tiene preguntas relacionadas con la
ciudad de nacimiento, la edad, el sexo, el valor del ingreso mensual, la preferencia de
comida, el grado de escolaridad y el tiempo de trabajo que llevan en la empresa.
Identifique las variables que intervienen en el estudio y llene un cuadro como el que se
muestra a continuación. (Se presenta la primera de las variables).
Variable TIPO SUBTIPO
Ciudad de nacimiento Cualitativa Nominal

3. Un estudio de mercado pretende conocer si a los jóvenes les agrada o no tener


mascotas, qué tipo de animal prefieren como mascota, cuál es el sexo que prefieren
para la mascota, de qué color le gusta la mascota, cuánto estarían dispuestos a pagar
por una mascota y cuál sería el número de mascotas que estarían dispuestos a tener.
El estudio se realiza con jóvenes, hombres y mujeres, en edades entre 16 y 20 años,
que viven en el barrio El Estadio del municipio de Miraflores. La oficina de planeación
del departamento informa que en el barrio hay una población total de 1150 personas
en este rango de edades. Se diseña una encuesta que se aplica al 35% de los
jóvenes. Para el estudio realizado determine: descripción y tamaño de la población;
descripción y tamaño de la muestra; variables utilizadas; clasificación de las variables
utilizadas.
4. Clasifique las variables que se describen a continuación:
4.1 Barrio donde viven los empleados de una empresa.
4.2 Tipo de zapatos de calle que utilizan médicos de una clínica
4.3 Cargo que ocupan los egresados de UNISARC que laboran en empresas del Eje
Cafetero.
4.4 Valor de los aportes que las clínicas veterinarias hacen por concepto de
seguridad social de sus empleados.
4.5 Cantidad de personas que trabajan en clínicas veterinarias y que acreditan
estudios de postgrado.
4.6 Cantidad de cirugías realizadas por día en una clínica
4.7 Costo de los microscopios disponibles en el mercado
130 CARLOS HERNAN SARAZA NARANJO
4.8 Tipo de mascota preferida por mujeres que tienen entre 25 y 30 años
4.9 Registro de las preferencias políticas de jóvenes de zonas rurales
4.10 Valor cobrado por almacenes de mascotas, por concepto de retención en la
fuente.

5. Un grupo de investigadores decide realizar un estudio para determinar si los jóvenes


matriculados en grado once en los colegios de Risaralda están pensando ingresar a la
universidad. Se registran 11765 estudiantes matriculados en grado once. Para el
estudio se entrevistan 52 estudiantes y se obtienen los resultados que se registran, en
orden horizontal en la siguiente tabla:

SI NO SI NO NO SI NO SI NO SI NO SI NO
SI NO SI NO SI NO SI NO NO SI NO NO NO
NO SI NO SI NO SI NO SI NO NO SI SI NO
SI SI NO NO NO NO NO SI SI NO SI SI SI

Teniendo en cuenta la información suministrada: a. Describa la población y determine


el valor de N; b. Describa la muestra y determine el valor de n; c. describa y clasifique
la variable; d. Encuentre el resultado de X24; X2 y X50; e. Interprete el resultado de X27.

6. Se realiza una encuesta socioeconómica entre las familias del municipio La Peña. La
encuesta tiene el objetivo de determinar los siguientes aspectos: distribución de los
habitantes del municipio por sexos y por estratos; ingreso promedio familiar por mes;
edades de las personas económicamente activas; tipo de comida que prefieren las
familias; actividades que han sido relegadas a causa de la condición económica de la
familia; alternativas que ha diseñado la familia para mejorar las condiciones
económicas; respuesta acerca de estar de acuerdo o no con las políticas económicas
del país; evaluación de la gestión del gobierno en términos de excelente, aceptable,
buena o mala.

Para el estudio que se describe identifique las variables que intervienen y clasifique
cada una de ellas.

7. Determine cuáles de las siguientes afirmaciones son verdaderas o falsas. Para las
afirmaciones falsas justifique la respuesta

7.1 La variable tipo de mascotas disponibles en el mercado es cualitativa porque las


masscotas se clasifican según su color.
7.2 La variable grado de escolaridad de los empleados de almacenes veterinarios es
cualitativa nominal porque se refiere a cualidades y no establece orden
7.3 El valor X3=25 de una variable significa que el tercer valor obtenido en una encuesta
arrojó un resultado de 25
7.4 Cuando en una encuesta se encuentra que X32=245 se tiene seguridad que X33≥245
7.5 Si el tamaño de una población es N=450 es posible obtener una muestra de tamaño
n=50
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 131
7.6 Para una muestra se sabe que X3=25 y que X5=32 entonces se puede concluir que
X8=57
7.7 La variable valor del gasto mensual en pago de servicios públicos en empresas
transformadoras de lácteos es cuantitativa continua porque hace referencia a una
medición del gasto
7.8 En un mismo estudio estadístico es posible combinar diferentes clases de variables

TALLER UNIDAD II
1.
Número de hijos en las familias de los empleados de la empresa Tus Mascotas
Xi fi Fi hi% Hi%
1 12
2 45
3 23
4 9
5 1

Complete la tabla y responda los siguientes enunciados:

1.1 Describa la población y determine el valor de N


1.2 Describa la muestra y determine el valor de n
1.3 Interprete f3, F2, h1 y H4
1.4 Cuántas familias tienen a lo sumo 2 hijos
1.5 Cuál es el porcentaje de familias que tienen menos de 2 hijos
1.6 Cuál es el mayor número de hijos por familia
1.7 Cuál es el número de hijos que más se presentó
1.8 Cuántas familias tienen más de dos hijos o menos de 5 hijos
1.9 Cuál es el porcentaje de familias que tienen menos de 2 hijos y más de 4 hijos
1.10 Cuántas familias tienen por lo menos 2 hijos.

2. Se realiza un estudio para determinar la cantidad de mascotas vendidas por mes en


empresas dedicadas a esta actividad. Para el estudio se visitan 25 empresas y se
pregunta por el número de mascotas vendidas el mes anterior. Los datos obtenidos son
los siguientes:
7 4 3 8 4 4 4 7 3 7 4 4 4
5 4 2 4 5 4 5 5 8 5 4 5 0
4 7 8 8 8 8 8 8 7 4 3 4
5 5 4 0 4 4 4 4 5 0 8 0

Organice los datos en una tabla de distribución de frecuencias y responda los siguientes
enunciados:

2.1 Obtenga tres conclusiones sobre los datos de la tabla.


2.2 Cuál es el valor y qué significan f3 y H5.
2.3 En cuántas empresas el número de mascotas vendidas supera 45.
2.4 Cuál es el porcentaje de empresas que venden a lo sumo 80 mascotas.
2.5. Cuál fue el número de mascotas vendidas que menos se presentó.
132 CARLOS HERNAN SARAZA NARANJO

3. Se realiza un estudio para determinar el tiempo que tardan los perros para recuperarse de la
anestesia que han recibido en una cirugía. Se registra el tiempo, en horas, de 80 perros que
fueron anestesiados con el mismo medicamento. Los datos encontrados son los siguientes:
0,9 0,9 0,9 0,9 0,9 0,8 0,8 1,0 0,9 0,9 0,8 0,8 0,8 0,8
2 5 5 6 4 5 2 1 0 0 0 0 4 3
0,9 0,9 0,9 0,9 0,9 0,9 0,9 1,0 0,7 0,7 0,7 0,7 0,9 0,9
0 4 2 3 0 5 2 0 2 4 8 8 4 3
0,7 0,7 0,7 1,0 0,9 0,8 0,5 0,6 0,6 0,9 0,9 0,6 0,7 0,7
5 8 7 2 4 0 0 3 0 2 3 2 1 8
0,4 0,4 0,5 0,6 0,6 0,8 0,5 0,8 0,8 0,9 0,7 0,7 0,8 0,8
5 8 7 2 4 0 6 3 0 2 1 2 1 8
1,0 1,0 0,4 0,8 0,6 0,5 0,6 0,5 0,4 0,5 0,5 0,4 0,6 0,5
5 8 9 7 4 9 4 3 8 2 3 9 1 6
0,9 0,9 0,8 0,7 0,7 0,7 0,6 0,7 0,6 0,5
9 8 4 2 2 8 5 1 0 2

Organice los datos en 7 intervalos de clase, construya la tabla de distribución de frecuencias


correspondiente y responda los siguientes enunciados:

3.1 Cuál fue el menor tiempo encontrado


3.2 Cuál fue el tiempo que menos se presentó
3.3 Cuál es el valor y qué significan h6 y F3
3.4 Obtenga tres conclusiones sobre los datos de la tabla
3.5 Cuál es el tiempo que más se presentó.

4. Longitud de lombrices toxocara cati encontradas en gatos


Longitudes (cm) Xi fi Fi hi Hi Longitudes
(cm)
4,2 - 4,6 13
4,7 - 5,1 11
5,2 - 5,6 10
5,7 - 6,1 9
6,2 - 6,6 7
6,7 - 7,1 25
7,2 - 7,6 18

Complete la tabla y responda los enunciados:

4.1 Determine el valor de n


4.2 Cuántas lombrices tienen longitud superior a 6,6 centímetros
4.3 Cuántas lombrices tienen longitud de a lo sumo 6,1 centímetros
4.4 Cuál es el porcentaje de lombrices con longitud superior a 5,6 centímetros e inferior a 6,7
centímetros
4.5 Cuál es el porcentaje de lombrices con longitud de por lo menos 5,7 centímetros y a lo
sumo 5,1 centímetros
4.6 Cuál es el porcentaje de lombrices con longitud superior a 6,6 centímetros o inferior a 5,2
centímetros.
4.7 Cuál es la longitud que más se presenta en las lombrices.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 133
4.8 Cuál fue la mayor longitud encontrada en las lombrices
4.9 Qué valor tienen y que significan F5 y h4
4.10 Cuántas lombrices tienen longitud que no supera 6,1 centímetros.

5. Para un estudio en el que se han considerado 120 datos, se construyen 8 intervalos de


clase. Determine cuáles de las siguientes afirmaciones son falsas. Justifique cada una de
las respuestas elegidas.

5.1 f8 = 120
5.2 F4 = f3 + f4
5.3 H4= H3 + h4
5.4 H8=120
5.5 f1+f2+f3=F3
5.6 h3 < h4
5.7 H5 > H4
5.8 F3 = H3

6. Se realiza un estudio para determinar el estrato social de las mujeres que laboran en
empresas que distribuyen alimentos para mascotas. Los datos obtenidos se resumen en la
siguiente tabla:
3 1 2 3 4 2 4 3 1 6 2 4 3 2 1 6 4 3 2 4 1 2 4 3 2
2 2 3 6 2 3 4 2 6 4 3 2 1 6 4 3 2 1 4 3 2 4 4 3 2

Organice los datos en una tabla de frecuencias y determine:

6.1 Variable que interviene en el estudio y clasificación de la misma


6.2 Descripción y tamaño de la muestra
6.3 Porcentaje de mujeres que están clasificadas en estrato 2
6.4 Cantidad de mujeres que están clasificadas en estratos 4 o 6
6.5 Porcentaje de mujeres que están clasificadas en estrato 2 y en estrato 3
6.6 Cantidad de mujeres clasificadas en estrato 5
6.7 Porcentaje de mujeres que no están clasificadas en estrato 3
6.8 Porcentaje de mujeres que están clasificadas en estrato 2 o en estrato 3
7. Se realizó un estudio estadístico de variable continua en el cual se construyeron 8
intervalos. La muestra utilizada fue de 80 datos. Con base en esta información determine si
las siguientes afirmaciones son verdaderas o falsas. Si la afirmación es falsa indique cuál
sería la forma de corregirla.
7.1 ______ F5>f5

7.2 ______ F6= f4+f5

7.3 ______ H8=80

7.4 ______ f3>F3

7.5 ______ H4=H3+h4


134 CARLOS HERNAN SARAZA NARANJO
8. Se preguntó en 20 almacenes que distribuyen alimentos para mascotas, en el Eje
Cafetero, el número de bultos de concentrado vendidos durante un día. Los datos
obtenidos son los siguientes:
45 48 48 48 50 50 50 50 50 64
64 70 70 70 70 70 70 85 85 85

Construya la tabla de distribución de frecuencias y determine:

8.1 Cuántos almacenes reportan ventas superiores a 50 bultos


8.2 Cuál es el porcentaje de almacenes con ventas de por lo menos 70 o a lo sumo 64
bultos
8.3 Cuál es el porcentaje de almacenes con ventas mayores que 64 y menores que 85 bultos
8.4 Cuál fue la venta que menos se presentó
8.5 Cuál fue la menor venta reportada
8.6 Cuál es el número de almacenes cuyas ventas no exceden 64 bultos
8.7 Cuál es el porcentaje de almacenes cuyas ventas exceden 64 bultos pero no exceden 50
bultos
8.8. Interprete f3, H4 y F5

9. Se realiza un estudio de mercado para determinar el valor mensual que las familias de
zona rural destinan para comprar alimento para mascotas. Los datos, en miles de pesos,
se registran en la siguiente tabla:
8,5 8,5 8,5 8,8 8,8 8,8 8,8 8,8 9.0 9,0 9,0 9,3 9,5 9,5
10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12,
0 0 0 0 0 0 0 0 5 8 5 7 0 5
12, 12, 13, 13, 14, 14, 14, 14, 14, 14, 14, 14, 15, 15,
5 8 7 9 0 4 7 7 7 7 7 7 2 8
16, 16, 17, 18, 20, 20, 20, 25, 27, 27, 28, 29, 29, 29,
4 9 8 2 1 4 9 7 4 9 1 3 5 8

9.1 Construya la tabla de distribución de frecuencias con m=7


9.2 Con los datos de la tabla obtenga 5 conclusiones
9.3 Con los datos de la tabla dé respuesta a los siguientes enunciados:
9.3.1 Cuántas familias destinan más de $20.800 para comprar alimento para mascotas
9.3.2 Cuántas familias destinan menos de $24.100 para comprar alimento para mascotas
9.3.3 Cuántas familias destinan por lo menos $17.700 y a lo sumo $27,200 para comprar
alimento para mascotas
9.3.4 Cuántas familias destinan menos de $20.900 o más de 27.200 para comprar alimento
para mascotas
9.3.5 Porcentaje de familias que destinan más de $20.800 o menos de $14.500 para
comprar alimento para mascotas
9.3.6 Porcentaje de familias que destinan más de $14.400 y menos de $20.900 para
comprar alimento para mascotas
9.3.7 Porcentaje de familias que destinan más de $17.600 o menos de $24.100 para
comprar alimento para mascotas
9.3.8 Valor destinado para comprar alimento para mascotas que más se presentó
9.3.9 Mayor valor destinado para comprar alimento para mascotas
9.3.10Interprete F4 y H3
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 135

10. Se realiza un estudio para determinar el valor pagado por familias colombianas por
concepto de juguetes para mascotas, adquiridos en diferentes empresas. Los datos
obtenidos se resumen en la siguiente tabla:
Gasto (millones de $) fi
0,45-0,62 11
0,63-0,80 14
0,81-0,98 13
0,99-1,16 9
1,17-1,34 5
1,35-1,52 3

Complete la tabla y determine:

10.1 Tamaño de la muestra


10.2 Cuántas familias tienen pagos en juguetes inferiores a $810.000
10.3 Cuál es el porcentaje de familias que pagan en juguetes a lo sumo $980.000
10.4 Cuál es el mayor valor que se paga en juguetes
10.5 Cuál es el valor pagado en juguetes que más se presenta en el estudio
10.6 Cuál es el porcentaje de familias que gastan a lo sumo $800.000 o por lo menos
$1.170.000 en juguetes.
10.7 Cuántas familias pagan por lo menos $990.000 y a lo sumo $1.340.000 en juguetes
10.8 Cuál es el porcentaje de familias que pagan más de $1.160.000 y menos de $810.000
en juguetes.

11. Proponga un ejemplo de aplicación de distribución de variable discreta y construya la


tabla correspondiente.

12. Proponga un ejemplo de aplicación de distribución de variable continua y construya la


tabla correspondiente.

TALLER UNIDAD III


1. Refiérase al ejercicio 1 del taller de la unidad II, construya el gráfico de barras y el gráfico
circular correspondientes.

2. Refiérase al ejercicio 2 del taller de la unidad II, construya el gráfico circular.

3. Refiérase al ejercicio 3 del taller de la unidad II, construya el polígono de frecuencias y las
ojivas.

4. Refiérase al ejercicio 4 del taller de la unidad II, construya la ojiva mayor que y el
histograma.
136 CARLOS HERNAN SARAZA NARANJO
5. Establezca diferencias y semejanzas entre el histograma y el polígono de frecuencias de
una muestra.

6.
Altura de terneros
90 82
80 74

No. de terneros
70 62
60 56 1,2-1,3
50 45 1,4-1,5
40
30 1,6-1,7
20 14 1,8-1,9
10 2,0-2,1
0
2,2-2,3
1
Tomando como referencia el gráfico responda los siguientes enunciados:
Alturas(m)
6.1 Describa el estudio y determine el tamaño de la muestra
6.2 Cuántos terneros tienen altura de por lo menos 1,8 metros
6.3 Porcentaje de terneros que tienen altura entre 1,4 y 1,9 metros
6.4 Cuántos terneros tienen altura entre 1,8 y 2,1 metros
6.5 Porcentaje de terneros que tienen altura a lo sumo de 1,9 metros
6.6 Mayor altura encontrada en los terneros
6.7 Altura que menos se presenta
6.8 Cantidad de terneros que no logran superar 1,7 metros de altura

7. Peso de un lote de pollos


80
70
60
No. de pollos

50 1,4-1,7
1,8-2,1
40 75 2,2-2,5
30 56 2,6-2,9
52
46 3,0-3,3
20
32 3,4-3,7
10 24 25
3,8-4,1
0
1
Pesos (libras)

Tomando como referencia el gráfico responda los siguientes enunciados:


7.1 Mayor peso encontrado
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 137
7.2 Porcentaje de pollos que tienen peso entre 1,8 y 2,9 libras.
7.3 Porcentaje de pollos que tienen peso de por lo menos 3,4 libras
7.4 Porcentaje de pollos que tienen peso de a lo sumo 3,3 libras
7.5 Porcentaje de pollos que no alcanzan peso de 2,6 libras
7.6 Menor peso encontrado

8. Para diferentes estudios y especialmente para la presentación de resultados en revistas y


periódicos se utiliza un gráfico denominado pictograma. Consulte qué es un pictograma y
construya el pictograma correspondiente al ejercicio 4 de la unidad número 2.

TALLER UNIDAD IV
1. Tomando como referencia la siguiente tabla, Encuentre el valor de cada una de las
sumatorias dadas:

1 2 3 4 5 6 7 8
Xi 2 3 5 8 -1 4 3 6
Yi 4 2 10 3 8 -3 -4 7
Zi 0 11 12 -5 11 9 8 8

5 7 2

1.1
 Xi
2 1.6
X
4
i

4 8

1.2
  7Yi
1 1.7
 6Y  8Z
5
i i

7 4
9Xi
1.3
 3( X i  Zi )
3 1.8
 12
1

3 5
8 Zi Yi
1.4
 (Y  Z )
5
i i
1.9
84
4

4 8

 Xi i  3(Z
Y
i  2Yi )  4Z i
1.5 1 1.10 1

2. Encuentre el valor medio de los números pares mayores o iguales que 2 y menores o
iguales que 8

3. Encuentre la mediana de los números impares mayores que 3 y menores que 15.
138 CARLOS HERNAN SARAZA NARANJO
4. Una clínica odontológica canina ha registrado la cantidad de tubos de resina utilizados
durante 10 meses encontrando los datos que se registran en la siguiente tabla

340 342 298 298 340 345 298 354 302 311
Encuentre.

4.1 Valor medio de la cantidad de tubos utilizados por mes


4.2 Cantidad de tubos utilizados en el 50% de los meses que presentaron mayor cantidad de
tubos de resina
4.3 Cantidad de tubos utilizados que más se presentó

5. Los datos de la tabla siguiente corresponden a la cantidad de gatos y perros esterilizados


en un día por un grupo de estudiantes, en veredas de Santa Rosa de Cabal

CANTIDAD DE No. DE VEREDAS


ANIMALES
35 3
38 5
40 7
42 6
44 4
45 2
50 5

5.1 Determine la cantidad media de animales esterilizados por día


5.2 Determine la cantidad de animales esterilizado en el 50% de las veredas con menor
número de esterilizaciones
5.3 Encuentre la cantidad de animales esterilizados que más se presenta por día

6. Un avicultor tiene 3 lotes de pollos en los cuales ha programado el sacrifico


correspondiente. En total tiene 200 pollos. El primer lote presenta un peso medio de 3,2
libras; en el segundo lote hay una cantidad de pollos que es excedida por la cantidad del
primer lote en 13 unidades y que tiene un peso medio de 3,7 libras; el tercer lote tiene una
cantidad de pollos que excede a la cantidad de pollos del segundo grupo en un animal. Si
el peso medio de todos los pollos es 3,5755 libras ¿Cuál es el peso medio de los pollos
del tercer lote?

7. El propietario de la finca “La Esperanza” paga salarios mensuales cuya media asciende a
$812.300

7.1 Si el propietario decide incrementar cada salario en $32.800, ¿cuál es el nuevo salario
medio?

7.2 Si el propietario decide incrementar cada salario en el 6%, ¿cuál es el nuevo salario
medio?

8. Los siguientes datos corresponden a una muestra del gasto mensual en medicamentos
para aves en fincas de la vereda Los Micos
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 139

Gasto (miles de $) fi
10 - 15 35
16 - 21 20
22 - 27 18
28 - 33 35
34 - 39 15
40 - 45 13

Determine: gasto medio, gasto que más se presenta; gasto en el 15% de las fincas que
presentan mayores gastos; gasto en el 25% de las fincas que reportan los mayores gastos;
gasto en el 30% de las fincas que reportan los menores gastos; gasto en el 50% de las fincas
que presentan los mayores gastos.

9. Los siguientes datos corresponden a una muestra de la longitud de peces en el estanque


A23 de la piscícola El Mirador.

Longitudes (cm) fi
12,5-12,9 35
12,9-13,3 32
13,3-13,7 42
13,7-14,1 23
14,1-14,5 15
14,5-14,9 13

9.1 Calcule la longitud media de los peces


9.2 Calcule la longitud del 50% de los peces más largos
9.3 Calcule la longitud que más se presenta
9.4 Calcule la longitud del 35% de los peces más largos
9.5 Calcule la longitud del 20% de los peces más cortos

10. En la tabla siguiente se registra el valor del salario mínimo en Colombia durante 9 años
consecutivos. Calcule el incremento porcentual anual del salario mínimo para los años entre
el 2011 y el 2019. Con los valores calculados obtenga la media geométrica y la media
armónica.
AÑO SALARIO
2011 535.600
2012 566.700
2013 589.500
2014 616.000
2015 644.350
2016 689.455
140 CARLOS HERNAN SARAZA NARANJO
2017 737.717
2018 781.242
2019 828.116

11.
Edad de las personas económicamente
activas en las familias campesinas del
departamento de Risaralda
60
52

Número de personas
50 45 44
40 17-22
34 34
23-28
30 27 28
29-34
20 35-40
Con base en el histograma determine: 41-46
10
47-52
0 53-58
11.1 Cuántas personas componen la muestra 1
11.2 Edad media de las personas Edades

11.3 Edad que más se presenta


11.4 Edad del 50% de las personas más jóvenes
11.5 Cuál es la edad del 35% de las personas de mayor edad
11.6 Cuál es el porcentaje de personas con edades entre 29 y 40 años

12. El departamento de control de calidad de un laboratorio ha determinado los tiempos, en


horas, requeridos para analizar muestras que llegan al laboratorio. Los tiempos
aparecen en la siguiente tabla:

TIEMPOS(horas) fi
0,38 – 0,52 14
0,53 - 0,67 18
0,68 - 0,82 22
0,83 - 0,97 45
0,98 - 1,12 32
1,13 - 1,27 25
1,28 - 1,42 20

12.1 Encuentre el tiempo medio requerido para analizar una muestra.


12.2 Encuentre el tiempo requerido para el 50% de los análisis más rápidos.
12.3 Encuentre el tiempo que más se presenta.
12.4 Encuentre el tiempo requerido para el 10% de los análisis más rápidos.
12.5 Encuentre el tiempo requerido para el 18% de los análisis más demorados.
12.6 Encuentre el tiempo requerido para el 75% de los análisis más rápidos
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 141

TALLER UNIDAD V
1. Los siguientes datos corresponden al valor de los gastos mensuales en pago de
servicio de agua en clínicas odontológicas de animales. El gasto está expresado en
miles de pesos.

Gasto fi
43 – 50 21
51 - 58 14
59 - 66 12
67 - 74 18
75 - 82 15

Determine:

1.1 Rango del costo de servicio de agua


1.2 Desviación media del costo de servicio de agua
1.2 Varianza y desviación estándar del costo
1.3 Dispersión relativa del costo
1.4 Si por efecto de errores en la facturación se cobró un excedente de $1400 a cada finca,
cuál es el verdadero valor de la media, la varianza, la desviación estándar y el coeficiente de
variación.

2. Dos fincas vecinas crían conejos. En el último año se tomó el peso de 10 conejos de
cada finca. Determine cuál de las dos fincas presentó la producción más homogénea.
Finca Ensueño Finca Calamar
Pesos (g) Pesos (g)
320 320
330 450
340 320
360 310
325 270
380 470
370 270
390 400
350 370
330 315
142 CARLOS HERNAN SARAZA NARANJO
3. La empresa “Mascotas y alimentos” paga impuestos mensuales por diferentes
conceptos cuyo valor medio asciende a $485.000 y su varianza es $21.200.000.

3.1 Si el gobierno decide incrementar cada impuesto en $17.000, ¿cuál es el nuevo


impuesto medio y cuál es la nueva varianza?

3.2 Si el gobierno decide incrementar cada impuesto en el 5,8%, ¿cuál es el nuevo impuesto
medio y cuál es la nueva varianza?

4. Los Siguientes datos corresponden a una muestra de la resistencia de bolsas plásticas


referencia B45 disponibles en el mercado. Las resistencias están dadas en kilogramos.
PESOS(Kg) fi
10,5 - 14,5 5
14,5 - 18,5 6
18,5 - 22,5 8
22,5 - 26,5 15
26,5 - 30,5 40
30,5 - 34,5 32
34,5 - 38,5 18
Determine:

4.1 Varianza y desviación estándar de las resistencias


4.2 Desviación media de las resistencias
4.3 Coeficiente de variación de las resistencias
4.4 Utilizando el teorema de Tchebysheff con dos valores de K diferentes, analice la muestra

5. En un estudio socioeconómico se pregunta en 8 clínicas acerca del valor que pagan


anualmente por concepto de impuestos. Los datos obtenidos, tomados en miles de pesos,
se resumen en la siguiente tabla:

900 450 500 800 750 420 380 600

5.1 Determine el coeficiente de variación de los pagos en impuestos


5.2 Encuentre el coeficiente de sesgo
5.3 Determine el coeficiente de curtosis
6. Los registros financieros anuales de la empresa “Aves del Otún” muestran que los
ingresos mensuales tienen un valor medio de $23.565.000 con una varianza de $2
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 143
50.625.000.000; de igual manera informan que el valor medio de los egresos mensuales
es $7.025.000 con varianza de $2 6.724.000.000. Cuál de las dos variables resulta ser más
heterogénea.

7. Se pregunta a empleados de la empresa “El Encanto” acerca del número de personas que
conforman sus familias. Los datos obtenidos se registran en la siguiente tabla:

7 4 5 8 6 7 9 2
5 7 5 7 5 7 8 7

Calcule la varianza, la desviación estándar y el coeficiente de variación.

8. Se realiza un estudio en clínicas del país para determinar la cantidad de consultas


atendidas en el mes de diciembre de 2019. Los resultados son los siguientes:

Cantidad de 10 10 10
92 94 95 96 98
consultas 0 5 8
Número de clínicas 3 4 5 2 4 6 2 8

Calcule el coeficiente de variación, el coeficiente de sesgo y el coeficiente de curtosis

9. En un estudio de la cantidad de huevos vendidos durante un día en tiendas de Pereira se


encuentran los datos que se resumen en la tabla siguiente:

No. de huevos vendidos No. de tiendas (fi)


(Xi)
52 4
58 9
64 12
65 5
78 9
82 5
94 10

Calcule la varianza, la desviación estándar y el coeficiente de variación

10. Se realiza un estudio para determinar el valor de las acciones que manejan empresas
colombianas. Los resultados del estudio se muestran en la siguiente tabla:
Valor acciones No. de empresas (fi)
(millones de $)
1,5-2,4 2
2,5-3,4 4
3,5-4,4 16
4,5-5,4 5
5,5-6,4 11
6,5-7,4 22
7,5-8,4 34
144 CARLOS HERNAN SARAZA NARANJO
Calcule la varianza, la desviación estándar y el coeficiente de variación

11. Se realiza un estudio para determinar el valor de los gastos mensuales de publicidad de
empresas pecuarias. Los datos obtenidos se resumen en la siguiente tabla:
Valor gastos No. de empresas (fi)
(millones de $)
0,62-0,84 10
0,85-1,07 18
1,08-1,30 24
1,31-1,53 35
1,54-1,76 24
1,77-1,99 18
2,00-2,22 10

11.1 Determine el valor de la varianza, la desviación estándar y el coeficiente de variación.


11.2 Interprete la muestra utilizando la campana de Gauss correspondiente al 99,73%
11.3 Determine e interprete el coeficiente de sesgo y el coeficiente de curtosis

12. En un estudio que pretende determinar el valor de las remesas procedentes del extranjero
que reciben mensualmente 52 familias campesinas del departamento de Risaralda se
obtienen los siguientes datos:

 X i  34.970.000  X  X   10.559.250.000
2
i

Con los datos dados determine:

12.1 Valor medio de las remesas


12.2 Desviación estándar de las remesas
12.3 Coeficiente de variación de las remesas

13. Determine cuáles de las afirmaciones siguientes son verdaderas o falsas. Para las
afirmaciones falsas corrija la afirmación o explique por qué es falsa

13.1 Si la varianza de una muestra es 25 entonces la desviación estándar de la muestra es


625

13.2 Si la suma de los datos de una muestra es 1024 y la media de la muestra es 64


entonces el tamaño de la muestra es 16

13.3 Si la desviación estándar de una muestra es -24,8 entonces la varianza de la muestra


es (-24,8)2.

13.4 Para que una distribución sea simétrica se requiere que el momento de orden 3 sea
igual a cero

13.5 Cuando el rango de una muestra es 25000 se puede afirmar que la muestra es
heterogénea
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 145

13.6 Cuando el coeficiente de variación de una muestra es 23,45% y la varianza de la


muestra es 20,25, se puede afirmar que la media de la muestra es 1,0525.
146 CARLOS HERNAN SARAZA NARANJO

TALLER UNIDAD VI

1. Un investigador recibe 8 muestras de sangre para las que dispone de igual número de
cajas petri. ¿De cuántas formas puede asignar las cajas a las muestras?

2. En una prueba psicotécnica aplicada a Médicos Veterinarios que aspiran a gerenciar una
clínica se exponen 5 dibujos de animales en un salón y se pide a cada entrevistado que
elija, a su gusto, uno de los cinco dibujos y se pare al lado de él. A la prueba se
presentan 6 candidatos. ¿De cuántas formas puede ocurrir la elección de los dibujos?

3. ¿Cuántos resultados pueden presentarse en el premio mayor de una lotería en el que se


deben acertar 4 números y una serie compuesta por dos números?

4. En la empresa “Alimentos del Bosque” laboran 7 hombres y 8 mujeres. Para el mes de


diciembre el propietario decide bonificar, con bonificaciones de igual valor, a tres hombres
y cuatro mujeres.

a. ¿De cuántas maneras se puede presentar la bonificación?


b. ¿De cuántas maneras se puede presentar la bonificación si se decide que uno de los
hombres no debe ser bonificado?
c. ¿De cuántas maneras se puede presentar la bonificación si se decide que una de las
mujeres y dos de los hombres deben ser bonificados?
d. ¿De cuántas maneras se puede presentar la bonificación si se decide que dos de las
mujeres deben ser bonificadas mientras que dos de los hombres no deben ser
bonificados?

5. Una empresa transformadora de lácteos produce 4 tipos de yogur, 3 tipos de avena y 6


tipos de leche saborizada. La empresa envía a sus clientes un muestrario constituido por
un tipo de producto de cada clase. ¿Cuántos muestrarios diferentes puede enviar la
empresa?

6. En un laboratorio se toma la decisión de marcar cada caja petri con un código compuesto
por dos letras y dos números. La primera letra es una C o una K para distinguir si la caja
es clara u opaca; la segunda letra puede ser cualquiera del alfabeto sin repetir la primera
letra; los números se pueden repetir. El laboratorio tiene 5400 cajas petri disponibles.
¿Es posible, con este tipo de código, marcar todas las cajas disponibles?.

7. Los estudiantes de Medicina Veterinaria de UNISARC deben presentar una evaluación


que consta de 13 preguntas y que debe cumplir unas condiciones especificadas por el
profesor. Cuántas maneras de escoger las preguntas a resolver hay con cada una de las
siguientes condiciones:
a. El estudiante debe resolver solamente 8 preguntas a libre elección
b. El estudiante debe responder 8 preguntas, las 3 primeras preguntas son de carácter
obligatorio y de las restantes no interesa cuáles escoja
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 147
c. El estudiante debe responder 8 preguntas de tal manera que 4 sean preguntas pares y
4 sean preguntas impares

8. Un piscicultor dispone de 3 vías para ir desde el estanque C1 al estanque C2 y de 4 vías


para viajar desde el estanque C2 hasta el estanque C1. ¿De cuántas formas se puede
organizar el viaje de ida y vuelta de C1 a C2?.

9. En un Centro de Investigaciones se destinan tres premios para entregar a los mejores


trabajos de investigación del año. Si el centro recibe 25 trabajos de investigación, ¿de
cuántas maneras puede entregar los premios?

10. Se lanzan a rodar 5 lápices que tienen marcados en sus lados los números del 1 al 4.
¿Cuántos resultados posibles hay?

13. El grupo de estudiantes del programa de Medicina Veterinaria está conformado por 25
personas. Se requiere escoger 5 personas para que asistan a un seminario. De cuántas
formas se puede hacer la selección en los casos siguientes:

a. Cualquier estudiante puede ser escogido


b. Cinco estudiantes determinados no pueden ser escogidos
c. Dos estudiantes determinados deben ser escogidos

14. En un laboratorio clínico se dispone de 7 espacios para ubicar 7 microscopios. De


cuántas formas se pueden rotar los aparatos en los diferentes espacios.

TALLER UNIDAD VII

TEORÍA DE LA PROBABILIDAD

1. Se extraen dos hámster al azar, sin remplazamiento, de una jaula que contiene 10
hámster blancos, 30 hámster crema y 20 hámster naranja. Determine la probabilidad de
que los hámster extraídos sean:

a. Dos de color crema b. El primero naranja y el segundo blanco


c. Dos del mismo color d. Uno blanco y uno crema
e. Al menos uno naranja f. A lo sumo uno crema

2. La probabilidad de que la vacuna A24 tenga efecto positivo en un caballo es 98,2%


mientras que la probabilidad de que la vacuna A15 tenga efecto positivo en un caballo es
92%. Suponga que se aplica la vacuna A24 a un caballo y la vacuna A15 a otro caballo,
encuentre la probabilidad de que:

a. Las dos vacunas tengan efecto positivo


b. Una de las vacunas tenga efecto positivo
c. Al menos una de las vacunas tenga efecto positivo
d. La vacuna A24 tenga efecto positivo pero la vacuna A15 no lo tenga
148 CARLOS HERNAN SARAZA NARANJO
3. La tabla No.1 registra la evaluación hecha sobre el estado final de perros, gatos y aves
que han sido sometidos a cirugía en una clínica.

Tabla 1. Registro de estado final de animales intervenidos quirúrgicamente

TIPO DE ESTADO TOTAL


ANIMAL RECUPERADO NO
RECUPERADO
Perro 42 8
Gato 38 12
Ave 54 6
TOTAL

Se toma un registro de animal al azar. Determine la probabilidad de que el registro


corresponda:

a.
b. A un perro
c. A un perro o a un animal recuperado
d. A un ave y que no se haya recuperado
e. A un perro o a un gato
f. A un animal que no se haya recuperado o a un gato

11.
4. Tomando los datos de la tabla No. 1 asuma que se toman tres registros al azar, sin
remplazamiento, determine la probabilidad de obtener:

a.
b. Tres registros del mismo tipo de animal
c. Tres registros de animales no recuperados
d. Por lo menos un animal recuperado
e. Menos de dos gatos

5. La tabla No. 2 corresponde a un registro de la condición visual de perros, atendidos en la


clínica Centenario.

Tabla No. 2. Registro de condición visual de perros, clínica Centenario

B B B M B B B B M M
B B B B B B M B B B

B= Buena condición M= Mala condición

Suponga que se escogen 3 registros al azar con remplazamiento, encuentre la probabilidad


de que por lo menos 1 de ellos corresponda a perros con buena condición visual.
ESTADÍSTICA CON APLICACIONES EN MEDICINA VETERINARIA 149

6. El 92,72% de las operaciones que realiza una clínica resultan exitosas. Si se realizan 3
operaciones, encuentre la probabilidad de obtener:

a.
b. Ninguna exitosa
c. Menos de una que no sea exitosa
d. Más de 1 que sea exitosa
e.

11.
7. La tabla No. 3 corresponde a la revisión del proceso de atención al cliente en
40 consultas recibidas en la clínica “Risaralda”. Los cuadros marcados con √
corresponden a excelente atención, mientras que los marcados con X
requieren mejora en los procedimientos.

Tabla No. 3. Resultado de la atención al cliente, clínica “Risaralda”.

√ X √ X √ X √ √ √ √ √ √ √ √ √ √ √ √ √ X
X √ √ √ √ √ √ √ √ √ √ X √ X √ X X √ X √

Para tres nuevas citas atendidas. Determine la probabilidad de que:

a. Por lo menos 1 requiera mejora


b. Menos de 2 resulten excelentes
c. A lo sumo 1 resulte excelente
d. Se registre mayor cantidad de atenciones excelentes

8. En el laboratorio “Innovaciones Clínicas” se lleva el registro de tres tipos


nuevos de vacunas. Un registro parcial de la prueba de las vacunas se muestra
en la tabla No.4

Tabla No. 4. Registro de prueba de vacunas nuevas.

RESULTADO TIPO DE ANIMAL


TOTAL
Conejo Perro Gato
Exitosa 74 135
No exitosa 11 27
TOTAL 46 205

Si se selecciona un registro al azar determine la probabilidad de que corresponda

a. A un perro o a una vacuna exitosa


b. A una vacuna no exitosa o a un conejo
c. A una vacuna exitosa y a un gato
d. A un perro o un gato
e. A un conejo y un perro
150 CARLOS HERNAN SARAZA NARANJO

9. Con base en la tabla No. 4 asuma que se escogen 3 registros al azar con
reemplazamiento. Encuentre la probabilidad de que correspondan:

a. Por lo menos a 1 vacuna exitosa


b. A lo sumo dos conejos
c. A más vacunas exitosas que no exitosas
d. Por lo menos a dos gatos

DISTRIBUCIÓN BINOMIAL

10. Las estadísticas indican que la probabilidad de que un perro se recupere


satisfactoriamente de una operación de cataratas es del 71,5%. Si una
clínica opera 12 perros, calcule la probabilidad de que:

a. Más de 10 perros se recuperen satisfactoriamente


b. 2 perros no se recuperen satisfactoriamente
c. A lo sumo 9 perros se recuperen satisfactoriamente

11. En un ataque de sarna se comprueba que 15 de cada 120 conejos presentan


síntomas de la enfermedad. Si se realiza una inspección a 25 conejos, determine
las siguientes probabilidades:

a. Que ninguno de ellas tenga síntomas de sarna


b. Que 15 de ellos NO tengan síntomas de sarna
c. Que por lo menos 2 de ellos tengan síntomas de sarna
d. Que no más de 3 NO tengan síntomas de sarna

12. En un estudio de mercado se pregunta a 95 parejas acerca de su preferencia


por tener un perro o un gato como mascota. 34 parejas prefieren tener perro.
Un encuestador visita 14 parejas y espera encontrar por lo menos 3 de ellas
que prefieran tener perro. Cuál es la probabilidad de que el vendedor NO logre
encontrar lo esperado.

13. Se sabe que el 32% de las clínicas del eje cafetero tienen inversiones en
bienes raíces. Para una muestra de 12 clínicas determine las siguientes
probabilidades:

a. Que ninguna tenga inversiones en bienes raíces


b. Que por lo menos 10 tengan inversiones en bienes raíces
c. Que a lo sumo 10 tengan inversiones en bienes raíces
d. Que no más de 2 no tengan inversiones en bienes raíces.
MANUAL DE ESTADÍSTICA 151

14. Las estadísticas tomadas en una muestra de peso de perros callejeros indican
que el 64% de los perros tienen peso superior a 7 libras. Para una muestra de
9 perros callejeros determine la probabilidad de:

a. Encontrar 5 perros con peso superior a 7 libras


b. Encontrar menos de 2 perros con peso superior a 7 libras
c. Encontrar por lo menos 1 perro con peso que no supere 7 libras
d. Encontrar a lo sumo 7 perros con peso que no supere 7 libras
15. Estadísticas indican que de cada 50 animales que son golpeados en
accidentes de tránsito, 6 mueren. Para un grupo de 8 animales golpeados en
accidentes de tránsito, determine la probabilidad de que sea mayor el número
de animales que sobreviven que el número de animales que se mueren.

16. Se realiza una inspección a un lote de guantes de cirugía y se encuentra que


el 7,4% de ellos resultan de mala calidad. Si se revisan 15 guantes, determine
la probabilidad de encontrar:

a. 5 de mala calidad
b. 14 de buena calidad
c. Más de dos de mala calidad
d. A lo sumo 13 de buena calidad
e. Encuentre la media, la desviación estándar y la varianza para la variable
x=cantidad de guantes de buena calidad

DISTRIBUCIÓN DE POISSON

17. Una empresa aseguradora ofrece una póliza para cubrir a clínicas veterinarias
contra el riesgo de que un paciente muera como resultado de una cirugía; la
empresa conoce estadísticas según las cuales el 0,023% de los animales
intervenidos quirúrgicamente mueren como resultado de la cirugía. Si la
empresa asegura una clínica que realiza 1360 cirugías, determine las
siguientes probabilidades:

a. Que deba reconocer 3 seguros


b. Que deba reconocer menos de tres seguros
c. Que deba reconocer por lo menos 4 seguros
d. Que no deba reconocer seguros

18. En un proceso de reproducción in vitro de larvas se sabe que el 2% de las


larvas nacen débiles y por tanto mueren. Para un proceso de producción in
vitro de 250 larvas encuentre la probabilidad de que:

a. Más de 2 larvas mueran


b. Entre 5 y 7 (incluidos) larvas mueran
152 CARLOS HERNAN SARAZA NARANJO

c. Menos de 3 larvas mueran


d. Por lo menos 4 larvas mueran

19. Ante la aparición de una bacteria en una producción bovina, se ha comprobado


que el número medio de animales afectados cada 12 horas es 4,5 animales.
Para una hacienda en la que se detecta la aparición de la bacteria determine
las siguientes probabilidades:

a. Que en 12 horas se afectan más de 2 animales


b. Que en 3 horas se afecten menos de 3 animales
c. Que en 5 horas se afecten por lo menos 2 animales
d. Que en 8 horas se afecten más de 5 y menos de 8 animales

DISTRIBUCIÓN NORMAL

20. La altura de una muestra de caballos tienen distribución normal con media
154,5 centímetros y desviación estándar 4,1 centímetros. Determine la
probabilidad de que un caballo tomada al azar tenga altura de:

a. Por lo menos 156,4 cm b. A lo sumo 157,05 cm


c. Entre 152,0 y 155,8 cm d. Por lo menos 150,95 cm

21. Los pesos de una muestra de conejos que se pone a la venta están
distribuidos normalmente con media 3,2 kilogramos y desviación estándar 0,56
libras. Determine la probabilidad de que un cliente que solicita un conejo al
azar obtenga una animal con peso:

a. Mayor que 3,5 kilogramos


b. Menor que 3 kilogramos y mayor que 2,8 kilogramos
c. Mayor que 2,9 kilogramos o menor que 2,45 kilogramos
d. Menor que 3,05 kilogramos o mayor que 4 kilogramos

22.Una intervención quirúrgica que se ha realizado 450 veces tiene un tiempo de


duración que se distribuye normalmente con media de 2,35 horas y desviación
estándar de 0,28 horas. Determine cuántas intervenciones han tenido una
duración:

a. Entre 2,9 y 3,02 horas b. Entre 214 y 241 horas


c. Entre 200 y 220 horas d. Por lo menos 203 horas o a lo sumo 198 horas

23. Una empresa ha realizado el montaje de una máquina automática para


empacar jugos. El montaje ha sido logrado de tal manera que la máquina
empaca bolsas con una cantidad media de 175 cm3 y una desviación estándar
de 3,2 cm3. Si la empresa utiliza 1200 bolsas con capacidad de contener 182
cm3. Determine:
MANUAL DE ESTADÍSTICA 153

a. Cuántas bolsas se derramarán en el proceso de empaque


b. Cuál es la probabilidad de que una bolsa resulte con menos de 172 cm3 de
jugo.
c. En cuántas bolsas se derramarán por lo menos 1,2 cm3 de jugo

24. El tiempo de reproducción de un hongo está distribuido normalmente con


media 14,5 días y desviación estándar 3,1 días, determine:

a. Cuál es la probabilidad de que un hongo tenga un tiempo de reproducción


entre 14,4 y 14,5 días
b. Cuál es la probabilidad de que un hongo tenga un tiempo de reproducción
entre 13,8 días y 16,6 días.
c. Qué porcentaje de hongos tienen un tiempo de reproducción de más de 15,2
días.
d. Si la buena producción del hongo depende de que su reproducción ocurra
antes de 20 días, cuál es la probabilidad de que un hongo no tenga buena
producción.

25. Los ingresos mensuales de 45 empresas están distribuidos normalmente con


media 12,4 millones de pesos y desviación estándar 0,85 millones de pesos.
Determine:

a. Probabilidad de que una empresa tenga ingresos superiores a $15 millones


b. Cuántas empresas tienen ingresos entre 10 millones y 11,5 millones
c. Cuántas empresas tienen ingresos que no superan los 13 millones.
d. Porcentaje de empresas que tienen ingresos de por lo menos 10,9 millones o a lo
sumo 10,5 millones.

26. Las longitudes de una muestra de gatos tienen distribución normal con media
78,64 centímetros y desviación estándar 3,5 centímetros. Determine:

a. Longitud del 37,5% de los gatos más largos


b. Longitud del 87,45% de los gatos más largos
c. Longitud del 62,43% de los gatos más cortos
d. Longitud del 24,32% de los gatos más cortos
154 CARLOS HERNAN SARAZA NARANJO

También podría gustarte