Parcial Domiciliario Bioestadistica
Parcial Domiciliario Bioestadistica
Parcial Domiciliario Bioestadistica
PARCIAL DOMICILIARIO
BIOESTADÍSTICA Curso de verano 2024
Los trabajos son individuales y deberán tener una extensión entre 20 y 30 carillas. Caso
El médico frances Pierre Charles Alexandre Louis, fue uno de los primeros científicos en aplicar
herramientas propias del análisis estadístico sobre la medicina, logrando cuantificar diferentes
datos y variables sobre la tuberculosis, enfermedad muy común en ese entonces. Dicho hecho fue
publicado por el mismo en su obra denominada como “Método numérico”.
Gracias a esto, logró inspirar a varios de sus colegas, los cuales a lo largo de los años fueron
generando sus propias técnicas. Casos como Louis René Villermé y William Farr quienes en
conjunto lograron elaborar los primeros mapas epidemiológicos basados en métodos
cuantitativos de análisis realizados anteriormente.
En 1812, el matemático Pierre Laplace presentó una teoría analítica basada en probabilidades, la
cual ponía énfasis en la importancia del uso de la estadística sobre asuntos médicos.
A mediados del siglo XIX, Florence Nightingale logró aplicar diferentes herramientas estadísticas a
su trabajo de enfermera durante la guerra, tomando como dato el hecho de que las muertes en el
hospital eran mayores a aquellas que se generaban en el frente de batalla.
Luego de un análisis sobre los datos recogidos, llegó a la conclusión de que se trataba de una mala
higiene y medidas poco eficaces.
A lo largo del siglo XIX, el fenómeno de la bioestadística siguió expandiéndose logrando que
muchos científicos, matemáticos, médicos y físicos llevaran a cabo sus análisis.
En el siglo XX, siguieron diversos avances donde, luego de largas epidemias de sarampión William
Heaton Hamer intentó darles una explicación mediante la utilización del método estadístico
denominado como “modelo temporal discreto”.
Ronald Ross intentó determinar una relación entre la cantidad de mosquitos con la incidencia de
la malaria y científicos como Austin Bradford lograron correlacionar al tabaco con el cáncer de
pulmón.
En el año 1946, el British Medical Research Council presentó el primer ensayo clínico basado en la
bioestadística sobre el uso de estreptomicina en tratamientos de tuberculosis pulmonar.
Hoy día, la estadística como disciplina es muy importante a la hora de investigar nuevos posibles
tratamientos.
3. Mencione y describa los tipos de Estadística que conoce.
partir de las estadísticas descriptivas, para luego analizarlas mediante fórmulas que permiten
obtener resoluciones.
Variables cuantitativas: Las variables cuantitativas son aquellas referidas a los números.
➝ Variables cuantitativas discretas: Se basan en números enteros.
➝ Variables cuantitativas continuas: Se basan en números decimales.
Variables cualitativas: Las variables cualitativas son aquellas referidas a diferentes aspectos
característicos, pero no a números.
➝ Variables cualitativas ordinales: Se basan en establecer o seguir un orden.
➝ Variables cualitativas nominales: Se basan en características propias de los individuos u objetos.
Variables dicotómicas: Las variables dicotómicas son aquellas en donde se establecen únicamente dos
respuestas posibles, entre sí/no ante una incógnita.
➝ Variables dicotómicas cuantitativas: Se basan en asignarle a cada respuesta un valor numérico.
➝ Variables dicotómicas cualitativas: Se basan en asignarle a cada respuesta una cualidad.
Una muestra es una porción representativa de la población que se desea estudiar o analizar.
Normalmente, la utilización de la muestra se aplica en poblaciones muy grandes, donde la
recolección de los datos conlleva mucho tiempo y dinero.
6. Esquematiza tipos de muestreo, sus características, ventajas e inconvenientes
➝ Población
➝ Muestra
➝ Muestreo
➝ Parámetro
➝ Variable
➝ Debe captar la atención de los lectores, representando la información que posee de manera
sencilla, clara y precisa.
➝ Debe ser capaz de explicarse por sí sola, comparando los datos de manera que resalten sus
diferencias notablemente.
➝ Se deben detallar; el título del gráfico, el origen, las escalas que se utilizaron y leyendas.
➝ Deben ser fácilmente identificables todas las variables presentadas.
➝ Debe ser una manera de ilustrar y plasmar la información recolectada en el estudio llevado a
cabo.
➝ Las leyendas deben poder ser leídas de izquierda a derecha o de abajo hacia arriba.
➝ No debe presentar más ejes coordenados de los que sean necesarios.
➝ La frecuencia de repetición del dato debe representarse en el eje vertical.
➝ Las divisiones o subdivisiones deberán estar claramente detalladas.
Diagramas areales
➝ Gráfico en barras
➝ Gráfico sectorial
➝ Gráfico de histograma
➝ Gráfico de polígono de frecuencia
Diagramas no areales
La probabilidad clásica es una medida estadística que nos indica la posibilidad de que suceda un
determinado evento en función de todos los posibles sucesos.
Esta rama de la probabilidad es encargada de distribuir equitativamente la probabilidad entre
cada uno de los sucesos que componen el espacio muestral.
Para lograr determinar esas probabilidades, se suele utilizar una fórmula denominada como
“Regla de Laplace” , la cual implica dividir los casos favorables a un suceso entre el número total
de casos posibles, dando como resultado siempre valores entre el 0 y el 1.
La frecuencia de probabilidad determina qué tan posible resulta un evento luego de que se
presenta una cantidad muy elevada de repeticiones del mismo a largo plazo.
Para lograr calcular la frecuencia de probabilidad se determina el cociente entre la cantidad de
casos favorables, la cual tiende a infinito y la cantidad de casos posibles.
12. Señale las diferencias entre experimentos aleatorios y deterministas. Ejemplifique.
Los experimentos aleatorios son aquellos en donde si bien se conocen todos los posibles
resultados que se puedan obtener de antemano, no se tiene certeza de cuál de todos será el
correcto o indicado hasta que se lleve a cabo el experimento.
Por ejemplo: Se presenta un paciente con signos compatibles con tres diferentes patologías, si
bien se sabe cuales son los posibles resultados, no se sabrá sino hasta que se lleven a cabo
diversos estudios.
Los experimentos determinísticos son aquellos en donde, si se realizan en las mismas condiciones,
siempre se obtendrá el mismo resultado.
Por ejemplo: Si una persona corre durante 10 minutos, su frecuencia cardiaca se elevará.
Un suceso es cualquier tipo de subconjunto dentro del espacio muestral, es decir, cualquier tipo
de evento que ocurre dentro de un grupo determinado.
➝ Suceso elemental
➝ Suceso compuesto
➝ Suceso seguro
➝ Suceso imposible
➝ Suceso compatible
➝ Suceso incompatible
➝ Suceso dependiente
➝ Suceso independiente
➝ Suceso contrario
Las medidas de posición central son herramientas estadísticas que permiten obtener diferentes
valores a partir de una serie de datos numéricos , sean agrupados o no.
➝ Media aritmética: La media aritmética representa el valor promedio de todos los datos
obtenidos.
Se calcula mediante una fórmula, la cual varía dependiendo si se trata de datos agrupados o
no.
➝ Datos no agrupados:
Por ejemplo:
➝ Datos agrupados:
Por ejemplo:
Intervalos M fi
[ 60 - 70 ) 65 28
[ 70 - 80 ) 75 21
[ 80 - 90 ) 85 19
[ 90 - 100 ) 95 15
[ 100 - 110 ) 105 7
conjuntos y se debe promediar al valor más alto del primer conjunto con el valor más
bajo del segundo conjunto.
Por ejemplo:
➝ Serie impar: En el caso de trabajar con una serie impar, el dato de en medio se elimina
fórmula:
➝ Modo: El modo representa al valor con mayor frecuencia absoluta dentro de la serie, es decir,
Por ejemplo:
Por ejemplo:
Intervalos M fi
[ 60 - 70 ) 65 28
[ 70 - 80 ) 75 21
[ 80 - 90 ) 85 19
[ 90 - 100 ) 95 15
[ 100 - 110 ) 105 7
Las medidas de dispersión son aquellas que nos permiten determinar el grado de dispersión de
una variable estadística.
Para conocer estos valores, se utilizan diferentes fórmulas que nos demuestran el cambio en una
determinada variable.
➝ Desvío estándar: El desvío estándar es una medida de dispersión que nos determina que tan
alejados se encuentran la totalidad de los datos recolectados con respecto al valor de la media
aritmética.
Por ejemplo:
Se desea saber el valor de desvío estándar de los siguientes datos correspondientes a las
alturas (cm) de alumnos de bioestadística;
156 , 160 , 165 , 171 , 178 , 181
➝ Varianza: La varianza es otra medida de dispersión que nos determina la variación entre los
datos recolectados con respecto a la media aritmética, obteniendo el mismo valor que el
desvío estándar, pero elevado al cuadrado.
Es decir, el desvío estándar es igual a la raíz cuadrada de la varianza.
Por ejemplo:
Se desea saber el valor de la varianza de los siguientes datos correspondientes a las alturas
(cm) de alumnos de bioestadística;
156 , 160 , 165 , 171 , 178 , 181
➝ Rango: El rango es una medida de dispersión que representa la diferencia entre el valor mayor
R = Ls - Li
Por ejemplo:
Se desea saber el valor del rango de los siguientes datos correspondientes a las alturas (cm) de
alumnos de bioestadística;
156 , 160 , 165 , 171 , 178 , 181
Por ejemplo:
Se desea saber el coeficiente de variación de los siguientes datos correspondientes a las alturas
(cm) de alumnos de bioestadística;
156 , 160 , 165 , 171 , 178 , 181
17. ¿Qué entiende por intervalo de clase? Detalle su estructura.
Los intervalos de clase son grupos en donde se reúnen los datos recolectados, donde cada
conjunto de intervalos de clase deberán contener a la misma cantidad de valores numéricos.
➝ Límites de clase: Los límites de clase representan al valor menor y mayor dentro de un
intervalo de clase.
➝ Límite inferior
➝ Límite superior
intervalo de clase.
➝ Rango: El rango determina la dispersión entre el valor superior e inferior de la totalidad de los
intervalos.
La distribución normal de datos es un tipo de gráfico donde se presenta un patrón respecto del
orden de los valores numéricos, obteniendo una distribución simétrica alrededor del valor central,
es decir, alrededor del valor de la media aritmética.
Esto determina que a medida de que los valores se alejan de la media, se vuelven menos
probables.
19. Mencione la relación entre un área determinada bajo la curva y su respectivo porcentaje de
datos.
El área bajo la curva obtenida en un gráfico representa el 100% de los datos. En su parte mayor
podemos observar al valor de la media, y cómo a medida que los datos se alejan de ese valor,
disminuye su porcentaje de probabilidad.
Al seleccionar una determinada área de la curva, se selecciona a su vez, un determinado
porcentaje de datos.
20. Explique las pruebas de significación (Z y T).
Las pruebas de significación son una serie de procedimientos establecidos que nos permiten
determinar si una hipótesis se acepta o se rechaza. Para realizarlas, se trabaja con muestras de la
población tomadas con anterioridad de manera correcta.
Los pasos a seguir son los mismos para las diferentes pruebas, variando las fórmulas utilizadas;
1. Planteo de la pregunta
2. Determinar la hipótesis
➝ Hipótesis nula (H0)
➝ Hipótesis alternativa (Ha)
3. Determinar la significación
4. Conocer el valor p
5. Aceptar o rechazar la hipótesis nula
6. Conclusión
➝ Prueba de significación Z (test Z): La prueba de significación Z se utiliza para comparar a dos
pareados se utiliza para un solo grupo, comparando los valores antes y después de generar
algo en ellos, utilizando los valores de distribución T.
Se toma como grado de significación a los valores de 0,05 - 0,01 y 0,001 normalmente.
Entonces, una vez ubicado el valor calculado dentro del gráfico se establece su valor de p con su
grado de significación.
p<0,05%: Determina que hay un 0,05 (5%) de probabilidades de que el valor pertenezca a los
valores normales.
p<0,01%: Determina que hay un 0,01 (1%) de probabilidades de que el valor pertenezca a los
valores normales.
p<0,001%: Determina que hay un 0,001 (0,1%) de probabilidades de que el valor pertenezca a
los valores normales.
22. Defina contraste ó hipótesis estadística y mencione sus tipos.
La hipótesis estadística es una suposición que se establece sobre las características de una
determinada población. Dicha hipótesis luego se logra aceptar o rechazar mediante el análisis
estadístico.
➝ Hipótesis causales
➝ Hipótesis correlacional
➝ Hipótesis de diferencia de grupos
➝ Hipótesis descriptivas
La región crítica hace referencia a aquella área que nos determina el rechazo de una hipótesis nula
por estar por fuera de los valores normales.
La región de aceptación hace referencia a aquella área que nos determina la aceptación de una
hipótesis nula por estar dentro de los valores normales.
24. Explique y esquematice test unilaterales de una cola y test bilaterales de dos colas.
Los test unilaterales de una cola son aquellos en donde la hipótesis que se desea aceptar o
rechazar nos establece una única área crítica, sea a la izquierda o derecha del gráfico.
Por ejemplo: ¿El fármaco experimental causa un aumento en las pulsaciones por minuto?
Los test bilaterales de dos colas son aquellos en donde la hipótesis que se desea aceptar o
rechazar nos establece dos áreas críticas, una a la izquierda y otra a la derecha del gráfico.
Por ejemplo: ¿El fármaco experimental causa cambios en las pulsaciones por minuto?
25. Describa el concepto de error, los tipos de errores y relaciónelo con aceptación o rechazo de
hipótesis.
El error se considera como la diferencia entre el valor calculado obtenido y el valor real de una
medida.
➝ Error tipo I: El error de tipo I se da cuando una hipótesis nula es rechazada, pero realmente es
verdadera.
➝ Error tipo II: El error de tipo II se da cuando una hipótesis nula es aceptada, pero realmente es
falsa.
PROBLEMAS
1. Clasificar las variables en numéricas y no numéricas (discretas y continuas):
Número de Número de
micciones personas
0 0
1 1
2 5
3 62
4 23
5 4
6 0
7 4
8 1
4. Según la distribución de la siguiente tabla;
a. Completar con los valores de frecuencia absoluta acumulada y Total de N.
b. Calcular todos los cuartiles
c. Calcular todos los deciles
d. Calcular el percentil 37 y 68
e. Realizar un histograma y un polígono de frecuencias
Intervalos fi Fi
[ 50 - 60 ) 18 18
[ 60 - 70 ) 20 38
[ 70 - 80 ) 26 64
[ 80 - 90 ) 24 88
[ 90 - 100 ) 20 108
[ 100 - 110 ) 15 123
[ 110 - 120) 12 135
Totales 135
5. Hallar la varianza y la desviación típica de la siguiente serie de números:
2 - 3 - 4 - 7 - 9 - 11 - 12 - 13
6. Según una encuesta realizada a 500 alumnos de Bioimágenes de facultad de medicina UBA,
ellos se trasladan a esta institución en distintos medios de transporte, que se detallan a
continuación:
200 alumnos viajan en subte, 150 lo hacen mediante colectivos, 30 se trasladan en taxi, 100
alumnos utilizan bicicleta y el resto a pie.
Establezca una tabla de frecuencias y realice un diagrama sectorial (circular)
xi fi Fi ni Ni ni%
200 alumnos 200 200 0,4 0,4 40%
150 alumnos 150 350 0,3 0,7 30%
30 alumnos 30 380 0,06 0,76 6%
100 alumnos 100 480 0,2 0,96 20%
20 alumnos 20 500 0,04 1 4%
7. Se dispone de una muestra de 14 niños de 5 años a los que se les ha medido la longitud de la
tibia, obteniendo los siguientes valores (en cm):
21.7 - 28.2 - 26.8 - 26.5 - 30.5 - 28.4 - 25.9 - 28.8 - 28.5 - 30.9 - 30.8 - 26.7 - 30.6 - 27.9
a. Calcular la media aritmética y la desviación típica
b. Calcular el cuartil 1, el decil 8, el percentil 25 y el percentil 75 de estos datos
Valores de menor a mayor
21,7 - 25,8 - 25,9 - 26,5 - 26,7 - 26,8 - 27,9 - 28,2 - 28,4 - 28,8 - 30,5 - 30,6 - 30,8 - 30,9
8. Los datos que se dan a continuación corresponden a la concentración de glucosa en
gramos/litro encontrada en muestras de diabéticos en un grupo de 42 varones.
a.
10. Un proyecto de investigación pretende, entre sus objetivos, poder estimar el nivel medio
de hematocrito en hombres nadadores profesionales.
Con este fin se ha recogido una muestra de 11 sujetos de esta población obteniendo para ello, los
siguientes valores de hematocrito:
46.5 - 48.9 - 43.6 - 48.8 - 49.5 - 42.8 - 45.9 - 47.2 - 46.9 - 44.4 - 47.7
a. Indica cuál es la población en estudio, cuál es la variable en estudio y el tipo de la misma.
b. Calcula un intervalo de confianza al 99 % para la media de la variable en la población.
c. Los investigadores que han realizado un estudio previo afirman que el valor medio de
hematocrito en este tipo de profesionales es superior a 44, ¿el intervalo que has obtenido en el
apartado anterior confirma este resultado o no?
d. Calcula el percentil 77 de los datos de la muestra
a.
11) Los siguientes valores son las concentraciones de bilirrubina en suero de una muestra de 10
pacientes admitidos a un hospital para el tratamiento de la hepatitis:
20,5 - 14,8 - 21,3 - 12,7 - 15,2 - 26,6 - 23,4 - 22,9 - 15,7 - 19,2
Con estos valores construye un intervalo de confianza al 95 % para la concentración media de
bilirrubina en suero de este tipo de pacientes
3. Si de 4000 pacientes las causas de muerte son: Gastroenteritis 800; Cáncer 200; Enfermedades
Cardíacas 400; Tuberculosis 200; Otras enfermedades el resto:
a. La probabilidad de padecer Tuberculosis se calcula como el número de casos favorables
sobre posibles
b. otras enfermedades representan entre el 45% y el 55%
c. Gastroenteritis, Cáncer, Enfermedades Cardíacas y Tuberculosis representan menos del
50%
d. los que fallecieron por Gastroenteritis representan el 40% y se representan en un
diagrama sectorial con un sector de 72º
8. Si la capacidad vital de 100 jóvenes es x ± 0.5 litros, con una variación del 12.5 %. El intervalo de
confianza de la muestra es:
a. 3.5 – 4.5 litros
b. 3.95 – 4.05 litros
c. 3.9 – 4.1 litros
d. 3 – 5 litros