Problemas Clasificados Segundo Parc
Problemas Clasificados Segundo Parc
Problemas Clasificados Segundo Parc
Cátedra de Bioestadı́stica
Facultad de Medicina
Problemas
de
Bioestadı́stica
Inferencia Estadı́stica
Análisis de una Muestra
1. En una determinada comunidad hay unos hábitos alimenticios generales basados en una dieta hipercalórica.
Se piensa que este puede ser un factor que produzca un incremento de la presión sanguı́nea en los individuos
de la comunidad, respecto a la media regional. Estudios previos han determinado que la presión sanguı́nea
sistólica se distribuye de manera normal, y que en la región su nivel medio es de 140 mmHg y σ = 20 mmHg.
Con objeto de determinar los valores de la presión sistólica en esa comunidad se tomó una muestra de 25
individuos, para los cuales se obtuvo x̄ = 146 mmHg. Si suponemos que en nuestra comunidad la dispersión
de la presión sistólica es la misma que en la región:
(a) Da una estimación del nivel medio de la presión sistólica en esa comunidad. ¿Qué error cometemos al
hacer dicha estimación?
(b) ¿Qué tamaño de muestra debemos tomar para poder estimar la presión sistólica media de la comunidad
con un error máximo de 4 mmHg, para un nivel de confianza del 95%?
(Solución: a) x̄ = 146; Error máximo= 7.84 (1 − α = 0.95). b) n=97).
2. Estima puntualmente y mediante un intervalo de confianza, la cantidad media de gastrina, en mujeres
gestantes, entre 15 y 25 semanas de gestación, mediante los datos siguientes:
39 49 35 39 34 21 49 40 35 38
Consideraremos que los valores de gastrina se distribuyen normalmente. Utiliza un nivel de confianza del
95%.
Sabemos que para un nivel de confianza fijo, mientras más estrecho es el intervalo, más deseable es. ¿Qué
podrı́amos hacer para obtener, en nuestro problema, una reducción de la anchura del intervalo?
(Solución: x̄ = 37.9; (32.2029, 43.5971))
3. Un dermatólogo investiga cierto tipo de afección de piel induciéndolo en una muestra aleatoria de 25 ratas y
tratándolas luego con un nuevo fármaco. Se cuenta el número de horas hasta que desaparece dicha afección,
con los resultados siguientes:
Supondremos que el número de horas hasta que desaparece la afección se distribuye normalmente.
(a) Estima el número medio de horas que tarda en desaparecer la afección dermatológica con el nuevo
fármaco. ¿Cuál es el error máximo de esta estimación? Utiliza un nivel de confianza del 95%.
(b) Si repetimos este experimento exactamente en las mismas condiciones, la longitud del intervalo que
obtendrı́amos, ¿serı́a la misma?. Razona la respuesta.
(c) Supongamos ahora que σ = 32 horas. Calcula un intervalo de confianza al 90% para el número medio
de horas que tarda en desaparecer la afección dermatológica. En estas condiciones, ¿qué tamaño de
muestra se necesitarı́a para tener el 90% de confianza de que la media se estima dentro de ±5 horas?
2
(a) Calcula un intervalo de confianza para la estatura media de la población, en el caso de la muestra de
tamaño 16, para una confianza del 95%.
(b) Ídem para la muestra de tamaño 400.
(c) Si nos preguntasen acerca de la estatura media de la población, ¿cuál de las dos experiencias elegirı́amos
para responder?. Razona la respuesta.
5. En un estudio sobre la talla de niños menores de 4 meses se obtuvo, a partir de una muestra de 200 niños,
que la talla media en la población considerada está entre 63.2cm y 69.6cm, con un nivel de confianza del
95%. Por otro lado, sólo a 120 niños se les midió una cierta variable bioquı́mica, obteniéndose a partir de
dicha muestra, que el valor medio de dicha variable está entre 320mg/l y 336mg/l con un nivel de confianza
del 99%.
(a) Da una estimación puntual del valor medio y de la varianza, tanto de la talla como de la variable
bioquı́mica, para los niños de la población.
6. Los valores de LH, obtenidos en una muestra aleatoria, de mujeres en estado de gestación son los siguientes:
162 222 245 195 204 240 157 164 183 192 179 191 192 171 146 147 131
248 176 207
(Los valores están expresados en mlU/ml y están redondeados). Suponiendo que los valores de LH se
distribuyen normalmente, obtén un intervalo que contenga, con una gran confianza, el 95% de los valores de
LH de mujeres gestantes. Interpreta el resultado obtenido.
(Solución: (82.64,292.56) al 99%).
7. Un cardiólogo se encuentra interesado en encontrar lı́mites de normalidad al 95%, con una confianza del
99%, para la presión sistólica tras un fuerte ejercicio fı́sico. Obtén tales lı́mites si en 50 individuos se obtuvo
190 ± 3 (error estándar). Supondremos que la presión sistólica se distribuye normalmente.
(Solución: (135.4,244.6)).
8. Los datos de la tabla adjunta corresponden al peso total del corazón en un grupo de 10 hombres normales
y 11 con enfermedad de corazón (valores tomados en autopsias realizadas en un determinado hospital).
Suponiendo normalidad de la variable, construye un intervalo de confianza, para un nivel de confianza del
99%, para la varianza del peso total del corazón de hombres con la enfermedad. Ídem para hombres normales.
Enfermos 450 760 325 495 285 450 460 375 310 615 425
Normales 245 350 340 300 310 270 300 360 405 290
9. Se pretende conocer la influencia de un tratamiento con metil-dopa sobre pacientes hipertensos. Para ello se
toman 10 pacientes hipertensos a los que se les mide la presión sanguı́nea. Posteriormente se les administra
el tratamiento y se les vuelve a medir la presión una semana después. Los datos de la presión sanguı́nea
antes y después de la administración del tratamiento están en la siguiente tabla:
Antes 200 194 236 163 240 225 203 180 177 240
Después 188 212 186 150 200 222 190 154 180 225
3
Para probar la efectividad del fármaco, queremos medir la diferencia, D, entre la presión sanguı́nea inicial
y final para cada persona. Supongamos que D está normalmente distribuida con media µD y varianza σD 2,
ambas desconocidas
2.
(a) Estima puntualmente y mediante un intervalo de confianza µD y σD
(b) ¿Qué opinión tienes de la efectividad de la metil-dopa a partir de los resultados obtenidos para estos
10 pacientes hipertensos?
10. En una prueba sobre la leucemia en ratones AKR, se toma una muestra testigo de 56 ratones, (ratones sin
ningún tratamiento), de los cuales aparecieron 45 leucémicos.
11. En un muestreo llevado a cabo en una amplia región se tomaron 125 individuos, al azar, de los cuales 30
padecieron afecciones pulmonares.
12. Ha sido realizado (Journal of Clinical Epidemiology, (1988) 41(6), 531-541) un estudio caso-control sobre la
efectividad del Test de Pap en la prevención del cáncer cervical (por identificación de lesiones precancerosas).
Se obtuvo que un 28.1% de 153 casos de cáncer cervical y un 7.2% de 153 controles nunca se habı́an realizado
un Test de Pap previo al diagnóstico del caso.
(a) Obtén un intervalo de confianza, al 95%, para el porcentaje de casos de cáncer cervical que nunca se
han realizado un Test de Pap.
(b) Ídem para los controles.
(c) ¿Piensas que el Test de Pap es útil para prevenir el cáncer cervical?
13. Datos procedentes del registro general de enfermos con cáncer de pulmón indican que para aquellas locali-
zaciones del tumor en las que la cirugı́a es la terapia adecuada, un 40% de los individuos sobrevive 3 años
después del diagnóstico y un 33% sobreviven durante 5 años. Supongamos que a un grupo de pacientes que
deberı́an haber recibido el tratamiento quirúrgico habitual se les asigna un nuevo tipo de cirugı́a. De 100
de tales pacientes, 55 sobrevivieron durante 3 años y 45 sobrevivieron durante 5 años. ¿Indica esto que la
nueva forma de cirugı́a es mejor en algún sentido que la forma habitual?
(Solución: Sı́).
14. La ingestión de calorı́as por persona y por dı́a en una determinada región es de 2900 calorı́as. En una región
vecina, se efectuó un muestreo para estudiar el consumo medio de calorı́as. Se eligieron aleatoriamente 50
personas y los resultados fueron de un consumo medio de 3000 calorı́as por persona y por dı́a, con una
desviación tı́pica muestral de 100 calorı́as. Suponiendo que la distribución del consumo de calorı́as en esa
región es normal, contesta las siguientes preguntas:
4
(a) ¿Podemos admitir, con un nivel de significación del 5%, que las dos regiones tienen diferente consumo
medio de calorı́as por persona y por dı́a?.
(b) Si la muestra hubiese sido de tamaño 27, ¿a qué conclusiones llegarı́amos? Calcula las probabilidades
de significación en ambos casos.
(Solución: a) Sı́, texp =7.07, p < 10−3 ; b) Sı́, texp =5.20, p < 10−3 ).
15. Un laboratorio ha obtenido una sustancia que en cierto modo alivia determinadas afecciones cutáneas. Dicho
laboratorio afirma, según sus experiencias, que dicha sustancia causa alivio, en los pacientes tratados, por
espacio de 10 horas por término medio. Se ha elegido una muestra de 120 individuos afectados por esta
dolencia, se les trató con dicha sustancia y se contabilizó el tiempo de alivio en los pacientes. Los resultados
fueron un tiempo medio de 9.6 horas, con una desviación tı́pica de 1.2 horas.
(a) ¿Podemos desmentir la afirmación del laboratorio con un nivel de significación del 5%? Calcula el valor
de p.
(b) Como máximo, ¿en cuánto podemos estimar el tiempo medio de alivio que produce esa sustancia?
(Solución: a) Sı́, texp =-3.65; p < 0.001. b) (−∞, 9.78) con una confianza del 95%).
16. Se observaron 12 mujeres primı́paras y se obtuvieron los tiempos en minutos de la duración del parto:
353 496 568 422 410 380 463 430 310 518 446 368
(Solución: a) p > 0.2. b) texp =3.309; p < 0.01. c) al 95%, entre 24 y 117 minutos más).
17. Una nueva carta ocular (la carta de Ferris) ha sido utilizada para medir la agudeza visual en varios estudios
de investigación. Para un mismo individuo se utilizan cartas diferentes sobre el ojo derecho e izquierdo. Una
medida de la agudeza visual es el número de letras leı́das correctamente. Una medida de variabilidad es el
número de letras leı́das correctamente con el ojo izquierdo - el número de letras leı́das correctamente con
el ojo derecho. Para que la nueva carta sea considerada mejor que la utilizada habitualmente (la carta de
Snellen)-donde la misma carta se utilizaba para cada ojo-, la variabilidad debe ser mayor en la nueva que en
la habitual. Sea Xi =número de letras leı́das correctamente con el ojo izquierdo - el número de letras leı́das
correctamente con el ojo derecho por el individuo i-ésimo. Suponemos que Xi sigue distribución normal
con varianza σ 2 . Para la carta de Snellen es conocido que σ = 1.5. Tomamos datos sobre 20 individuos
utilizando la nueva carta y obtenemos que s = 2. ¿Es significativamente mayor la variabilidad con la carta
de Ferris?
(Solución: X 2 = 33.78; 0.01 < p < 0.025).
18. En un estudio sobre sanidad dental se hace la hipótesis de que el 90% de niños menores de 4 años no muestran
indicios de caries dental. Se tomaron 100 niños, menores de 4 años, de los cuales el 82% no dio tales indicios.
En base a estos resultados , ¿serı́a aceptable el hipotético valor del 90%?.
(Solución: No, zexp =-2.67; 0.001 < p < 0.01).
19. Se ha comprobado que el porcentaje de curaciones espontáneas de cierta enfermedad es del 40%. Un
laboratorio ha obtenido un antibiótico y asegura que es eficaz sobre dicha enfermedad. Para comprobarlo
se tomó una muestra de 100 personas, a las que se les inyectó este antibiótico. El porcentaje de personas
curadas fue del 55%. ¿Podemos creer, con un nivel del significación del 5%, la afirmación del laboratorio?
(Solución: Sı́, zexp =3.06).
5
20. El 70% de los pacientes internados en un hospital traumatológico requieren intervención quirúrgica. A 30 de
estos pacientes se les aplica un nuevo método de fisioterapia y 17 de ellos requieren intervención quirúrgica.
¿Es eficaz la fisioterapia?
(Solución: zexp = −1.59, 0.055 < p < 0.06).
6
Inferencia Estadı́stica
Análisis de dos Muestras
1. Se dispone de dos procedimientos A y B para la detección de glucosa en la sangre. Para ver cuál de ellos es
más preciso, se ha efectuado 10 mediciones con A y 11 con B, de la misma muestra de sangre, obteniéndose
las estimaciones siguientes:
s2A = 3.333 s2B = 3.818.
¿Podemos afirmar que ambos métodos no son igualmente precisos?.
(Solución: p > 0.2).
(a) ¿Es posible afirmar, con un nivel de significación del 5%, que existe diferencia significativa en la dismi-
nución de la glucemia según se aplique una dosis alta o baja de insulina?
(b) ¿En cuánto podemos estimar dicha diferencia?
(c) Ídem para un nivel de significación del 1%.
3. Una muestra de 61 alumnos de una universidad A dieron una estatura media de 1.80m con una desviación
tı́pica de 0.08m. Una muestra de 41 alumnos de otra universidad, B, dieron una estatura media de 1.76m. y
una desviación tı́pica de 0.1m. Si suponemos que las poblaciones de las alturas se distribuyen normalmente,
contesta las siguientes preguntas:
(a) ¿Podemos afirmar, con un nivel de error el 5%, que los alumnos de ambas universidades difieren en
estatura media? Calcula la probabilidad de significación.
(b) ¿En cuánto podemos valorar dicha diferencia?
(Solución: a) Sı́).
4. Se da a continuación la dosis de colesterol sérico en mg/l, de dos grupos de individuos hiperlipidémicos, bajo
el efecto de un placebo y después de un tratamiento que reduce el colesterol:
(a) Probar si existe diferencia significativa entre las dosis medias de colesterol sérico en ambas poblaciones,
suponiendo normalidad de ambas variables.
7
(Unidades=minutos). Si suponemos que las variables se distribuyen normalmente, realiza el contraste ade-
cuado, calculando la probabilidad de significación.
(Solución: p > 0.1).
7. Se ha estudiado el tiempo de reacción ante un estı́mulo auditivo bajo dos situaciones o condiciones radi-
calmente diferentes F y Q. Para ello se ha elegido una muestra aleatoria de 9 niños, los cuales han sido
estimulados, en primer lugar, bajo la situación F y pasado un tiempo prudencial de reposo, son nuevamente
estimulados bajo Q. Los tiempos de reacción, en centésimas de segundo, aparecen en la siguiente tabla:
niño 1 2 3 4 5 6 7 8 9
sist. F 14 12 9 13 15 17 13 12 13
sist. Q 17 14 13 15 16 16 16 15 13
(a) Suponiendo que la diferencia de los tiempos de reacción se distribuye normalmente, ¿puede afirmarse
que el tiempo de reacción medio difiere de la situación F a la Q, si admitimos un nivel de error del 1%?
8. Se quiere probar si los efectos hipnóticos de un nuevo fármaco M, son mejores que los del fármaco usado
habitualmente L. Para ello se eligieron 10 personas, de forma aleatoria, a las que primeramente se les
administró L y se les anotó el tiempo, en horas, de sueño. Pasado un tiempo prudencial se les administró
M, obteniéndose del mismo modo, el tiempo, en horas, de sueño. Los resultados fueron los siguientes:
Persona 1 2 3 4 5 6 7 8 9 10
L 7 6 8 9 6.5 8 8.5 8 9.5 8
M 9 8 10 8.5 9 7 9 8.5 9.5 7.5
(a) Suponiendo normalidad, ¿puede afirmarse que el nuevo fármaco es mejor que el habitual, si admitimos
un nivel de error del 1%?
Ratas 1 2 3 4 5 6 7 8 9 10 11
Antes 126 120 124 122 130 129 114 116 119 112 118
Después 119 116 117 122 127 122 110 120 112 110 111
(a) ¿Hay un descenso significativo de la presión sanguı́nea sistólica tras la ingestión de etanol?
(b) Valora tal descenso.
(Solución: a) texp = 3.679; p < 0.01. b) Desciende entre 1.58 y 6.42 al 95%).
8
10. Se realizó un test oral de glucosa a dos muestras de pacientes sanos, una de jóvenes y otra de mayores. El
test consistió en anotar el nivel de glucosa en sangre en el momento de la ingestión de 100g de glucosa y
tras 60 minutos de la misma. Los resultados aparecen en la tabla adjunta. Si suponemos normalidad de la
variable nivel de glucosa, contesta las siguientes preguntas:
(a) ¿Hay un aumento de glucosa en sangre en los jóvenes de los 0 a los 60 minutos?, ¿y en los mayores?
(b) ¿Son iguales los niveles basales en ambos grupos?
(c) ¿El incremento en los jóvenes es inferior al de los mayores?
(d) ¿Los niveles a los 60 minutos son superiores en los mayores?
(e) ¿Cuál de las preguntas anteriores obedece a la idea común de que la tolerancia a la glucosa en sujetos
sanos tiende a decrecer con la edad?
(f) ¿Cuánto vale el aumento medio en los jóvenes?
Jóvenes 0’ 81 89 80 75 74 97 76 89
60’ 136 140 149 151 138 154 141 155
Mayores 0’ 98 94 93 88 79 90 86 89 81 90 86 80
60’ 196 190 191 189 159 185 182 190 170 197 163 187
(Solución: a) texp = 21.870; p < 0.001 para jóvenes. texp = 35.328; p < 0.001 para mayores. b) texp =1.665.
c) texp = 8.011, p < 0.001. d) texp = 7.603, p < 0.001. f) (56.075,69.675) al 95%).
11. Los porcentajes de curación de dos tipos de cáncer de piel A y B han sido del 85% sobre una muestra de 400
cancerosos A y de 225 curaciones sobre una muestra de 300 cancerosos B. ¿Existe diferencia significativa en
las proporciones de curaciones de estos tipos de cáncer?. Si es afirmativa la respuesta, ¿es posible estimar
dicha diferencia?
(Solución: a) texp = 3.32. p < 0.001. (0.04,0.16) al 95%).
12. Se piensa que la presencia del antı́geno AG-4 está relacionado con un desenlace favorable en el tratamiento
de pacientes con carcinoma de cuello uterino. De 21 mujeres ya fallecidas por tal causa, 6 presentaban el
antı́geno; de 42 mujeres que reaccionaron bien al tratamiento, 28 presentaron el antı́geno.
13. De un grupo de 100 enfermos de apendicitis crónica, 40 poseen una fórmula sanguı́nea de leucocitosis.
En otro hospital se hace una misma revisión de 300 enfermos con el mismo diagnóstico y 110 de ellos
presentan leucocitosis. ¿Es significativa la diferencia de porcentaje de enfermos con leucocitosis? Calcula la
probabilidad de significación.
(Solución: texp = 0.5963. p > 0.1).
14. Se sospecha que añadiendo al tratamiento habitual para la curación de una determinada enfermedad, un
medicamento A, se consigue mayor número de curaciones. Tomamos dos grupos de enfermos de 100 indi-
viduos cada uno. Al primero se le suministra el medicamento A y se curan 60, mientras que al otro grupo
no se le administra y se curan 55. ¿Podemos decir que es beneficioso el uso del medicamento A, para la
9
curación de la enfermedad, para un nivel de significación del 5%? ¿Cómo queda la respuesta a la pregunta
anterior reflejado en el intervalo de confianza para la diferencia de proporciones?
(Solución: No. (-0.09,0.19) al 95%).
15. Se tienen dos medicamentos, A y B, que curan una misma enfermedad. Aplicados a dos muestras de enfermos
se obtienen los siguientes resultados:
curados no curados
A 72 17
B 64 23
(a) ¿Actúan de forma diferente los medicamentos A y B sobre dicha enfermedad? Calcula la probabilidad
de significación.
(b) Supongamos que son igualmente efectivos, obtén un intervalo de confianza, al 10%, de la proporción
común de curados. ¿Tiene sentido?
16. Se quiere comprobar la efectividad de una vacuna contra una determinada enfermedad. Para ello se sumi-
nistra la vacuna a 100 animales y se les comparó con un grupo testigo de otros 100, de modo que a los 200 se
les contagió la enfermedad. Entre los vacunados murieron sólo 8 como resultado de la enfermedad, mientras
que del grupo testigo murieron 20. ¿Podemos decir, con un nivel de significación del 5%, que la vacuna es
eficaz para reducir la mortalidad?
(Solución: a) texp = −2.45. Sı́).
17. Un investigador médico está interesado en probar si una determinada enfermedad inducida en animales de
laboratorio, produce un número de muertes mayores en animales adultos que en los jóvenes. Para ello toma
una muestra de 200 jóvenes y al cabo de un mes se mueren 58. Igualmente, toma 150 animales adultos,
muriendo en el mismo periodo 36. ¿Está fundamentada su sospecha, a un nivel del 5%?
(Solución: texp = 1. No).
18. Durante mucho tiempo se ha afirmado que en los nacimientos gemelares el segundo nacido tiene una mayor
probabilidad de sufrir determinados problemas respiratorios que el primero. ¿Es aceptable la hipótesis si, de
221 nacimientos gemelares, en 24 casos ambos niños presentaron los problemas, en 158 ninguno los presentó,
en 8 los presentó el primero pero no el segundo y al revés en los 31 restantes?. Cuantifica el incremento de
la probabilidad. (Arnold et al.(1987) The New England Journal of Medicine, 317(18), 1121-1125).
(Solución: texp = 3.683, p < 0.01. (5.04%,15.77%) al 95%).
19. En los pacientes terminales de cáncer son muy importante los cuidados administrados tendentes a paliar
el sufrimiento por causa de su enfermedad. A 80 de tales pacientes se les somete a dos tipos de cuidado
alternativamente, mostrándose aliviados 24 de ellos con ambos, 24 con ninguno, 28 con el primero pero no
con el segundo y 4 con el segundo pero no con el primero. ¿Hay razones para preferir un tipo de cuidados
al otro?.
(Solución: texp = 4.24; p < 0.01).
20. En un estudio sobre el efecto de un fármaco A en la prevención de nacimientos prematuros, se contó con
500 pares de mujeres embarazadas, emparejadas de tal manera que el peso de las dos mujeres de un par
se diferenciase, a lo sumo, en 500g. A una de las mujeres se le administró un placebo, mientras que al
otro miembro del par se le administró el fármaco A. En 30 de estos pares ambas mujeres tuvieron un niño
prematuro. En 420 pares, ambas tuvieron niños normales. En 35 pares, la mujer que tomó el fármaco A
tuvo un niño normal y la que tomó el placebo, uno prematuro. Y, por último, en 15 pares, la mujer que
10
tomó el fármaco tuvo un niño prematuro y la que no lo tomó, uno normal. ¿Qué podemos decir del efecto
del fármaco A?
(Solución: texp = 2.83; p < 0.005).
11
Inferencia Estadı́stica
Análisis de varias Muestras
1. El enrojecimiento cloropropamida / alcohol es un enrojecimiento facial experimentado por los pacientes
diabéticos tratados con cloropropamida después del consumo de alcohol. Se realiza un experimento para
estudiar la capacidad de la indometacina para bloquear esta reacción. Participaron en el estudio tres tipos
de diabéticos: I, diabéticos sin complicaciones; II, diabéticos con retinopatı́a severa, y III, diabéticos con
enfermedades de los grandes vasos. Al principio del experimento se toma la temperatura facial de cada
paciente y se le suministran después 250mg de cloropropamida. Después de 12 horas, se le dan al paciente
40ml de jerez y se anota la temperatura facial. Se repite el experimento con cada paciente que recibe
100mg de indometacina setenta y cinco minutos antes de tomar el jerez. Nuevamente se anota el cambio
en la temperatura facial. Se obtuvieron las siguientes observaciones para la diferencia de temperaturas
(temperatura después que se utilizó la indometacina menos temperatura antes de que se tomara):
Suponiendo normalidad de las variables e igualdad de varianzas, ¿podemos afirmar que existen diferencias
en la variación de temperatura entre los tres grupos de diabéticos? Interpreta el resultado.
(Solución: Fexp = 11.815, p < 0.001).
2. Para evaluar la influencia del tipo de acidosis del recién nacido en los niveles de glucemia medidos en el
cordón umbilical del mismo, se obtuvieron los datos de la siguiente tabla:
Controles 51 56 58 60 62 63 65 68 72 73
Acidosis Respiratoria 60 65 66 68 68 69 73 75 78 80
Acidosis Metabólica 69 73 74 78 79 79 82 85 87 88
Acidosis Mixta 70 75 76 77 79 80 82 86 88 89
3. En 1985 (Kopelman, H. et al. New England Journal of Medicine, 312(6), 329-334) se llevó a cabo un
estudio sobre la concentración de proteina de las secreciones duodenales de pacientes con fibrosis quı́stica.
La siguiente tabla proporciona datos relacionando la concentración de proteina (en mg/ml) con la función
pancreática medida por la secreción de tripsina (en u/(Kg/hr))
Secreción de tripsina
≤ 50 51-1000 > 1000
Individuo Proteina Individuo Proteina Individuo Proteina
1 1.7 1 1.4 1 2.9
2 2.0 2 2.4 2 3.8
3 2.0 3 2.4 3 4.4
4 2.2 4 3.3 4 4.7
5 4.0 5 4.4 5 5.0
6 4.0 6 4.7 6 5.6
7 5.0 7 6.7 7 7.4
8 6.7 8 7.6 8 9.4
9 7.8 9 9.5 9 10.3
10 11.7
12
Suponiendo normalidad de las variables e igualdad de varianzas, ¿a qué conclusiones podemos llegar?.
(Solución: Fexp = 1.265, p > 0.1)
4. Para determinar el efecto de la hemodiálisis sobre el tamaño del hı́gado, se estudian tres poblaciones:
controles normales, pacientes urémicos no dializados y pacientes dializados. Con una muestra aleatoria de
cada población se mide la superficie de hı́gado (cm2 ), obteniendo:
Contrasta la hipótesis nula de que no existe diferencia en el tamaño del hı́gado entre las tres poblaciones,
asumiendo normalidad e igualdad de varianzas. Calcula el valor de p.
(Solución: Fexp = 14.28. p < 0.001).
5. El control del estrés es uno de los factores que más influyen en los resultados de los deportistas de élite, pero
su nivel no es el mismo en los distintos deportes (aún cuando se trate de competiciones del máximo nivel).
Para comprobar esto, se tomaron atletas de tres deportes (fútbol, atletismo y natación) en los que se anotó
su nivel de estrés (muy fuerte, fuerte, moderado y leve). Los resultados se dan en la siguiente tabla:
¿Tenemos razones para pensar que el grado de estrés no es el mismo para cada uno de estos tres deportes?
(Solución: Sı́, χ2 = 104.46, p < 0.001).
6. Ante la sospecha de que el hábito de fumar de una embarazada puede influir en el peso de su hijo al nacer, se
tomaron dos muestras, una de fumadoras y otra de no fumadoras, y se clasificó a sus hijos en tres categorı́as
en función de su peso (menor del percentil 10, entre el percentil 10 y 90 y mayor del percentil 10). Los datos
aparecen en la tabla siguiente:
13
7. De cada uno de los 6 distritos de una ciudad se tomaron 100 individuos al azar y se encontró que habı́a
22, 16, 15, 31, 23 y 25 hipertensos respectivamente. ¿Es igual la prevalencia de la hipertensión en todos los
distritos?
(Solución: χ2 = 10.26, 0.05 < p < 0.1).
8. Para estudiar el efecto de la edad en la supervivencia tras una intervención quirúrgica general, se tomaron
305 individuos menores de 75 años y 125 mayores de esa edad. Tras la intervención murieron 25 individuos
entre los menores de 75 años y 20 entre los mayores. Analiza los datos.
(Solución: χ2 = 5.7618, 0.01 < p < 0.05).
9. Al aplicar campos electromagnéticos pulsantes a diversas fracturas (62 en tibia, 26 en húmero y 18 en fémur)
con el fin de provocar su unión, se encontró que se consolidaron 34, 16 y 10 de cada una de ellas. ¿Varı́a la
consolidación con la localización?
(Solución: χ2 = 0.34, p > 0.2).
14
Inferencia Estadı́stica
Relación entre Variables
1. A fin de estudiar la evolución del ángulo de Clarke (en grados) con la edad del niño (sano) se obtuvieron
ambos datos en un grupo de 16 niños (entre 3 y 10 años) elegidos al azar:
Edad (X) 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10
Ángulo (Y ) 24 22 28 25 32 31 33 30 34 34 36 39 39 41 46 44
Suponiendo que se dan las hipótesis de normalidad e igualdad de varianzas adecuadas, contesta las siguientes
preguntas:
(a) ¿Existe relación entre la edad y el ángulo de Clarke?. Si existe, ¿cómo podemos medir el grado de la
relación?
(b) ¿Qué porcentaje de la variabilidad del ángulo queda explicada por la relación que mantiene con la
variable edad?
(c) ¿Cuánto varı́a el ángulo por cada año que pasa de edad?
(d) ¿Qué valor del ángulo tendrı́a un niño con 12 años? ¿Y uno de 5 años?
(Solución: a) Sı́, texp = 15.91; r = 0.973. b) 94.7%. c)(2.49,3.27) al 95%. d) No se puede calcular; (25.6,33.0)
al 95%).
2. Los datos siguientes son medidas de las concentraciones de calcio (en mg/100ml) y de hormona paratiroidea
(en µg/ml) en el plasma de 12 individuos sanos.
Calcio (X) 11.0 11.0 10.6 10.5 10.6 10.4 10.2 9.5 8.2 7.5 6.0 5.0
PTH (Y) 0.30 0.50 1.12 1.23 1.24 1.31 1.33 2.10 2.15 2.43 3.70 4.27
(a) ¿Existe relación entre ambas variables? Si existe, valora el grado de dicha relación ası́ como el sentido.
(b) Estima la recta de regresión del PTH sobre la concentración de Calcio.
(c) ¿Qué nivel medio de PTH le corresponde a un nivel de Calcio de 10 unidades?
(d) ¿Qué nivel medio de Calcio corresponde a una PTH de 1.5 unidades?, ¿y a una de 5 unidades?.
(Solución: a) Sı́, texp = 12.33; r = −0.973. b) y = 6.5360 − 0.5191x. c) (1.11,1.58) al 95%. d) Calcula la
recta de regresión de x sobre y: x = 12.097 − 1.566y. (9.37,10.07) al 95%; para 5 no puede calcularse).
3. Se ha medido la presión sistólica (mmHg) en 12 individuos para relacionarla con la edad de los mismos (en
años). Los resultados fueron los siguientes:
Edad 30 50 60 30 70 60 60 40 40 50 70 40
Presión 107 136 148 109 158 150 145 120 118 134 162 124
15
(d) Calcula una estimación de la presión sistólica correspondiente a una edad de 52 años. Ídem para 69
años.
(e) ¿En cuánto podemos estimar el porcentaje de la variabilidad de la presión sistólica no explicada por la
edad?
(Solución: a) texp = 28.737, p < 0.001. b) r = 0.994. c) y = 68.57 + 1.31x. d) 136.88; 159.21. e) 1.19%).
4. Los datos siguientes dan la torsión tibial en los miembros sanos y enfermos en los niños de 1 año con el pie
zambo congénito. Asumiendo las hipótesis necesarias, ¿podemos afirmar que están relacionados linealmente?
Sano 5 27 17 33 18 24 25 13 20 21 22
Enfermo 37 23 28 32 33 48 9 27 19 21 39
Dosis 25 28 24 20 30 27 22 21
Tiempo 10 8 11 15 9 7 14 16
Asumiendo las hipótesis necesarias, estudia la correlación lineal entre ambas variables.
(Solución: r = −0.9, 0.001 < p < 0.01).
6. 1343 niños fueron clasificados según el grado de cumplimiento de su calendario vacunal y el nivel socio-
cultural de sus padres.
Cumplimiento
Nivel Alto Medio Bajo
Alto 94 38 2
Medio Alto 150 63 7
Medio Bajo 277 134 7
Bajo 228 229 114
¿Existe asociación entre estas dos variables cualitativas?. Si es ası́, ¿cómo podemos medir el grado de dicha
relación?
(Solución: χ2 = 163.51, p < 0.0001. C = 0.3295)
7. La rehabilitación de individuos con fracturas en extremidades inferiores (como consecuencia de un accidente
de tráfico) se ve condicionada por la participación de los mismos en el proceso de rehabilitación (Bajo=Menos
de 30’; Medio=De 30’ a 60’; Alto=Más de 60’). A fin de comprobar el último supuesto, se tomaron 360 de
tales pacientes y se les clasificó como en la tabla siguiente:
Participación
Tiempo Baja Media Alta
Bajo 39 38 112
Medio 24 26 70
Alto 24 20 7
¿Existe asociación entre estas dos variables cualitativas?. Si es ası́, ¿cómo podemos medir el grado de dicha
relación?
(Solución: χ2 = 36.43, p < 0.001. C = 0.303)
16
8. Para estudiar la relación entre el hábito de fumar y la aparición de cardiopatı́a coronaria, se observaron 80
fumadores y 70 no fumadores durante un periodo de tiempo, sufriendo la misma en dicho periodo 35 de los
primeros y 16 de los segundos. ¿Influye el ser fumador en la apirición de la cardiopatı́a? Si existe dicha
influencia ¿cómo puedes medir su grado?
(Solución: χ2 = 7.26, 0.005 < p < 0.01. φ = 0.22)
9. Varios libros de Medicina Interna recomiendan al médico la palpación de la arteria radial con el fin de evaluar
el estado de la pared arterial. Se tomaron 215 pacientes y se les clasificó según la palpabilidad de dicha
arteria (grados 0,1 y 2 para ”no palpable”, ”palpable” y ”muy palpable o dura”, respectivamente) y según
una puntuación de 0 a 4 en orden creciente de degeneración arterial (evaluada tras la muerte del paciente y
su análisis anatomopatológico). Los datos aparecen en la siguiente tabla:
Palpación
A. Anatomo-patolog. 0 1 2
0 20 5 5
1 60 20 10
2 45 15 15
3 10 5 5
10. En un estudio de seguimiento para detectar los factores que influyen en la muerte por enfermedad isquémica
del corazón, una de las preguntas era si el último mes el paciente habı́a sentido un dolor en el pecho. Tras
9 años de seguimiento, de 4580 individuos 460 sufrieron dolor en el pecho, y de ellos 80 fallecieron por la
enfermedad citada. De los que no padecieron dolor en el pecho, 395 fallecieron por enfermedad isquémica
del corazón. ¿Están relacionados el dolor en el pecho y la muerte por enfermedad isquémica del corazón?
(Solución: χ2 = 27.11, p < 0.001)
17
Problemas Generales
Inferencia Estadı́stica
1. En un estudio sobre enfermedades cerebrales degenerativas se ha sometido a un total de 10 pacientes con
demencia senil a la siguiente prueba: los pacientes deben realizar andando un determinado trayecto (el
mismo para todos), en primer lugar de manera libre para posteriormente realizarlo con ayuda de un andador.
La variable considerada fue el tiempo (en seg.) empleado en el trayecto y los datos obtenidos fueron los
siguientes:
Individuo 1 2 3 4 5 6 7 8 9 10
Sin Andador 254 185 219 205 182 310 191 245 229 245
Con Andador 278 215 241 265 173 290 227 245 238 261
¿Hay un aumento en el tiempo empleado en el recorrido cuando el trayecto se realiza con andador frente a
cuando éste no se utiliza? Comprueba previamente la hipótesis necesaria para aplicar un test paramétrico.
Responde la pregunta de la manera más completa que sepas, calculando y comentando en cada caso la
probabilidad de significación.
Paciente 1 2 3 4 5 6 7 8 9 10
Sin Andador 64 72 71 67 72 76 67 72 58 69
Con Andador 67 86 68 69 75 80 67 81 64 85
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Sin Andador 77 73 70 78 72 72 74 76 69 76 78 75 76 63 78
Con Andador 85 75 67 83 60 77 81 76 78 79 74 74 86 63 70
(a) ¿Existen diferencias significativas en el tiempo empleado en el recorrido entre dementes y no dementes
cuando el trayecto se realiza sin andador?
(b) ¿Existen diferencias significativas en el tiempo empleado en el recorrido entre dementes y no dementes
cuando el trayecto se realiza con andador?
(c) Entre los pacientes con demencia, ¿hay un aumento en el tiempo empleado en el recorrido cuando el
trayecto se realiza con andador frente a cuando éste no se utiliza?
(d) Entre los pacientes sin demencia, ¿hay diferencias en el tiempo empleado en el recorrido cuando el
trayecto se realiza con andador frente a cuando éste no se utiliza?
Suponiendo normalidad en las variables, responde las preguntas de la manera más completa que sepas, cal-
culando y comentando en cada caso la probabilidad de significación y valorando la magnitud de la diferencia
cuando exista.
18
3. Se ha realizado un ensayo clı́nico para estudiar si el área (rural o urbana) en el que vive un individuo influye
en su nivel de colesterol. Para ello se tomaron al azar dos grupos de 6 individuos, el primero de ellos de un
área rural de montaña y el segundo de un área urbana de una ciudad de 150 mil habitantes. Los datos del
nivel de colesterol (en mg/dl) de cada individuo aparecen en la siguiente tabla:
(a) ¿A qué conclusiones podemos llegar después de analizar los datos? Supón normalidad e igualdad de
varianzas. Indica qué hipótesis vas a contrastar. Resuelve el problema respondiendo a la pregunta de
la manera más completa que sepas (interpretando los resultados obtenidos), calculando y comentando
la probabilidad de significación.
(b) En el estudio realizado en la ciudad, a los 6 individuos anteriormente seleccionados, además de medirles
el nivel de colesterol, se les sometió a un experimento consistente en, durante dos meses, ingerir diaria-
mente 200gr de jamón ibérico de bellota y realizar 30 minutos de ejercicio fı́sico suave, con el objetivo
de encontrar evidencias de que este producto junto con un ejercicio moderado ayudan a bajar el nivel
de colesterol. Después de los dos meses de experimentación se obtuvieron los resultados de la siguiente
tabla (se vuelven a repetir los valores iniciales de referencia):
Individuos 1 2 3 4 5 6
Nivel Inicial 178.0 204.8 200.0 188.0 199.7 191.3
Nivel 2 meses después 184.6 188.3 169.7 197.7 167.0 176.9
¿A qué conclusiones podemos llegar después de analizar los datos? ¿Ayudan el jamón ibérico y el
ejercicio a bajar el nivel colesterol? Supón normalidad. Indica qué hipótesis vas a contrastar. Resuelve el
problema respondiendo a la pregunta de la manera más completa que sepas (interpretando los resultados
obtenidos), calculando y comentando la probabilidad de significación.
A 11 9 12 9 10 10 10 8 9 10 8 7
B 17 15 11 12 16 13 13 14 11 14 14 12
C 20 20 15 19 19 21 16 21 16 22 20
Suponiendo normalidad e igualdad de varianzas, determina si existen diferencias significativas entre los tres
grupos, A, B y C, a nivel de la variable calibre anal. En caso de existir diferencias indica entre qué grupos.
Comenta los resultados obtenidos.
5. Para saber si la captación de noradrenalina en el bazo de ratas se ve modificada al inyectarles a éstas canti-
dades crecientes de una sustancia (diazóxido), se tomaron tres grupos de 75, 115 y 150 ratas (homogéneas),
aplicándole a cada uno de ellos dosis de diazóxido de 150, 300 y 600 unidades, respectivamente. Sacrificando
los animales, se midió por radioinmunoensayo el nivel de noradrenalina en el bazo, clasificándose éste como
Muy Alto (>100 mg/l), Alto (50-100 mg/l), Moderado (30-50 mg/l), Leve (10-30 mg/l) ó Nulo (<10 mg/l),
obteniéndose la siguiente tabla de resultados:
19
¿A qué conclusión podemos llegar sobre la influencia de diferentes dosis de diazóxido en el nivel de noradre-
nalina del bazo? Responde a la pregunta de la manera más completa que sepas, calculando y comentando
la probabilidad de significación.
Tratamientos Mediciones
Diazóxido 150 44.972 38.121 83.754 51.544 52.125
Diazóxido 300 54.171 23.773 44.749 40.120 42.491
(a) ¿A qué conclusión podemos llegar sobre la influencia de las dosis de diazóxido en el nivel de noradrena-
lina del bazo? Asume normalidad. Plantea y resuelve el correspondiente test de hipótesis, calculando
y comentando la probabilidad de significación.
(b) En otro experimeto relacionado con este problema, se investigó si una dosis creciente de diazóxido
está relacionada con un aumento en la proporción de individuos que presentan efectos secundarios al
administrársele dicha sustancia. Ası́, se le suministró una dosis de 150 unidades a 25 ratas, de las
cuales 7 presentaron efectos secundarios, mientras que 300 unidades se le administró a 30 ratas, siendo
17 las que presentaron efectos secundarios. ¿A qué conclusión podemos llegar? Plantea y resuelve el
correspondiente test de hipótesis, calculando y comentando la probabilidad de significación.
7. Al marcar animales de laboratorio para futuros estudios, hay que inmovilizarlos temporalmente, para lo
cual se utiliza hidrocloruro de fenciclicina. Se realiza un estudio para determinar la relación entre dosis
administrada (en mg) y el tiempo (en minutos) transcurrido hasta la inmovilización completa.
Dosis 20 21 22 23 24 25 26 27 28 29 30
Tiempo 16 12 16 15 13 10 12 10 10 8 8
Asumiendo las hipótesis de normalidad e igualdad de varianzas necesarias, contesta las siguientes preguntas:
(a) ¿Existe relación lineal entre la dosis y el tiempo?. Calcula y comenta la probabilidad de significación.
Si existe, ¿cómo podemos medir el grado de la relación?
(b) ¿Qué porcentaje de la variabilidad del tiempo queda explicado por la relación que mantiene con la
variable dosis?
(c) ¿En cuántos minutos podemos estimar que varı́a el tiempo por cada mg que aumenta la dosis?
(d) ¿En cuánto podemos estimar el valor medio del tiempo transcurrido hasta la inmovilización completa
para una dosis de 25mg?
20