Bioestadistica 2

BIOESTADISTICA 2
BIOESTADISTICA 5
INTRODUCCION A LA ESTADISTICA ANALITICA:
TEORIA DE
PROBABILIDADES
CONCEPTOS PREVIOS
El concepto de probabilidad nace con
el deseo del hombre de conocer con
certeza los eventos futuros.
OBJETO DE ESTUDIO DE LA TEORIA DE

PROBABILIDADES
FENOMENOS TEORIA DE
ALEATORIOS PROBABILIDADES
EXPERIMENTOS
(FENOMENOS)
FENOMENOS CIENCIAS
DETERMINISTICOS EXACTAS
Pag. 1
BIOESTADISTICA 2
PROBABILIDAD
 La probabilidad es la parte de las matemáticas que se encarga
del estudio de fenómenos o experimentos aleatorios (se repite
bajo las mismas condiciones y el resultado no siempre es el
mismo).
La probabilidad de ocurrencia de un evento es el grado de

certeza (confianza) con que este puede ocurrir
¿Por qué es necesario aprender a

calcular probabilidades?
Aunque el resultado de ninguna prueba es absolutamente

exacto, eso no afecta la probabilidad de la presencia o
ausencia de una enfermedad. Por lo tanto, entender las
probabilidades es fundamental para el proceso de toma de
decisiones y para esta preparados ante la ocurrencia de un
evento.
CONCEPTOS BASICOS
EXPERIMENTO ALEATORIO: ESPACIOS MUESTRAL: SUCESO O EVENTO:
Es el conjunto de subconjunto del espacio

Acción voluntaria cuyos
TODOS los resultados muestral, seleccionado de
resultados están sujetos al
posibles de un acuerdo a una condición
azar.
experimento aleatorio. (“Es lo que se espera que
ocurra”)..
Pag. 2
BIOESTADISTICA 2
Tipos de Probabilidades
Aunque parezca un concepto simple, debido a que es utilizado
cotidianamente de manera intuitiva , su definición formal puede ser
complicada desde el punto de vista matemático.
CLASICA o a priori ANTES DEL

EXPERIMENTO
(TEORICA)
OBJETIVA
FRECUENCIA RELATIVA
PROBABILIDADES DESPUES DEL
o a posteriori (REAL) EXPERIMENTO
SUBJETIVA o personalistica
Tipos de Sucesos o eventos

SIMPLE
• Se llama suceso simple, marginal o individual, a un solo evento «A»
(del espacio muestral), que es de interés conocer su probabilidad de
ocurrencia.
COMPUESTO
• Se llama suceso unión de A y B, al formado por los resultados

experimentales que están en A o en B (incluyendo los que están en
ambos) y que se simboliza como: AUB,
• Se llama suceso intersección de A y B, al formado por los resultados
experimentales que están simultáneamente en A y B, y que se
simboliza como A∩B o simplemente AB
• Se llama suceso condicional o dependiente cuando la ocurrencia de

un evento A depende de la ocurrencia de un evento B (condición)
Pag. 3
BIOESTADISTICA 2
CALCULO DE PROBABILIDADES
Simple Compuesta o Conjunta
Marginal Unión Intersección Condicional
7
P( X ) P( X  Y ) P( X  Y ) P( X | Y )
La probabilidad de La probabilidad de La probabilidad de La probabilidad de
que ocurra que ocurran dos que ocurra dos que ocurra
eventos eventos a la vez
X X “sabiendo que”
X o Y o ambos XeY ha ocurrido Y
X X Y X Y
Y
Regla de Laplace Regla de Suma Regla de Multiplicación
¿Que tipo de probabilidad se

quiere calcular?
uno ¿Cuántos eventos se dos

quieren medir?
Probabilidad marginal o Probabilidad compuesta

individual o conjunta
¿Te dan datos ¿Qué expresión

si o valores no gramatical
en la pregunta? reconoces?
Probabilidad real Probabilidad clásica

AoB AyB A dado que B
(a posteriori) (a priori)
Probabilidad de Probabilidad de Probabilidad

unión intersección condicional
¿Los eventos son ¿Los eventos son

excluyentes? independientes?
P a = N° de eventos a / P a = Evento a /
N° de eventos totales x 100 Espacio muestral x 100
no si si no
Regla de La Place
P (a U b) = Pa + Pb – P (a n b) P (a n b) = Pa * Pb
P (a U b) = Pa + Pb P (a / b) = P (a n b) / Pb
Regla de suma Regla de multiplicación
Pag. 4
BIOESTADISTICA 2
Ejercicio:
Un paciente ingresa a una farmacia. La probabilidad de

que compre (a) un analgésico es 0,60 (b) un
descongestionante es 0,50, y (c) un analgésico y un
descongestionante es 0,30 ¿Cuál es la probabilidad de
que compre un analgésico, un descongestionante o
ambos?.
P(A) = 0,60
P(AUD) = P(A) + P(D) - P (A D)
U
P(D) = 0,50
U P(AUD) = 0,60 + 0,50 - 0,30
P (A D) = 0,30 P(AUD) = 0,80
Pag. 5
BIOESTADISTICA 2
La probabilidad que un paciente sea intervenido

quirúrgicamente del corazón es 0,2 y de los
riñones es 0,3 ¿Cuál es la probabilidad de que un
paciente cualquiera haya tenido una intervención
al corazón o a los riñones?
P(C) = 0,2
P(R) = 0,3 P(CUR) = P(C) + P(R)
= 0,2  0,3
P(CUR) = 0,5
La probabilidad de que el personal auxiliar que labora en una clínica

llegue tarde el día lunes es 0,50 y la probabilidad de que llegue
retrasado los días lunes y martes es 0,20. Dado que cierto
trabajador llegó tarde el día lunes, ¿cuál es la probabilidad de que
llegue tarde el día siguiente?.
 TL )
P(TL ) = 0,50 P(TM
TL
) = P(T M
P(TL )
P(TL  TM ) = 0,20
0,20
= = 0,40
0,50
Pag. 6
BIOESTADISTICA 2
¿Cuál es la probabilidad de que en una

familia con dos hijos, ambos sean varones?
P(V1 )  0,5
P(V2 )  0,5
P (V1  V2 )  P(V1 )  P(V2 )
= (0,5) (0,5)
P (V1  V2 )  0,25
Ejemplos de Probabilidad Condicional

Es la Probabilidad que se presente un evento “A” “dado
que” se presente un evento “B”
Ejemplo: La siguiente tabla muestra el sexo de 50 pacientes de

un hospital, así como su condición de ¨nuevo¨ (si asiste por
primera vez) o ¨repetidor¨ (si no es la primera vez que asiste)
Condición Paciente Paciente

Sexo Nuevo Repetidor Total
Masculino 18 12 30
Femenino 13 7 20
Total 31 19 50
Si se selecciona un paciente al azar:
Pag. 7
BIOESTADISTICA 2
A) ¿Cuál es la probabilidad que sea varón?

30
P(V ) =  0,60
50
La probabilidad de que un paciente seleccionado al azar sea
varón es 0,60
B) ¿Cuál es la probabilidad que sea varón y repetidor?
12
P(V  R) =  0,24
50
La probabilidad de que un paciente seleccionado al azar sea un
varón y repetidor es 0,24
C) Dado que el paciente elegido resultó ser varón, ¿Cuál es la
probabilidad que sea repetidor?

12
P( R )=  0,40
V 30
Bioestadistica 6
ESTADISTICA ANALITICA
Pag. 8
BIOESTADISTICA 2
Estadística Analítica
OBJETIVOS
Estimar
parámetros Probar hipótesis
(inferencia)
A. Estadística Inferencial (Estimación o Inferencia)

• La Estadística inferencial que toma la
información de la estadística descriptiva para
realizar procesos que permiten, dentro de
ciertos rangos de confianza, determinar el
comportamiento probable de la población que es
representada por la Muestra
• Muestra aleatoria: se considera aleatoria

siempre y cuando cada observación, medición o ESTADÍGRAFOS
individuo de la población tenga la misma (estadísticos)
probabilidad de ser seleccionado (azar).
• Tipos de estimación o inferencia: PARÁMETROS

• Estimación puntual: Se trabaja con una muestra.
• Estimación por intervalos de confianza: Se trabaja con varias muestras.
Se propone un intervalo de valores, en el que se encontrará el parámetro
con cierta probabilidad (nivel de confianza).
Pag. 9
BIOESTADISTICA 2
OBJETIVO DE LA INFERENCIA = CONOCER EL PARAMETRO
ESTIMACION o INFERENCIA ESTIMACION o INFERENCIA

PUNTUAL POR INTERVALO
Existe la probabilidad que el N1 X 1= 58 Kg
estadístico o valor muestral sea el

verdadero valor o Parámetro buscado.
N2 X 2= 54 Kg
POBLACION
X = 63 Kg N
(P)
N3 X 3= 62 Kg
N4 X 4= 61 Kg
Existe una probabilidad que el

verdadero valor o Parámetro 54 Kg 62 Kg
buscado, se encuentre en el rango
(P)
CONFIANZA = PROBABILIDAD DE ACERTAR
• Nivel o grado de confianza: probabilidad que asociamos con una estimación del
intervalo. Se representa con (1 - a). Los niveles más utilizados son 0,90 0,95 y 0,99. Se
utiliza cuando se trabaja con estadística inferencial o probabilística.
• Intervalos de confianza: es el alcance o rango de la estimación que estamos

haciendo. Es el rango de valores entre los cuales existe la probabilidad que se
encuentre el valor real o Parámetro de la población.
GRADO DE CONFIANZA
(probabilidad de acertar)
INTERVALO DE CONFIANZA
(rango de valores)
Pag. 10
BIOESTADISTICA 2
PROPIEDADES DE LA DISTRIBUCION DE PROBABILIDADES

(ADAPATADO DE CHEBISHEV)
En el caso de distribución normal de

probabilidades las áreas representan: Puntos
de
• El 68% de probabilidades se inflexión
encuentra en 1 desviación
estándar de la media.
• El 95,5% de probabilidades se
encuentra en 2 (1.96) desviación
estándar de la media.
   +
• El 99,7% de probabilidades se
encuentra en 3 (2.6) desviación  - + 
estándar de la media ,
Mo,
Mn
OJO: Pregunta de
bioestadística
¿Qué tipo
de
descriptiva estadística analítica
es?
Terminología Terminología
•Muestra •Muestra
•Media representativa
•Desviación •Estimación
estándar y •Error estándar
•Rango o •Intervalo de
intervalo. confianza.
Buscar la respuesta Buscar la respuesta

que este redactada en que este redactada en
términos absolutos terminología
(descriptivos). probabilística.
Descartar cualquiera Descartar cualquiera
que tenga terminología que este redactada en
inferencial términos absolutos.
Pag. 11
BIOESTADISTICA 2
APLICACIÓN EN ESTADISTICA DESCRIPTIVA

• Diga ud. ¿cual es el intervalo de peso en Kg. en el que se encontrará el
68% de individuos de un marco muestral, en el cual la media de peso
es de 78Kg con una DS de + - 6 Kg.? .
• En que rango de Talla se encontrará el 95% de la población en la que

se sabe que la media de talla es de 160 cm con una DS de + - 15 cm?
• En que rango de edades se encontrará el 99% de individuos de una

muestra (marco), cuya media aritmética fue de 35 años con una DS de
+- 3 años.
APLICACIÓN EN ESTADISTICA INFERENCIAL

• En un estudio transversal sobre una muestra de sujetos representativos de una
comunidad , se ha observado una prevalencia de HTA de 20% (intervalo de confianza
95% : 15 -25%). La afirmación correcta es:
▫ a. Se tiene un 95% de confianza de que el intervalo de 15 a 25%, incluye el verdadero
valor de la prevalencia de la HTA de la comunidad.
▫ b. La prevalencia real de la HTA de la comunidad se sitúa entre el 15 y 25%.
• En un estudio en una población se ha encontrado una media de PAS en varones adultos

de 120 mmHg, con un error estándar de 2. con un intervalo de confianza al 95%. La
afirmación correcta es:
▫ a. El 95% de los varones adultos de la población tienen una PAS entre 115 a 126
mmHg.
▫ b. Existe una probabilidad del 95% que el verdadero valor de la PAS de la población
este entre 116 a 124 mmHg.
• La prevalencia de glicemia en una muestra representativa de 500 individuos es de 110

mg% con un intervalo de confianza del 95%, cuyos límites son: 90 y 130 mg%. Cuál es la
afirmación correcta:
▫ a. Existe un 95% de confianza de que el intervalo 90 a 130 mg% incluya al verdadero
valor de la prevalencia de la glicemia de la comunidad.
▫ b. Existe un 95% de confianza de que la prevalencia de la glicemia en dicha comunidad
es de 110 mg%.
Pag. 12
BIOESTADISTICA 2
Bioestadistica 7
TEORIA DE
MUESTREO
¿Para que sirve una muestra?

Una muestra sirve para hacer inferencias acerca de los
parámetros de una población en base a la información
obtenida de la muestra.
características:
• Debe Representar a la población (Representativa)
• Debe generar resultados Confiables
• Disminuir Costos
• Disminuir Sesgos
Pasos en el proceso de obtener una muestra

representativa:
1. Determinar Tamaño de la muestra.

2. Aplicar el método aleatorio de selección de la muestra.
La tarea fundamental de la ESTADISTICA INFERENCIAL, es sacar conclusiones acerca de la

población a partir de una muestra extraída de la misma (Aproximarse al Parámetro a partir
de Estadísticos).
Pag. 13
BIOESTADISTICA 2
1. Tamaño de la muestra (n)

El tamaño muestral depende de tres factores:
El grado de confianza: Es la probabilidad de acertar en la
inferencia. A mayor tamaño muestral mayor confianza.
El grado de error: Es la probabilidad de equivocarnos en
la inferencia. A mayor tamaño muestral menor error.
El nivel de variabilidad: Es el grado de homogeneidad o
heterogeneidad de la composición de la población. A
mayor variabilidad poblacional, se requiere mayor tamaño
muestral.
2. Método aleatorio de selección de la muestra

Para que la inferencia sea válida el muestreo debe ser aleatorio o
probabilístico.
Aleatoriedad de la selección: Se refiere a que cada elemento

del universo (población) debe tener la misma probabilidad de ser
elegido en la muestra.
TIPOS DE MUESTREO PROBABILISTICO

1. MUESTREO ALEATORIO SIMPLE
Características
• Escoge al azar los miembros del marco poblacional (universo) hasta
completar el tamaño muestral previsto.
• Se enumeran todos los miembros del marco poblacional y de acuerdo
con una tabla de números aleatorios se van escogiendo (mecánica o
digitalmente).
• Se aplica fundamentalmente en marcos poblacionales pequeños y
plenamente identificados y homogéneas.
Tipos
Muestreo sin reemplazo
Se selecciona solo una vez cada muestra.
Muestreo con reemplazo

Se puede incluir dos o más veces en la muestra.
Pag. 14
BIOESTADISTICA 2

2. MUESTREO ALEATORIO SISTEMATICO
•Este tipo de muestreo se utiliza:
1- Cuando no se puede armar un marco muestral para la selección de la

muestra.
2- Cuando las unidades de muestreo tienen cierto orden.
3- Siempre que las poblaciones sean móviles o que sufran evoluciones
Por ejemplo: De un total de 400 HC, se decide un tamaño de muestra de

20 HC, para lo cual se define como intervalo K: 400/20 = 20, es decir cada
unidad muestral se tomará 1 dejando 20 HC.
3. MUESTREO ESTRATIFICADO
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está
compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra
que contenga también esa misma proporción.
Pag. 15
BIOESTADISTICA 2
ESTRATOS Homogéneos en su interior; diferentes

entre sí en propiedades y tamaño
Comuna B
Comuna A
Comuna C
Comuna D
Los estratos más grandes

Tienen mayor probabilidad de ser representados
EJEMPLO:
Población
heterogénea
para la variable
edad
No se puede aplicar métodos aleatorios porque cada

miembro no tiene la misma posibilidad de ser elegido, por
lo tanto debemos “homogenizar” la población:
ESTRATIFICAR
Población
homogénea
para la variable
edad
ESTRATO ESTRATO ESTRATO

NIÑOS ANCIANOS ADOLESCENTES
Pag. 16
BIOESTADISTICA 2

4. MUESTREO POR CONGLOMERADOS
Los miembros del grupo mayoritario tienen una mayor

probabilidad de ser seleccionados en la muestra
No se cumple la aleatoridad
En las Unidades de observación se eligen aleatoriamente al interior de

los conglomerados
El error de la medición (error muestral) no se da al interior del

conglomerado sino entre los conglomerados
Antes de hacer inferencias, el analista deberá examinar la

variabilidad interna de cada conglomerado y la variabilidad entre
ellos, pues es posible que algunos de los conglomerados no sean
representativos del universo.
Ejemplo: Para identificar los factores de riesgo vulnerables de la enfermedad

ateroesclerótica en los trabajadores agrícolas de una provincia, se seleccionan
aleatoriamente un número de cooperativas de producción agropecuaria y se estudian a
todos los trabajadores de dichos centros.
CONGLOMERADOS
Grupo 1A
Grupo 5C
Grupo 2A
Grupo 3B
Heterogéneos en su interior; diferentes entre sí en

propiedades y tamaño
Pag. 17
BIOESTADISTICA 2
ERRORES DE LA MEDICIÓN ESTADISTICA

Al trabajar con datos muestrales en los procesos de investigación
epidemiológica, se pueden presentar dos tipos de errores:
• Error Aleatorio (Error Estándar)
• Error Sistemático (Sesgos)
Error Aleatorio Sesgo
Imprecisión Invalidez
ERRORES DE LA MEDICIÓN
Error Aleatorio Sesgos

(Error Estándar) (errores sistemáticos)
Diferencia (variabilidad) de Diferencia sistemática entre

las mediciones alrededor del las mediciones y el valor
valor verdadero (Parámetro), verdadero (PARÁMETRO),
debida al azar. NO SE PUEDE debida a problemas de
ELIMINAR, SOLO SE PUEDE diseño. SE PUEDE Y SE DEBE
REDUCIR ELIMINAR.
Aumenta con: Relacionados con:

Adelanto diagnóstico
Muestras pequeñas
Notificación
Recuerdo
Variabilidad del fenómeno
Selección
Afectan la precisión Afectan la validez
Pag. 18
BIOESTADISTICA 2
Tipos de Sesgos
•Error sistemático introducido en la
planeación del estudio
•Sesgo de Selección: Errores que se

cometen al escoger los individuos para
formar los grupos de investigación.
•Sesgo de Información (ejecucion):

Errores que se cometen en cualquier fase
de tratamiento de la información (recojo,
organización, procesamiento o
interpretación)
Tipos de sesgo de selección
• Sesgo de confusión.
• Sesgo Berksoniano – Puede haber una asociación

espuria entre enfermedades o entre una
característica y una enfermedad debido a las
diferentes probabilidades de admisión a un
hospital para aquellos con la enfermedad, sin la
enfermedad pero con la característica de interés
• Sesgo de respuesta – aquellos que aceptan estar en

un estudio pueden ser de alguna forma diferentes a
los que rehusan participar
– Voluntarios son diferentes de aquellos enlistados
Pag. 19
BIOESTADISTICA 2
Tipos de sesgo de información

• Sesgo del entrevistador – el conocimiento de un entrevistador puede
influenciar la estructura de preguntas y la manera de presentar las respuestas.
• Sesgo de pérdida o seguimiento – aquellos que son perdidos en el

seguimiento o quienes se retiran pueden afectar el procesamiento de datos
• Sesgo de instrumento – Cuando el equipo o instrument que se utiliza para

recojer o procdesar información no está calibrado
• Sesgo de recuerdo o memoria – aquellos (as) con una exposición o

resultados particulares pueden recordar eventos más claramente o ampliar sus
pensamientos sobre el evento
• Sesgo del observador – observadores pueden tener expectativas

preconcebidas de lo que deberían encontrar en un exámen
• Sesgo de vigilancia o monitoreo – el grupo con la exposición o el resultado

pueden ser seguidos más estrechamente o por más tiempo que el grupo de
comparación: Efecto Hawthorne
• Efecto Placebo – La subjetividad e interéses de los participantes pueden

alterar la veracidad de los datos
Controles para sesgos

TIPOS DE SESGO CONTROL
Confusión Apareamiento de grupos.
SESGO DE
Berksoniano No elegir a pacientes hospitalizados
SELECCIÓN
Voluntariado No pedir voluntarios para estudios experimentales
Entrevistador / Capacitar mejor a entrevistadores y observadores y

observador estandarizar herramientas y procedimientos
Incrementar el número de individuos en estudios
Pérdida o seguimiento
prospectivos.
Instrumentos (mal
Calibrar los instrumentos de medición a ser utilizados
calibración)
Evitar recopilar información apelando a la memoria de la
Recuerdo o memoria
gente. Se prefiere identificar fuente secundaria.
Vigilancia (Hawtorne) No sobre vigilar a un grupo respecto a otro.

SESGO DE
INFORMACION Para evitar la subjetividad evitar que las personas
conozcan las condiciones de la experimentación:
CEGADO O ENMASCARAMIENTO:
Estudio con ciego simple: los sujetos no saben de si ellos

Percepción (ensayos
están en el grupo experimental o en el control
clínicos)
Estudio doble ciego: el sujeto y el observador no saben la
situación del sujeto.
Estudio triple ciego: el sujeto, el observador y el analista

de los datos no saben de la situación del sujeto.
Pag. 20
BIOESTADISTICA 2
ESTADISTICA ANALITICA:
PRUEBA DE HIPOTESIS
(CONTRASTE DE HIPOTESIS)
Bioestadística 8
Hipótesis: definición
 Son suposiciones que
relacionan una variable con
otra y que serán probadas a
través de la investigación,
con el fin de ser aceptadas o
rechazadas por medio de los
resultados obtenidos.
 Son ante todo, enunciados

que expresan afirmaciones
o negaciones sobre la
realidad.
A B
(Variable (Variable
independiente) dependiente)
Pag. 21
BIOESTADISTICA 2
¿Qué es la prueba de hipotesis?
Es un procedimiento estadístico,
(matemático), una herramienta
de análisis de datos que permite
ACEPTAR o RECHAZAR la
Hipótesis estadística (NULA).
Mide la significancia estadística, es

decir, mide la probabilidad
matemática de que la hipótesis
científica sea verdadera.
1. Establecer la hipótesis nula y la alternativa

2. Elegir el error estadístico tolerable: nivel de significación o el grado de
error esperado: nivel crítico para alfa (generalmente es 5% o 0.05)
3. Elegir un estadístico de contraste (Prueba estadística o de
significancia)
4. Procesamiento de datos del experimento para calcular el estadístico
de la muestra aleatoria (obtener “valor p”).
5. Comparar el “valor p” con el valor “alfa” para concluir si la Hipotesis
nula se rechaza o no (Criterio de rechazo).
P>a
NO ACEPTA
No
Hipótesis Nula PE
Rechazar la Ho
Hipótesis
1 2 3 4 5 Alterna
Hipótesis a p Rechazar la Ho
científica ACEPTA
Contraste de hipótesis
Hipótesis Alterna P<a
Pag. 22
BIOESTADISTICA 2
1 Establecer las Hipótesis estadísticas
En el proceso de la estadística inferencial, hay dos tipos de hipótesis claves:
 LA HIPOTESIS NULA (Ho), se construye artificialmente para que el investigador

evalúe su hipótesis de investigación. Plantea que no existe relación entre los dos
fenómenos comparados. ES LA QUE SE DEBE CONTRASTAR.
 LA HIPOTESIS ALTERNA (H1), es la hipótesis complementaria que

simplemente señala la existencia de un hecho o de un evento (representa a la
hipótesis de investigación o experimental), o la relación entre dos o más
fenómenos. ES COMPLEMENTARIA A LA ANTERIOR.
EJEMPLO:
Hipótesis científica: El nivel de colesterol en sangre de los hombres difiere del de
las mujeres
Hipótesis estadística (NULA): el promedio de la variable Nivel de colesterol En
sangre de la población de Hombres es igual al promedio de esa misma Distribución
en la población de mujeres.
Ho:  hombres =  mujeres
Hipótesis Experimental:
El fármaco “A” (variable independiente) provoca una reducción importante de la
PA (variable dependiente).
Grupo experimental RESULTADOS
Fármaco X PA
A (ge)
comparar
Grupo control
Placebo
B X PA
(gc)
X PA X PA X PA X PA
= =
(ge) (gc) (ge) (gc)
HIPOTESIS ALTERNA HIPOTESIS NULA

(Hipótesis experimental)
Pag. 23
BIOESTADISTICA 2
Hipótesis: La Droga A es útil para tratar la enfermedad

Realidad de la H0
Verdadera Falsa
(Droga A no sirve)- (Droga A sirve) +
Error de tipo II
p>a
Correcto El tratamiento sí tiene
No rechazo H0 efecto pero no lo
(grado de percibimos.
confianza Probabilidad β
(Droga A no
sirve) 1- α)
Proceso
matemático: - VN FN
contraste de
la hipótesis p<a Error de tipo I
(GRAVE) Correcto
Rechazo H0
El tratamiento no tiene (Poder de la
efecto pero se decide que
sí. Prueba
(Droga A sirve) 1- β)
Probabilidad α
+ FP VP
EL CONTRATSE DE HIPOTESIS ES UN PROCESO MATEMATICO QUE

TRATA DE ENCONTRAR LA VERDAD
EJEMPLO GOLD ESTANDAR
ENFERMO SANO
PRUEBA DE
TAMIZAJE
POSITIVA VERDADERO FALSO POSITIVO

POSITIVO (error)
NEGATIVA FALSO NEGATIVO VERDADERO
(error) NEGATIVO
REALIDAD
CULPABLE INOCENTE
DECISION DEL
JURADO
CULPABLE JUSTICIA Injusticia

(error grave)
INOCENTE Injusticia JUSTICIA
(error)
Pag. 24
BIOESTADISTICA 2
ERROR DE TIPO I (a)

 Es rechazar estadísticamente, una hipótesis nula siendo esta
verdadera en la realidad (ERROR GRAVE).
MNEMOTECNIA:
ERROR TIPO I
RECHAZAR Ho
SIENDO Ho, VERDADERA
Es claro que se puede reducir de dos maneras:

- Aumentando la región de aceptación (gràficamente)
- Aumentando el tamaño de la muestra
Nivel de confianza (1 – a)
Representa el complemento del error tipo I, es decir la
probabilidad de no rechazar la hipótesis nula siendo ésta
verdadera (acierto).
Se representa con (1 - a). Los niveles más utilizados son 0,90
0,95 y 0,99.
Pag. 25
BIOESTADISTICA 2
ERROR DE TIPO II (β)

 Error tipo Beta: o tipo II, es aceptar una hipótesis nula siendo falsa
 Nemotecnia: es la inversa al error tipo I o alfa:
inverso NO RECHAZAR Ho
inverso
SIENDO Ho, FALSA
Se observa la existencia de una relación inversa entre la

magnitud de los errores a y b : conforme a aumenta, b
disminuye.
Poder de la Prueba (Potencia del test)
(1-b)
La meta de todo investigador en el proceso de contraste de
hipotesis es: rechazar la hipótesis nula, por ello es
importante que la prueba tenga dicho poder.
El poder de la prueba se debe entender como la capacidad que

tiene la prueba estadística de RECHAZAR LA HIPOTESIS
NULA SIENDO ESTA FALSA.
Pag. 26
BIOESTADISTICA 2
3 Elegir el estadístico de contraste (Prueba estadística)
Para cada tipo de diseño se debe elegir una Prueba de contraste

particular:
PRUEBAS PARAMETRICAS PRUEBAS NO PARAMETRICAS
T de student independiente Chi cuadrado

T de student apareada Wilcoxon
ANOVA U de Mann Whitney
Correlación de pearson Mc Nemar
Kruskall wallis
Correlaciòn de pearson
4 Procesar los datos con la Prueba estadística elegida:

obtener el valor P
Valores P
el P valor o nivel de significación empírico del contraste (a
posteriori) es el dato obtenido a partir del valor del estadístico
del contraste (Prueba estadística o de significancia) , en las
observaciones que corresponden a la realización de la muestra
de tamaño n extraída de la población X.
Prueba estadística elegida
Datos
(variables)
de la
Valor p
muestra
Pag. 27
BIOESTADISTICA 2
5 Criterio de rechazo de Ho: Comparar p y a
Si el valor p es más chico que el nivel de significación alfa, la hipótesis

nula es rechazada.
si p<a H0 se rechaza
Si el valor de p es mayor que alfa, la hipótesis nula no es rechazada.
p<a RECHAZO LA Ho ACEPTO LA H1.
 Se acepta que la diferencia entre los tratamientos no se debe al azar, pero, con
un % de confianza o % de error (alfa).
 La diferencia aceptada, es “significativa” o “estadísticamente significativa”,
porque la probabilidad de equivocarnos es bastante baja (pej. < del 5%).
RESUMEN
Resultados del Toma de decisiones
contraste de (conclusión del Condición
Hipótesis estudio)
Probabilidad de
% confianza
p< a Aceptar Acertar
Rechazar Ho
H1 Probabilidad de
Proceso : Equivocarse % error
Contraste
de hipótesis
Probabilidad de
No Rechazar % confianza
p >a Ho
No Aceptar Acertar
H1 Probabilidad de
Equivocarse % error
RECHAZAR = NO ACEPTAR NO RECHAZAR = ACEPTAR
Pag. 28
BIOESTADISTICA 2
PRUEBAS DE SIGNIFICACION
ESTADISTICA
 Son fórmulas estadísticas (matemáticas) que
permiten saber si hay diferencias significativas
(no por azar) entre dos resultados.
 Permiten al investigador
determinar si hay una
diferencia significativa
entre las medias
muestrales
¿Como seleccionar la prueba estadística adecuada?
Criterios de selección
 Tipo de variables
 Cuantitativa
 Cualitativa
 Tipos de preguntas de investigación
 Asociación (correlaciòn)
 Comparación (Factor de riesgo).
 Cuántos grupos se están comparando.
 Estructura de datos
 Independientes
 Dependientes (Pareados)
Pag. 29
BIOESTADISTICA 2
TIPO DE VARIABLE
 La elección del Método Analítico o Prueba Estadistica, esta

determinada principalmente por el tipo de variable con el
que se vaya a trabajar.
Test Paramétricos (porque se

 Variable cuantitativa conocen los parámetros estadísticos de
la población y muestra).
excepto
Cuando te indican que:
•La distribución de la muestra no es NORMAL
•La muestra es “muy pequeña”
•Escojas una Prueba No paramétrica
 Variable cualitativa Test No Paramétrico
Tipos de Pruebas estadísticas

En la estadística inferencial el investigador se encuentra
con dos tipos de técnicas:
Paramétricas
Son las más potentes y por consiguiente las inferencias que se
realizan son más fiables.
El inconveniente es que el investigador no siempre puede cumplir con
los requisitos y supuestos que exige el enfoque paramétrico, sobre
todo en investigaciones educativas y sociales.
No paramétricas
Son fáciles de utilizar y no son tan potentes como las paramétricas.
El análisis de datos cualitativos ha generado técnicas propias, que
actualmente constituyen toda una metodología específica que viene
marcada por la propia idiosincrasia cualitativa y que toma
determinadas opciones en relación a las unidades del registro de los
datos y la forma de tratarlos.
Pag. 30
BIOESTADISTICA 2
PRUEBAS PARAMETRICAS
Requisitos:
- Variables son cuantitativas (Escalas de intervalo y
proporciones).
- Variables tienen un comportamiento NORMAL.
- Selección de participantes o formación de grupos puede ser
dependientes o independientes.
- Varianzas de grupos son similares.
1. Test de la t de Student.
2. t de Student apareada.
3. ANOVA
4. Correlación de Pearson.
¿Qué es la prueba “t”

(t de student) ?
 Definición:
Es una prueba estadística para evaluar si
dos grupos difieren entre sí de
manera significativa respecto a sus
medias.
Se simboliza por “ t ”
Hipótesis a probar:
De diferencia entre dos grupos. La
hipótesis de investigación propone que William Sealey
los grupos difieren significativamente Gosset
entre sí y la hipótesis nula dice que no (“Student”)
difieren significativamente.
Pag. 31
BIOESTADISTICA 2
Características de las pruebas “t”

 Prueba t no pareada o independiente: prueba si las medias
estimadas de la población por 2 muestras independientes
difieren significativamente (grupo de hombres y grupo de
mujeres)
 Prueba t pareada: prueba si la media estimada de la población

por muestras dependientes difieren significativamente (media de
pre y post-tratamiento para el mismo grupo de pacientes.
 Existen dos versiones de la prueba t Student: una que supone

que las varianzas poblacionales son iguales y otra versión que
no asume esto último.
 PRUEBA F – Snedecor: Se aplica cuando existen varianzas
diferentes para ambos grupos de comparación.
 La igualdad de varianzas se conoce como homocedasticidad y

la no igualdad de varianzas como heterocedasticidad.
Concepto de grupos dependientes

o pareados: 3 situaciones
Cohorte
Diseños Cohorte
1 Analíticos
Casos Control expuesta
no
expuesta
Intervención
Diseño Cuasi
2 experimental
Antes Después
Experiment
al Tratamiento A
3 Ensayo cruzado
Control Tratamiento B
Pag. 32
BIOESTADISTICA 2
¿Qué es el análisis de varianza

unidireccional ? ANOVA (oneway)
Definición
Es una prueba estadística para analizar si más de dos grupos
(3 o mas), difieren significativamente entre sí en cuanto a
sus medias y varianzas.
La prueba “ t “ es utilizada para dos grupos y el análisis de
varianza unidireccional (ANOVA) se usa para tres o más
grupos
Hipótesis a probar:
De diferencia entre más de dos grupos, se propone que los
grupos difieren significativamente entre si y la nula propone
que no difieren
Concepto de Correlación (Regresión)

 Denota fuerza de relación entre variables
 Análisis de Correlación .- Es el conjunto de técnicas estadísticas

empleadas para medir la intensidad de la asociación entre dos variables.
El principal objetivo del estudio del análisis de correlación consiste en
determinar que tan intensa es la relación entre dos variables.
Pag. 33
BIOESTADISTICA 2
Coeficiente de correlación de Pearson

 Definición.- Es una prueba estadística para analizar la relación entre dos o más
variables cuantitativas. Se simboliza por “ r “ y sus valores son de -1 a +1
Mientras mas cerca a los extremos la relación es mas fuerte (positiva o negativa).
 Si “r” > 0, la correlación lineal es positiva (si sube el valor de una variable sube la otra).
La correlación es más fuerte cuanto más se aproxime a 1.
Por ejemplo: altura y peso: los alumnos más altos suelen pesar más.
 Si “r” < 0, la correlación lineal es negativa (si sube el valor de una variable disminuye el
de la otra). Esta correlación es tanto más fuerte cuanto más se aproxime a −1. Por
ejemplo: peso y velocidad: los alumnos más gordos suelen correr menos.
 Si “r” = 0, no existe correlación lineal entre las variables. Aunque podría existir otro
tipo de correlación (parabólica, exponencial, etc.)
 El Coeficiente de Determinación (r2) es el cuadrado del Coeficiente de

correlación e indica el porcentaje de variación que sufre una variable respecto a la otra.
Ejemplo: Si el r2 del peso – talla es 64%, significa que la variación del peso
se debe en 64% a la talla, el otro 36% se debe a otros factores.
PRUEBAS NO PARAMETRICAS
Requisitos:
-Variables son cualitativas (Escalas nominal y ordinal) o
cuantitativas con bajo tamaño muestral (n<30).
-No asumen nada respecto a la distribución de las variables.
-Selección de participantes independientes o dependientes.
 Chi cuadrado
 Test de Wilcoxon o del Rango con signo.
 Test de la U de Mann-Whitney.
 Test de Kruskal-Wallis.
 Coeficiente de correlación de spearman
 Test de Mc Nemar
 Test de Friedman.
Pag. 34
BIOESTADISTICA 2
Prueba chi cuadrado (chi² o X² o ji²)

La prueba chi-cuadrado es una prueba no paramétrica que se
emplea para medir la asociación entre dos o mas variables
cualitativas nominales cuando tenemos tablas de contingencia.
De manera general, el estadístico chi-cuadrado se obtiene así:
2 ( f e  ft ) 2
 
ft
Donde fe representa las frecuencias empíricas (observadas) y ft representa las
frecuencias teóricas (esperadas).
Total de Fila x Total de Columna

F. Esperada=
Total General
Caracterìsticas de la ji cuadrado
 Los datos deberán estar en forma de frecuencias. En general,

cuando las frecuencias absolutas esperadas, en la gran mayoría de
celdas son grandes (>5), se utiliza el X2 para realizar el contraste
mencionado.
 La Prueba Chi cuadrado no establece causalidad, solo de

asociación.
 En Tablas de 2 x 2, cuando una de las celdas (20% de celdas)

tiene <5 de frecuencia observada o esperada se usa
corrección de Yates (Mayor de 30 variables) o Prueba
exacta de Fisher (Menor de 30 variables).
 No tiene valores negativos. El valor mínimo es 0.
 Todas las curvas son asimétricas
Pag. 35
BIOESTADISTICA 2
Test de la U de Mann-Whitney.
Es una prueba no paramétrica aplicada a dos muestras

independientes, cuyos datos han sido medidos al menos
en una escala de nivel ordinal (mediana).
El test es virtualmente idéntico a la realización de una

prueba paramétrica ordinaria T student de dos muestras
independientes en los datos después de haber ordenado
las muestras combinadas.
“Estudiante Universitario Independiente”
Test de Wilcoxon o del Rango con

signo.
La prueba de los signos de Wilcoxon es una prueba no

paramétrica para comparar la mediana de dos muestras
relacionadas o dependientes (APAREADAS) y determinar si
existen diferencias entre ellas.
Se utiliza como alternativa a la prueba t de Student apareada

cuando no se puede suponer la normalidad de dichas
muestras.
Pag. 36
BIOESTADISTICA 2
Test de Kruskal-Wallis.
Es un método no paramétrico para probar si un

grupo de datos proviene de la misma población.
Intuitivamente, es idéntico al ANOVA con los datos
reemplazados por categorías. Es una extensión de
la prueba de la U de Mann-Whitney para 3 o más
grupos. (independientes)
TEST DE McNEMAR
Prueba no paramétrica para dos variables

dicotómicas relacionadas.
Contrasta los cambios en las respuestas utilizando

la distribución de chi-cuadrado.
Es útil para detectar cambios en las respuestas

debidas a la intervención experimental en los
diseños del tipo "antes-después“ o para
comparar dos tipos de tratamiento.
Pag. 37
BIOESTADISTICA 2
Test de Friedman
Esta es una prueba no parametrica desarrollada por el

economista Milton Friedman.
Este test es utilizado para comparar varias medianas

(variable cualitativa ordinal), solo que es utilizado cuando
estas medianas son del mismo grupo.
Es una versión no paramétrica del ANOVA para grupos

dependientes.
TEST DE KOLMOGOROV-SMIRNOV
 Para conocer si se puede suponer que los datos siguen

una distribución normal, se pueden realizar diversos
contrastes llamados de BONDAD DE AJUSTE.
 El Test de Kolmogorov-Smirnov es la prueba estadística

mas utilizada para demostrar si una colección de datos
sigue una distribución NORMAL (una Curva de Gauss)
 Otros tests empleados para la prueba de normalidad

son debidos a Saphiro y Wilks (< 30 elementos).
Pag. 38
BIOESTADISTICA 2
ESTADISTICO DE KAPPA
Índice de comparación de la concordancia entre dos

(02) observadores independientes sobre si el
resultado de una prueba diagnóstica es normal o
anormal.
Se usa para medir la repetibilidad del test

diagnóstico.
TABLAS RESUMEN DE PRUEBAS

ESTADISTICAS
Pag. 39
BIOESTADISTICA 2
FLUXOGRAMA PARA SELECCIONAR PRUEBA ESTADISTICA
¿Qué prueba estadística

debo elegir?
¿Tipo de
CUANTITATIVA variable? CUALITATIVA
PRUEBAS PARAMETRICAS PRUEBAS NO PARAMETRICAS
¿Qué ¿Qué
establece establece
entre variables? entre variables?
Comparación estadística Comparación estadística

Relación (Significación estadística Relación (Significación estadística
de las diferencias) de las diferencias)
¿Cuántos V. Ordinal V. Nominal

grupos?
2 >2 ¿Cuántos ¿Cuántos

grupos? grupos?
2 >2 2 >2
V. Ordinal
Dependientes e
Dependientes Independientes
independientes Depend. Independ. Independ. Depend. Dependientes Independientes
Correlación t student Correlación U de Mann Kruskall Nc Q de

de Pearson apareada
ANOVA
de Spearman
Wilcoxon
Whitney Wallis
Friedman
Nemar Cochrane
Chi
t de cuadrado
student
EJERCICIOS
1. ¿Con que Test se pueden comparar dos Chi cuadrado
proporciones?
2. ¿Cuál de las siguientes pruebas estadísticas puede

T de student
utilizarse para comparar las medias observadas
independiente
en dos muestras independientes?
3. ¿Cuál es la prueba de significación estadística que

permite analizar los estudios de investigación
Chi cuadrado
con datos categorizables que comparan dos o
mas grupos independientes medidos en escalas
nominales?
4. El Test no paramétrico que permite estudiar la Correlación de

relación entre dos variables cuantitativas es: spearman
Pag. 40
BIOESTADISTICA 2
EJERCICIOS
5. En un ensayo clínico se comparan 03 tratamientos,
la variable respuesta es continua. Aceptando que ANOVA
la variable tiene una distribución normal, el test
correcto para comparar la respuesta es:
6. Se desea comparar la colesterolemia en 3 ANOVA

muestras de sujetos, cada una de ellas
representativas. ¿Cuál de las siguientes será la
prueba apropiada?
7. Se determinó la colesterolemia de de un grupo de T de student

30 pacientes antes de iniciar un tto y 6 meses apareada
después. ¿Cuál es la prueba estadística es la mas
adecuada?
EJERCICIOS
8. La existencia de relación entre dos variables Correlación de
cuantitativas se verifica mediante el test de: pearson
9. La comparación entre dos medias apareadas se T de student

estudia con: apareada
10. Para comparar varias proporciones con datos

Chi cuadrado
independientes se aplica el test de:
11. Se compara la talla promedio entre 2 grupos de

niños que recibieron distintos patrones de Prueba T de
alimentación. Cada grupo comprendía 25 niños. student
Señale la prueba de significancia mas apropiada
12. Se desea comparar la intensidad de dolor, medida

en una escala ordinal, entre 2 grupos de sujetos Test de U de
que han recibido tto diferentes. La prueba Mann Withney
estadística es:
Pag. 41

Bioestadistica 2

Cargado por

Copyright:

Formatos disponibles

Bioestadistica 2

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Bioestadistica 2

Cargado por

Copyright:

Formatos disponibles

BIOESTADISTICA 2

INTRODUCCION A LA ESTADISTICA ANALITICA:

OBJETO DE ESTUDIO DE LA TEORIA DE

La probabilidad de ocurrencia de un evento es el grado de

¿Por qué es necesario aprender a

Aunque el resultado de ninguna prueba es absolutamente

EXPERIMENTO ALEATORIO: ESPACIOS MUESTRAL: SUCESO O EVENTO:

Es el conjunto de subconjunto del espacio

CLASICA o a priori ANTES DEL

Tipos de Sucesos o eventos

• Se llama suceso unión de A y B, al formado por los resultados

• Se llama suceso condicional o dependiente cuando la ocurrencia de

Simple Compuesta o Conjunta

Marginal Unión Intersección Condicional

Regla de Laplace Regla de Suma Regla de Multiplicación

¿Que tipo de probabilidad se

uno ¿Cuántos eventos se dos

Probabilidad marginal o Probabilidad compuesta

¿Te dan datos ¿Qué expresión

Probabilidad real Probabilidad clásica

Probabilidad de Probabilidad de Probabilidad

¿Los eventos son ¿Los eventos son

Regla de suma Regla de multiplicación

Un paciente ingresa a una farmacia. La probabilidad de

La probabilidad que un paciente sea intervenido

La probabilidad de que el personal auxiliar que labora en una clínica

¿Cuál es la probabilidad de que en una

Ejemplos de Probabilidad Condicional

Ejemplo: La siguiente tabla muestra el sexo de 50 pacientes de

Condición Paciente Paciente

Si se selecciona un paciente al azar:

A) ¿Cuál es la probabilidad que sea varón?

C) Dado que el paciente elegido resultó ser varón, ¿Cuál es la

probabilidad que sea repetidor?

A. Estadística Inferencial (Estimación o Inferencia)

• Muestra aleatoria: se considera aleatoria

• Tipos de estimación o inferencia: PARÁMETROS

OBJETIVO DE LA INFERENCIA = CONOCER EL PARAMETRO

ESTIMACION o INFERENCIA ESTIMACION o INFERENCIA

Existe la probabilidad que el N1 X 1= 58 Kg

estadístico o valor muestral sea el

Existe una probabilidad que el

CONFIANZA = PROBABILIDAD DE ACERTAR

• Intervalos de confianza: es el alcance o rango de la estimación que estamos

PROPIEDADES DE LA DISTRIBUCION DE PROBABILIDADES

En el caso de distribución normal de

Buscar la respuesta Buscar la respuesta

APLICACIÓN EN ESTADISTICA DESCRIPTIVA

• En que rango de Talla se encontrará el 95% de la población en la que

• En que rango de edades se encontrará el 99% de individuos de una

APLICACIÓN EN ESTADISTICA INFERENCIAL

• En un estudio en una población se ha encontrado una media de PAS en varones adultos

• La prevalencia de glicemia en una muestra representativa de 500 individuos es de 110

¿Para que sirve una muestra?

Pasos en el proceso de obtener una muestra

1. Determinar Tamaño de la muestra.

La tarea fundamental de la ESTADISTICA INFERENCIAL, es sacar conclusiones acerca de la

1. Tamaño de la muestra (n)