Bioestadistica 2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 41

BIOESTADISTICA 2

BIOESTADISTICA 5

INTRODUCCION A LA ESTADISTICA ANALITICA:

TEORIA DE
PROBABILIDADES

CONCEPTOS PREVIOS
El concepto de probabilidad nace con
el deseo del hombre de conocer con
certeza los eventos futuros.

OBJETO DE ESTUDIO DE LA TEORIA DE


PROBABILIDADES

FENOMENOS TEORIA DE
ALEATORIOS PROBABILIDADES

EXPERIMENTOS
(FENOMENOS)

FENOMENOS CIENCIAS
DETERMINISTICOS EXACTAS

Pag. 1
BIOESTADISTICA 2

PROBABILIDAD
 La probabilidad es la parte de las matemáticas que se encarga
del estudio de fenómenos o experimentos aleatorios (se repite
bajo las mismas condiciones y el resultado no siempre es el
mismo).

La probabilidad de ocurrencia de un evento es el grado de


certeza (confianza) con que este puede ocurrir

¿Por qué es necesario aprender a


calcular probabilidades?

Aunque el resultado de ninguna prueba es absolutamente


exacto, eso no afecta la probabilidad de la presencia o
ausencia de una enfermedad. Por lo tanto, entender las
probabilidades es fundamental para el proceso de toma de
decisiones y para esta preparados ante la ocurrencia de un
evento.

CONCEPTOS BASICOS

EXPERIMENTO ALEATORIO: ESPACIOS MUESTRAL: SUCESO O EVENTO:

Es el conjunto de subconjunto del espacio


Acción voluntaria cuyos
TODOS los resultados muestral, seleccionado de
resultados están sujetos al
posibles de un acuerdo a una condición
azar.
experimento aleatorio. (“Es lo que se espera que
ocurra”)..

Pag. 2
BIOESTADISTICA 2

Tipos de Probabilidades
Aunque parezca un concepto simple, debido a que es utilizado
cotidianamente de manera intuitiva , su definición formal puede ser
complicada desde el punto de vista matemático.

CLASICA o a priori ANTES DEL


EXPERIMENTO
(TEORICA)

OBJETIVA

FRECUENCIA RELATIVA
PROBABILIDADES DESPUES DEL
o a posteriori (REAL) EXPERIMENTO

SUBJETIVA o personalistica

Tipos de Sucesos o eventos


SIMPLE
• Se llama suceso simple, marginal o individual, a un solo evento «A»
(del espacio muestral), que es de interés conocer su probabilidad de
ocurrencia.

COMPUESTO

• Se llama suceso unión de A y B, al formado por los resultados


experimentales que están en A o en B (incluyendo los que están en
ambos) y que se simboliza como: AUB,
• Se llama suceso intersección de A y B, al formado por los resultados
experimentales que están simultáneamente en A y B, y que se
simboliza como A∩B o simplemente AB

• Se llama suceso condicional o dependiente cuando la ocurrencia de


un evento A depende de la ocurrencia de un evento B (condición)

Pag. 3
BIOESTADISTICA 2

CALCULO DE PROBABILIDADES

Simple Compuesta o Conjunta

Marginal Unión Intersección Condicional

7
P( X ) P( X  Y ) P( X  Y ) P( X | Y )
La probabilidad de La probabilidad de La probabilidad de La probabilidad de
que ocurra que ocurran dos que ocurra dos que ocurra
eventos eventos a la vez
X X “sabiendo que”
X o Y o ambos XeY ha ocurrido Y

X X Y X Y
Y

Regla de Laplace Regla de Suma Regla de Multiplicación

¿Que tipo de probabilidad se


quiere calcular?

uno ¿Cuántos eventos se dos


quieren medir?

Probabilidad marginal o Probabilidad compuesta


individual o conjunta

¿Te dan datos ¿Qué expresión


si o valores no gramatical
en la pregunta? reconoces?

Probabilidad real Probabilidad clásica


AoB AyB A dado que B
(a posteriori) (a priori)

Probabilidad de Probabilidad de Probabilidad


unión intersección condicional

¿Los eventos son ¿Los eventos son


excluyentes? independientes?
P a = N° de eventos a / P a = Evento a /
N° de eventos totales x 100 Espacio muestral x 100
no si si no

Regla de La Place
P (a U b) = Pa + Pb – P (a n b) P (a n b) = Pa * Pb

P (a U b) = Pa + Pb P (a / b) = P (a n b) / Pb

Regla de suma Regla de multiplicación

Pag. 4
BIOESTADISTICA 2

Ejercicio:

Un paciente ingresa a una farmacia. La probabilidad de


que compre (a) un analgésico es 0,60 (b) un
descongestionante es 0,50, y (c) un analgésico y un
descongestionante es 0,30 ¿Cuál es la probabilidad de
que compre un analgésico, un descongestionante o
ambos?.

P(A) = 0,60
P(AUD) = P(A) + P(D) - P (A D)
U
P(D) = 0,50
U P(AUD) = 0,60 + 0,50 - 0,30
P (A D) = 0,30 P(AUD) = 0,80

Pag. 5
BIOESTADISTICA 2

La probabilidad que un paciente sea intervenido


quirúrgicamente del corazón es 0,2 y de los
riñones es 0,3 ¿Cuál es la probabilidad de que un
paciente cualquiera haya tenido una intervención
al corazón o a los riñones?

P(C) = 0,2
P(R) = 0,3 P(CUR) = P(C) + P(R)
= 0,2  0,3
P(CUR) = 0,5

La probabilidad de que el personal auxiliar que labora en una clínica


llegue tarde el día lunes es 0,50 y la probabilidad de que llegue
retrasado los días lunes y martes es 0,20. Dado que cierto
trabajador llegó tarde el día lunes, ¿cuál es la probabilidad de que
llegue tarde el día siguiente?.

 TL )
P(TL ) = 0,50 P(TM
TL
) = P(T M
P(TL )
P(TL  TM ) = 0,20
0,20
= = 0,40
0,50

Pag. 6
BIOESTADISTICA 2

¿Cuál es la probabilidad de que en una


familia con dos hijos, ambos sean varones?

P(V1 )  0,5
P(V2 )  0,5
P (V1  V2 )  P(V1 )  P(V2 )

= (0,5) (0,5)

P (V1  V2 )  0,25

Ejemplos de Probabilidad Condicional


Es la Probabilidad que se presente un evento “A” “dado
que” se presente un evento “B”

Ejemplo: La siguiente tabla muestra el sexo de 50 pacientes de


un hospital, así como su condición de ¨nuevo¨ (si asiste por
primera vez) o ¨repetidor¨ (si no es la primera vez que asiste)

Condición Paciente Paciente


Sexo Nuevo Repetidor Total
Masculino 18 12 30
Femenino 13 7 20
Total 31 19 50

Si se selecciona un paciente al azar:

Pag. 7
BIOESTADISTICA 2

A) ¿Cuál es la probabilidad que sea varón?


30
P(V ) =  0,60
50
La probabilidad de que un paciente seleccionado al azar sea
varón es 0,60
B) ¿Cuál es la probabilidad que sea varón y repetidor?
12
P(V  R) =  0,24
50
La probabilidad de que un paciente seleccionado al azar sea un
varón y repetidor es 0,24

C) Dado que el paciente elegido resultó ser varón, ¿Cuál es la

probabilidad que sea repetidor?


12
P( R )=  0,40
V 30

Bioestadistica 6

ESTADISTICA ANALITICA

Pag. 8
BIOESTADISTICA 2

Estadística Analítica

OBJETIVOS

Estimar
parámetros Probar hipótesis
(inferencia)

A. Estadística Inferencial (Estimación o Inferencia)


• La Estadística inferencial que toma la
información de la estadística descriptiva para
realizar procesos que permiten, dentro de
ciertos rangos de confianza, determinar el
comportamiento probable de la población que es
representada por la Muestra

• Muestra aleatoria: se considera aleatoria


siempre y cuando cada observación, medición o ESTADÍGRAFOS
individuo de la población tenga la misma (estadísticos)
probabilidad de ser seleccionado (azar).

• Tipos de estimación o inferencia: PARÁMETROS


• Estimación puntual: Se trabaja con una muestra.
• Estimación por intervalos de confianza: Se trabaja con varias muestras.
Se propone un intervalo de valores, en el que se encontrará el parámetro
con cierta probabilidad (nivel de confianza).

Pag. 9
BIOESTADISTICA 2

OBJETIVO DE LA INFERENCIA = CONOCER EL PARAMETRO

ESTIMACION o INFERENCIA ESTIMACION o INFERENCIA


PUNTUAL POR INTERVALO

Existe la probabilidad que el N1 X 1= 58 Kg

estadístico o valor muestral sea el


verdadero valor o Parámetro buscado.
N2 X 2= 54 Kg
POBLACION
X = 63 Kg N
(P)
N3 X 3= 62 Kg

N4 X 4= 61 Kg

Existe una probabilidad que el


verdadero valor o Parámetro 54 Kg 62 Kg
buscado, se encuentre en el rango
(P)

CONFIANZA = PROBABILIDAD DE ACERTAR

• Nivel o grado de confianza: probabilidad que asociamos con una estimación del
intervalo. Se representa con (1 - a). Los niveles más utilizados son 0,90 0,95 y 0,99. Se
utiliza cuando se trabaja con estadística inferencial o probabilística.

• Intervalos de confianza: es el alcance o rango de la estimación que estamos


haciendo. Es el rango de valores entre los cuales existe la probabilidad que se
encuentre el valor real o Parámetro de la población.

GRADO DE CONFIANZA
(probabilidad de acertar)

INTERVALO DE CONFIANZA
(rango de valores)

Pag. 10
BIOESTADISTICA 2

PROPIEDADES DE LA DISTRIBUCION DE PROBABILIDADES


(ADAPATADO DE CHEBISHEV)

En el caso de distribución normal de


probabilidades las áreas representan: Puntos
de
• El 68% de probabilidades se inflexión
encuentra en 1 desviación
estándar de la media.
• El 95,5% de probabilidades se
encuentra en 2 (1.96) desviación
estándar de la media.
   +
• El 99,7% de probabilidades se
encuentra en 3 (2.6) desviación  - + 
estándar de la media ,
Mo,
Mn

OJO: Pregunta de
bioestadística

¿Qué tipo
de
descriptiva estadística analítica
es?

Terminología Terminología
•Muestra •Muestra
•Media representativa
•Desviación •Estimación
estándar y •Error estándar
•Rango o •Intervalo de
intervalo. confianza.

Buscar la respuesta Buscar la respuesta


que este redactada en que este redactada en
términos absolutos terminología
(descriptivos). probabilística.
Descartar cualquiera Descartar cualquiera
que tenga terminología que este redactada en
inferencial términos absolutos.

Pag. 11
BIOESTADISTICA 2

APLICACIÓN EN ESTADISTICA DESCRIPTIVA


• Diga ud. ¿cual es el intervalo de peso en Kg. en el que se encontrará el
68% de individuos de un marco muestral, en el cual la media de peso
es de 78Kg con una DS de + - 6 Kg.? .

• En que rango de Talla se encontrará el 95% de la población en la que


se sabe que la media de talla es de 160 cm con una DS de + - 15 cm?

• En que rango de edades se encontrará el 99% de individuos de una


muestra (marco), cuya media aritmética fue de 35 años con una DS de
+- 3 años.

APLICACIÓN EN ESTADISTICA INFERENCIAL


• En un estudio transversal sobre una muestra de sujetos representativos de una
comunidad , se ha observado una prevalencia de HTA de 20% (intervalo de confianza
95% : 15 -25%). La afirmación correcta es:
▫ a. Se tiene un 95% de confianza de que el intervalo de 15 a 25%, incluye el verdadero
valor de la prevalencia de la HTA de la comunidad.
▫ b. La prevalencia real de la HTA de la comunidad se sitúa entre el 15 y 25%.

• En un estudio en una población se ha encontrado una media de PAS en varones adultos


de 120 mmHg, con un error estándar de 2. con un intervalo de confianza al 95%. La
afirmación correcta es:
▫ a. El 95% de los varones adultos de la población tienen una PAS entre 115 a 126
mmHg.
▫ b. Existe una probabilidad del 95% que el verdadero valor de la PAS de la población
este entre 116 a 124 mmHg.

• La prevalencia de glicemia en una muestra representativa de 500 individuos es de 110


mg% con un intervalo de confianza del 95%, cuyos límites son: 90 y 130 mg%. Cuál es la
afirmación correcta:
▫ a. Existe un 95% de confianza de que el intervalo 90 a 130 mg% incluya al verdadero
valor de la prevalencia de la glicemia de la comunidad.
▫ b. Existe un 95% de confianza de que la prevalencia de la glicemia en dicha comunidad
es de 110 mg%.

Pag. 12
BIOESTADISTICA 2

Bioestadistica 7

TEORIA DE
MUESTREO

¿Para que sirve una muestra?


Una muestra sirve para hacer inferencias acerca de los
parámetros de una población en base a la información
obtenida de la muestra.
características:
• Debe Representar a la población (Representativa)
• Debe generar resultados Confiables
• Disminuir Costos
• Disminuir Sesgos

Pasos en el proceso de obtener una muestra


representativa:

1. Determinar Tamaño de la muestra.


2. Aplicar el método aleatorio de selección de la muestra.

La tarea fundamental de la ESTADISTICA INFERENCIAL, es sacar conclusiones acerca de la


población a partir de una muestra extraída de la misma (Aproximarse al Parámetro a partir
de Estadísticos).

Pag. 13
BIOESTADISTICA 2

1. Tamaño de la muestra (n)


El tamaño muestral depende de tres factores:
El grado de confianza: Es la probabilidad de acertar en la
inferencia. A mayor tamaño muestral mayor confianza.
El grado de error: Es la probabilidad de equivocarnos en
la inferencia. A mayor tamaño muestral menor error.
El nivel de variabilidad: Es el grado de homogeneidad o
heterogeneidad de la composición de la población. A
mayor variabilidad poblacional, se requiere mayor tamaño
muestral.

2. Método aleatorio de selección de la muestra


Para que la inferencia sea válida el muestreo debe ser aleatorio o
probabilístico.

Aleatoriedad de la selección: Se refiere a que cada elemento


del universo (población) debe tener la misma probabilidad de ser
elegido en la muestra.

TIPOS DE MUESTREO PROBABILISTICO


1. MUESTREO ALEATORIO SIMPLE

Características
• Escoge al azar los miembros del marco poblacional (universo) hasta
completar el tamaño muestral previsto.
• Se enumeran todos los miembros del marco poblacional y de acuerdo
con una tabla de números aleatorios se van escogiendo (mecánica o
digitalmente).
• Se aplica fundamentalmente en marcos poblacionales pequeños y
plenamente identificados y homogéneas.

Tipos
Muestreo sin reemplazo
Se selecciona solo una vez cada muestra.

Muestreo con reemplazo


Se puede incluir dos o más veces en la muestra.

Pag. 14
BIOESTADISTICA 2

TIPOS DE MUESTREO PROBABILISTICO


2. MUESTREO ALEATORIO SISTEMATICO

•Este tipo de muestreo se utiliza:

1- Cuando no se puede armar un marco muestral para la selección de la


muestra.
2- Cuando las unidades de muestreo tienen cierto orden.
3- Siempre que las poblaciones sean móviles o que sufran evoluciones

Por ejemplo: De un total de 400 HC, se decide un tamaño de muestra de


20 HC, para lo cual se define como intervalo K: 400/20 = 20, es decir cada
unidad muestral se tomará 1 dejando 20 HC.

TIPOS DE MUESTREO PROBABILISTICO

3. MUESTREO ESTRATIFICADO

Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está
compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra
que contenga también esa misma proporción.

Pag. 15
BIOESTADISTICA 2

ESTRATOS Homogéneos en su interior; diferentes


entre sí en propiedades y tamaño

Comuna B

Comuna A

Comuna C

Comuna D

Los estratos más grandes


Tienen mayor probabilidad de ser representados

EJEMPLO:

Población
heterogénea
para la variable
edad

No se puede aplicar métodos aleatorios porque cada


miembro no tiene la misma posibilidad de ser elegido, por
lo tanto debemos “homogenizar” la población:
ESTRATIFICAR

Población
homogénea
para la variable
edad

ESTRATO ESTRATO ESTRATO


NIÑOS ANCIANOS ADOLESCENTES

Pag. 16
BIOESTADISTICA 2

TIPOS DE MUESTREO PROBABILISTICO


4. MUESTREO POR CONGLOMERADOS

Los miembros del grupo mayoritario tienen una mayor


probabilidad de ser seleccionados en la muestra

No se cumple la aleatoridad

En las Unidades de observación se eligen aleatoriamente al interior de


los conglomerados

El error de la medición (error muestral) no se da al interior del


conglomerado sino entre los conglomerados

Antes de hacer inferencias, el analista deberá examinar la


variabilidad interna de cada conglomerado y la variabilidad entre
ellos, pues es posible que algunos de los conglomerados no sean
representativos del universo.

Ejemplo: Para identificar los factores de riesgo vulnerables de la enfermedad


ateroesclerótica en los trabajadores agrícolas de una provincia, se seleccionan
aleatoriamente un número de cooperativas de producción agropecuaria y se estudian a
todos los trabajadores de dichos centros.

CONGLOMERADOS
Grupo 1A

Grupo 5C

Grupo 2A

Grupo 3B

Heterogéneos en su interior; diferentes entre sí en


propiedades y tamaño

Pag. 17
BIOESTADISTICA 2

ERRORES DE LA MEDICIÓN ESTADISTICA


Al trabajar con datos muestrales en los procesos de investigación
epidemiológica, se pueden presentar dos tipos de errores:
• Error Aleatorio (Error Estándar)
• Error Sistemático (Sesgos)

Error Aleatorio Sesgo

Imprecisión Invalidez

ERRORES DE LA MEDICIÓN

Error Aleatorio Sesgos


(Error Estándar) (errores sistemáticos)

Diferencia (variabilidad) de Diferencia sistemática entre


las mediciones alrededor del las mediciones y el valor
valor verdadero (Parámetro), verdadero (PARÁMETRO),
debida al azar. NO SE PUEDE debida a problemas de
ELIMINAR, SOLO SE PUEDE diseño. SE PUEDE Y SE DEBE
REDUCIR ELIMINAR.

Aumenta con: Relacionados con:


Adelanto diagnóstico
Muestras pequeñas
Notificación
Recuerdo
Variabilidad del fenómeno
Selección

Afectan la precisión Afectan la validez

Pag. 18
BIOESTADISTICA 2

Tipos de Sesgos
•Error sistemático introducido en la
planeación del estudio

•Sesgo de Selección: Errores que se


cometen al escoger los individuos para
formar los grupos de investigación.

•Sesgo de Información (ejecucion):


Errores que se cometen en cualquier fase
de tratamiento de la información (recojo,
organización, procesamiento o
interpretación)

Tipos de sesgo de selección

• Sesgo de confusión.

• Sesgo Berksoniano – Puede haber una asociación


espuria entre enfermedades o entre una
característica y una enfermedad debido a las
diferentes probabilidades de admisión a un
hospital para aquellos con la enfermedad, sin la
enfermedad pero con la característica de interés

• Sesgo de respuesta – aquellos que aceptan estar en


un estudio pueden ser de alguna forma diferentes a
los que rehusan participar

– Voluntarios son diferentes de aquellos enlistados

Pag. 19
BIOESTADISTICA 2

Tipos de sesgo de información


• Sesgo del entrevistador – el conocimiento de un entrevistador puede
influenciar la estructura de preguntas y la manera de presentar las respuestas.

• Sesgo de pérdida o seguimiento – aquellos que son perdidos en el


seguimiento o quienes se retiran pueden afectar el procesamiento de datos

• Sesgo de instrumento – Cuando el equipo o instrument que se utiliza para


recojer o procdesar información no está calibrado

• Sesgo de recuerdo o memoria – aquellos (as) con una exposición o


resultados particulares pueden recordar eventos más claramente o ampliar sus
pensamientos sobre el evento

• Sesgo del observador – observadores pueden tener expectativas


preconcebidas de lo que deberían encontrar en un exámen

• Sesgo de vigilancia o monitoreo – el grupo con la exposición o el resultado


pueden ser seguidos más estrechamente o por más tiempo que el grupo de
comparación: Efecto Hawthorne

• Efecto Placebo – La subjetividad e interéses de los participantes pueden


alterar la veracidad de los datos

Controles para sesgos


TIPOS DE SESGO CONTROL
Confusión Apareamiento de grupos.
SESGO DE
Berksoniano No elegir a pacientes hospitalizados
SELECCIÓN
Voluntariado No pedir voluntarios para estudios experimentales

Entrevistador / Capacitar mejor a entrevistadores y observadores y


observador estandarizar herramientas y procedimientos
Incrementar el número de individuos en estudios
Pérdida o seguimiento
prospectivos.
Instrumentos (mal
Calibrar los instrumentos de medición a ser utilizados
calibración)
Evitar recopilar información apelando a la memoria de la
Recuerdo o memoria
gente. Se prefiere identificar fuente secundaria.

Vigilancia (Hawtorne) No sobre vigilar a un grupo respecto a otro.


SESGO DE
INFORMACION Para evitar la subjetividad evitar que las personas
conozcan las condiciones de la experimentación:

CEGADO O ENMASCARAMIENTO:

Estudio con ciego simple: los sujetos no saben de si ellos


Percepción (ensayos
están en el grupo experimental o en el control
clínicos)
Estudio doble ciego: el sujeto y el observador no saben la
situación del sujeto.

Estudio triple ciego: el sujeto, el observador y el analista


de los datos no saben de la situación del sujeto.

Pag. 20
BIOESTADISTICA 2

ESTADISTICA ANALITICA:

PRUEBA DE HIPOTESIS
(CONTRASTE DE HIPOTESIS)

Bioestadística 8

Hipótesis: definición
 Son suposiciones que
relacionan una variable con
otra y que serán probadas a
través de la investigación,
con el fin de ser aceptadas o
rechazadas por medio de los
resultados obtenidos.

 Son ante todo, enunciados


que expresan afirmaciones
o negaciones sobre la
realidad.

A B
(Variable (Variable
independiente) dependiente)

Pag. 21
BIOESTADISTICA 2

¿Qué es la prueba de hipotesis?

Es un procedimiento estadístico,
(matemático), una herramienta
de análisis de datos que permite
ACEPTAR o RECHAZAR la
Hipótesis estadística (NULA).

Mide la significancia estadística, es


decir, mide la probabilidad
matemática de que la hipótesis
científica sea verdadera.

1. Establecer la hipótesis nula y la alternativa


2. Elegir el error estadístico tolerable: nivel de significación o el grado de
error esperado: nivel crítico para alfa (generalmente es 5% o 0.05)
3. Elegir un estadístico de contraste (Prueba estadística o de
significancia)
4. Procesamiento de datos del experimento para calcular el estadístico
de la muestra aleatoria (obtener “valor p”).
5. Comparar el “valor p” con el valor “alfa” para concluir si la Hipotesis
nula se rechaza o no (Criterio de rechazo).

P>a
NO ACEPTA
No
Hipótesis Nula PE
Rechazar la Ho
Hipótesis
1 2 3 4 5 Alterna
Hipótesis a p Rechazar la Ho
científica ACEPTA
Contraste de hipótesis

Hipótesis Alterna P<a

Pag. 22
BIOESTADISTICA 2

1 Establecer las Hipótesis estadísticas

En el proceso de la estadística inferencial, hay dos tipos de hipótesis claves:

 LA HIPOTESIS NULA (Ho), se construye artificialmente para que el investigador


evalúe su hipótesis de investigación. Plantea que no existe relación entre los dos
fenómenos comparados. ES LA QUE SE DEBE CONTRASTAR.

 LA HIPOTESIS ALTERNA (H1), es la hipótesis complementaria que


simplemente señala la existencia de un hecho o de un evento (representa a la
hipótesis de investigación o experimental), o la relación entre dos o más
fenómenos. ES COMPLEMENTARIA A LA ANTERIOR.

EJEMPLO:
Hipótesis científica: El nivel de colesterol en sangre de los hombres difiere del de
las mujeres
Hipótesis estadística (NULA): el promedio de la variable Nivel de colesterol En
sangre de la población de Hombres es igual al promedio de esa misma Distribución
en la población de mujeres.

Ho:  hombres =  mujeres

Hipótesis Experimental:
El fármaco “A” (variable independiente) provoca una reducción importante de la
PA (variable dependiente).

Grupo experimental RESULTADOS

Fármaco X PA
A (ge)

comparar
Grupo control

Placebo
B X PA
(gc)

X PA X PA X PA X PA
= =
(ge) (gc) (ge) (gc)

HIPOTESIS ALTERNA HIPOTESIS NULA


(Hipótesis experimental)

Pag. 23
BIOESTADISTICA 2

Hipótesis: La Droga A es útil para tratar la enfermedad


Realidad de la H0
Verdadera Falsa
(Droga A no sirve)- (Droga A sirve) +
Error de tipo II
p>a
Correcto El tratamiento sí tiene
No rechazo H0 efecto pero no lo
(grado de percibimos.
confianza Probabilidad β
(Droga A no
sirve) 1- α)
Proceso
matemático: - VN FN
contraste de
la hipótesis p<a Error de tipo I
(GRAVE) Correcto
Rechazo H0
El tratamiento no tiene (Poder de la
efecto pero se decide que
sí. Prueba
(Droga A sirve) 1- β)
Probabilidad α
+ FP VP

EL CONTRATSE DE HIPOTESIS ES UN PROCESO MATEMATICO QUE


TRATA DE ENCONTRAR LA VERDAD

EJEMPLO GOLD ESTANDAR

ENFERMO SANO
PRUEBA DE
TAMIZAJE

POSITIVA VERDADERO FALSO POSITIVO


POSITIVO (error)
NEGATIVA FALSO NEGATIVO VERDADERO
(error) NEGATIVO

REALIDAD

CULPABLE INOCENTE
DECISION DEL
JURADO

CULPABLE JUSTICIA Injusticia


(error grave)
INOCENTE Injusticia JUSTICIA
(error)

Pag. 24
BIOESTADISTICA 2

ERROR DE TIPO I (a)


 Es rechazar estadísticamente, una hipótesis nula siendo esta
verdadera en la realidad (ERROR GRAVE).
MNEMOTECNIA:

ERROR TIPO I

RECHAZAR Ho

SIENDO Ho, VERDADERA

Es claro que se puede reducir de dos maneras:


- Aumentando la región de aceptación (gràficamente)
- Aumentando el tamaño de la muestra

Nivel de confianza (1 – a)
Representa el complemento del error tipo I, es decir la
probabilidad de no rechazar la hipótesis nula siendo ésta
verdadera (acierto).
Se representa con (1 - a). Los niveles más utilizados son 0,90
0,95 y 0,99.

Pag. 25
BIOESTADISTICA 2

ERROR DE TIPO II (β)


 Error tipo Beta: o tipo II, es aceptar una hipótesis nula siendo falsa
 Nemotecnia: es la inversa al error tipo I o alfa:

inverso NO RECHAZAR Ho

inverso
SIENDO Ho, FALSA

Se observa la existencia de una relación inversa entre la


magnitud de los errores a y b : conforme a aumenta, b
disminuye.

Poder de la Prueba (Potencia del test)

(1-b)
La meta de todo investigador en el proceso de contraste de
hipotesis es: rechazar la hipótesis nula, por ello es
importante que la prueba tenga dicho poder.

El poder de la prueba se debe entender como la capacidad que


tiene la prueba estadística de RECHAZAR LA HIPOTESIS
NULA SIENDO ESTA FALSA.

Pag. 26
BIOESTADISTICA 2

3 Elegir el estadístico de contraste (Prueba estadística)

Para cada tipo de diseño se debe elegir una Prueba de contraste


particular:

PRUEBAS PARAMETRICAS PRUEBAS NO PARAMETRICAS

T de student independiente Chi cuadrado


T de student apareada Wilcoxon
ANOVA U de Mann Whitney
Correlación de pearson Mc Nemar
Kruskall wallis
Correlaciòn de pearson

4 Procesar los datos con la Prueba estadística elegida:


obtener el valor P

Valores P
el P valor o nivel de significación empírico del contraste (a
posteriori) es el dato obtenido a partir del valor del estadístico
del contraste (Prueba estadística o de significancia) , en las
observaciones que corresponden a la realización de la muestra
de tamaño n extraída de la población X.

Prueba estadística elegida

Datos
(variables)
de la
Valor p
muestra

Pag. 27
BIOESTADISTICA 2

5 Criterio de rechazo de Ho: Comparar p y a

Si el valor p es más chico que el nivel de significación alfa, la hipótesis


nula es rechazada.

si p<a H0 se rechaza
Si el valor de p es mayor que alfa, la hipótesis nula no es rechazada.

p<a RECHAZO LA Ho ACEPTO LA H1.

 Se acepta que la diferencia entre los tratamientos no se debe al azar, pero, con
un % de confianza o % de error (alfa).
 La diferencia aceptada, es “significativa” o “estadísticamente significativa”,
porque la probabilidad de equivocarnos es bastante baja (pej. < del 5%).

RESUMEN
Resultados del Toma de decisiones
contraste de (conclusión del Condición
Hipótesis estudio)

Probabilidad de
% confianza
p< a Aceptar Acertar
Rechazar Ho
H1 Probabilidad de
Proceso : Equivocarse % error
Contraste
de hipótesis
Probabilidad de
No Rechazar % confianza
p >a Ho
No Aceptar Acertar
H1 Probabilidad de
Equivocarse % error

RECHAZAR = NO ACEPTAR NO RECHAZAR = ACEPTAR

Pag. 28
BIOESTADISTICA 2

PRUEBAS DE SIGNIFICACION
ESTADISTICA
 Son fórmulas estadísticas (matemáticas) que
permiten saber si hay diferencias significativas
(no por azar) entre dos resultados.

 Permiten al investigador
determinar si hay una
diferencia significativa
entre las medias
muestrales

¿Como seleccionar la prueba estadística adecuada?

Criterios de selección

 Tipo de variables
 Cuantitativa
 Cualitativa
 Tipos de preguntas de investigación
 Asociación (correlaciòn)
 Comparación (Factor de riesgo).

 Cuántos grupos se están comparando.

 Estructura de datos
 Independientes
 Dependientes (Pareados)

Pag. 29
BIOESTADISTICA 2

TIPO DE VARIABLE

 La elección del Método Analítico o Prueba Estadistica, esta


determinada principalmente por el tipo de variable con el
que se vaya a trabajar.

Test Paramétricos (porque se


 Variable cuantitativa conocen los parámetros estadísticos de
la población y muestra).
excepto
Cuando te indican que:
•La distribución de la muestra no es NORMAL
•La muestra es “muy pequeña”
•Escojas una Prueba No paramétrica

 Variable cualitativa Test No Paramétrico

Tipos de Pruebas estadísticas


En la estadística inferencial el investigador se encuentra
con dos tipos de técnicas:

Paramétricas
Son las más potentes y por consiguiente las inferencias que se
realizan son más fiables.
El inconveniente es que el investigador no siempre puede cumplir con
los requisitos y supuestos que exige el enfoque paramétrico, sobre
todo en investigaciones educativas y sociales.

No paramétricas
Son fáciles de utilizar y no son tan potentes como las paramétricas.
El análisis de datos cualitativos ha generado técnicas propias, que
actualmente constituyen toda una metodología específica que viene
marcada por la propia idiosincrasia cualitativa y que toma
determinadas opciones en relación a las unidades del registro de los
datos y la forma de tratarlos.

Pag. 30
BIOESTADISTICA 2

PRUEBAS PARAMETRICAS
Requisitos:
- Variables son cuantitativas (Escalas de intervalo y
proporciones).
- Variables tienen un comportamiento NORMAL.
- Selección de participantes o formación de grupos puede ser
dependientes o independientes.
- Varianzas de grupos son similares.

1. Test de la t de Student.
2. t de Student apareada.
3. ANOVA
4. Correlación de Pearson.

¿Qué es la prueba “t”


(t de student) ?
 Definición:
Es una prueba estadística para evaluar si
dos grupos difieren entre sí de
manera significativa respecto a sus
medias.

Se simboliza por “ t ”

Hipótesis a probar:
De diferencia entre dos grupos. La
hipótesis de investigación propone que William Sealey
los grupos difieren significativamente Gosset
entre sí y la hipótesis nula dice que no (“Student”)
difieren significativamente.

Pag. 31
BIOESTADISTICA 2

Características de las pruebas “t”


 Prueba t no pareada o independiente: prueba si las medias
estimadas de la población por 2 muestras independientes
difieren significativamente (grupo de hombres y grupo de
mujeres)

 Prueba t pareada: prueba si la media estimada de la población


por muestras dependientes difieren significativamente (media de
pre y post-tratamiento para el mismo grupo de pacientes.

 Existen dos versiones de la prueba t Student: una que supone


que las varianzas poblacionales son iguales y otra versión que
no asume esto último.
 PRUEBA F – Snedecor: Se aplica cuando existen varianzas
diferentes para ambos grupos de comparación.

 La igualdad de varianzas se conoce como homocedasticidad y


la no igualdad de varianzas como heterocedasticidad.

Concepto de grupos dependientes


o pareados: 3 situaciones
Cohorte
Diseños Cohorte
1 Analíticos
Casos Control expuesta
no
expuesta

Intervención

Diseño Cuasi
2 experimental
Antes Después

Experiment
al Tratamiento A

3 Ensayo cruzado

Control Tratamiento B

Pag. 32
BIOESTADISTICA 2

¿Qué es el análisis de varianza


unidireccional ? ANOVA (oneway)

Definición
Es una prueba estadística para analizar si más de dos grupos
(3 o mas), difieren significativamente entre sí en cuanto a
sus medias y varianzas.
La prueba “ t “ es utilizada para dos grupos y el análisis de
varianza unidireccional (ANOVA) se usa para tres o más
grupos

Hipótesis a probar:
De diferencia entre más de dos grupos, se propone que los
grupos difieren significativamente entre si y la nula propone
que no difieren

Concepto de Correlación (Regresión)


 Denota fuerza de relación entre variables

 Análisis de Correlación .- Es el conjunto de técnicas estadísticas


empleadas para medir la intensidad de la asociación entre dos variables.
El principal objetivo del estudio del análisis de correlación consiste en
determinar que tan intensa es la relación entre dos variables.

Pag. 33
BIOESTADISTICA 2

Coeficiente de correlación de Pearson


 Definición.- Es una prueba estadística para analizar la relación entre dos o más
variables cuantitativas. Se simboliza por “ r “ y sus valores son de -1 a +1

Mientras mas cerca a los extremos la relación es mas fuerte (positiva o negativa).

 Si “r” > 0, la correlación lineal es positiva (si sube el valor de una variable sube la otra).
La correlación es más fuerte cuanto más se aproxime a 1.
Por ejemplo: altura y peso: los alumnos más altos suelen pesar más.

 Si “r” < 0, la correlación lineal es negativa (si sube el valor de una variable disminuye el
de la otra). Esta correlación es tanto más fuerte cuanto más se aproxime a −1. Por
ejemplo: peso y velocidad: los alumnos más gordos suelen correr menos.

 Si “r” = 0, no existe correlación lineal entre las variables. Aunque podría existir otro
tipo de correlación (parabólica, exponencial, etc.)

 El Coeficiente de Determinación (r2) es el cuadrado del Coeficiente de


correlación e indica el porcentaje de variación que sufre una variable respecto a la otra.

Ejemplo: Si el r2 del peso – talla es 64%, significa que la variación del peso
se debe en 64% a la talla, el otro 36% se debe a otros factores.

PRUEBAS NO PARAMETRICAS
Requisitos:
-Variables son cualitativas (Escalas nominal y ordinal) o
cuantitativas con bajo tamaño muestral (n<30).
-No asumen nada respecto a la distribución de las variables.
-Selección de participantes independientes o dependientes.
 Chi cuadrado
 Test de Wilcoxon o del Rango con signo.
 Test de la U de Mann-Whitney.
 Test de Kruskal-Wallis.
 Coeficiente de correlación de spearman
 Test de Mc Nemar
 Test de Friedman.

Pag. 34
BIOESTADISTICA 2

Prueba chi cuadrado (chi² o X² o ji²)


La prueba chi-cuadrado es una prueba no paramétrica que se
emplea para medir la asociación entre dos o mas variables
cualitativas nominales cuando tenemos tablas de contingencia.

De manera general, el estadístico chi-cuadrado se obtiene así:

2 ( f e  ft ) 2
 
ft
Donde fe representa las frecuencias empíricas (observadas) y ft representa las
frecuencias teóricas (esperadas).

Total de Fila x Total de Columna


F. Esperada=
Total General

Caracterìsticas de la ji cuadrado

 Los datos deberán estar en forma de frecuencias. En general,


cuando las frecuencias absolutas esperadas, en la gran mayoría de
celdas son grandes (>5), se utiliza el X2 para realizar el contraste
mencionado.

 La Prueba Chi cuadrado no establece causalidad, solo de


asociación.

 En Tablas de 2 x 2, cuando una de las celdas (20% de celdas)


tiene <5 de frecuencia observada o esperada se usa
corrección de Yates (Mayor de 30 variables) o Prueba
exacta de Fisher (Menor de 30 variables).

 No tiene valores negativos. El valor mínimo es 0.

 Todas las curvas son asimétricas

Pag. 35
BIOESTADISTICA 2

Test de la U de Mann-Whitney.

Es una prueba no paramétrica aplicada a dos muestras


independientes, cuyos datos han sido medidos al menos
en una escala de nivel ordinal (mediana).

El test es virtualmente idéntico a la realización de una


prueba paramétrica ordinaria T student de dos muestras
independientes en los datos después de haber ordenado
las muestras combinadas.

“Estudiante Universitario Independiente”

Test de Wilcoxon o del Rango con


signo.

La prueba de los signos de Wilcoxon es una prueba no


paramétrica para comparar la mediana de dos muestras
relacionadas o dependientes (APAREADAS) y determinar si
existen diferencias entre ellas.

Se utiliza como alternativa a la prueba t de Student apareada


cuando no se puede suponer la normalidad de dichas
muestras.

Pag. 36
BIOESTADISTICA 2

Test de Kruskal-Wallis.

Es un método no paramétrico para probar si un


grupo de datos proviene de la misma población.
Intuitivamente, es idéntico al ANOVA con los datos
reemplazados por categorías. Es una extensión de
la prueba de la U de Mann-Whitney para 3 o más
grupos. (independientes)

TEST DE McNEMAR

Prueba no paramétrica para dos variables


dicotómicas relacionadas.

Contrasta los cambios en las respuestas utilizando


la distribución de chi-cuadrado.

Es útil para detectar cambios en las respuestas


debidas a la intervención experimental en los
diseños del tipo "antes-después“ o para
comparar dos tipos de tratamiento.

Pag. 37
BIOESTADISTICA 2

Test de Friedman

Esta es una prueba no parametrica desarrollada por el


economista Milton Friedman.

Este test es utilizado para comparar varias medianas


(variable cualitativa ordinal), solo que es utilizado cuando
estas medianas son del mismo grupo.

Es una versión no paramétrica del ANOVA para grupos


dependientes.

TEST DE KOLMOGOROV-SMIRNOV

 Para conocer si se puede suponer que los datos siguen


una distribución normal, se pueden realizar diversos
contrastes llamados de BONDAD DE AJUSTE.

 El Test de Kolmogorov-Smirnov es la prueba estadística


mas utilizada para demostrar si una colección de datos
sigue una distribución NORMAL (una Curva de Gauss)

 Otros tests empleados para la prueba de normalidad


son debidos a Saphiro y Wilks (< 30 elementos).

Pag. 38
BIOESTADISTICA 2

ESTADISTICO DE KAPPA

Índice de comparación de la concordancia entre dos


(02) observadores independientes sobre si el
resultado de una prueba diagnóstica es normal o
anormal.

Se usa para medir la repetibilidad del test


diagnóstico.

TABLAS RESUMEN DE PRUEBAS


ESTADISTICAS

Pag. 39
BIOESTADISTICA 2

FLUXOGRAMA PARA SELECCIONAR PRUEBA ESTADISTICA

¿Qué prueba estadística


debo elegir?

¿Tipo de
CUANTITATIVA variable? CUALITATIVA

PRUEBAS PARAMETRICAS PRUEBAS NO PARAMETRICAS

¿Qué ¿Qué
establece establece
entre variables? entre variables?

Comparación estadística Comparación estadística


Relación (Significación estadística Relación (Significación estadística
de las diferencias) de las diferencias)

¿Cuántos V. Ordinal V. Nominal


grupos?

2 >2 ¿Cuántos ¿Cuántos


grupos? grupos?

2 >2 2 >2
V. Ordinal

Dependientes e
Dependientes Independientes
independientes Depend. Independ. Independ. Depend. Dependientes Independientes

Correlación t student Correlación U de Mann Kruskall Nc Q de


de Pearson apareada
ANOVA
de Spearman
Wilcoxon
Whitney Wallis
Friedman
Nemar Cochrane
Chi
t de cuadrado
student

EJERCICIOS
1. ¿Con que Test se pueden comparar dos Chi cuadrado
proporciones?

2. ¿Cuál de las siguientes pruebas estadísticas puede


T de student
utilizarse para comparar las medias observadas
independiente
en dos muestras independientes?

3. ¿Cuál es la prueba de significación estadística que


permite analizar los estudios de investigación
Chi cuadrado
con datos categorizables que comparan dos o
mas grupos independientes medidos en escalas
nominales?

4. El Test no paramétrico que permite estudiar la Correlación de


relación entre dos variables cuantitativas es: spearman

Pag. 40
BIOESTADISTICA 2

EJERCICIOS
5. En un ensayo clínico se comparan 03 tratamientos,
la variable respuesta es continua. Aceptando que ANOVA
la variable tiene una distribución normal, el test
correcto para comparar la respuesta es:

6. Se desea comparar la colesterolemia en 3 ANOVA


muestras de sujetos, cada una de ellas
representativas. ¿Cuál de las siguientes será la
prueba apropiada?

7. Se determinó la colesterolemia de de un grupo de T de student


30 pacientes antes de iniciar un tto y 6 meses apareada
después. ¿Cuál es la prueba estadística es la mas
adecuada?

EJERCICIOS
8. La existencia de relación entre dos variables Correlación de
cuantitativas se verifica mediante el test de: pearson

9. La comparación entre dos medias apareadas se T de student


estudia con: apareada

10. Para comparar varias proporciones con datos


Chi cuadrado
independientes se aplica el test de:

11. Se compara la talla promedio entre 2 grupos de


niños que recibieron distintos patrones de Prueba T de
alimentación. Cada grupo comprendía 25 niños. student
Señale la prueba de significancia mas apropiada

12. Se desea comparar la intensidad de dolor, medida


en una escala ordinal, entre 2 grupos de sujetos Test de U de
que han recibido tto diferentes. La prueba Mann Withney
estadística es:

Pag. 41

También podría gustarte