2 Regresión Logística

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 12

2.

Regresin logstica
2. REGRESIN LOGSTICA 2.1. Introduccin 2.2. Modelo logit 2.3. Construccin de modelos 2.4. Interpretacin de Odd ratios 2.5. Ejercicio en R.

2.1. Regresin logstica


Se utiliza cuando la variable de respuesta es dicotmica. La variable o variables independientes pueden ser dicotmicas, categricas, o continuas. Ejemplo: nos interesa conocer el efecto de la distancia al borde de un hbitat, el porcentaje de ocultamiento del nido y el tipo de hbitat sobre la probabilidad de parasitismo de nidos. Otros ejemplos?

Como construir grficas de dispersin para variables de respuesta dicotmicas?


Grfica tradicional de dispersin no muestra tendencias ya que obtendramos una lnea de puntos en 0 y otra en 1. Podemos generar intervalos para la variable independiente, calcular para cada uno de estos intervalos la proporcin de xitos, y graficar estas proporciones vs. intervalos de la variable independiente.

2.2. y 2.3. Modelo y construccin de modelos


e 0 1x ( x) 1 e 0 1x

(x) puede transformarse utilizando la transformacin logit: ( x) g ( x) 0 1 x 1 ( x)

Para que sirve todo esto?


La funcin logstica es extremadamente flexible y fcil de utilizar, adems puede ser interpretada biolgicamente.

2.4. Interpretacin
Bajo el modelo de regresin logstica:
1 g ( x 1) g ( x)

La pendiente del coeficiente representa el cambio en el logit correspondiente al cambio en una unidad en x. Por lo tanto la interpretacin no es directa, la forma de interpretar los coeficientes de la regresin dependen del tipo de datos.

Odd ratios
Para interpretar los resultados se utilizan odd ratios o razn What??? de probabilidad:
Para los parmetros de la regresin logstica:

e
( EE ) e

1 =exp 1

(en Excel)

Para intervalos de confianza utilizar media 1.95 (error estndar):


EE ( 1 )

=exp EE1

(en Excel)

Interpretacin: Si el intervalo de confianza incluye el valor 1, entonces el efecto de la variable es irrelevante, si el intervalo no incluye a 1, entonces la variable tiene significado biolgico.

Ejemplo:

Variable independiente dicotmica


La razn de probabilidad, Odds ratio ( e ) es la probabilidad de Y=1 con respecto a Y=0.
1

Ejemplo: si Y corresponde a la presencia o ausencia de parasitismo de nidos en un sitio, 2 sugiere que la probabilidad entonces de parasitismo es 2 veces mayor que la probabilidad de ausencia de parasitismo en el sitio.

Variable independiente categrica


Se utiliza un grupo (nivel) de comparacin.
e es la probabilidad de que para un grupo
1

determinado Y=1 con respecto al grupo de comparacin. Ejemplo: si y representa la presencia o ausencia de parasitismo en tres diferentes tipos de hbitat, 0.5 sugiere que la entonces un valor de probabilidad de presencia de parasitismo es menor en un tipo de hbitat con respecto al tipo de hbitat de comparacin.

Variable independiente continua


e es el incremento en la probabilidad de que y = 1 para una unidad de cambio en la variable independiente.
Ejemplo: si y es la presencia o ausencia de costras y x es el porcentaje de humedad en el suelo entonces 3.5 sugiere que la probabilidad de ocurrencia de costras se incrementa 3.5 veces con cada unidad de incremento en el porcentaje de humedad.
1

Prueba de bondad de ajuste para regresiones logsticas


Prueba de Hosmer and Lemeshow: agrupa a los datos con base en los valores de las probabilidades estimadas , despus calcula las frecuencias observadas y frecuencias estimadas, y corre una prueba de x2.

Ejemplo con R
mydata<-read.csv("c://curso//ejerciciosr//binary.csv") attach(mydata) names(mydata) summary(gre) sd(gre) summary(gpa) sd(gpa) table(rank) table(admit) table(rank,admit) mylogit<- glm(admit~gre+gpa+as.factor(rank), family=binomial(link="logit"), na.action=na.pass) summary(mylogit) confint(mylogit)

exp(mylogit$coefficients) exp(confint(mylogit)) rank <- c(1,2,3,4) gre <- c(mean(mydata$gre)) gpa <- c(mean(mydata$gpa)) newdata1 <- data.frame(gre,gpa,rank) newdata1 newdata1$rankP <-predict(mylogit,newdata=newdata1,type="response") newdata1

Dr. Chapa, please give us a break!

Ejercicio: regresin logstica en r doc binary.csv

También podría gustarte