Regresión y Correlación Múltiple
Regresión y Correlación Múltiple
Regresión y Correlación Múltiple
1
Introducción
La regresión y correlación múltiple son herramientas estadísticas fundamentales que permiten
analizar la relación entre varias variables independientes y una variable dependiente. Este
análisis es crucial en diversas disciplinas, desde la economía hasta la biología, ya que ayuda a
entender cómo múltiples factores influyen en un resultado específico.
Análisis de Varianza
El análisis de varianza (ANOVA) para regresión múltiple es una técnica que permite evaluar
la significancia global del modelo. A través de esta técnica, se puede determinar si al menos
una de las variables independientes tiene un efecto significativo sobre la variable
dependiente, comparando la variabilidad explicada por el modelo con la variabilidad no
explicada.
Análisis de Residuales
Finalmente, el análisis de residuales es esencial para validar el modelo. Los residuos son las
diferencias entre los valores observados y los valores predichos; su análisis ayuda a
identificar patrones no capturados por el modelo y a verificar supuestos como la
homocedasticidad y la normalidad. Un examen cuidadoso de estos residuos puede
proporcionar información valiosa sobre la calidad del ajuste y posibles mejoras en el modelo.
En resumen, el análisis de regresión múltiple es una herramienta poderosa para entender
relaciones complejas entre variables, y su correcta aplicación puede ofrecer insights
significativos en diversas áreas del conocimiento.
2
3.2 Regresión y correlación múltiple
El propósito del análisis de regresión y correlación es el estudio de la relación existente entre
dos variables aleatorias, una denominada independiente y otra denominada dependiente.
Regresión
Correlación múltiple
La regresión lineal múltiple permite generar un modelo lineal en el que el valor de la variable
dependiente o respuesta (Y) se determina a partir de un conjunto de variables independientes
3
llamadas predictores (X1, X2,X3…). Es una extensión de la regresión lineal simple,
Yi=(β0+β1X1i+β2X2i+⋯+βnXni)+ei
4
Fórmula:
ANOVA
5
Objetivos
Suposiciones
Componentes clave
Prueba F
Limitaciones
- No evalúa la causalidad.
- Sensibilidad a outliers y violaciones de suposiciones.
- No es adecuado para variables categóricas.
Recuerda que la interpretación de los resultados debe ser cuidadosa y considerar las
limitaciones del análisis.
CONCEPTO
El análisis de residuales es el principal método estadístico para verificar si las suposiciones
del modelo de regresión son válidas. Aun cuando no se encuentre ninguna violación, esto no
necesariamente implica que el modelo vaya a proporcionar buenas predicciones.
6
Análisis de los residuos que se usa para determinar si parecen ser válidas las suposiciones
hechas acerca del modelo de regresión. El análisis de residuales también se usa para
identificar observaciones atípicas y observaciones influyentes.
Para la adecuada interpretación de las gráficas de residuales experiencia y criterio son muy
importantes. Es raro que una gráfica de residuales tenga exactamente la forma de una de las
gráficas presentadas en la figura. Sin embargo, los analistas que realizan frecuentemente
estudios de regresión y gráficas de residuales se vuelven expertos en reconocer las diferencias
entre las formas razonables y las que indican que se puede dudar de las suposiciones del
modelo. Una gráfica de residuos proporciona una técnica para evaluar la validez de las
suposiciones en un modelo de regresión.
Observación atípica: Dato u observación que no sigue la tendencia del resto de los datos.
Puede tratarse de datos erróneos; si es así, esos datos deben ser corregidos. Puede tratarse de
una violación a las suposiciones del modelo; si es así, habrá que considerar otro modelo. Por
último, puede tratarse, simplemente, de valores inusuales que se presenten por casualidad. En
ese caso, esos valores deberán conservarse.
7
Observación influyente
Observación en la que la variable independiente tiene un valor extremo
La recta de regresión estimada tiene pendiente negativa, pero si la observación influyente se
elimina del conjunto de datos, la pendiente de la recta de regresión estimada cambia de
negativa a positiva y la intersección con el eje y es menor.
Las observaciones influyentes deben examinarse cuidadosamente dado el gran efecto que
tienen sobre la ecuación de regresión estimada. Lo primero que hay que hacer es verificar que
no se haya cometido algún error al recolectar los datos. Si se cometió algún error, se corrige y
se obtiene una nueva ecuación de regresión estimada. Si la observación es correcta, puede
uno considerarse afortunado de tenerla. Tal dato, cuando es correcto, contribuye a una mejor
comprensión del modelo adecuado y conduce a una mejor ecuación de regresión estimada
8
Conclusión
El análisis de varianza (ANOVA) complementa este estudio al ofrecer una evaluación global
de la significancia del modelo. A través de esta técnica, se puede determinar si al menos una
de las variables independientes contribuye significativamente a explicar la variabilidad en la
variable dependiente, lo que refuerza la validez del modelo.
Por último, el análisis de residuales es crucial para validar los supuestos del modelo y
garantizar su robustez. Al examinar los residuos, se pueden identificar patrones que indiquen
posibles deficiencias en el ajuste, lo que permite realizar ajustes necesarios para mejorar la
precisión del modelo.
9
Referencias
10