2.7 Analisis de Regresion Multiple y Correlacion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

ESTADÍSTICA PARA

LA ADMINISTRACIÓN II

2.7 Análisis de Correlación

Bibliografía
Anderson, David R., Dennis J. Sweeney y Thomas A. Williams.

Estadística para administración y economía.

10a. ed., Cengage Learning Editores, 2008


15Ander(624-692).qxd 2/29/08 11:06 AM Page 626

626 Capítulo 15 Regresión múltiple

En el capítulo 14 se presentó la regresión lineal simple y se mostró su uso en la obtención de una


ecuación de regresión estimada que describe la relación entre dos variables. Recuérdese que la
variable que se predice o explica es la variable dependiente y la variable que se usa para prede-
cir o explicar la variable dependiente es la variable independiente. En este capítulo se continúa
con el estudio del análisis de regresión considerando, ahora, las situaciones en las que intervie-
nen dos o más variables independientes. Este estudio, al que se le conoce como análisis de re-
gresión múltiple, permite tomar más factores en consideración y obtener estimaciones mejores
que las que son posibles con la regresión lineal simple.

15.1 Modelo de regresión múltiple


El análisis de regresión múltiple estudia la relación de una variable dependiente con dos o más
variables independientes. Para denotar el número de variables independientes se suele usar p.

Modelo de regresión y ecuación de regresión


Los conceptos de modelo de regresión y ecuación de regresión vistos en el capítulo previo, son
aplicables en el caso de la regresión múltiple. A la ecuación que describe cómo está relacionada
la variable dependiente y con las variables independientes x1, x2, . . ., xp se le conoce como mo-
delo de regresión múltiple. Se supone que el modelo de regresión múltiple toma la forma si-
guiente

MODELO DE REGRESIÓN MÚLTIPLE


y  β0  β1x1  β2 x 2  . . .  βp xp   (15.1)

En el modelo de regresión múltiple, β0, β1, β2, . . . , βp, son parámetros y el término del error 
(la letra griega épsilon) es una variable aleatoria. Examinando con atención este modelo se ve
que y es una función lineal de x1, x2, . . ., xp (la parte β0  β1x1  β2 x 2  . . .  βp xp) más el tér-
mino del error . El término del error corresponde a la variabilidad en y que no puede atribuirse
o explicarse al efecto lineal de las p variables independientes.
En la sección 15.4 se discutirán los supuestos para el modelo de regresión múltiple y para .
Uno de los supuestos es que la media o valor esperado de  es cero. Una consecuencia de este
supuesto es que la media o valor esperado de y, que se denota E(y), es igual a
β0  β1x1  β2 x 2  . . .  βp xp. A la ecuación que describe cómo está relacionada la media de y
con x1, x2 , . . . , xp se le conoce como ecuación de regresión múltiple.

ECUACIÓN DE REGRESIÓN MÚLTIPLE


E( y)  β0  β1x1  β2 x 2  . . .  βp xp (15.2)

Ecuación de regresión múltiple estimada


Si se conocieran los valores de β0, β1, β2, . . . , βp, se podría usar la ecuación (15.2) para calcular
la media de las y para valores dados de x1, x2, . . ., xp. Desafortudamente, los valores de estos pa-
rámetros no suelen conocerse, es necesario estimarlos a partir de datos muestrales. Para calcular
los valores de los estadísticos muestrales b1, b2, . . ., bp, que se usan como estimadores puntuales
de los parámetros β0, β1, β2, . . . , βp se emplea una muestra aleatoria simple. Con los estadísti-
cos muestrales se obtiene la siguiente ecuación de regresión múltiple estimada.
15Ander(624-692).qxd 2/29/08 11:06 AM Page 627

15.2 Método de mínimos cuadrados 627

ECUACIÓN DE REGRESIÓN MÚLTIPLE ESTIMADA


ŷ  b0  b1x1  b2 x 2  . . .  bp xp (15.3)

donde
b0, b1, b2, . . . , bp son las estimaciones de β0, β1, β2, . . . , βp
ŷ  valor estimado de la variable dependiente

Este proceso de estimación en la regresión múltiple se muestra en la figura 15.1.

15.2 Método de mínimos cuadrados


En el capítulo 14, se usó el método de mínimos cuadrados para obtener la ecuación de regre-
sión estimada que permitía aproximar mejor la relación lineal entre las variables dependiente e
independiente. Este método también se usa para obtener la ecuación de regresión múltiple esti-
mada. El criterio en el método de mínimos cuadrados, como ya se dijo, es el siguiente.

CRITERIO DE MÍNIMOS CUADRADOS


min 兺( yi  ŷi )2 (15.4)

FIGURA 15.1 PROCESO DE ESTIMACIÓN EN LA REGRESIÓN MÚLTIPLE

Modelo de regresión
En la regresión lineal sim- múltiple
ple, b0 y b1 son los estadísti- Datos muestrales
cos muestrales que se usan
para estimar los paráme- Ecuación de regresión múltiple
tros β0 y β1. En la regresión
múltiple, en el proceso de
inferencia estadística aná- son
logo, b0, b1, b2, ..., bp deno-
parámetros desconocidos
tan los estadísticos
muestrales que se usan
para estimar los paráme-
tros β0 , β1, β2 , . . . , βp.

Cálculo de la ecuación
de regresión múltiple
estimada
son las estimaciones de

son
estadísticos muestrales
15Ander(624-692).qxd 2/29/08 11:06 AM Page 628

628 Capítulo 15 Regresión múltiple

donde
yi  valor observado en la variable dependiente en la observación i
ŷi  valor estimado para la variable dependiente en la observación i

Los valores estimados de la variable dependiente se calculan empleando la ecuación de regresión


múltiple estimada
ŷ  b0  b1x1  b2 x 2  . . .  bp xp
Como indica la expresión (15.4), el método de mínimos cuadrados emplea datos muestrales para
obtener los valores de b0, b1, b2, . . ., bp que hacen que la suma de los cuadrados de los residua-
les [las diferencias entre los valores observados de la variable dependiente (yi) y los valores es-
timados de la variable dependiente (ŷi )] sea un mínimo.
En el capítulo 14 se dieron las fórmulas para calcular los estimadores b0 y b1 para la ecua-
ción de regresión lineal simple estimada ŷ  b0  b1x empleando el método de mínimos cua-
drados. Con conjuntos de datos relativamente pequeños, fue posible usar esas fórmulas para
obtener b0 y b1 mediante cálculos manuales. En la regresión múltiple, en cambio, las fórmulas
para calcular b0, b1, b2, . . . , bp emplean álgebra de matrices y quedan fuera del alcance de este
texto. Por esta razón, en el estudio de la regresión múltiple, se centrará la atención en el uso de
los paquetes de software para obtener la ecuación de regresión estimada y algunas otras informa-
ciones. Lo importante será la interpretación de los resultados que proporcionan estos paquetes de
software y no cómo hacer los cálculos para la regresión múltiple.

Un ejemplo: Butler Trucking Company


Para ilustrar el análisis de regresión múltiple, se empleará un problema de la empresa Butler
Trucking Company, una empresa que se dedica al transporte de objetos y mercancías en el sur de
California. La actividad principal de esta empresa es hacer entregas en su área local. Para mejo-
rar el horario de trabajo, los gerentes deseaban estimar el tiempo total de recorrido diario nece-
sario para hacer las entregas.
Al principio, los gerentes creyeron que el tiempo total de recorrido diario estaba estrecha-
mente relacionado con el número de millas recorridas para hacer las entregas. Partiendo de una
muestra aleatoria simple de 10 entregas se obtuvieron los datos que se presentan en la tabla 15.1
y en el diagrama de dispersión de la figura 15.2. Después de observar el diagrama de disper-
sión, los gerentes consideraron que para describir la relación entre tiempo total de recorrido (yi)
y el número de millas recorridas (xi) podía emplearse el modelo de regresión lineal simple

TABLA 15.1 DATOS PRELIMINARES DE BUTLER TRUCKING

Recorrido x1 ⴝ Millas y ⴝ Tiempo de


recorridas recorrido (horas)
1 100 9.3
archivo CD 2
3
50
100
4.8
8.9
en 4 100 6.5
Butler 5 50 4.2
6 80 6.2
7 75 7.4
8 65 6.0
9 90 7.6
10 90 6.1

También podría gustarte