Modelo de Regresión Múltiple

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

UAC ESTADISTICA II

ANÁLISIS DE REGRESIÓN MÚLTIPLE

El análisis de regresión múltiple estudia la relación de una variable dependiente con dos o más
variables independientes.
Es decir; el objetivo del Análisis de Regresión Lineal Múltiple es relacionar una variable respuesta
y con un conjunto de variables predictoras x1, x2, …, xk, utilizando un modelo lineal. Lo que se
desea es poder estimar el valor medio de y y/o predecir valores particulares de y al observar en
el futuro cuando las variables predictoras toman valores específicos.

Elección de las variables de predicción

Se debe tomar en cuenta los siguientes pasos para la selección de variables de un modelo de
regresión lineal múltiple:

a) Identificar la variable dependiente y las variables de predicción o predictoras que se van


a incluir en el modelo.
b) Seleccionar una muestra aleatoria, y registrar todas las variables para cada elemento de
la muestra.
c) Identificar las relaciones entre las variables de predicción y la dependiente, y entre las
propias variables de predicción (matriz de correlaciones).

Modelo de regresión múltiple

La ecuación que describe la relación entre la variable dependiente y con las variables
independientes x1, x2, ..., xk, es denominada modelo de regresión múltiple y se define como:

𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘 + 𝜀
Donde:
y : variable respuesta que se quiere predecir.
𝛽0 , 𝛽1 , 𝛽2 , … , 𝛽𝑘 : Coeficientes del modelo de regresión múltiple denominados parámetros.
x1, x2, …, xk : variables predictoras independientes.
𝜀 : error aleatorio.

En este modelo se ve que, y es una función lineal de x1, x2, . . ., xk más el término del error 𝜀. El
término del error corresponde a la variabilidad en y que no puede atribuirse o explicarse al efecto
lineal de las k variables predictoras independientes.

Ecuación de regresión múltiple estimada

A partir de los datos de una muestra, se encuentran las estimaciones de los parámetros ( 𝛽0 , 𝛽1 ,
𝛽2 , … , 𝛽𝑘 ). Con los estadísticos muestrales se obtiene la siguiente ecuación de regresión
múltiple estimada:

pág. 1
UAC ESTADISTICA II

𝑦̂ = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 + ⋯ + 𝑏𝑘 𝑥𝑘

Donde:
𝑦̂ : valor estimado de la variable dependiente.

𝑏0 , 𝑏1 , 𝑏2 , . . . , 𝑏𝑘 : estimaciones puntuales de los parámetros poblacionales 𝛽0 , 𝛽1 ,


𝛽2 , … , 𝛽𝑘

x1, x2, ..., xk : son las variables predictoras.

EJEMPLO: Se realiza un estudio de asociación entre las siguientes variables:


Y: gastos mensuales expresados en cientos de dólares
X1: ingreso mensual familiar en miles de dólares
X2: tamaño de la familia.
En una muestra de 10 familias escogidas al azar se han encontrado los datos que se presentan en
la tabla que sigue:
Y X1 X2
45 10 8
40 9 8
38 8 6
35 7 6
32 7 5
30 6 4
28 6 3
27 4 2
25 3 2
22 2 1

a) Determine la ecuación de regresión muestral de los gastos mensuales con respecto a las dos
variables: ingreso mensual y tamaño de la familia.
b) Estime el gasto mensual para una familia de 8 integrantes y cuyo ingreso mensual es de 7000
dólares.

Solución
Para encontrar la ecuación de regression y algunas medidas resumen utilizaremos Excel y
Minitab:
En EXCEL.

pág. 2
UAC ESTADISTICA II

Los pasos siguientes describen cómo emplear la herramienta de regresión para el análisis de
regresión múltiple con Excel.

Paso 1. Seleccionar Datos del menú Herramientas

Paso 2. Elegir Análisis de datos

Paso 3. Elegir Regresión en la lista Funciones para análisis

Paso 4. Cuando aparezca el cuadro de diálogo Regresión

Ingresar Valores de Y en el cuadro Rango Y, de entrada

Ingresar Valores de X en el cuadro Rango X de entrada

Seleccionar Rótulos

Seleccionar Nivel de confianza

Ingresar Porcentaje de nivel de confianza en el cuadro Nivel de confianza

Seleccionar Rango de salida

Ingresar Celda en blanco en el cuadro Rango de salida (en donde aparecerán los resultados)

Clic en Aceptar

Error Estadístico Inferior Superior Inferior Superior


Coeficientes Probabilidad
típico t 95% 95% 95% 95%
Intercepción 17.8340 1.8602 9.58703 2.8232E-05 13.433 22.2327 13.435 22.232
X1 0.97839 0.8399 1.16477 0.282265 -1.0078 2.96464 -1.007 2.9646
X2 1.84442 0.8627 2.13791 0.069849 -0.1955 3.88443 -0.1955 3.8844

Luego, la ecuación de regresión múltiple de los gastos mensuales con respecto a las dos variables
como son ingreso mensual y tamaño de la familia, es:

𝑦̂ = 17,834 + 0,978𝑥1 + 1,844𝑥2

Por otro lado, si una familia tiene 8 integrantes y su ingreso mensual es 7000 dólares, esto es,
si 𝑥1 = 7 , 𝑥2 = 8, entonces, su gasto mensual estimado será:
𝑦̂ = 17,834 + 0,978(7) + 1,844(8) = 39.4382 𝑜 394382 𝑑ó𝑙𝑎𝑟𝑒𝑠

En MINITAB

Utilizamos MINITAB para estimar los gastos mensuales con respecto al ingreso mensual y al
número de integrantes de una familia.

Primero, es necesario ingresar los datos en una hoja de cálculo de Minitab. Los gastos mensuales
se ingresan en la columna C1, ingreso mensual familiar se ingresan en la columna C2 y el tamaño
de la familia en la columna C3. Los nombres de las variables, Y (gastos), X1 (ingreso) y X2 (tamaño

pág. 3
UAC ESTADISTICA II

de la familia) se ingresan como encabezados de estas columnas. A continuación, se describen los


pasos a seguir con Minitab para obtener los resultados de regresión que se presentan en el
ejercicio.
Paso 1. Seleccionar el menú Estadísticas
Paso 2. Seleccionar el menú Regresión.
Paso 3. Elegir Regresión
Paso 4. Seleccionar Ajustar modelo de regresión
Paso 5. Cuando aparezca el cuadro de diálogo Regresión
Ingresar Y en la caja Respuestas
Ingresar X1 y X2 en el cuadro Predictores
Clic en OK
Por tanto, la ecuación de regresión múltiple muestral es:

𝑦̂ = 17,83 + 0,978𝑥1 + 1,844𝑥2

En MINITAB;

Si una familia tiene 8 integrantes y su ingreso mensual es 7000 dólares, esto es,
si 𝑥1 = 7 , 𝑥2 = 8, entonces, su gasto mensual estimado es:

𝑦̂ = 17,834 + 0,978(7) + 1,844(8) = 39.4382 𝑜 394382 𝑑ó𝑙𝑎𝑟𝑒𝑠

En MINITAB:

Interpretación de la ecuación de regresión

Cuando se tiene una ecuación de regresión múltiple donde las unidades de medición son las
mismas tanto para la variable dependiente Y, como para las variables independientes x 1, x2,., xk,
los coeficientes de regresión se comparan directamente en la siguiente forma:

pág. 4
UAC ESTADISTICA II

La cantidad b0 es la ordenada en el Origen. Para k = 2 por ejemplo, es el intercepto del plano de


regresión con el eje Y cuando x1= 0 y x2= 0

Los demás coeficientes de regresión bi indican el cambio promedio de Y correspondiente a un


incremento unitario en X, cuando las demás X permanecen constantes.

Por ejemplo, en la ecuación de regresión múltiple del ejemplo anterior:

𝑦̂ = 17,834 + 0,978𝑥1 + 1,844𝑥2

La cantidad b0= 17, 834 es la ordenada en el Origen.

El valor b1= 0,978 indica que si hay un aumento unitario en x 1 es decir un aumento de 1000
dólares en los ingresos mensuales de las familias, los gastos mensuales (Y) aumentan en promedio
0,978 en cientos de dólares, esto es, 0.978 x 100 = 97, 8 dólares, manteniendose constante
x2(tamaño de familia).

El valor b2= 1,844 indica que si hay un aumento de un miembro en la familia (x2) entonces hay un
aumento promedio de 1,844, cientos de dólares, 1,844 x 100 = 184,4 dólares en los gastos
mensuales, permaneciendo constante x1 (ingreso mensual).

Ejercicios de Aplicación

1. El dueño de una empresa, desea estimar el ingreso bruto semanal en función de los gastos en
publicidad. A continuación, se presentan los datos de 10 semanas.

Ingreso semanal Publicidad en Publicidad en


bruto (en miles de televisión (en miles periódicos (en miles
dólares) de dólares) de dólares)
96 5.0 1.5
90 2.0 2.0
95 4.0 1.5
92 2.5 2.5
95 3.0 3.3
94 3.5 2.3
94 2.5 4.2
94 3.0 2.5
97 4.8 2.0
92 2.3 1.9

a) Obtenga una ecuacion de regresión estimada en la que los montos gastados en publicidad en
television y periódicos sean las variables independientes.

pág. 5
UAC ESTADISTICA II

b) Interprete los coeficientes del modelo de regresión múltiple del problema.


c) ¿cuál es el ingreso semanal bruto en una semana en la que se gastan 3500 dólares en
publicidad en television y 1800 dólares en publicidad en periódicos?

2. El artículo “How to Optimize and Control the Wire Bonding Process: Part II” Solid State
Technology, Jan. 1991: 67-72) describió un experimento realizado para evaluar el impacto de
las variables x1 = fuerza (gm), x2 = potencia (mW), x3 = temperatura (°C) y x4 = tiempo (ms)
en y = resistencia de pegamento al corte (gm). Los datos siguientes* se generaron para ser
consistentes con la información dada en el artículo:

a) Encontrar la ecuación estimada de regression.


b) Interpretar el coeficiente de temperatura
c) Predecir la resistencia cuando resulta una fuerza de 35 gm, potencia de 75 mW,
temperatura de 200° y tiempo de 20 ms

pág. 6

También podría gustarte