Análisis de Regresión Múltiple

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 11

Anlisis de regresin mltiple

SUPUESTOS

A. Puede haber cualquier nmero de variables independientes.

B. Se emplea el criterio de mnimos cuadrados para desarrollar la ecuacin de regresin.

C. Es necesario un paquete de software estadstico para realizar los clculos.

Anlisis de regresin
mltiple

La forma descriptiva
general de una ecuacin
lineal mltiple se muestra
en la formula..

a es la bj es la cantidad en que Y cambia


interseccin, el cuando esa Xj particular aumenta
valor de Y una unidad, cuando los valores de
cuando todas las todas las dems variables
X son cero. independientes se mantienen
constantes.
Como hay dos variables En la grafica se presentan los
independientes, esta relacin residuos como la diferencia
se representa de forma entre la Y real y la Y ajustada
grafica como un plan. en el plano.

Con la informacin de los estudiantes de la Universidad de las Fuerzas Armadas ESPE de 25


aos determine:

Y X1 X2 X3 X4
No # DE VASOS DE
PREGUNTA #3 ESTATURA (CM) PESO (KG) PREGUNTA # 1
AGUA
1 360 175 60 100 1
2 650 173 75 38 1
3 720 190 80 40 1
4 200 182 77 12 1
5 200 168 58 15 1
6 520 149 64 38 1
7 600 196 75 10 1
8 200 189 60 26 1
9 180 165 60 36 1
10 680 156 69 40 1
11 450 148 64 30 1
12 840 169 53 40 1
13 500 156 75 14 1
14 800 163 75 19 1
15 350 154 60 10 1
16 450 145 60 36 1

1) La ecuacin de regresin y su respectivo pronstico de Y

Coeficientes
ANLISIS DE VARIANZA

Grados de Suma de Promedio de los


Intercepcin F Valor crtico de F
69,3905949
libertad cuadrados cuadrados
Y= a + b1x1 + b2x2 + b3x3 + b4x4 ESTATURA (CM) -2,71956019
Regresin 4 209013,002 52253,2504 1,09658036 0,40551093
Y= 69,3905949 -2,71956019x1 + PESO (KG) 12,01764612
Residuos 12,01764612x2
11 + 2,130832455x3
524161,998 47651,0908
# DE VASOS DE AGUA 2,130832455
Total 15 733175
PREGUNTA # 1 0

2) Con anlisis de ANOVA, compruebe el valor de r, 2 y Syx

Estadsticas de la regresin

Coeficiente de correlacin mltiple 0,533928161

Coeficiente de determinacin R^2 0,285079281

R^2 ajustado 0,02510811

Error tpico 218,291298

Observaciones 16


2 =
3) Con el valor crtico de F indique si la hiptesis nula se
209013,002 acepta o se rechaza
2 =
733175 La hiptesis nula se acepta

2
= 0,2851 =
(+1)
= 2

porque
2 = el valor de F es
mayor
al 5% que se trabaja = 0,2851 524161,998
=
como209013,002
referencia. 16 ( 4 + 1 )
2 = r = 0,5339
733175
4) Indique en orden que = 218, 29
2variable
= 0,2851debera irse primero analizando estadstico t y
la probabilidad.

Estadstico t Probabilidad

Intercepcin 0,10388371 0,919131492

ESTATURA (CM) -0,71227128 0,491128589

PESO (KG) 1,60493469 0,136810591

# DE VASOS DE AGUA 0,78590327 0,448522555


PREGUNTA #3 ESTATURA (CM) PESO (KG) # DE VASOS PREGUNTA #
DE AGUA 1

PREGUNTA #3 1

ESTATURA (CM) -0,03356674 1

PESO (KG) 0,330478736 0,354934958 1

# DE VASOS DE AGUA 0,082987063 -0,004243886 -0,27850544 1

PREGUNTA # 1 #DIV/0! #DIV/0! #DIV/0! #DIV/0! 1

PREGUNTA # 1 65535 #NUM!

Variables Estadstico t Probabilidad

1 ESTATURA (CM) -0,71227128 0,491128589

2 # DE VASOS DE AGUA 0,78590327 0,448522555

3 PESO (KG) 1,60493469 0,136810591

La variable que debera irse primero es la ESTATURA, ya que analizando el estadstico


t, este sera el menor, y analizando la probabilidad este sera el valor mayor. Con el
mismo criterio analizamos las dems variables.

5) Indique si existe multicolinealidad

No existe multicolinealidad, ya que los datos se encuentran dentro del rango


establecido de -0,70 y 0,70. Por lo tanto no existen problemas y no se deben eliminar
variables

6) Indique si existe omosedasticidad


PESO (KG) Grfico de los residuales
600

400

Residuos
200

0
0 20 40 60 80 100
-200

-400
PESO (KG)

S existe omosedasticidad, ya que los puntos no tiene forma de cono o de ondas. Se


encuentran dispersos

EVALUACIN DE UNA ECUACIN DE REGRESIN MLTIPLE

Reporta la cantidad total de la variacion de la


variable independiente y divide esta variacion
entre las que se explican mediante el grupo
de variables independientes y las que no.
Evaluacin de una ecuacin
de regresin mltiple

Reporta los grados de libertad asociados con


las variables independientes, el error de la
varia-cion y la variacion total.

LA TABLA ANOVA:
Recordemos que la variacin total de una variable dependiente, Y, se
divide en dos componentes:
Regresin, o la variacin de Y explicada por todas las variables
independientes,
El error o residuo, o variacin no explicada de Y. Estas dos
categoras se identifican en la primera columna de la siguiente tabla
ANOVA.

SUMA DE LOS CUADRADOS

2
SS total= ( )

ERROR ESTNDAR DE ESTIMACIN MLTIPLE

( )2
=
( + 1) ( + 1)

Y es la observacin actual.
Y es el valor estimado calculado mediante la ecuacin
de regresin.
n es el nmero de observaciones en la muestra.
k es el nmero de variables independientes.
SSR es la suma de los cuadrados del residuo de la tabla
ANOVA.
COEFICIENTE DE DETERMINACIN MLTIPLE

CARACTERISTICAS
Se representa por una letra R mayscula al
cuadrado. En otras palabras, se escribe como
R2 debido a que se comporta como el
cuadrado de un coeficiente de correlacin.

Puede variar de 0 a 1. Un valor cercano a 0


indica poca asociacin entre el conjunto de
variables independientes y la variable
dependiente. Un valor cercano a 1 significa
una asociacin fuerte.

No puede adoptar valores negativos. Ningn


numero que se eleve al cuadrado o se eleve a
la segunda potencia puede ser negativo

.Es fcil de interpretar. Como R2 es un valor


entre 0 y 1 es fcil de interpretar, comparar y
comprender.
COEFICIENTE AJUSTADO DE DETERMINACIN

De aqu, R2 aumenta slo


Cada nueva variable debido al nmero total
El nmero de variables
independiente hace de variables
independientes de una
que las predicciones independientes y no
ecuacin de regresin
sean ms precisas, lo porque la variable
mltiple aumenta el
que a su vez reduce independiente agregada
coeficiente de
el SSE y aumenta el sea un buen factor de
determinacin.
SSR. prediccin de la variable
dependiente.

EJERCICIO

Salsberry Realty vende casas en la costa este de Estados Unidos. Una de las
preguntas mas frecuentes de los compradores potenciales es: si compramos
esta casa, cuanto gastaremos en calefaccion durante el invierno? Al
departamento de investigacion de Salsberry se le pidio desarrollar algunas
directrices respecto de los costos de calefaccion de casas unifamiliares. Se
considera que tres variables se relacionan con dichos costos: 1) la
temperatura externa diaria media, 2) el numero de pulgadas de aislamiento
en el atico y 3) los anos de uso del calentador. Para el estudio, el
departamento de investigacion de Salsberry selecciono una muestra aleato-
ria de 20 casas de venta reciente. Determino el costo de calefaccion de cada
casa en enero pasado, asi como la temperatura externa en enero en la
region, el numero de pulgadas de ais- lamiento del atico y los anos de uso
del calentador. La informacion muestral se reporta en la tabla 14-1.
ERROR ESTANDAR

Y 427.194 4.583X1 14.831X2 6.101X3

427.194 4.583(35) 14.831(3) 6.101(6)

258.90

Por lo tanto, se estimaria que la calefaccion de una casa con una


temperatura externa media en enero de 35 grados, 3 pulgadas de
aislamiento y un calentador de 6 anos de antiguedad costaria $258.90. El
costo de calefaccion actual fue $250, por lo cual el residuo, que es la
diferencia entre el valor actual y el valor estimado, es Y Y 250 258.90 8.90.
Esta diferencia de $8.90 es el error aleatorio o no explicado del primer
elemento muestreado. El siguiente paso es elevar al cuadrado esta
diferencia, es decir; determinar (Y Y)2 (250 258.90)2 ( 8.90)2 79.21.

Es el error tipico cuando se emplea esta ecuacion para predecir el costo.


Primero, las unidades son las mismas que en la variable dependiente, por lo
cual el error estandar es en dolares ($51.05). Segundo, se espe- ra que los
residuos sean aproximados a una distribucion mas o menos normal, por lo
que alrededor de 68% de ellos estara dentro de $51.05 y cerca de 95%
dentro de 2(51.05) $102.10.

Usando los residuos y la suma total de los cuadrados de la tabla ANOVA,


se puede emplear la formula para calcular el coeficiente de determinacion
multiple.

Las variables independientes (temperatura externa, cantidad de aislamiento


y antiguedad del calentador) explican, o contabilizan, 80.4% de la variacion
del costo de calefaccion. En otras palabras, 19.6% de la variacion se debe a
otras fuentes, como el error aleatorio o variables no incluidas en el analisis.

COEFICIENTE DE DETERMINACION AJUSTADO

Si se compara R2 (0.80) con R2 ajustada (0.77), la diferencia en este caso


es pequena.

También podría gustarte