Regresión Lineal Simpl1
Regresión Lineal Simpl1
Regresión Lineal Simpl1
FORMULAS
SC ( x )=∑ x −n x
2 2
SC ( y )=∑ y −n y
2 2
SP ( xy )=∑ xy−n x y
SC ( x )=Sumade cuadrados de x
SC ( y )=Suma de cuadrados de y
SP ( xy )=Suma de productos de xy
ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO
Y^ =b0 +b 1 X
donde:
b 1 : es la pendiente de la recta estimada, llamada coeficiente de regresión el cual se interpreta como el cambio promedio en Y
cuando X cambia en una unidad.
Observación
√
n n n
∑ y −b 0 ∑ y i −b1 ∑ xi y i
2
i
i=1 i=1 i=1
Se =
n−2
Se
Sb =1
√ SC ( X)
b1
T cal=
Sb 1
EJERCICIO RESUELTO
Suponga que para hacer un estudio sobre los gastos de consumo familiar mensual en relación con el ingreso familiar mensual,
se eligieron 10 familias al azar encontrándose la siguiente información:
Ingreso familiar ($) ( X ) 80 100 120 140 160 180 200 220 240 260
Gasto de consumo familiar ($) ( Y ) 75 65 90 95 110 115 120 140 155 150
Y^ =b0 +b 1 X
Y^ =27.2650+0.4955 X
b) Es posible afirmar que si el ingreso familiar se incrementa en un dólar, el consumo familiar se incrementa en promedio,
en $ 0.41.
Falso, si el ingreso familiar se incrementa en un dólar, el consumo familiar se incrementa, en promedio, en $ 0.4955.
√
n n n
∑ y −b 0 ∑ y i −b1 ∑ xi y i
2
√
i
i=1 i=1 i=1 132825−27.2650∗1115−0.4955∗205900
Se = = =7.0806
n−2 10−2
Se 7.0806
Sb = = =0.0390
1
√ SC ( X) √ 33000
b1 0.4955
T cal= = =12.7051
S b 0.0390
1
Con un nivel de significancia del 5%, existe evidencia estadística para concluir que La recta de regresión es significativa
−1 ≤r ≤ 1
Fórmula para el cálculo del coeficiente de correlación de Pearson:
SP(x , y)
r=
√ SC( x ) √ SC( y)
Si r =−1, Indica que la correlación entre las variables X e Y es perfecta negativa.
2 b 1 SP(x , y )
R=
SC ( y )
Un coeficiente de determinación cercano a uno 1, indica que la recta de regresión estimada se ajusta mejor a los datos.
Para una mejor interpretación del coeficiente de determinación es conveniente convertirlo a porcentaje multiplicando el
resultado por 100%, por lo que, R2 indica el porcentaje de la variabilidad total de Y que es explicada por la recta de regresión
estimada.
EJERCICIO RESUELTO
Suponga que para hacer un estudio sobre los gastos de consumo familiar mensual en relación con el ingreso familiar mensual, se
eligieron 10 familias al azar encontrándose la siguiente información:
Ingreso familiar ($) ( X ) 80 100 120 140 160 180 200 220 240 260
Gasto de consumo familiar ($) ( Y ) 75 65 90 95 110 115 120 140 155 150
SP(x , y) 16350
r= = =0.9761
√ SC( x ) √ SC( y) √33000 √ 8502.5
La correlación entre las variables ingreso familiar y gasto de consumo familiar es positiva intensa porque se encuentra entre
0.8 ≤ r <1.
2 b 1 SP(x , y ) 0.4955∗16350
R= = =0.9528 95.28 %
SC ( y ) 8502.5
Este valor indica que el 95.28% de la variabilidad del gasto de consumo familiar es explicada por la recta de regresión estimada.
EJERCICIO PROPUESTO
Un corredor de bienes raíces desea saber cómo cambia el precio de una casa ante un cambio en el tamaño de la misma. Por tal
motivo, el corredor seleccionó una muestra aleatoria de 11 casas y obtuvo información sobre la superficie (en 100 m2) y el precio
(en miles de dólares). Los resultados obtenidos son los siguientes:
Área (X) 1.0 1.4 1.5 1.5 1.3 1.2 1.0 1.6 1.8 1.4 1.2
Precio (Y) 60 69 74 71 68 56 61 76 82 70 65
∑ x =20.79
2
∑ x =14.9 ∑ y 2=51984 ∑ y=752 ∑ xy =1035.9
x=1.3545 y=68.3636
a) Estime la ecuación de regresión para estimar el precio de una casa a partir de su tamaño.
Y^ =b0 +b 1 X
Y^ =29.8240+28.4530 X
√
n n n
∑ y −b 0 ∑ y i −b1 ∑ xi y i
2
√
i
i=1 i=1 i=1 51984−29.8240∗752−28.4530∗1035.9
Se = = =3.0164
n−2 11−2
Se 3.0164
Sb = = =3.8665
1
√ SC ( X) √ 0.6086
b1 28.4530
T cal= = =7.3589
S b 3.8665
1
Con un nivel de significancia del 5%, existe evidencia estadística para concluir que La recta de regresión es significativa
c) Calcule el error de predicción para una casa cuya área es 140 metros cuadrados.
2
x=140 m . = 1.4
Y^ =29.8240+28.4530∗( 1.4 )=69.6582
Error de predicción=69−69.6582=−0.6582
Error de predicción=70−69.6582=0.3418
Si el área de la casa aumenta en 100 m2, entonces el precio de la casa se incrementa en promedio 28.4530 miles de dólares.
SP(x , y) 17.3165
r= = =0. 9260
√ SC( x ) √ SC( y) √ 0.6086 √574.6001
La correlación entre las variables área de la casa y el precio de la casa es positiva intensa porque se encuentra entre 0.8 ≤ r <1.
2 b 1 SP(x , y ) 28.4530∗17.3165
R= = =0.85748 85.748 %
SC ( y ) 574.6001
Este valor indica que el 85.748% de la variabilidad del precio de la casa es explicada por la recta de regresión estimada.
Problema 2
Para determinar la relación entre la velocidad (X) y el rendimiento de la gasolina (Y) en automóviles de determinada marca, se
tomó una muestra de 5 automóviles y se obtuvieron los siguientes resultados:
Y: Rendimiento (Km/Galón) 55 52 50 45 40
Se pide:
Y^ =b0 +b 1 X
Y^ =78−0.37 X
2 b 1 SP(x , y ) (−0.37)∗(−370)
R= = =0. 9695 96.95 %
SC ( y ) 141.2
Este valor indica que el 96.95% de la variabilidad del rendimiento en gasolina es explicada por la recta de regresión estimada.
c) Utilizar el modelo de regresión desarrollado para predecir el rendimiento de gasolina para una velocidad de 95 Km/h.
X :9 5
Y^ =78−0.37 X
^
Y =78−0 . 37∗( 95 )=42 .85 km/galón
d) Plantear las hipótesis respectivas y decir si el modelo obtenido es significativo a un nivel de significancia del 5%.
e) Calcule los errores de predicción para X= 70 y X=90.