Regresión Lineal Simpl1

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 7

Regresión lineal simple

FORMULAS

SC ( x )=∑ x −n x
2 2

SC ( y )=∑ y −n y
2 2

SP ( xy )=∑ xy−n x y

SC ( x )=Sumade cuadrados de x
SC ( y )=Suma de cuadrados de y
SP ( xy )=Suma de productos de xy
ESTIMACIÓN DE LOS PARÁMETROS DEL MODELO

^β 1=b 1= SP(x , y) β^ 0=b0= y−b1 x


SC ( x)
Por lo tanto, la recta de regresión estimada tiene la siguiente forma:

Y^ =b0 +b 1 X

donde:

b 0 : es el intercepto con el eje Y de la recta de regresión.

b 1 : es la pendiente de la recta estimada, llamada coeficiente de regresión el cual se interpreta como el cambio promedio en Y
cuando X cambia en una unidad.

Observación

Si b 1>0, la tendencia lineal es creciente.

Si b 1<0, la tendencia lineal es decreciente.

Si b 1=0, indica que no existe relación lineal entre las variables.

PRUEBA DE HIPÓTESIS PARA VALIDAR LA RECTA DE REGRESIÓN

Paso 1 (Plantee las hipótesis de prueba)

H 0 : β 1=0 (La recta de regresión no es significativa)

H 1 : β1 ≠ 0 (La recta de regresión es significativa)

Paso 2 (Establezca el nivel de significancia) α

Paso 3 (Calcule el valor del estadístico de prueba)


n n n

∑ y −b 0 ∑ y i −b1 ∑ xi y i
2
i
i=1 i=1 i=1
Se =
n−2
Se
Sb =1
√ SC ( X)
b1
T cal=
Sb 1

Paso 4 (Establezca la región de rechazo)


t (α ¿¿2 ;n −2 )¿ t (1−α ¿¿2 ;n−2)¿

Paso 5 (Concluya de acuerdo al enunciado del problema)

EJERCICIO RESUELTO

Suponga que para hacer un estudio sobre los gastos de consumo familiar mensual en relación con el ingreso familiar mensual,
se eligieron 10 familias al azar encontrándose la siguiente información:

Ingreso familiar ($) ( X ) 80 100 120 140 160 180 200 220 240 260
Gasto de consumo familiar ($) ( Y ) 75 65 90 95 110 115 120 140 155 150

∑ x 2=322000 ∑ x =1700 ∑ y 2=132825 ∑ y=1115 ∑ xy =205900


x=170 y=111.5

SC ( x )=∑ x −n x =322000−10∗170 =33000


2 2 2

SC ( y )=∑ y −n y =132825−10∗111.5 =8502.5


2 2 2

SP ( xy )=∑ xy−n x y=205900−10∗170∗111.5=16350

a) Calcule la recta de regresión.

^β 1=b 1= SP(x , y) = 16350 =0.4955 ^β 0=b 0= y−b 1 x=111.5−0.4955∗170=27.2650


SC ( x) 33000
Por lo tanto, la recta de regresión estimada tiene la siguiente forma:

Y^ =b0 +b 1 X

Y^ =27.2650+0.4955 X
b) Es posible afirmar que si el ingreso familiar se incrementa en un dólar, el consumo familiar se incrementa en promedio,
en $ 0.41.

Falso, si el ingreso familiar se incrementa en un dólar, el consumo familiar se incrementa, en promedio, en $ 0.4955.

c) Indique si el modelo puede considerarse significativo.

Paso 1 (Plantee las hipótesis de prueba)

H 0 : β 1=0 (La recta de regresión no es significativa)

H 1 : β1 ≠ 0 (La recta de regresión es significativa)

Paso 2 (Establezca el nivel de significancia) α =0.05

Paso 3 (Calcule el valor del estadístico de prueba)


n n n

∑ y −b 0 ∑ y i −b1 ∑ xi y i
2


i
i=1 i=1 i=1 132825−27.2650∗1115−0.4955∗205900
Se = = =7.0806
n−2 10−2
Se 7.0806
Sb = = =0.0390
1
√ SC ( X) √ 33000
b1 0.4955
T cal= = =12.7051
S b 0.0390
1

Paso 4 (Establezca la región de rechazo)

t (α ¿¿2 ;n −2 )=t 0.025; 8


=−2.306 ¿ t (1−α ¿¿2 ;n−2)=t 0.975; 8
=2.306¿

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Tcal=12.7051 y pertenece a la región de rechazo, entonces se rechaza Ho.

Con un nivel de significancia del 5%, existe evidencia estadística para concluir que La recta de regresión es significativa

Coeficiente de Correlación y Coeficiente de Determinación

COEFICIENTE DE CORRELACIÓN DE PEARSON (r )

−1 ≤r ≤ 1
Fórmula para el cálculo del coeficiente de correlación de Pearson:

SP(x , y)
r=
√ SC( x ) √ SC( y)
Si r =−1, Indica que la correlación entre las variables X e Y es perfecta negativa.

Si −1<r ≤−0.8, Correlación negativa intensa

Si −0.8< r ≤−0.2, Correlación negativa normal

Si −0.2<r < 0, Correlación negativa débil

Si 0< r <0.2, Correlación positiva débil

Si 0.2 ≤ r <0.8, Correlación positiva normal

Si 0.8 ≤ r <1 , Correlación positiva intensa

Si r =0, Indica que no hay correlación entre las variables X e Y.

Si r =1, Indica que la correlación entre las variables X e Y es perfecta positiva.

COEFICIENTE DE DETERMINACIÓN (R2)


2
0≤ R ≤1

2 b 1 SP(x , y )
R=
SC ( y )
Un coeficiente de determinación cercano a uno 1, indica que la recta de regresión estimada se ajusta mejor a los datos.

Para una mejor interpretación del coeficiente de determinación es conveniente convertirlo a porcentaje multiplicando el
resultado por 100%, por lo que, R2 indica el porcentaje de la variabilidad total de Y que es explicada por la recta de regresión
estimada.
EJERCICIO RESUELTO

Suponga que para hacer un estudio sobre los gastos de consumo familiar mensual en relación con el ingreso familiar mensual, se
eligieron 10 familias al azar encontrándose la siguiente información:

Ingreso familiar ($) ( X ) 80 100 120 140 160 180 200 220 240 260

Gasto de consumo familiar ($) ( Y ) 75 65 90 95 110 115 120 140 155 150

SC ( x )=∑ x −n x =322000−10∗170 =33000


2 2 2

SC ( y )=∑ y −n y =132825−10∗111.5 =8502.5


2 2 2

SP ( xy )=∑ xy−n x y=205900−10∗170∗111.5=16350

^β 1=b 1= SP(x , y) = 16350 =0.4955 ^β 0=b 0= y−b 1 x=111.5−0.4955∗170=27.2650


SC ( x) 33000

a) Explique el significado del coeficiente de correlación de Pearson con respecto al enunciado.

SP(x , y) 16350
r= = =0.9761
√ SC( x ) √ SC( y) √33000 √ 8502.5
La correlación entre las variables ingreso familiar y gasto de consumo familiar es positiva intensa porque se encuentra entre
0.8 ≤ r <1.

b) Explique el significado del coeficiente de determinación con respecto al enunciado.

2 b 1 SP(x , y ) 0.4955∗16350
R= = =0.9528 95.28 %
SC ( y ) 8502.5
Este valor indica que el 95.28% de la variabilidad del gasto de consumo familiar es explicada por la recta de regresión estimada.

EJERCICIO PROPUESTO

Un corredor de bienes raíces desea saber cómo cambia el precio de una casa ante un cambio en el tamaño de la misma. Por tal
motivo, el corredor seleccionó una muestra aleatoria de 11 casas y obtuvo información sobre la superficie (en 100 m2) y el precio
(en miles de dólares). Los resultados obtenidos son los siguientes:

Área (X) 1.0 1.4 1.5 1.5 1.3 1.2 1.0 1.6 1.8 1.4 1.2

Precio (Y) 60 69 74 71 68 56 61 76 82 70 65
∑ x =20.79
2
∑ x =14.9 ∑ y 2=51984 ∑ y=752 ∑ xy =1035.9
x=1.3545 y=68.3636

SC ( x )=∑ x −n x =20.79−11∗1.3545 =0.6086


2 2 2

SC ( y )=∑ y −n y =51984−11∗68.3636 =574.6001


2 2 2

SP ( xy )=∑ xy−n x y=1035.9−11∗1.3545∗68.3636=17.3165

a) Estime la ecuación de regresión para estimar el precio de una casa a partir de su tamaño.

^β 1=b 1= SP(x , y) = 17.3165 =28.4530 ^β 0=b0 = y−b 1 x=68.3636−28.4530∗1.3545=29.8240


SC ( x) 0.6086
Por lo tanto, la recta de regresión estimada tiene la siguiente forma:

Y^ =b0 +b 1 X

Y^ =29.8240+28.4530 X

b) ¿Es el modelo significativo? Utilice un nivel de significancia del 5%.

Paso 1 (Plantee las hipótesis de prueba)

H 0 : β 1=0 (La recta de regresión no es significativa)

H 1 : β1 ≠ 0 (La recta de regresión es significativa)

Paso 2 (Establezca el nivel de significancia) α =0.05

Paso 3 (Calcule el valor del estadístico de prueba)


n n n

∑ y −b 0 ∑ y i −b1 ∑ xi y i
2


i
i=1 i=1 i=1 51984−29.8240∗752−28.4530∗1035.9
Se = = =3.0164
n−2 11−2
Se 3.0164
Sb = = =3.8665
1
√ SC ( X) √ 0.6086
b1 28.4530
T cal= = =7.3589
S b 3.8665
1

Paso 4 (Establezca la región de rechazo)

t (α ¿¿2 ;n −2 )=t 0.025; 9


=−2.262 ¿ t (1−α ¿¿2 ;n−2)=t 0.975; 9
=2.262¿

Paso 5 (Concluya de acuerdo al enunciado del problema)

Como Tcal=7.3589 y pertenece a la región de rechazo, entonces se rechaza Ho.

Con un nivel de significancia del 5%, existe evidencia estadística para concluir que La recta de regresión es significativa

c) Calcule el error de predicción para una casa cuya área es 140 metros cuadrados.
2
x=140 m . = 1.4
Y^ =29.8240+28.4530∗( 1.4 )=69.6582

Error de predicción=Y i−Y^ i

Error de predicción=69−69.6582=−0.6582
Error de predicción=70−69.6582=0.3418

d) Obtenga el precio esperado de una casa de 165 metros cuadrados.


2
x=1 65 m .= 1.65
Y^ =29.8240+28.4530∗( 1.65 )=76.7715
e) Interprete el coeficiente de regresión en términos del problema.

Si el área de la casa aumenta en 100 m2, entonces el precio de la casa se incrementa en promedio 28.4530 miles de dólares.

f) Explique el significado del coeficiente de correlación de Pearson con respecto al enunciado.

SP(x , y) 17.3165
r= = =0. 9260
√ SC( x ) √ SC( y) √ 0.6086 √574.6001
La correlación entre las variables área de la casa y el precio de la casa es positiva intensa porque se encuentra entre 0.8 ≤ r <1.

g) Explique el significado del coeficiente de determinación con respecto al enunciado.

2 b 1 SP(x , y ) 28.4530∗17.3165
R= = =0.85748 85.748 %
SC ( y ) 574.6001
Este valor indica que el 85.748% de la variabilidad del precio de la casa es explicada por la recta de regresión estimada.

Problema 2

Para determinar la relación entre la velocidad (X) y el rendimiento de la gasolina (Y) en automóviles de determinada marca, se
tomó una muestra de 5 automóviles y se obtuvieron los siguientes resultados:

X: Velocidad (Km/h) 60 70 80 90 100

Y: Rendimiento (Km/Galón) 55 52 50 45 40

Se pide:

∑ x 2=33000 ∑ x =400 ∑ y 2=11854 ∑ y=242 ∑ xy =18990


x=80 y=48.4

SC ( x )=∑ x −n x =33000−5∗80 =1000


2 2 2

SC ( y )=∑ y −n y =11854−5∗48.4 =141.2


2 2 2

SP ( xy )=∑ xy−n x y=18990−5∗80∗48.4=−370

a) Hallar la ecuación de regresión e interpretar sus coeficientes.

^β 1=b 1= SP(x , y) = −370 =−0.37 ^β 0=b0= y −b1 x=48.4−(−0.37 )∗80=78


SC ( x) 1000
Por lo tanto, la recta de regresión estimada tiene la siguiente forma:

Y^ =b0 +b 1 X

Y^ =78−0.37 X

b) Calcular el coeficiente de determinación e interpretarlo.

2 b 1 SP(x , y ) (−0.37)∗(−370)
R= = =0. 9695 96.95 %
SC ( y ) 141.2
Este valor indica que el 96.95% de la variabilidad del rendimiento en gasolina es explicada por la recta de regresión estimada.
c) Utilizar el modelo de regresión desarrollado para predecir el rendimiento de gasolina para una velocidad de 95 Km/h.

X :9 5
Y^ =78−0.37 X
^
Y =78−0 . 37∗( 95 )=42 .85 km/galón

d) Plantear las hipótesis respectivas y decir si el modelo obtenido es significativo a un nivel de significancia del 5%.
e) Calcule los errores de predicción para X= 70 y X=90.

También podría gustarte