EJERCICIO REGRESIÓN LINEAL MULTIPLE (Francisco)

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 11

Ejercicio:

Para el siguiente conjunto de datos relacionados con el ingreso profesional,

Ingreso (Y) Experiencia (X1) Ind. Capacitación (X2)


53 15 22
64 15 25
56 15 22
63 17 21
86 16 33
70 16 27
50 15 20
78 15 31
A)- Ajustar un modelo de regresion lineal simple entre variables Y y X1, calculando:

a. Los parametros del modelo.


b. Escribir el modelo e interpretar.
c. Cálculo de coeficiente de correlación r de Pearson y R²
d. Calcular ANOVA
e. Formular Hipotesis y validar el modelo.

B)- Ajustar un modelo de regresion MULTIPLE Y, X1 y X2, calculando:

a. Los parametros del modelo.


b. Escribir el modelo e interpretar.
c. Cálculo de coeficiente de correlación multiple r de Pearson y R²
d. Calcular ANOVA
e. Formular Hipotesis y validar el modelo.
Solución;

N° INGRESO (Y) EXPERIENCIA (X1) X·Y X² Y²


1 53 15 795 225 2809
2 64 15 960 225 4096
3 56 15 840 225 3136
4 63 17 1071 289 3969
5 86 16 1376 256 7396
6 70 16 1120 256 4900
7 50 15 750 225 2500
8 78 15 1170 225 6084
Total 520 124 8082 1926 34890
Promedio 65 15.5 1010.3 240.8 4361.3

a- Covarianza

(∑ x · ∑ y)
S p x·y =∑ x·y −¿ ¿
n

124 · 520
S p x·y =8082−
8

S p x·y =22

Covarianza ˃0 por lo tanto Existe Relación Directa.

Parámetros del Modelo.

S p x·y
B 1=
S Cx

22
B 1=
4

B1=5,5

B0=¿  - ¿)

B0=65 – ¿)

B0=−20,25
b- Modelo

Ŷ= B0 +B 1 · Χ

Ŷ = −¿ 20,25 +5,5 · Χ

La correlación entre ingresos y experiencia no es estadísticamente significativa (p > 0,05); el


modelo de regresión puede explicar un 11,1% de la variación en ingresos.

Si el modelo se ajustara adecuadamente a los datos, esta ecuación se puede utilizar para
predecir ingresos para un determinado valor de experiencia o bien un nivel de experiencia
que corresponda a un valor o rango de valores deseados para ingresos.

c- Coeficiente de Correlacion Lineal de Pearson, coeficiente de determinación o Capacidad


predictiva del Modelo.

Calcular r y R²,
S p x·y =22

(∑ x ) ²
S C x =∑ x ²−¿ ¿
n

(124) ²
S C x =1926−
8

S C x =4

( ∑ y) ²
S C y =∑ y ²−¿ ¿
n

(520)²
S C y =34890−
8

S C y =1090

S p x·y
r = SC ·SC
√ x y

22
r = √ 4 · 1090

r = 0,333

R² = r² · 100

R² = (0,333)² · 100
R² = 11,088%

Por lo tanto existe una muy baja relacion entre las varibles.

d- Validación del modelo en su conjunto ANOVA

Fuente Grados Suma de Cuadrados F


Variación Libertad Cuadrados Medios

Regresión k SCR CMR CMR/CME


Error n-k-1 SCE CME
Total n-1 SCT

k = 1 = grados de libertad = 1
n=8

Suma de Cuadrados

²
SCR = B1 * SC X
SCR = 5,5² · 4 = 121

SCT =SC y
SCT = 1090

SCE = SCT – SCR


SCE = 1090 – 121 = 969

Cuadrados Medios

S CR 121
CMR = = = 121
k 1

S CE 969
CME = = = 161,5
(n−k −1) 6

F observado

C MR 121
F obs= = = 0,749
CME 161,5

e- Hipótesis sobre el Modelo

H 0 : B1 = 0

H 1 : B 1≠ 0
Fuente Grados Suma de Cuadrados F obs
Variación Libertad Cuadrados Medios
Regresión 1 121 121 0,749
Error 6 969 161,5
Total 7 1090

Considerando que el nivel de confianza es de 95% y los grados de libertad de Regresion son 1 y de
Error, 6 tal cual como indica la tabla, el F tab queda asi segun Tabla Fisher.

F tab=5,9874

Entonces,

F obs ≤ F tab = 0,749 ≤5,9874 Por lo tanto NO se rechaza la hipótesis Nula.

Conclusion:

Al trabajar con un nivel de confianza del 95% y según el valor de F obs (0,749) entregado por
ANOVA, el cual es inferior a F tab (5,9874), se acepta la hipótesis nula y concluimos que nuestro
modelo no es válido para realizar estimaciones de relaciones entre nivel de capacitación,
experiencia e ingreso de profesionales.

B)- Ajustar un modelo de regresion MULTIPLE Y, X1 y X2, calculando:

a. Los parametros del modelo.


b. Escribir el modelo e interpretar.
c. Cálculo de coeficiente de correlación multiple r de Pearson y R²
d. Calcular ANOVA
e. Formular Hipotesis y validar el modelo.

Ingreso (Y) Experiencia (X1) Ind. Capacitación (X2)


53 15 22
64 15 25
56 15 22
63 17 21
86 16 33
70 16 27
50 15 20
78 15 31

a. Los parametros del Modelo.

Presentacion del Modelo;

INGRESOS= -67,0997 + 4,5903 · EXPERIENCIA + 2,4259 · IND CAPACITACION

Hipotesis de los Betas para:

Para B0
H 0 :B 0=0
H 1 : B0 ≠ 0

Al trabajar con un nivel de significancia del 0,05 y al tratarse de una prueba bilateral, es decir,
α/2= 0,025 y según el p-value entregado de 0,00375 entregado por la prueba T, se rechaza la
hipótesis nula, por lo tanto B0 es significativo en el modelo.

Para B1
H 0 :B1 =0
H 1 : B1 ≠ 0

Al trabajar con un nivel de significancia del 0,05 y al tratarse de una prueba bilateral, es decir,
α/2= 0,025 y según el p-value entregado de 0,00268 entregado por la prueba T, se rechaza la
hipótesis nula, por lo tanto B1 es significativo en el modelo.

Para B2
H 0 :B 2=0
H 1 : B2 ≠ 0

Al trabajar con un nivel de significancia del 0,05 y al tratarse de una prueba bilateral, es decir,
α/2= 0,025 y según el p-value entregado de 0,00000828 entregado por la prueba T, se rechaza
la hipótesis nula, por lo tanto B2 es significativo en el modelo.

b) Escribir el modelo e interpretar.

INGRESOS= -67,0997 + 4,5903 · EXPERIENCIA + 2,4259 · IND CAPACITACION

Interpretación de B1

Por cada unidad de incremento de Experienca que incrementa un profesional, los ingresos del
profesional se ven incrementados en 4,5903. Siempre y cuando el indice de capacitacion se
mantenga constante.

Interpretación de B2

Por cada unidad de incremento de Indice de Capacitacion que incrementa un profesional, los
ingresos del profesional se ven incrementados en 2,4259 Siempre y cuando el nivel de experiencia
se mantenga constante.

c) Cálculo de coeficiente de correlación multiple r de Pearson y R²

R2 =0,9873 = √ R=¿ 0,9936297

r =¿0,9936297

Este es el coeficiente de correlacion lineal multiple y significa que existe una alta correlacion entre el
ingreso de los profesionales, la experiecnia y el nivel de capacitacion.
R2 =0,9873 o 98,73%
Corresponde al coeficiente de determinación multiple o capacidad del modelo e indica que el ingreso
del profesional esta explicado por la experiencia y el indice de capacitacion de un 98,73% y la
diferencia de 1,27% lo explican otras variables no consideradas en el modelo, tales como
competencia, rubro, etc.

R2 Corregido= 98,23%
Corresponde al coeficiente de determinación múltiple o capacidad explicativa del modelo, con una
corrección a la baja, para ver el equilibrio entre el número de variables independientes y el número
de casos. En este caso la corrección fue inferior a un punto.
d) Validación del modelo en su conjunto ANOVA:

Segun el desarrollo de excel se obtiene que:


Considerando los calculos en excel y la ANOVA para modelos de regresion Multiple se aplica la
siguiente formula (desarrollado en excel):

scR(residual)=∑ ( yᵢ− ŷᵢ ) ²

scR=¿13.8113246

scE(error o regresión)=∑ ¿ ¿ ¿

scE=¿1076.20812

scG(total)=∑ ¿ ¿ ¿

scG=¿ 1090

Cuadrados Medios

S CR 1076,189
CMR = = = 538,094
k 2

S CE 13,811
CME = = = 2,762
(n−k −1) 5

F observado

C MR 538,094
F obs= = = 194,82
CME 2,762

Fuente Grados Suma de Cuadrados F


Variación Libertad Cuadrados Medios

Regresión k SCR CMR CMR/CME


Residual n-k-1 SCE CME
Total n-1 SCT

k = 2 = grados de libertad = 2
n=8

Fuente Grados Suma de Cuadrados F obs


Variación Libertad Cuadrados Medios
Regresión 2 1076,189 538,094 194,802
Residual 8-2-1 =5 13,811 2,762
Total 7 1090

e) Formular Hipotesis y validar el modelo.


HIPOTESIS

H0 : ( BB 12)=0
H 1 : B 1 ≠0
( )
B2

Considerando que el nivel de confianza es de 95% y los grados de libertad de Regresion son 2 y de
Error, 5 tal cual como indica la tabla, el F tab queda asi segun Tabla Fisher.

F tab=5,7861

Entonces,

F obs ≥ F tab = 194,802≥ 5,7861

Como el F obs ≥ F tab se Rechaza la Hipotesis Nula.

En Conclusion,

Al trabajar con un nivel de significancia α=0,05 y según p-value:1,807e-05, entregado por el F


obtenido del ANOVA, se rechaza la hipótesis nula, lo que significa que el modelo puede ser usado
para estimar los ingresos en función de la Experiencia e Indice de Capacitacion de un profesional.

También podría gustarte