Regresión Multilineal
Regresión Multilineal
Regresión Multilineal
LA PAZ – BOLIVIA
Práctica
(Regresión Multilineal)
𝒚 𝒙𝟏 𝒙𝟐
1 1 1
2 2 2
3 3 3
4 4 4
5 5 5
b)
𝒚 𝒙𝟏 𝒙𝟐
1 1 1
2 2 2
3 3 3
4 4 4
5 5 5
6 6 6
7 7 7
8 8 8
9 9 9
10 10 10
11 11 11
12 12 12
13 13 13
14 14 14
2. Analice los dos incisos del ejercicio anterior y responda las siguientes preguntas:
a) ¿Por qué el coeficiente de correlación (𝑟) es 1 en ambos casos?
b) ¿Por qué el coeficiente de determinación (𝑟 2 ) es 1 en ambos casos?
c) ¿Cuál es la razón por la que el coeficiente de determinación ajustado (𝑟 2 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜) es
diferente en ambos casos?
3. Con ayuda de Excel hallar la ecuación de regresión multilineal, el coeficiente de correlación
múltiple (𝑟), el coeficiente de determinación (𝑟 2 ) y el coeficiente de determinación
ajustado (𝑟 2 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜) para los siguientes conjuntos de datos:
a)
𝒚 𝒙𝟏 𝒙𝟐 𝒙𝟑
1 2 2 1
1 1 3 2
2 2 3 5
4 5 7 6
7 8 8 13
9 11 11 17
12 17 20 25
15 28 33 45
b)
𝒚 𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒
2 23 33 12 1
2 32 35 15 1
3 44 37 16 1
4 12 41 22 8
5 15 44 15 12
5 22 45 25 15
5 43 44 33 13
6 25 49 25 12
7 19 50 12 16
8 22 56 17 17
El departamento de auditorías tiene un registro del número de horas que usa sus
computadoras para detectar impuestos no pagados. ¿Podríamos combinar esta información
con los datos referentes a las horas de trabajo de auditorías de campo y obtener una
ecuación de estimación más precisa para los impuestos no pagados descubiertos por cada
mes?
(Regresión Multilineal)
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%
Intercepción 4,44089E-16 3,08074E-16 1,44149994 0,245104946 -5,36341E-16 1,42452E-15 -5,36341E-16 1,42452E-15
Variable X 1 0 0 65535 #¡NUM! 0 0 0 0
Variable X 2 1 9,28879E-17 1,07657E+16 #¡NUM! 1 1 1 1
Ejercicio 1 b)
y=x
Resumen Multilineal R² = 1
1 1 1 16
2 2 2 Estadísticas de la regresión 14
3 3 3 Coeficiente de correlación múltiple 1 12
10
4 4 4 Coeficiente de determinación R^2 1
8
5 5 5 R^2 ajustado 0,916666667 6
6 6 6 Error típico 0 4
7 7 7 Observaciones 14 2
0
8 8 8 0 2 4 6 8 10 12 14 16
9 9 9 ANÁLISIS DE VARIANZA
10 10 10 Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
11 11 11 Regresión 2 227,5 113,75 #¡NUM! #¡NUM!
12 12 12 Residuos 12 0 0
13 13 13 Total 14 227,5
14 14 14
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Coeficiente de correlación múltiple 1 Intercepción 0 0 65535 #¡NUM! 0 0 0 0
Coeficiente de determinación R^2 1 Variable X 1 0 0 65535 #¡NUM! 0 0 0 0
R^2 ajustado 1 Variable X 2 1 0 65535 #¡NUM! 1 1 1 1
Ecuación multilineal y=x
Ejercicio 2
Analice los dos incisos del ejercicio anterior y responda las siguientes preguntas:
a) ¿Por que el coeficiente de correlación es 1 en ambos casos?
Porque la intensidad de la relación lineal entre "x1" y "x2" es perfecta.
b) ¿Por que el coeficiente de determinación es 1 en ambos casos?
Porque en ambos incisos se muestra una correlación positiva perfecta, además, los datos de las variables de ambos incisos son iguales en ambos ejes.
c) ¿Cual es la razón por la que el coeficiente de determinación ajustado es diferente en ambos casos?
Porque el coeficiente de determinación ajustado muestra una representación más exacta del ajuste del coeficiente de determinación.
Ejercicio 3 a)
Resumen
1 2 2 1
1 1 3 2 Estadísticas de la regresión
2 2 3 5 Coeficiente de correlación múltiple 0,98028393
4 5 7 6 Coeficiente de determinación R^2 0,960956584
7 8 8 13 R^2 ajustado 0,931674022
9 11 11 17 Error típico 1,382717353
12 17 20 25 Observaciones 8
15 28 33 45
ANÁLISIS DE VARIANZA
Coeficiente de correlación múltiple 0,98028 Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Coeficiente de determinación R^2 0,96096 Regresión 3 188,2273709 62,74245696 32,816684 0,002820753
R^2 ajustado 0,93167 Residuos 4 7,647629109 1,911907277
Ecuación multilineal y = 1,41 x1 - 0,64 x2 - 0,09 x3 + 1,46 Total 7 195,875
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 1,460076286 0,748233082 1,951365584 0,122764619 -0,617351793 3,537504364 -0,617351793 3,537504364
Variable X 1 1,414661654 0,725846158 1,948982769 0,123100838 -0,600610357 3,429933665 -0,600610357 3,429933665
Variable X 2 -0,638049503 0,437745286 -1,457581665 0,218693861 -1,853425261 0,577326254 -1,853425261 0,577326254
Variable X 3 -0,086449701 0,357979772 -0,241493256 0,821047457 -1,080360888 0,907461486 -1,080360888 0,907461486
Ejercicio 3 b)
Resumen
2 23 33 12 1
2 32 35 15 1 Estadísticas de la regresión
3 44 37 16 1 Coeficiente de correlación múltiple 0,995623835
4 12 41 22 8 Coeficiente de determinación R^2 0,991266821
5 15 44 15 12 R^2 ajustado 0,984280279
5 22 45 25 15 Error típico 0,251104657
5 43 44 33 13 Observaciones 10
6 25 49 25 12
7 19 50 12 16 ANÁLISIS DE VARIANZA
8 22 56 17 17 Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 4 35,78473226 8,946183064 141,8823086 2,47903E-05
Coeficiente de correlación múltiple 0,99562 Residuos 5 0,315267744 0,063053549
Coeficiente de determinación R^2 0,99127 Total 9 36,1
R^2 ajustado 0,98428
Ecuación multilineal y = 0,0095 x1 + 0,2266 x2 - 0,0275 x3 + 0,0734 x4 - 5,5575 Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción -5,557574771 1,148148519 -4,840466786 0,004713021 -8,508984498 -2,606165044 -8,508984498 -2,606165044
Variable X 1 0,009532596 0,010095468 0,944245017 0,388400761 -0,016418632 0,035483823 -0,016418632 0,035483823
Variable X 2 0,226641134 0,032665432 6,938256111 0,00095487 0,142671967 0,3106103 0,142671967 0,3106103
Variable X 3 -0,027515089 0,016675175 -1,650062929 0,159842797 -0,070379991 0,015349814 -0,070379991 0,015349814
Variable X 4 0,073401204 0,041293493 1,77754891 0,135622404 -0,0327471 0,179549507 -0,0327471 0,179549507
Ejercicio 4
X1 X2 Y
Embarcaciones
Empleo (En Reparaciones o
Año en Resumen
miles) Conversiones
construcción
1 133,4 108 431 Estadísticas de la regresión
2 177,3 99 1335 Coeficiente de correlación múltiple 0,615398923
3 143 105 1419 Coeficiente de determinación R^2 0,378715834
4 142 111 1631 R^2 ajustado 0,068073751
5 130,3 100 852 Error típico 18,81144842
6 120,6 85 847 Observaciones 7
7 120,4 79 806
ANÁLISIS DE VARIANZA
Ecuación multilineal Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
y = 0,46 x1 + 0,02 x2 + 71,03 Regresión 2 862,8347768 431,4173884 1,219138857 0,385994015
El modelo muestra una relación cercana entre las variables usadas. Residuos 4 1415,482366 353,8705915
Por otro lado, los puntos débiles están en los coeficientes de Total 6 2278,317143
determinación y de correlación, ya que su exactitud es muy baja.
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 71,0318466 63,77862873 1,113724895 0,327805562 -106,046015 248,1097082 -106,046015 248,1097082
Variable X 1 0,461991397 0,692335164 0,667294428 0,54110803 -1,46023918 2,384221974 -1,46023918 2,384221974
Variable X 2 0,020815324 0,019474121 1,068870993 0,345341117 -0,033253506 0,074884153 -0,033253506 0,074884153