Laboratorio Taller Regresion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 13

LABORATORIO – TALLER DE REGRESIÓN

Por Ing. Wilson Castro Zapata

1. REGRESIÓN LINEAL SIMPLE

El modelo de regresión lineal simple se representa como:

ŷ = 𝑏0 + 𝑏1 𝑥

(∑ 𝑦𝑖)2
𝑆𝑆𝑇 = ∑ 𝑦𝑖 2 −
𝑛

𝑆𝑆𝐸 = ∑ 𝑦𝑖 2 − 𝑎 ∑ 𝑦𝑖 − 𝑏 ∑ 𝑥𝑖𝑦𝑖

𝑆𝑆𝐸
𝑟2 = 1 −
𝑆𝑆𝑇

𝑆𝑋𝑌 𝐶𝑜𝑣(𝑥, 𝑦)
𝑟= =
√𝑆𝑋𝑋 √𝑆𝑌𝑌 √𝑉𝑎𝑟(𝑥) ∙ 𝑉𝑎𝑟(𝑦)

Las ecuaciones, obtenidas por el método de mínimos cuadrados derivando SSE para encontrar los
coeficientes de regresión son:
REGRESION LINEAL MÚLTIPLE

En este modelo, se tienen varias variables independientes o explicativas x1, x2, …, xk y una sola
variable respuesta y. La ecuación de regresión múltiple es:

ŷ = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 +. . . +𝑏𝑘 𝑥𝑘

Ecuaciones para el cálculo de los estimadores:

MATRICES

El modelo general es:

Al desarrollar el modelo de regresión, se tiene que en este:

(𝑋′𝑋)𝐛 = 𝑋′𝑦

Que para mayor facilidad se representa como:

𝐀𝐛 = 𝐠
Con:

De esta forma, para encontrar los estimadores, es decir, el vector b, se tiene:

𝒃 = 𝑨−𝟏 ∙ 𝒈
Ejemplo

Encontrar un modelo de regresión múltiple de la forma:

y = b0 + b1 x1 + b2 x2

con los datos:

y x1 x2
193 1,6 851
172 22 1058
113 33 1357
230 15,5 816
91 43 1201
125 40 1115
Primero se implementa la Matriz X:

Se copia y pegado especial/Trasponer:

Matriz X Matriz X’
1 1 1 1 1 1
1 1,6 851 1,6 22 33 15,5 43 40
1 22 1058 851 1058 1357 816 1201 1115
1 33 1357
1 15,5 816
1 43 1201
1 40 1115

Con la función MMULT() se obtiene la matriz producto X’X en ese orden:

Matriz X’X:

6 155,1 6398
155,1 5264,81 178309,6
6398 178309,6 7036496

Luego se obtiene la Inversa con la función MINVERSA():

MINVERSA(X’X)

8,5950959 0,0809579 -0,009867


0,08095787 0,0021025 -0,000127
-
-0,0098667 0,0001269 1,233E-05

Se obtiene el vector g = X’y con la función MMULT():

Vector g = X’y

g = X'y
924
20299,8
935906

Finalmente se obtiene el vector b multiplicando MINVERSA(X’X)*g:


INV(X'X) g = X'y
b0 = 8,5950959 0,0809579 -0,009867 924 = 350,994271
-
b1 = 0,08095787 0,0021025 -0,000127 20299,8 = 1,27199445
- -
b2 = -0,0098667 0,0001269 1,233E-05 935906 = 0,15390423

Ahora se calcula el ypronosticado con el modelo y los errores o residuales. Así, si b0 se encuentra
en la celda I20, b1 en I21 y b2 en I22 y los datos de x1 inician en C2 y de x2 en D2, para encontrar
el primer Ypronosticado se inserta la fórmula:

=$I$20+$I$21*C2+$I$22*D2

Donde se fijan con F4 los valores de las constantes, luego se hace el copiado automático
obteniéndose el resultado:

ypron Error
217,987 -24,987
160,180 11,820
100,170 12,830
205,693 24,307
111,460 -20,460
128,511 -3,511
SUMA: 0,000

El error es solamente la diferencia entre el y verdadero y el y pronosticado. La suma de errores


debe ser cero.

REGRESIÓN MÚLTIPLE CON EL COMPLEMENTO ANÁLISIS DE DATOS

Se seleccionan los datos como se ilustra y se indica una salida del informe:
Y se obtienen los mismos resultados que realizando el procedimiento matricial.
MODELOS NO LINEALES Y LINEALIZACION

Ejemplo. Se tienen los datos de Presión y Volumen de un gas ideal:


P V
64,7 50
51,3 60
40,5 70
25,9 90
7,8 100

La ley para un gas ideal en cierto proceso, es de la forma:


𝛾
Pi Vi = C

Se observa que corresponde al caso y = Cx A

Aplicando logaritmos:
𝛾
ln(Pi Vi ) = ln(C)
𝛾
ln(Pi ) + ln(Vi ) = ln(C)

ln(Pi ) = ln(C) − 𝛾ln(Vi )

Obteniendo los logaritmos:

ln(Pi) ln(Vi)
Y* X*
4,1697612 3,91202301
3,93769075 4,09434456
3,70130197 4,24849524
3,25424297 4,49980967
2,05412373 4,60517019
Al aplicar el modelo lineal se obtiene:

Y*
5
4,5
4
3,5
3
2,5 y = -2,6535x + 14,759
R² = 0,8156
2
1,5
1
0,5
0
3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 4,6 4,7

Y* = -2.6535X*+14.759

Luego: 𝛾 = − 2.6535, que es propio del gas

lnC = 14.759

𝐶 = 𝑒 14.759 = 2568929.93 Intersección (Excel dice intercepción)

Al correr el complemento con estos datos, efectivamente se obtiene:

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,90308495
Coeficiente de determinación R^2 0,815562427
R^2 ajustado 0,754083236
Error típico 0,415070862
Observaciones 5

Coeficientes
Intercepción 14,7589739
Variable X 1 -2,653472208
Desarrollar los puntos indicados.
b) Calcule el coeficiente de correlación e indique qué tan bueno es el modelo lineal para estos
datos.

También podría gustarte