T14. Modelos de Regresión Lineal
T14. Modelos de Regresión Lineal
T14. Modelos de Regresión Lineal
Talla
Peso
(cm) (kg)
162 61
154 60
180 78
158 62
171 66
169 60
166 54
176 84
163 68
OBJETO DEL TEMA
¿está relacionada la ¿podemos estimar el
talla y el peso de los peso de los atunes a
atunes? partir de su talla?
(cm) (kg)
162 61
Pesa 78 kg
154 60
180 78
158 62
171 66
Pesa 62 kg
169 60
166 54
176 84
163 68
Mide 158 cm Mide 180 cm
REGRESIÓN LINEAL SIMPLE
(cm) (kg)
a 162 61
la tall
co n 154 60
e nta
aum
180 78
es o
e l p 158 62
que
re ce 171 66
P a
169 60
166 54
176 84
163 68
REGRESIÓN LINEAL SIMPLE
Talla
Peso
(cm) (kg)
162 61
154 60
180 78
158 62
5 kg
171 66
169 60
5 cm 166 54
176 84
163 68
Resumiendo:
¿y0? ?
x0
^
y0
x0
e
Y ̂ = b0 + b1X
tg ángulo = b1
b0=55
En el modelo de regresión lineal simple,
dadas dos variables:
– Y (dependiente)
– X (independiente, explicativa, predictora)
Y = γ + βX estima
Y ̂ = b0 + b1X
¿CUAL ES LA MEJOR RECTA ?
ei = (yi − yi )̂
ellos se le denomina error residual o residuo
(yi − yi ̂)2 =
n n n
ei2 = (yi − (b0 + b1xi))2
∑ ∑ ∑
i=1 i=1 i=1
• Se comprueba que para lograr dicho resultado basta
con resolver:
n n
∑i XiYi − nXY ∑i (Xi − X) − (Yi − Y ) SXY
b1 = n 2 = n = 2
∑i Xi − nX 2 ∑i (Xi − X)2 SX
b0 = Y − b1X
• Valores que obtenemos del conjunto de datos
muestrales calculando:
las medias X Y
Xi2
∑ ∑ ∑
Xi XiYi
¿Cuándo es bueno un modelo de regresión?
¿Cuándo es bueno un modelo de regresión?
2
2
S XY Varianza de Y explicada por X
R = 2 2 =
SX SY Varianza total de Y
2 2
R =r
Y Ŷ
+ =
Varianza no explicada
X
¿Cuándo es bueno un modelo de regresión?
390
r= 0.984
420
r= 0.415
r^2 = 0.172 r^2 = 0.969
400
380
380
370
y
y
360
360
340
350
320
150 160 170 180 190 150 160 170 180 190
H0 : β = β0 = 0 β=?
H1 : β ≠ β0 ≠ 0 α = 0,05
(b1 − β0)SX n − 1
texp = < tn−2, α2
SY..X
(
p − valor = 2P tn−2 >
(b1 − β0)SX n − 1
SY..X )
Requisitos de los datos para un modelo
de regresión lineal
e = (Y − Y)̂
e=0
n n
(Y − Y )̂ 2 =
2 1 1
(yi − (b0 + b1xi))2
n−2∑ ∑
SY..X =
i=1
n − 2 i=1
2 n−1 2
SY..X = (SY − b12SX2)
n−2
Además, las estimaciones puntuales podemos extenderlas
a estimaciones por Intervalos de confianza obteniendo
información sobre los niveles de confianza y predicción:
Iβ1−α
(
= (b1 ± e) = b1 ± tn−2, α2
SY..X
SX n − 1 )
- sobre los valores puntuales de Y, dado un
punto de X, denominándose intervalo de
predicción:
Iy1−α
0
( (
= (b0 + b1x0 ± e) = b0 + b1x0 ± tn−2SY..X
1 (x0 − X )2
1+ +
n (n − 1)SX2 ))
Modelo de regresión lineal
Intervalo de confianza del 95%
Intervalo de predicción del 95%
Requisitos de los datos para un modelo
de regresión lineal
100
90
80
70
60
50
40
30
140 150 160 170 180 190 200
e e
Ŷ Ŷ
Requisitos de los datos para un modelo
de regresión lineal