Regresion Lineal Simple
Regresion Lineal Simple
Regresion Lineal Simple
1.1. Introduccin
1.2. Especificacin del modelo de regresin lineal simple en la poblacin.
1.2.1. Estructura de los modelos de regresin
1.2.2. Hiptesis bsicas
1.3. Estimacin de los parmetros del modelo de regresin lineal simple
1.3.1. La recta de regresin de mnimos cuadrados en
puntuaciones directas y principales propiedades
1.3.2. La recta de regresin en puntuaciones diferenciales
1.3.3. La recta de regresin en puntuaciones tpicas
1.3.4. Relacin entre la pendiente de la recta y el coeficiente de
correlacin
1.3.5. Interpretacin de los coeficientes de la recta de regresin
1.4. El contraste de la regresin
1.4.1.Componentes de variabilidad y bondad de ajuste
1.4.2. Validacin del modelo
1.4.3. Significacin de parmetros
1.5. Diagnosis del modelo: Anlisis de residuos
1.6. Prediccin
1.1. Introduccin
1.1.Ejemplos de investigaciones en las que puede ser adecuado utilizar el
modelo de regresin simple.
Se pretende estudiar si la competencia escolar de nios,
medida en una escala entre 1 y 4, depende del tiempo en
meses que llevan viviendo con un progenitor
Variable dependiente o criterio (endgena): competencia escolar
Variable independiente o predictora (exgena): meses de
monoparentalidad
Se pretende estudiar si el ajuste emocional de nios, medido
por un test de ajuste que proporciona puntuaciones en una
escala entre 0 y 10, depende del mbito rural o urbano en el
que vive la familia
Variable dependiente o criterio: ajuste emocional
Variable independiente o predictora: mbito geogrfico
1.1. Introduccin
1.1.Ejemplos de investigaciones en las que puede ser adecuado utilizar el
modelo de regresin simple.
Se pretende estudiar la relacin entre estrs laboral y la
variable trabajo a turno
Variable dependiente o criterio: estrs laboral
Variable independiente o predictora: tipo de turno: fijo o variable
Se pretende estudiar si las notas en Anlisis de Datos II
dependen de Anlisis de Datos I
Variable dependiente o criterio: Anlisis de Datos II
Variable independiente o predictora: Anlisis de datos I
Para estudiar empricamente estas relaciones medimos, en una muestra de sujetos, los valores
de las variables incluidas en la relacin. Genricamente, la informacin de un sujeto cualquiera de
la muestra Si, vendr dada por el par (Xi, Yi). El conjunto de pares constituye la matriz de datos
de la investigacin y para los ejemplos propuestos tendr el siguiente formato.
N=9
Anlisis de datos II
1
2
3
4
5
0
7
8
9
10
Meses
2
1
3
4
2
3
5
6
8
9
2
18
108
24
132
60
16
9
84
N=10
comp escolar
mbito
4
4
3.66
2.83
2
3.5
2.16
2.66
2.5
1.83
N=10
1
1
1
1
1
0
0
0
0
0
comp escolar
N=10
4
4
3.66
2.83
2
3.5
2.16
2.66
2.5
Turno
estrs
0
0
0
0
0
1
1
1
1
1
65
76
50
89
57
45
34
56
55
61
25
20
15
-5
10
4
0
10
3
12
2
-10
1
-15
0
0
10
12 -20
0
0
10
12
80
5
60
0
40
-5
20
-10
0
0
30
25
20
15
10
5
0
-15
40
35
30
25
20
15
10
5
0
0
10
15
20
300
250
200
150
100
50
0
0
10
15
20
1.1.3.2. La covarianza
N
x y
i 1
S P C
N 1
Y -Y
X - X
X - X
Y -Y
X - X
X - X
(X
Y -Y
S xy
)(
- X Y -Y
x y
S
S
x y
x
i 1
i 1
Y
i 1
1 r xy 1
rxy = 0.88
25
20
rxy = 0
15
10
rxy = 1
5
0
0
10
12
10
12
5
0
-5
-10
-15
-20
rxy = -1
rxy = -0.88
rxy = 0
Xi
Yi
predictora
independiente
exgena
explicativa
criterio
dependiente
endgena
explicada
Y i f X i i 0 1 X i i Y i i
Y i 0 1 X i Puntuacin predicha por la recta de regresin verdadera
Y Y
Residuo o error de prediccin
i
Ejercicio
fsico
Esperanza
de vida
Y 0 1 X 70 0,3 X
Consumo
de tabaco
Esperanza
de vida
Y 0 1 X 70 0,04 X
i
2. Homocedasticidad: la varianza del trmino de error es constante:
E( Y / Xi ) X i
ar
V
Y
X
)/(
E (Y / X i ) X i
1. La media de Y depende linealmente de
X:
2
Var
(
Y
/
X
)
2. La varianza de Y es constante:
i
Y / X i N ( X i , 2 )
y2 / x y2 / x y2 / x y2 / x
1
Distribucin Normal
X1,
X2,
X3,
X4
X1,
X2,
X3,
X4
8,00
Y: Anlisis de Datos II
7,00
6,00
5,00
4,00
3,00
2,00
1,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
X: Anlisis de datos I
b X
Y i
Y i
Y i e
9,00 10,00
Y i e
i1
2
i
i1
i1
b X
b X
i1
Y i Y i
i1
Yi
a b X
m in
X
i1
X
i1
Yi a b X
Y
X
Y bX i X
S
S
xy
2
x
rxy
-4,5
-2,1
20,25
9,45
-3,5
-3,1
12,25
10,85
-2,5
-1,1
6,25
2,75
-1,5
-0,1
2,25
0,15
-0,5
-2,1
0,25
1,05
0,5
-1,1
0,25
-0,55
1,5
0,9
2,25
1,35
2,5
2,9
6,25
7,25
3,5
1,9
12,25
6,65
10
4,5
3,9
20,25
17,55
55
41
82,5
56,5
Y Y
X X
( X X )2
X X Y Y
X
i 1
X Yi Y
2
56,50
0,743
82,50
i 1
Yi 0,021 0,743 X i
Y 0,021 0,742 X i
dependencia de escalas.xls
Y a bX e Y bX bX e
Y Y b X X e
y bx e
y bx
Sy
yi rxy
Sx
yi
xi
rxy
Sy
Sx
xi ei
ei
Sy
Z yi rxy Z xi Z ei
r Z
Z
i
xy
xi
a) En puntuaciones directas
Y 0,021 0,742 X i
b) En puntuaciones diferenciales
y 0,742 x
c) En puntuaciones estandarizadas
Z 0,86Z x
Sx
rxy b
Sy
1,0
,5
0,0
-,5
-1,0
-2,0
-1,0
-,5
0,0
,5
1,0
1,5
-1
-1
-2
-2
-1,5
-3
-2
-3
-3
-2
-1
-1
3
1.4. El contraste de la regresin: introduccin
1
1
0
0
-1
-2
-2
-1
-3
-2
-1
-2,0
-1
-2
-3
-3
-3
-2
-1
-1,5
-1,0
-,5
0,0
,5
1,0
1,5
3
3
2
2
1
1
0
0
-1
-1
-2
-3
-3
-2
-1
-2
-3
-3
-2
-1
-1
-2
-3
-4
-4
-3
-2
-1
Yi a bX i
Yi
Xi
Yi a bX i
Yi
Y Yi Y Yi Yi
Desviacin
Desviacin
Desviacin
total
explicada
residual
Xi
Y Y Y Y Y Y
N
i 1
i 1
i 1
Variacin
Explicada
Variacin
Residual
Xi
SCt
i1
2
i
i1
Yi 2
i1
Yi
i1
SCexp Y Y
i 1
b 2 X X b 2 xi2 b 2
i 1
i 1
X i2
i 1
SCres
i 1
Yi Yi
e
2
i 1
2
i
SCt SCexp
i 1
Xi
N 1S y2
2
2
b N 1 S x
SCt Z y2 N 1
i 1
SCexp Z r
i 1
2
i
2
xy
2
2
Z
r
x xy N 1
i 1
SCres N 1 1 rxy2
SCt
SCt
SCt
1 R 2 1 R2
R
2
SCexp
SCt
i 1
N
Y
i 1
b2 X X
Y
N
i 1
2
2
b 2 S x2
rxy2
2
Sy
r2xy= 0
Y
X
r2xy= 1
Y X
r2xy
Y
H 0 : E Y / X 0 Yi i
H1 : E Y / X 0 1 X i Yi 0 1 X i i
2.- Estadstico de Contraste (Discrepancia).
2
S exp
F
2
Sres
SCexp
rxy2
k
K
SCres
1 rxy2
N K1
N K 1
1-
Fc
Tabla F
Tabla F
H1 : 1 0
H0 : 0
H1: 0
b 1
Sb
2
S res
N
X
i 1
2
S res
i1
X i2
Xi
i 1
rxy
1 rxy2
N 2
Fc
Regiones de rechazo de H0
http://www.stat.ucla.edu/~dinov/courses_students.dir/Applets.dir/T-table.html
Tabla t de Student
1.6. Prediccin
Intervalos de prediccin:
Y o : Y t
,N K 1
S res 1
X X
X X
i1