IVc Regresion Lineal y Correlacion PDF
IVc Regresion Lineal y Correlacion PDF
IVc Regresion Lineal y Correlacion PDF
Conceptos generales
...
...
Objetivos
...
Ecuación
( X 1 ... X p | 1 ... q )
• donde:
= Variable respuesta (dependiente)
Xi = Variable independiente (i = 1, ... , p)
j = Parámetro de la función (j = 1, ... , q)
• Modelo y ecuación:
Yi Y . X i X i i
Yi ( X i X ) i
• donde:
= Parámetros de la ecuación a ser estimados
= Valor de la intercepción de Y poblacional, cuando X = 0
= Pendiente de la línea a través de la media de la población
de Y.
X = Variable independiente.
10
• Modelo Tipo I
– Se considera Modelo Tipo I cuando los valores de la variable
independiente son considerados como fijos (X’s).
– Para este modelo el investigador selecciona los valores de X,
entendiéndose que los valores de la variable dependiente son aleatorias.
– Se puede presentar tres casos de variación en la toma de la muestra.
• Modelo Tipo II
– Se considera Modelo Tipo II cuando los valores de la variable
independiente son considerados como aleatorios (X’s).
11
X ,
i Y Xi
X ,
i' Y X i'
unidades Y . X X i
i
Y . X X i'
i'
Y .0
1 X’i Xi X
12
Yi a bX i e i
N N
e
i 1
2
i
i 1
2
i
Mínimo
e Y Yˆi Yi a bX i
N N N
2 2 2
Mínimo
i i
i 1 i 1 i 1
13
n 2
Yi a bX i 0
â i i
n 2
Yi a bX i 0
b i i
14
...
• entonces:
n
2 Yi a bX i 1 0
i 1
n
2 Yi a bX i X i 0
i 1
• operando
n
Y
i 1
i a bX i 0
Y X
n
i i aX 1 bX 12 0
i 1
15
• desarrollando la ecuación:
n n n
Y aˆ bX
i 1
i
i 1 i 1
i 0
n n n
Y X aˆX bX
i 1
i i
i 1
i
i 1
2
i 0
n
si aˆ Naˆ
i 1
Y
i 1
i Naˆ b X i
i 1
n n n
Yi X i aˆ X i b X i2
i 1 i 1 i 1
16
...
Y i b X i X Y i i b X i2
aˆ i 1 i 1
aˆ i 1
n
i 1
X
N
i
i 1
• igualando ambas ecuaciones:
n n n n
Y i b X i X Y i i b X i2
i 1 i 1
i 1
n
i 1
X
N
i
i 1
n n
n Yi b X i n n
i 1
Xi
i 1
N
i 1
X iYi b X i2
i 1 i 1
17
n n
n X Y i i
X Y i i i 1
N
i 1
b i 1
2
n
Xi
i 1
n
i 1
X
N
i
2
18
• estimación de â
n n
Y i X i
aˆ i 1
b i 1
N N
aˆ Y bX
19
20
r bY . X bX .Y
21
22
Fuentes de variación en Y X , Y . e Y Yˆ
Y
X , Yˆ
Yˆ Y b X X
Yˆ Y b X X
X , Y X ,Y
Ŷ
X
23
Fuentes de variación
Y Y Yˆ Y Y Yˆ b X X eY . X
24
• Atribuible a la media
nY 2
Y 2
• atribuible a la regresión
b 2 X X
2 X X Y Y 2
X X
2
25
Fuentes de variación
• Ecuaciones derivadas:
Y Y b X X eY . X
Y nY 2 b 2 X X eY2 . X
2 2
Y X X Y Y
2 2
Y 2
SC residual
X X
2
n
SC b | a
X X Y Y 2
X X
2
SC b | a b X X Y Y b 2 X X Yˆ Y
2
2
26
grados
Suma de Cuadrado
Fuente de Variación de F
Cuadrado Medio
libertad
Debido a la regresión 1 X X Y Y / X X
2 2
SCb /glb CMb /
Error n-2 Y Yˆ
2
SCe /gle CMerror
Total n-1 Y Y
2
27
Fuente de
Individual Todo el grupo
Variación
Yˆ 2
Regresión (Yˆ Y ) i Y SC Regresión
Y Yˆi
2
Residual (Y Yˆ ) i SC Residual
Total (Y Y ) Y i Y 2 SC Total
28
29
X X Y Y 2
Y Y
2
Y Y X X
2 2
sY2 . X
n2 n2
• Varianza de un estimado, de la media Y para una X dada.
1
sY2ˆ sY2 . X
X X 2
X X
2
n
30
CI Y . X Y b X X t 0.025 sY . X
1
X X 2
n X X 2
n X X 2
31
CI b
t 0.025 sY . X
X X
2
32
Prueba de Hipótesis
33
Y Ajustado Y eY . X Yi b X i X
34
Yˆ a bX
Y
Y1
Y2 Y1 Y2
Y’2
Y2' Y1'
Y’1
0
X X
35
Y . X X i
• Todas las poblaciones involucradas en la regresión son
normalmente distribuidos, con varianza común 2. La suma de
los errores () es igual a cero.
36
2
Y=+X
2
2
x1 x2 xi
37
1
V ( pred Y ) Y2 . X 1
X X 2
n X X 2
s 2 pred Y sY2 . X 1
1 X X 2
n X X 2
38
CI ( pred Y ) Y b X X t 0.025 sY . X 1
1
X X 2
n X X 2
39
40
41
42
X = Peso al nacimiento
Y = Peso al destete
X 699.30 X 2
24,707.59
Y 4,707.70 Y 2
1,089,898.23
X 33.30 Y 224.18
XY 162,186.20
n 21
s X2 71.05 sY2 1,727.20
44
162,186.20
699.304,707.70
21 5,419.79
b 3.8143
24,707.59
699.302 1,420.90
21
SC ( X ) 24,707.59
699.302 1,420.90
21
SP ( X , Y ) 162,186.20
699.304,707.70 5,419.79
21
SP ( X , Y ) 5,419.79
b 3.8143
SC ( X ) 1,420.90
45
X X
2
SC Re gresión b X X Y Y b 2 X X
2
699.304,707.70 2
162,186.20
21
SC Re gresión
24,707.59
699.302
21
29,374,123.64
SC Re gresión 20,672.90
1,420.90
CM Re gresión 20,672.90
46
SC Error Y Yˆ Y Y
2 2 X X Y Y 2
X X
2
162,186.20
699.304,707.70 2
1,089,898.23
4,707.702 21
SC Error
E
21 24,707.59
699.30
2
21
29,734,123.6441
SC Error 34,543.9781 13,871.0781
1,420.90
13,871.0781
CM Error 730.05674
21 2
47
Total 20 34,453.9781
48
H0 0
b 0
t
sY2 X
X X
2
t 2 F (5.3213) 2 28.3168
t ( 0.05 ,19 gl ) 2.093
t ( 0.01,19 gl ) 2.861
49
Peso Peso
Peso Peso
Peso Nac. Destete Peso Nac. Destete
Destete Destete
ajustado ajustado
20.60 187.50 235.94 37.40 249.60 233.96
21.00 163.80 210.72 38.80 265.80 244.82
22.40 157.80 199.38 39.60 216.90 192.87
22.80 218.70 258.75 40.30 218.10 191.40
24.20 223.50 258.21 41.20 288.00 257.87
26.20 176.60 203.68 42.60 265.50 230.03
27.00 220.90 244.83 42.80 268.50 232.26
28.50 201.70 220.01 43.10 219.60 182.22
30.80 175.50 185.04 43.20 283.50 245.74
31.00 180.60 189.37 43.40 288.60 250.08
32.40 237.00 240.43
50
300
280
260
240
220
Peso al desttete
200
180
160
140
120
100
20.00 25.00 30.00 35.00 40.00 45.00
Peso al Nacim iento
51
X 315.00 X 2
3,301.00
Y 46.52 Y 2
69.799
X 9.8438 Y 1.4538
XY 445.71
n 32
s X2 6.4587 sY2 0.0700
53
445.71
315.0046.52
32 12.22
b 0.0610
3,301.00
315.002 200.2188
32
SC ( X ) 3,301.00
315.002 200.2188
32
SP ( X , Y ) 445.71
315.0046.52 12.22
32
SP ( X , Y ) 12.22
b 0.0610
SC ( X ) 200.2188
54
X X
2
SC Re gresión b X X Y Y b 2 X X
2
315.0046.52 2
445.71 32
SC Re gresión
3,301.00
315.002
32
149.3590
SC Re gresión 0.7460
200.2188
CM Re gresión 0.7460
55
SC Error Y Yˆ Y Y
2 2 X X Y Y 2
X X
2
445.71
315.0046.52 2
69.799
46.522 32
SC Error
E
32
3,301.00
315.00
2
32
149.3590
SC Error 2.1706 1.4246
200.2188
1.4246
CM Error 0.04749
32 2
56
Total 31 2.1706
57
H0 0
b 0
t
sY2 X
X X
2
t 2 F ( 3.96352) 2 15.70954
t ( 0.05 , 30 gl ) 2.042
t ( 0.01, 30 gl ) 2.750
58
59
2.50
2.00
1.50
1.00
0.50
0 2 4 6 8 10 12 14 16
Tam año de Cam ada al Nacim iento
60
Correlación
62
63
Valor Observaciones
Correlación positiva, si se
r >0 incrementa en X se incrementa
también en Y
Correlación negativa, si se
r<0
incrementa en X se reduce en Y
No existe correlación, relación
r=0
independiente.
64
Valor Observaciones
r=0 No existe correlación
r = (0, 0.30] Correlación baja.
r = (0.30, 0.60] Correlación media
r = (0.60, 1.00] Correlación alta
65
Correlación no lineal
66
67
Tipos de correlación
68
69
70
X X Y Y
n
i 1
r n 1
X X Y Y
n n
2 2
i 1 i 1
n 1 n 1
X X Y Y
n
r i 1
X X Y Y
n n
2 2
i 1 i 1
71
Coeficiente de Determinación
72
Y Y Yi Yˆ
n n 2
2
i
r
2 i 1 i 1
Y Y
n
2
i
i 1
73
Coeficiente de determinación
VExplicada
R2 r 2
VTotal
Y2 VResidual V
R2 1 Resi2dual
Y2 Y
74
Coeficiente de determinación
2
n
X i X Yi Y
r n
2 i 1
X i X Yi Y
n
2 2
i 1 i 1
75
i 1 i 1 SC debido a X
r
2
Yi Y
n
2 SC Total (Y )
i 1
2
n
X i X Yi Y Yi Y
n
2
SC debido a Y
r 2 i 1 i 1
X i X
n
2 SC Total ( X )
i 1
n n
X i X Yi Y X i X Yi Y
r 2 i 1 n i 1 b b
X i X Yi Y 2
n YX XY
2
i 1 i 1
76
Coeficiente de No Determinación
1 - r² = s²XY / s²Y
77
1 r
Z ' 0.5 ln
1 r
78
79
r
t
1 r2
n2
80
1 2
Z 1' Z 2'
Z*
m
1
n
i 1 i 3
81
82
• Determinación de Z promedio:
n 3Zi
'
i
Z '
i
n 3
w
i
i
83
84
Tamaño
T ñ d
de
1.00 0.597 0.842 0.326
Camada al
442 362 440 357
Nacimiento
Tamaño de
0.597 1.00 0.558 0.771
Camada al
362 362 362 356
Destete
Peso de la
0.842 0.558 1.00 0.353
Camada al
440 362 440 357
Nacimiento
Peso de la
0.326 0.771 0.353 1.00
Camada al
357 356 357 357
Destete
85
Tamaño
T ñ d
de
1.00 0.530 0.822 0.331
Camada al
310 258 309 259
Nacimiento
Tamaño de
0.530 1.00 0.577 0.793
Camada al
258 258 258 258
Destete
Peso de la
0.822 0.577 1.00 0.481
Camada al
309 258 309 259
Nacimiento
Peso de la
0.331 0.793 0.481 1.00
Camada al
259 258 259 259
Destete
86
T
Tamaño
ñ d
de
1.00 0.528 0.838 0.387
Camada al
316 261 313 260
Nacimiento
Tamaño de
0.528 1.00 0.545 0.826
Camada al
261 261 261 259
Destete
Peso de la
0.838 0.545 1.00 0.431
Camada al
313 261 313 260
Nacimiento
Peso de la
0.387 0.826 0.431 1.00
Camada al
260 259 260 260
Destete
87
• r = 0.416
88
Anexos
91
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Output Statistics
93
Sum of Residuals 0
Sum of Squared Residuals 13871
Predicted Residual SS (PRESS) 16874
94
95
96
97
98
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 1 0
0.74598
74598 0
0.74598
74598 15.71
15 71 0.0004
0 0004
Error 30 1.42457 0.04749
Corrected Total 31 2.17055
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
101
102
103