U1 Regresion Lineal Simple y Correlacion
U1 Regresion Lineal Simple y Correlacion
U1 Regresion Lineal Simple y Correlacion
Unidad 1
Regresion lineal simple y correlacion
E(Y / X) 0 1X
En donde B 0 y B 1 son parametros del modelo y son constantes
desconocidas. Por que es es necesario estimar los dos parametros.
Yˆ B0 B1 x
ó
Yˆ a bx
Se deben determinar los valores tanto de a como de b. para lo cual se hace
uso del metodo de Minimos cuadrados.
0
1 2 3 4 X
Las formulas para para determinar los valores de a y b son:
y bx
a
n
nxy xy
b
nx x
2 2
Ejemplo: Una empresa de mensajeria de entrega casa por casa, busca
mejorar su servicio. Desea establecer la relación que puede existir entre el
tiempo empleado y la distancia recorrida para la entrega de un determinado
producto.
Aplicando el modelo de regresion simple, es decir, las
formulas para calcular la ecuacion de la recta con a y b,
se puede realizar una tabla para facilitar los calculos.
Ejemplo a
y b x
n
n x y xy x2 Yˆ b
nx y xy
nx 2 x
2
1 825 3.5
2 215 1
3 1070 4 Yˆ a bx
4 550 2
5 480 1 nx y
6 920 3
7 1350 4.5
xy
8 325 1.5
nx 2
9 670 3
10 1215 5 x 2
Σ
bx
Ejemplo
y b x
a
n
nx y xy
b
nx 2 x
2
Yˆ a bx
nx y
xy
nx 2
x 2
bx
Regresion lineal
6
0
0 200 400 600 800 1000 1200 1400 1600
Medidas de variación
En el estudio de la regresion lineal simple se
establece la relacion que existe entre dos variables,
la cual se presenta a traves de una recta. Pero existen
algunas variaciones y errores presentes en dicha
relacion.
El error estándar es una medida de la dispersión
de los datos observados con respecto a la recta
de regresión.
El error estándar se obtiene mediante la
siguiente formula:
2
y ay bxy
Se
n2
La varianza de la variable separable se calcula:
2
2y 2
S y y
n
Ejemplo
y 2 ay bxy
Se
n2
99.75 0.1181 28.5 0.0036 26370
Se
10 2
Se 0.48
y 2
99.75
2.85
2 2
S y2 y2 S
y
n 10
S y2 1.85
Cálculo de los coeficientes de
correlación y de determinación.
Para determinar si en base a la relacion
que existe entre dos variables es posible
realizar estimaciones con una presicion
aceptable se deben conocer los
coeficientes de determinacion y
correlacion.
Coeficiente de determinación R2
x y
Sxy xy
n
Syy y 2
y 2
Variabilidad total
n
Sxx x 2
x
2
n
Coeficiente de correlacion r
ˆ
ei Yi Yi
Gráficamente, aparece un residuo en el diagrama de
dispersión como la distancia vertical entre un valor
observado de Y y la línea de predicción.
Analisis residual
H0: b=0
H1:b≠0
Para ello se utiliza en Analisis de varianza (ANOVA).
Fuentes de variaciòn
ANOVA
SCR b Sxy
x y
Sxy xy
n
Syy y 2
y 2
Sxx x 2
x 2
n
Ejemplo
a= 0.0036
b= 0.1181
SC R 0.0036 4653 16.68
Sxy 4653
Syy 18.525
Sxx 7104300
7620
2
1297860
10
Fuente de
GL SC CM Fc Ft
Variación
Regresión 1 16.68 16.68 72.52 7.57
Error 8 1.84 0.23
Total 9 18.525
Conclusión
Yˆ a bX
550 2 2.09
480 1 1.84
Yˆ 0.1181 0.0036(1578)
920 3 3.42
1350 4.5 4.96 Yˆ 5.8
325 1.5 1.28
670 3 2.52
1215 se tardaria
En conlusión 5 4.47
5.8 hrs en entregar un determinado producto
si la distancia
predecir 1578 es 1578 km.