Tema - Regresion y Correlacion
Tema - Regresion y Correlacion
Tema - Regresion y Correlacion
REGRESIÓN Y CORRELACIÓN
LINEAL SIMPLE
6
5
Predictando
4
3
2 Yc = a + bx
1
0
1 2 3 4
Predictor
Contando con información sobre variables, tales como: ingresos y gastos; ventas y
años de experiencia, ventas y utilidades. (Variables X, Y), se sabe o se asume que
guardan relación entre sí; se aplica regresión para estimar valores “Y”, a partir
de valores “X”, o sea sustituir valores observados por valores calculados.
Se dice regresión lineal cuando los valores de Y, pueden ser estimados bajo la
forma Y = a + b X, en cualquier otro caso se denominará regresión o correlación
no lineal (Curvilínea)
Permite estimar una variable llamada Predictando (Y) con relación a otra llamada
Predictor (X) para lo cual es necesario ajustar una línea recta a un conjunto de
datos, utilizando el método de mínimos cuadrados, a través de la ecuación de la
línea recta.
Y = a + bx; dónde: Y = Predictando, variable que se desea estimar
a y b = coeficientes de regresión, a = origen y b = pendiente.
X = Predictor, con base a la que se estima.
Para encontrar los coeficientes de regresión se pueden utilizar varias fórmulas.
a) Ecuaciones normales
∑ Y = na + b ∑ X
∑ XY = a ∑ X + b ∑ X 2
a= (∑ X 2 ) ( ∑Y ) - ( ∑ X ) ( ∑ XY )
n ∑X2 - ( ∑X )2
2
b= n ( ∑ X Y ) - (∑ X ) ( ∑Y )
n (∑ X 2 ) - ( ∑ X ) 2
c) Fórmula abreviada
a= Y - b X
b= ∑XY -n XY
∑X2 – nX2
∑ ( Y – Yc) 2 es mínima.
3
Dónde:
Y = Predictando ó variable que se desea estimar,
Yc = Valores de Y calculados con la ecuación,
n = Números de parejas de la variable
b) Fórmula abreviada:
Syx = ∑ Y 2 - a ∑ Y - b ∑ XY
n
Dónde:
X = valores del predictor, o variable dependiente
Y = Valores del predictando
a = origen de la ordenada
b= pendiente de la recta
n = número de parejas de la variable
a ) Propiedades de S yx
4
2.1 Características:
r , siempre es positivo, no dice si la correlación es negativa.
Para r: (puede ser positivo o negativo)
a) Sí r = 0, correlación positiva
b) Sí r = 0, correlación negativa
c) Sí r = 0, no existe correlación
d) Sí r = - 1, correlación perfecta negativa
e) Sí r = 1, correlación perfecta positiva
f) Sí - 1 ≤ r ≤ 1, la correlación es fuerte o débil, según se acerque a cero.
Una empresa cuenta con información sobre los gastos en publicidad y sus ventas
anuales. La información es la siguiente: (Miles de Quetzales)
2009 4 32
2010 10 42
2011 3 31
2012 4 35
2013 2 26
2014 1 21
5
SE PIDE:
a) El mapa de dispersión o nube de puntos;
b) Determinar la ecuación de regresión para estimar las ventas anuales;
c) Estimar las ventas anuales para 2015, si se gasta en publicidad Q 5, 000.00;
d) Indicar el grado de error de la estimación;
e) Hallar el intervalo para el 68.26 % de los casos; y
f) Indicar cual es el grado de correlación entre las variables e interpretar el
resultado.
SOLUCIÓN
50
40
Ventas Q.
30
20
10
0
1 2 3 4 4 10
Gastos en publicidad Q.
b) Ecuación de regresión
Y = a +bX
b = ∑ XY - n X Y
∑X2- nX2
a = Y - bX
6
Cuadro de cálculo:
1 2 3 4 5
Año X Y XY X2 Y2
b= 854 - 6 (4 ) ( 31.17)
146 – 6 ( 4 )
a = 31.17 – 2.1184 ( 4 )
Y = 22.6964 + 2.1184 X
7
c) Estimar las ventas anuales para 2015, si se gasta en publicidad Q 5,
000.00;
Syx = ∑ Y 2 - a ∑ Y - b ∑ XY
n
Syx = 2.5
Yc ± Syx
Q30.7884 miles
33.2884 + 2.5 =
Q35.7884 miles
8
f) Indicar el grado de correlación de las variables.
6,031 – 6 ( 31.17 ) 2
6,091 - 5829.41
261.59
Intepretación: existe alta correlación entre las dos variables, con un 92.52 % que
está cercano a 100.0 % que es la máxima correlación.