Parte 1 de Inf - Mes4, para Alumnos
Parte 1 de Inf - Mes4, para Alumnos
Parte 1 de Inf - Mes4, para Alumnos
Y=a+bx
Donde:
Y= Variable dependiente
a= Intersección en Y para la población
b= Pendiente para la población
X= variable independiente
EJEMPLO
En la regresión lineal simple la gráfica de la ecuación se llama línea de regresión
estimada.
𝒚 = 𝟏𝟓 + 𝟎. 𝟓𝒙 𝒚 = 𝟑𝟎 − 𝒙
x y x y
0 15 X=0 y=15+0.5(0)=15 0 30 X=0 y=30-0=30
10 20 10 20
20 25 20 10
30 30 30 0
40 35
En general una recta de correlación simple toma la forma Y=a+bx en donde “a” es
intersección “Y”, esto es al punto en que la recta y el eje “Y” se intersectan y lo es la
pendiente de la recta la cual es un cambio en “Y” por cada unitario en X.
TALLER 1
Para la ecuación Y=a+bx, Muestra gráficamente cada uno de los siguientes pares y
describa la relación entre “X” y “Y”.
a, b
A 2,0
B 2,1
C -2,2
D 4,3
E -2,3
F 1, -5
Diagrama de dispersión
(r= 0.97)
( r=-0.99)
(r= 0.06)
(parabólica r= - 0.33)
En nuestro caso, parece existir una relación positiva entre las dos variables, es decir, las
puntuaciones medias de percepción de calidad se incrementan a medida que aumentan las
puntuaciones medias de expectativas. No obstante, esta relación entre ambas variables parece ser
débil, al tiempo que se observa una considerable dispersión de los datos, especialmente en el rango
de valores altos para expectativas.
Coeficiente de Correlación
Para determinar con más precisión el grado de esa relación, se puede calcular el coeficiente de
correlación lineal, que expresa la intensidad de la correlación entre dos variables. Este coeficiente
puede calcularse mediante la fórmula correspondiente, El coeficiente de correlación lineal, que se
expresa mediante la letra “r”, es el cociente entre la covarianza y el producto de las desviaciones
típicas de ambas variables:
El valor de este coeficiente puede estar comprendido entre −1 y 1. Cuando toma un valor próximo a
−1, la correlación es fuerte y negativa. Si el valor es cercano a +1, la correlación es fuerte y positiva.
Si el coeficiente de correlación lineal presenta un valor próximo a 0, la correlación es débil.
El cálculo del coeficiente de correlación lineal efectuado para los datos del ejemplo de nuestro
diagrama de dispersión arroja un resultado de:
r = 0,45
Se confirma que existe una relación positiva entre ambas variables, si bien la correlación encontrada
es moderada.
Nota: Se utiliza el coeficiente de correlación de Pearson, aplicable para variables cuantitativas, que
mide el grado de covariación entre distintas variables relacionadas linealmente. Esto significa que
puede haber variables fuertemente relacionadas, pero no linealmente, en cuyo caso no es aplicable
la correlación de Pearson
𝑛(𝜀𝑥𝑦) − (𝜀𝑥)(𝜀𝑦)
𝑟=
√𝑛(𝜀𝑥 2 ) − (𝜀𝑥)2 . √𝑛(𝜀𝑦 2 ) − (𝜀𝑦)2
N=20
𝜀𝑥𝑦 = 1012
𝜀𝑥 = 147
𝜀𝑦 = 131
𝜀𝑥 2 = 1261
𝜀𝑦 2 = 921
20(1012) − (147)(131) 983
𝑟= = = 𝟎. 𝟒𝟔
√20(1261) − (147)2 . √20(921) − (131)2 2131.99
TALLER 2
Calcule el coeficiente de correlación para los siguientes datos.
El criterio de los cuadrados mínimos exige que sea la suma mínima, entonces
cualquier recta que minimice esta cantidad recibe el nombre de cuadrados mínimos.
𝑁. (∑ 𝑥𝑦) − (∑ 𝑦)(∑ 𝑥)
𝑏=
𝑁(∑ 𝑥)2 − (∑ 𝑥)2
∑ 𝑦 − 𝑏. ∑ 𝑥
𝑎=
𝑁
EJEMPLO
En una compañía de seguros se desea determinar la relación entre la experiencia en
ventas y el volumen de las mismas, se selecciona una muestra aleatoria de 9
vendedores, años de experiencia (X) y ventas anuales(Y).
1 2 2 1 4
2 1 2 4 1
3 3 9 9 9 Calcula
4 3 12 16 9
1. Diagrama de Dispersion
5 4 20 25 16 2. Coeficiente de regresión a y b
3. Ecuacion de regresion
6 5 30 36 25 4. X=10 años
5. Calcula la correlacion simple
7 6 42 49 36
8 5 40 64 25
9 7 63 81 49
SOLUCION
TALLER 4
2 70
1 40
3 100
2 80
1 30
3 100
∑ = 12
SOLUCION
Regresión Múltiple
Si solamente están involucrados 2 variables, se dice que la técnica es una regresión o
correlación simple, cuando están implicados 3 o más variables se tratara de una relación
o correlación múltiple.
EJEMPLO
En la regresión lineal simple la gráfica de la ecuación se llama lineal de regresión
estimada
y= 1.5+0.5
x y
0 15
10 20
20 25
30 30
40 35
En general una recta de relación simple toma la forma y=a*bx en donde “a” es
intersección “y”, esto es el punto en que la recta y el eje “y” se intersecta y b es la
pendiente de la recta la cual es un cambio en “Y” por cada cambio unitario en x.
Regresión múltiple
Las ideas anteriores pueden generalizarse a más variables, por ejemplo, si creemos que
hay una regresión lineal entre una variable dependiente “Z” y 2 variables independientes
“X,Y” entonces buscaremos una ecuación conectando las variables que tengan la forma
siguiente:
Z=a+bx+cy
Está se denomina ecuaciones de regresión (Z/XY), Puesto qué la ecuación pasada
representa un plano en un sistema de coordenadas rectangulares tradicional. Se llama
plano de regresión, para encontrar el plano de regresión de los cuadrados mínimos,
determinados los coeficientes de regresión a, b, c con los siguientes ecuaciones
normales correspondientes.
Ecuaciones normales
∑ 𝑍 = 𝑁. 𝑎 + 𝑏. ∑ 𝑋 + 𝐶. ∑ 𝑌
∑ 𝑋𝑍 = 𝑎. 𝑥 + 𝑏. ∑ 𝑋 2 + 𝐶. ∑ 𝑋𝑌
∑ 𝑌𝑍 = 𝑎. ∑ 𝑌 + 𝑏. ∑ 𝑋𝑌 + 𝐶. ∑ 𝑌 2
EJEMPLO
La tabla siguiente muestra los pesos (z) en libras, las estaturas (x) en pulgadas y las
edades (y) en años.
N X Y XY X2 Y2 Z XZ YZ Z=a+bx+cy
Regresión múltiple
Z=a+bx+cy
753=12a+643b+106c
40830=643a+34843b+5779c
6796=106a+5779b+976c
a + b + c = ∑𝑍
a + b + c = ∑ 𝑋𝑍
a + b + c = ∑ 𝑌𝑍
TALLER 5
N X Y XY X2 Y2 Z XZ YX Z=a+bx+cy
1 61 19 123
2 66 21 209
3 59 22 132
4 60 19 147
5 66 20 150
6 63 20 125
7 66 26 147
8 60 19 110
9 65 19 130
10 58 20 144
11 61 20 119
12 67 20 160
13 67 19 150
14 63 19 132
15 70 25 183
16 68 20 160
17 67 19 139
∑=
SOLUCION