Regresiones
Regresiones
Regresiones
Ecuación matemática:
Número
aleatorio
Y 0 1 X 1 2 X 2 ... n X n
simple
Múltiple
Regresiones
Nota
• Variable dependiente: Nota
en la evaluación
• Variable independiente:
Horas de estudio.
Horas de Estudio
Regresiones
Horas de Nota 20
Estudio (X) (Y)
16
4 8
12
Nota
5 10
8
6 12
4
7 14
0
8 16 1 2 3 4 5 6 7 8 9 10
9 18 Horas de Estudio
10 20
Y = 2X
R2 = 1
Coeficiente de Determinación 0 <> 1
Más alto mejor es la capacidad predictiva de X sobre Y
Regresiones
Horas de Nota
Estudio (X) (Y)
4 7
5 8.5
6 10
7 11.5
8 13
9 14.5
10 16
11 17.5
12 19 Y = 1.5X + 1
R2 = 1
Regresiones
Horas de Estudio Nota
(X) (Y)
12 12
9 10
10 11
14 11
2 9
7 11
16 15
11 11
15 16
8 8
4 9
18 17
12 13
9 9
10 14
Y = 0.654X + 5.081
2 6
17 20
0 4 R2 = 0.8126
8 11
20 18
Supuesto del Modelo de Regresión Lineal
1. Linealidad R²
2. Independencia
3. Homocedasticidad Residuos
4. Normalidad
5. No- Colinealidad X₁ ̴ X₂
Regresiones
Ŷ = b₀ + b₁ X
Donde:
1 58 2 116 4
2 105 6 630 36
3 88 8 704 64
4 118 8 944 64
5 117 12 1,404 144
6 137 16 2,192 256
7 157 20 3,140 400
8 169 20 3,380 400
9 149 22 3,278 484
10 202 26 5,252 676
1,300 140 21,040 2,528
Regresiones
21,400 - (140)(1300)/10
b₁ = 2,528 -(140)²/10
= 5
b₀ = 130 - 5 (14) = 60
Ŷ = 60 + 5 X
Regresiones
Restaurante xᵢ y = 60 + 5x
1 7 95
2 9 105
3 12 120
4 15 135
5 18 150
6 19 155
7 21 165
8 25 185
9 30 210
10 32 220
CASO: Distribuidor de Autos
• La variable dependiente es la
suma de un conjunto de
elementos:
Modelo de regresión múltiple poblacional:
• El origen de la recta.
Ventas = β0 + β1(Precio) + β2(Publicidad) + ε
• Una combinación lineal
de variables
independientes o
predictoras. Modelo de regresión múltiple muestral:
• Los residuos. Ventasj = b0 + b1(Precioj) + b2(Publicidadj) +
errorj
• El incumplimiento del supuesto
de linealidad = error de
especificación.
Modelo de regresión múltiple lineal
• El coeficiente de correlación, r o
R , es una medida de asociación Ventas = b0 + b1(Precio) + b2(Publicidad)
entre las variables aleatorias X y
Y, cuyo valor varía entre -1 y +1.
Los datos de 15 meses son recolectados….
Formulación del Modelo
Pendientes (bi)
Estiman el cambio en el valor promedio de “y” como bi unidades por cada
unidad de incremento en “xi” manteniendo las otras variables constantes.
Ejemplo: Si b1 = -10, entonces se espera que las ventas promedio (y) se
reduzcan en 10 autos por mes por cada $1000 en que se incremente el precio
(x1), manteniendo constante la variable publicidad (x2).
Intercepto (b0)
Estima el valor promedio de “y” cuando todas las variables “xi” son iguales
a cero.
Matriz de Correlación
Ventas 1
Precio -0.44327 1
Publicidad 0.55632 0.03044 1
• Excel:
– Datos / Análisis de datos / Regresión
Estimación de la Ecuación
Estimación de la Ecuación
SSR 29460.0
R2 0.52148
SST 56493.3
n 1
R 1 (1 R )
2 2
n k 1
A
R 2A 0.44172
• Estadístico de prueba:
SSR
k MSR
F
SSE MSE
n k 1
MSR 14730.0
F 6.5386
MSE 2252.8
Con 2 y 12 grados de libertad Valor P para la
prueba
DIAGNÓSTICO DEL MODELO: PRUEBA F
(SIGNIFICANCIA GENERAL)
0 No rechazar H0 Rechazar H0 F
Estadístico de prueba:
bi 0 (gl = n – k – 1)
t
sb i
¿LAS VARIABLES INDIVIDUALES SON
SIGNIFICATIVAS?
H0: βi = 0; HA: βi 0
/2=0.025 /2=0.025
g.l. = 15-2-1 = 12
= 0.05
t/2 = 2.1788 Rechazar H0 No rechazar H0 Rechazar H0
-tα/2 0 tα/2
-2.1788 2.1788
Excel (Resultado):
Coeficientes Error típico Estadístico t Valor p
Precio -24.97509 10.83213 -2.30565 0.03979
Publicidad 74.13096 25.96732 2.85478 0.01449
Decisión: Para cada variable se rechaza H0
Conclusión: Hay evidencia suficiente para concluir que cada variable in-
dividual (Precio y Publicidad) afecta a la venta de autos, dada
la presencia de la otra para =0.05
15-43
SSE
s MSE
n k 1
Residuos
Ventas Estimadas
Obtenido con Statpro (Complemento de Excel)
4. Normalidad (Residuos)
NORMALIDAD (RESIDUOS)
1
VIFj
1 R 2j
R2j es el coeficiente de determinación de la regresión de la j ma
variable independiente contra las restantes k – 1 variables
independientes