β1
β1
β1
Uno de los supuestos básicos del modelo de regresión lineal clásico es el que los errores
tengan distribución normal con media cero y varianza 𝜎 2 , esto es:
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
𝑌𝑖 = 𝑋𝛽 + 𝑢
Donde:
𝑢𝑖 ~N(0, 𝜎 2 );∀𝑖
Dado que los estimadores de MCO son combinaciones lineales de 𝑌𝑖 , entonces los estimadores
también seguirían esta distribución
̅𝟐
𝟏 𝐗
𝛃𝟏 ~𝐍 (𝛃𝟏 , 𝛔𝟐 ( + 𝟐 ))
𝐧 𝚺𝐱
𝛔𝟐
𝛃𝟐 ~𝐍 (𝛃𝟐 , ( ))
𝚺𝐱 𝟐
̂2 −𝛽2
𝛽 𝛼
𝑃𝑟 (−𝑧1−𝛼 < 2
< 𝑧1−𝛼 ) = (1 − 𝛼) 𝑑𝑜𝑛𝑑𝑒 ∶ 𝑧1−𝛼 𝑒𝑠 𝑒𝑙 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 1 − 2
2 √𝜎 ⁄ 2 2 2
𝛴𝑥
Función de
densidad de la
Área = (1 − 𝛼)
normal estándar
𝛼
Área=
𝛼 Área= 2
2
Entonces:
2 2
𝑃𝑟 (𝛽̂2 −𝑧1−𝛼 √𝜎 ⁄ 2 < 𝛽2 < 𝛽̂2 + 𝑧1−𝛼 √𝜎 ⁄ 2 ) = (1 − 𝛼)
2 𝛴𝑥 2 𝛴𝑥
Ejemplo: para 𝛼=0.05, los valores máximo y mínimo del intervalo de confianza al 95% para 𝛽2
serían:
𝜎 2
𝛽̂2 ± 𝑍0.975 √𝛴𝑥 2 𝑍0.975 = 1.96
Comprobación:
(𝒏 − 𝟐)𝒔𝟐
𝒙𝟐 = ~𝒙𝟐(𝒏−𝟐)
𝝈𝟐
𝑝 [𝑥 2 𝛼⁄2,(𝑛−2) ≤ 𝑥 2 ≤ 𝑥 2 1−𝛼⁄ ] = (1 − 𝛼)
2,(𝑛−2)
(𝑛 − 2)𝑠 2 (𝑛 − 2)𝑠 2
𝑝[ ≤ 𝜎2 ≤ ] = (1 − 𝛼)
𝑥 2 1−𝛼⁄ 𝑥 2 𝛼⁄2,(𝑛−2)
2,(𝑛−2)
Área = (1 − 𝛼)
𝛼
Área=
𝛼 Área= 2
2
Comprobación:
̂ 𝟐 − 𝜷𝟐
𝜷
𝑷𝒓 −𝒕𝟏−𝜶 (𝒏 − 𝟐) < < 𝒕𝟏−𝜶 (𝒏 − 𝟐) = (𝟏 − 𝜶)
𝟐 𝟐 𝟐
√𝒔 ⁄ 𝟐
𝜮𝒙
( )
Operando:
2 2
𝑃𝑟 (𝛽̂2 −𝑡1−𝛼 (𝑛 − 2)√𝑠 ⁄ 2 < 𝛽2 < 𝛽̂2 + 𝑡1−𝛼 (𝑛 − 2)√𝑠 ⁄ 2 ) = (1 − 𝛼)
2 𝛴𝑥 2 𝛴𝑥
𝛼
𝑑𝑜𝑛𝑑𝑒 𝑡 𝛼(𝑛−2) 𝑒𝑠 𝑒𝑙 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 1 − 2
1−
2
𝒔𝟐
̂ 𝟐 ± 𝒕 𝜶 (𝒏 − 𝟐)√
𝜷𝟐 ∈ 𝜷 𝟏−
𝟐 𝜮𝒙𝟐
𝟏 𝑿̅𝟐
̂ 𝟏 ± 𝒕 𝜶 (𝒏 − 𝟐)√𝒔𝟐 ( +
𝜷𝟏 ∈ 𝜷 )
𝟏−
𝟐 𝒏 𝜮𝒙𝟐
Prueba de hipótesis
Es un procedimiento a través de pruebas de hipótesis. Involucran la recolección de una muestra
y el uso de resultados muestrales para proporcionar evidencias y emitir conclusiones.
Hipótesis Nula 𝑯𝟎 : 𝜷𝟐 = 𝒂
Hipótesis alternativa 𝑯𝟎 : 𝜷𝟐 ≠ 𝒂
Al ser 𝜷𝟐 una variable aleatoria prácticamente nunca será igual al valor, salvo cuestión de
azar.
Intervalo aleatorio
• Rechazo 𝐻0
• No rechazo 𝐻0
• ERROR TIPO I
• ERROR TIPO II
Acepta la hipótesis a pesar que 𝑎 y 𝛽2 son valores muy lejanos (se acepta una hipótesis falsa)
Intervalos de confianza más anchos o más angostos
𝐻0
𝐻1 𝐻1
Región de rechazo Región de rechazo
Región de
aceptación
𝛼 𝛼
2 2
Estadístico t
T-student cuando 𝐻0 es cierta 𝜷𝟐 = 𝒂
• Condición de rechazo de 𝐻0
̂𝟐 − 𝒂
𝜷
|| || > 𝒕 𝜶 (𝒏 − 𝟐)
𝟏−
𝟐
̂(𝜷
√𝑽𝒂𝒓 ̂𝟐 )
• Condición de No rechazo de 𝐻0
̂𝟐 − 𝒂
𝜷
|| || < 𝒕 𝜶 (𝒏 − 𝟐)
𝟏−
𝟐
̂(𝜷
√𝑽𝒂𝒓 ̂𝟐 )
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖
𝑯𝟎 : 𝜷𝟐 = 𝟎
𝑯𝟏 : 𝜷𝟐 ≠ 𝟎
̂𝟐
𝜷
|𝒕| = || || > 𝒕𝟏−𝜶 (𝒏 − 𝟐)
𝟐
̂ ̂
√𝑽𝒂𝒓(𝜷𝟐 )
̂𝟐
𝜷
|𝒕| = || || < 𝒕 𝜶 (𝒏 − 𝟐)
𝟏−
𝟐
̂(𝜷
√𝑽𝒂𝒓 ̂𝟐 )
EL P-VALUE
Probabilidad o 𝒑 > 𝒕
𝛽̂
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 2 × 1 − 𝐹 || || , 𝑛 − 𝑘
̂ (𝛽̂)
√𝑉𝑎𝑟
[ ( )]
̂
𝜷
𝒑 − 𝒗𝒂𝒍𝒖𝒆 = 𝟐 × 𝑭 − || || , 𝒏 − 𝒌
̂(𝜷
√𝑽𝒂𝒓 ̂)
( )
Donde:
̂
𝛽
𝐹 (| | , 𝑛 − 𝑘)=Función de distribución acumulada de t-student
̂)
̂ (𝛽
√𝑉𝑎𝑟
𝑘 = 2 en el modelo bivariado
Función de 𝑷-value
densidad de la
variable aleatoria
𝛼
Área= 2
𝛼 Área= 2
EJERCICIO 1:
Decisión:
Como
|𝑡| = 10.092 > 2.3646 = 𝑡 𝛼(𝑛−2)
1−
2
=> 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑐𝑜𝑛 5% 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎
EJERCICIO 2:
i) Contraste de la hipótesis : 𝛽2
Hipótesis
𝐻0 : 𝛽2 = 0
𝐻1 : 𝛽2 ≠ 0
Estadístico t:
Decisión:
Como
|𝑡| = 14.509 > 2.228 = 𝑡0.95(10)
𝑡 𝛼(𝑛−2)
1−
2
Producción 1 2 3 4 5 6 7 8 9 10
Costo Total 193 226 240 244 257 260 274 297 350 420
𝑁° 𝑋 𝑌 𝑥 = 𝑋 − 𝑋̅ 𝑦 = 𝑌 − 𝑌̅ 𝑥2 𝑥𝑦 𝑌̂ 𝑒 𝑒2
1 1 193 -4.50 -83.10 20.25 373.95 186.40 6.60 43.56
2 2 226 -3.50 -50.10 12.25 175.35 206.33 19.67 386.78
3 3 240 -2.50 -36.10 6.25 90.25 226.27 13.73 188.60
4 4 244 -1.50 -32.10 2.25 48.15 246.20 -2.20 4.84
5 5 257 -0.50 -19.10 0.25 9.55 266.13 -9.13 83.42
6 6 260 0.50 -16.10 0.25 -8.05 286.07 -26.07 679.47
7 7 274 1.50 -2.10 2.25 -3.15 306 -32.00 1024.00
8 8 297 2.50 20.90 6.25 52.25 325.93 -28.93 837.14
9 9 350 3.50 73.90 12.25 258.65 345.87 4.13 17.08
10 10 420 4.50 143.90 20.25 647.55 365.80 54.20 2937.64
SUMA 55.00 2761.00 0.00 0.00 82.50 1644.50 2761.00 0 6202.53
PROMEDIO 5.50 276.10
𝛽1 = 166.4667
𝛽2 = 19.9333
Donde:
Numero de observaciones
n 10
Promedios (Medias):
∑ 𝑋𝑖 ∑ 𝑌𝑖
𝑋̅ = 𝑌̅ =
𝑛 𝑛
Media de x:
𝑋̅ 5.50
Media de y:
𝑌̅ 276.10
𝑥 = 𝑋 − 𝑋̅ 𝑦 = 𝑌 − 𝑌̅
Estimadores (Parámetros):
∑ 𝑥𝑦
𝛽̂1 = 𝑌̅ − 𝛽̂2 𝑋̅ 𝛽̂2 = 2
𝑥
𝑌̂ = 𝛽̂1 + 𝛽̂2 𝑋
Residuos:
𝑒 = 𝑌 − 𝑌̂ = 𝑦 − 𝛽̂2 𝑥
Estimador 𝑆 2 (𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝜎 2 ):
∑ 𝑒2
𝑆2 =
𝑛−2
Varianza estimadas de 𝛽1 𝑦 𝛽2:
1 𝑋̅ 2 𝑆2
𝑣𝑎𝑟 (𝛽̂1 ) = 𝑆 2 (𝑛 + ∑ 𝑋 2 ) 𝑣𝑎𝑟 (𝛽̂2 ) = ∑ 𝑋 2
𝑖 𝑖
𝑆𝐶𝑇 = ∑ 𝑌 2 = ∑(𝑌 − 𝑌̅ )2
𝑆𝐶𝐸 = 𝛽̂2 ∑ 𝑋 2
Suma de cuadrados de los Residuos (SCR):
Hipótesis Hipótesis
𝐻0 : 𝛽1 = 0 𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0 𝐻1 : 𝛽1 ≠ 0
Valor absoluto
del estadístico t Estadístico t
Decisión Decisión
𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑆 2
2
∑ 𝑒2
𝑆 = = 775.3167
𝑛−2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎
1 𝑋̅ 2 𝑆2
𝑣𝑎𝑟 (𝛽̂1 ) = 𝑆 2 ( + ∑ ) 𝑣𝑎𝑟 (𝛽̂2 ) = ∑
𝑛 𝑋𝑖2 𝑋𝑖2
𝑆𝐶𝑇 = ∑ 𝑌 2 = ∑(𝑌 − 𝑌̅ )2
𝑆𝐶𝐸 = 𝛽̂2 ∑ 𝑋 2
𝑆𝐶𝐸 = 32780.3667
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 (𝑆𝐶𝑅)
𝑆𝐶𝑅 = 6202.5333
𝑆𝐶𝑅 = ∑ 𝑒 2
𝜮𝑿𝒊 𝒀𝒊 = 𝟏𝟗𝟕𝟑. 𝟔𝟕 𝒏 = 𝟐𝟎
̅ = 𝟗. 𝟓𝟔
𝑿 ̅ = 𝟖. 𝟕𝟔𝟓
𝒀
SOLUCION:
𝑌 = 𝐷𝑒𝑚𝑎𝑛𝑑𝑎 𝑑𝑒 𝑎𝑙𝑖𝑚𝑒𝑛𝑡𝑜
𝑋 = 𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑑𝑖𝑠𝑝𝑜𝑛𝑖𝑏𝑙𝑒
𝑌𝑖 = 𝛽1 +𝛽2 𝑋𝑖 + 𝜇𝑖
a)
∑ 𝑋𝑖
𝑋̅ = = 9.56 → ∑ 𝑋𝑖 = 191.20
𝑛
∑ 𝑌𝑖
𝑌̅ = = 8.765 → ∑ 𝑌𝑖 = 175.3
𝑛
𝑥𝑖 = 𝑋𝑖 − 𝑋̅
𝑦𝑖 = 𝑌𝑖 − 𝑌̅
∑ 𝑋𝑖 𝑌𝑖 + 𝑌̅ ∑ 𝑋𝑖 + 𝑋̅ ∑ 𝑌𝑖 + ∑ 𝑋̅𝑌̅
1973.67 = ∑ 𝑋𝑖 𝑌𝑖 + ∑ 𝑋̅𝑌̅
𝑛 𝑥𝑋̅𝑥 𝑌̅ = 1675.868
=> ∑ 𝑋𝑖 𝑌𝑖 = 297.802
∑ 𝑌𝑖 𝑋𝑖 297.802
𝛽̂2 = = = 0.883
𝑋𝑖2 337.308
𝛽̂1 = 𝑌̅ + 𝛽̂2 𝑋̅ = 8.765 − (0.883)(9.56) = 0.324 ,
𝐼𝑛𝑡𝑒𝑟𝑝𝑟𝑒𝑡𝑎𝑐𝑖𝑜𝑛:
𝛽1 (𝐼𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡𝑜)
𝛽2 (𝑃𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒)
𝑆𝐶𝑅 14.0302
b) 𝑅 2 = 1 − 𝑆𝐶𝑇 = 1 − 277.0255 = 0.9494
= ∑ 𝑌𝑖2 − 2𝑌̅ ∑ 𝑌𝑖 + ∑ 𝑌̅ 2
= 1813.53 − 2(8.765)(175.3) + 20(8.765)2
= 277.0255
=> 𝑆𝐶𝑅 = 277.0255 − (0.883)2 (337.308) = 14.0302
=> 𝑆𝐶𝑇 = ∑ 𝑌𝑖2
Estimar la varianza de 𝜇
𝑉𝑎𝑟(𝜇) = 𝜎 2 = 𝑆 2 (𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙)
, 1 − 𝛼 = 0.95 ; 𝛼 = 0.05
−0.7269 ≤ 𝛽1 ≤ 1.3749
(𝑛 − 2)𝑆 2 2
(𝑛 − 2)𝑆 2
≤ 𝜎 ≤
𝑋 2 𝛼(𝑛−2) 𝑋 2 𝛼(𝑛−2)
1− 2 2
Contraste de la hipótesis: 𝛽2
Hipótesis
𝐻0 : 𝛽2 = 0
𝐻1 : 𝛽2 ≠ 0
Estadístico t:
𝛽̂2 | 0.883 | 0.883
|𝑡| = || || = = || || = |18.3681| = 18.3681
√𝑣𝑎𝑟 (𝛽̂2 ) | 𝑆 | 2
√ 0.7795
√ 337.308
∑ 𝑋𝑖2
Decisión:
Como
|𝑡| = 18.3681 > 2.101 = 𝑡 𝛼(𝑛−2)
1−
2
=> 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑐𝑜𝑛 95% 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎
X 3 5 6 4 2 7 8 9 10
Y 2 4 6 3 4 8 10 14 12
SOLUCION:
a) Estimador 𝑆 2
∑ 𝑒2
𝑆2 = = 2.9619
𝑛−2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎
𝑆𝐶𝑇 = ∑ 𝑌 2 = ∑(𝑌 − 𝑌̅ )2
𝑆𝐶𝑇 = 144.0000
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑝𝑜𝑟 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 (𝑆𝐶𝐸)
𝑆𝐶𝐸 = 𝛽̂2 ∑ 𝑋 2
𝑆𝐶𝐸 = 123.2667
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 (𝑆𝐶𝑅)
𝑆𝐶𝑅 = 20.7333
𝑅 − 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜
𝑅 2 = 0.8560
𝑡1−𝛼 = 2.3646
2
𝑋 𝛼(𝑛−2) = 16.0128
1−
2
𝑋𝛼(𝑛−2) = 1.6899
2
Intervalos de confianza 𝛽1
𝐿𝐼 = −5.0318
𝐿𝑆 = 1.8318
Intervalos de confianza 𝛽2
𝐿𝐼 = 0.980
𝐿𝑆 = 1.9587
Intervalos de confianza 𝜎 2
𝐿𝐼 = 1.2948
𝐿𝑆 = 12.2692
c) Prueba de Hipótesis
Hipótesis Hipótesis
𝐻0 : 𝛽1 = 0 𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0 𝐻1 : 𝛽1 ≠ 0
Valor absoluto
del estadístico t Estadístico t
|𝑡| = 1.1025 |𝑡| = 6.4512
Decisión Decisión