Ejercicio 13
Ejercicio 13
Ejercicio 13
Ejercicio 13
Descripción:
Objetivo del ejercicio:
Realizar pruebas de hipótesis en los coeficientes de regresión.
Excel o cualquier paquete estadístico como Minitab. Consulta los recursos de apoyo del tema 13-15
Realizar los siguientes ejercicios empleando un software estadístico o Excel. En tus resultados deb
evidencia de los análisis estadísticos realizados. Los problemas se pueden realizar en pareja o de m
individual.
1. La energía eléctrica consumida (Y) cada mes por una planta química se considera relacionada co
temperatura ambiente promedio, grados Fahrenheit (X1), número de días al mes (X2), la pureza pro
producto, en porciento (X3) y las toneladas obtenidas del producto (X4). Se dispone de los datos his
anterior.
Temperatura en Porcentaje de
Días
grados Fahrenheit, Pureza
Y X1 X2 X3
240 25 24 91
236 31 21 90
290 45 24 88
274 60 25 87
301 65 25 91
316 72 26 94
300 80 25 87
296 84 25 86
267 75 24 88
276 60 25 91
288 50 25 90
261 38 23 89
h. Calcula R2ajustada.
i. Construye un intervalo de confianza para las pendientes de la población β1, β2, β
Costo de Ventas
Distribución (miles de
Órdenes
(miles de dólares) dólares)
Y
52.95 386 4015
71.66 446 3806
85.58 512 5309
63.69 401 4262
72.81 457 4296
68.44 458 4097
52.46 301 3213
70.77 484 4809
82.03 517 5237
74.39 503 4732
70.84 535 4413
54.08 353 2921
62.98 372 3977
72.3 328 4428
58.99 408 3964
79.38 491 4582
94.44 527 5582
59.74 444 3450
90.5 623 5079
93.24 596 5735
69.33 463 4269
53.71 389 3708
89.18 547 5387
66.8 415 4161
Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
Entregable(s): Resultados de ejercicio y proceso.
Toneladas
de producto
X4
100
95
110
88
94
99
97
96
110
105
100
98
omedio para el almacén cuando las ventas son de 400,000 dólares y el número de órdenes es de 4500.
entado (proceso) y
1. La energía eléctrica consumida (Y) cada mes por una planta química se considera relacionada con la
temperatura ambiente promedio, grados Fahrenheit (X1), número de días al mes (X2), la pureza promedio del
producto, en porciento (X3) y las toneladas obtenidas del producto (X4). Se dispone de los datos históricos del
año anterior.
240 25 24 91 100
236 31 21 90 95
290 45 24 88 110
274 60 25 87 88
301 65 25 91 94
316 72 26 94 99
300 80 25 87 97
296 84 25 86 96
267 75 24 88 110
276 60 25 91 105
288 50 25 90 100
261 38 23 89 98
SUMMARY OUTPUT
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations
ANOVA
Grados de libertad
Suma de cuadrados Cuadrados medios F Significance F
Regression
Residual
Total
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas
de una prueba de hipótesis.
1) Establecimiento de hipotésis
𝐻_0: 𝛽_1=𝛽_2=𝛽_3=𝛽_4=0 (Temperatura en grados Fareheit X1 , días X2, porcentaje de pureza X3 y to
En oposición a:
Ha : βi ≠ 0 (Al menos una variable independiente X, ya sea la temperatura en grados Farenheit X1 , días X2, porcen
afectan la energía eléctrica Y).
2) Estadística de prueba
3) Regla de decisión
Rechazar H0 si Fcalculada es mayor que Fteórica: 𝐹_7^4 (0.05)=4.12
d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las etapas de
una prueba de hipótesis para cada uno de los coeficientes.
2) Estadística de prueba
𝑆_(𝑏_1 )=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=
3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que t teórica:
4) Conclusión
Puesto que |tcalculada |= que t teórica = 2.3646
Prueba para determinar si la variable X2 tiene efecto significativo en la energía eléctrica.
1) Establecimiento de hipotésis
𝐻_0: 𝛽_2=0 (Temperatura en grados Farenheit X2 no afectan la energía eléctrica Y).
En oposición a:
Ha : β2 ≠ 0 (Días X2 no afectan la energía eléctrica Y).
2) Estadística de prueba
𝑆_2=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=
3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que t teórica:
4) Conclusión
Puesto que |tcalculada |= que t teórica = 2.3646
2) Estadística de prueba
𝑆_3=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=
3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que tteórica:
4) Conclusión
Puesto que |tcalculada |= que t teórica = 2.3646
2) Estadística de prueba
𝑆_4=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=
3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que t teórica:
En este caso, el 74.475% de la variación en la energía eléctrica se explica por X1(temperatura en grados farenheit), X2 (días), X
interpretarse en relación con los extremos, 0 y 1.
𝑆_𝜀=√(𝑆𝐶𝐸/(𝑛−𝑘−1))=√𝐶𝑀𝐸
SCE=
g. Pronostica la energía eléctrica consumida (Y) cuando la temperatura ambiente promedio (X1) es de
30, el número de días al mes (X2) es de 25 grados Fahrenheit, la pureza promedio del producto, en
porciento (X3), es de 92 y las toneladas obtenidas del producto (X4) es de 95.
𝑌 ̂=
h. Calcula R2ajustada.
𝑅_𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜^2=1−(1−𝑅^2 )((𝑛−1)/(𝑛−𝑘−1))=
i. Construye un intervalo de confianza para las pendientes de la población β1, β2, β3 y β4.
Si se establece un intervalo de confianza al 95% para la energía eléctrica y se tiene el valor crítico:
𝑡_(0.05∕2) (7)=𝑡_0.025 (7)=2.3646
Entonces, con un 95% de confianza, se tiene que el verdadero valor β 1 se encuentra en el intervalo:
Si se establece un intervalo de confianza al 95% para la energía eléctrica y se tiene el valor crítico:
𝑡_(0.05∕2) (7)=𝑡_0.025 (7)=2.3646
Entonces, con un 95% de confianza, se tiene que el verdadero valor β 2 se encuentra en el intervalo:
Si se establece un intervalo de confianza al 95% para la energía eléctrica y se tiene el valor crítico:
𝑡_(0.05∕2) (5)=𝑡_0.025 (5)=2.5706
Entonces, con un 95% de confianza, se tiene que el verdadero valor β 3 se encuentra en el intervalo:
Si se establece un intervalo de confianza al 95% para la energía eléctrica y se tiene el valor crítico:
𝑡_(0.05∕2) (5)=𝑡_0.025 (5)=2.5706
Mientras 𝑆_(𝑏_4 )= , el cual se obtiene del excel en el inciso a):
Entonces, con un 95% de confianza, se tiene que el verdadero valor β4 se encuentra en el intervalo:
nada con la
eza promedio del
atos históricos del
Lower 95.0%
Upper 95.0%
aje de pureza X3 y toneladas de producto X4 no afectan el consumo diario de petróleo Y).
promedio (X1) es de
del producto, en
rvalo:
ervalo:
ervalo:
ervalo:
de R2 debe
2. Un negocio de ventas por catálogo de computadoras personales, software y hardware mantiene un almacén ce
examina el proceso de distribución y está interesada en examinar los factores que afectan los costos. En la actua
orden. Se recolectaron datos de los últimos 24 meses que indican los costos de distribución (Y), las ventas (X1) y
Costo de Ventas
Distribución (miles de Órdenes
(miles de dólares) dólares)
Y X1 X2
52.95 386 4015
71.66 446 3806
85.58 512 5309
63.69 401 4262
72.81 457 4296
68.44 458 4097
52.46 301 3213
70.77 484 4809
82.03 517 5237
74.39 503 4732
70.84 535 4413
54.08 353 2921
62.98 372 3977
72.3 328 4428
58.99 408 3964
79.38 491 4582
94.44 527 5582
59.74 444 3450
90.5 623 5079
93.24 596 5735
69.33 463 4269
53.71 389 3708
89.18 547 5387
66.8 415 4161
SUMMARY OUTPUT
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations
ANOVA
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de una p
1) Establecimiento de hipotésis
𝐻_0: 𝛽_1=𝛽_2=0 (Ventas X1 , ordenes X2, no afectan el costo de distribución Y).
En oposición a:
Ha : βi ≠ 0 (Al menos una variable independiente X, ya sea las ventas X1 , ordenes X2, afectan la energía eléctrica
2) Estadística de prueba
3) Regla de decisión
Rechazar H0 si Fcalculada es mayor que Fteórica: 𝐹_21^2 (0.05)=3.47
El valor de Fteórica puede obtenerse en la tabla siguiente:
4) Conclusión
d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las etapas de
2) Estadística de prueba
𝑆_(𝑏_1 )=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=
3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que t teórica:
2) Estadística de prueba
𝑆_𝑏2=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=
3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que tteórica:
4) Conclusión
Puesto que |tcalculada |= que t teórica = 2.0796
En este caso, el 87.59% del costo de distribución se explica por X1(ventas) y X2 (ordenes). En la práctica, 0 ≤ R2 ≤ 1, y el valor d
extremos, 0 y 1.
f. Calcula el error estándar de estimación.
𝑆_𝜀=√(𝑆𝐶𝐸/(𝑛−𝑘−1))=√𝐶𝑀𝐸
SCE=
g. Pronostica los costos de distribución mensuales promedio para el almacén cuando las ventas s
h. Calcula R2ajustada.
𝑅_𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜^2=1−(1−𝑅^2 )((𝑛−1)/(𝑛−𝑘−1))=
Si se establece un intervalo de confianza al 95% para el costo de distribución y se tiene el valor crítico:
𝑡_(0.05∕2) (21)=𝑡_0.025 (21)= 2.0796
Entonces, con un 95% de confianza, se tiene que el verdadero valor β 1 se encuentra en el intervalo:
Si se establece un intervalo de confianza al 95% para el costo de distribución y se tiene el valor crítico:
𝑡_(0.05∕2) (21)=𝑡_0.025 (21)= 2.0796
Entonces, con un 95% de confianza, se tiene que el verdadero valor β 2 se encuentra en el intervalo:
ware mantiene un almacén centralizado para la distribución de los productos ordenados. La administración
afectan los costos. En la actualidad, se cobra una pequeña cuota por manejo, independiente del monto de la
tribución (Y), las ventas (X1) y el número de órdenes recibidas (X2).
o de distribución Y).
ación ( β 1 y β2).
en el intervalo:
en el intervalo: