Ejercicio 13

Descargar como xlsx, pdf o txt
Descargar como xlsx, pdf o txt
Está en la página 1de 34

Matrícula Alumno

Ejercicio 13
Descripción:
Objetivo del ejercicio:
Realizar pruebas de hipótesis en los coeficientes de regresión.

Descripción del ejercicio:


Por medio de este ejercicio el alumno comprenderá el proceso de las pruebas de hipótesis en la reg
múltiple.

Requerimientos para el ejercicio:

Excel o cualquier paquete estadístico como Minitab. Consulta los recursos de apoyo del tema 13-15

Instrucciones para el alumno:

Realizar los siguientes ejercicios empleando un software estadístico o Excel. En tus resultados deb
evidencia de los análisis estadísticos realizados. Los problemas se pueden realizar en pareja o de m
individual.

1. La energía eléctrica consumida (Y) cada mes por una planta química se considera relacionada co
temperatura ambiente promedio, grados Fahrenheit (X1), número de días al mes (X2), la pureza pro
producto, en porciento (X3) y las toneladas obtenidas del producto (X4). Se dispone de los datos his
anterior.

Temperatura en Porcentaje de
Días
grados Fahrenheit, Pureza

Y X1 X2 X3

240 25 24 91
236 31 21 90
290 45 24 88
274 60 25 87
301 65 25 91
316 72 26 94
300 80 25 87
296 84 25 86
267 75 24 88
276 60 25 91
288 50 25 90
261 38 23 89

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.


b. Interpreta los coeficientes de regresión en el contexto del problema.
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las e
de una prueba de hipótesis.

d. Prueba la significancia de los coeficientes de regresión individuales. Realiza toda


una prueba de hipótesis para cada uno de los coeficientes.
e. Calcula e interpreta R2 en el contexto del problema.
f. Calcula el error estándar de estimación.

g. Pronostica la energía eléctrica consumida (Y) cuando la temperatura ambiente pr


de 30, el número de días al mes (X2) es de 25 grados Fahrenheit, la pureza promed
en porciento (X3), es de 92 y las toneladas obtenidas del producto (X4) es de 95.

h. Calcula R2ajustada.
i. Construye un intervalo de confianza para las pendientes de la población β1, β2, β

2. Un negocio de ventas por catálogo de computadoras personales, software y hardware mantiene u


centralizado para la distribución de los productos ordenados. La administración examina el proceso
está interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una peq
manejo, independiente del monto de la orden. Se recolectaron datos de los últimos 24 meses que in
de distribución (Y), las ventas (X1) y el número de órdenes recibidas (X2).

Costo de Ventas
Distribución (miles de
Órdenes
(miles de dólares) dólares)
Y
52.95 386 4015
71.66 446 3806
85.58 512 5309
63.69 401 4262
72.81 457 4296
68.44 458 4097
52.46 301 3213
70.77 484 4809
82.03 517 5237
74.39 503 4732
70.84 535 4413
54.08 353 2921
62.98 372 3977
72.3 328 4428
58.99 408 3964
79.38 491 4582
94.44 527 5582
59.74 444 3450
90.5 623 5079
93.24 596 5735
69.33 463 4269
53.71 389 3708
89.18 547 5387
66.8 415 4161

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.


b. Interpreta los coeficientes de regresión en el contexto del problema.
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las e
d. Prueba la significancia de los coeficientes de regresión individuales. Realiza toda
e. Calcula e interpreta R2 en el contexto del problema.
f. Calcula el error estándar de estimación.
g. Pronostica los costos de distribución mensuales promedio para el almacén cuand
h. Calcula R2ajustada.
i. Construye un intervalo de confianza para las pendientes de la población ( β 1 y β2)

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
Entregable(s): Resultados de ejercicio y proceso.

Criterios de evaluación de la actividad:


1. Obtención de los coeficientes de regresión.
2. Realización de las pruebas de hipótesis.
3. Conclusión en el contexto del problema.
pruebas de hipótesis en la regresión lineal

ursos de apoyo del tema 13-15.

o Excel. En tus resultados debes presentar


ueden realizar en pareja o de manera

ca se considera relacionada con la


días al mes (X2), la pureza promedio del
4). Se dispone de los datos históricos del año

Toneladas
de producto

X4

100
95
110
88
94
99
97
96
110
105
100
98

de regresión lineal múltiple.


xto del problema.
ón múltiple; realiza todas las etapas

esión individuales. Realiza todas las etapas de


ntes.
.

do la temperatura ambiente promedio (X1) es


Fahrenheit, la pureza promedio del producto,
del producto (X4) es de 95.

entes de la población β1, β2, β3 y β4.

oftware y hardware mantiene un almacén


nistración examina el proceso de distribución y
a actualidad, se cobra una pequeña cuota por
de los últimos 24 meses que indican los costos
(X2).
de regresión lineal múltiple.
xto del problema.
ón múltiple; realiza todas las etapas de una prueba de hipótesis.
sión individuales. Realiza todas las etapas de una prueba de hipótesis para cada uno de los coeficientes.

omedio para el almacén cuando las ventas son de 400,000 dólares y el número de órdenes es de 4500.

entes de la población ( β 1 y β2).

entado (proceso) y
1. La energía eléctrica consumida (Y) cada mes por una planta química se considera relacionada con la
temperatura ambiente promedio, grados Fahrenheit (X1), número de días al mes (X2), la pureza promedio del
producto, en porciento (X3) y las toneladas obtenidas del producto (X4). Se dispone de los datos históricos del
año anterior.

Temperatura en Porcentaje de Toneladas


Días
grados Fahrenheit pureza de producto
Y X1 X2 X3 X4

240 25 24 91 100
236 31 21 90 95
290 45 24 88 110
274 60 25 87 88
301 65 25 91 94
316 72 26 94 99
300 80 25 87 97
296 84 25 86 96
267 75 24 88 110
276 60 25 91 105
288 50 25 90 100
261 38 23 89 98

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

SUMMARY OUTPUT

Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

ANOVA
Grados de libertad
Suma de cuadrados Cuadrados medios F Significance F
Regression
Residual
Total

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept
X Variable 1
X Variable 2
X Variable 3
X Variable 4

La ecuación de regresión lineal múltiple es:

b. Interpreta los coeficientes de regresión en el contexto del problema.

c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas
de una prueba de hipótesis.

1) Establecimiento de hipotésis
𝐻_0: 𝛽_1=𝛽_2=𝛽_3=𝛽_4=0 (Temperatura en grados Fareheit X1 , días X2, porcentaje de pureza X3 y to
En oposición a:
Ha : βi ≠ 0 (Al menos una variable independiente X, ya sea la temperatura en grados Farenheit X1 , días X2, porcen
afectan la energía eléctrica Y).

2) Estadística de prueba

𝐹_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝐶𝑀 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛)/(𝐶𝑀 𝐸𝑟𝑟𝑜𝑟)

Revisamos el inciso anterior y buscamos (cuadrados medios=CM):


CM Regresión=
Fcalculada=
CM Error=

3) Regla de decisión
Rechazar H0 si Fcalculada es mayor que Fteórica: 𝐹_7^4 (0.05)=4.12

El valor de Fteórica puede obtenerse en la tabla siguiente:


4) Conclusión

Puesto que Fcalculada = que F teórica = 𝐹_7^4 (0.05)=4.12

d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las etapas de
una prueba de hipótesis para cada uno de los coeficientes.

Prueba para determinar si la variable X1 tiene efecto significativo en la energía eléctrica.


1) Establecimiento de hipotésis
𝐻_0: 𝛽_1=0 (Temperatura en grados Farenheit X1 no afectan la energía eléctrica Y).
En oposición a:
Ha : β1 ≠ 0 (La temperatura en grados Farenheit X1 no afectan la energía eléctrica Y).

2) Estadística de prueba
𝑆_(𝑏_1 )=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=

3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que t teórica:

En donde tteórica se obtiene de la tabla:


𝑡_𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡_(∝∕2) (𝑛−𝑘−1)=𝑡_(0.05∕2) (7)=𝑡_0.025 (7)=2.3646

4) Conclusión
Puesto que |tcalculada |= que t teórica = 2.3646
Prueba para determinar si la variable X2 tiene efecto significativo en la energía eléctrica.
1) Establecimiento de hipotésis
𝐻_0: 𝛽_2=0 (Temperatura en grados Farenheit X2 no afectan la energía eléctrica Y).
En oposición a:
Ha : β2 ≠ 0 (Días X2 no afectan la energía eléctrica Y).

2) Estadística de prueba
𝑆_2=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=

3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que t teórica:

En donde tteórica se obtiene de la tabla:


𝑡_𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡_(∝∕2) (𝑛−𝑘−1)=𝑡_(0.05∕2) (7)=𝑡_0.025 (7)=2.3646

4) Conclusión
Puesto que |tcalculada |= que t teórica = 2.3646

Prueba para determinar si la variable X3 tiene efecto significativo en la energía eléctrica.


1) Establecimiento de hipotésis
𝐻_0: 𝛽_3=0 (Porcentaje de pureza X3 no afectan la energía eléctrica Y).
En oposición a:
Ha : β3 ≠ 0 (Porcentaje de pureza X3 no afectan la energía eléctrica Y).

2) Estadística de prueba
𝑆_3=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=
3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que tteórica:

En donde tteórica se obtiene de la tabla:


𝑡_𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡_(∝∕2) (𝑛−𝑘−1)=𝑡_(0.05∕2) (7)=𝑡_0.025 (7)=2.3646

4) Conclusión
Puesto que |tcalculada |= que t teórica = 2.3646

Prueba para determinar si la variable X4 tiene efecto significativo en la energía eléctrica.


1) Establecimiento de hipotésis
𝐻_0: 𝛽_4=0 (Toneladas de producto X4 no afectan la energía eléctrica Y).
En oposición a:
Ha : β4 ≠ 0 (Toneladas de producto X4 no afectan la energía eléctrica Y).

2) Estadística de prueba
𝑆_4=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=

3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que t teórica:

En donde tteórica se obtiene de la tabla:


𝑡_𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡_(∝∕2) (𝑛−𝑘−1)=𝑡_(0.05∕2) (7)=𝑡_0.025 (7)=2.3646
4) Conclusión
Puesto que |tcalculada |= que t teórica = 2.3646

e. Calcula e interpreta R2 en el contexto del problema.

En este caso, el 74.475% de la variación en la energía eléctrica se explica por X1(temperatura en grados farenheit), X2 (días), X
interpretarse en relación con los extremos, 0 y 1.

f. Calcula el error estándar de estimación.

𝑆_𝜀=√(𝑆𝐶𝐸/(𝑛−𝑘−1))=√𝐶𝑀𝐸

SCE=

g. Pronostica la energía eléctrica consumida (Y) cuando la temperatura ambiente promedio (X1) es de
30, el número de días al mes (X2) es de 25 grados Fahrenheit, la pureza promedio del producto, en
porciento (X3), es de 92 y las toneladas obtenidas del producto (X4) es de 95.

𝑌 ̂=

h. Calcula R2ajustada.

𝑅_𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜^2=1−(1−𝑅^2 )((𝑛−1)/(𝑛−𝑘−1))=
i. Construye un intervalo de confianza para las pendientes de la población β1, β2, β3 y β4.

𝑏_1±𝑡_(∝∕2) (𝑛−𝑘−1)𝑆_(𝑏_𝑖 ) b1=

Si se establece un intervalo de confianza al 95% para la energía eléctrica y se tiene el valor crítico:
𝑡_(0.05∕2) (7)=𝑡_0.025 (7)=2.3646

Mientras 𝑆_(𝑏_1 )= , el cual se obtiene del excel en el inciso a):

Entonces, con un 95% de confianza, se tiene que el verdadero valor β 1 se encuentra en el intervalo:

𝑏_2±𝑡_(∝∕2) (𝑛−𝑘−1)𝑆_(𝑏_𝑖 ) b2=

Si se establece un intervalo de confianza al 95% para la energía eléctrica y se tiene el valor crítico:
𝑡_(0.05∕2) (7)=𝑡_0.025 (7)=2.3646

Mientras 𝑆_(𝑏_2 )= , el cual se obtiene del excel en el inciso a):

Entonces, con un 95% de confianza, se tiene que el verdadero valor β 2 se encuentra en el intervalo:

𝑏_3±𝑡_(∝∕2) (𝑛−𝑘−1)𝑆_(𝑏_𝑖 ) b3=

Si se establece un intervalo de confianza al 95% para la energía eléctrica y se tiene el valor crítico:
𝑡_(0.05∕2) (5)=𝑡_0.025 (5)=2.5706

Mientras 𝑆_(𝑏_3 )= , el cual se obtiene del excel en el inciso a):

Entonces, con un 95% de confianza, se tiene que el verdadero valor β 3 se encuentra en el intervalo:

𝑏_4±𝑡_(∝∕2) (𝑛−𝑘−1)𝑆_(𝑏_𝑖 ) b4=

Si se establece un intervalo de confianza al 95% para la energía eléctrica y se tiene el valor crítico:
𝑡_(0.05∕2) (5)=𝑡_0.025 (5)=2.5706
Mientras 𝑆_(𝑏_4 )= , el cual se obtiene del excel en el inciso a):

Entonces, con un 95% de confianza, se tiene que el verdadero valor β4 se encuentra en el intervalo:
nada con la
eza promedio del
atos históricos del

Lower 95.0%
Upper 95.0%
aje de pureza X3 y toneladas de producto X4 no afectan el consumo diario de petróleo Y).

X1 , días X2, porcentaje de pureza X3 y toneladas de producto X4 ,


odas las etapas de

nergía eléctrica Y).


nergía eléctrica Y).
s farenheit), X2 (días), X3(porcentaje de pureza ) y x4(toneladas de producto). En la práctica, 0 ≤ R2 ≤ 1, y el valor de R2 debe

promedio (X1) es de
del producto, en
rvalo:

ervalo:

ervalo:
ervalo:
de R2 debe
2. Un negocio de ventas por catálogo de computadoras personales, software y hardware mantiene un almacén ce
examina el proceso de distribución y está interesada en examinar los factores que afectan los costos. En la actua
orden. Se recolectaron datos de los últimos 24 meses que indican los costos de distribución (Y), las ventas (X1) y

Costo de Ventas
Distribución (miles de Órdenes
(miles de dólares) dólares)
Y X1 X2
52.95 386 4015
71.66 446 3806
85.58 512 5309
63.69 401 4262
72.81 457 4296
68.44 458 4097
52.46 301 3213
70.77 484 4809
82.03 517 5237
74.39 503 4732
70.84 535 4413
54.08 353 2921
62.98 372 3977
72.3 328 4428
58.99 408 3964
79.38 491 4582
94.44 527 5582
59.74 444 3450
90.5 623 5079
93.24 596 5735
69.33 463 4269
53.71 389 3708
89.18 547 5387
66.8 415 4161

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

SUMMARY OUTPUT

Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations
ANOVA

Grados de Suma de Cuadrado


libertad cuadrados s medios F Significance F
Regression
Residual
Total

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept
X Variable 1
X Variable 2

La ecuación de regresión lineal múltiple es:

b. Interpreta los coeficientes de regresión en el contexto del problema.

c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de una p

1) Establecimiento de hipotésis
𝐻_0: 𝛽_1=𝛽_2=0 (Ventas X1 , ordenes X2, no afectan el costo de distribución Y).
En oposición a:

Ha : βi ≠ 0 (Al menos una variable independiente X, ya sea las ventas X1 , ordenes X2, afectan la energía eléctrica

2) Estadística de prueba

𝐹_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝐶𝑀 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛)/(𝐶𝑀 𝐸𝑟𝑟𝑜𝑟)

Revisamos el inciso anterior y buscamos (cuadrados medios=CM):


CM Regresión=
Fcalculada=
CM Error= Cuadrados medios

3) Regla de decisión
Rechazar H0 si Fcalculada es mayor que Fteórica: 𝐹_21^2 (0.05)=3.47
El valor de Fteórica puede obtenerse en la tabla siguiente:

4) Conclusión

Puesto que Fcalculada = que F teórica = 𝐹_7^4 (0.05)=3.47

d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las etapas de

Prueba para determinar si la variable X1 tiene efecto significativo en el costo de distribución.


1) Establecimiento de hipotésis
𝐻_0: 𝛽_1=0 (Ventas X1 no afectan el costo de distribución Y).
En oposición a:
Ha : β1 ≠ 0 (Ventas X1 no afectan el costo de distribución Y).

2) Estadística de prueba
𝑆_(𝑏_1 )=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=

3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que t teórica:

En donde tteórica se obtiene de la tabla:


𝑡_𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡_(∝∕2) (𝑛−𝑘−1)=𝑡_(0.05∕2) (21)=𝑡_0.025 (21)= 2.0796
4) Conclusión
Puesto que |tcalculada |= que t teórica = 2.0796

Prueba para determinar si la variable X2 tiene efecto significativo en la energía eléctrica.


1) Establecimiento de hipotésis
𝐻_0: 𝛽_2=0 (Ordenes X2 no afectan el consumo de energía Y).
En oposición a:
Ha : β2 ≠ 0 (Ordenes X2 no afectan el consumo de energía Y).

2) Estadística de prueba
𝑆_𝑏2=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=

3) Regla de decisión
Rechazar H0 si |tcalculada|= es mayor que tteórica:

En donde tteórica se obtiene de la tabla:


𝑡_𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡_(∝∕2) (𝑛−𝑘−1)=𝑡_(0.05∕2) (21)=𝑡_0.025 (21)= 2.0796

4) Conclusión
Puesto que |tcalculada |= que t teórica = 2.0796

e. Calcula e interpreta R2 en el contexto del problema.

En este caso, el 87.59% del costo de distribución se explica por X1(ventas) y X2 (ordenes). En la práctica, 0 ≤ R2 ≤ 1, y el valor d
extremos, 0 y 1.
f. Calcula el error estándar de estimación.

𝑆_𝜀=√(𝑆𝐶𝐸/(𝑛−𝑘−1))=√𝐶𝑀𝐸

SCE=

g. Pronostica los costos de distribución mensuales promedio para el almacén cuando las ventas s

h. Calcula R2ajustada.

𝑅_𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜^2=1−(1−𝑅^2 )((𝑛−1)/(𝑛−𝑘−1))=

i. Construye un intervalo de confianza para las pendientes de la población ( β 1 y β2).

𝑏_1±𝑡_(∝∕2) (𝑛−𝑘−1)𝑆_(𝑏_𝑖 ) b1=

Si se establece un intervalo de confianza al 95% para el costo de distribución y se tiene el valor crítico:
𝑡_(0.05∕2) (21)=𝑡_0.025 (21)= 2.0796

Mientras 𝑆_(𝑏_1 )= , el cual se obtiene del excel en el inciso a):

Entonces, con un 95% de confianza, se tiene que el verdadero valor β 1 se encuentra en el intervalo:

𝑏_2±𝑡_(∝∕2) (𝑛−𝑘−1)𝑆_(𝑏_𝑖 ) b2=

Si se establece un intervalo de confianza al 95% para el costo de distribución y se tiene el valor crítico:
𝑡_(0.05∕2) (21)=𝑡_0.025 (21)= 2.0796

Mientras 𝑆_(𝑏_2 )= , el cual se obtiene del excel en el inciso a):

Entonces, con un 95% de confianza, se tiene que el verdadero valor β 2 se encuentra en el intervalo:
ware mantiene un almacén centralizado para la distribución de los productos ordenados. La administración
afectan los costos. En la actualidad, se cobra una pequeña cuota por manejo, independiente del monto de la
tribución (Y), las ventas (X1) y el número de órdenes recibidas (X2).

e regresión lineal múltiple.


Lower 95.0%Upper 95.0%

aliza todas las etapas de una prueba de hipótesis.

o de distribución Y).

2, afectan la energía eléctrica Y).


s. Realiza todas las etapas de una prueba de hipótesis para cada uno de los coeficientes.
la práctica, 0 ≤ R2 ≤ 1, y el valor de R2 debe interpretarse en relación con los
almacén cuando las ventas son de 400,000 dólares y el número de órdenes es de 4500.

ación ( β 1 y β2).

en el intervalo:

en el intervalo:

También podría gustarte