Ejercicio 13

Descargar como xlsx, pdf o txt
Descargar como xlsx, pdf o txt
Está en la página 1de 27

Matrícula Alumno

3067621
Eduardo Arámbula Acosta

Ejercicio 13
Descripción:
Objetivo del ejercicio:
Realizar pruebas de hipótesis en los coeficientes de regresión.

Descripción del ejercicio:


Por medio de este ejercicio el alumno comprenderá el proceso de las pruebas de hipótesis en la reg
múltiple.

Requerimientos para el ejercicio:

Excel o cualquier paquete estadístico como Minitab. Consulta los recursos de apoyo del tema 13-15

Instrucciones para el alumno:

Realizar los siguientes ejercicios empleando un software estadístico o Excel. En tus resultados deb
evidencia de los análisis estadísticos realizados. Los problemas se pueden realizar en pareja o de m
individual.
2. Un negocio de ventas por catálogo de computadoras personales, software y hardware mantiene
centralizado para la distribución de los productos ordenados. La administración examina el proceso
está interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una peq
manejo, independiente del monto de la orden. Se recolectaron datos de los últimos 24 meses que in
de distribución (Y), las ventas (X1) y el número de órdenes recibidas (X2).
0

Costo de Ventas
Distribución (miles de
Órdenes
(miles de dólares) dólares)
Y
52.95 386 4015
71.66 446 3806
85.58 512 5309
63.69 401 4262
72.81 457 4296
68.44 458 4097
52.46 301 3213
70.77 484 4809
82.03 517 5237
74.39 503 4732
70.84 535 4413
54.08 353 2921
62.98 372 3977
72.3 328 4428
58.99 408 3964
79.38 491 4582
94.44 527 5582
59.74 444 3450
90.5 623 5079
93.24 596 5735
69.33 463 4269
53.71 389 3708
89.18 547 5387
66.8 415 4161

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.


b. Interpreta los coeficientes de regresión en el contexto del problema.
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las e
d. Prueba la significancia de los coeficientes de regresión individuales. Realiza toda
e. Calcula e interpreta R2 en el contexto del problema.
f. Calcula el error estándar de estimación.
g. Pronostica los costos de distribución mensuales promedio para el almacén cuand
h. Calcula R2ajustada.
i. Construye un intervalo de confianza para las pendientes de la población ( β 1 y β2)

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
Entregable(s): Resultados de ejercicio y proceso.

Criterios de evaluación de la actividad:


1. Obtención de los coeficientes de regresión.
2. Realización de las pruebas de hipótesis.
3. Conclusión en el contexto del problema.
pruebas de hipótesis en la regresión lineal

ursos de apoyo del tema 13-15.

o Excel. En tus resultados debes presentar


ueden realizar en pareja o de manera
oftware y hardware mantiene un almacén
nistración examina el proceso de distribución y
a actualidad, se cobra una pequeña cuota por
de los últimos 24 meses que indican los costos
(X2).
de regresión lineal múltiple.
xto del problema.
ón múltiple; realiza todas las etapas de una prueba de hipótesis.
sión individuales. Realiza todas las etapas de una prueba de hipótesis para cada uno de los coeficientes.

omedio para el almacén cuando las ventas son de 400,000 dólares y el número de órdenes es de 4500.

entes de la población ( β 1 y β2).

entado (proceso) y
2. Un negocio de ventas por catálogo de computadoras personales, software y hardware mantiene un almacén ce
se cobra una pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos de los últim

a. Estima e interpreta los coeficientes de la ecuación de regr

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.935914420112443
Coeficiente de determinación R^2 0.87593580177441
R^2 ajustado 0.864120163848164
Error típico 4.76616557288834
Observaciones 24

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Regresión 2 3368.08737620143
Residuos 21 477.043019631906
Total 23 3845.13039583333

Coeficientes Error típico


Intercepción -2.72824658305998 6.15787975375409
Variable X 1 0.047113872228302 0.0203279196421746
Variable X 2 0.011946926301883 0.00224856945630893

b. Interpreta los coeficientes de regresión en el contexto del problema.

c. Prueba la significancia global del modelo de regresión múltiple; realiza todas

1) Establecimiento de hipotésis
𝐻_0: 𝛽_1=𝛽_2=0
En oposición a:

Ha : βi ≠ 0 (Al menos una variable independiente X, ya sea las ventas X1 , ordenes X2, afectan la energía eléctrica

2) Estadística de prueba

𝐹_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝐶𝑀 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛)/(𝐶𝑀 𝐸𝑟𝑟𝑜𝑟)

Revisamos el inciso anterior y buscamos (cuadrados medios=CM):


CM Regresión= 3368.08737620143

CM Error= 477.043019631906 Promedio de los cuadrados

3) Regla de decisión
Rechazar H0 si Fcalculada es mayor que Fteórica:

El valor de Fteórica puede obtenerse en la tabla siguiente:


4) Conclusión

Puesto que Fcalculada = que F teórica =

Que se rechaza la hipotesis que al menos existe evidencia de que al menos una X afecta a Y porque ventas X, ordenes X

d. Prueba la significancia de los coeficientes de regresión individuales. Realiza t

Prueba para determinar si la variable X1 tiene efecto significativo en el costo de distribución.


1) Establecimiento de hipotésis
𝐻_0: 𝛽_1=0
En oposición a:
Ha : β1 ≠ 0 (Ventas X1 no afectan el costo de distribución Y).

2) Estadística de prueba
𝑆_(𝑏_1 )=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=

3) Regla de decisión
Rechazar H0 si |tcalculada|= 2.31 es mayor que t teórica: 2.0796

En donde tteórica se obtiene de la tabla:


𝑡_𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡_(∝∕2) (𝑛−𝑘−1)=𝑡_(0.05∕2) (21)=𝑡_0.025 (21)= 2.0796

4) Conclusión
Puesto que |tcalculada |= 2.31 que t teórica = 2.0796

Prueba para determinar si la variable X2 tiene efecto significativo en el costo de distribución.


1) Establecimiento de hipotésis
𝐻_0: 𝛽_2=0
En oposición a:
Ha : β2 ≠ 0 (Ordenes X2 no afectan el consumo de energía Y).

2) Estadística de prueba
𝑆_𝑏2=
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=(𝑏_𝑖−𝛽_𝑖)/𝑆_(𝑏_𝑖 )
𝑡_𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=

3) Regla de decisión
Rechazar H0 si |tcalculada|= 5.313 es mayor que t teórica: 2.0796

En donde tteórica se obtiene de la tabla:


𝑡_𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡_(∝∕2) (𝑛−𝑘−1)=𝑡_(0.05∕2) (21)=𝑡_0.025 (21)= 2.0796

4) Conclusión
Puesto que |tcalculada |= 5.313 que t teórica = 2.0796

e. Calcula e interpreta R2 en el contexto del problema.

En este caso, el 87.59% del costo de distribución se explica por X1(ventas) y X2 (ordenes). En la práctica, 0 ≤ R2 ≤ 1, y el valor d

f. Calcula el error estándar de estimación.

𝑆_𝜀=√(𝑆𝐶𝐸/(𝑛−𝑘−1))=√𝐶𝑀𝐸

SCE=
g. Pronostica los costos de distribución mensuales promedio para el almacén c

Y=b0+b1x1+b2x2

h. Calcula R2ajustada.

𝑅_𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜^2=1−(1−𝑅^2 )((𝑛−1)/(𝑛−𝑘−1))=

i. Construye un intervalo de confianza para las pendientes de la población ( β 1 y

𝑏_1±𝑡_(∝∕2) (𝑛−𝑘−1)𝑆_(𝑏_𝑖 )

Si se establece un intervalo de confianza al 95% para el costo de distribución y se tiene el valor crítico:
𝑡_(0.05∕2) (21)=𝑡_0.025 (21)= 2.0796

Mientras 𝑆_(𝑏_1 )=

Entonces, con un 95% de confianza, se tiene que el verdadero valor β 1 se encuentra en el intervalo:

𝑏_2±𝑡_(∝∕2) (𝑛−𝑘−1)𝑆_(𝑏_𝑖 )

Si se establece un intervalo de confianza al 95% para el costo de distribución y se tiene el valor crítico:
𝑡_(0.05∕2) (21)=𝑡_0.025 (21)= 2.0796

Mientras 𝑆_(𝑏_2 )=

Entonces, con un 95% de confianza, se tiene que el verdadero valor β 2 se encuentra en el intervalo:
les, software y hardware mantiene un almacén centralizado para la distribución de los productos ordenados. La administrac
to de la orden. Se recolectaron datos de los últimos 24 meses que indican los costos de distribución (Y), las ventas (X1) y el

Costo de Ventas
Distribución (miles de
(miles de dólares) dólares)
Y X1
52.95 386
71.66 446
85.58 512
63.69 401
72.81 457
68.44 458
52.46 301
70.77 484
82.03 517
74.39 503
70.84 535
54.08 353
62.98 372
72.3 328
58.99 408
79.38 491
94.44 527
59.74 444
90.5 623
93.24 596
69.33 463
53.71 389
89.18 547
66.8 415

interpreta los coeficientes de la ecuación de regresión lineal múltiple.


Promedio de los cuadrados F Valor crítico de F
1684.04368810071 74.133602200915 3.04290202276427E-10
22.716334268186

Estadístico t Probabilidad Inferior 95%


-0.443049668418215 0.662260246925043 -15.5342585731353
2.3176927623501 0.030643769312632 0.00483964910592448
5.31312309182319 2.87239200114428E-05 0.00727077012971144

e regresión en el contexto del problema.

al del modelo de regresión múltiple; realiza todas las etapas de una prueba de hipótesis.

(Ventas X1 , ordenes X2, no afectan el costo de distribución Y).

ntas X1 , ordenes X2, afectan la energía eléctrica Y).

Fcalculada= 7.06034306675381
los cuadrados

ue Fteórica: 𝐹_21^2 (0.05)=3.47

rse en la tabla siguiente:


𝐹_7^4 (0.05)=3.47

menos una X afecta a Y porque ventas X, ordenes X^2 no afectan el costo por las ordenes de distribución.

s coeficientes de regresión individuales. Realiza todas las etapas de una prueba de hipótesis para cada uno de los coeficien

el costo de distribución.

(Ventas X1 no afectan el costo de distribución Y).

2.3176927623501

0.0471138722283024 2.3176927623501
0.0203279196421746

es mayor que t teórica: 2.0796

el costo de distribución.
(Ordenes X2 no afectan el consumo de energía Y).

5.31312309182319

0.0119469263018833 5.31312309182319
0.00224856945630893

13 es mayor que t teórica: 2.0796

contexto del problema.

as) y X2 (ordenes). En la práctica, 0 ≤ R2 ≤ 1, y el valor de R2 debe interpretarse en relación con los extremos, 0 y 1.

estimación.

-2.089945

477.043019631906
tribución mensuales promedio para el almacén cuando las ventas son de 400,000 dólares y el número de órdenes es de 450

=1−(1−𝑅^2 )((𝑛−1)/(𝑛−𝑘−1))=

40.0688517673178

onfianza para las pendientes de la población ( β 1 y β2).

ución y se tiene el valor crítico:

, el cual se obtiene del excel en el inciso a):

lor β 1 se encuentra en el intervalo:

b2=

ución y se tiene el valor crítico:

, el cual se obtiene del excel en el inciso a):

lor β 2 se encuentra en el intervalo:


los productos ordenados. La administración examina el proceso de distribución y está interesada en examinar los factores
os de distribución (Y), las ventas (X1) y el número de órdenes recibidas (X2).

Órdenes

X2
4015
3806
5309
4262
4296
4097
3213
4809
5237
4732
4413
2921
3977
4428
3964
4582
5582
3450
5079
5735
4269
3708
5387
4161
Superior 95% Inferior 95.0% Superior 95.0%
10.0777654070153 -15.5342585731353 10.0777654070153
0.0893880953506804 0.00483964910592448 0.0893880953506804
0.0166230824740551 0.00727077012971144 0.0166230824740551
es de distribución.

e hipótesis para cada uno de los coeficientes.


0.875935801774411

on los extremos, 0 y 1.
dólares y el número de órdenes es de 4500.

18,896.58
da en examinar los factores que afectan los costos. En la actualidad,
Los coeficientes y ecuaciones de regresion
se utilizan para averiguar la varianza y la
hipotesis sobre la estimación del error y la
aumentación de la hipotesis. Todo
problema tiene una x o y. para hacer la
regresion hay que presionar regresion en
datos y elegir los datos y crear una
regresión. La regresión lineal múltiple es
una extensión de la regresión lineal
simple, la cual permite tomar en cuenta a
más de una variable independiente es
decir, en lugar de usar solo una variable
independiente X para explicar la variación
en Y, pueden utilizarse al mismo tiempo
otras variables independientes. En la
regresión simple, la variable dependiente
se puede representar con Y y la variable
independiente con X. En el análisis de
regresión múltiple, se utilizan las X con
subíndices para representar a las distintas
variables independientes. La variable
dependiente todavía se representa con Y,
y las variables independientes se indican
con X1, X2, X3…XK. Una vez que se ha
determinado la serie inicial de variables
independientes, la relación entre Y y
dichas X se puede expresar como un
modelo de regresión múltiple. Al usar más
de una variable independiente, pueden
hacerse predicciones más exactas.

También podría gustarte