Casa Muestreado

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 5

PRACTICA ESTADÍSTICA

INFERENCIAL
Docente: Ana Laura Bautista García

Vanessa Barrera Guerrero


Adrián Cristino Moran
Valeria Olguin Guerrero

4to Semestre Grupo 1

Calificación: _____________________
En la tabla se reportan precios de casas unifamiliares, con una muestra aleatoria de lo casas tomada
de cada una de las tres subdivisiones de vivienda. Como puede apreciarse, además de subdivisión y
precio también se recoge la información sobre extensión en pies cuadrados de cada casa y lote. Con
el precio como la variable dependiente, realice un análisis de regresión por pasos hacia atrás usando
software de computo.

Tabla Precios de unifamiliares en tres subdivisiones

Casa muestreado Precio (y) Área habitables Tamaño de lotes Subdivisión (x3)
(x1) (x2)
1 102200 1500 12000 A
2 103950 1200 10000 A
3 87900 1200 10000 A
4 110000 1600 15000 A
5 97000 1400 12000 A
6 95700 1200 10000 A
7 113600 1600 15000 A
8 109600 1500 12000 A
9 110800 1500 12000 A
10 90600 1300 12000 A
11 109000 1600 13000 B
12 133000 1900 15000 B
13 134000 1800 15000 B
14 120300 2000 17000 B
15 137000 2000 17000 B
16 122400 1700 15000 B
17 121700 1800 15000 B
18 126000 1900 16000 B
19 128000 2000 16000 B
20 117500 1600 13000 B
21 158700 2400 18000 C
22 186800 2600 18000 C
23 172400 2300 16000 C
24 151200 2200 16000 C
25 179100 2800 20000 C
26 182300 2700 20000 C
27 195850 3000 22000 C
28 168000 2400 18000 C
29 199400 2500 20000 C
30 163000 2400 18000 C

a) Obtenga la ecuación de regresión múltiple para estimar el precio de casas con base en las
tres variables de tamaño del lote y ubicación.
La ecuación de regresión es
Precio (y) = 40462 + 36.0 Área habitables (x1) + 0.94
Tamaño de lotes (x2)
+ 4267 Subdivisión (x3) + 26648 sub(x4)
b) Pruebe la significancia del modelo de regresión múltiple al nivel del 5%

El modelo de regresión es significativo al 5%

c) Observe que variable tiene el coeficiente de regresión parcial con menor estadística t
reportada (y mayor que valor de P) y determine si la contribución de esa variable es
significativa al nivel de 5%. (Nota: para nuestra solución adoptamos la perspectiva de que,
dado que las dos variables indicadoras representan a una sola variable cualitativa, de
ubicación, ambas o ninguna debe eliminarse en el modelo. En consecuencia, solo
consideremos el más alto de los dos cocientes t asociados con las variables indicadoras.
Coef.
Predictor Coef de EE T P
Constante 40462 12046 3.36 0.003
Área habitables (x1) 36.03 19.11 1.89 0.071
Tamaño de lotes (x2) 0.936 2.139 0.44 0.666
Subdivisión (x3) 4267 5194 0.82 0.419
sub(x4) 26648 11429 2.33 0.028

El tamaño de lote tiene menor valor de la estadística de la prueba (T=0.44) y el


mayor valor P de tal forma que el tamaño de lote con (P=0.666) por lo tanto se
debe eliminar este modelo y realizar un nuevo modelo sin tomar en cuenta el
tamaño de lote.

d) Continuamos con el problema c), obtenga la ecuación de regresión múltiple para el modelo
reducido.
La ecuación de regresión es
Precio (y) = 41153 + 43.6 Área habitables (x1) + 4025 Subdivisión
(x3)
+ 24319 sub(x4)

e) Pruebe la significancia del modelo de regresión múltiple reducido al nivel del 5%.

El modelo de regresión es significativo al 5%

f) Observe que variable tiene el coeficiente de regresión parcial con la menor estadística t
reportada (y el mayor valor P) determine si la contribución de esa variable al modelo de
regresión múltiple es significativa al nivel del 5%.
Coef.

Predictor Coef de EE T P
Constante 41153 11755 3.50 0.002
Área habitables (x1) 43.558 8.190 5.32 0.000
Subdivisión (x3) 4025 5084 0.79 0.436
sub(x4) 24319 9954 2.44 0.022
El menor valor de la estadística de prueba es para la primera variable
indicadora (T = 0.79), el cual se ignora dada la posición que se describió
en el inciso c) con respecto a las variables indicadoras. La siguiente
estadística de prueba de menor magnitud es la correspondiente a la
segunda variable indicadora (P = 2.44) y es significativa a un nivel del
5%. Por ello, esta variable no debe eliminarse del modelo.

g) Observe la gráfica de residuales para el modelo de regresión múltiple reducido.


¿Parecen cumplir los supuestos de linealidad e igualdad de las varianzas condicionales?

Se puede observar en la gráfica los puntos residuales por lo tanto


concluimos que las suposiciones se satisfacen en forma razonable.

h) Use el modelo de regresión del problema c) y estime el precio de una casa con:

 1200 pies cuadradas y en la subdivisión A


Nueva Ajuste
Obs Ajuste SE IC de 95% PI de 95%
1 93423 3067 (87120, 99727) (75432, 111415)
 1800 pies cuadrados y en la subdivisión B
Nueva Ajuste
Obs Ajuste SE IC de 95% PI de 95%
1 123583 2604 (118231, 128936) (105902, 141264)

 2400 pies cuadrados y en la subdivisión C


Nueva Ajuste
Obs Ajuste SE IC de 95% PI de 95%
1 170012 2803 (164252, 175773) (152204, 187821)
i) Use el modelo de regresión del problema c) para determinar el intervalo de confianza de
95% para el precio medio condicional de todas las casas con:

 1200 pies cuadradas y en la subdivisión A


Nueva Ajuste
Obs Ajuste SE IC de 95% PI de 95%
1 93423 3067 (87120, 99727) (75432, 111415)
 1800 pies cuadrados y en la subdivisión B
Nueva Ajuste
Obs Ajuste SE IC de 95% PI de 95%
1 123583 2604 (118231, 128936) (105902, 141264)
 2400 pies cuadrados y en la subdivisión C
Nueva Ajuste
Obs Ajuste SE IC de 95% PI de 95%
1 170012 2803 (164252, 175773) (152204, 187821)

j) Continuamos con el problema c), determine el intervalo de predicción de 95% para el precio
de una casa individual en cada una de las tres categorías anteriormente identificas.

 1200 pies cuadradas y en la subdivisión A


Nueva Ajuste
Obs Ajuste SE IC de 95% PI de 95%
1 93423 3067 (87120, 99727) (75432, 111415)
 1800 pies cuadrados y en la subdivisión B
Nueva Ajuste
Obs Ajuste SE IC de 95% PI de 95%
1 123583 2604 (118231, 128936) (105902, 141264)
 2400 pies cuadrados y en la subdivisión C
Nueva Ajuste
Obs Ajuste SE IC de 95% PI de 95%
1 170012 2803 (164252, 175773) (152204, 187821)

Se puede observar en los intervalos es más amplio el intervalo de predicción en las tres categorías. El
intervalo de predicción indica que hay una probabilidad del precio de las casas en las tres subdivisiones,
con las especificaciones de 1200 pies cuadrados y en la subdivisión A esta en un precio de ($75432 y
$111415). 1800 pies cuadrados y en la subdivisión B está en un precio de ($105902 y $141264). 2400
pies cuadrados y en la subdivisión C está en un precio ($152204 y $187821)

También podría gustarte