INTERVALOS Romina Cardeña Tintaya - Rommel Vela Banda
INTERVALOS Romina Cardeña Tintaya - Rommel Vela Banda
INTERVALOS Romina Cardeña Tintaya - Rommel Vela Banda
Y 0 1 X
Verdadera recta de regresión:
n n
n n
y i xi
S xy ( xi x ) yi xi yi i 1 i 1
i 1 i 1 n
OTRA FORMA DE CALCULO DE LOS PARAMETROS
INTERPRETACIÓN DE PARAMETROS
EJEMPLO:
SEA X = HORAS DE ESTUDIO DEDICADAS A LA SEMANA SI: Y = 3 + 2X
SEA Y = PROMEDIO DE CALIFICACIÓN
EL COEFICIENTE SIGNIFICA (β1): POR CADA HORA ADICIONAL DE ESTUDIO DEDICADA A LA SEMANA, SU CALIFICACIÓN AUMEN
LA CONSTANTE SIGNIFICA (β0): SI LA PERSONA NO DEDICA HORAS DE ESTUDIO SE ESPERA QUE SAQUE DE PROMEDIO TRES
r
S xy R r 2 2
INTERPRETACIÓN DE PARAMETROS
EJEMPLO:
si R^2 = 0.94…. ESTO QUIERE DECIR QUE EL 94% APROXIMADAMENTE DE LA VARIACIÓN EN LA VARIABLE Y PUEDE S
REGRESIÓN
DOS
i ~ N (0, 2 )
anza 2;
S
βˆ 1 xy
S xx
adrados de Y
2
n
n
y i
yi
2 2 i 1
i 1 n
n
xi
i 1
n
Y = 3 + 2X
eficiente de determinación:
EL R^2 ESTA ENTRE 0 Y 1
R r
2 2
uando el coeficiente r de Pearson se eleva al cuadrado, el resultado indica el porcentaje de la variación de una variable debido a la variació
e la otra y viceversa. Es decir, el coeficiente de determinación, r al cuadrado o r², es la proporción de la variación en Y explicada por X.
PRUEBAS DE HIP
Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y
Prueba de Hipótesis sobre β1: El estadístico de prueba tiene distribución T-Student con n-2 grados
ˆ1 1
H 0 : β1 0 T Tc = 22.6418585
MS E
H 1 : β1 0
S xx Por lo tanto: SE RECHAZA LA HIPOTESIS N
H0 : 0 r n2
T Tc = 22.6418585
INTERVALOS DE CO
37.29 a 43.15 m3
28.53 a 51.92 m3
1 ( xo x ) 2
yˆ 0 ta / 2 , n 2 MS E 1
3) en determinado lugar. n S xx
yˆ i
2
SS E
2 n2
+ 0.827 X
PRUEBAS DE HIPOTESIS
ineal entre X y Y n
yi yˆ i
2
SS E
MS E i 1
n2 n2
n
yi yˆ i
2
SS E
MS E i 1
n2 n2
ECHAZA LA HIPOTESIS NULA; ES DECIR SI HAY REGRESIÓN LINEAL ENTRE EL VOLUMEN DE LLUVIA Y EL VOLUMEN DE
ECHAZA LA HIPOTESIS NULA; ES DECIR SI HAY REGRESIÓN LINEAL ENTRE EL VOLUMEN DE LLUVIA Y EL VOLUMEN DE
INTERVALOS DE CONFIANZA
1 ( xo x ) 2
ˆ 0 ta / 2 , n 2
y MS E
n S xx
1 ( xo x ) 2
ˆ 0 ta / 2 , n 2
y MS E 1
n S xx
( xo x ) 2
S xx
Bandas de predicción
LSP
15.3021694658
20.9315054176
22.5441345915
24.9666924798
29.8250466602
35.5159411074
43.6895372315
49.4422811112
56.0486990992
66.0221074941
70.2001041109
77.7531196938
90.4316758933
104.072179118
116.959722247
UVIA Y EL VOLUMEN DE
UVIA Y EL VOLUMEN DE
xo x ) 2
S xx
1 ( xo x ) 2
n S xx
EJERCICIO 2
Los siguientes datos representan el número de horas de estudio (x) y la calificación obtenida (y) en un exa
a) Grafique y obtenga su tendencia y ecuación
b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.
d) Estime el valor de la variable dependiente cuando la independiente es 15
Var Indep.
Var. Dep. o regresiva
No. hrs. estu Calificación del examen
No. Observ. X Y X2 Y2 XY yiestimada ei
1 1 71 1 5041 71 71.45 0.2025
2 2 71 4 5041 142 72.8375 3.37640625
3 4 74 16 5476 296 75.6125 2.60015625
4 4 80 16 6400 320 75.6125 19.2501563
5 7 80 49 6400 560 79.775 0.050625
6 12 86 144 7396 1032 86.7125 0.50765625
sumatorias 30 462 230 35754 2421 462 25.9875
Promedio 5 77
Sxx = 80 S
Sxy = 111 βˆ 1 xy
Syy =
β1 =
180
1.388
S xx
β0 = 70.063
Y=70.06+1.38X
ˆ 0 y ˆ 1 x
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) C
Resumen
Estadísticas de la regresión
Coeficiente d 0.925
Coeficiente 0.855625
R^2 ajustado 0.81953125
Error típico 2.54889682
Observacione 6
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 154.0125 154.0125 23.7056277 0.00822656
Residuos 4 25.9875 6.496875
Total 5 180
Y=70.06+1.38X = 90.76
2 Practic
Coef. De Determinación, R2= 0.856 <- 85.56% de la variación de Y está explicada por el modelo de regresión
SSE= 25.988 <- Suma de cuadrados de los errores
MSE= 6.497 <- Cuadrados medios de los errores
Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y
Tc = 4.8688425
Tc = 4.8688425
INTERVALOS DE CONFIANZA
79.87 a 101.88
ación obtenida (y) en un examen, para una muestra de seis estudiantes
n n
la parte b) Comente.
n n
y i xi
S xy ( xi x ) yi xi yi i 1 i 1
i 1 i 1 n
2
n
n n
xi
S xx xi x xi
2 2 i 1
i 1 i 1 n
2
n
n n
y i
S yy yi y y 2i i 1
2
i 1 i 1 n
uadrados
yˆ ˆ0 ˆ1 x
xy
xx
SSxyxy
ˆ 1 x rr
SSxxxxSSyyyy
DATOS
ANALISIS DE DATOS
REGRESION
RANGO DE SALIDAD
Inferior 95.0%
Superior 95.0%
65.1637571 74.9612429
0.59628165 2.17871835
diente es 15
2 Practica
modelo de regresión
ineal entre X y Y
n
y yˆ
2
i i
SS E
MS E i 1
n2 n2
ˆ1 1
T H0 : β1 0
MS E
H1 : β1 0
S xx
NTONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LAS HORAS DE
(X) Y LA CALIFICACION OBTENIDA (Y)
r n2 H0 : 0
T
1 r 2 H1 : 0
NTONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LAS HORAS DE
DIO Y LA CALIFICACION OBTENIDA
NFIANZA
1 ( xo x ) 2
yˆ 0 ta / 2,n 2 MS E
n S xx
1 ( xo x ) 2
yˆ 0 ta / 2,n 2 MS E 1
n S xx
n
xi
i 1
n
RE LAS HORAS DE
RE LAS HORAS DE
de datos
promedios
siguientes
, que se
obtuvieron
de los
EJERCICIO 3
registros
históricos:
a) Grafique y obtenga su tendencia y ecuación
b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.
d) Estime el valor de la variable dependiente cuando la independiente es 64
N X Y X2 Y2 XY yiestimada
1 480 362 230400 131044 173760 463.8461288047
2 880 750 774400 562500 660000 760.8392382399
3 110 243 12100 59049 26730 189.1275025772
4 320 410 102400 168100 131200 345.0488850307
5 960 758 921600 574564 727680 820.237860127
6 950 1002 902500 1004004 951900 812.8130323911
7 240 320 57600 102400 76800 285.6502631436
8 510 365 260100 133225 186150 486.1206120124
9 750 618 562500 381924 463500 664.3164776735
SUMATORIA 5200 4828 3823600 3116810 3397720 4828
PROMEDIO 577.77777778 536.4444444
1000
800
f(x) = 0.7424827736x + 107.4543974825
R² = 0.8571306624
600
400
200
0
0 200 400 600 800 1000 1200
Sxx = 819155.5556
Sxy = 608208.8889 Y=107.45+0.74X
Syy = 526856.2222
β1 = 0.742
β0 = 107.454
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) C
Resumen
Estadísticas de la regresión
Coeficiente de c 0.925813514
Coeficiente de 0.857130662
R^2 ajustado 0.836720757
Error típico 103.697086
Observaciones 9
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 451584.623 451584.623 41.9958176 0.0003403507
Residuos 7 75271.5995 10753.0856
Total 8 526856.222
Y=107.45+0.74X = 154.81
2 Practica
Coef. De Determinación, R2= 0.857 <- 85.71% de la variación de Y está explicada por el modelo de regresión
SSE= -81352.667 <- Suma de cuadrados de los errores
MSE= 10753.086 <- Cuadrados medios de los errores
Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y
Si a = 0.05 a/2= 0.025
La región de rechazo es: | t0 |>ta/2 2.3646243
Tc = 6.4804180
Tc = 6.4804180
INTERVALOS DE CONFIANZA
-138.59 a 448.54
s en la parte b) Comente.
(Y - Yestimada)^2
10372.6339525099
117.4890856218
2902.2459785718
4218.6473357611
3873.5512331831
35791.7087130584
1179.9044221028
14670.2026542512
2145.2161040784
75271.5994791384
os cuadrados
yˆ ˆ0 ˆ1 x
yˆ ˆ0 ˆ1 x
ependiente es 64
2 Practica
da por el modelo de regresión
AS, ENTONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LA VARIBLE X Y Y
H0 : 0
n-2 grados de libertad.
r n2
T
1 r 2 H1 : 0
AS, ENTONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LA VARIBLE X Y Y
LOS DE CONFIANZA
1 ( xo x ) 2
yˆ 0 ta / 2, n 2 MS E
1n ( xoSxxx ) 2
ˆ 0 ta / 2, n 2
y MS E
n S xx
1 ( xo x ) 2
yˆ 0 ta / 2, n 2 MS E 1
n ( xoSxxx ) 2
1
yˆ 0 ta / 2, n 2 MS E 1
n S xx
β1 0
β1 0
L ENTRE LA VARIBLE X Y Y
0
0
L ENTRE LA VARIBLE X Y Y
EJERCICIO 4
Para el conjunto de datos promedios siguientes, que se
obtuvieron de los registros históricos:
a) Grafique y obtenga su tendencia y ecuación
b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.
d) Use la recta de Regresión para pronosticar la posible venta de la primera semana de Mayo (sema
X INDE Y DEPEN
N Semanas Ventas X2 Y2 XY yiestimada(Y - Yestimada)^2
1 1 6,757 1 45,657,049 6757 4115.48617 6977595.34
2 2 7,811 4 61,011,721 15622 4133.06324 13527218.8
3 3 1,219 9 1,485,961 3657 4150.64032 8594514.94
4 4 8,609 16 74,114,881 34436 4168.21739 19720550.2
5 5 2,707 25 7,327,849 13535 4185.79447 2186833.07
6 6 4,202 36 17,656,804 25212 4203.37154 1.88112609
7 7 1,472 49 2,166,784 10304 4220.94862 7556718.5
8 8 2,088 64 4,359,744 16704 4238.52569 4624760.75
9 9 951 81 904,401 8559 4256.10277 10923704.3
10 10 1,259 100 1,585,081 12590 4273.67984 9088294.55
11 11 1,336 121 1,784,896 14696 4291.25692 8733543.45
12 12 2,674 144 7,150,276 32088 4308.83399 2672682.18
13 13 4,904 169 24,049,216 63752 4326.41107 333608.975
14 14 9,551 196 91,221,601 133714 4343.98814 27112972.5
15 15 2,283 225 5,212,089 34245 4361.56522 4320433.36
16 16 4,828 256 23,309,584 77248 4379.14229 201473.242
17 17 6,802 289 46,267,204 115634 4396.71937 5785374.92
18 18 9,102 324 82,846,404 163836 4414.29644 21974564.6
19 19 5,823 361 33,907,329 110637 4431.87352 1935232.89
20 20 6,570 400 43,164,900 131400 4449.45059 4496729.79
21 21 1,516 441 2,298,256 31836 4467.02767 8708564.3
22 22 2,137 484 4,566,769 47014 4484.60474 5511248.03
SUMATORIA 253 94601 3795 582048799 1103476 94601 174986621
PROMEDIO 11.5 4300.04545455
10,000
8,000
6,000
8,000
6,000
2,000
0
0 5 10 15 20 25
Estadísticas de la regresión
Coeficiente d 0.0395092914
Coeficiente 0.0015609841
R^2 ajustado -0.0483609667
Error típico 2957.92681256
Observacione 22
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 273578.385 273578.385 0.031268492 0.86142115
Residuos 20 174986621 8749331.03
Total 21 175260199
d) Use la recta de Regresión para pronosticar la posible venta de la primera semana de Mayo (sema
Y=4097.90+17.57X = 4502.01
2 Practic
Coef. De Determinación, R2= ###<- 0.16% de la variación de Y está explicada por el modelo de regresión
SSE= 174986620.569 <- Suma de cuadrados de los errores
MSE= 8749331.028 <- Cuadrados medios de los errores
Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y
Tc = 0.1768290
Tc = 0.1768290
1778.89 a 7225.47 m3
Intervalo de predicción para Y dado X
Si el volumen de lluvia es de: 23 m3
La predicción para el volumen 4502.18182
-2242.21 a 11246.57 m3
arte b) Comente.
emana de Mayo (semana 23)
Yestimada)^2
Y=4097.90+17.57X
2 Practica
modelo de regresión
al entre X y Y
n
yi yˆ i
2
SS E
MS E i 1
n2 n2
ˆ1 1
T H0 : β1 0
MS E
S xx H1 : β1 0
NCES SE NO HAY EVIDENCIA SUFIECIENTE PARA REHAZAR LA HIPOTESIS NULA, ES DECIR NO HAY REGRESION
LINEAL ENTRE LA VARIBLE X Y Y
r n2 H0 : 0
T
1 r 2 H1 : 0
ARA RECHAZAR LA HIPOTESIS NULA
NCES SE NO HAY EVIDENCIA SUFIECIENTE PARA REHAZAR LA HIPOTESIS NULA, ES DECIR NO HAY REGRESION
LINEAL ENTRE LA VARIBLE X Y Y
TERVALOS DE CONFIANZA
NO HAY REGRESION
NO HAY REGRESION
EJERCICIO 5
Para el conjunto de datos promedios siguientes, que se
obtuvieron de los registros históricos:
a) Grafique y obtenga su tendencia y ecuación
b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.
d) Use la recta de Regresión para pronosticar las exportaciones cuando los gastos de marketing son
800
600
400
200
0
5 6 7 8 9 10 11 12 13
Sxx = 20.88
Sxy = 2379 Y=-99.18+113.93X
Syy = 272468.75
β1 = 113.937
β0 = -99.181
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.
Resumen
Estadísticas de la regresión
Coeficiente de corre 0.997403402
Coeficiente de dete 0.9948135463
R^2 ajustado 0.9922203195
Error típico 26.581446083
Observaciones 4
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 271055.603 271055.6034 383.619948 0.0025966
Residuos 2 1413.14655 706.5732759
Total 3 272468.75
d) Use la recta de Regresión para pronosticar las exportaciones cuando los gastos de marketing son
Y=-99.18+113.93X 1204.301
2 Practica
Coef. De Determinación, R2= ### <- 99.48% de la variación de Y está explicada por el modelo de regre
SSE= 1413.147 <- Suma de cuadrados de los errores
MSE= 706.573 <- Cuadrados medios de los errores
Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y
Tc = 19.5862183
Tc = 19.5862183
INTER
946.20 a 1065.81 m3
876.94 a 1135.07 m3
a parte b) Comente.
s gastos de marketing son 9.7 (miles de euros)
(Y - Yestimada)^2
242.124331
871.776531
289.879979
9.36571046
1,413
a parte b) Comente.
or crítico de F
neal entre X y Y
n
yi yˆ i
2
SS E
MS E i 1
n2 n2
ˆ1 1
T
MS E
ˆ1 1
T H0 : β1 0
s de libertad.
MS E
S xx H1 : β1 0
ESIS NULA
ONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LA VARIBLE X Y Y
r n2 H0 : 0
T
s de libertad.
1 r 2 H1 : 0
ESIS NULA
ONCES SE RECHAZA LA HIPOTESIS NULA, ES DECIR SI HAY REGRESION LINEAL ENTRE LA VARIBLE X Y Y
INTERVALOS DE CONFIANZA
miento es de:
0
0
LA VARIBLE X Y Y
LA VARIBLE X Y Y
EJERCICIO 6
Para el conjunto de datos promedios siguientes, que se
obtuvieron de los registros históricos:
a) Grafique y obtenga su tendencia y ecuación
b) Ajuste la curva de tendencia lineal por método de mínimos cuadrados
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b) Comente.
d) Use la recta de Regresión para pronosticar la variable dependiente cuando la independiente va
X Y X2 Y2 XY yiestimada
1 5 27 25 729 135 27.2272727
2 7 26 49 676 182 24.8181818
3 8 24 64 576 192 23.6136364
4 10 21 100 441 210 21.2045455
5 9 22 81 484 198 22.4090909
6 12 18 144 324 216 18.7954545
7 13 17 169 289 221 17.5909091
8 15 15 225 225 225 15.1818182
9 14 16 196 256 224 16.3863636
10 17 14 289 196 238 12.7727273
SUMATORIA 110 200 1,342 4,196 2,041 200
PROMEDIO 11 20
20
15
10
0
4 6 8 10 12 14 16 18
Sxx = 132
Sxy = -159 Y=33.250-1.20X
Syy = 196
β1 = -1.205
β0 = 33.250
c) Realice una regresión Lineal y compare los datos con los obtenidos en la parte b)
Resumen
Estadísticas de la regresión
Coeficiente d 0.9885124035
Coeficiente 0.9771567718
R^2 ajustado 0.9743013683
Error típico 0.7481036632
Observacione 10
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 191.522727 191.522727273 342.213198 7.5144E-08
Residuos 8 4.47727273 0.5596590909
Total 9 196
Y=33.250-1.20X 16.09
2 Practic
Coef. De Determinación, R2= ###<- 97.72% de la variación de Y está explicada por el modelo de regresión
SSE= 4.477 <- Suma de cuadrados de los errores
MSE= 0.560 <- Cuadrados medios de los errores
Si β1=0, ó ρ=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y
Tc = -18.4990053
Tc = -18.4990053
15.29 a 16.76
14.15 a 17.90
os en la parte b) Comente.
e cuando la independiente vale 14.3
(Y - Yestimada)^2
0.05165289
1.39669421
0.14927686
0.04183884
0.16735537
0.63274793
0.34917355
0.03305785
0.14927686
1.50619835
4
18
os cuadrados
s obtenidos en la parte b) Comente.
or crítico de F
2 Practica
ada por el modelo de regresión
BLAS, ENTONCES SE NO HAY EVIDENCIA SUFIECIENTE PARA REHAZAR LA HIPOTESIS NULA, ES DECIR NO HA
REGRESION LINEAL ENTRE LA VARIBLE X Y Y
r n2 H0 : 0
T
ados de libertad.
1 r 2 H1 : 0
BLAS, ENTONCES SE NO HAY EVIDENCIA SUFIECIENTE PARA REHAZAR LA HIPOTESIS NULA, ES DECIR NO HA
REGRESION LINEAL ENTRE LA VARIBLE X Y Y
INTERVALOS DE CONFIANZA
e Y dado X:
m3
de escurrimiento es de:
m3
0
0
0
0