Regressão Linear (Ex. Resolvido)

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 4

LINEAR E DE CORRELAC

ANALISE
DE REGRESSAO
AO
Problemas Resolvidos
17.1 Suponha que um analista toma uma amostra aleatoria de 10 carregamentos recentes por
caminh
ao feitos por uma companhia e anota a distancia em quilometros e o tempo de entrega
ao meio-dia mais proximo. Construir o diagrama de dispersao para os dados da Tabela-1 e fazer
consideracoes sobre se parece apropriada a analise de regressao linear simples.
Tabela-1 Amostra de observacoes de distancias rodoviarias e tempo de entrega para 10 carregamentos aleatoriamente selecionados.
Carregamento amostrado
Distancia X, em km
Tempo de entrega,
Y, em dias

1
825

2
215

3
1070

4
550

5
480

6
920

7
1350

8
325

9
670

10
1215

3,5

1,0

4,0

2,0

1,0

3,0

4,5

1,5

3,0

5,0

Resp. Pelo diagrama, parece que os pontos seguem, de modo geral, uma relacao linear. Entao,
parece apropriada ao caso a analise de regressao linear.

17.2 Determinar a equacao de regressao de mnimos quadrados para os dados no Problema 17.1,
e tracar a linha de regressao no diagrama de dispersao para os dados.
Resp. Com referencia `a Tabela 17.2,
P10
b =

(26.370) (10)(762)(2, 85)


4653
i=1 Xi Yi nXY
=
=
= 0, 0036.
P
10
2
2
7.104.300 (10)(762)
1.297.860
i=1 Xi nX

b = 2, 85 (0, 0036)(762) = 0, 1068

b = Y X
= 0, 11.
Portanto,
b = 0.11 + 0.0036X
Yb (X) =
b + X
Tabela 17.2 Calculos para a determinacao da equacao de regressao linear para estimar o tempo
de entrega com base na distancia rodoviaria

Carregamento
amostrado
1
2
3
4
5
6
7
8
9
10
Totais

Distancia X,
em km
825
215
1070
550
480
920
1350
325
670
1215
7620

Media

i
X = i=1
n
7620
= 10 = 762

10

Tempo de entrega,
Y, em dias
3,5
1,0
4,0
2,0
1,0
3,0
4,5
1,5
3,0
5,0
28,5
Y =

10
i=1

Yi

=
= 2,85
n

Xi Yi
2887,5
215,0
4280,0
1100,0
480,0
2760,0
6075,0
487,5
2010,0
6075,0
26.370,0

X2i
680.625
46.225
1.144.900
302.500
230.400
846.400
1.822.500
105.625
448,900
1.476.225
7.104.300

Y2i
12,25
1,00
16,00
4,00
1,00
9,00
20,25
2,25
9,00
25,00
99,75

28,5
10

Note que as linhas tracejadas indicam o desvio entre cada valor amostrado de Yi e o correspondente valor estimado, Ybi , i = 1, ..., n. A soma dos quadrados destes desvios e minimizada pela linha
de regressao linear determinada pelo procedimento acima.
17.3 Usando a equacao de regressao desenvolvida no Problema 17.2, estimar o tempo de entrega
para um carregamento para 1.000 quilometros. Esta equacao de regressao poderia ser usada para
estimar o tempo de entrega para um carregamento de 2.500 quilometros?
Resp. Yb (x) = 0, 11 + 0, 0036X = 0, 11 + 0, 0036(1000) = 3, 71 dias.
Nao e apropriado usar a equacao acima para uma viagem de 2.500 quilometros, porque os dados da
amostra para esta equacao de regressao linear estimada incluem viagens de ate 1.350 quilometros
somente.
17.4 Calcular o desvio padrao estimada de para o problema de analise do tempo de entrega,
utilizando os valores determinados na solucao do Problema 17.2.
Resp.
2

P10

b =
P10

2
i=1 Yi

1,683
8

P10

Ybi )2
=
n2

i=1 (Yi

P
b 10
i=1 Xi Yi

99, 75 (0, 11)(28, 5) (0, 0036)(26.370)


=
=
n2
8

= 0, 2104
b = 0, 2104 = 0, 4587
= 0, 46
i=1 Yi

17.5 Com as solucoes dos Problemas 17.3 e 17.4, construir um intervalo estimado de predicao
b
Y de 95% para o tempo de entrega, envolvendo um carregamento para 1.000 quilometros, sem
considerar a incerteza associada com a propria posicao da linha de regressao.
Resp. Uma vez que Yb (x) (para X = 1.000) = 3,71 dias (do Problema 17.3), e
b = 0,46 (do Problema
17.4), o intervalo de predicao de 95% (com graus de liberdade = 10 - 2 = 8) e:
Yb (1000) t(n 2; = 0, 05)b
= 3,71 (2,306)(0,46) = 3,71 1,06 = 2,65 a 4,77 dias.
Ent
ao, dado um carregamento por caminhao que envolve uma distancia de 1.000 quilometros,
estimamos que o tempo de entrega estara entre 2,65 e 4,77 dias, com uma probabilidade de 0,95.

17.6 Usando os valores determinados nos problemas anteriores, construir um intervalo de confianca de 95% para a media do tempo (E(Y |X) = + X) de entrega para um carregamento para
1.000 quilometros.
Resp. Dado Yb (x) (para X = 1.000) = 3,71 dias,
b = 0,46 e os valores na Tabela 17.2,

SY (x)

v
s
u
2
u1
X)
1
(X

(1000 762)2
i
=
bt + P
+
= 0, 1748
=
0.46
= 0, 17.
n
2
(
X)
n
10 7.104.300 (7620)2
( ni=1 Xi2 i=1n i )
10

O intervalo de confianca de 95% para a media condicional (onde os graus de liberdade = 10 2 = 8) e:

Yb (1000) t(n 2; = 0, 05)SY (x) = = 3,71 (2,306)(0,17)= 3,710,39 = 3,32 a 4,10 dias
Ent
ao, para carregamentos por caminhao em distancias de 1.000 quilometros, estimamos que o
tempo medio de entrega esta entre 3,32 e 4,10 dias, com 95% de confianca.
17.7 Usando os valores determinados nos problemas anteriores, calcular o intervalo de predicao
de. 95% para o tempo de entrega de um carregamento, dado que a distancia e de 1.000 quilometros,
levando em conta a incerteza sobre a posicao da linha de regressao. Comparar este intervalo com
o construdo no Problema 17.5.

Resp. Uma vez que Yb (1000) = 3,71 dias, e que


b = 0,46, e SY (x) = 0,17;

b2 + S 2

SYseg =

Y (x)

(0, 46)2 + (0, 17)2 =

0, 2405 = 0, 4904
= 0, 49

O intervalo de confianca de 95% para a media condicional (onde os graus de liberdade = 10 2 = 8) e:


Yb (1000) t(n 2; = 0, 05)SYseg = = 3,71 (2,306)(0,49)= 3,711,13 = 2,58 a 4,84 dias.
Como esperado, este intervalo de predicao e um pouco mais amplo do que o intervalo do Problema 17.5, o qual foi construdo usando-se o erro padrao de estimacao e sem considerar a incerteza
associada com a localizacao do valor de regressao medio.
17.8 Determinar o intervalo de confianca de 95% para para os dados de distancia e tempo de
entrega discutidos nos problemas anteriores.
Resp. Dados
b = 0,46 e os valores da Tabela 17.2,

S = q

Pn

2
i=1 Xi

nX

= p

0, 46
7.104.300 10(762)2

0, 46
= 0, 0004.
1.139, 24

Uma vez que b = 0,0036 (do Problema 17.2) e que graus de liberdade = n - 2 = = 10 - 2 = 8,
o intervalo de confianca de 95% para e: b t S = 0,0036 (2,306)(0,0004) = 0,0036 0,0009
= 0,0027 a 0,0045.
17.9 Com referencia ao Problema 17.8, testar a hipotese nula Ho : =0 para os dados de distancia
e tempo de entrega a um nvel de significancia de 5%.
Resp.

Ho : =0
vs
H1 : 6==0
tT ab (gl = 8, = 0, 05) = 2, 306
tcalc =

o
Sb

000380
0,0004

= 9, 00.
3

Portanto, rejeita-se a hipotese nula, e conclui-se que ha uma relacao significante entre a distancia
dos carregamentos e o tempo de entrega.
17.10
Coeficiente de determinacao

R2 =

SQReg
SQR
16, 842
=1
=
= 0, 9091
SQT
SQT
18

Portanto podemos concluir que cerca de 91% da variacao no tempo de entrga e explicada pela
dist
ancia rodoviaria envolvida.

Você também pode gostar