SPSS Regressao Multipla

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 27

REGRESSO LINEAR MLTIPLA exemplo usando o SPSS

Um fabricante de produtos eletrnicos est interessado em saber que variveis esto associadas com o grau de conhecimento dos consumidores sobre um tipo de processador que a companhia lanou recentemente no mercado. Uma amostra de 46 clientes foi selecionada fornecendo dados sobre os gerentes de compras em relao s variveis:
Y = grau de conhecimento do processador (escala de 0 a 100) X1 X2 X3 X4 X5 = = = = = Nvel de escolaridade (anos de estudo) Idade (anos) grau de conhecimento sobre os recentes avanos na rea (escala de 0 a 100) distncia entre o escritrio e a loja mais prxima (Km) salrio mensal (nmero de salrios mnimos)

1. Encontre a melhor regresso utilizando o mtodo Forward e compare com a melhor regresso utilizando o mtodo Backward. A soluo encontrada foi a mesma? Deveria ser? 2. Como voc avaliaria o modelo cujas variveis independentes so idade, escolaridade e salrio? Interprete o modelo. Formule e teste a significncia de cada um dos coeficientes angulares. Alguma evidncia de outlier nesse modelo? 3. Considerando o modelo do item 2, calcule a correlao entre idade e grau de conhecimento do processador, corrigida pelo expurgo das variveis escolaridade e salrio. 4. Considerando o modelo do item 2, investigue a possvel violao das premissas do modelo linear. Qual a importncia da premissa de distribuio dos erros (normalidade)? 5. Analise os resduos e comente sobre alguma anomalia encontrada no modelo do item 2. 6. Faa uma previso para o grau de conhecimento esperado de uma pessoa de 45 anos, com 15 anos de estudo e renda de 30 salrios mnimos.

www.alphaquant.com.br
[email protected]

COMO RODAR A REGRESSO LINEAR MLTIPLA NO SPSS

1 Abrir o SPSS INICIAR SPSS FOR WINDOWS

2 Abrir o arquivo com os dados numricos FILE OPEN DATA

3 Para rodar a regresso linear, fazer:

www.alphaquant.com.br
[email protected]

4 Selecionar a varivel dependente (Y) e as independentes (X) e tambm, o mtodo que ser utilizado (Enter, Forward ou Backward):

Aps isto, clicar em CONTINUE. OBS.: no caso da regresso linear simples (quando s existe uma varivel independente - X), o mtodo ser o Enter.

5 No boto STATISTICS, selecionar:

OBS: Selecione o R square change. Aps isto, clicar em CONTINUE.


www.alphaquant.com.br
[email protected]

6 No boto PLOTS, selecionar:

Se quiser os grficos de Y com todos os Xs, selecione Produce all partial plots Aps isto clicar em CONTINUE.

7 No boto SAVE, selecionar:

Aps isto clicar em CONTINUE. 8 Clicar em OK. O SPSS ir rodar a regresso linear mltipla.
www.alphaquant.com.br
[email protected]

Resoluo do Exerccio Anlise do OUTPUT


Resposta da

QUESTO 1

Faremos primeiro o mtodo Forward. Para isso, selecionaremos Method: Forward. Os demais passos esto relacionados no PASSO A PASSO acima.

O output do SPSS, para esta regresso linear mltipla, est apresentado a seguir.

Aps cada quadro mencionada a utilidade dele. E, em itlico e azul, feita a anlise estatstica.
OBS.: No output, os quadros Excluded Variables e Collinearity Diagnostic foram excludos.

www.alphaquant.com.br
[email protected]

Mtodo Forward Regression

Descriptive Statistics Mean 71,17 10,83 37,65 69,02 10,57 30,33 St d. Dev iation 10,92 2,23 9,95 11,72 5,05 7,94 N 46 46 46 46 46 46

Conheciment o Escolaridade Idade Av anos Dist ncia Salrio

Devemos calcular o CV (coeficiente de variao). O CV calculado dividindo-se o desvio padro (Std. Deviation) pela mdia (Mean).

Anlise Como os coeficientes de variao de todas as variveis so menores do que 50%, considera-se que as variveis no possuem alta disperso. Por isso, no necessria nenhuma transformao nos dados.

a Variables Entered/Removed

Model 1 2 3 4 5

Variables Ent ered Escolaridade Idade Av anos Dist ncia Salrio

Variables Remov ed , , , , ,

Forward (C riterion: Forward (C riterion: Forward (C riterion: Forward (C riterion: Forward (C riterion:

Met hod Probabilit y -of -F-to-enter Probabilit y -of -F-to-enter Probabilit y -of -F-to-enter Probabilit y -of -F-to-enter Probabilit y -of -F-to-enter

<= <= <= <= <=

,050) ,050) ,050) ,050) ,050)

a. Dependent Variable: Conhecimento

Esse quadro apresenta a ordem de entrada das variveis no modelo. No faremos anlises estatsticas sobre ele.

www.alphaquant.com.br
[email protected]

Model Summaryf Adjusted R Square ,501 ,808 ,961 ,975 ,989 St d. Error of the Estimate 7,71 4,79 2,15 1,71 1,16

Model 1 2 3 4 5

R ,716a ,903b ,982c ,989d ,995e

R Square ,512 ,816 ,964 ,978 ,990

a. Predictors: (Constant), Escolaridade b. Predictors: (Constant), Escolaridade, Idade c. Predictors: (Constant), Escolaridade, Idade, Av anos d. Predictors: (Constant), Escolaridade, Idade, Av anos, Dist ncia e. Predictors: (Constant), Escolaridade, Idade, Av anos, Dist ncia, Salrio f .Dependent Variable: Conhecimento

O modelo escolhido pelo mtodo Forward o ltimo (o quinto). Ento, analisaremos apenas as estatsticas dele. Podemos observar que, a cada entrada de uma nova varivel no modelo, o R ajustado e o Desvio Padro do modelo melhoravam. Ou seja, o R ajustado aumentava e o desvio padro da estimativa diminua o que muito bom.

No olhamos para o R, mas sim para o R ajustado, pois se trata de uma regresso mltipla. Para compararmos diversos modelos com diferentes nmeros de variveis independentes, usamos o R ajustado, e no o R. O R ajustado pondera o R2 de acordo com o nmero de variveis independentes no modelo, e o nmero de observaes.

Anlise: R ajustado: 98,9% da variao total explicada pela relao entre as variveis independentes e Y (varivel dependente), quando levados em considerao o nmero de variveis independentes no modelo. Essa estatstica sofre penalizao pela entrada de variveis no modelo..

Std Error of the Estimate: o desvio padro do modelo igual a 1,16.

www.alphaquant.com.br
[email protected]

ANOVAf Sum of Squares 2746,285 2616,324 5362,609 4376,383 986,226 5362,609 5168,536 194,073 5362,609 5242,282 120,326 5362,609 5308,707 53,901 5362,609

Model 1

df 1 44 45 2 43 45 3 42 45 4 41 45 5 40 45

Regression Residual Total Regression Residual Total Regression Residual Total Regression Residual Total Regression Residual Total

Mean Square 2746,285 59,462 2188,191 22,935 1722,845 4,621 1310,571 2,935 1061,741 1,348

F 46,186

Sig. ,000a

95,406

,000b

372,847

,000c

446,564

,000d

787,917

,000e

a. Predictors: (Const ant), Escolaridade b. Predictors: (Const ant), Escolaridade, Idade c. Predictors: (Const ant), Escolaridade, Idade, Av anos d. Predictors: (Const ant), Escolaridade, Idade, Av anos, Distncia e. Predictors: (Const ant), Escolaridade, Idade, Av anos, Distncia, Salrio f .Dependent Variable: Conhecimento

O SPSS apresenta o resultado das regresses realizadas at se chegar no melhor modelo. Como o melhor modelo o ltimo (o 5 apresentado por ele), faremos o teste F apenas desse modelo.

Anlise: Teste F teste do modelo H0: 1 = 2 = 3 = 4 = 5= 0 H1: algum diferente de zero Alpha = 5%

www.alphaquant.com.br
[email protected]

Como Sig (0,000) menor do que alfa (0,05) rejeitamos H0 e conclumos que pelo menos um beta diferente de zero, logo, existe relao linear entre Y e pelo menos um X.

a Coeffi cients

Model 1 2

(Constant) Escolaridade (Constant) Escolaridade Idade (Constant) Escolaridade Idade Av anos (Constant) Escolaridade Idade Av anos Dist ncia (Constant) Escolaridade Idade Av anos Dist ncia Salrio

Unstandardized Coef f icients B St d. Error 33,318 5,685 3,497 ,515 50,738 4,091 4,033 ,326 -,617 ,073 36,426 2,137 2,704 ,178 -,673 ,033 ,446 ,034 39,889 1,838 2,727 ,142 -,639 ,027 ,415 ,028 -,267 ,053 43,433 1,344 3,047 ,106 -,679 ,019 ,421 ,019 -,299 ,036 -,185 ,026

St andardi zed Coef f icien ts Beta ,716 ,825 -,562 ,553 -,613 ,479 ,558 -,582 ,446 -,124 ,624 -,618 ,452 -,138 -,135

t 5,861 6,796 12,402 12,377 -8,430 17,046 15,190 -20,317 13,093 21,704 19,211 -23,463 14,890 -5,013 32,322 28,627 -35,171 22,278 -8,224 -7,021

Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000

95% Conf idence Interv al f or B Lower Bound Upper Bound 21,861 44,776 2,460 4,534 42,488 58,989 3,376 4,690 -,764 -,469 32,113 40,739 2,345 3,063 -,740 -,606 ,378 ,515 36,178 43,601 2,440 3,013 -,694 -,584 ,359 ,471 -,374 -,159 40,717 46,148 2,831 3,262 -,718 -,640 ,383 ,459 -,373 -,226 -,238 -,132

Zero-order ,716 ,716 -,401 ,716 -,401 ,672 ,716 -,401 ,672 -,367 ,716 -,401 ,672 -,367 ,437

Correlations Part ial ,716 ,884 -,789 ,920 -,953 ,896 ,949 -,965 ,919 -,616 ,976 -,984 ,962 -,793 -,743

Part ,716 ,809 -,551 ,446 -,596 ,384 ,449 -,549 ,348 -,117 ,454 -,558 ,353 -,130 -,111

Collinearity Statistics Tolerance VI F 1,000 ,962 ,962 ,649 ,946 ,643 ,649 ,888 ,611 ,901 ,530 ,813 ,610 ,886 ,684 1,000 1,040 1,040 1,540 1,057 1,555 1,542 1,126 1,637 1,110 1,888 1,230 1,641 1,128 1,462

a. Dependent Variable: Conhecimento

Essa tabela apresenta os coeficientes angulares (os betas) das variveis. Apresenta os intervalos de confiana de cada coeficiente, a correlao parcial e o VIF. Novamente s olharemos para o modelo 5 (que foi escolhido como o melhor).

Testes para is i indica a mudana que ocorre na resposta mdia E(Y), por unidade de mudana (com incremento unitrio) na varivel independente Xi, quando as demais variveis so mantidas constantes. O parmetro 0 o intercepto do plano de regresso (coeficiente linear). 1 , 2 , .... 5 so coeficientes de regresso (coef angulares). Para testar se cada varivel explicativa, separadamente, significativa para o modelo, procedemos ao teste t.

www.alphaquant.com.br
[email protected]

Anlise: Teste t - teste dos coeficientes

1 o coeficiente da varivel nvel de escolaridade, e b1 o estimador de 1, expresso


em escala/anos de estudo. Teste t para 1 H0: 1 = 0 H1: 1 0

= 0,05
Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de Ou seja, conclumos que 1 0. significncia.

2 o coeficiente da varivel idade , e b2 o estimador de 2, expresso em


escala/anos. Teste t para 2 H0: 2 = 0 H1: 2 0

= 0,05
Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de Ou seja, conclumos que 2 0. significncia.

3 o coeficiente da varivel avanos , e b3 o estimador de 3.


Teste t para 3 H0: 3 = 0 H1: 3 0

= 0,05
Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de Ou seja, conclumos que 3 0.
www.alphaquant.com.br
[email protected]

significncia.

10

4 o coeficiente da varivel distncia , e b4 o estimador de 4, expresso em


escala/Km. Teste t para 4 H0: 4 = 0 H1: 4 0

= 0,05
Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de Ou seja, conclumos que 4 0. significncia.

5 o coeficiente da varivel salrio , e b5 o estimador de 5, expresso em


escala/no. de s.m.. Teste t para 5 H0: 5 = 0 H1: 5 0

= 0,05
Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de Ou seja, conclumos que 5 0. ...................... Intervalos de Confiana com 95% de confiana: O intervalo de confiana para 1 : [2,8 ; 3,2] O intervalo de confiana para 2 : [-0,7; -0,6] O intervalo de confiana para 3 : [0,38; 0,459] O intervalo de confiana para 4 : [-0,37 ; -0,22] O intervalo de confiana para 5 : [-0,23 ; -0,13] significncia.

www.alphaquant.com.br
[email protected]

11

VIFs Como os VIFs das cinco variveis independentes so menores do que 5, no existe o problema da multicolinearidade

Modelo Linear: = 43,43 + 3,04 (escolaridade) - 0,67 (idade) + 0,42 (avano) - 0,29 (distncia) - 0,18 (salrio) De acordo com o modelo selecionado, a cada ano a mais de escolaridade (X1), o grau de conhecimento do processador (Y) aumenta 3,04 unidades, mantendo as demais variveis constantes. A cada ano a mais de idade (X2), o grau de conhecimento do processador (Y) diminui 0,67 unidades, mantendo as demais variveis constantes. A cada incremento unitrio no avano (X3), o grau de conhecimento do processador (Y) aumenta 0,42 unidades, mantendo as demais variveis constantes. A cada quilmetro a mais de distncia (X4), o grau de conhecimento do processador (Y) diminui 0,29 unidades, mantendo as demais variveis constantes. A cada salrio mnimo ganho a mais (X5), o grau de conhecimento do processador (Y) diminui 0,18 unidades, mantendo as demais variveis constantes.

O coeficiente linear igual a 43,43. Ou seja, se todas as variveis independentes forem iguais a zero, o grau de conhecimento do processador igual a 43,43.

www.alphaquant.com.br
[email protected]

12

a Residual s Stati stics

Predicted Value St d. Predicted Value St andard Error of Predicted Value Adjusted Predict ed Value Residual St d. Residual St ud. Residual Delet ed Residual St ud. Deleted Residual Mahal. Distance Cook's Distance Centered Lev erage Value

Minimum 44,69 -2,439 ,21 45,24 -2,45 -2,110 -2,293 -2,89 -2,429 ,465 ,000 ,010

Maximum 93,24 2,031 ,58 93,08 2,34 2,019 2,118 2,58 2,219 10,145 ,158 ,225

Mean 71,17 ,000 ,41 71,18 -1,50E-14 ,000 -,002 -4,83E-03 -,006 4,891 ,024 ,109

St d. Dev iation 10,86 1,000 9,69E-02 10,86 1,09 ,943 1,007 1,25 1,032 2,597 ,037 ,058

N 46 46 46 46 46 46 46 46 46 46 46 46

a. Dependent Variable: Conhecimento

Olharemos para o Std. Residual para verificarmos se existem candidatos a outlier ou valor influente. Olharemos tambm para Cooks Distance para ver se existe valor influente. Caso o Maximun esteja maior de 1, a observao valor influente.

Anlise da tabela: O Std Residual est dentro do intervalo de 3 desvios, logo no existem candidatos a outlier e nem valor influente. A distncia de Cook mxima muito inferior a 1, o que refora a afirmativa acima, de que no existem valores influentes.

www.alphaquant.com.br
[email protected]

13

Charts
Normal P-P Plot of Regression Standardized Residual Dependent Variable: Conhecimento
1,00

,75

Expected Cum Prob

,50

,25

0,00 0,00 ,25 ,50 ,75 1,00

Observed C um Prob

Scatterplot Dependent Variable: Conhecimento


3

Regression Standardized Residual

-1

-2 -3 -3 -2 -1 0 1 2 3

Regression Standardized Predicted Value

As premissas bsicas so: 1. Linearidade 2. i ~ Normal Normalidade 3. E(i) = 0 4. 2(i) constante homocedasticidade 5. cov(i, j) = 0 independncia (autocorrelao dos erros igual a zero) Como podemos observar pelo P-P Plot, a premissa de normalidade no violada, assim como se olharmos o grfico dos resduos padronizados versus os valores preditos padronizados, podemos observar que as demais premissas so satisfeitas, pois os resduos se distribuem de maneira aleatria (sem formas definidas, sem padres).
www.alphaquant.com.br
[email protected]

14

O segundo passo ser rodar a regresso novamente realizando o mtodo Backward. Para isso, selecionaremos Method: Backward. Os demais passos esto descritos acima, no PASSO A PASSO.

O output do SPSS, para esta regresso linear mltipla, est apresentado a seguir.
O quadro Collinearity Diagnostic foi excludo.

www.alphaquant.com.br
[email protected]

15

Mtodo Forward Regression


Descriptive Statistics Mean 71,17 10,83 37,65 69,02 10,57 30,33 St d. Dev iation 10,92 2,23 9,95 11,72 5,05 7,94 N 46 46 46 46 46 46

Conheciment o Escolaridade Idade Av anos Dist ncia Salrio

Este quadro o mesmo apresentado pelo Forward


b Variabl es Entered/Removed

Model 1

Variables Entered Salrio, Idade, Dist ncia, Av anos, Escolarida a de

Variables Remov ed

Method

Enter

a. All requested v ariables entered. b. Dependent Variable: Conheciment o

Este quadro mostra que nenhuma varivel foi excluda do modelo, j que o Variables Removed est vazio. As cinco variveis independentes entraram no modelo.

ATENO!!! O modelo selecionado pelo mtodo Backward foi o mesmo selecionado pelo Forward. o modelo que possui as 5 variveis explicativas. Dessa forma a anlise do output ser a mesma apresentada para o mtodo Backward, uma vez que o modelo o mesmo. No necessariamente a soluo seria a mesma, pois a ordem de entrada (e sada) das variveis, no modelo, geram diferentes correlaes parciais, o que poderia resultar em diferentes modelos.

www.alphaquant.com.br
[email protected]

16

RESOLUO DAS QUESTES 2 A 6:

Para isso teremos que rodar uma nova regresso, na qual as variveis independentes sero: Escolaridade, Idade e Salrio.

1. Com o SPSS ainda aberto, no mesmo arquivo de dados, retornamos ao ANALYSE REGRESSION LINEAR 2. No quadro das variveis independentes, ficam apenas as variveis: Escolaridade, Idade e Salrio.

3. Deixa o mtodo Enter, pois est sendo pedido um modelo com essas 3 variveis. Se usarmos os mtodos Backward ou Forward, pode ser que alguma destas variveis no fiquem no modelo;

www.alphaquant.com.br
[email protected]

17

4. Selecione OK.
Obs.: as demais marcaes (STATISCITCS, PLOTS e SAVE) no se alteram. Caso voc tenha fechado o SPSS, ter que repetir aquelas telas de STATISTICS, PLOTS e SAVE, apresentadas nas pginas anteriores.

OUTPUT DA REGRESSO:
Resposta da

QUESTO 2

Item: Como voc avaliaria o modelo cujas variveis independentes so idade, escolaridade e salrio?

Regression
Descriptive Statistics Mean 71,17 10,83 37,65 30,33 St d. Dev iation 10,92 2,23 9,95 7,94 N 46 46 46 46

Conheciment o Escolaridade Idade Salrio

Anlise: Ao calcular o coeficiente de variao (CV) das quatro variveis, obtivemos os seguintes resultados: Varivel Conhecimento Escolaridade Idade Salrio CV 0,15 0,20 0,26 0,26

Como todas as variveis apresentam CV menores do que 50%, elas no possuem disperso alta. Com isso, no sugerimos nenhuma transformao nos dados.

www.alphaquant.com.br
[email protected]

18

b Variabl es Entered/Removed

Model 1

Variables Entered Salrio, Idade, a Escolaridade

Variables Remov ed .

Method Enter

a. All requested v ariables entered. b. Dependent Variable: Conhecimento

Anlise:
Model Summaryb Model 1 R ,906a R Square ,820 Adjusted R Square ,808 St d. Error of the Estimate 4,788

a. Predictors: (Constant), Salrio, Idade, Escolaridade b. Dependent Variable: Conhecimento

O modelo possui como variveis independentes: Salrio, Idade e Escolaridade. Anlise: 80,8% da variao total explicada pela relao entre as variveis independentes e Y (varivel dependente). O R ajustado o R que leva em considerao o nmero de variveis explicativas presentes no modelo. Std Error of the Estimate: o desvio padro do modelo igual a 4,79.

ANOVAb Model 1 Sum of Squares 4399,761 962,848 5362,609 df 3 42 45 Mean Square 1466,587 22,925 F 63,973 Sig. ,000a

Regression Residual Total

a. Predictors: (Const ant), Salrio, I dade, Escolaridade b. Dependent Variable: Conhecimento

www.alphaquant.com.br
[email protected]

19

Anlise: Teste F teste do modelo H0: 1 = 2 = 3 = 0 H1: algum diferente de zero

Nvel de significncia (alfa) = 0,05 Como Sig (0,000) menor do que alfa (0,05) rejeitamos H0 e conclumos que existe pelo menos um beta diferente de zero, logo, pelo menos uma varivel X possui relao linear significativa com Y.

a Coeffi ci ents

Model 1

(Constant) Escolaridade Idade Salrio

Unstandardized Coef f icients B St d. Error 52,760 4,554 4,236 ,383 -,642 ,077 -,109 ,107

St andardized Coef f icients Beta ,867 -,585 -,079

t 11,586 11,059 -8,315 -1,010

Sig. ,000 ,000 ,000 ,318

Zero-order ,716 -,401 ,437

Correlations Part ial ,863 -,789 -,154

Part ,723 -,544 -,066

Collinearity Statistics Tolerance VI F ,696 ,864 ,699 1,438 1,157 1,431

a. Dependent Variable: Conhecimento

Resposta da

QUESTO 2

Item: Interprete o modelo luz de seus coeficientes.

Modelo Linear: = 52,76 + 4,23 (escolaridade) - 0,64 (idade) - 0,10 (salrio) De acordo com o modelo selecionado, a cada ano a mais de escolaridade (X1), o grau de conhecimento do processador (Y) aumenta em 4,23 unidades, mantendo as demais variveis constantes. A cada ano a mais de idade (X2), o grau de conhecimento do processador (Y) diminui 0,64 unidades, mantendo as demais variveis constantes.

www.alphaquant.com.br
[email protected]

20

A cada salrio mnimo ganho a mais (X3), o grau de conhecimento do processador (Y) diminui 0,10 unidades, mantendo as demais variveis constantes.

O coeficiente linear igual a 52,76. (no possui sentido prtico neste exemplo) QUESTO 2

Resposta da

Item: Formule e teste a significncia de cada um dos coeficientes angulares e diga em que unidade cada um deles est expresso.

Teste t - teste dos coeficientes

1 o coeficiente da varivel nvel de escolaridade, e b1 o estimador de 1, expresso


em escala/anos de estudo.

Teste t para 1 H0: 1 = 0 H1: 1 0 Nvel de significncia () = 0,05 Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de significncia. Ou seja, conclumos que 1 0. Em outras palavras, existe relao linear entre o nvel de escolaridade (X1) e o grau de conhecimento (Y).

2 o coeficiente da varivel idade , e b2 o estimador de 2, expresso em


escala/anos.

Teste t para 2
www.alphaquant.com.br
[email protected]

21

H0: 2 = 0 H1: 2 0

= 0,05

Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de significncia. Ou seja, conclumos que 2 significativamente diferente de zero. Com isso, existe relao linear entre as variveis idade (X2) e grau de conhecimento (Y).

3 o coeficiente da varivel salrio , e b3 o estimador de 3, expresso em


escala/no. de salrios mnimos. Teste t para 3 H0: 3 = 0 H1: 3 0

= 0,05
Como Sig (0,318) MAIOR do que alfa (0,05), NO rejeitamos H0 ao nvel de 5% de significncia. Ou seja, conclumos que 3 NO significativamente diferente de zero, e com isso, NO existe relao linear entre X3 (salrio) e Y (grau de conhecimento). Essa varivel no significativa para o modelo, logo, ela deveria ser retirada.

Intervalos de Confiana com 95% de confiana: O intervalo de confiana para 1 : [3,4 ;5] O intervalo de confiana para 2 : [-0,79 ; -0,4] O intervalo de confiana para 3 : [-0,325 ; 0,108]

www.alphaquant.com.br
[email protected]

22

Como observamos, o Intervalo de Confiana de beta 3 (relacionado varivel Salrio) contempla o valor zero. E, se o zero est dentro do intervalo de confiana, o coeficiente no significativamente diferente de zero. Portanto, a varivel X3 deve ser retirada do modelo.

VaFs Como os VIFs das trs variveis independentes so menores do que 5, no existe o problema da multicolinearidade.

Resposta da

QUESTO 3

Calcule a correlao entre idade e grau de conhecimento, corrigida pelo expurgo das variveis escolaridade e salrio.

Coeficiente de Correlao Parcial (na tabela est no quadrinho Correlations Partial) O coeficiente de correlao parcial entre as variveis Idade (X2) e Grau de Conhecimento (Y), corrigido pelo expurgo das variveis Escolaridade (X1) e Salrio (X3), igual a -0,789. Esse coeficiente de correlao parcial alto (quase |0,8|) e mostra que a varivel Idade explica bastante do modelo.

O coeficiente de correlao parcial entre as variveis Escolaridade (X1) e Grau de Conhecimento (Y), corrigido pelo expurgo das variveis Idade (X2) e Salrio (X3), igual a 0,863. Esse coeficiente de correlao parcial tambm alto (maior do que 0,8) mostra que a varivel Escolaridade explica bastante do modelo. O coeficiente de correlao parcial entre as variveis Salrio (X3) e Grau de Conhecimento (Y), corrigido pelo expurgo das variveis Escolaridade (X1) e Idade (X2), igual a -0,154. Esse coef. de correlao parcial muito baixo (0,154 menor do que 0,5), mostrando que a varivel Salrio explica pouqussimo do modelo. Isso refora o que foi apresentado anteriormente: a varivel Salrio (X3) no significativa para o modelo e deveria ser retirada.

www.alphaquant.com.br
[email protected]

23

Resposta da

QUESTO 2

Item: H alguma evidncia de outlier neste modelo?


a Residual s Stati stics

Predicted Value St d. Predicted Value St andard Error of Predicted Value Adjusted Predict ed Value Residual St d. Residual St ud. Residual Delet ed Residual St ud. Deleted Residual Mahal. Distance Cook's Distance Centered Lev erage Value

Minimum 47,98 -2,345 ,735 47,98 -12,426 -2,595 -2,640 -12,859 -2,856 ,083 ,000 ,002

Maximum 91,01 2,006 2,282 90,62 11,984 2,503 2,557 12,504 2,749 9,241 ,114 ,205

Mean 71,17 ,000 1,359 71,16 ,000 ,000 ,001 ,011 -,003 2,935 ,017 ,065

St d. Dev iation 9,888 1,000 ,387 9,893 4,626 ,966 ,998 4,945 1,038 2,144 ,026 ,048

N 46 46 46 46 46 46 46 46 46 46 46 46

a. Dependent Variable: Conhecimento

Scatterplot Dependent Variable: Conhecimento


3 2
1, 00

N orm al P -P Plot of Regression Standardized R esidual D ependent Variable: Conhecim ento

1
, 75

-1

Expected Cum Prob

, 50

-2 -3 -3 -2 -1 0

, 25

0, 00 0, 00 , 25 , 50 , 75 1, 00

Regression Standardized Predicted Value

Observ ed C um Prob

Olharemos para o Std. Residual para verificarmos se existem candidatos a outlier ou valor influente. Olharemos tambm para Cooks Distance para ver se existe valor influente. Caso o Maximun esteja maior de 0,9, a observao valor influente.

Anlise:
www.alphaquant.com.br
[email protected]

24

O Std Residual (resduo padronizado) est dentro do intervalo de 3 desvios, logo no existem candidatos a outlier e nem valor influente. A distncia de Cook mxima (0,114) muito inferior a 1, o que refora a afirmativa acima, de que no existem valores influentes.

Resposta da

QUESTO 4 e QUESTO 5

Investigue a possvel violao das premissas do modelo linear. Qual a importncia da premissa de distribuio dos erros (normalidade).

As premissas bsicas so: 1. Linearidade 2. i ~ Normal Normalidade 3. E(i) = 0 4. 2(i) constante homocedasticidade = varincia constante dos erros 5. cov(i, j) = 0 independncia (autocorrelao dos erros igual a zero)

Como podemos observar pelo P-P Plot, a premissa de normalidade no violada, assim como se olharmos o grfico (Scatterplot) dos resduos padronizados X os valores preditos padronizados, podemos observar que as demais premissas so satisfeitas, pois os resduos se distribuem de maneira aleatria (sem formas definidas, sem padres).

Normalidade: Essa premissa fundamental, pois toda inferncia feita com base nas distribuies (t, F) que vm da Normal. Se a Normal for violada, os testes que sero feitos no iro servir pra nada. Se no tiver normalidade, no pode-se testar os parmetros, realizar o modelo.

www.alphaquant.com.br
[email protected]

25

Resposta da

QUESTO 6

Faa uma previso para o grau de conhecimento esperado de uma pessoa de 45 anos, com 15 anos de estudo e renda de 30 salrios mnimos.

Modelo Linear: = 52,76 + 4,23 (escolaridade) - 0,64 (idade) - 0,10 (salrio) = 52,76 + 4,23 (15) - 0,64 (45) - 0,10 (30) = = 84,41.

www.alphaquant.com.br
[email protected]

26

Base de dados
Gerente ID
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46

Conhecimento y
76 65 73 76 68 69 56 70 60 73 60 64 80 88 61 80 69 75 48 79 62 80 69 67 70 81 43 88 60 72 64 92 85 67 65 94 77 83 70 78 68 60 88 76 60 65

Escolaridade x1
12 10 15 11 10 8 7 11 12 11 10 8 14 13 9 12 11 13 6 10 10 15 10 10 9 11 7 11 7 11 9 12 12 10 11 15 14 13 8 11 11 12 13 14 8 11

Idade x2
33 51 59 33 35 23 34 43 43 33 53 26 56 22 43 33 39 41 43 25 43 46 37 43 23 26 44 14 37 32 45 31 36 45 48 33 54 40 33 24 36 44 23 42 37 48

Avanos x3
65 74 86 67 65 55 59 73 50 76 68 56 91 69 68 73 72 68 55 80 53 82 66 68 53 74 39 64 64 64 72 97 94 74 73 81 83 82 68 64 65 50 69 68 64 74

Distncia x4
11 6 15 15 19 16 12 11 17 16 15 12 4 6 9 12 13 11 16 13 5 21 8 1 4 9 8 1 15 14 10 3 6 9 10 2 9 13 5 5 19 17 7 11 15 10

Salrio x5
19 21 40 21 28 12 33 27 33 40 24 30 31 40 30 28 32 33 24 44 21 31 26 35 36 40 23 36 17 36 22 34 32 23 42 38 27 31 19 42 28 33 41 33 17 42

www.alphaquant.com.br
[email protected]

27

Você também pode gostar