SPSS Regressao Multipla
SPSS Regressao Multipla
SPSS Regressao Multipla
Um fabricante de produtos eletrnicos est interessado em saber que variveis esto associadas com o grau de conhecimento dos consumidores sobre um tipo de processador que a companhia lanou recentemente no mercado. Uma amostra de 46 clientes foi selecionada fornecendo dados sobre os gerentes de compras em relao s variveis:
Y = grau de conhecimento do processador (escala de 0 a 100) X1 X2 X3 X4 X5 = = = = = Nvel de escolaridade (anos de estudo) Idade (anos) grau de conhecimento sobre os recentes avanos na rea (escala de 0 a 100) distncia entre o escritrio e a loja mais prxima (Km) salrio mensal (nmero de salrios mnimos)
1. Encontre a melhor regresso utilizando o mtodo Forward e compare com a melhor regresso utilizando o mtodo Backward. A soluo encontrada foi a mesma? Deveria ser? 2. Como voc avaliaria o modelo cujas variveis independentes so idade, escolaridade e salrio? Interprete o modelo. Formule e teste a significncia de cada um dos coeficientes angulares. Alguma evidncia de outlier nesse modelo? 3. Considerando o modelo do item 2, calcule a correlao entre idade e grau de conhecimento do processador, corrigida pelo expurgo das variveis escolaridade e salrio. 4. Considerando o modelo do item 2, investigue a possvel violao das premissas do modelo linear. Qual a importncia da premissa de distribuio dos erros (normalidade)? 5. Analise os resduos e comente sobre alguma anomalia encontrada no modelo do item 2. 6. Faa uma previso para o grau de conhecimento esperado de uma pessoa de 45 anos, com 15 anos de estudo e renda de 30 salrios mnimos.
www.alphaquant.com.br
[email protected]
www.alphaquant.com.br
[email protected]
4 Selecionar a varivel dependente (Y) e as independentes (X) e tambm, o mtodo que ser utilizado (Enter, Forward ou Backward):
Aps isto, clicar em CONTINUE. OBS.: no caso da regresso linear simples (quando s existe uma varivel independente - X), o mtodo ser o Enter.
Se quiser os grficos de Y com todos os Xs, selecione Produce all partial plots Aps isto clicar em CONTINUE.
Aps isto clicar em CONTINUE. 8 Clicar em OK. O SPSS ir rodar a regresso linear mltipla.
www.alphaquant.com.br
[email protected]
QUESTO 1
Faremos primeiro o mtodo Forward. Para isso, selecionaremos Method: Forward. Os demais passos esto relacionados no PASSO A PASSO acima.
O output do SPSS, para esta regresso linear mltipla, est apresentado a seguir.
Aps cada quadro mencionada a utilidade dele. E, em itlico e azul, feita a anlise estatstica.
OBS.: No output, os quadros Excluded Variables e Collinearity Diagnostic foram excludos.
www.alphaquant.com.br
[email protected]
Descriptive Statistics Mean 71,17 10,83 37,65 69,02 10,57 30,33 St d. Dev iation 10,92 2,23 9,95 11,72 5,05 7,94 N 46 46 46 46 46 46
Devemos calcular o CV (coeficiente de variao). O CV calculado dividindo-se o desvio padro (Std. Deviation) pela mdia (Mean).
Anlise Como os coeficientes de variao de todas as variveis so menores do que 50%, considera-se que as variveis no possuem alta disperso. Por isso, no necessria nenhuma transformao nos dados.
a Variables Entered/Removed
Model 1 2 3 4 5
Variables Remov ed , , , , ,
Forward (C riterion: Forward (C riterion: Forward (C riterion: Forward (C riterion: Forward (C riterion:
Met hod Probabilit y -of -F-to-enter Probabilit y -of -F-to-enter Probabilit y -of -F-to-enter Probabilit y -of -F-to-enter Probabilit y -of -F-to-enter
Esse quadro apresenta a ordem de entrada das variveis no modelo. No faremos anlises estatsticas sobre ele.
www.alphaquant.com.br
[email protected]
Model Summaryf Adjusted R Square ,501 ,808 ,961 ,975 ,989 St d. Error of the Estimate 7,71 4,79 2,15 1,71 1,16
Model 1 2 3 4 5
a. Predictors: (Constant), Escolaridade b. Predictors: (Constant), Escolaridade, Idade c. Predictors: (Constant), Escolaridade, Idade, Av anos d. Predictors: (Constant), Escolaridade, Idade, Av anos, Dist ncia e. Predictors: (Constant), Escolaridade, Idade, Av anos, Dist ncia, Salrio f .Dependent Variable: Conhecimento
O modelo escolhido pelo mtodo Forward o ltimo (o quinto). Ento, analisaremos apenas as estatsticas dele. Podemos observar que, a cada entrada de uma nova varivel no modelo, o R ajustado e o Desvio Padro do modelo melhoravam. Ou seja, o R ajustado aumentava e o desvio padro da estimativa diminua o que muito bom.
No olhamos para o R, mas sim para o R ajustado, pois se trata de uma regresso mltipla. Para compararmos diversos modelos com diferentes nmeros de variveis independentes, usamos o R ajustado, e no o R. O R ajustado pondera o R2 de acordo com o nmero de variveis independentes no modelo, e o nmero de observaes.
Anlise: R ajustado: 98,9% da variao total explicada pela relao entre as variveis independentes e Y (varivel dependente), quando levados em considerao o nmero de variveis independentes no modelo. Essa estatstica sofre penalizao pela entrada de variveis no modelo..
www.alphaquant.com.br
[email protected]
ANOVAf Sum of Squares 2746,285 2616,324 5362,609 4376,383 986,226 5362,609 5168,536 194,073 5362,609 5242,282 120,326 5362,609 5308,707 53,901 5362,609
Model 1
df 1 44 45 2 43 45 3 42 45 4 41 45 5 40 45
Regression Residual Total Regression Residual Total Regression Residual Total Regression Residual Total Regression Residual Total
Mean Square 2746,285 59,462 2188,191 22,935 1722,845 4,621 1310,571 2,935 1061,741 1,348
F 46,186
Sig. ,000a
95,406
,000b
372,847
,000c
446,564
,000d
787,917
,000e
a. Predictors: (Const ant), Escolaridade b. Predictors: (Const ant), Escolaridade, Idade c. Predictors: (Const ant), Escolaridade, Idade, Av anos d. Predictors: (Const ant), Escolaridade, Idade, Av anos, Distncia e. Predictors: (Const ant), Escolaridade, Idade, Av anos, Distncia, Salrio f .Dependent Variable: Conhecimento
O SPSS apresenta o resultado das regresses realizadas at se chegar no melhor modelo. Como o melhor modelo o ltimo (o 5 apresentado por ele), faremos o teste F apenas desse modelo.
Anlise: Teste F teste do modelo H0: 1 = 2 = 3 = 4 = 5= 0 H1: algum diferente de zero Alpha = 5%
www.alphaquant.com.br
[email protected]
Como Sig (0,000) menor do que alfa (0,05) rejeitamos H0 e conclumos que pelo menos um beta diferente de zero, logo, existe relao linear entre Y e pelo menos um X.
a Coeffi cients
Model 1 2
(Constant) Escolaridade (Constant) Escolaridade Idade (Constant) Escolaridade Idade Av anos (Constant) Escolaridade Idade Av anos Dist ncia (Constant) Escolaridade Idade Av anos Dist ncia Salrio
Unstandardized Coef f icients B St d. Error 33,318 5,685 3,497 ,515 50,738 4,091 4,033 ,326 -,617 ,073 36,426 2,137 2,704 ,178 -,673 ,033 ,446 ,034 39,889 1,838 2,727 ,142 -,639 ,027 ,415 ,028 -,267 ,053 43,433 1,344 3,047 ,106 -,679 ,019 ,421 ,019 -,299 ,036 -,185 ,026
St andardi zed Coef f icien ts Beta ,716 ,825 -,562 ,553 -,613 ,479 ,558 -,582 ,446 -,124 ,624 -,618 ,452 -,138 -,135
t 5,861 6,796 12,402 12,377 -8,430 17,046 15,190 -20,317 13,093 21,704 19,211 -23,463 14,890 -5,013 32,322 28,627 -35,171 22,278 -8,224 -7,021
Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
95% Conf idence Interv al f or B Lower Bound Upper Bound 21,861 44,776 2,460 4,534 42,488 58,989 3,376 4,690 -,764 -,469 32,113 40,739 2,345 3,063 -,740 -,606 ,378 ,515 36,178 43,601 2,440 3,013 -,694 -,584 ,359 ,471 -,374 -,159 40,717 46,148 2,831 3,262 -,718 -,640 ,383 ,459 -,373 -,226 -,238 -,132
Zero-order ,716 ,716 -,401 ,716 -,401 ,672 ,716 -,401 ,672 -,367 ,716 -,401 ,672 -,367 ,437
Correlations Part ial ,716 ,884 -,789 ,920 -,953 ,896 ,949 -,965 ,919 -,616 ,976 -,984 ,962 -,793 -,743
Part ,716 ,809 -,551 ,446 -,596 ,384 ,449 -,549 ,348 -,117 ,454 -,558 ,353 -,130 -,111
Collinearity Statistics Tolerance VI F 1,000 ,962 ,962 ,649 ,946 ,643 ,649 ,888 ,611 ,901 ,530 ,813 ,610 ,886 ,684 1,000 1,040 1,040 1,540 1,057 1,555 1,542 1,126 1,637 1,110 1,888 1,230 1,641 1,128 1,462
Essa tabela apresenta os coeficientes angulares (os betas) das variveis. Apresenta os intervalos de confiana de cada coeficiente, a correlao parcial e o VIF. Novamente s olharemos para o modelo 5 (que foi escolhido como o melhor).
Testes para is i indica a mudana que ocorre na resposta mdia E(Y), por unidade de mudana (com incremento unitrio) na varivel independente Xi, quando as demais variveis so mantidas constantes. O parmetro 0 o intercepto do plano de regresso (coeficiente linear). 1 , 2 , .... 5 so coeficientes de regresso (coef angulares). Para testar se cada varivel explicativa, separadamente, significativa para o modelo, procedemos ao teste t.
www.alphaquant.com.br
[email protected]
= 0,05
Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de Ou seja, conclumos que 1 0. significncia.
= 0,05
Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de Ou seja, conclumos que 2 0. significncia.
= 0,05
Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de Ou seja, conclumos que 3 0.
www.alphaquant.com.br
[email protected]
significncia.
10
= 0,05
Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de Ou seja, conclumos que 4 0. significncia.
= 0,05
Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de Ou seja, conclumos que 5 0. ...................... Intervalos de Confiana com 95% de confiana: O intervalo de confiana para 1 : [2,8 ; 3,2] O intervalo de confiana para 2 : [-0,7; -0,6] O intervalo de confiana para 3 : [0,38; 0,459] O intervalo de confiana para 4 : [-0,37 ; -0,22] O intervalo de confiana para 5 : [-0,23 ; -0,13] significncia.
www.alphaquant.com.br
[email protected]
11
VIFs Como os VIFs das cinco variveis independentes so menores do que 5, no existe o problema da multicolinearidade
Modelo Linear: = 43,43 + 3,04 (escolaridade) - 0,67 (idade) + 0,42 (avano) - 0,29 (distncia) - 0,18 (salrio) De acordo com o modelo selecionado, a cada ano a mais de escolaridade (X1), o grau de conhecimento do processador (Y) aumenta 3,04 unidades, mantendo as demais variveis constantes. A cada ano a mais de idade (X2), o grau de conhecimento do processador (Y) diminui 0,67 unidades, mantendo as demais variveis constantes. A cada incremento unitrio no avano (X3), o grau de conhecimento do processador (Y) aumenta 0,42 unidades, mantendo as demais variveis constantes. A cada quilmetro a mais de distncia (X4), o grau de conhecimento do processador (Y) diminui 0,29 unidades, mantendo as demais variveis constantes. A cada salrio mnimo ganho a mais (X5), o grau de conhecimento do processador (Y) diminui 0,18 unidades, mantendo as demais variveis constantes.
O coeficiente linear igual a 43,43. Ou seja, se todas as variveis independentes forem iguais a zero, o grau de conhecimento do processador igual a 43,43.
www.alphaquant.com.br
[email protected]
12
Predicted Value St d. Predicted Value St andard Error of Predicted Value Adjusted Predict ed Value Residual St d. Residual St ud. Residual Delet ed Residual St ud. Deleted Residual Mahal. Distance Cook's Distance Centered Lev erage Value
Minimum 44,69 -2,439 ,21 45,24 -2,45 -2,110 -2,293 -2,89 -2,429 ,465 ,000 ,010
Maximum 93,24 2,031 ,58 93,08 2,34 2,019 2,118 2,58 2,219 10,145 ,158 ,225
Mean 71,17 ,000 ,41 71,18 -1,50E-14 ,000 -,002 -4,83E-03 -,006 4,891 ,024 ,109
St d. Dev iation 10,86 1,000 9,69E-02 10,86 1,09 ,943 1,007 1,25 1,032 2,597 ,037 ,058
N 46 46 46 46 46 46 46 46 46 46 46 46
Olharemos para o Std. Residual para verificarmos se existem candidatos a outlier ou valor influente. Olharemos tambm para Cooks Distance para ver se existe valor influente. Caso o Maximun esteja maior de 1, a observao valor influente.
Anlise da tabela: O Std Residual est dentro do intervalo de 3 desvios, logo no existem candidatos a outlier e nem valor influente. A distncia de Cook mxima muito inferior a 1, o que refora a afirmativa acima, de que no existem valores influentes.
www.alphaquant.com.br
[email protected]
13
Charts
Normal P-P Plot of Regression Standardized Residual Dependent Variable: Conhecimento
1,00
,75
,50
,25
Observed C um Prob
-1
-2 -3 -3 -2 -1 0 1 2 3
As premissas bsicas so: 1. Linearidade 2. i ~ Normal Normalidade 3. E(i) = 0 4. 2(i) constante homocedasticidade 5. cov(i, j) = 0 independncia (autocorrelao dos erros igual a zero) Como podemos observar pelo P-P Plot, a premissa de normalidade no violada, assim como se olharmos o grfico dos resduos padronizados versus os valores preditos padronizados, podemos observar que as demais premissas so satisfeitas, pois os resduos se distribuem de maneira aleatria (sem formas definidas, sem padres).
www.alphaquant.com.br
[email protected]
14
O segundo passo ser rodar a regresso novamente realizando o mtodo Backward. Para isso, selecionaremos Method: Backward. Os demais passos esto descritos acima, no PASSO A PASSO.
O output do SPSS, para esta regresso linear mltipla, est apresentado a seguir.
O quadro Collinearity Diagnostic foi excludo.
www.alphaquant.com.br
[email protected]
15
Model 1
Variables Remov ed
Method
Enter
Este quadro mostra que nenhuma varivel foi excluda do modelo, j que o Variables Removed est vazio. As cinco variveis independentes entraram no modelo.
ATENO!!! O modelo selecionado pelo mtodo Backward foi o mesmo selecionado pelo Forward. o modelo que possui as 5 variveis explicativas. Dessa forma a anlise do output ser a mesma apresentada para o mtodo Backward, uma vez que o modelo o mesmo. No necessariamente a soluo seria a mesma, pois a ordem de entrada (e sada) das variveis, no modelo, geram diferentes correlaes parciais, o que poderia resultar em diferentes modelos.
www.alphaquant.com.br
[email protected]
16
Para isso teremos que rodar uma nova regresso, na qual as variveis independentes sero: Escolaridade, Idade e Salrio.
1. Com o SPSS ainda aberto, no mesmo arquivo de dados, retornamos ao ANALYSE REGRESSION LINEAR 2. No quadro das variveis independentes, ficam apenas as variveis: Escolaridade, Idade e Salrio.
3. Deixa o mtodo Enter, pois est sendo pedido um modelo com essas 3 variveis. Se usarmos os mtodos Backward ou Forward, pode ser que alguma destas variveis no fiquem no modelo;
www.alphaquant.com.br
[email protected]
17
4. Selecione OK.
Obs.: as demais marcaes (STATISCITCS, PLOTS e SAVE) no se alteram. Caso voc tenha fechado o SPSS, ter que repetir aquelas telas de STATISTICS, PLOTS e SAVE, apresentadas nas pginas anteriores.
OUTPUT DA REGRESSO:
Resposta da
QUESTO 2
Item: Como voc avaliaria o modelo cujas variveis independentes so idade, escolaridade e salrio?
Regression
Descriptive Statistics Mean 71,17 10,83 37,65 30,33 St d. Dev iation 10,92 2,23 9,95 7,94 N 46 46 46 46
Anlise: Ao calcular o coeficiente de variao (CV) das quatro variveis, obtivemos os seguintes resultados: Varivel Conhecimento Escolaridade Idade Salrio CV 0,15 0,20 0,26 0,26
Como todas as variveis apresentam CV menores do que 50%, elas no possuem disperso alta. Com isso, no sugerimos nenhuma transformao nos dados.
www.alphaquant.com.br
[email protected]
18
b Variabl es Entered/Removed
Model 1
Variables Remov ed .
Method Enter
Anlise:
Model Summaryb Model 1 R ,906a R Square ,820 Adjusted R Square ,808 St d. Error of the Estimate 4,788
O modelo possui como variveis independentes: Salrio, Idade e Escolaridade. Anlise: 80,8% da variao total explicada pela relao entre as variveis independentes e Y (varivel dependente). O R ajustado o R que leva em considerao o nmero de variveis explicativas presentes no modelo. Std Error of the Estimate: o desvio padro do modelo igual a 4,79.
ANOVAb Model 1 Sum of Squares 4399,761 962,848 5362,609 df 3 42 45 Mean Square 1466,587 22,925 F 63,973 Sig. ,000a
www.alphaquant.com.br
[email protected]
19
Nvel de significncia (alfa) = 0,05 Como Sig (0,000) menor do que alfa (0,05) rejeitamos H0 e conclumos que existe pelo menos um beta diferente de zero, logo, pelo menos uma varivel X possui relao linear significativa com Y.
a Coeffi ci ents
Model 1
Unstandardized Coef f icients B St d. Error 52,760 4,554 4,236 ,383 -,642 ,077 -,109 ,107
Resposta da
QUESTO 2
Modelo Linear: = 52,76 + 4,23 (escolaridade) - 0,64 (idade) - 0,10 (salrio) De acordo com o modelo selecionado, a cada ano a mais de escolaridade (X1), o grau de conhecimento do processador (Y) aumenta em 4,23 unidades, mantendo as demais variveis constantes. A cada ano a mais de idade (X2), o grau de conhecimento do processador (Y) diminui 0,64 unidades, mantendo as demais variveis constantes.
www.alphaquant.com.br
[email protected]
20
A cada salrio mnimo ganho a mais (X3), o grau de conhecimento do processador (Y) diminui 0,10 unidades, mantendo as demais variveis constantes.
O coeficiente linear igual a 52,76. (no possui sentido prtico neste exemplo) QUESTO 2
Resposta da
Item: Formule e teste a significncia de cada um dos coeficientes angulares e diga em que unidade cada um deles est expresso.
Teste t para 1 H0: 1 = 0 H1: 1 0 Nvel de significncia () = 0,05 Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de significncia. Ou seja, conclumos que 1 0. Em outras palavras, existe relao linear entre o nvel de escolaridade (X1) e o grau de conhecimento (Y).
Teste t para 2
www.alphaquant.com.br
[email protected]
21
H0: 2 = 0 H1: 2 0
= 0,05
Como Sig (0,000) menor do que alfa, rejeitamos H0 ao nvel de 5% de significncia. Ou seja, conclumos que 2 significativamente diferente de zero. Com isso, existe relao linear entre as variveis idade (X2) e grau de conhecimento (Y).
= 0,05
Como Sig (0,318) MAIOR do que alfa (0,05), NO rejeitamos H0 ao nvel de 5% de significncia. Ou seja, conclumos que 3 NO significativamente diferente de zero, e com isso, NO existe relao linear entre X3 (salrio) e Y (grau de conhecimento). Essa varivel no significativa para o modelo, logo, ela deveria ser retirada.
Intervalos de Confiana com 95% de confiana: O intervalo de confiana para 1 : [3,4 ;5] O intervalo de confiana para 2 : [-0,79 ; -0,4] O intervalo de confiana para 3 : [-0,325 ; 0,108]
www.alphaquant.com.br
[email protected]
22
Como observamos, o Intervalo de Confiana de beta 3 (relacionado varivel Salrio) contempla o valor zero. E, se o zero est dentro do intervalo de confiana, o coeficiente no significativamente diferente de zero. Portanto, a varivel X3 deve ser retirada do modelo.
VaFs Como os VIFs das trs variveis independentes so menores do que 5, no existe o problema da multicolinearidade.
Resposta da
QUESTO 3
Calcule a correlao entre idade e grau de conhecimento, corrigida pelo expurgo das variveis escolaridade e salrio.
Coeficiente de Correlao Parcial (na tabela est no quadrinho Correlations Partial) O coeficiente de correlao parcial entre as variveis Idade (X2) e Grau de Conhecimento (Y), corrigido pelo expurgo das variveis Escolaridade (X1) e Salrio (X3), igual a -0,789. Esse coeficiente de correlao parcial alto (quase |0,8|) e mostra que a varivel Idade explica bastante do modelo.
O coeficiente de correlao parcial entre as variveis Escolaridade (X1) e Grau de Conhecimento (Y), corrigido pelo expurgo das variveis Idade (X2) e Salrio (X3), igual a 0,863. Esse coeficiente de correlao parcial tambm alto (maior do que 0,8) mostra que a varivel Escolaridade explica bastante do modelo. O coeficiente de correlao parcial entre as variveis Salrio (X3) e Grau de Conhecimento (Y), corrigido pelo expurgo das variveis Escolaridade (X1) e Idade (X2), igual a -0,154. Esse coef. de correlao parcial muito baixo (0,154 menor do que 0,5), mostrando que a varivel Salrio explica pouqussimo do modelo. Isso refora o que foi apresentado anteriormente: a varivel Salrio (X3) no significativa para o modelo e deveria ser retirada.
www.alphaquant.com.br
[email protected]
23
Resposta da
QUESTO 2
Predicted Value St d. Predicted Value St andard Error of Predicted Value Adjusted Predict ed Value Residual St d. Residual St ud. Residual Delet ed Residual St ud. Deleted Residual Mahal. Distance Cook's Distance Centered Lev erage Value
Minimum 47,98 -2,345 ,735 47,98 -12,426 -2,595 -2,640 -12,859 -2,856 ,083 ,000 ,002
Maximum 91,01 2,006 2,282 90,62 11,984 2,503 2,557 12,504 2,749 9,241 ,114 ,205
Mean 71,17 ,000 1,359 71,16 ,000 ,000 ,001 ,011 -,003 2,935 ,017 ,065
St d. Dev iation 9,888 1,000 ,387 9,893 4,626 ,966 ,998 4,945 1,038 2,144 ,026 ,048
N 46 46 46 46 46 46 46 46 46 46 46 46
1
, 75
-1
, 50
-2 -3 -3 -2 -1 0
, 25
0, 00 0, 00 , 25 , 50 , 75 1, 00
Observ ed C um Prob
Olharemos para o Std. Residual para verificarmos se existem candidatos a outlier ou valor influente. Olharemos tambm para Cooks Distance para ver se existe valor influente. Caso o Maximun esteja maior de 0,9, a observao valor influente.
Anlise:
www.alphaquant.com.br
[email protected]
24
O Std Residual (resduo padronizado) est dentro do intervalo de 3 desvios, logo no existem candidatos a outlier e nem valor influente. A distncia de Cook mxima (0,114) muito inferior a 1, o que refora a afirmativa acima, de que no existem valores influentes.
Resposta da
QUESTO 4 e QUESTO 5
Investigue a possvel violao das premissas do modelo linear. Qual a importncia da premissa de distribuio dos erros (normalidade).
As premissas bsicas so: 1. Linearidade 2. i ~ Normal Normalidade 3. E(i) = 0 4. 2(i) constante homocedasticidade = varincia constante dos erros 5. cov(i, j) = 0 independncia (autocorrelao dos erros igual a zero)
Como podemos observar pelo P-P Plot, a premissa de normalidade no violada, assim como se olharmos o grfico (Scatterplot) dos resduos padronizados X os valores preditos padronizados, podemos observar que as demais premissas so satisfeitas, pois os resduos se distribuem de maneira aleatria (sem formas definidas, sem padres).
Normalidade: Essa premissa fundamental, pois toda inferncia feita com base nas distribuies (t, F) que vm da Normal. Se a Normal for violada, os testes que sero feitos no iro servir pra nada. Se no tiver normalidade, no pode-se testar os parmetros, realizar o modelo.
www.alphaquant.com.br
[email protected]
25
Resposta da
QUESTO 6
Faa uma previso para o grau de conhecimento esperado de uma pessoa de 45 anos, com 15 anos de estudo e renda de 30 salrios mnimos.
Modelo Linear: = 52,76 + 4,23 (escolaridade) - 0,64 (idade) - 0,10 (salrio) = 52,76 + 4,23 (15) - 0,64 (45) - 0,10 (30) = = 84,41.
www.alphaquant.com.br
[email protected]
26
Base de dados
Gerente ID
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
Conhecimento y
76 65 73 76 68 69 56 70 60 73 60 64 80 88 61 80 69 75 48 79 62 80 69 67 70 81 43 88 60 72 64 92 85 67 65 94 77 83 70 78 68 60 88 76 60 65
Escolaridade x1
12 10 15 11 10 8 7 11 12 11 10 8 14 13 9 12 11 13 6 10 10 15 10 10 9 11 7 11 7 11 9 12 12 10 11 15 14 13 8 11 11 12 13 14 8 11
Idade x2
33 51 59 33 35 23 34 43 43 33 53 26 56 22 43 33 39 41 43 25 43 46 37 43 23 26 44 14 37 32 45 31 36 45 48 33 54 40 33 24 36 44 23 42 37 48
Avanos x3
65 74 86 67 65 55 59 73 50 76 68 56 91 69 68 73 72 68 55 80 53 82 66 68 53 74 39 64 64 64 72 97 94 74 73 81 83 82 68 64 65 50 69 68 64 74
Distncia x4
11 6 15 15 19 16 12 11 17 16 15 12 4 6 9 12 13 11 16 13 5 21 8 1 4 9 8 1 15 14 10 3 6 9 10 2 9 13 5 5 19 17 7 11 15 10
Salrio x5
19 21 40 21 28 12 33 27 33 40 24 30 31 40 30 28 32 33 24 44 21 31 26 35 36 40 23 36 17 36 22 34 32 23 42 38 27 31 19 42 28 33 41 33 17 42
www.alphaquant.com.br
[email protected]
27