Exercício 1
Exercício 1
Exercício 1
# recebendo a base
library(data.table)
base <- fread(input = paste0("mobile.csv"), header = T, na.strings = "NA", data.table =
FALSE, dec=".")
A - Ajuste um modelo de regressão linear múltipla utilizando somente as variáveis com efeito
significante no modelo e interprete os coeficientes das variáveis no modelo.
Residuals:
Min 1Q Median 3Q Max
-1099.65 -258.07 13.67 262.21 1076.63
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1181.00805 44.73282 26.401 < 2e-16 ***
battery_power -0.47532 0.01982 -23.978 < 2e-16 ***
dual_sim 35.69008 17.02544 2.096 0.036183 *
mobile_wt 0.83491 0.24081 3.467 0.000537 ***
price_range_CAT1 947.07401 24.14120 39.231 < 2e-16 ***
price_range_CAT2 1847.97625 24.14917 76.523 < 2e-16 ***
price_range_CAT3 2791.42917 24.63081 113.331 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 380.1 on 1993 degrees of freedom
Multiple R-squared: 0.8776, Adjusted R-squared: 0.8772
F-statistic: 2382 on 6 and 1993 DF, p-value: < 2.2e-16
dual-sim: o modelo mostra que o celular possuindo 2 chips, o desempenho sobe para
1216,69813 em relação a quando tem somente 1, que é ≃ 1181,01. Isso mostra uma
variação de 35,69008 caso o aparelho tenha dois chips
mobile-wt: o modelo mostra que a cada grama a mais no telefone, o desempenho sobe
o equivalente a 0.83491 na classificação de desempenho
price_range: o modelo mostra que a cada o preço que você paga no telefone influência
índice de desempenho em: 947,07401 caso seja um preço baixo, 1847,97625 caso
seja um preço médio e 2791,42917
B - Das variáveis independentes que você selecionou no item (a), indique qual a variável que
possui
relação mais forte com a variável dependente INDEX e mostre como você fez para tirar essa
conclusão
library(relaimpo)
imp<-calc.relimp(modelo_analisado)
var.exp<-data.frame(round(imp$lmg*100,1))
colnames(var.exp)<-"imp.lmg"
nome<-rownames(var.exp)
var.exp<-data.frame(nome,var.exp)
library(ggplot2)
ggplot(var.exp, aes(nome,imp.lmg)) +
geom_bar(stat = "identity")+
geom_text(aes(label = imp.lmg), vjust = 1.5, lwd=6, colour = "white")
plot(fitted(modelo_analisado),rstandard(modelo_analisado))
abline(0,0)
library(car)
qqPlot(modelo_analisado)
Conclusão da Análise do Item ‘C’:
A análise residual mostra que existe uma distribuição normal, e aproximadamente linear