11a RepresentaçãodedadosMultidimensionais
11a RepresentaçãodedadosMultidimensionais
11a RepresentaçãodedadosMultidimensionais
30
Estupro
20
10 20 10
90
60 70 80 90
80
70
População
60 60
urbana (%)
50
30 40 50 60 40
30
350
300 200250 300 350
250
200 Assalto 200
150
100
50 100 150 200
50
15
10 15 Gráficos com
10
reticulados (g),
Homicídio
pontos (p) e linhas de
0 5
5
tendência (smooth).
0
Variáveis quantitativas
Ver
> co.intervals(UrbanPop,
number = 6, overlap = 0.5)
15
15
10
10
5
5
Murder
Murder
(31.9,51.6] (51.6,71.4]
(31.9,51.6] (51.6,71.4]
15
15
10 10
5 5
50 100 150 200 250 300 350 50 100 150 200 250 300 350
Assault Assault
Variáveis quantitativas
Inclusão do nome da variável Duas variáveis dependentes, sem
condicionante nos painéis variável condicionante
> xyplot(Murder ~ Assault | > xyplot(Murder + Rape ~UrbanPop,
cut(UrbanPop, 3), type = c("p", type = c("p", "smooth"), pch =20)
"smooth"), pch = 20,
strip.custom(strip.names =
TRUE, var.name = "UrbanPop"))
40
30
Murder + Rape
20
10
30 40 50 60 70 80 90
UrbanPop
População
urbana (%)
Assalto
As variáveis x1 e x4
x3 separam as
observações em
dois grupos.
Em um dos
grupos os valores x3
de x1 são os
menores e os
valores de x3 são
os maiores.
No outro grupo há x2
uma inversão.
As variáveis x2 e
x4 não permitem
uma separação
tão nítida quanto x1
x 1 e x3 . Min Max
Variáveis qualitativas
> tab3rel =
prop.table(tab3, margin
= 1)
> (tab3relp = tab3rel *
100)
Variáveis qualitativas
Gráfico de barras
> rownames(tab3relp) = paste(rep(levels(urbanity), each =
length(levels(province))), levels(province), sep = "\n")
> barplot(t(tab3relp), beside = TRUE, legend = levels(sex), density
= 15, ylab = "Percentagem")
> box()
female
male
80
Gráfico com as distribuições
condicionais de sex |
(urbanity, province).
60
Exercício. Apresentar os
Percentagem
rótulos e a legenda em
40
português.
20
0
La Union Pangasinan
(urbanity, province).
Função barchart (lattice).
urban
>
barchart(prop.table( tab3va
r, margin = c(1, 2)) * 100,
xlab ="Percentagem“, ylab =
"Localização") rural
Localização
diferente. Ilocos Norte Ilocos Sur
Exercícios.
1. Mudar as cores e adicionar urban
uma legenda.
2. Verificar o resultado da função
prop.table. rural
0 20 40 60 80 100
Percentagem
Variáveis qualitativas
empilhados. La Union
> urban
barchart(prop.table( tab3va
r, margin = c(1, 2)) * 100,
xlab = Percentagem", ylab rural
Localização
= "Localização", layout =
c(1, 4)) Ilocos Sur
urban
Exercício. Compare com o
gráfico do slide anterior. rural
Ilocos Norte
O que pode ser afirmado sobre a
associação entre as variáveis? urban
rural
0 20 40 60 80 100
Percentagem
Variáveis quantitativas e qualitativas
Dados Ilocos
> names(dados)
Gráfico de pontos
Duas variáveis condicionantes e acréscimo
Função stripplot (lattice) de ruído
> stripplot(log(income / > stripplot(log(income / 1000, 10) ~
1000, 10) ~ sex | province, sex | province + urbanity, xlab =
xlab = "Sexo do responsável", "Sexo do responsável", ylab = "Log
ylab = "Log renda domiciliar renda domiciliar (1000 pesos)",
(1000 pesos)") jitter.data = TRUE)
urban urban urban urban
La Union Pangasinan Ilocos Norte Ilocos Sur La Union Pangasinan
3.0 3.0
2.5 2.5
L o g re n d a d o m ic ilia r (1 0 0 0 p e s o s )
L o g re n d a d o m icilia r (1 0 0 0 p e so s)
2.0 2.0
1.5 1.5
1.0 1.0
2.5 2.5
2.0 2.0
1.5 1.5
1.0 1.0
female male female male female male female male female male female male
Sexo do responsável Sexo do responsável
Variáveis quantitativas e qualitativas
Gráfico de caixas
Função bwplot (lattice)
> bwplot(log(income / 1000, 10) ~ sex, xlab = "Sexo do
responsável", ylab = "Log renda domiciliar (1000
pesos)")
L o g re n d a d o m ic ilia r (1 0 0 0 p e s o s )
3.0
2.5
2.0
1.5
1.0
female male
Sexo do responsável
Variáveis quantitativas e qualitativas
2.5
2.0
2.5
Log renda domiciliar (1000 pesos)
1.0
2.0
rural rural rural rural
Ilocos Norte Ilocos Sur La Union Pangasinan
3.0
1.5 2.5
2.0
1.0
1.5
1.0
female male female male female male female male female male female male female male female male
Sexo do responsável Sexo do responsável
Variáveis quantitativas e qualitativas
30 0.0
La Union
20 1.0
0.5
Densidade
10
0.0
Ilocos Sur
Percentagem
0
Ilocos Norte Ilocos Sur 1.0
30
0.5
0.0
20 Ilocos Norte
1.0
10
0.5
0
0.0
1.0 1.5 2.0 2.5 3.0 1.0 1.5 2.0 2.5 3.0
Log renda domiciliar (1000 pesos)
Log renda domiciliar (1000 pesos)
Variáveis quantitativas e qualitativas
1.0
0.5 1.0
Densidade
0.0
Densidade
Ilocos Norte Ilocos Sur
0.5
1.0
0.5
0.0
0.0
0.5 1.0 1.5 2.0 2.5 3.0 0.5 1.0 1.5 2.0 2.5 3.0
Log renda domiciliar (1000 pesos) Log renda domiciliar (1000 pesos)
Variáveis quantitativas e qualitativas
ylab = "Densidade",
xlab = "Log renda
domiciliar (1000
pesos)", col = "white", 0.5
panel =
function(x, ...)
{ panel.histogram(x, 0.0
Density
...) Ilocos Norte Ilocos Sur
panel.mathdensity(dmath
= dnorm, col = "blue",
args = list(mean =
mean(x),sd = sd(x))) })
1.0
Exercícios.
0.5
1. Substituir a função
densidade normal pela
densidade estimada. 0.0
2.5
2.5
2.0
Log renda domiciliar (1000 pesos)
2.0
1.5
1.0
1.0
Ilocos Norte Ilocos Sur
3.0
Ilocos Norte Ilocos Sur
3.0
2.5
2.0 2.5
1.5 2.0
1.0
1.5
2 4 6 8 10 12
1.0
Tamanho da família
2.0
1.0
1.0
Ilocos Norte Ilocos Sur
3.0 rural rural rural rural
Ilocos Norte Ilocos Sur La Union Pangasinan
3.0
2.5
2.5
2.0
2.0
1.5
1.5
1.0
1.0
2 4 6 8 10 12
Tamanho da família 2 4 6 8 10 12 2 4 6 8 10 12
Tamanho da família
Variáveis quantitativas e qualitativas
Tamanho da
Tamanho da
família
família rural rural rural rural
Renda Ilocos Norte Ilocos Sur
Renda Ilocos Norte Ilocos Sur La Union Pangasinan
domiciliar
domiciliar
Tamanho da Tamanho da
família família
Min Max Min Max Min Max