Tema 2 - Apresentação de Dados
Tema 2 - Apresentação de Dados
Tema 2 - Apresentação de Dados
APRESNTAÇÃO DE DADOS
1. Introdução
Para analisar um grande conjuntos de dados de uma variável, é necessário é necessário organizá-los ou
resumi-los em tabelas e gráficos para ter uma ideia sobre a forma de distribuição desses dados. A tabela
mais utilizada é a tabela de distribuição de frequências e os gráficos mais usados são o gráfico de
barras, o gráfico circular e o histograma.
A frequência de um valor ou dado é nº de vezes que o valor da variável ocorre ou aparece no conjunto
de dados. Calculam-se dois tipos de frequências:
Frequência relativa f r de um valor é a razão entre a frequência absoluta é o nº total dos dados;
fi
obtém-se dividindo a frequência: f r
n
Também como veremos é importante calcular as frequências acumuladas absolutas Fi e relativas Fr
que são somas das respectivas frequências simples.
Exemplo 1:
O conselho directivo de uma escola pretende construir um campo de jogos. Antes de mandar construir o
campo, gostaria de ter uma ideia de quais modalidades de jogos são mais preferidos pelos alunos da
escola. Para tomar essa decisão, o conselho directivo encarregou um professor de educação física para
recolher a informação sobre as preferências dos alunos. Para a recolha de da informação o professor
utilizou a seguinte metodologia: Elaborou uma listas com as seguintes modalidades: Futebol (F),
Basquetebol (B), Andebol (A), Voleibol (V), Ténis (T) e percorreu todas as 10 turmas da escola, onde em
cada turma recolheu a opinião dos alunos cujo nº fosse múltiplo de 5. Em cada turma foram
seleccionados 5 alunos.
F, V, V, B, A, A, F, F, F, B, B, T, A, F, B, F, A, F, B, B, T, F, T, A, F, B, T,F, V, B, F, F, B, B, T, B, F, A, F,
B, B, T, V, F, B, T, F, B, T, F.
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
2
Resolução:
Nº Modalidades Contagem f i
1 A //// / 6
2 B //// //// //// 15
3 F //// //// //// / 16
4 T //// /// 8
5 V //// 5
50
Nº Modalidades f i fr fr %
1 A 6 0,12 12%
2 B 15 0,30 30%
3 F 16 0,32 32%
4 T 8 0,16 16%
5 V 5 0,10 10%
50 1,00 100%
fi
f ri ; n f i f1 f 2 f 3 f 4 f 5 6 15 16 8 5 50
n
f 6 f 15
f r1 i 0,12; f r2 i 0,30;..... ....
n 50 n 50
f
f ri % i 100 f r1 100
n
f r%1 0,12 100 12%; f r2% 0,30 100 30%;...... ...
Note-se que:
f i n
f r 1
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
3
Gráfico de barras:
fi
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
Modalidades A B F T V
Gráfico circular:
V A
10% 12%
T
16%
B
30%
F
32%
Modalidades A B F T V
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
4
Exemplo 2:
O comportamento dos alunos de uma turma foi classificado numa escala com as seguintes categorias:
Mau (M); Suficiente (S), Bom (B) e Excelente (E).
B S B B S B B E B M
S B B S B S B E S B
E B S B S B B B B S
B B B B M B E B S B
Resolução:
Nº Classificação Contagem fi
1 M // 2
2 S //// //// 10
3 B //// //// //// //// //// 24
4 E //// 4
40
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
5
Quando os dados são ordinais, é importante também calcular as frequências acumuladas absolutas Fi
e relativas Fr .
F1 f1
Fi Fi 1 f i
O mesmo raciocínio aplica-se para o cálculo de Fr .
Nº Classificação f i fr fr % Fi Fr Fr %
1 M 2 0,05 5% 2 0,05 5%
2 S 10 0,25 25% 12 0,30 30%
3 B 24 0,60 60% 36 0,90 90%
4 E 4 0,10 10% 40 1,00 100%
40 1,00 100%
Leitura da tabela:
2 alunos tiveram comportamento mau o que corresponde a 5%, 10 alunos tiveram comportamento
suficiente o que corresponde a 25% , 14 alunos tiveram comportamento bom o que corresponde a 25%
e 4 alunos correspondentes a 10% tiveram um bom comportamento.
Aproveitando o facto de a variável ser ordinal, pode-se concluir que, através das frequências
acumuladas que 30% tiver comportamento inferior a bom (mau e suficiente) e os restantes, 70% tiveram
comportamento superior a suficiente, o que indica que os alunos da turma em geral tiveram um
comportamento apreciável.
Trabalho:
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
6
Exemplo 3:
Perguntou-se o nº de irmãos a 20 alunos de uma turma da 10ª classe de uma escola secundária e
obteve-se os seguintes resultados:
2; 5; 1; 4; 0; 6; 1; 3; 6; 1; 5; 3; 4; 1; 3; 5; 0; 4; 2; 1.
Para dados não agrupados a construção da tabela da distribuição de frequências é similar ao processo
de construção de uma tabela para dados qualitativos ordinais. O procedimento segue os passos
seguintes:
x min 0; x max 6
i xi Contagem fi
1 0 // 2
2 1 //// 5
3 2 // 2
4 3 /// 3
5 4 /// 3
6 5 /// 3
7 6 // 2
20
i xi fi fr fr % Fi Fr Fr %
1 0 2 0,10 10% 2 0,10 10%
2 1 5 0,25 25% 7 0,35 35%
3 2 2 0,10 10% 9 0,45 45%
4 3 3 0,15 15% 12 0,60 60%
5 4 3 0,15 15% 15 0,75 75%
6 5 3 0,15 15% 18 0,90 90%
7 6 2 0,10 10% 20 1,00 100%
20 1,00 100%
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
7
Gráfico de barras:
fi
0
0 1 2 3 4 5 6
Ou
fr%
30%
25%
20%
15%
10%
5%
0%
0 1 2 3 4 5 6
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
8
Analisando os dados conclui-se que o nº dos irmãos dos alunos da turma varia de zero a seis irmão,
sendo 2 alunos sem irmão e 2 com 6 irmãos. A maior parte dos alunos tem apenas um irmão (25%). 12
alunos (60%) tem menos de 4 irmão. Um quarto dos alunos (25%) tem mais de 4 irmãos, etc.
Quando temos uma grande quantidade de dados quantitativos é necessário reduzir o tamanho da tabela
de distribuição de frequências agrupando dos dados em intervalos de classes. Esse agrupamento tem a
vantagem de resumir a informação para tornar mais compreensível mas tem o inconveniente da perda
de informação pois, passa-se a trabalhar numa classe de dados e o tipo de dados passa para uma
escala ordinal que como sabemos tem poucas operações do que a escala numérica (intervalo ou rácio).
Exemplo:
O director de uma turma da 9ª classe recolheu os dados sobre o tempo (minutos) que cada aluno leva
de casa para a escola:
5; 21; 26; 13; 24; 29; 37; 12; 31; 5; 50; 18; 33; 14;23; 22; 17; 32; 7; 17; 42; 15;38; 20; 11; 26; 25; 29; 27;
8;24; 12; 39; 25; 28; 14; 42; 19; 22; 28;9; 18.
Resolução:
x min 5; x max 50
At xmax xmin 50 5 45
Não existe uma regra rígida para o cálculo de número de classes, mas um número muito grande de
classes não permite visualizar a forma da distribuição de dados, em contrapartida, um número muito
pequeno permite a perda da informação sobre o conjunto de dados. Em geral aconselha-se que o nº de
classes esteja entre 5 a 20 classes.
i. Para n 25 k 5
ii. Para n 25 calcula-se através de uma das seguintes fórmulas:
k n (1)
k 1 3,3 log n (2)
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
9
O valor de k deve ser arredondado para o maior número inteiro mais próximo.
k 42 6,48 7 classes.
i Li Ls
1 [5-12[
2 [12-19[
3 [19-26[
4 [26-33[
5 [33-40[
6 [40-47[
7 [47-54[
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
10
Representante da classe
O representante ou marca da classe de uma dada classe i x̂ i é o ponto médio da classe que se
Li Ls
calcula pela fórmula: xˆ i
2
5 12 17
xˆ1 8,5
2 2
12 19 31
xˆ 2 15,5
2 2
----------------
i Li Ls x̂ i
1 [5-12[ 8,5
2 [12-19[ 15,5
3 [19-26[ 22,5
4 [26-33[ 29,5
5 [33-40[ 36,5
6 [40-47[ 43,5
7 [47-54[ 50,5
i Li Ls x̂ i Contagem fi
1 [5-12[ 8,5 //// / 6
2 [12-19[ 15,5 //// //// 10
3 [19-26[ 22,5 //// //// 10
4 [26-33[ 29,5 //// //// 9
5 [33-40[ 36,5 //// 4
6 [40-47[ 43,5 // 2
7 [47-54[ 50,5 / 1
42
i Li Ls x̂ i fi fr fr % Fi Fr %
1 [5-12[ 8,5 6 0,14 14% 6 14%
2 [12-19[ 15,5 10 0,24 24% 16 38%
3 [19-26[ 22,5 10 0,24 24% 26 62%
4 [26-33[ 29,5 9 0,21 21% 35 83%
5 [33-40[ 36,5 4 0,10 10% 39 93%
6 [40-47[ 43,5 2 0,05 5% 41 98%
7 [47-54[ 50,5 1 0,02 2% 42 100%
42 1,00 100%
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
11
fi
11
10
9
8
7
6
5
4
3
2
1
0
5 12 19 26 33 40 47 54
Obs.:
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
12
Um outro gráfico muito importante para a descrição de um conjunto de dados é o gráfico de ramos e
folhas (Stem and Leaf). O gráfico de ramos e folhas permite descrever os dados sem a perda dos dados
originais e é especialmente usado quando os dados são formados por dois ou mais algarismos. Vamos
apresentar um exemplo de dados com dois algarismos:
78; 59; 86; 94: 43; 56; 78; 84; 57; 89; 96; 68; 67; 65; 75; 73; 67; 87; 84; 45;
56; 94; 87; 56; 85; 76; 86; 79; 78; 77; 59; 76; 68; 49; 86; 87; 83; 94; 85; 96.
Num dia gráfico de ramos e folha cada número é separado em um ramo, na parte esquerda e uma folha
na parte direita. Por exemplo o número 78 é representado por 7|8, sendo 7 o ramo e 8 a folha.
2º Ramos e folhas
Como temos 2 dígitos, os ramos serão formados por algarismos das dezenas e as folhas por algarismos
das unidades. Para 78, o ramo será 7 e a folha 8.
Ramos Folhas
4 359
5 967669
6 87578
7 885369876
8 649747566735
9 446446
Ramos Folhas
4 359
5 666799
6 57788
7 356678889
8 344556667779
9 444466
Contando as frequências em cada ramos temos:
Ramos Folhas
(3) 4 359
(6) 5 666799
(5) 6 57788
(9) 7 356678889
(12) 8 344556667779
(5) 9 444466
Obs:
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
13
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
14
Exercícios:
1. Considera a pauta de frequência de uma turma com 16 alunos:
1 F 10 Admitido
2 M 14 Dispensado
3 M 5 Excluído
4 F 12 Admitido
5 M 5 Excluído
6 M 6 Excluído
7 M 6 Excluído
8 M 10 Admitido
9 F 16 Dispensado
10 F 8 Excluído
11 M 12 Admitido
12 F 4 Excluído
13 M 10 Admitido
14 F 9 Excluído
15 F 7 Excluído
16 F 8 Excluído
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
15
2. Foram inqueridos 50 alunos de uma turma para avaliar a qualidade das aulas ministradas por um
professor de Geografia, usando a seguinte a escala: Excelente (E); Óptima (O); Boa (B); Medíocre
(M); Péssima (P). Os resultados do inquérito foram os seguintes:
B E O B M E O E O BE O M O E P M E B M E E E B E
16; 11; 11;14; 18; 15; 16; 2; 11, 16; 14; 15; 16; 20; 12, 16; 17; 11; 8; 6; 12; 13; 3; 6; 19; 11; 10; 7; 14; 7;
17; 16; 17; 15; 15; 13; 14; 15;11; 8; 16; 15; 14; 7.
4. Os seguintes dados referem-se as notas de frequência obtidas pelos alunos da 8ª classe durante o
1º trimestre de 2013.
13,0 12,0 12,0 11,0 9,5 12,0 12,0 13,0 13,0 6,0
14,0 12,0 13,0 11,0 13,0 13,0 11,0 14,0 13,0 11,0
13,0 11,0 13,0 11,0 14,0 12,0 14,0 9,5 12,0 8,5
11,0 14,0 14,0 14,0 14,0 13,0 12,0 12,0 13,0 12,0
13,0 12,0 10,0 12,0 7,0 9,5 12,0 12,0 13,0 13,0
6,0 14,0 12,0 13,0 12,0 15,0 15,0 11,0 7,0 7,0
11,0 13,0 7,5 14,0 11,0
a) Agrupe os dados em intervalos de classes e faça o resumo em uma tabela de distribuição de
frequências.
b) Indique o número de alunos em situação positiva e a respectiva percentagem.
c) Construa o histograma.
d) Com base no histograma, comenta sobre a forma de distribuição das notas dos alunos.
Fim
_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017