Tema 2 - Apresentação de Dados

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 16

2.

APRESNTAÇÃO DE DADOS

Domingos Uchavo, Maputo 2017


1

1. Introdução
Para analisar um grande conjuntos de dados de uma variável, é necessário é necessário organizá-los ou
resumi-los em tabelas e gráficos para ter uma ideia sobre a forma de distribuição desses dados. A tabela
mais utilizada é a tabela de distribuição de frequências e os gráficos mais usados são o gráfico de
barras, o gráfico circular e o histograma.

A frequência de um valor ou dado é nº de vezes que o valor da variável ocorre ou aparece no conjunto
de dados. Calculam-se dois tipos de frequências:

Frequência absoluta  f i  de um valor ao nº de vezes que o valor ocorre ou aparece no conjunto de


dados.

Frequência relativa  f r  de um valor é a razão entre a frequência absoluta é o nº total dos dados;
 fi 
obtém-se dividindo a frequência:  f r  
 n 

Também como veremos é importante calcular as frequências acumuladas absolutas Fi  e relativas Fr 
que são somas das respectivas frequências simples.

2. Distribuição de frequências de dados

2.1 Distribuição de frequências de dados qualitativos

Exemplo 1:

O conselho directivo de uma escola pretende construir um campo de jogos. Antes de mandar construir o
campo, gostaria de ter uma ideia de quais modalidades de jogos são mais preferidos pelos alunos da
escola. Para tomar essa decisão, o conselho directivo encarregou um professor de educação física para
recolher a informação sobre as preferências dos alunos. Para a recolha de da informação o professor
utilizou a seguinte metodologia: Elaborou uma listas com as seguintes modalidades: Futebol (F),
Basquetebol (B), Andebol (A), Voleibol (V), Ténis (T) e percorreu todas as 10 turmas da escola, onde em
cada turma recolheu a opinião dos alunos cujo nº fosse múltiplo de 5. Em cada turma foram
seleccionados 5 alunos.

Os resultados obtidos foram os seguintes:

F, V, V, B, A, A, F, F, F, B, B, T, A, F, B, F, A, F, B, B, T, F, T, A, F, B, T,F, V, B, F, F, B, B, T, B, F, A, F,
B, B, T, V, F, B, T, F, B, T, F.

Elabora uma tabela de distribuição de frequências destes dados.

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
2

Resolução:

1º Identificação do tipo de variável

Trata-se de uma variável qualitativa nominal com 5 categorias: A, B, F, T, V.

2º Contagem das frequências em cada categoria usando uma tabela auxiliar:

Nº Modalidades Contagem f i
1 A //// / 6
2 B //// //// //// 15
3 F //// //// //// / 16
4 T //// /// 8
5 V //// 5
 50

3º Tabela de distribuição de frequências:

Nº Modalidades f i fr fr %
1 A 6 0,12 12%
2 B 15 0,30 30%
3 F 16 0,32 32%
4 T 8 0,16 16%
5 V 5 0,10 10%
 50 1,00 100%

fi
f ri  ; n   f i  f1  f 2  f 3  f 4  f 5  6  15  16  8  5  50
n
f 6 f 15
f r1  i   0,12; f r2  i   0,30;..... ....
n 50 n 50
f
f ri %  i  100  f r1  100
n
f r%1  0,12  100  12%; f r2%  0,30  100  30%;...... ...

Note-se que:

 f i n

 f r 1

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
3

Gráfico de barras:

fi

17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
Modalidades A B F T V

Gráfico circular:

V A
10% 12%

T
16%

B
30%

F
32%

Modalidades A B F T V

Obs: Estes gráficos foram construídos através do Excel

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
4

A partir da análise da tabela de distribuição de frequências responda às seguintes questões:

1. Qual é a modalidade mais preferida pelos alunos da escola?


2. Qual é a modalidade menos preferida pelos alunos da escola?
3. Tendo em conta que há escassez de recursos qual seria a decisão que o conselho da escola
deveria tomar.

Exemplo 2:

O comportamento dos alunos de uma turma foi classificado numa escala com as seguintes categorias:
Mau (M); Suficiente (S), Bom (B) e Excelente (E).

B S B B S B B E B M
S B B S B S B E S B
E B S B S B B B B S
B B B B M B E B S B

Faça a distribuição de frequências.

Resolução:

1º Identificação do tipo da variável:

Trata-se de uma variável qualitativa ordinal com 4 categorias: M, S, B, E.

2º Contagem das frequências em cada categoria usando uma tabela auxiliar:

Quando a variável é ordinal é importante colocar as categorias em ordem

Nº Classificação Contagem fi
1 M // 2
2 S //// //// 10
3 B //// //// //// //// //// 24
4 E //// 4
 40

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
5

3º Tabela de distribuição de frequências:

Quando os dados são ordinais, é importante também calcular as frequências acumuladas absolutas Fi 
e relativas Fr  .

As frequências acumuladas obtém-se pelas seguintes fórmulas recursivas:

F1  f1
Fi  Fi 1  f i
O mesmo raciocínio aplica-se para o cálculo de Fr .

Nº Classificação f i fr fr % Fi Fr Fr %
1 M 2 0,05 5% 2 0,05 5%
2 S 10 0,25 25% 12 0,30 30%
3 B 24 0,60 60% 36 0,90 90%
4 E 4 0,10 10% 40 1,00 100%
 40 1,00 100%

Leitura da tabela:

A distribuição dos alunos é os seguintes:

2 alunos tiveram comportamento mau o que corresponde a 5%, 10 alunos tiveram comportamento
suficiente o que corresponde a 25% , 14 alunos tiveram comportamento bom o que corresponde a 25%
e 4 alunos correspondentes a 10% tiveram um bom comportamento.

Pode-se dizer que a maioria dos alunos tiveram um bom comportamento.

Aproveitando o facto de a variável ser ordinal, pode-se concluir que, através das frequências
acumuladas que 30% tiver comportamento inferior a bom (mau e suficiente) e os restantes, 70% tiveram
comportamento superior a suficiente, o que indica que os alunos da turma em geral tiveram um
comportamento apreciável.

Trabalho:

Faça a representação dos dados da distribuição no gráfico de barras e no gráfico circular.

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
6

2.2 Distribuição de frequências de dados quantitativos


2.2.1 Dados não agrupados

Exemplo 3:

Perguntou-se o nº de irmãos a 20 alunos de uma turma da 10ª classe de uma escola secundária e
obteve-se os seguintes resultados:

2; 5; 1; 4; 0; 6; 1; 3; 6; 1; 5; 3; 4; 1; 3; 5; 0; 4; 2; 1.

Representa a distribuição numa tabela de frequências.

Para dados não agrupados a construção da tabela da distribuição de frequências é similar ao processo
de construção de uma tabela para dados qualitativos ordinais. O procedimento segue os passos
seguintes:

1º Localiza-se o mínimo valor e o máximo valor do conjunto de dados:

x min  0; x max  6

2º Faz a contagem das frequências de cada valor numa tabela auxiliar:

i xi Contagem fi
1 0 // 2
2 1 //// 5
3 2 // 2
4 3 /// 3
5 4 /// 3
6 5 /// 3
7 6 // 2
 20

3º Tabela de distribuição de frequências:

i xi fi fr fr % Fi Fr Fr %
1 0 2 0,10 10% 2 0,10 10%
2 1 5 0,25 25% 7 0,35 35%
3 2 2 0,10 10% 9 0,45 45%
4 3 3 0,15 15% 12 0,60 60%
5 4 3 0,15 15% 15 0,75 75%
6 5 3 0,15 15% 18 0,90 90%
7 6 2 0,10 10% 20 1,00 100%
 20 1,00 100%

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
7

Gráfico de barras:

fi

0
0 1 2 3 4 5 6

Ou

fr%
30%

25%

20%

15%

10%

5%

0%
0 1 2 3 4 5 6

Comentários sobre os resultados:

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
8

Analisando os dados conclui-se que o nº dos irmãos dos alunos da turma varia de zero a seis irmão,
sendo 2 alunos sem irmão e 2 com 6 irmãos. A maior parte dos alunos tem apenas um irmão (25%). 12
alunos (60%) tem menos de 4 irmão. Um quarto dos alunos (25%) tem mais de 4 irmãos, etc.

2.2.2 Dados agrupados

Quando temos uma grande quantidade de dados quantitativos é necessário reduzir o tamanho da tabela
de distribuição de frequências agrupando dos dados em intervalos de classes. Esse agrupamento tem a
vantagem de resumir a informação para tornar mais compreensível mas tem o inconveniente da perda
de informação pois, passa-se a trabalhar numa classe de dados e o tipo de dados passa para uma
escala ordinal que como sabemos tem poucas operações do que a escala numérica (intervalo ou rácio).

Exemplo:

O director de uma turma da 9ª classe recolheu os dados sobre o tempo (minutos) que cada aluno leva
de casa para a escola:

5; 21; 26; 13; 24; 29; 37; 12; 31; 5; 50; 18; 33; 14;23; 22; 17; 32; 7; 17; 42; 15;38; 20; 11; 26; 25; 29; 27;
8;24; 12; 39; 25; 28; 14; 42; 19; 22; 28;9; 18.

Agrupe os dados em intervalos de classes e construa uma tabela de distribuição de frequências.

Resolução:

1º Localiza-se o mínimo valor e o máximo valor do conjunto de dados:

x min  5; x max  50

2º Determinar a Amplitude Total do conjunto de dados  AT 

At  xmax  xmin  50  5  45

3º Determinação sobre o número de classes k 

Não existe uma regra rígida para o cálculo de número de classes, mas um número muito grande de
classes não permite visualizar a forma da distribuição de dados, em contrapartida, um número muito
pequeno permite a perda da informação sobre o conjunto de dados. Em geral aconselha-se que o nº de
classes esteja entre 5 a 20 classes.

As regras mais usadas na prática são as seguintes:

i. Para n  25  k  5
ii. Para n  25 calcula-se através de uma das seguintes fórmulas:
 k  n (1)
 k  1 3,3 log n  (2)

A fórmula (2) é conhecida por fórmula de Sturges.

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
9

O valor de k deve ser arredondado para o maior número inteiro mais próximo.

No caso do exemplo temos n  42 então temos,

k  42  6,48  7 classes.

iii. Determinar a amplitude da cada classe ai 


At
ai 
k

Também deve ser arredondado ao inteiro mais próximo.

No caso do exemplo temos:


50  5 45
ai    6,4  7
7 7
iv. Limite de inferior Li  e Limite superior Ls  da classe:
Os limites de classes devem ser definidos de modo que cada valor da distribuição de dados seja incluído
numa única classe.
O mínimo valor deve pertencer à 1ª classe e o máximo valor deve pertencer a ultima classe.
Sempre que possíveis as classes devem ter amplitudes iguais, mas há casos em que a 1ª e a última
classes tem intervalos abertos.

Nenhuma classe deve ter frequência nula.

No exemplo dado pode-se definir as seguintes classes:

i Li  Ls 
1 [5-12[
2 [12-19[
3 [19-26[
4 [26-33[
5 [33-40[
6 [40-47[
7 [47-54[

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
10

Representante da classe

O representante ou marca da classe de uma dada classe i x̂ i  é o ponto médio da classe que se
Li  Ls
calcula pela fórmula: xˆ i 
2

No caso do exemplo tem-se:

5  12 17
xˆ1    8,5
2 2
12  19 31
xˆ 2    15,5
2 2
----------------

i Li  Ls  x̂ i
1 [5-12[ 8,5
2 [12-19[ 15,5
3 [19-26[ 22,5
4 [26-33[ 29,5
5 [33-40[ 36,5
6 [40-47[ 43,5
7 [47-54[ 50,5

Os pontos médios das classes devem ser de cálculo fácil.

Tabela de distribuição de frequências do exemplo:

i Li  Ls  x̂ i Contagem fi
1 [5-12[ 8,5 //// / 6
2 [12-19[ 15,5 //// //// 10
3 [19-26[ 22,5 //// //// 10
4 [26-33[ 29,5 //// //// 9
5 [33-40[ 36,5 //// 4
6 [40-47[ 43,5 // 2
7 [47-54[ 50,5 / 1
 42

i Li  Ls  x̂ i fi fr fr % Fi Fr %
1 [5-12[ 8,5 6 0,14 14% 6 14%
2 [12-19[ 15,5 10 0,24 24% 16 38%
3 [19-26[ 22,5 10 0,24 24% 26 62%
4 [26-33[ 29,5 9 0,21 21% 35 83%
5 [33-40[ 36,5 4 0,10 10% 39 93%
6 [40-47[ 43,5 2 0,05 5% 41 98%
7 [47-54[ 50,5 1 0,02 2% 42 100%
 42 1,00 100%

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
11

Histograma e polígono de frequências:

fi

11
10
9
8
7
6
5
4
3
2
1
0

5 12 19 26 33 40 47 54

………… Polígono de frequências

Obs.:

 O histograma é um gráfico de barras com as barras juntas


 O polígono de frequências obtém-se unindo os pontos médios das classes.
 O histograma é o polígono de frequência dá-nos a forma da distribuição de dados. Neste caso deste
exemplo a distribuição é assimétrica positiva.

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
12

Gráfico de Ramos e Folhas

Um outro gráfico muito importante para a descrição de um conjunto de dados é o gráfico de ramos e
folhas (Stem and Leaf). O gráfico de ramos e folhas permite descrever os dados sem a perda dos dados
originais e é especialmente usado quando os dados são formados por dois ou mais algarismos. Vamos
apresentar um exemplo de dados com dois algarismos:

78; 59; 86; 94: 43; 56; 78; 84; 57; 89; 96; 68; 67; 65; 75; 73; 67; 87; 84; 45;

56; 94; 87; 56; 85; 76; 86; 79; 78; 77; 59; 76; 68; 49; 86; 87; 83; 94; 85; 96.

Num dia gráfico de ramos e folha cada número é separado em um ramo, na parte esquerda e uma folha
na parte direita. Por exemplo o número 78 é representado por 7|8, sendo 7 o ramo e 8 a folha.

O processo de construção é o seguinte:

1º Localizar o mínimo e o máximo: 43 e 96

2º Ramos e folhas

Como temos 2 dígitos, os ramos serão formados por algarismos das dezenas e as folhas por algarismos
das unidades. Para 78, o ramo será 7 e a folha 8.

Ramos Folhas
4 359
5 967669
6 87578
7 885369876
8 649747566735
9 446446

Ordenando os dados temos:

Ramos Folhas
4 359
5 666799
6 57788
7 356678889
8 344556667779
9 444466
Contando as frequências em cada ramos temos:

Ramos Folhas
(3) 4 359
(6) 5 666799
(5) 6 57788
(9) 7 356678889
(12) 8 344556667779
(5) 9 444466
Obs:

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
13

 Colocando as folhas na posição vertical, obtém-se o histograma da distribuição


 A partir do gráfico pode-se recuperar os dados originais o que não acontece com outros gráficos.

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
14

Exercícios:
1. Considera a pauta de frequência de uma turma com 16 alunos:

nº Sexo Nota freq. Resultado

1 F 10 Admitido

2 M 14 Dispensado

3 M 5 Excluído

4 F 12 Admitido

5 M 5 Excluído

6 M 6 Excluído

7 M 6 Excluído

8 M 10 Admitido

9 F 16 Dispensado

10 F 8 Excluído

11 M 12 Admitido

12 F 4 Excluído

13 M 10 Admitido

14 F 9 Excluído

15 F 7 Excluído

16 F 8 Excluído

a) Identifique as variáveis e o seus tipos.


b) Faça a tabela de distribuição de frequências das variáveis sexo e representa num gráfico
circular.
c) Faça a distribuição de frequência da variável resultado e representa num gráfico de barras.
d) Comente sobre a equidade do género na turma.
e) Faça comentários sobre o aproveitamento dos alunos.
f) Comparando o resultado dos alunos dos dois grupos (sexos) teve melhor aproveitamento

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017
15

2. Foram inqueridos 50 alunos de uma turma para avaliar a qualidade das aulas ministradas por um
professor de Geografia, usando a seguinte a escala: Excelente (E); Óptima (O); Boa (B); Medíocre
(M); Péssima (P). Os resultados do inquérito foram os seguintes:

B E O B M E O E O BE O M O E P M E B M E E E B E

OOMEB EOPOEEB EEEBMEOEEBOMB

a) Diga de que tipo de variável se trata e qual é a escala usada.


b) Faça a tabela de distribuição de frequências.
c) Que tipo de gráficos se pode usar para representar este tipo de dados.
d) Representa os dados no gráfico de barras.
e) O que se pode dizer sobre a qualidade das aulas ministradas pelo professor?

3. Os alunos de uma turma obtiveram as seguintes notas numa prova da Geografia:

16; 11; 11;14; 18; 15; 16; 2; 11, 16; 14; 15; 16; 20; 12, 16; 17; 11; 8; 6; 12; 13; 3; 6; 19; 11; 10; 7; 14; 7;
17; 16; 17; 15; 15; 13; 14; 15;11; 8; 16; 15; 14; 7.

a) Agrupe os dados em intervalos de classes e faça o resumo em uma tabela de distribuição de


frequências.
b) Construa o histograma.
c) Com base no histograma, comenta sobre a forma de distribuição das notas dos alunos.

4. Os seguintes dados referem-se as notas de frequência obtidas pelos alunos da 8ª classe durante o
1º trimestre de 2013.

13,0 12,0 12,0 11,0 9,5 12,0 12,0 13,0 13,0 6,0
14,0 12,0 13,0 11,0 13,0 13,0 11,0 14,0 13,0 11,0
13,0 11,0 13,0 11,0 14,0 12,0 14,0 9,5 12,0 8,5
11,0 14,0 14,0 14,0 14,0 13,0 12,0 12,0 13,0 12,0
13,0 12,0 10,0 12,0 7,0 9,5 12,0 12,0 13,0 13,0
6,0 14,0 12,0 13,0 12,0 15,0 15,0 11,0 7,0 7,0
11,0 13,0 7,5 14,0 11,0
a) Agrupe os dados em intervalos de classes e faça o resumo em uma tabela de distribuição de
frequências.
b) Indique o número de alunos em situação positiva e a respectiva percentagem.
c) Construa o histograma.
d) Com base no histograma, comenta sobre a forma de distribuição das notas dos alunos.

5. Os seguintes dados referem-se ao tempo (minutos) os estudantes de uma turma gastaram na


Internet na sua última sessão:
50; 40; 41; 17; 11; 22; 44; 28; 21; 19; 23; 37; 51; 54; 42; 86; 41; 78; 56; 72; 56; 17; 69;30; 80; 56; 29;
20; 18; 29; 34; 59; 73; 77; 36; 39; 30; 62; 54; 67; 39; 31; 53; 44.
a) Construa o gráfico de ramos e folhas para a distribuição.
b) Comente sobre a forma de distribuição dos dados.

Fim

_____________________________________________________________________________________________
Domingos Uchavo, Maputo, 2017

Você também pode gostar