Estatística Aplicada À Educação (Definitivo) PDF
Estatística Aplicada À Educação (Definitivo) PDF
Estatística Aplicada À Educação (Definitivo) PDF
1.3.1 – Amostra
É um subconjunto finito de uma população. A amostra é uma parte da
população, necessária quando se tratar de uma população com uma quantidade
muito grande de elementos. A amostra permite que se trabalhe com uma parte
dos elementos de uma população, quando existe dificuldade de fazer a pesquisa
com todos os elementos da população.
1.3.2 – Variáveis
São as características que podem se observadas (ou medidas) em cada
elemento da população, ou ainda, é um conjunto de resultados possíveis de um
fenômeno.
A variável pode ser:
a) Qualitativa: quando os valores são expressos por uma qualidade ou atributo.
Ex.: sexo, cor da pele, estado civil.
b) Quantitativa: quando os valores são expressos por números. Ex.: idade,
salários, notas da avaliação, etc.
A variável quantitativa pode ser contínua ou discreta:
Variável Contínua: assume inúmeros valores entre dois limites. Ex.: Peso
das malas num aeroporto.
Variável Discreta: assume apenas os valores de um conjunto enumerável.
Ex.: Número de alunos que freqüentam diariamente o campus da UFPA
de Cametá.
Exemplos:
1) 237,85001 → 237,9 2) 5,5256 → 5,53
Se após o algarismo 5 não seguir (em qualquer casa) um número diferente
de 0, ao algarismo que antecede o 5 será acrescentada uma unidade, se
for ímpar, e permanecerá como está, se for par.
Exemplos:
1) 246,35→ 246,4 2) 246,85 → 246,8 3) 12,1250 → 12,12
Observação:
Nos softwares de computadores (como o Excel) e calculadoras científicas,
porém, não é aplicado o critério indicado no item c. Nesses casos, se o primeiro
algarismo a ser abandonado for o algarismo 5, o arredondamento será feito com
o aumento de uma unidade ao algarismo que antecede o 5.
Exemplos:
1) 246,35→ 246,4 2) 246,85 → 246,9 3) 12,1250 → 12,13
Exercícios
Nos exercícios 1 ao 5, responda os itens i, ii e iii abaixo:
i) Estabeleça a variável em cada caso;
ii) Classifique as variáveis em qualitativas ou quantitativas;
iii) Diga quais das variáveis são contínuas e quais são discretas.
1) A cor dos olhos dos alunos da turma de Pedagogia – 2008 da UFPA- Cametá.
2) Os salários dos funcionários da UFPA-Cametá.
3) A quantidade de alimento, em gramas, ingerida por estudante em um
determinado colégio.
4) O sexo dos filhos de casais residentes em Mocajuba-Pa.
5) O número de pessoas da terceira idade, durante um ano, no turismo de
Fortaleza.
6) Escreva cada número com arredondamento para décimos.
a) 238,4575
b) 71,21
c) 4,8976
d) 0,03424
1.6 – Amostragem
Existem métodos ou técnicas adequadas para recolher amostras, de forma
a garantir (tanto quanto possível) o sucesso da pesquisa e dos resultados.
Devemos estabelecer um número mínimo de elementos para compor a
amostra. Essa quantidade não deve ser menor que 10% do total de elementos
da população. Por exemplo, numa população de 500 elementos, devemos, por
um critério de seleção, selecionar um mínimo de 50 elementos (10% de 500)
para compor a amostra.
Mas que método devemos utilizar para realizar a escolha?
Podemos recorrer a diferentes formas de amostragem: amostragem
aleatória simples, amostragem sistemática e amostragem estratificada
proporcional.
2 4 3 5 6 4 7 2 0 0 3 5 8 1 1 0 0 5
1 9 8 6 4 3 5 2 4 7 8 9 7 7 6 5 4 2
2 3 0 1 2 1 1 6 7 8 9 7 7 6 5 4 2
2 2 8 8 1 9 0 0 6 0 7 2 1 0 5 6 4 3
Classe População %
A 20 16,7
B 15 12,5
C 35 29,1
D 30 25,0
E 20 16,7
Total 120 100
6 10 9 14 7 4 13 11 5 7
8 10 12 5 9 13 11 14 9 10
9 11 8 6 7 14 10 8 7 13
11 6 12 11 15 13 9 4 9 8
12 11 4 10 7 13 9 8 10 5
10 9 8 12 13 7 8 6 15 11
4 6 7 8 9 9 10 11 12 13
4 6 7 8 9 10 10 11 12 14
4 6 7 8 9 10 10 11 13 14
5 6 7 8 9 10 11 11 13 14
5 7 8 8 9 10 11 12 13 15
5 7 8 9 9 10 11 12 13 15
exclusão do limite superior (significa que a partir da idade de seis anos exatos a
criança está excluída dessa classe).
Segundo a resolução 886/66 do IBGE, os intervalos de classe devem
empregar o símbolo de inclusão e exclusão ⊢ entre os valores extremos de um
intervalo.
𝑛 = 𝑓1 + 𝑓2 + 𝑓3 + ⋯ = 𝑓𝑖
𝑖=1
No exemplo:
6
𝑛= 𝑓𝑖 = 60
𝑖=1
A tabela pode ser reescrita de forma mais adequada ao conceito de
freqüência:
Exercício
Numa equipe de recreação juvenil, foram coletadas as alturas de 50
adolescentes, onde os dados brutos encontram-se na tabela abaixo:
𝑛= 𝑓𝑖 = 50
Considerando essa nova tabela de distribuição de freqüência, responda
aos próximos itens:
g) Qual o limite inferior da terceira classe?
h) Qual o limite superior da sexta classe?
i) Qual o limite inferior d sétima classe?
j) Qual o limite superior da segunda classe?
k) Qual a amplitude total da distribuição (∆𝑇)?
l) Foram obtidos valores diferentes para a amplitude amostral da distribuição
(𝐴𝐴) e amplitude total da distribuição (∆𝑇)? Explique por quê.
𝑓𝑖 = 𝑛
𝐹𝐾 = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝐾−1 + 𝑓𝐾 ⇔ 𝐹𝐾 = 𝑓𝑖
𝑖=1
Também na tabela mencionada anteriormente, consideramos a
freqüência da quarta classe 𝑓4 = 15 e número de observações 𝑛 = 60. Ao
calcular a freqüência acumulada da quarta classe, obtemos:
𝐹4 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 = 6 + 10 + 15 + 15 = 46 ⇔ 𝐹4 = 46
Isto significa que existem 46 crianças com idade abaixo de 12 anos no
acampamento (12 anos é o limite superior da quarta classe).
Exercício
Em um colégio 𝑋, foi feita uma pesquisa sobre o salário recebido pelos
seus funcionários, sendo consultados 130 funcionários e obtidos os resultados
na tabela a seguir:
Número de salários mínimos Trabalhadores (𝒇𝒊 )
1⊢3 18
3⊢5 24
5⊢7 21
7⊢9 19
9 ⊢ 11 15
11 ⊢ 13 14
13 ⊢ 15 11
15 ⊢ 17 5
17 ⊢ 19 3
= 130
Exercício
Uma empresa de pesquisa colheu a opinião de 1200 pessoas e elaborou
um relatório especificando a preferência sobre qual Estado brasileiro essas
pessoas gostariam de conhecer. Os valores constam na tabela a seguir:
Distribuição dos estados brasileiros que as pessoas gostariam de conhecer
Estados brasileiros Preferência de pessoas (freqüência)
Rio Grande do Sul 80
Minas Gerais 170
Rio de Janeiro 380
São Paulo 320
Bahia 190
Paraná 60
𝑛= 𝑓𝑖 = 1200
Inclua na tabela a seguir os cálculos da freqüência relativa (𝑓𝑟𝑖 ), da
freqüência acumulada (𝐹𝑖 ) e da freqüência acumulada relativa (𝐹𝑟𝑖 ).
Distribuição dos estados brasileiros que as pessoas gostariam de conhecer
I 𝑿𝒊 𝒇𝒊 𝒇𝒓𝒊 𝑭𝒊 𝑭𝒓𝒊
1 Rio Grande 80
do Sul
2 Minas Gerais 170
3 Rio de 380
Janeiro
4 São Paulo 320
5 Bahia 190
6 Paraná 60
𝑛= 𝑓𝑖 = 1,00
= 1200
15%
10%
5%
0%
1978 1980 1982 1983 1984
Pelo gráfico deduzimos que em 1978, ano em que o general Figueiredo foi
escolhido presidente, a taxa era de 29%, caindo para 5% em 1980. Em 1982,
quando foram realizadas eleições diretas para governador, o otimismo dos
brasileiros chegou a 18%, caindo para zero em 1983, quando o Brasil recorreu ao
FMI (Fundo Monetário Internacional). Nessa ocasião 40% dos entrevistados
consideravam que o ano seguinte seria melhor, e os outros 40 que seria pior. Em
1984, o último ano do regime militar instalado em 1964, a taxa de otimismo
volta a subir, atingindo 27%.
Além de revelar o fenômeno estatístico, o gráfico tem a função de facilitar
sua compreensão, por meio do efeito visual imediato que lhe é próprio. Essa
característica é uma vantagem que os gráficos têm sobre as tabelas, já que a
impressão que eles produzem é mais rápida e viva.
A Estatística pode recorrer a vários tipos de gráfico. Os principais são os
gráficos de linha ou de curva e os diagramas de área (que incluem os gráficos
1) Gráfico de Setores
A representação por setores consiste em dividir um círculo em partes (setores
circulares), com os ângulos de medida proporcional à porcentagem da variável
tabelada.
Exemplo:
ÁREA DAS REGIÕES DO BRASIL
22%
Centro-oeste
Sul
42%
7% Sudeste
Nordeste
11% Norte
18%
Fonte: IBGE
Exercício
Com o objetivo de traçar um perfil dos alunos freqüentadores da
biblioteca de certa universidade foram entrevistados 20 alunos, obtendo:
Tabela de Freqüência do Estado Civil
Estado Civil Freqüência Freqüência Porcentagem
absoluta Relativa %
Separado 1 1 5
= 0,05
20
Solteiro 12 12 60
= 0,6
20
Casado 6 6 30
= 0,3
20
Viúvo 1 1 5
= 0,05
20
Total 𝒏 = 𝟐𝟎 1 100
2) Gráfico de Barras
Para construir esse tipo de gráfico, basta estabelecer uma escala
conveniente para definir o tamanho da barra e usar a freqüência de cada
ocorrência da variável em estudo na representação.
Exemplo:
Número de alunos que freqüentam uma biblioteca A
Ano Número de alunos que usaram a
biblioteca
2000 1500
2001 2350
2002 3100
2003 3250
2004 3500
2005 4050
2006 4300
2007 4550
5000
4500
4000
3500
Número de alunos
3000
2500
2000
1500
1000
500
0
2000 2001 2002 2003 2004 2005 2006 2007
Anos
3) Histograma
Consiste em um conjunto de retângulos que apresentam:
i) As bases sobre um eixo horizontal (eixo dos X) com centro nos pontos médios
e as larguras iguais às amplitudes dos intervalos das classes;
ii) As áreas dos retângulos são proporcionais às freqüências das classes;
Se todos os intervalos tiverem a mesma amplitude, as alturas dos
retângulos serão proporcionais às freqüências das classes.
Exemplo: Suponhamos válida a tabela abaixo:
Tabela de freqüência do tempo de permanência do aluno na biblioteca, onde a
amplitude das classes considerada é 55
Tempo de Freqüência Freqüência Porcentagem
permanência Absoluta Relativa %
(em minutos)
30 ⊢ 65 8 8 40
= 0,4
20
65 ⊢ 100 6 6 30
= 0,3
20
100 ⊢ 135 1 1 5
= 0,05
20
135 ⊢ 170 5 5 25
= 0,25
20
Total 20 100
45%
40%
35%
30%
25%
20%
15%
10%
5%
0%
4) Gráfico de Linhas
Neste tipo de gráfico determinamos diversos pontos, que são, unindo-os
por segmentos de reta, construindo desta forma, uma curva poligonal. É
importante lembrar que esse tipo de gráfico representa a função entre as
variáveis envolvidas.
Exemplo:
Considere a tabela abaixo:
Dados do número de alunos que freqüentam a biblioteca por ano
Ano Número de alunos que usaram a
biblioteca
2000 1500
2001 2350
2002 3100
2003 3250
2004 3500
2005 4050
2006 4300
2007 4550
5000
4500
4000
Número de alunos
3500
3000
2500
2000
1500
1000
500
0
2000 2001 2002 2003 2004 2005 2007 2007
Anos
x i
x1 x2 .. xn
x i 1
n n
onde:
x - média aritmética simples;
𝑥𝑖 - valores da variável;
n - número de observações.
Exemplo:
Sejam os valores abaixo correspondente aos salários de 5 funcionários de
uma empresa. Calcular a média aritmética simples.
x p i i
x1 p1 x2 p2 ... xk pk x1 p1 x2 p2 ... xk pk
xp i 1
k
p1 p2 .. pk
p
n
i
i 1
onde:
x p - média aritmética ponderada;
x i - valores da variável;
pi - pesos dos valores da variável (nº de vezes que cada valor ocorre);
k
pi n - número de observações;
i 1
k - número de classes ou de valores individuais diferentes da variável.
Os pesos dos valores da variável correspondem ao número de vezes que
cada valor ocorre.
Exemplo:
Sejam os valores abaixo correspondentes aos salários de 10 funcionários
de uma empresa:
x1 800,00; x2 770,00; x3 790,00; x4 800,00; x5 760,00;
x6 750,00; x7 760,00; x8 780,00; x9 800,00; x10 770,00
(750,00 1) (760,00 2) (770,00 2) (780,00 1) (790,00 1) (800,00 3)
xp
1 2 2 11 3
x p 778,00
Exercício
Para ingressar em uma determinada Instituição de Ensino um candidato
deve fazer três provas, uma de matemática, uma de português e outra de
conhecimentos gerais e deve obter no mínimo média 6,0 para ser classificado,
disputando a vaga com os demais candidatos segundo a ordem de classificação.
O que podemos afirmar sobre um candidato que obteve as notas mostradas na
tabela a seguir?
Provas Pesos das Provas Notas do Candidato A
Matemática 7 8,0
Português 6 6,0
Conhecimentos Gerais 5 4,0
Onde:
− letra grega (pi) que indica o produto dos valores da variável.
Exemplo:
Calcular a média geométrica simples do conjunto 𝑥 = {1, 4, 16, 64}.
4
xg n x i 1
i n x1 x2 x3 x4
x g 4 1 4 16 64 8 xg 8
Ou
log 4096 3,612360
log x g log 4 4096 0,903090
4 4
x g anti log 0,903090 8
Exercício
Determine a média geométrica dos números 2, 4 e 8.
Exercício
A pontuação de um aluno em uma seqüência de prova foi: 8,4; 9,1; 7,2;
6,8; 8,7 e 7,8. Determine a média harmônica.
x 2
i
x12 x22 ... xn2
xq i 1
n n
onde:
x i - valores da variável;
𝑛 - número de observações.
Exemplo:
Calcular a média quadrática do conjunto:
𝑥 = {2, 3, 4, 5}
2 2 32 4 2 5 2
xq 3,67 xq 3,67
4
Exercício
O valor da hora-aula de 5 professores de um determinado colégio está
mostrado na tabela abaixo. Determine a média quadrática do valor da hora-aula.
Professores Valor da hora-aula (R$)
A 7,50
B 12,50
C 17,00
D 25,00
E 32,00
Exemplo:
Calcular a moda dos seguintes conjuntos de valores:
x = {4, 5, 5, 6, 6, 6, 7, 7, 8, 8} Mo = 6
y = {4, 4, 5, 5, 6, 6}
Amodal, pois seus três valores apareceram 2 vezes cada um.
z = {1, 2, 2, 2, 3, 3, 4, 5, 5, 5, 6, 6} Mo1 = 2 e Mo2 = 5, conjunto bimodal,
pois tanto o valor 2 como o valor 5 apresentaram o maior número de
ocorrências.
w = {1, 2, 3, 4, 5} Amodal
2) Para a série {2, 6, 7, 10, 12, 13, 18, 21} n = 8 A mediana será o termo de
ordem:
n 8 n 8
P1 4 P2 1 1 5
2 2 2 2
10 12
Me 11
2
Exercícios
1) O quadro abaixo apresenta os salários recebidos por funcionários de uma
empresa segundo o cargo que ocupam. Determine a mediana dos salários que a
empresa paga para seus funcionários.
Cargos Salários (R$)
Diretor 2.500,00
Chefe de Departamento 1.700,00
Agente Administrativo 800,00
Serviços Gerais 500,00
Segurança 450,00
Apoio Técnico 600,00
𝑛= 𝑓𝑖 = 45 𝑃𝑚 𝑖 .𝑓 𝑖 = 1575
𝑖=1 𝑖=1
5
𝑖=1 𝑃𝑚 𝑖 .𝑓 𝑖 1575
𝑥𝑝 = = ⟹ 𝑥𝑝 = 35.
𝑛 45
Propriedades da Média
1ª) A soma algébrica dos afastamentos (ou desvios, ou resíduos) de um conjunto
de números tomados em relação à média aritmética é zero. Simbolicamente:
n k
d i ( xi x ) 0 ou d i pi ( xi x ) pi 0
i 1 i 1
4ª) A soma dos quadrados dos desvios tomados em relação à média aritmética é
um mínimo.
Uso da Média:
É a mais utilizada dos valores médios, pela simplicidade e rapidez de seu
cálculo.
a) Quando se deseja obter um valor médio estável e significativo que inclui no
seu cálculo todos os valores;
b) É usada na determinação de índices de grande importância estatística;
c) Quando se deseja maior precisão na determinação de uma medida, realiza-se
várias induções e toma-se como resultado a média aritmética.
Exercício
A tabela a seguir contém informações da renda familiar mensal de um
grupo de estudantes. Determine a renda média desse grupo.
Renda familiar mensal Freqüência Relativa
(em salário mínimo) 𝑓𝑖
𝑓𝑟𝑖 =
𝑓𝑖
5 | 6,7 0,1
6,7 | 8,3 0,1
8,3 | 10 0,2
10 | 11,6 0,6
2ª) Séries que apresentam o mesmo número de elementos com a mesma soma
total têm a mesma média aritmética, enquanto séries que apresentam o mesmo
número de elementos com o mesmo produto têm a mesma média geométrica.
4ª) Quanto maior for a diferença entre os valores originais maior será a
diferença entre as médias aritmética e geométrica.
Exemplo:
1
p i
n
xh k k
i 1
k
1 1 pi
i 1 xi
pi x
i 1
pi
i 1 xi
i
k
p
i 1
i
onde:
𝑛 - número de observações;
x i - valores da variável;
pi - pesos dos valores da variável.
Exemplo:
Calcular a média harmônica dos dados constantes da tabela abaixo:
Classes pi xi 1 pi
xi xi
1 | 3 2 2 1/2 1,00
3 | 5 4 4 1/4 1,00
5 | 7 8 6 1/6 1,33
7 | 9 4 8 1/8 0,50
9 | 11 2 10 1/10 0,20
5 5 p
pi 20 i 4 ,03
i1 i1 x i
20
xh 4,96 xh 4,96
4,03
Exercício
A tabela a seguir mostra a distribuição, em toneladas, das cargas máximas
suportadas por certos cabos fabricados por uma companhia. Determine a média
harmônica.
Carga Máxima (toneladas) Número de cabos
9,3 ⊢ 9,7 2
9,8 ⊢ 10,2 5
10,3 ⊢ 10,7 12
10,8 ⊢ 11,2 17
11,3 ⊢ 11,7 14
11,8 ⊢ 12,2 6
12,3 ⊢ 12,7 3
12,8 ⊢ 13,2 1
𝑛 = 60
x 2
i pi
x12 . p1 x22 . p2 ... xk2 . pk
xq i 1
n n
onde:
x i - valores da variável;
pi - pesos dos valores da variável;
𝑛 - número de observações.
Exemplo:
Calcular a média quadrática dos valores da tabela abaixo:
Classes pi xi xi2 xi2 pi x i . pi
2 | 4 5 3 9 45 15
4 | 6 10 5 25 250 50
6 | 8 12 7 49 588 84
8 | 10 10 9 81 810 90
10 12 5 11 121 605 55
n = 42 2298 294
x 2
i pi
2298
xq i 1
7,40 xq 7,40
n 42
Exercício
A tabela a seguir contém a altura de 100 estudantes do sexo masculino de
uma determinada universidade. A partir das informações contidas na tabela
determine as médias aritmética, geométrica, harmônica e quadrática altura dos
estudantes.
Altura (cm) Número de Estudantes
1,51 ⊢ 1,58 5
1,59 ⊢ 1,66 18
1,67 ⊢ 1,74 42
1,75 ⊢ 1,82 27
1,83 ⊢ 1,90 8
Exemplo:
Número de Peças de Precisão Defeituosas devolvidas mensalmente pelo
Controle de Qualidade.
N° de Peças com N° de meses
Defeito 𝒑𝒊
𝒙𝒊
0 2
1 4
2 6
3 8
4 4
5 2
6 1
7
pi 27
i1
Tratando-se de uma tabela de freqüências com valores tabulados e
agrupados em classes, o procedimento não é imediato, sendo disponíveis alguns
métodos de cálculo distintos. Qualquer que seja o método adotado, o primeiro
passo para determinar a moda é localizar a classe que apresenta a maior
freqüência, comumente chamada de classe modal. Um dos métodos para o
cálculo da Moda é o Método de Czuber.
Método de Czuber
O método de Czuber, para o cálculo da moda elaborada, leva em
consideração não apenas as freqüências das classes adjacentes, mas também a
freqüência da classe modal. O ponto que corresponde à moda divide o intervalo
da classe modal em duas partes, as quais são proporcionais às diferenças entre a
freqüência da classe modal e as das respectivas classes adjacentes. Assim:
FMo Fant
Mo Li h
2 FMo ( Fant Fpost )
onde:
4.3.6. Mediana
Para o caso de uma distribuição, a ordem, a partir de qualquer um dos
extremos, é dada por:
𝑓𝑖
2
1 passo: Determina-se as freqüências acumuladas;
2 passo: Calcula-se a posição da mediana;
3 passo: Marca-se a classe correspondente à freqüência acumulada
imediatamente superior a posição calculada e, em seguida, emprega-se a
fórmula:
𝑓𝑖
− 𝐹𝑎𝑛𝑡
𝑀𝑒 = 𝑙𝑀𝑒 + 2 . ℎ𝑀𝑒
𝑓𝑀𝑒
onde:
𝑙𝑀𝑒 – é o limite inferior da classe mediana;
𝐹𝑎𝑛𝑡 - freqüência acumulada até a classe anterior à classe mediana;
𝑓𝑀𝑒 – freqüência simples da classe mediana;
ℎ𝑀𝑒 – amplitude do intervalo da classe mediana.
Exemplo:
i Estaturas Fi Fa
(cm)
1 150 | 154 4 4
2 154 | 158 9 13
Classe 3 11 24
158 | 162
mediana
4 162 | 166 8 32
5 166 | 170 5 37
6 170 | 174 3 40
𝑓𝑖 = 40
𝑓𝑖 40
= = 20 Classe mediana de ordem 3 (i = 3)
2 2
Uso da Mediana:
a) É usada em fenômenos educacionais quando se quer tornar objetiva a
avaliação de uma classe;
b) Quando se quer exatamente o valor que divide a metade da distribuição;
c) Quando a distribuição tem resultados discrepantes e pairam dúvidas sobre
sua validade e correção.
X Md Mo Mo Md X
X Md Mo
4.3.7.1. Quartis 𝑸𝑲
Nos quartis a série é dividida em quatro partes iguais. Os elementos
separatrizes da série são 𝑄1 , 𝑄2 e 𝑄3 .
𝑄1 : é o primeiro quartil, corresponde à separação dos primeiros 25% de
elementos da série;
𝑄2 : é o segundo quartil, coincide com a mediana 𝑄2 = 𝑀𝑑 ;
𝑄3 : é o terceiro quartil, corresponde à separação dos últimos 25% de elementos
da série.
Para o cálculo dos quartis utilizam-se técnicas semelhantes àquelas do
cálculo da mediana. Conseqüentemente, podemos utilizar as mesmas fórmulas
𝑓𝑖
do cálculo da mediana, levando em conta que onde houver a expressão será
2
𝐾 𝑖𝑓
substituída por , sendo 𝐾 o número da ordem do quartil, em que 𝐾 = 1
4
corresponde ao primeiro quartil. Se 𝐾 = 2, temos o segundo quartil e se 𝐾 = 3,
temos o terceiro quartil.
Determina-se, inicialmente, a classe que contém o valor quartil a ser
calculado. A identificação da classe é feita por meio do termo da ordem
calculada pela expressão.
𝐾 𝑓𝑖
𝐾 = 1,2,3
4
Esse termo está localizado numa classe que recebe o nome de classe
quartil. Assim, temos:
𝐾 𝑓𝑖
− 𝐹𝑎𝑛𝑡
𝑄𝐾 = 𝑙𝑄𝐾 + 4 . ℎ𝑄𝐾
𝑓𝑄𝐾
Sendo:
Exemplo:
Para o cálculo dos quartis de dados agrupados com intervalos de classe,
consideramos a distribuição dos pesos de um grupo de turistas que visita um
parque temático. Será acrescentada uma coluna com os valores da freqüência
acumulada.
Distribuição dos pesos de um grupo de turistas de um parque temático
i Pesos Freqüência Freqüência
(Kg) (𝒇𝒊 ) acumulada (𝑭𝒊 )
1 10 ⊢ 30 8 8
2 30 ⊢ 50 26 34
3 50 ⊢ 70 57 91
4 70 ⊢ 90 42 133
5 90 ⊢ 110 27 160
6 110 ⊢ 130 16 176
𝒇𝒊 = 176
3. 𝑓 𝑖 3×176
𝐾=3→ = = 132 (o terceiro quartil pertence à quarta classe)
4 4
Logo:
2. 𝑓 𝑖
−𝐹𝑎𝑛𝑡 132−91
4
𝑄3 = 𝑙𝑄3 + . ℎ𝑄3 = 70 + . 20 = 89,52 kg
𝑓𝑄 3 42
Portanto:
𝑄1 = 53,5 kg, 𝑄2 = 68,95 kg e 𝑄3 = 89,52 kg
4.3.7.2. Decis 𝑫𝑲
Nos decis, a série é dividida em 10 partes iguais 𝐷1 , 𝐷2 , … , 𝐷9 .
𝐷1 : é o primeiro decil, corresponde à separação dos primeiros 10% de elementos
da série;
𝐷5 : é o quinto decil, coincide com a mediana 𝐷5 = 𝑀𝑑 ;
𝐷9: é o nono decil, corresponde à separação dos últimos 10% de elementos da
série.
Determina-se a classe que contém o valor decil a ser calculado pela
expressão:
𝐾 𝑓𝑖
𝐾 = 1,2,3, … ,9
10
Esse termo está localizado numa classe que recebe o nome de classe decil.
Para o cálculo dos decis utilizamos técnicas semelhantes às do cálculo dos
quartis. E utilizamos a fórmula:
𝐾 𝑓𝑖
− 𝐹𝑎𝑛𝑡
𝐷𝐾 = 𝑙𝐷𝐾 + 10 . ℎ𝐷𝐾
𝑓𝐷𝐾
Sendo:
𝑙𝐷𝐾 = limite inferior da classe do decil considerado;
𝐹𝑎𝑛𝑡 = freqüência acumulada da classe anterior à classe do decil considerado;
ℎ𝐷𝐾 = amplitude do intervalo de classe do decil considerado;
𝑓𝐷𝐾 = freqüência simples da classe do decil considerado.
Exemplo:
O cálculo dos decis será exemplificado com os dados da próxima tabela,
que organiza as estaturas de adolescentes, colhidas durante o período em que
participaram de um acampamento, durante as férias.
Distribuição de estaturas de um acampamento infantil
i Estaturas Freqüência Freqüência
(cm) (𝒇𝒊 ) acumulada (𝑭𝒊 )
1 120 ⊢ 128 6 6
2 128 ⊢ 136 12 18
3 136 ⊢ 144 16 34
4 144 ⊢ 152 13 47
5 152 ⊢ 160 7 54
𝒇𝒊 = 54
1. 𝑓 𝑖
10
−𝐹𝑎𝑛𝑡 5,4−0
𝐷1 = 𝑙𝐷1 + . ℎ𝐷1 = 120 + . 8 = 127,5 cm
𝑓𝐷 1 6
2. 𝑓 𝑖 2×54
Segundo decil 𝐾 = 2 : = = 10,8 (o segundo decil pertence à
10 10
segunda classe).
2. 𝑓 𝑖
−𝐹𝑎𝑛𝑡 10,8−6
10
𝐷2 = 𝑙𝐷2 + . ℎ𝐷2 = 128 + . 8 = 131,2 cm
𝑓𝐷 2 12
Dessa forma, podemos calcular os outros decis. Por exemplo, o cálculo do
7. 𝑓 𝑖 7×54
sétimo decil 𝐾 = 7 : = = 37,8 (o sétimo decil pertence à quarta
10 10
classe).
2. 𝑓 𝑖
10
−𝐹𝑎𝑛𝑡 37,8−34
𝐷7 = 𝑙𝐷7 + . ℎ𝐷7 = 144 + . 8 = 146,3 cm
𝑓𝐷 7 13
4.3.7.2. Percentis 𝑫𝑲
Nos percentis, a série é dividida em 100 partes iguais
𝑃1 , 𝑃2 , 𝑃3 , … , 𝑃99 .
𝑃1 : é o primeiro percentil, corresponde à separação do primeiro 1% de
elementos da série.
𝑃50 : é o qüinquagésimo percentil, coincide com a mediana 𝑃50 = 𝑀𝑑 .
Para o cálculo dos percentis, utilizamos técnicas semelhantes às do cálculo
dos quartis e decis. Inicialmente, determina-se a classe que contém o valor a ser
calculado pela expressão:
𝐾 𝑓𝑖
𝐾 = 1,2,3, … ,99
100
Exemplo:
Na tabela do exemplo anterior, vamos calcular o 36º percentil.
36 𝑓𝑖 36×54
𝐾 = 36: = = 19,4 (o trigésimo sexto percentil pertence à terceira
100 100
classe).
36 𝑓 𝑖
100
−𝐹𝑎𝑛𝑡 19,4−18
𝑃36 = 𝑙𝑃36 + . ℎ𝑃36 = 136 + . 8 = 136,7 cm
𝑓𝑃 36 16
Exercício
Uma rede de hotéis tem um gasto salarial com seus funcionários de
acordo com a tabela abaixo.
Gasto salarial de uma rede de hotéis com seus funcionários
i Número de Número de Ponto médio
salários funcionários (𝒙𝒊 )
mínimos (𝒇𝒊 )
1 0⊢2 14 6
2 2⊢4 28 18
3 4 ⊢ 6 19 34
4 6⊢8 15 47
5 8 ⊢ 10 16 54
6 10 ⊢ 12 17
7 12 ⊢ 14 13
8 14 ⊢ 16 9
9 16 ⊢ 18 6
10 18 ⊢ 20 3
𝑓𝑖 =
Calcule:
a) Os quartis;
b) O 2º, 6º e o 9º decil;
c) O 18º, 29º, 58º, 72º e o 93º percentil.
5.1. Introdução
A interpretação de dados estatísticos exige que se realize um número
maior de estudos, ale das medidas de posição. O estudo das médias, medianas,
moda, quartis e percentis são válidos, mas não suficientes para estudos
comparativos ou conclusões qualitativas.
As medidas de dispersão ou de variabilidade servem para verificar a
representatividade das medidas de posição.
Das medidas de dispersão ou de variabilidade estudamos:
Amplitude total (já estudado na unidade II);
Variância e desvio-padrão;
Coeficiente de variação.
5.3. Desvio-Padrão (𝑺 ou 𝝈)
O desvio-padrão 𝑆 é a medida mais usada na comparação de diferenças
entre conjuntos de dados, por ter grande precisão. O desvio-padrão determina a
dispersão dos valores em relação à média.
O desvio-padrão é determinado pela fórmula:
𝑥 𝑖 −𝑥 2 𝑑 𝑖2
𝑆= = (desvio-padrão de uma população)
𝑛 𝑛
Da mesma forma que para a variância, caso o desvio-médio representar
uma descrição da amostra e não da população, o denominador passa a ser
(𝑛 − 1), logo:
𝑥 𝑖 −𝑥 2 𝑑 𝑖2
𝑆= = (desvio-padrão de uma amostra)
𝑛−1 𝑛−1
2
𝑥𝑖2 𝑥𝑖
∴𝑆= −
𝑛 𝑛
Propriedades do Desvio-Padrão
Somando ou subtraindo um mesmo valor de todos os valores de uma
variável, o devio-padrão não se altera;
Multiplicando (ou dividindo-se) todos os valores de uma variável por um
mesmo número (diferente de zero), o desvio-padrão fica multiplicado (ou
dividido) por esse número.
9 2 9 2 2
𝑖=1 𝑥𝑖 𝑖=1 𝑥𝑖 13.138 330
∴𝑆= − = −
9 9 9 9
= 1459,78 − 36,67 2 = 1459,78 − 1344,44 = 10,74
Exemplo:
Em um encontro de estudantes, foi feito um levantamento sobre o
número de dias de permanência para 37 hóspedes, os resultados estão
apresentados na tabela abaixo.
Para o cálculo do desvio-padrão aplicando a fórmula
𝑓 𝑖 𝑥 𝑖2 𝑓𝑖 𝑥 𝑖 2
𝑆= − é conveniente inserir na tabela as colunas
𝑛 𝑛
contendo os produtos 𝑓𝑖 𝑥𝑖 e 𝑓𝑖 𝑥𝑖2 .
Número de dias de permanência num hotel para 37 hóspedes
Número de dias de Número de 𝒇𝒊 𝒙𝒊 𝒇𝒊 𝒙𝟐𝒊
permanência (𝒙𝒊 ) hóspedes
𝒇𝒊
2 3 6 12
4 6 24 96
6 4 24 144
8 2 16 128
10 7 70 700
12 5 60 720
14 4 56 784
16 6 96 1.536
𝑓𝑖 = 37 𝑓𝑖 𝑥𝑖 = 352 𝑓𝑖 𝑥𝑖2 = 4.120
8 2 8 2 2
𝑖=1 𝑓𝑖 𝑥𝑖 𝑖=1 𝑓𝑖 𝑥𝑖 4120 352 2
∴𝑆= − = − = 111,35 − 9,51
37 37 37 37
= 4,57
Exemplo:
Foi feita uma pesquisa entre as hospedagens e hotéis de uma cidade
praiana em que procurou-se apurar os valores praticados na cobrança de uma
diária (com direito ao café da manhã).
Valores da diária com café da manhã em algumas hospedagens e hotéis de uma
cidade praiana
I Valor da Hospedagen Ponto 𝒇𝒊 𝒙𝒊 𝒇𝒊 𝒙𝟐𝒊
diária s ou hotéis médio
(em R$) (𝒇𝒊 ) 𝒙𝒊
1 30 ⊢ 50 4 40 160 6400
2 50 ⊢ 70 8 60 480 28.800
3 70 ⊢ 90 5 80 400 32.000
4 90 ⊢ 110 7 100 700 70.000
5 110 ⊢ 130 3 120 360 43.200
6 130 ⊢ 150 5 140 700 98.000
𝑓𝑖 = 32 𝑓𝑖 𝑥𝑖 278.400
= 2.800
6 2 6 2 2
𝑖=1 𝑓𝑖 𝑥𝑖 𝑖=1 𝑓𝑖 𝑥𝑖 278.400 2.800 2
𝑆= − = − = 8.700 − 87,50
𝑛 𝑛 32 32
= 32,31
∴ 𝑆 = 32,31
𝑥 = 𝑀𝑑 = 𝑀𝑜
68%
−𝑆 𝑥 +𝑆
Exemplo:
Um restaurante cobra o almoço de cada cliente mediante peso (por quilo)
da quantidade de alimento consumida. Foi observado, durante um mês, que as
quantidades de alimento consumidas são normalmente distribuídas. Se a média
consumida for 550g e o desvio-padrão 200g, calcule:
a) A amplitude do intervalo da zona de neutralidade;
b) A amplitude dos 95% centrais.
Solução:
a) Zona de normalidade : de 𝑥 − 𝑆 até 𝑥 + 𝑆 .
Sendo 𝑥 = 550ge 𝑆 = 200g, temos o intervalo:
𝑥 − 𝑆 = 550 − 200 = 350g
𝑥 + 𝑆 = 550 + 200 = 750g
A amplitude do intervalo da zona de normalidade é de 350g até 750g. Isso
significa que: 68% dos clientes do restaurante consomem entre 350g e 750g.
b) Amplitude dos 95% centrais: de 𝑥 − 2𝑆 até 𝑥 + 2𝑆 .
𝑥 − 2𝑆 = 550 − 2 × 200 = 550 − 400 = 150g
𝑥 + 2𝑆 = 550 + 2 × 200 = 500 + 400 = 900g
A amplitude dos 95% centrais é de 150g até 900g. Essa amplitude indica
que 95% dos clientes consomem entre 150g e 900g.
Exercícios
Distribuição de freqüência
i Classes 𝒇𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊 𝒇𝒊 𝒙𝟐𝒊 𝑭𝒊
1 30 ⊢ 56 1
2 56 ⊢ 82 3
3 82 ⊢ 108 4
4 108 ⊢ 134 3
5 134 ⊢ 160 5
6 160 ⊢ 186 2
𝑓𝑖 = 𝑓𝑖 𝑥𝑖 = 𝑓𝑖 𝑥𝑖2 =
REFERÊNCIAS BIBLIOGRÁFICAS
[3] NAZARETH, Helenalda. Curso Básico de Estatística. São Paulo: Ática, 1995.
[4] CRESPO, Antonio A. Estatística Fácil. 18ª edição. São Paulo: Saraiva, 2002.
[6] AZEVEDO, A.G. de; CAMPOS, P.H.B. de. Estatística Básica. 5ª edição. Rio de
Janeiro: LTC, 1987.