Poligrafo Parte 1 2022
Poligrafo Parte 1 2022
Poligrafo Parte 1 2022
ESTATÍSTICA
E
PROBABILIDADE
Belo Jardim/PE
CAPÍTULO 1- INTRODUÇÃO
INTRODUÇÃO
A palavra estatística provém do latim status, que significa estado. A primeira utilização da
estatística envolvia compilações de dados e gráficos que descreviam vários aspectos de um estado ou
país. Tem-se notícia de que cerca de 2.000 a.C. os chineses recenseavam sua populações agrícolas.
Em 1662, John Graunt publicou informes estatísticos sobre nascimentos e mortes. O trabalho de Graunt
foi secundado por estudos de mortalidade e taxas de morbidade, tamanho de populações, rendas e
taxas de desemprego. As famílias, os governos e as empresas se apóiam largamente em dados
estatísticos. Assim é que as taxas de desemprego, de inflação, os índices do consumidor, as taxas de
natalidade e mortalidade são calculadas cuidadosamente a intervalos regulares, e seus resultados são
utilizados por empresários para tomarem decisões que afetam a futura contratação de empregados,
níveis de produção e expansão para novos mercados.
A coleta, o processamento, a interpretação e a apresentação de dados numéricos pertencem
todos ao domínio da estatística.
A ESTATÍSTICA é uma Ciência que fornece métodos para a coleta, organização, descrição,
análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.
Logo
ou
A – Variável qualitativa
Quando uma característica ou variável é não numérica. Aquelas que apresentam como possíveis
realizações uma qualidade (ou atributo) do indivíduo pesquisado. As variáveis qualitativas podem ser
classificadas como:
a) nominal, para a qual não existe nenhuma ordenação possível; e
b) ordinal, para a qual existe uma ordem nos seus resultados.
B – Variável quantitativa
POPULAÇÃO E AMOSTRA
À Estatística não interessa concluir a respeito de indivíduos isoladamente observados, mas sim
de grupos ou conjuntos, porque seu objetivo é o estudo da chamada população.
População consiste na totalidade de unidades de observação a partir das quais se deseja tomar
uma decisão. Também é chamada de universo.
Se a população é pequena, é razoável observar toda ela. Todavia, examinar a população inteira
nem sempre é viável. Por esse motivo, o estudo estatístico inicia-se com a coleta de parte de uma
população, denominada amostra, constituída de um número finito de unidades de observação e que
devem ter as mesmas características da população.
CENSO é uma coleção de dados relativos a todos os elementos de uma população.
No ambiente das ciências exatas, os dados quase sempre são uma amostra que foi selecionada
a partir de alguma população. Geralmente esses dados são coletados de uma das duas formas a seguir:
- experimento planejado – observa e registra dados onde são feitas variações propositais nas variáveis
controláveis de algum processo
Exemplo: Medir e registrar concentração de certo componente químico a partir de avriações na
temperatura de uma reação química.
ARREDONDAMENTO DE DADOS
1º) Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3 ou 4, fica inalterado o último algarismo a
permanecer.
Exemplos: a) 13,67 passa a 13,7 b) 2,99 passa a 3,0 c) 41,08 passa a 41,1
d) 2,352 passa a 2,4 e) 25,6501 passa a 25,7 f) 24,75 passa a 24,8
Observações
1) Não devemos fazer arredondamentos sucessivos.
Exemplo: 17,3452 passa a 17,3 e não a 17,35 e por fim a 17,4
Se tivermos necessidade de um novo arredondamento, fica recomendada a volta aos dados
originais.
EXERCÍCIOS
INTRODUÇÃO
Muitas vezes é impraticável para o pesquisador observar todos os elementos do grupo que
pretende estudar. É preciso, então, recorrer à pesquisa com uma parte desse todo.
Todos os elementos do grupo a ser estudado constituem a população (finita ou infinita). A parte
da população efetivamente examinada é a amostra.
Suponhamos uma pesquisa sobre o nível de escolaridade de um grupo de 800 pessoas. Nesse
caso, a população é o conjunto das 800 pessoas. Se sentirmos desnecessário ou impossível examinar
os 800 elementos, podemos recorrer à amostragem, ou seja, podemos examinar alguns desses
elementos.
É claro que se escolhermos apenas dois desses 800 elementos, corremos o risco de selecionar
exatamente dois elementos com as mesmas características. Se os dois forem analfabetos, por exemplo,
podemos concluir que todos os elementos da população também o são.
Observe que, qualquer que seja a amostra, sempre corremos o risco de chegar a conclusões
erradas, mas esse risco diminui a medida que aumenta a quantidade de elementos a serem examinados.
Os estudos que utilizam métodos estatísticos vão desde os que são bem concebidos e
executados, dando resultados confiáveis, aos que são concebidos deficientemente e mal executados,
levando a conclusões enganosas e sem qualquer valor real. Eis alguns pontos importantes para o
planejamento de um estudo eficaz de produzir resultados válidos:
1- Identificar com precisão a questão a ser respondida e definir com clareza a população de interesse.
2- (Tentar) Identificar os fatores importantes que afetam o problema em questão.
3- Propor um modelo para o problema
4- Estabelecer um plano adequado para coleta de dados. Esse plano deve descrever detalhadamente
a realização de um estudo observacional ou de um experimento, e deve ser elaborado
cuidadosamente, de modo que os dados coletados representem efetivamente a população em
questão.
5- Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros que podem
resultar de uma coleta tendenciosa de dados.
6- Analisar os dados e tirar conclusões. Identificar também possíveis fontes de erros. As diferenças
entre as amostras são chamadas de erro amostral, embora nenhum erro tenha ocorrido.
AMOSTRAGEM ALEATÓRIA
Para que nossas inferências sejam válidas, a amostra tem de ser representativa da população.
Amostras com observações que sejam convenientes ou exerçam julgamento na seleção podem
introduzir alguma tendência. Para evitar essas dificuldades é desejável selecionar uma amostra aleatória
como o resultado de algum mecanismo de chance.
Em uma amostra aleatória, os elementos da população são escolhidos de tal forma que cada
um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatória simples de n
elementos, de maneira que toda amostra de tamanho n possível tenha a mesma chance de ser
escolhida).
As amostras aleatórias podem ser escolhidas por diversos métodos, inclusive a utilização de
programas computacionais para gerar números aleatórios.
Este tipo de amostragem é equivalente a um sorteio lotérico.
Na prática, a amostragem aleatória simples pode ser realizada numerando-se a população de 1
a N e sorteando-se, a seguir por meio de um dispositivo aleatório qualquer, n números dessa sequência,
os quais corresponderão aos elementos pertencentes à amostra.
Exemplo 2.1: No caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um
para pertencer a uma amostra da produção diária. Neste caso estaríamos fixando o tamanho da amostra
em 10% da população. Esse método é simples e utilizado com frequência.
Exemplo 2.2: Deseja-se retirar uma amostra de n = 12 unidades de observação de uma população de
tamanho N = 874. O intervalo de seleção é, então, 874/10 = 72,8(aproxima-se para menos, senão se
ultrapassará a ordem da última unidade). Desse modo, vão-se contando as unidades de observação e
escolhem-se aquelas que estiverem, por exemplo, nas seguintes posições: 72, 114, 216, 288, 360, 432,
504, 576, 648, 720, 792 e 864.
3) AMOSTRAGEM ESTRATIFICADA PROPORCIONAL
Exemplo 2.3: Uma empresa cadastra seus funcionários através do grau de instrução. A tabela a seguir
apresenta essa situação.
Se desejarmos uma amostra com 84 pessoas, elas ficariam distribuídas conforme a última
coluna da tabela:
População Amostra
Grau de instrução
Número de pessoas* Número de pessoas
Ensino fundamental completo 187
Ensino médio incompleto 125
Ensino médio completo 69
Ensino superior incompleto 58
Ensino superior completo 42
Pós graduação 13
Total
*Dados fictícios
OBESRVAÇÃO
Os elementos escolhidos são aqueles julgados como típicos da população que se deseja estudar.
Por exemplo, num estudo sobre a produção científica dos departamentos de ensino de uma
universidade, um estudioso sobre o assunto pode escolher os departamentos que ele considera serem
aqueles que melhor representam a universidade em estudo.
EXERCÍCIOS
2) Numa escola da região, para estudar a preferência em relação a refrigerantes, sortearam-se 150
estudantes entre os 1000 matriculados. Responda:
a) Qual a população envolvida na pesquisa?
b) Que tipo de amostragem foi utilizado e qual é a amostra considerada?
3) Em uma certa cidade, quer-se estudar o interesse despertado por um programa de TV entre os alunos
de 7 anos de idade das escolas de ensino fundamental. Para isso, pretende-se levantar uma amostra
de 300 crianças. A partir dos dados abaixo, estratifique a amostra:
ESCOLA POPULAÇÃO
A 400
B 300
C 350
D 450
E 520
4) Em uma cidade com 30.000 habitantes deseja fazer-se uma pesquisa sobre a preferência por tipo de
lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem.
a) Qual a população envolvida na pesquisa?
b) Supondo que na cidade haja 5500 mulheres e 6000 homens, com 20 anos, determine uma amostra
com 1200 pessoas.
5) Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente 40, 100 e 60
indivíduos. Sabendo que, ao ser realizada uma amostragem estratificada proporcional, nove elementos
foram retirados do 3º estrato, determine o número total de elementos da amostra.
6) Em uma empresa existem 250 funcionários, sendo 35 na linha de produção A, 32 na linha de produção
B , 30 na linha de produção C, 28 na linha de produção D , 35 na linha de produção E, 32 na linha de
produção F, 31 na área administrativa e 27 na engenharia. Obtenha uma amostra de 40 funcionários.
8) Uma empresa que embala biscoitos realiza o controle de qualidade selecionando aleatoriamente 10
caixas da produção total diária e pesando os pacotes. Depois, eles abrem um pacote de cada caixa e
inspecionam o conteúdo.
A partir dessas informações, identifique se possível:
a) a população
b) as variáveis da população em questão
c) a(s) amostra(s)
d) o método amostral e dizer se foi aleatório ou não
e) qualquer fonte potencial de tendenciosidade que você pode detectar
INTRODUÇÃO
Os métodos gráficos tem encontrado um uso cada vez maior devido ao seu apelo visual.
Normalmente, é mais fácil para qualquer pessoa entender a mensagem de um gráfico do que aquela
embutida em tabelas ou sumários numéricos.
A representação gráfica de uma série de dados permite, ao mesmo tempo, uma visão geral e
alguma caracterização particular da população por meio de uma correspondência entre as categorias
ou valores e uma determinada figura geométrica, de tal modo que cada valor ou categoria é representado
por uma figura proporcional.
Os principais tipos de gráficos são diagramas, cartogramas e pictogramas.
GRÁFICO EM LINHA
Exemplo 3.1: A tabela a seguir apresenta a variação (%) do índice de preços ao consumidor amplo
Fonte: IBGE
25
concentração (g)
20
15
10
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
tempo (min)
25
20
15
%
10 HOMENS
MULHERES
5
0
1996 1997 1998 1999 2000 2001
Ano
35
30
25
concentração (g)
20
15
10
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
tempo(min)
Componente B Componente A
É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas)
ou horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos
respectivos dados. Um gráfico de colunas mostra as alterações dos dados em um intervalo de tempo ou
ilustra comparações entre categorias, as quais são organizadas de maneira horizontal e os valores de
maneira vertical para enfatizar a variação ao longo do tempo.
Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos
dados. Um gráfico de barras ilustra comparações entre categorias; estas são organizadas verticalmente,
enquanto os valores têm disposição horizontal, para enfatizar a comparação de valores e dar menos
ênfase ao tempo.
No gráfico de colunas e de barras, também é indiferente a ordem de apresentação dos
retângulos, por se tratar de uma série ordenada segundo uma característica qualitativa. Nesses casos,
não há, em geral, uma ordem única, técnica e logicamente admissível, podendo ocorrer diversas ordens,
correspondentes a diversos critérios.
Exemplo 3.5: A tabela a seguir apresenta dados relativos a uma pesquisa realizada em uma cidade da
região. A questão era “Como você fica sabendo das promoções da loja XX?”
Fonte Frequência* %
TV 68 44,3
Amigos 65 42,9
Internet 36 23,6
Jornal 31 20,7
Rádio 28 18,7
Parentes 23 14,9
Encartes de jornal 13 8,7
Outros 1 0,9
*Múltiplas respostas
Fonte: A autora
30%
25,7%
24,5%
25%
20%
15% 13,6%
11,7%
10,6%
10% 8,7%
4,9%
5%
0,4%
0%
TV Amigos Internet Jornal Rádio Parentes Encartes Outros
de jornal
Figura: Como você fica sabendo das promoções da loja XX? (Múltiplas respostas)
Fonte: A autora
Exemplo 3.8: O gráfico a seguir apresenta dados de uma pesquisa feita com uma amostra de
microempresários da região, onde lhes foi questionado sobre o que faltava às suas empresas para serem
mais competitivas.
Capacitação de
mão de obra
75%
Fonte: A autora
DIAGRAMA DE DISPERSÃO
O gráfico de dispersão apresenta duas variáveis numéricas. Então temos pontos (pares
ordenados) representando a relação entre essas variáveis.
Exemplo 3.9: Supõe-se que o conteúdo de hidrogênio seja um fator importante na porosidade de
fundições de liga de alumínio. A tabela a seguir apresenta os dados sobre conteúdo de hidrogênio e
porosidade numa determinada série de testes e o respectivo gráfico.
Conteúdo de
0,18 0,2 0,21 0,21 0,21 0,22 0,23 0,23 0,24 0,24 0,25 0,28 0,3 0,37
hidrogênio
Porosidade 0,46 0,7 0,41 0,45 0,55 0,44 0,24 0,47 0,22 0,8 0,88 0,7 0,72 0,75
1,00
0,80
Porosidade
0,60
0,40
0,20
0,00
0,00 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40
Conteúdo de hidrogênio
Quando observar um gráfico ou uma tabela, particularmente como parte de um anúncio, seja
cauteloso. Observe as escalas usadas nos eixos horizontal e vertical. Pode-se distorcer a verdade com
as técnicas estatísticas.
Exemplo 3.10
1300
1230
R$ 1100
980
900
Homens Mulheres
1400
1230
1200
980
1000
800
R$
600
400
200
0
Homens Mulheres
Exemplo 3.11
Os gráficos a seguir apresentam o grau de satisfação dos estudantes com o transporte coletivo
da cidade (dados fictícios).
Ótimo
28% Ruim
18%
Regular
14%
Bom
32%
50
40
32%
30 28%
%
20 18%
14%
10 8%
0
Péssimo Ruim Regular Bom Ótimo
CARTOGRAMA
PICTOGRAMA
O pictograma constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao
mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras.
Há situações em que não estamos interessados nos padrões de um grupo, mas em caracterizá-
lo como um todo. Podemos ter questões como: Qual o salário médio do trabalhador brasileiro? Qual o
tipo sanguíneo mais comum? Qual a nota que divide os alunos de uma turma em um grupo superior e o
outro inferior? Para responder a essas questões necessitamos de um grupo único, que represente todos
os valores obtidos pelo grupo. Este número possibilita a caracterização do grupo como um conjunto e
tende a se condensar no centro da série; desse fato deriva o termo "medida de tendência central". A
utilização de medidas de posição não substitui o uso de tabelas e de gráficos.
Veremos, então, três medidas de tendência central: a média, a mediana e a moda. Elas
constituem maneiras diversas de determinar um único número representativo de uma série, e, conforme
veremos, raramente coincidem.
1) MÉDIAS
MÉDIA ARITMÉTICA ( ou x )
n N
x i x i
x i 1
ou i 1
n N
ou mais simples como:
x
xi
x i
ou
n N
Quando desejamos saber a média dos dados determinamos a média aritmética simples.
Exemplo 4.1: Sabendo-se que o número de peças produzidas por sete máquinas diferentes, num certo
dia, foi 10, 17, 13, 15, 16, 18 e 12, temos, para produção média desse dia:
10 17 13 15 16 18 12 101
x 14,4
7 7
Logo:
x = 14,4 peças
A média aritmética de uma amostra pode não pertencer ao conjunto original de valores, nem
precisa ter significado real.
A fórmula anterior para calcular a média aritmética supõe que cada observação tenha a mesma
importância. Embora este seja o caso mais geral, há exceções.
A média aritmética ponderada é aquela resultante de um conjunto de valores, no qual alguns
valores têm importância (ou quantidade de ocorrências) maior que a dos outros.
Exemplo 4.2: O IBGE vai rever o cálculo do índice de inflação (INPC) para que retrate com mais
fidelidade o custo de vida... O setor de vestuário, com peso de 10% na formação do índice, deve ficar
com uma ponderação entre 5% e 6% .
Exemplo 4.3: Se o exame final, em um curso, tem peso 3 e as provas realizadas no semestre têm peso
1, e um aluno tem notas 85 no exame, 70 e 90 nas provas, sua média ( aritmética ponderada ) será:
x
x .w
i i
w i
Exemplo 4.4: Os salários médios mensais dos professores de ensino fundamental em três cidades são
R$ 1.450,00, R$ 1.620,00 e R$ 1.190. Havendo 720, 660 e 520 professores de ensino elementar nessas
cidades, seu salário médio será:
MÉDIA GEOMÉTRICA
A média geométrica de uma amostra é um número que, levando em conta o total dos elementos
dessa amostra, pode representar a todos, sem alterar o produto desses elementos. Assim sendo, a
média geométrica de uma amostra de tamanho n é igual à raiz de ordem n do produto dos n valores.
Desse modo, a média geométrica é calcula por:
Ao contrário da média aritmética, a média geométrica não é muito influenciada pelos valores
extremos de uma sequência numérica. Ainda, a média geométrica é definida apenas para números
positivos.
A média geométrica é usada para médias proporcionais de crescimento quando uma medida
subsequente depende de medidas prévias.
1ª ) As importações brasileiras durante o ano de 1998 foram as seguintes, em bilhões de dólares: janeiro,
4.577; fevereiro, 3.799; março, 5.038; abril, 4.799; maio, 4.913; junho, 4.844; julho, 5.329; agosto, 4.634;
setembro, 5.338; outubro, 5.039; novembro, 4.709 e dezembro, 4.538. Determine a média das
importações brasileiras em 1998.
2ª ) O crescimento do Brasil foi de 2,8% em 1996, 3,7% em 1997 e 0,5% em 1998. Determine a taxa
média de crescimento do Brasil nesses três anos.
Na primeira situação, bastaria calcular a média aritmética simples dos valores dos 12 meses.
Isso resultaria U$ 4.794,75 bilhões.
Na segunda situação devemos calcular a média geométrica desses três valores:
x G i x1 1 x2 2 ... xn
p p p pn
MÉDIA HARMÔNICA
Já vimos que a média aritmética não é adequada para todas as séries de dados. Não pode ser
empregada, por exemplo, para médias de crescimento (usamos a média geométrica) ou proporções de
velocidade. Digamos que um motorista dirija seu carro de uma cidade A para uma cidade B a uma
velocidade média de 60 quilômetros por hora. Na volta, ou seja, a viagem da cidade B para a cidade A
ele perfaz com uma velocidade média de 30 quilômetros por hora. Qual a velocidade média global? A
resposta não é 45 quilômetros por hora.
Vamos supor que a distância de A até B seja de 60 km (embora possa ser considerada qualquer
distância). Então:
60 km
- o tempo para deslocar-se de B até A 2 horas
30 km / h
60 km
- o tempo de A para B 1 hora
60 km / h
- se o tempo total foi 3 horas e a distância total, 120 km, temos que a velocidade média global é 40
km/h
2
A média acima é harmônica entre 30 e 60. Calculamos assim xH 40
1 1
30 60
A fórmula é a seguinte:
n
xH
1
x
i
Exemplo 4.6: Um investidor compra R$ 18.000 em ações de uma companhia a R$ 45,00 a ação. Num
segundo momento, compra R$ 18.000 a R$ 36,00 a ação e, por fim, numa terceira aplicação, compra
R$ 18.000 a R$ 30,00 a ação. Assim, descubra o preço médio por ação pago pelo investidor.
xH P i
ou x H p i
p1 p2 p p
x1 x2
... n
xn
x i
2) MEDIANA (Md)
A mediana é aquele valor que ocupa a posição central da listagem, estando a amostra com seus
valores ordenados e com todos os valores repetidos também incluídos, individualmente, na lista. A
mediana da amostra divide o conjunto total em duas partes iguais, com metade (50%) dos valores acima
da mediana da amostra e metade (50%) abaixo dela. A mediana da amostra pode não pertencer ao
conjunto original de valores.
Exemplo 4.7: Dada uma série de valores, como, por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9, de acordo
com a definição de mediana, o primeiro passo a ser dado é o de ordenação (crescente ou decrescente)
dos valores:
2 - 5 - 6 - 9 - 10 - 13 - 15 - 16 - 18
Em seguida tomamos aquele valor central que apresenta o mesmo número de elementos à
direita e à esquerda. Em nosso exemplo esse valor é o 10.
Logo, Md = 10
Exemplo 4.8: Se a lista de valores tiver número par de termos, a mediana será, por definição, qualquer
número compreendido entre os dois valores centrais da série. Convencionaremos utilizar o ponto médio.
Dada a lista:
Logo:
10 12 22
Md = 11
2 2
Md = 11
Então, se os dados da lista estão ordenados e n é o número de elementos dessa lista, o valor
mediano será:
n 1
- o termo de ordem , se n for ímpar
2
n n
- a média aritmética dos termos de ordem e 1 se n for par
2 2
OBSERVAÇÕES
Exemplo 4.9: Em 15 dias, um laboratório realiza 40, 52, 55, 38, 40, 48, 56, 56, 60, 37, 58, 63, 46, 50
e 61 testes químicos. Qual a mediana para o contexto do problema?
1) Não depende de todos os valores da série, podendo se manter inalterável com a modificação de
alguns deles.
2) Não é influenciada pelos valores extremos da distribuição; por isso é particularmente indicada
quando existem dados discrepantes.
3) Pode ser calculada quando os valores mais altos e mais baixos de uma série não podem ser
exatamente definidos.
3) MODA( Mo)
A denominação moda torna-se coerente na medida em que é (são) o(s) evento(s) que mais se
destaca(m), isto é, que ocorre(m) com maior frequência no fenômeno estudado. Examinemos alguns
exemplos do nosso cotidiano:
Exemplo 4.10: Quando queremos informações sobre o tipo de sangue mais comum, estamos
interessados na moda. Se um comerciante pretende abrir uma loja de calçados e quer saber quais os
números de sapatos femininos que deve encomendar em maior quantidade, a medida de tendência que
ele necessita para um bom planejamento administrativo é a moda. Numa eleição, o candidato que tem
o maior número de votos representa a moda. Evidentemente, o comerciante pode constatar que não há
um único número de sapato que predomine, mas que os mais comuns são 35, 36 e 37. Terá, assim,
uma distribuição multimodal, com três modas: 35, 36 e 37.
Cabe ressaltar que, apesar de ser a frequência que se destaca, a moda não representa
necessariamente a maioria no total de resultados.
Uma sequência de números pode não ter valor modal ( ou moda) ou apresentar vários tipos de
repetições, recebendo então várias denominações:
a) amodal, quando não tem distinção entre todas as frequências que aparecem;
b) unimodal , quando há apenas uma moda;
c) bimodal, quando há duas modas;
d) multimodal, quando há três ou mais modas.
a) 2, 7, 5, 4, 3, 1
b) 1, 3, 9, 2, 9, 5
Observação
Comparada com a média e com a mediana, a moda é a menos útil das medidas para problemas
estatísticos, porque não se presta à análise matemática, ao contrário do que ocorre com as outras duas
medidas. A utilidade da moda se acentua quando um ou dois valores, ou um grupo de valores, ocorrem
com muito maior freqüência que outros.
1) Inspecionam-se quinze rádios antes da remessa. Os números de defeitos por unidade são: 1, 0, 3,
4, 2, 1, 0, 3, 1, 2, 0, 1, 1, 0, 1. Determine o número médio, mediano e modal de defeitos.
2) Qual o número que devemos juntar a 5; 7; 8 e 2 de modo que sua média seja 6 ?
4) A nota de Estatística de uma turma seria calculada com a média aritmética de 4 testes. Dessa
maneira, Luciana obteria nota 7. O professor, no entanto, resolver anular um dos testes no qual ela
havia tirado 8. Qual vai ser a nota de Luciana?
5) Se o salário médio anual pago aos três profissionais de uma empresa é R$ 156.000,00, algum deles
pode receber um salário anual superior a R$ 500.000,00?
6) Em um posto de controle rodoviário, doze motoristas multados por excesso de velocidade estavam
dirigindo a 8 - 11 - 14 - 6 - 8 - 10 - 20 - 11 - 13 - 18 - 9 – 15 quilômetros por hora acima do limite
regulamentar de velocidade.
a) Em média, em quantos quilômetros por hora esses motoristas estavam excedendo o limite?
b) Se aquele motorista que excedia o limite em menos de 15 quilômetros por hora foi multado em
R$ 60,00 e os outros foram multados em R$ 88,00, determine a média das multas que esses
motoristas tiveram de pagar.
7) Durante um período de uma hora uma sorveteria recebeu 20 fregueses, e os valores das compras
em reais foram:
1,25 2,50 1,25 5,50 3,25 3,75 2,75 6,25 4,00 2,50
1,25 1,25 3,75 6,00 4,50 3,25 1,25 4,50 2,50 1,50
8) O número de carros vendidos por cada um dos 10 vendedores de uma revenda autorizada de
automóveis durante certo mês, é 10,10,4,7,2,12,10,12,15 e 14. Determinar:
a) a venda média;
b) a venda mediana;
c) a moda para esta distribuição.
10) Suponha que os preços de varejos de alguns itens selecionados tenham variado conforme a tabela
a seguir. Determinar a mudança percentual média nos preços de varejo.
13) As observações a seguir são relativas à resistência por cisalhamento (em MPa) de uma junta soldada
de uma determinada forma:
22,2 40,4 16,4 73,7 36,6 109,9 30,0 4,4 33,1 66,7 81,5
RESPOSTAS:
1) x = 1,33, Md = 1, Mo = 1
2) 8
3) 37,56
4) 6,7
5) Não
6) a) 11,92 b) 67
7) a) 3,14 b) 0,58
8) a) x = 9,6 b) Md = 10 c) Mo = 10
9) a) x = 2,77 b) Md = 1 c) Mo = 0
10) 6%
11) Sim. Sim.
12) Sim. Sim.
13) a) 46,8 b) 36,6 c) 44,5
SEPARATRIZES
A mediana é apenas um dentre os muitos quantis que dividem os dados em duas ou mais partes
tão aproximadamente iguais quanto possível. Entre eles, destacam-se os quartis, os decis e os
percentis, que dividem os dados em 4, 10 e 100 partes, respectivamente.
QUARTIS
30 15 26 17 25 12 18 19 34 22 14 33
Calculemos:
Q1 = Q2 = Q3 =
Tudo funcionou bem neste exemplo porque 12, o tamanho da amostra, é múltiplo de 4. Que
devemos fazer, entretanto, se isto não ocorrer? Suponha, por exemplo, que a cidade com a temperatura
de 17 deixasse de reportar o valor; ficaríamos com os 11 números abaixo, dispostos ordenadamente:
Calculemos:
Q1 = Q2 = Q3 =
PERCENTIS
É o problema de dividir esses dados em cem partes aproximadamente iguais, onde dizemos
“aproximadamente iguais” porque não há maneira de dividir em cem partes iguais um conjunto com
n=328, por exemplo. As medidas estatísticas criadas com esta finalidade são tradicionalmente
conhecidas como percentis, P1, P2 , ... P81, ... , P98 e P99.
MEDIDAS DE DISPERSÃO
DISPERSÃO OU VARIABILIDADE
Vimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado, por
meio de procedimentos matemáticos, em poucos valores representativos - média aritmética , mediana,
moda. Tais valores podem servir de comparação para dar a posição de qualquer elemento do conjunto.
Porém, não é o bastante dar uma das medidas de posição para caracterizar perfeitamente um conjunto
de valores.
Exemplo 4.13: Suponhamos que se deseja comparar o desempenho de dois funcionários, com base no
número de cadeiras sem defeitos produzidas durante uma semana:
Baseados nestes únicos resultados obtidos, diríamos que a produção de B é melhor do que de
A, já que B produz, em média, um maior número de cadeiras diariamente. No entanto se formos um
É evidente que um alto grau de homogeneidade costuma ser considerado como uma qualidade
desejável nesta situação.
Exemplo 4.14: Temos duas turmas A e B . Observe a tabela onde é mostrado o desempenho dos
alunos. Calcule a média de cada turma.
Turma A Turma B
4 1
6 0
5 10
3 9
4 2
7 8
6 5
= 35 = 35
Esses dois conjuntos possuem a mesma média. Pode-se dizer que estes conjuntos são iguais?
Não, porque embora ambos tenham a mesma média eles diferem na sua homogeneidade. Neste
exemplo, o conjunto B é mais heterogêneo ou mais disperso que o conjunto A. Portanto, não bastam
que conheçamos apenas a média de um conjunto, precisamos também, conhecer a dispersão do
conjunto.
Daí surgem as medidas de variabilidade ou medidas de dispersão. Estas medidas medem a
dispersão do conjunto, avaliando a heterogeneidade ou a homogeneidade do mesmo.
A dispersão mede quão próximos uns dos outros estão os valores de um grupo.
AMPLITUDE
A amplitude (ou intervalo total) de um conjunto de dados é igual à diferença entre o maior e o
menor valor.
Exemplo 4.15: Em um hospital, onde se mede a pulsação de cada paciente três vezes por dia, o
paciente A acusou as taxas de 72, 76 e 74, e o paciente B acusou 72, 91 e 59. A taxa média de ambos
é a mesma, 74; observe, entretanto, a diferença na variabilidade. Enquanto a pulsação de A é estável,
a de B apresenta grande flutuação.
A vantagem de usar a amplitude como medida de dispersão reside no fato de o intervalo ser
relativamente fácil de calcular, mesmo para um grande conjunto de números. Entretanto, a maior
limitação da amplitude é o fato dela levar em conta somente os dois valores extremos de um conjunto,
nada informando quanto aos outros valores.
A variância é a medida de dispersão que mede a média dos quadrados dos desvios dos valores,
de um conjunto numérico em relação a sua média.
Cálculo da Variância:
s 2
(x i x) 2 amostral
n 1
2
(x i )2 populacional
N
Onde:
xi = valor da variável
x média amostral
xi x = desvio em relação à média
= média populacional
No cálculo de variância divide-se a soma obtida por n-1 quando se trata de um conjunto de
números que representam uma amostra. Se um conjunto de números constitui uma população, ou se a
finalidade de somar os dados é apenas descrevê-los, e não fazer inferências sobre uma população,
então deve-se usar N em lugar de (n-1) no denominador.
Funcionário xi x ( x i x )2 Funcionário xi x ( x i x )2
A B
80 70
81 90
79 80
80 72
80 93
= = = =
Turma A xi x ( x i x )2 Turma B xi x ( x i x )2
4 1
6 0
5 10
3 9
4 2
7 8
6 5
= = = =
s s2 2
ou
s
(x i x) 2
(x i )2
n 1 N
O desvio padrão é uma das medidas mais comumente usadas para distribuições, e desempenha
papel relevante em toda a estatística. Cabe notar que a unidade do desvio padrão é a mesma da média.
Por exemplo, se a média é em reais, o desvio padrão também se exprime em reais. A variância, por sua
vez, se exprime em quadrados de unidades ( p. ex., reais2).
x 2
x 2
x 2
n
x n
2
s2 s
n 1 e n 1
COEFICIENTE DE VARIAÇÃO
Crianças ( kg ) Adultos ( kg )
4 66
2 64
6 62
Verificamos que o peso médio para as crianças é de 4 kg, enquanto para os adultos é de 64 kg.
A dispersão dos dados em torno da média é a mesma, pois ambos têm desvio padrão s = 2 kg. Entretanto
a variação de 2 kg no grupo de crianças, cujo peso médio é de 4 kg, é mais importante do que a mesma
variação no grupo de adultos, cujo peso médio é 64 kg. Neste tipo de situação, é mais interessante o
emprego de uma medida de dispersão relativa adimensional e geralmente expressa em porcentagens:
o coeficiente de variação.
AMPLITUDE INTERQUARTÍLICA
Q = Q3 - Q1
A amplitude interquartílica é uma medida de variabilidade bastante robusta, que é pouco afetada
pela presença de dados atípicos, onde 50% dos dados estão entre Q1 e Q3.
EXERCÍCIOS
2) Calcule a média e o desvio padrão de uma amostra das vendas diárias, em reais;
8 100; 9 000; 4 580; 5 600; 7 680; 4 800 e 10 640
3) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio
padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que
disciplina foi maior a dispersão?
5) Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão,
respectivamente, 18,3 e 1,47, calcule o coeficiente de variação.
8) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97cm.
Outro grupo de 125 moças tem uma estatura média de 161,9 cm, sendo o desvio padrão igual a
6,01cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo?
9) Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação
de 3,3%. Qual o desvio padrão desse grupo?
10) Quinze amostras de ar de certa região foram obtidas e para cada uma delas foi determinada a
concentração de monóxido de carbono. Os resultados (em ppm) foram:
RESPOSTAS