Livro - Estatistica

Silvia Helena Mangili Tassi
Estatística
Criciúma
2014
SATC — Associação Beneficente da Faculdade Virtual SATC
Indústria Carbonífera de Santa Catarina Coordenador
Presidente de Honra Suenoni Paladini
Ruy Hülse Assessoria Pedagógica e de Capacitação
Diretor Executivo Christian Deboita Medeiros
Fernando Luiz Zancan Jaqueline Marcos Garcia de Godoi
Diretor Administrativo Financeiro Supervisor de Conteúdo
Vanderlei Antônio Milioli Cristiane Gonçalves Dagostim
Diretor de Relações Corporativas Diagramação e ilustrações
Iraide Antônio Piovesan Amanda Rodrigues Anselmo
Faculdade SATC Coordenação dos Cursos

Diretor Engenharia Elétrica
Carlos Antonio Ferreira André Abelardo Tavares
Secretária Acadêmica Engenharia Mecânica
Cristiane Dias Luciano Dagostin Bilessimo
Coordenação Acadêmica
Kelli Savi da Silva
Coordenação de Ensino
Jovani Castelan
Sumário
Conheça a autora .................................................................................................5
Apresentação ...................................................................................................... 7
Unidade 1
■ Conhecendo um pouco da estatística ........................................................9
Módulo 1 – Introdução à estatística ................................................................. 11
Módulo 2 – Conceitos básicos aplicados à estatística ....................................... 21
Módulo 3 – Análise exploratória de dados I ..................................................... 31
Módulo 4 – Amostragem ................................................................................. 41
Unidade 2
■ Análise exploratória de dados 2 .............................................................. 67
Módulo 5 – Escalas e outras medidas estatísticas ............................................ 69
Módulo 6 – Tabelas estatísticas ........................................................................ 83
Módulo 7 – Gráficos estatísticos ...................................................................... 91
Unidade 3
■ Distribuição de frequência .................................................................... 117
Módulo 8 – Apresentação tabular e gráfica de uma distribuição de frequência ..... 119
Módulo 9 – representação gráfica de uma distribuição de frequência.............137
Unidade 4
■ Medidas de posição e de dispersão e estimação .................................... 155
Sumário
Módulo 10 – Medidas de posição .................................................................. 157

Módulo 11 – Medidas de dispersão ou de variabilidade ................................ 173
Módulo 12 – Medidas assimétricas e medidas de curtose ............................. 185
Unidade 5
■ Correlação e regressão linear ................................................................ 199
Módulo 13 – Correlação e regressão ............................................................. 201
Unidade 6
■ Teoria da probabilidade ........................................................................ 219
Módulo 14 – Probabilidade ........................................................................... 221
Módulo 15 – Distribuições de probabilidade ................................................. 247
Módulo 16 – Modelos probabilísticos ........................................................... 261
Unidade 7
■ Inferência estatística ............................................................................ 281
Módulo 17 – Estimação ................................................................................. 283
Módulo 18 – Testes de hipóteses ................................................................... 293
Referências ..................................................................................................... 117

Conheça a autora
Mestre em Engenharia de Produção, na área de Mídia e Conhecimento pela

Universidade Federal de Santa Catarina (UFSC). Bacharel em Ciência da Com-
putação, pela Universidade do Sul de Santa Catarina (UNISUL), campus Tuba-
rão. Licenciada em Matemática, pelo Centro Universitário Leonardo da Vinci
– UNIASSELVI. Atualmente, Professora Universitária nos cursos de: Engenharia
(da Computação, Elétrica, Química e Mecânica), da Faculdade SATC e dos cur-
sos de Engenharias (da Computação e da Energia) e de Tecnologia da Informa-
ção e Comunicação, da Universidade Federal de Santa Catarina (UFSC), campus
Araranguá.
Unidade 1 5
Apresentação
Caros alunos, nós não podemos confundir o que realmente envolve a área da es-
tatística, para muitos, é apenas a análise dos dados, o que não está correto. A área
da estatística engloba todo um processo, desde a fase de planejamento de uma
pesquisa; a coleta dos dados; a análise dos dados, chegando à interpretação dos
dados que servirão para auxiliar os gestores de empresas na tomada de decisões.
Esta poderá gerar novos produtos, auxiliar a ganhar de concorrentes, aumentar a
produtividade, diminuir perdas de matéria-prima, identificar pontos positivos e
negativos nos negócios com o intuito de melhorar processos, entre outros.
Veja: Coleta de Organização

Planejamento
dados dos dados
Interpretação Análise dos Exposição dos

dos dados dados dados
No dia a dia, as pessoas - ao lerem jornais e revistas - se deparam com dados es-
tatísticos que precisam interpretar a fim de tirar suas conclusões. Esse é um fato
que vem crescendo consideravelmente, tanto na vida pessoal como profissional,
levando as pessoas a buscarem conhecer técnicas e ferramentas estatísticas para
seu melhor entendimento e até mesmo crescimento profissional.
Então, que tal conhecermos melhor essa ciência e desenvolvermos habilidades

em estatística para ingressarmos no mercado de trabalho com a qualidade em-
presarial almejada? Atenção!!! Para isso, precisamos conhecer algumas informa-
ções dessa área.
Vamos em frente?!
Unidade 1 7
Unidade 1
Conhecendo um pouco da
estatística
Nesta unidade, você irá se familiarizar com a área da
Estatística. O objetivo aqui é apresentar definições básicas
com terminologias aplicadas nesta área matemática, dando-
lhe os subsídios teóricos necessários para contribuir com o seu
aprimoramento. Esta parte também mostrará como a estatística
está subdividida, algumas das suas aplicações no mercado de
trabalho, os tipos de variáveis possíveis de serem aplicadas,
entre outros assuntos relevantes a sua aplicabilidade.
Na sequência, serão apresentadas algumas técnicas

estatísticas, tanto ema nível teórico, como prático por meio
de alguns exemplos. O foco aqui é capacitá-lo(la) a usar
corretamente os diferentes tipos de amostragensm ou
quando não cabível à situação em questão, o Censo.
Parece bastante coisa, não é mesmo? Mas com leitura

atenta e calma, juntos conseguiremos atingir o objetivo
deste módulo. Então, vamos em frente! ■
Unidade 1 9
Módulo 1
Introdução à estatística
Para pôr em prática qualquer teoria que seja, faz-se ne-
cessário conhecer o ontem, o hoje e buscar um futuro provável,
não é mesmo? Pois bem! Na área da estatística não poderia ser
diferente. Então, neste primeiro momento serão apresentadas al-
gumas informações da área, com sua breve história, subdivisões
e como os profissionais estão atuando e poderão vir a atuar nesta
parte da ciência exata.
Unidade 1 11
1.1 Um breve histórico
A estatística é uma área da matemática que vem sendo utilizada por nós há mui-
tos e muitos anos, às vezes, de forma correta; em alguns casos, porém, com o
abuso de dados estatísticos distorcidos, quando não equivocados, errados.
Se dividirmos a história em partes, podemos dizerrelatar que antigamente os ho-

mens já faziam uso da estatística para contar:
■ O número de habitantes de um território;

■ Quantas crianças nasciam durante determinado ano;
■ Quantos óbitos ocorreram em determinado período; na tela, usar imagens
■ Entre outros, porém, tudo informalmente.
Na idade média, essa ciência já podia ser percebida na área tributária. Porém,
somente a partir do século XVI, é que tivemos os primeiros números relativos
e as primeiras tábuas e tabelas sendo utilizadas para registrar os fatos sociais
ocorridos na época, como: registros de casamentos e acontecimentos religiosos.
(CRESPO, 2009).
Já no século XVIII, a coleta de alguns

dados, análise e geração de informações
passaram a ter um foco científico, melhor
trabalhado, o que deu origem à palavra
ESTATÍSTICA, formalizada por
Godofredo Achenwall, ficando este
conhecido na história como o
pai da estatística. (CRESPO, 2009)
A palavra estatística detem origem latina, como seu radical STATUS (significa
ESESTADO), logo, o termo estatística sigsignifica: o ESTUDO DO ESTADO
(BRUNI, 2008).
12 Unidade 1
Hoje, o IBGE - Instituto Brasileiro de Geografia e Estatística - é o órgão res-
ponsável pela montagem das estatísticas oficiais que atendem aà necessidades de
diversos segmentos da sociedade civil, bem como dos órgãos das esferas gover-
namentais: municipal, estadual e federal.
1.2 Conceito e aplicações
Estatística é uma área da matemática aplicada que disponibiliza métodos e téc-

nicas para sistematicamente: coletar dados, organizar, resumir, analisar e inter-
pretá-los de forma concisa, eficaz e concreta, deixando de lado o “achismo” nas
interpretações.
Os dados coletados podem ser obtidos por pesquisas ou experimentos, permitin-

do aos interessados com sua análise tomarem decisões.
A estatística têm aplicações em várias áreas

do conhecimento, entre elas: sociais, tecnológicas,
da saúde, industrial, educacional e outras.
Na área industrial, os engenheiros, por meio de dados estatísticos, conseguem

avaliar a qualidade de seus processos e produtos, contribuindo para diminuição
de perdas consideráveis, tanto em matéria-prima, como em produtividade. O que
permite aos gestores tomarem decisões como: o lançamento de novos produto,
campanhas que alcancem a novos clientes, ampliação de fábricas; colaborando
para que a empresa se mantenha no mercado de trabalho de forma competitiva
e com almejada qualidade.
Na área tecnológica, a estatística tem forte participação, principalmente na jun-

ção das áreas de Inteligência Artificial, Banco de Dados e Estatística, no que diz
respeito à extração de dados importantes e não triviais. Mas também é comum
o uso de estatística em redes, engenharia de software experimental, desenvolvi-
mento de sistemas de gestão e em outras áreas da computação.
Na área da saúde, é comum o uso de técnicas estatísticas para a pesquisa da situ-

ação atual, tanto no que tange a possíveis doenças (pragas) como ao uso de me-
dicamentos por determinada população. Assim acontecem novos investimentos
Unidade 1 13
em tratamentos e medicamentos, buscando melhorias na saúde municipal, esta-
dual e até mesmo nacional, quando não mundial.
Na educação, os especialistas em estatística ou os próprios matemáticos podem

exercer a função de docentes na disciplina de Estatística - muitas vezes chamada
de Probabilidade e Estatística - além de poderem contribuir na área de pesquisa
com novos experimentos e possíveis descobertas mercadológicas.
+ LEITURA
Recomendamos que você leia:
Acesse a Internet e realize – por meio de site de busca – uma pesquisa por “aplicações da
estatística nas engenharias” para conhecer outros exemplos do que está sendo realizado e o
que você pode fazer com a estatística.
1.3 Como a estatística está dividida?

Na prática, esta área da matemática costuma ser dividido em três áreas:
- Estatística Descritiva ou Dedutiva;

- Inferência Estatística ou Estatística Indutiva; e
- Probabilidade.
1.3.1 Estatística Descritiva

É a área da estatística em que se aplicam técnicas para coletar, organizar e sin-
tetizar (reduzir até que possível e viável for) os dados de interesse da pesquisa,
servindo para facilitar ao máximo a compreensão das informações extraídas.
14 Unidade 1
Mas você deve estar se perguntando: quando
se deve fazer uso dessa subárea da estatística,
certo?
Deve ser aplicada, quando você tiver ao seu alcance um grande número de da-
dos, dificultando a conclusão do estudo em questão. Assim, ao aplicar técnicas
descritivas, por meio de tabelas e gráficos, você conseguirá reduzir ao máximo
as informações geradas, conseguindo interpretar e chegar a algumas conclusões.
A Estatística Descritiva pode ser usada para tratar dados, como:
- A média semestral dos alunos na disciplina de Estatística;
- O número de votos favoráveis por candidatos em pesquisas eleitorais;
- O custo de vida de determinada população;
- A taxa de desemprego na região carbonífera;
- Entre outros.
1.3.2 Inferência Estatística
Também conhecida como Estatística Indutiva, é a subárea da estatística que faz

uso de uma amostra para fazer generalizações a respeito de aspectos relevantes
de uma população.
A inferência estatística tem utilização constante no mercado de trabalho, princi-

palmente, pelo alto custo e a dificuldade na operacionalização de observar uma
população inteira. Mas para que os resultados obtidos da amostra tenham uma
generalização coerente para a população, você precisa trabalhar com uma amos-
tra significativa, sem falar na atenção que precisa dar à margem de erro.
Unidade 1 15
Sendo assim, é importante adquirir conhecimentos para lidar com essas técni-
cas e procedimentos estatísticos que permitam dar ao interessado um grau de
confiabilidade nas afirmações que faz à população, baseadas nos resultados das
amostras. Em outras palavras, saber trabalhar a área de inferência estatística é
relevante para atuar no mercado de trabalho.
▪ E, afinal, o que se entende por inferência?
DICA
De acordo com Crespo ( 2009, p. 3), “a coleta, a organização e a descrição dos

dados estão a cargo da Estatística Descritiva, enquanto a análise e a interpreta-
ção desses dados ficam a cargo da Estatística Indutiva ou Inferencial.”.
1.3.3 Probabilidade
Esta área pode ser compreendida como uma teoria matemática que serve para
descrever os fenômenos aleatórios, fenômenos em que estão presentes algumas
incertezas.
Como, por exemplo: se você jogar um dado de forma honesta inúmeras vezes,
nunca poderá garantir qual será o próximo resultado antes do próximo lança-
mento. O mesmo ocorrerá ao jogar uma moeda, pois as possibilidades são incer-
tas, pode cair cara ou coroa, não é mesmo?
Resumindo, pode-se dizer que a probabilidade é a subárea que foca seus estu-
dos nos riscos e acasos em futuros eventos, determinando se é ou não possível
acontecer tal situação. Por isso, sua origem com os jogos de azar, nos quais já se
criavam estratégias para vencê-los (BRUNI, 2008).
16 Unidade 1
Posteriormente, abordaremos essa área com maiores detalhes por ser de extrema
relevância na engenharia.
Pesquisas mais complexas podem trabalhar com as três

áreas estatísticas mencionadas: a estatística descritiva, a
probabilidade e a inferência estatística, conforme mos-
tra a Fig. 1:
Figura 1 – Interação das Três Subdivisões Estatística
Estatística Probabilidade
Descritiva
Inferência
Estatística
Fonte: Costa Neto (2.002, p. 4).
Unidade 1 17
Adaptado. As empresas públicas e privadas buscam profissionais que saibam tra-
balhar com dados para geração de novas informações, que demonstrem habili-
dades para lidar com eles, opinando - quando possível e viável for - com novos
conhecimentos para melhorias e ampliações de mercado.
Para que você não seja apenas mais um usuário, é importante saber lidar com
estatística,
▪ então que tal começar o módulo 2 para conhecer

e aprimorar seu conhecimento estatístico com
alguns conceitos relevantes à compreensão do
conteúdo desta disciplina?
Síntese do módulo
Neste módulo, você teve a oportunidade de:
• aprender o verdadeiro significado de uma das áreas da matemática aplicada: a

estatística;
• conhecer um breve histórico da área, como ela pode ser aplicada no dia a dia
por profissionais diretos e indiretos; e
• estudar suas subdivisões, o que lhe permitiu conhecer a diferença entre a esta-
tística descritiva, a inferência estatística e a probabilidade.
18 Unidade 1
ATIVIDADES
1) Com base na leitura do módulo 1, desenvolva as seguintes questões, individu-

almente e, na sequência, confira suas respostas ao final do livro.
a) Como é descrito o termo estatística? Qual seu significado real?

b) Quais são as três subdivisões da estatística?
c) Quando se deve fazer uso, principalmente, da Estatística Descritiva?
d) A média bimestral dos alunos do Terceiro Ano do ensino médio, da escola X,

em matemática e; o número de votos favoráveis aos candidatos X e Y a Governa-
dor são exemplos de dados que podem ser tratados pela estatística:
I) Descritiva
II) Probabilística
III) Inferencial.
2) Atualmente, qual é o órgão responsável pela montagem das estatísticas oficiais

que atendem a necessidades de diversos segmentos da sociedade civil, bem como
dos órgãos das esferas governamentais municipal, estadual e federal, no Brasil?
a) ABNT
b) CNPq
c) ISSO
d) IBGE
e) MEC
Unidade 1 19
3) É correto afirmar que, no decorrer de uma pesquisa, enquanto a coleta, a or-
ganização e a descrição dos dados estão a cargo da Estatística Indutiva ou In-
ferencial, a análise e a interpretação desses dados ficam a cargo da Estatística
Descritiva?
( ) SIM ( ) NÃO
Por quê? Justifique sua resposta.
20 Unidade 1
Módulo 2
Conceitos básicos aplicados à

estatística
Como já mencionado, para alguns, a estatística é vista como
uma disciplina que trabalha apenas com um conjunto de
números, gráficos, tabelas e que serve para mostrar o Censo
Demográfico, o que é um equívoco. Além disso, o uso de alguns
dados também costuma ser apresentado erroneamente.
Para não corrermos esse risco, vamos conhecer alguns
conceitos (termos estatísticos) e quais são as fases necessárias
a serem percorridas durante uma pesquisa de qualidade? ■
Unidade 1 21
2.1 Termos estatísticos
No decorrer da leitura deste livro e ao estudar estatística, você lerá muito a res-
peito de: 1) métodos; 2) métodos científicos; 3) população; 4) amostra; 5) parâ-
metros e outros termos.
▪ Afinal, o que significam esses termos?
2.1.1 Métodos
De forma simplificada, pode ser compreendido como um meio eficaz para alcan-
çar determinada meta.
Para Galliano (1979, p. 6), “método é um conjunto de etapas, ordenadamente

dispostas, a serem vencidas na investigação da verdade, no estudo de uma ciência
ou para alcançar determinado fim.”
2.1.2 Métodos Científicos
Entre os métodos científicos se encontram os métodos experimentais e os esta-

tísticos.
2.1.2.1 Método Experimental
Este método costuma ser bastante utilizado pelos físicos e químicos em suas ex-
periências.
22 Unidade 1
O método experimental é o método em que o pesquisador analisa o problema,
elabora suas hipóteses, realiza algumas experiências (testes), manipulando (con-
trolando) as variáveis referentes ao estudo e, na sequência, avalia as relações ob-
servadas entre causas e efeitos do fenômeno estudado.
Por exemplo: a vacina da gripe A é resultado do experimento de alguns vírus por

especialistas na área da saúde.
2.1.2.2 Método Estatístico
Na prática, você pode conceituar método estatístico como uma técnica que tem
o objetivo de estruturar, organizar os momentos (fases, etapas) que precisam ser
estabelecidos ao realizar uma observação estatística.
Por exemplo, qual a viabilidade ou não do lançamento de um curso de informáti-

ca básica para um grupo de idosos, a partir de uma pesquisa de mercado?
Todas as variações precisam ser pontuadas, analisadas para se chegar a uma con-
clusão, por exemplo: o número de idosos interessados, o preço dos cursos ofe-
recidos na mesma região, a disponibilidade de horários. Tudo isso precisa ser
analisado, pois surtirão efeitos positivos ou negativos e auxiliarão a decidir se
vale a pena oferecer ou não o curso.
2.1.3 População
População também conhecida como universo refere-se ao conjunto de todos

os elementos envolvidos com a pesquisa, podendo estes serem pessoas, objetos
ou outras informações que apresentem pelo menos uma característica comum
(BRUNI, 2008).
São exemplos de população:
- Os alunos matriculados na disciplina de Estatística, na 3ª fase do Curso de En-

genharia da Computação, da Faculdade SATC;
Unidade 1 23
- Os alunos aprovados no Vestibular 2013-1, da SATC;
- O total de veículos vendidos no segundo semestre de 2012, pelo estacionamen-

to X de Criciúma.
2.1.4 Amostra
Amostra é um subconjunto da população, ou seja, corresponde a uma parte dos

objetos de uma população (BARBETTA, REIS e BORNIA, 2010).
Para os exemplos dados anteriormente, no item população, poderíamos ter para:
- População: Os alunos matriculados na disciplina de Estatística, da 3ª fase do

Curso de Engenharia da Computação, da Faculdade SATC;
Amostra: Os alunos do sexo masculino matriculados na disciplina de Estatística,

da 3ª fase do Curso de Engenharia da Computação, da Faculdade SATC;
- População: Os alunos aprovados no Vestibular 2013-1, da SATC;
Amostra: Os alunos aprovados no Vestibular 2013-1, da SATC, para o curso de

Engenharia Elétrica;
- População: O total de veículos vendidos no segundo semestre de 2012, pelo
estacionamento X de Criciúma;
Amostra: O total de veículos RENAULT SANDERO vendidos no segundo se-

mestre de 2012, pelo estacionamento X de Criciúma;
- Entre outros.
DICA
Enquanto a população trata com todos os elementos, a amostra é uma repre-

sentação desses dados, conhecidos como objetos ou indivíduos.
24 Unidade 1
Este assunto será abordado melhor na próxima unidade.
▪ Convite à reflexão:
▪ Caro aluno, agora que você já sabe distinguir entre

população e amostra, verifique se a afirmação a seguir
está correta?
Numa pesquisa sobre as eleições para Governador do estado de Santa Catarina,

a população é formada por 75% de todos os eleitores que serão entrevistados na
região carbonífera e a amostra é formada pelos indivíduos com direito a voto das
demais regiões?
Claro que não! Cuidado, nem sempre que aparece o termo todos signifi-
ca população!
2.1.5 Parâmetros
Os parâmetros são medidas usadas na área da Estatística para designar alguma
característica descritiva dos elementos da população (BARBETTA, REIS e BOR-
NIA, 2008). Como exemplos, pode-se citar:
- A idade média de uma determinada turma;

- A proporção do número de embalagens classificadas como em boas condições;
- Entre outros.
“Quando tratamos de POPULAÇÃO, temos PARÂMETROS.

Quando examinamos uma AMOSTRA, temos ESTATÍSTI-
CAS. Com base nas ESTATÍSTICAS (média amostral, vari-
ância amostral, etc.) obtidas por uma amostra, podemos
ESTIMAR os verdadeiros parâmetros populacionais (média populacional,
variância populacional, etc.).” (GONZÁLES, 2009, p. 4)
Unidade 1 25
Existem outros termos relevantes na área da estatística que precisam ser compre-
endidos para se ter qualidade no trabalho, mas esses termos serão apresentados
mais tarde, no decorrer deste livro.
Agora, para fecharmos o módulo em estudo, vamos conhecer quais fases você
precisará percorrer ao desenvolver uma pesquisa?
2.2. Fases de um processo estatístico

Para que se alcance resultados confiáveis, obtidos com propriedade e não no
“achismo”, os especialistas em estatística, como Dornelles Jr. (2005, p. 17), su-
gerem que o seguinte ciclo seja seguido ao realizar uma pesquisa de qualidade,
fazendo uso de métodos estatísticos:
a) Definição do problema;
b) Planejamento;
c) Coleta de dados;
d) Crítica dos dados;
e) Apuração dos dados;
f) Apresentação dos dados;
g) Análise e interpretação dos dados; e
h) Relatório final e publicação. Usar fluxograma do ambiente EaD
Para facilitar o processo, ainda podemos resumir esse processo em cinco fases
(GESSER e DALPIAZ, 2007):
a) Coleta de dados;
b) Crítica dos dados;
c) Apuração dos dados;
d) Apresentação dos dados; e
e) Análise dos resultados. Usar fluxograma do ambiente EaD
26 Unidade 1
Primeiramente, define-se o problema a ser pesquisado; na sequência se faz a co-
leta dos dados relevantes ao problema; podendo estes dados ser do tipo:
- Primário: quando o próprio pesquisador, o interessado no estudo, faz a coleta

dos dados; e
- Secundário: quando os dados já foram coletados por outra pessoa.
Os dados coletados caracterizam as coletas diretas e indiretas, respectivamente:
A coleta direta ocorre quando os dados coletados são obtidos via registros obri-
gatórios, ou por meio de inquéritos e questionários, aplicados pelo próprio pes-
quisador interessado. São exemplos de informativos obrigatórios: as certidões de
óbito, casamento, nascimento, entre outros.0
As coletas quando do tipo diretas podem ser classificadas pelo fator tempo em
contínuas, periódicas ou ocasional. Será:
• Contínua: quando é realizada continuamente, como por exemplo: registros de

nascimentos e óbitos, frequência dos acadêmicos às aulas;
• Periódica: quando realizada em intervalos de tempos constantes, como por

exemplo: a matrícula anual dos estudantes nas escolas, censos demográficos, ava-
liações semestrais e outros; e
• Ocasional: como o próprio nome diz, quando ocorre ocasionalmente para

atender a uma emergência ou a uma conjuntura, por exemplo: as pesquisas elei-
torais, como quando ocorrem epidemias, como Gripe A, e outras.
Já a coleta indireta se dá por meio de dados obtidos, concluídos de coletas dire-

tas realizadas anteriormente ou por meio de conhecimentos adquiridos relacio-
nados ao objeto de estudo em questão. Um exemplo típico é a pesquisa a respeito
da natalidade anual.
Após realizar a coleta dos dados, direta ou indiretamente, se faz necessária a crí-
tica desses dados para que possam ser evitados, ou até mesmo eliminados, re-
sultados de pesquisas com erros gravíssimos na conclusão de um trabalho, erros
estes causados, muitas vezes, por falta de percepção e atenção por parte dos pes-
quisadores ao selecionar os dados.
O próximo passo é tratar os dados coletados e já criticados. Esse processo de

apuração se realiza por meio da soma e, consequentemente, o seu processamen-
Unidade 1 27
to, conforme os critérios de classificação pré-definidos, podendo ser realizado
manualmente ou de forma eletrônica (o que hoje tem sido mais utilizado pelas
empresas).
Estando os dados processados, eles precisam ser apresentados ao público-alvo

interessado de forma prática, para o fácil entendimento do objeto de pesquisa.
Essa apresentação se faz geralmente via tabelas ou gráficos.
Após apresentação dos dados tabulados, se faz a análise dos resultados obtidos
por meio dos métodos estatísticos definidos. Para fechar o ciclo, tiram-se as de-
vidas conclusões e até mesmo previsões empresariais. Estas deverão ser docu-
mentadas por profissionais com conhecimento, não necessariamente o gerente
ou um graduado em estatística. O responsável pela pesquisa então documenta o
resultado para que os possíveis interessados possam fazer uso dele para melho-
rias ou novos investimentos, tais como: lançamentos de processos e produtos ao
precisar tomar decisões.
Síntese do módulo
Neste módulo, você aprimorou seus conhecimentos com alguns termos estatísti-
cos de suma relevância para a compreensão dos próximos capítulos, no que tange
à estatística na teoria, possibilitando aplicá-la na prática.
Você recebeu também informações a respeito de métodos, métodos científicos:

entre eles estatísticos e experimentais e, por fim, estudou as fases que compõe
o método estatístico. A partir daqui, você pode aprimorar seus conhecimentos
com a busca de novos exemplos de pesquisas já desenvolvidas por meio de dis-
sertações, teses, artigos e o próprio site do IBGE. Isso contribuirá positivamente
para o entendimento das demais unidades e até mesmo a aplicabilidade na práti-
ca dentro de seu curso, sua área de atuação.
28 Unidade 1
ATIVIDADES
Com base na leitura do módulo 2, desenvolva as seguintes questões, individual-

mente e, na sequência, confira suas respostas ao final do livro.
1) Você estudou que entre os métodos científicos se encontram os métodos ex-

perimentais e os estatísticos. Enquanto as ciências físicas e biológicas fazem uso
do método experimental, outras dão preferência ao estatístico. Quais são estas
ciências?
2) Em que momento, deve-se fazer uso de parâmetros e quando de estatísticas?
Unidade 1 29
3) Você estudou que um processo estatístico aborda cinco fases, atento a esta
afirmação, responda:
a) Quais são as fases?
b) Em um primeiro momento, define-se o problema a ser pesquisado; na sequ-

ência se faz a coleta dos dados relevantes ao problema; podendo estes dados ser
de que tipo? Explique-os:
c) Os dados coletados durante a etapa de coleta caracterizam uma coleta direta

ou indireta. Quando é do tipo direta?
d) Como pode ser classificada, de acordo com fator tempo, a coleta direta, isto é,
quando for obtida diretamente da fonte?
e) De acordo com fator tempo, os registros de nascimento e óbitos são exemplos

de coletas do tipo? Já os censos demográficos são classificados como coletas do
tipo?
f) Após tratar os dados coletados e já criticados, realiza-se o processo de apura-

ção por meio da soma e, consequentemente, o seu processamento, conforme os
critérios de classificação pré-definidos, podendo este ser realizado de que forma?
g) Os dados, quando processados, precisam ser apresentados ao público-alvo

interessado de forma prática para o fácil entendimento do objeto de pesquisa.
Como se costuma fazer essa apresentação?
30 Unidade 1
Módulo 3
Análise exploratória de dados I

No módulo 2, você estudou as fases de um processo estatístico,
tais como coleta e crítica dos dados e apresentação. Mas, afinal,
como tratar esses dados para que a pesquisa seja confiável?
Alguns procedimentos precisam ser utilizados, então,

neste módulo, abordaremos alguns conceitos relevantes ao
entendimento e como organizar esses dados e descrevê-los para
que se tenha informações concretas de interesse da pesquisa. ■
Vamos nesta!
Unidade 1 31
3.1 Variáveis
No desenvolvimento de uma pesquisa, o que importa estatisticamente são as ca-

racterísticas observadas dos elementos da população ou amostra, e não pura-
mente os elementos. Essas características são o que chamamos de variáveis, as
quais precisam ser bem definidas, de interesse ao estudo.
Por exemplo, ao analisar um determinado departamento de uma empresa você

poderá observar algumas características entre seus funcionários, tais como: ma-
trícula, sexo, idade, salário, número de dependentes, etc. Essas características va-
riam de elemento para elemento e, por isso, são chamadas de variáveis.
Por exemplo: Para o fenômeno “sexo” existem – biologicamente – dois possíveis

resultados: sexo feminino e sexo masculino.
Os estatísticos, com intuito de evitar respostas estranhas aos fenômenos observa-

dos, aconselham determinar previamente as possíveis alternativas de respostas.
Por exemplo, para à variável “estado civil”, pode-se trabalhar com as alternativas:
solteiro, casado, viúvo, desquitado e divorciado, já pré-definidos.
As variáveis podem ser classificadas em:

- Qualitativas; e
- Quantitativas.
As variáveis qualitativas ocorrem quando seus valores são expressos em catego-

rias, atributos e/ou qualidades, por exemplo:
Tabela 1 - Variáveis Qualitativas

Variável Possíveis Respostas
Sexo ( ) Masculino ( ) Feminino
Tamanho ( ) Baixo ( ) Mediano ( ) Alto
( ) Ensino Fundamental; ( ) Ensino Médio; ( ) Graduação;
Escolaridade
( ) Pós Graduação; ( ) Mestrado ( ) Doutorado
Fumante ( ) Sim ( ) Não
Cor dos Olhos ( ) Preto; ( ) Castanho; ( ) Azul ( ) Verde
Fonte: Autora
32 Unidade 1
Essas variáveis ainda podem ser subdivididas em nominais e ordinais.
Serão nominais quando não apresentarem qualquer ordem entre seus valores
(MAGALHÃES e LIMA, 2010).
Na Tab. 1 pode ser compreendido como nominal as variáveis: sexo, fumante e

cor dos olhos.
Já quando possuírem qualquer ordenação crescente, caracterizando aumento de

intensidade, será classificado como ordinais.
Entre as variáveis descritas na Tab. 1, podem ser citadas as variáveis ordinais:

tamanho e escolaridade.
Já nas quantitativas, os valores são numericamente mensuráveis. Por exemplo: o

número de alunos matriculados na disciplina de estatística poderá ser expresso
por meio dos números naturais: 0, 1, 2, ..., 30, ... etc.
DICA
Idade, número de filhos, salário dos funcionários são também exemplos de
variáveis quantitativas, pois são expressos em números.
As variáveis quantitativas também podem ser subdivididas em contínua e dis-

creta.
Por exemplo: o número de funcionários de uma empresa pode assumir qualquer

valor do conjunto dos números naturais, mas nunca decimais como 10,3; 10,35;
10,5 etc, logo essa é uma variável quantitativa discreta. Já as quantitativas contí-
nuas podem assumir valores decimais (entre intervalos), como, por exemplo, a
altura dos funcionários pode ser 1,63 m; 1,80 m e assim por diante, dependendo
da precisão da medida.
Unidade 1 33
DICA
As discretas são aquelas variáveis que podem assumir um número finito de
valores do conjunto de números inteiros. Já as variáveis contínuas são vari-
áveis que podem assumir qualquer valor pertencente ao conjunto dos números reais.
Como artifícios estatísticos, alguns profissionais costumam usar letras latinas

para representar uma variável, em geral, as últimas como: x, y, z.
Estatisticamente, uma população ou amostra pode originar vários tipos de da-

dos, por exemplo:
Tabela 2 – Exemplo de tipos de variáveis
Variável Variável
Variável Qualitativa Variável
População Quantitativa Quantitativa
Nominal Qualitativa Ordinal
Contínua Ordinal
Professores Sexo Escolaridade Idade; Altura Nº de filhos
Qualidade do Quantidade em
Brinquedos Caro ou barato Preço em R$
produto estoque
Fonte: Autora
3.2 População e amostra

População é o conjunto de elementos com pelo menos uma característica co-
mum que compõem o universo de nosso estudo (CRESPO, 2009).
São exemplos de população:

- Os alunos matriculados na disciplina de cálculo, no semestre 2013-1;
- Os softwares produzidos pela Microsoft em 2012; e
- Os brinquedos produzidos por uma fábrica em 2012.
Nunca esqueça! Ao especificar a população, se faz ne-

cessário, definir, deixar claro o tempo (período) referente
à pesquisa em questão.
34 Unidade 1
Ao acessar o site do IBGE, você consegue visualizar a população brasileira entre
os anos de 1980 a 2010, por exemplo. Mas para que isso seja possível, a equipe
responsável precisou – em um primeiro momento – identificar a população, ou
seja, o total de habitantes no país em cada ano em estudo, conforme mostra o
Gráfico 1.
Existem populações que não são viáveis ou são impossíveis de serem estudadas;
às vezes, por motivos operacionais; outras vezes; de tempo, econômico, ético,
entre outros; nestes casos, trabalha-se com amostras da população. Por exem-
plo, analisar todas as águas no mar do Balneário Rincão para verificar se está
poluída é um processo inviável, tanto em questões econômicas como operacio-
nais, logo se faz essa pesquisa com uma amostra da água.
Unidade 1 35
As amostras podem ser compreendidas como parte, subconjunto do universo
estatístico, dos quais serão extraídos alguns dados. São partes significativas dos
elementos que contêm características comuns ao interesse da pesquisa, que seja
representativa ao estudo.
Por exemplo:
Para saber se uma macarronada está boa, você não precisa degustar tudo, basta
experimentar uma parte, esta se chama amostra.
Caso você queira também visualizar um exemplo de amostra, tratado no site

do IBGE, basta observar o gráfico. 2, o qual apresenta uma proporção da popu-
lação por sexo. Ao analisar o sexo masculino ou feminino em relação ao total de
habitantes (população), estará tratando uma amostra.
36 Unidade 1
Esses objetos (dados estatísticos) também podem ser visualizados na tabela 3.
Tabela 3 - População total e proporção da população por sexo, grandes

grupos de idade e situação de domicílio.
População 1980 1991 1996 2000 2010
População total (1) 119.002.706 146.825.475 157.070.163 169.799.170 190.755.799
Por sexo (%)
Homens 49,68 49,36 49,3 49,22 48,97
Mulheres 50,31 50,63 50,69 50,78 51,03
Por grandes
grupos de idade
0-14 anos 38,2 34,72 31,54 29,6 24,08
15-64 anos 57,68 60,45 62,85 64,55 68,54
65 e mais 4,01 4,83 5,35 5,85 7,38
Por situação do
domicílio (%)
Urbana 67,59 75,59 78,36 81,25 84,36
Rural 32,41 24,41 21,64 18,75 15,64
Um exemplo típico de amostra é o subconjunto dos eleitores consultados nas

pesquisas de intenção de voto, realizadas pelo IBOPE para verificar a probabili-
dade de determinados candidatos aos cargos políticos serem ou não eleitos.
Outro exemplo: Vamos supor que você queira saber quantos por cento da
população criciumense são torcedores do time do Criciúma (Tigre).
Dependendo de quais indivíduos (muitos, 50% ou poucos torcedores) forem

alocados para compor a amostra, existirá um risco quanto à margem de erros,
podendo esta estar muito além ou não do índice verdadeiro, o que levaria à
inutilidade da pesquisa.
Mas para que essas situações não ocorram, o pesquisador precisa definir uma
amostra representativa e, para isso, se faz uso de técnicas estatísticas, como
amostragem. Este assunto será discutido no próximo módulo.
Unidade 1 37
Síntese do módulo
Caro aluno, neste módulo você conheceu os tipos de variáveis: qualitativas e

quantitativas, com as suas respectivas classificações: quando qualitativas em no-
minais e ordinais e quando enumerável (quantitativas) em discreta ou contínua.
Teve a oportunidade de complementar seus estudos a respeito da temática: po-

pulação e amostra, assunto de extrema relevância à compreensão e aplicação da
estatística, além de ter conhecido alguns conceitos, tratados por especialistas e,
exemplos da área apresentados pelo Instituto Brasileiro de Geografia e Estatística
– IBGE.
ATIVIDADES

1) Entre as alternativas a seguir, qual delas conceitua corretamente população?
a) Conjunto de animais.
b) Conjunto de observações.
c) Conjunto de todos os indivíduos, objetos ou informações que apresentam pelo
38 Unidade 1
menos uma característica em comum.
d) Conjunto de indivíduos apresentando uma característica especial.
e) Conjunto de indivíduos, objetos ou informações que não apresentam carac-

terística em comum.
2) Descreva população e amostra e, em seguida, exemplifique-as com dois exem-

plos práticos do seu dia a dia.
3) Classifique as variáveis em cada item a seguir, usando: (Q) para qualitativa;

(QD) quantitativa discreta e (QC) quantitativa contínua:
a) ( ) População: Peças produzidas pela máquina 2.

Variável: Número de peças produzidas por hora.
b) ( ) População: Alunos da turma I, de Cálculo I.
Variável: Sexo.
c) ( ) População: Casais residentes no Bairro Pinheirinho, de Criciúma.
Variável: Número de ßlhos.
d) ( ) População: Professores da Faculdade SATC.
Variável: Salários.
e) ( ) População: Propriedades agrícolas do Brasil.
Variável: Produção de feijão.
f) ( ) População: Alunos do 2º ano do Ensino Médio, da SATC.
Variável: Peso.
Unidade 1 39
40 Unidade 1
Módulo 4
Amostragem
Ao se realizar uma pesquisa, por questões econômicas,
éticas e outras, em alguns casos, faz-se necessário estudar
todos os elementos da população, mas na sua maioria,
trabalha-se com parte deste universo. Porém, para que essa
parte coletada para estudo seja representativa, necessita-
se que algumas técnicas sejam aplicadas. A essas técnicas
estatísticas damos o nome de amostragem e censo. ■
Vamos conhecê-los?
Unidade 1 41
4.1 Amostragem e censo
O que difere essas técnicas são os elementos envolvidos na coleta de dados. En-
quanto no censo se analisa todos os elementos da população individualmente, na
amostragem, trabalha-se com parte significativa deste universo que tenha condi-
ções de representar o todo.
Você deve estar se perguntando: quando devo usar Censo e quando devo usar
Amostragem. Vejamos:
Primeiro, é preciso analisar o tipo de pesquisa que irá desenvolver e quais seus
objetivos. Nos casos em que a população é muito grande ou infinita, o tempo de
pesquisa é curto, almeja-se um resultado rápido e, principalmente, quando os
recursos financeiros disponíveis para aplicar a pesquisa são escassos, os especia-
listas sugerem a aplicação da amostragem.
Já quando a população é pequena, as variáveis envolvidas são de fáceis acesso e

principalmente, quando o pesquisador necessita obter resultados exatos, reco-
menda-se o censo.
Se você pensar em questões de tempo e custo, sem dúvida, a técnica de amostra-

gem, no geral, se mostra mais eficiente.
Mas, conforme alerta Barbetta, Reis e Bornia (2008, p. 26), “a amostragem preci-
sa ser feita com critérios, pois pretendemos ter amostras que permitam, a partir
de uma análise estatística apropriada, obter conclusões satisfatórias sobre toda a
população.”
Amostragens são técnicas utilizadas para garantir, tanto quanto possível, o acaso
ao escolher a amostra.
Os elementos da população podem ser extraídos (escolhidos) aleatoriamente

com reposição ou sem reposição. Com reposição é quando o elemento sorteado
pode ser novamente sorteado (selecionado) e sem reposição, quando os elemen-
tos não podem ser sorteados mais de uma vez.
42 Unidade 1
Uma amostragem pode ser aplicada de várias formas, dependendo do conheci-
mento que os pesquisadores têm da população, quais recursos estão disponíveis
para o estudo em questão, entre outros fatores. Basicamente, a estatística conta
com dois métodos de amostragem. Vamos estudá-los?
Vamos estudá-los?
4.2 Amostragem probabilística e não probabilística
Nas amostragens probabilísticas os elementos que irão compor a amostra são

selecionados por meio de sorteios aleatórios que garantam à todos, a mesma pro-
babilidade de pertencerem a amostra selecionada.
Já nas amostragens não probabilísticas, os elementos selecionados para compor

a amostra são feitos de forma deliberada, por julgamento dos pesquisadores, o
que não garante a representatividade da população com a confiabilidade que nos
passa a probabilística (CORREA, 2003)
Sendo assim, daremos maior ênfase às amostragens probabilísticas:
a) Amostragem Aleatória Simples;

b) Amostragem Aleatória Estratificada;
c) Amostragem Sistemática; e
d) Amostragem por Conglomerado.
a) Amostragem Aleatória Simples
Nesta técnica, o pesquisador não conhece informações referentes aos elementos

da pesquisa. Os dados da amostra serão escolhidos aleatoriamente, por sorteio
Unidade 1 43
avulso, sem critérios de seleção.
Por exemplo: Para verificarmos qual é o editor de texto entre o Microsoft Word,
BrOffice.org Writer e o Google Writely mais utilizado em um universo estatístico
de 1000 usuários, se faz uma seleção aleatória (sorteio) de 10% dos usuários e
obtém-se uma amostra de 100 usuários, os quais responderão à entrevista e assim
se chegará a um dos editores apresentados como sendo o mais utilizado.
Outro exemplo prático pode ser estudado por meio da seguinte suposição:
Vamos supor que você queira avaliar o conhecimento de estatística adquirido

pelos acadêmicos das 1ª fases dos cursos de Engenharia de uma Faculdade, no
final do semestre 2012-2. Ao invés de aplicar uma prova a 90 alunos matriculados
na disciplina, você poderá trabalhar com uma amostra de 10% dos acadêmicos
matriculados, para isso, basta seguir os passos:
1 – Numere os acadêmicos de 01 a 90;

2 – Escreva os números, de 01 a 90, em pedaços iguais de um mesmo papel;
3 – Coloque os noventa papéis numerados numa urna ou embalagem similar;
4 – Mexa a embalagem com os papéis para misturar bem e retire, um a um, nove
papéis numerados para formar a amostra de 10% da população estudada; e
5 – Relacione os acadêmicos aos nove números sorteados da urna e aplique a

prova.
Esse procedimento é uma aplicação do método probabilístico de amostragem

aleatória simples.
Mas como proceder nas situações em que a popu-

lação e, consequentemente, a amostra são grandes?
44 Unidade 1
Com o intuito de facilitar a vida dos pesquisadores, foi elaborada uma Tabela de
Números Aleatórios, na qual os dez algarismos de 0 a 9 são disponibilizados ao
acaso nas linhas e colunas, conforme mostra o anexo 1.
Para definir os elementos de uma amostra fazendo uso da Tabela de Números

Aleatórios, em um primeiro momento, sorteia-se um algarismo qualquer, a par-
tir do qual o pesquisador considerará números de dois, três ou mais algarismos,
conforme sua necessidade.
Os números da tabela podem ser selecionados de cima para baixo ou vice-verso,

da esquerda para direita ou vice-verso, em diagonal como costumam aparecer em
palavras cruzadas e também, na forma de letras desenhadas (o A, por exemplo).
Segundo Barbetta (2007, p. 46): “não existe forma espe-

cífica para extrair os números da tabela.”. Escolhe-se uma
linha, coluna ou outra posição e ao selecionar os núme-
ros, devem ser desprezados aqueles que não pertencem
a população e os repetidos. A opção da escolha de leitura deve ser feita
antes de iniciar o processo de retirada dos números.
Assim, para entender como funciona a amostragem aleatória simples com uso da
tabela de números aleatórios, vamos rever o exemplo trabalhado anteriormente:
Vamos supor que você queira avaliar o conhecimento de estatística adquirido pe-
los acadêmicos das 1ª fases dos cursos de Engenharia de uma Faculdade, no final
do semestre 2012-2. Ao invés de aplicar uma prova nos 90 alunos matriculados
na disciplina, você poderá trabalhar com uma amostra de 10% dos acadêmicos
matriculados, usando a tabela de números aleatórios:
1 – Numere os acadêmicos de 01 a 90
2 – Adote, para este exemplo, a 18ª linha da tabela (anexo 1), mas não esqueça a
escolha da linha, coluna é combinada antes de iniciar o processo.
3 – Tome 9 números (10% da população), de 2 algarismos, visto que o maior
Unidade 1 45
número da população é o 90 e, esse possui dois algarismos;
Atento à tabela (anexo 1), você encontrará os números: 61; 02; 01; 81; 73; 92; 60;
66; 73; 58; 53; 34;
4 – Despreze aqueles que não pertencem à população e os que se repetem, e ob-

terá assim, os números: 61; 02; 01; 81; 73; 60; 66; 58; 53.
Esses números formarão a amostra em estudo, os quais devem ser relacionados

ao número dos respectivos acadêmicos, para que a prova de conhecimento seja
aplicada e, com os resultados, infere-se um parecer.
b) Amostragem Aleatória Estratificada
Na Amostragem Estratificada, a escolha da amostra também é aleatória, porém

em grupos (estratos) com características em comum, buscando representar sig-
nificativamente a população.
Nessa técnica são escolhidos elementos que atendam a necessidades específicas

de cada pesquisa. Por exemplo: donas de casa da classe D, jovens da classe A, alu-
nos aprovados na 1ª etapa do concurso, usuários do sexo masculino, etc.
Ao se aplicar a amostragem estartificada do tipo proporcional, mantêm-se a pro-

porcionalidade do tamanho da amostra para cada estrato. Por exemplo, se um
estrato refere-se a 10% da população, ele também representará 10% da amostra
(BARBETTA, REIS e BORNIA, 2010).
Exemplo prático:
Agora, ao verificar qual é o editor de texto entre o Microsoft Word, BrOffice.org

Writer e o Google Writely mais utilizado em um universo estatístico de 1000
usuários, sabendo que a maioria dos usuários é do sexo feminino, aplica-se uma
técnica de proporcionalidade, ou seja, deverá trabalhar com uma amostra de
10%. Dos 1000 usuários, 650 são do sexo feminino e 350 do sexo masculino, logo
se faz necessário sortear aleatoriamente 65 pessoas do grupo feminino e 35 do
grupo masculino, somando um total de 100 usuários que correspondem a 10%
dos 1000 usuários (população).
46 Unidade 1
Retomando o exemplo tratado no item amostragem aleatória simples e supon-
do que dos 90 acadêmicos da 1ª fase dos cursos de Engenharia que cursaram a
disciplina de estatística, 54 sejam do sexo masculino e 36 do sexo feminino, para
obter uma amostra estratificada proporcional, trabalha-se, neste caso, com dois
estratos: o do sexo masculino e o do sexo feminino, e uma amostra de 10% dos
acadêmicos, conforme mostra à Tabela. 4:
Tabela 4 – Primeira etapa da amostra estratificada
SEXO POPULAÇÃO 10% AMOSTRA
Masculino 54 10 x 54
100
= 5,4 5
Feminino 36 10 x 36
100
= 3,6 4
Total 90 10 x 90
100 = 9,0 9
Fonte: Crespo (2009, p. 13), adaptada
Na sequência, numeram-se os acadêmicos de 01 a 90, sendo numerados os ho-

mens de 01 a 54 e as mulheres de 55 a 90. Feito isso, sorteia-se a linha/coluna a ser
aplicada na tabela de números aleatórios. Para este exemplo, será usada a 1ª linha
e 2ª coluna da esquerda, de cima para baixo, obtendo-se os números:
57; 28; 92; 90; 80; 22; 56; 79; 53; 18; 53; 03; 27; 05 e 40.
Atenção: eliminam-se os números que não perten-

cem à população e os que se repetem, lembra-se?
Resultando assim nas amostras:
- para os do sexo masculino: 28; 22; 53; 18; 03; e
- para os do sexo feminino: 57; 90; 80; 56
Viu como não é tão complicado!
Unidade 1 47
Agora, relaciona-se o número aos acadêmicos e aplica-se a prova de conheci-
mento com amostra de 10% da população para inferir um parecer final.
▪ Você entendeu a diferença entre a estratificada e a
aleatória simples?
▪ Na aleatória simples corremos o risco de entrevistar
mais homens do que mulheres, enquanto que na es-
tratificada será selecionado aleatoriamente, porém de
forma proporcional, a cada grupo de sexo.
c) Amostragem Sistemática
Neste método de amostragem, o início da pesquisa também é aleatório, escolhe-

-se aleatoriamente um elemento da população e as demais são feitas em interva-
los de tempo. (BRUNI, 2008)
Um exemplo típico deste método são as pesquisas de boca de urna, em que se

evita formar uma amostra com o mesmo grupo, por meio das quais são reali-
zadas entrevistas com uma distância entre os entrevistados e em intervalos de
tempo definido, diminuindo assim a margem de erro. A cada seis pessoas que
passam, por exemplo, entrevista-se uma.
Para facilitar o processo, seguem-se os passos:

1 – Calcula-se o intervalo de seleção, dado por I =
N
n (I = Intervalo; N = Nº de
elementos da população e n = Nº de elementos da amostra), desprezando as de-
cimais;
2 – Sorteia-se o primeiro elemento do conjunto definido pelo intervalo, (1; ..., I);
e
3 – Obtêm-se a amostra, retirando um elemento a cada I (intervalo definido).
48 Unidade 1
Para exemplificar, considere o problema de extrair uma amostra sistemática de
tamanho 5 da seguinte população de acadêmicos matriculados em Cálculo 1, na
turma X, sendo identificado cada aluno com seu número de registro do diário do
professor, conforme relação dada a seguir:
01 – Aline 09 – Elton 17 – Humberto 25 – Marcelo

02 – Ari 10 – Fábio 18 – Ingrid 26 – Marcos
03 – Beatriz 11 – Fernanda 19 – Jonas 27 – Maria
04 – Bruno 12 – Fernando 20 – Juliana 28 – Natália
05 – Camilo 13 – Gabriel 21 – Júlio 29 – Paulo
06 – Carlos 14 – Gabriela 22 – Laura 30 – Pedro
07 – Diego 15 – Giovane 23 – Leandro 31 – Sabrina
08 – Eliane 16 – Helena 24 – Liliane 32 – Vilson
Como a amostra será composta por 5 elementos e a população contém 32 aca-

dêmicos, o intervalo será de 6 elementos, ou seja I = 32 = 6,4 desprezando-se a
5
decimal, I = 6, logo, sorteia-se um elemento entre os 6 primeiros elementos: (1; 2;
3; 4; 5; 6). Supondo-se que foi sorteado o 3, o primeiro acadêmico a fazer parte da
amostra será o de número 3, a “Beatriz”. Os demais componentes da amostra são
obtidos por meio do intervalo (I = 6) definido, resultando na seguinte amostra:
03; 09; 15; 21 e 27.
Relacionando esses números aos respectivos alunos, têm-se a amostra represen-

tativa, dada por: Beatriz; Elton; Giovane; Júlio e Maria.
Outro exemplo:
Suponhamos um loteamento contendo 150 casas, das quais se deseja obter uma
amostra formada com 15 casas, ou seja, uma amostra de 10%.
Para aplicar o método sistemático, primeiro se calcula o intervalo a ser adotado:

I=N , neste caso, I = 150 = 10; depois se sorteia um número entre o intervalo
n 15
definido (1; 2; 3; ...; 10) para ser o primeiro componente da amostra e os demais,
sistematicamente, percorre-se o intervalo de 10 em 10. Logo, se o número sorte-
Unidade 1 49
ado foi o 2, adota-se pelo lado direito ou esquerdo (o que for decidido) a 2ª casa
do loteamento; a 12ª; a 22ª; a 32ª; a 42ª; a 52ª; etc até formar a amostra com 15
elementos, retornando ao início do loteamento, pelo lado contrário.
d) Amostragem por Conglomerado
Ao agrupamento de elementos de uma população, dá-se o nome de conglomera-

do. Tão logo, amostragem por conglomerado é o método utilizado nos casos em
que a população possui subdivisões, ou seja, conglomerados.
Esse tipo de amostragem tem o objetivo de selecionar elementos sobre os conglo-

merados e não mais amostras da população como um todo. A seleção poderá ser
de forma aleatória simples ou estratificada e, quando necessário, diretamente
do conglomerado.
Por exemplo, dentro do Estado de Santa Catarina podem-se selecionar alguns

municípios (conglomerados) para determinada pesquisa. A partir desses conglo-
merados, pode-se aplicar novamente os métodos de aleatória simples ou estratifi-
cada e obter amostras dos elementos que farão parte da pesquisa.
Ao avaliar a qualidade das maçãs de uma determinada carga, por exemplo, as

caixas de maçãs são os conglomerados a serem tratados na pesquisa.
Suponha, por exemplo, que você queira realizar uma pesquisa nas escolas esta-
duais do Estado de Santa Catarina para verificar como está o nível de satisfação
profissional dos professores do quadro efetivo, nos últimos dois anos.
Em um primeiro momento, irá de forma aleatória simples ou estratificada sortear

alguns municípios de SC (Criciúma, Tubarão...); após definir os conglomerados,
poderá novamente aplicar um dos métodos para extrair indivíduos dos municí-
pios definidos que farão parte da amostra.
50 Unidade 1
DICA
Dentre as técnicas de amostragens probabilísticas, as aleatórias simples e

as estratificadas tendem a resultados mais precisos quando comparadas as
amostragens de conglomerados com uma amostra de mesmo tamanho. Mas em contrapar-
tida, em questões financeiras a técnica de conglomerado se mostra mais eficaz.
Agora, vamos falar um pouco sobre as amostragens não probabilísticas:
a) Amostragem Acidental;
b) Amostragem Intencional; e
c) Amostragem por Cotas.
a) Amostragem Acidental
Neste método, o pesquisador busca ser o mais aleatório possível, mas nem sem-
pre consegue, pois a característica desta amostragem é a formação da amostra
com elementos escolhidos ao acaso, acidentalmente, como o próprio nome in-
dica ou a esmo. (GESSER; DALPIAZ, 2007)
Esse tipo de amostragem é comum de ser realizada em pesquisas de opinião; em

pesquisas qualitativas no geral; em populações impossíveis de serem contadas
(enumeradas) e nos casos em que as populações são compostas por material con-
tínuo como: líquidos, minérios, gases, sendo suficiente homogeneizar e reter a
amostra, como, por exemplo, no caso de examinar uma carga de argila ao chegar
à fábrica.
DICA
Por mais que a amostragem acidental em algumas situações pareça produzir
uma amostra similar a uma amostra obtida com o método de amostragem
aleatória simples, nem sempre isso ocorre, esses métodos são diferentes.
Unidade 1 51
Basta pensar no exemplo:
Se numa pesquisa, com o foco em saber qual o melhor supermercado, do mu-

nicípio de Criciúma, as pessoas forem entrevistadas acidentalmente nas ruas
mais movimentadas, como avenida Centenário e ruas próximas algum super-
mercado, consequentemente, as pessoas que passam com maior frequências
nessas localidades tendem a ser selecionadas, tao logo, pode haver distorção nos
resultados.
▪ Sabe-se que a amostragem aleatória simples ga-
rante que cada elemento da população tenha a
mesma probabilidade de fazer parte da amostra,
então pode haver viés nos resultados da pesquisa?
b) Amostragem Intencional (Por Julgamento)
O pesquisador seleciona os componentes da amostra por meio de critérios que

considera ser relevante ao estudo. Por se tratar de uma escolha intencional, de
preferência do pesquisador, os riscos são consideráveis, podendo levar a pes-
quisa a resultados errôneos, inutilizando-a. (GESSER; DALPIAZ, 2007)
Exemplo: Suponha que o diretor de uma empresa queira avaliar a satisfação

quanto aos serviços prestados pelos seus fornecedores e o pesquisador escolha
somente os funcionários que, de certa forma, têm vínculos com os fornece-
dores, tendo interesse em mantê-los. Dessa forma, a amostra poderá representar
um resultado extremamente equivocado à realidade da empresa.
c) Amostragem por Cotas
A amostragem por cotas é muito parecida com a estratificada, porém nesta não
se aplica sorteio. Neste método, os elementos da população são subdivididos em
grupos e, consequentemente, as amostras formadas com número proporcional
ao tamanho dos subgrupos. (GESSER; DALPIAZ, 2007)
52 Unidade 1
Durante as campanhas eleitorais é comum ouvirmos falar em tendências elei-
torais de acordo com o IBOPE, mas como são realizadas essas pesquisas? Você
saberia dizer?
Nessas pesquisas, cada segmento da população representado na amostra é sele-

cionado na proporção aproximada em que aparece na sociedade.
Por exemplo: Para verificarmos entre os eleitores de determinado município,

em que 60% dos eleitores são homens e 40% mulheres, o número de entrevista
seguirá essa proporção, a cada 10 entrevistas realizadas serão entrevistados 6
homens e 4 mulheres. Caso isso não seja possível, são feitos cálculos estatísticos
que atribuem um peso à entrevista de acordo com a representação de cada seg-
mento na sociedade, visto que esse tipo de pesquisa serve para identificar uma
tendência e não o resultado final da eleição.
4.3 Tamanho de uma amostra
Para que a amostra definida seja realmente representativa e confiável, alguns es-
pecialistas costumam usar um processo com quatro fases que defina o tamanho
da amostra a ser trabalhada. Porém, esse conteúdo teoricamente ainda apresenta
certas desavenças e costuma, na prática, ser diferenciado para cada pesquisa de
acordo com o conhecimento dos profissionais envolvidos.
Para nossos estudos adotaremos no uso da técnica de amostragem estartificada,

por exemplo, também o processo a seguir:
1º) Calcula-se a amostra ideal usando a fórmula: n0 = 1

(E0)2
DICA
O E0 (erro) deverá ser usado em forma de coeficiente e nunca em %.
Por exemplo: 6% =
6 = 0,06.
100
Unidade 1 53
2º) Calcula-se a amostra mínima através da fórmula: n = N . n0
N + n0
3º) Calcula-se o que chamamos de Estimador da amostra: N 100%

n x
4º) Aplica-se o Estimador a cada estrato, porção.
Glossário
n0 = Tamanho referente à amostra ideal (conhecida como primeira aproximação);
E0 = Refere-se ao erro amostral permitido, ou seja, tolerável;
N = Tamanho da população; e
n = Tamanho da amostra propriamente dita.
Para compreender melhor como se calcula, siga o exemplo a seguir:
Suponha que você queira determinar o tamanho mínimo da amostra aleatória

simples necessária para garantir a representatividade de um universo estatístico
de acadêmicos matriculados na Faculdade X, de Criciúma, em 2010-2, podendo
admitir que os erros amostrais não ultrapassem a 5%, utilizando a Tabela. 5:
Tabela 5 - Matrículas dos cursos de graduação da

Faculdade X em 2010-2
CURSO ACADÊMICOS
Design Gráfico 870
Engenharia Elétrica 662
Engenharia da Computação 1555
Engenharia Mecânica 245
Engenharia Química 529
Jornalismo 340
Publicidade e Propaganda 2423
Tecnologia em Automação Industrial 370
Tecnologia em Manutenção Industrial 577
Tecnologia em Segurança do Trabalho 945
TOTAL 8516
Fonte: Gesser e Dalpiaz (2007, p. 46), adaptada.
54 Unidade 1
Logo:
1º) Amostra ideal: n0 = 1

2
(E0)
Como o erro amostral é de 5%, tem-se: 5% = 5 = 0,05.
100
1 1 = 400 acadêmicos
n0 = 1 2 = =
(E0) (0,05)2 0,0025
2º) Calcula-se a amostra mínima: n = N . n0

N + n0
Sendo N = 8516, tem-se:
n = 8516 . 400 =
3406400 = 382,05 = 382 acadêmicos
8516 + 400 8916
3º) Calcula-se o Estimador da amostra, usando uma regra de três:
N 100% 8516 100% x = 382 . 100

=
n x 382 x 8516
x = 38200 x = 4,49%
8516
4º) Agora, aplica-se o Estimador a cada estrato, (estrato vezes o estimador), ou
seja, multiplica-se o número de acadêmicos de cada curso pelo estimador:
Design Gráfico =
870 . 4,49% = 870 . 4,49 = 3906,3 = 39,063

100 100
arredondando 39 acadêmicos.
Unidade 1 55
Aplicando esse cálculo para cada curso, obtêm-se a amostra, conforme mostra a
Tabela 6:
Tabela 6 - Matrículas dos cursos de graduação da Faculdade X em

2010-2
CURSO ACADÊMICOS AMOSTRA
Design Gráfico 870 39
Engenharia Elétrica 662 30
Engenharia da Computação 1555 70
Engenharia Mecânica 245 11
Engenharia Química 529 24
Jornalismo 340 15
Publicidade e Propaganda 2423 109
Tecnologia em Automação Industrial 370 17
Tecnologia em Manutenção Industrial 577 26
Tecnologia em Segurança do Trabalho 945 42
TOTAL 8516 383
Portanto, a amostra total é de 383 acadêmicos. Os resultados foram arredonda-

dos, por se tratar de variáveis discretas, ou seja, pessoas.
Agora, que tal aprimorar seus conhecimentos resolvendo os exercícios deste

módulo?
56 Unidade 1
Síntese do módulo
Neste módulo, foram apresentadas as técnicas de coleta de dados, podendo ser

realizadas com reposição ou não. Você estudou os princípios relacionados a Cen-
so e Amostragem, permitindo-lhe aplicá-los a partir de agora de forma correta.
Aprendeu, a diferenciar as amostragens probabilísticas das não probabilísticas,
assim como aplicá-las por meio da teoria e visualização de alguns exemplos. Co-
nheceu um modelo de tabela de números aleatórios e o seu processo e, para fi-
nalizar, foi abordado como calcular o tamanho mínimo de uma amostra, tendo a
oportunidade de aplicar a teoria na prática, caso se depare com tal necessidade.
ATIVIDADES

1) A escola de informática SMT possui um total de 124 alunos matriculados.

Obtenha uma amostra representativa correspondente a 15% da população. Para
resolver, use a tabela de números aleatórios (anexo 1), começando na 1ª linha da
esquerda para direita.
Unidade 1 57
2) Os dados a seguir referem-se a uma população formada por 140 notas (pon-
tuação geral) resultantes da aplicação de uma prova de concurso para eletricista:
62 129 95 123 81 93 105 95 96 80 87 110 139 75

123 60 72 86 108 120 57 113 65 108 90 137 74 106
109 84 121 60 128 100 72 119 103 128 80 99 149 85
77 91 51 100 63 107 76 82 110 63 131 65 114 103
104 107 63 117 116 86 115 62 122 92 102 113 74 78
69 116 82 95 72 121 52 80 100 85 117 85 102 106
94 84 123 42 90 91 81 116 73 79 98 82 69 102
100 79 101 98 110 95 67 77 91 95 74 90 134 94
79 92 73 83 74 125 101 82 71 75 101 102 78 108
125 56 86 98 106 72 117 89 99 86 82 57 106 90
Obtenha uma amostra formada por 26 elementos, utilizando a tabela de números

aleatórios (anexo 1), dando início na 1ª linha da esquerda para direita.
3) Suponha que uma população apresenta-se dividida conforme sua classe so-
cial: baixa, média e alta, respectivamente, com tamanhos: n1 = 40, n2 = 60 e n3 =
100. Sabendo-se que ao ser realizada uma amostragem do tipo estratificada, 15
elementos da amostra foram retirados do 3º estrato, determine o número total de
elementos da amostra.
58 Unidade 1
Exercícios complementares
Para fecharmos a unidade 1, sugiro que você exercite seus conhecimentos ad-
quiridos, desenvolvendo as atividades complementares com questões baseadas
em provas como as do ENADE; concursos do IBGE, CELESC e outros, sempre
atento ao apoio que a Estatística nos dá para tomada de decisões.
1) No dia a dia é comum encontrarmos noticias com dados estatísticos em jor-

nais, revistas e outros meios de comunicação. Cabe a nós analisarmos sua vera-
cidade, só assim conseguiremos tomar decisões com maior segurança. Suponha
então que você leia a seguinte notícia:
“A Faculdade X no município de Tubarão/SC está oferecendo vagas gratuitas

para os 15 primeiros inscritos no curso de Medicina pelo ingresso sem vestibu-
lar. Aproveite esta oportunidade, é impar no estado catarinense na rede privada,
na educação!”
Você, no papel de diretor de outra instituição de ensino, de nível superior, no

Estado, como procederia após as 24 horas ao ler a notícia? Escreva três iniciativas
cabíveis a situação.
2) O profissional da área de estatística, interage com profissionais da área de: en-

genharia mecânica; engenharia elétrica; engenharia da computação; engenharia
química; tecnologia de automação e outras áreas do conhecimento, utilizando
técnicas e ferramentas que dão suporte à tomada de decisão na presença das
certezas e incertezas cotidianas. Mas, a incerteza os leva, em algumas situações, á
má aplicação desses recursos, ocasionando interpretações errôneas da realidade.
Leia com atenção as histórias A e B em quadrinho:
Unidade 1 59
História A História B
Eticamente e tecnicamente, qual critica um profissional da área de Estatística

deve fazer ao analisar a situação descrita na história de quadrinhos A? Contextu-
alize, justifique sua resposta.
60 Unidade 1
3) Com objetivo de promover a inclusão digital, os países em desenvolvimento
buscam investir em tecnologias para uso da comunidade em geral. Um dos indi-
cadores empregados tem sido o número de computadores que estão conectados
à Internet. Observe como se deu a evolução do número de computadores conec-
tados à Internet (hosts) nos três países que lideram o setor na América Latina,
durante o período de 2000 a 2004, analisando a tabela e gráfico a seguir:
Tabela – Número de computadores conectados à Internet,
período 2000 a 2004
2000 2001 2002 2003 2004
Argentina 142470 270275 465359 495920 742358
Brasil 446444 876596 1644575 2237527 3163349
México 404873 559165 918288 1107795 1333406
Fonte: Internet Systems Consortium, adaptada.
Gráfico – Número de computadores conectados à Internet

3500000
3000000
2500000
2000000 Argentina
Brasil
1500000
México
1000000
500000
0
1999 2000 2001 2002 2003 2004 2005
Fonte: Internet Systems Consortium, adaptado.

Dentre os três países da América Latina, os que apresentaram o menor e o maior
crescimento percentual no número de hosts, durante o período de 2000 a 2004
foram, respectivamente:
a) Brasil e Argentina.
b) México e Argentina.
c) Argentina e México.
d) Argentina e Brasil.
e) México e Brasil
Unidade 1 61
4) População refere-se ao conjunto de indivíduos, objetos observados, portado-
res de pelo menos uma característica em comum. Mas, nem sempre se conse-
gue trabalhar com todos esses elementos, por questões financeiras e de tempo,
estatisticamente, faz-se necessário estudar amostras significativas, subconjunto,
parte da população. Com foco nos conceitos descritos, leia as sentenças a seguir
e identifique a população e amostra referente a cada item:
a) A fim de avaliar a intenção de voto para próxima eleição para governador de

Santa Catarina, pessoas maiores de idade foram entrevistadas nos maiores mu-
nicípios catarinenses.
b) Para avaliar o resultado de uma campanha de vacinação no Estado de Santa

Catarina, mães de crianças recém-nascidas durante o segundo semestre de 2012,
foram questionadas a respeito da última vez que vacinaram seus filhos.
c) Para verificar a audiência de um programa de TV matutino no município de

Criciúma voltado para crianças até sete anos, indivíduos foram entrevistados
com relação ao canal em que estavam sintonizados.
5) O gerente de RH, da empresa X, a pedido do diretor da empresa, com o intui-

to de auxiliar a área de TI na informatização do setor, apresentou o resumo do
quadro de funcionários do departamento de contabilidade, conforme mostra a
tabela:
Funcionário Idade Escolaridade Salário (R$) Tempo de empresa
Paulo 34 Superior 2.380,00 5

Ricardo 43 Superior 3.452,68 7
Fernanda 21 Médio 780,52 2
Cintia 25 Médio 600 1
João 19 Fundamental 596 1
Fonte: Autora – Dados fictícios
Para dar início ao processo como deverão ser classificadas as variáveis envolvi-
das?
62 Unidade 1
6) (Adaptado, ENADE 2011) A Educação a Distância (EaD) é a modalidade de
ensino que permite que a comunicação e a construção do conhecimento entre os
usuários envolvidos possam acontecer em locais e tempos distintos. São neces-
sárias tecnologias cada vez mais sofisticadas para essa modalidade de ensino não
presencial, com vistas à crescente necessidade de uma pedagogia que se desen-
volva por meio de novas relações de ensino-aprendizagem.
O Censo da Educação Superior de 2009, realizado pelo MEC/INEP, aponta para

o aumento expressivo do número de matrículas nessa modalidade. Entre 2004 e
2009, a participação da EaD na Educação Superior passou de 1,4% para 14,1%,
totalizando 838 mil matrículas, das quais 50% em cursos de licenciatura. Levan-
tamentos apontam ainda que 37% dos estudantes de EaD estão na pós-graduação
e que 42% estão fora do seu estado de origem.
Considerando as informações acima, enumere três vantagens de um curso a dis-

tância, justificando brevemente cada uma delas.
Na sequencia explique a diferença entre as técnicas censo e amostragem aborda-

das estatisticamente neste livro.
Unidade 1 63
7) (IBGE, 2.010) Para evitar o grande gasto de tempo e de recursos que haveria se
toda a população tivesse de responder ao questionário completo, o IBGE adota
a técnica de:
a) pesquisa demográfica, na qual os moradores que assim o desejarem recebem

um questionário minucioso para ser respondido e, posteriormente, entregue;
b) realização de entrevistas, em que, na maior parte dos domicílios, os morado-

res respondem a questionários escritos, enquanto, em um número reduzido de
domicílios, são realizadas entrevistas mais simples;
c) amostragem, na qual alguns domicílios são selecionados para o responsável

responder a esse questionário, de forma que suas respostas representem a do
conjunto total;
d) registro de dados, por meio do qual os moradores de domicílios dotados de

computador e acesso à Internet devem, necessariamente, enviar seus dados por
meio eletrônico.
8) Explique a forma de se obter uma amostragem estratificada dos professores

de uma instituição de ensino superior, considerando que existem professores em
tempo integral; horistas e visitantes.
9) As pesquisas de intenção de voto aplicadas no decorrer de campanhas eleito-

rais, para que apresentem maior segurança costumam fazer uso da amostragem
probabilística sistemática, por quê? Como procede este tipo de amostragem? Re-
late o processo simulando um exemplo para entrevistar 10% de um total de 100
acadêmicos que tendem a participara da eleição para o coordenador do Centro
Acadêmico da instituição X.
10) Pedro, bacharel na área de estatística, está desenvolvendo um modelo para

prever o risco de crédito para o banco X, em Criciúma. Esse sistema será adotado
para conceder ou não crédito a um cliente da categoria correntista. A base de
dados da carteira de clientes revelou que 30.000 contratos foram quitados em dia
ou com atraso máximo de 1 mês e 10.000 foram quitados com atraso superior a
1 mês.
64 Unidade 1
Para reduzir os custos de implantação, Pedro poderá trabalhar somente com
4.000 contratos, considerando assim os 40.000 contratos a sua população de in-
teresse. Estando os contratos numerados de 1 a 40.000, com os primeiros 30.000
correspondendo aos contratos em dia financeiramente. Pedro precisa estimar a
média da idade do financeiramente. Por experiência, na área, sabe que a popula-
ção quanto mais jovem, maior é o índice de inadimplência.
Objetivando reduzir o erro-padrão do estimador da média da idade do financia-

mento, Pedro deverá aplicar qual dos procedimentos de amostragem:
a) Sorteie um número inteiro entre 1 e 10 e a partir do número que for sorteado,

selecione os contratos adotando um intervalo na sequência de 10 em 10, até que
4.000 contratos sejam selecionados.
b) Sorteie 3.000 números inteiros de 1 a 30.000 e 1.000 números inteiros de

30.001 a 40.000, por meio de amostragem aleatória simples sem reposição. Ado-
tando como amostra os contratos relacionados aos números sorteados.
c) Sorteie 2.000 números inteiros de 1 a 30.000 e 2.000 números inteiros de 30.001

a 40.000, por meio de amostragem aleatória simples sem reposição. Adotando
como amostra os contratos relacionados aos números sorteados.
d) Sorteie 4.000 números inteiros de 1 a 40.000, por meio de amostragem alea-

tória simples sem reposição. Adotando como amostra os contratos relacionados
aos números sorteados.
e) Sorteie 4.000 números inteiros de 1 a 40.000, por meio de amostragem alea-

tória simples com reposição. Adotando como amostra os contratos relacionados
aos números sorteados.
Unidade 1 65
Unidade 2
Análise exploratória de dados 2

Estatisticamente não basta definirmos população, amostra e o tipo
de amostragem para se chegar a conclusões relevantes a respeito
das variáveis medidas. Após coletar os dados, os pesquisadores
precisam desenvolver o procedimento de Análise exploratória de
dados, que auxilie os gestores nas possíveis tomadas de decisão.
Mas como realizam este procedimento?
Organizam os dados coletados de forma resumida em

tabelas, gráficos e através de medidas estatísticas e, na
sequência analisam e interpretam esses dados, buscando
padrões representativos da população (REIS, 2008).
Esta fase refere-se a estatistica descritiva e, por facilidade,

costuma ser trabalhada com apoio computacional, por meio
de planilhas eletrônicas, banco de dados, softwares estatísticos
específicos, mas nada o impede de realizá-la manualmente.
Vamos conhecer tais recursos descritivos?? ■
Unidade 2 67
Módulo 5
Escalas e outras medidas

estatísticas
Ao se realizar uma pesquisa, os fenômenos (elementos da população ou amos-
tra) são representados por meio de escalas1 , as quais variam conforme o nível de
mensuração das variáveis.
Tão logo, este módulo irá apresentar os tipos de escalas que os especialistas cos-
tumam utilizar durante o desenvolvimento estatístico, assim como outras medi-
das matemáticas que podem vir a ser aplicadas, como: proporção, índices, coefi-
cientes e outros.
Vamos em frente?!
1
De acordo com Gesser e Dalpiaz (2007, p. 17), “as escalas são séries de unidades que
representam o grau de variação da dimensão que está sendo medida”.
Unidade 2 69
5.1 Escalas estatísticas
Existem quatro tipos de escalas de medidas: nominal; ordinal; intervalar e de

razão.
a) Escala Nominal
Neste tipo de escala, as variáveis são divididas em categorias, de acordo com

suas características (atributos). São utilizadas, principalmente em pesquisas que
tratam variáveis qualitativas, como partidos políticos, sexo, religião entre outros
exemplos.
Na escala nominal, pode-se calcular a medida moda e trabalhar com porcenta-

gens, conforme mostra a Tabela 7:
Tabela 7 - Sexo dos professores da Escola X – Criciúma –

2012
NÚMERO DE
SEXO %
PROFESSORES
Feminino 30 75
Masculino 10 25
Total 40 100
Fonte: Autora
A porcentagem é calculada dividindo-se a parcela em questão (neste exemplo, o

número de professores, do sexo feminino e do sexo masculino) pelo total (total
de professores) e multiplica-se o resultado por 100. Conforme o exemplo dado:
Feminino: 30 . 100 = 75% Masculino: 10 . 100 = 25%

40 40
b) Escala Ordinal
Esta escala é utilizada para representar a posição em que se encontra o elemento

da população ou amostra em um patamar ordenado. A escala ordinal pode ser
70 Unidade 2
mostrada, usando-se: numerais ou ranking.
1) Numerais: usam-se os números naturais, 0, 1, 2, ..., para representar a classi-

ficação dos elementos envolvidos na pesquisa, por exemplo: pontuação em con-
cursos, pontos obtidos em uma avaliação, pontos em competições esportivas, etc.
Nesta escala, o “0” é a menor pontuação, “1” é a pontuação imediatamente acima
e assim por diante, até atingir o número máximo pré-definido.
2) Ranking: escalas ordenadas do tipo: A, B, C, D,...; ouro, prata e bronze; 1º, 2º e

3º lugar, nos quais o maior valor é o primeiro, o segundo é o valor imediatamente
abaixo, etc. Nas escalas ordinais consegue-se calcular as medidas de tendência
central (a ser estudadas posteriormente), igualdades e ordem. O nível de instru-
ção e status socioeconômico, conceitos obtidos no Mestrado, etc., são exemplos
de medidas em escala ordinal.
Tabela 8 – Classificação no xadrez dos jogos estudantis – Escola X – 2012

MEDALHAS ATLETA
Ouro Ana Paula
Prata Silvia
Bronze João
Fonte: Autora
c)Escala Intervalar
São escalas utilizadas para registrar um fenômeno observado de forma quantita-

tiva, inserido dentro de um intervalo, por exemplo de zero a dois, dois a quatro,
etc.
Esta escala é utilizada quando se pretende comparar intervalos e, em casos em

que se quer medir o quanto uma preferência distância-se de outra, de acordo
com suas características e quantidade dessas características, propriamente dito.
São exemplos de variáveis representadas em escalas intervalares: idades de um

grupo de pessoas, notas dos alunos, temperaturas dos municípios catarinenses,
etc.
Unidade 2 71
Por meio dessas escalas intervalares, podem-se calcular as medidas de tendência
central, posição, dispersão, correlações e inferências, medidas estas a serem estu-
dadas posteriormente.
Para a melhor compreensão dessa escala, segue como exemplo a Tabela 9.
Tabela 9 - Notas semestrais de Cálculo da Turma 510

Faculdade X – Semestre 2012-2
I NOTAS NÚMERO DE ALUNOS ( fi )

1 0 l 2 5
2 2 l 4 17
3 4 l 6 11
4 6 l 8 12
5 8 l 10 5
TOTAL 50
Fonte: Autora
d) Escala De Razão
Esta escala é utilizada para quantificar os objetos de acordo com determinadas

características, “podendo ordená-los e apreciar a igualdade das diferenças e, so-
bretudo, a igualdade de razões”, segundo Gesser e Dalpiaz (2007, p. 20).
Para construção da escala, define-se um valor como sendo o ponto zero (fixo e
absoluto) e, a partir deste, constroem-se as razões, conforme mostra a Tabela 10.
Tabela 10 - Unidades de Vasilhas de suco de

laranja vendidas – Janeiro / 2013
I ml por frascos fi
1 500 12500
2 750 5000
3 1000 10000
4 1250 7500
5 1500 2500
Fonte: Autora
72 Unidade 2
Usando 500 ml como o ponto zero, pode-se chegar às seguintes razões com os
demais pontos para construir a tabela da escala de razão final:
750 = 1,5 1000 = 2 1250 = 2,5 1500 = 3

500 500 500 500
Conforme mostra a Tabela 11 reescrita:
Tabela 11 - Unidades de Vasilhas de suco

de laranja vendidas – Janeiro / 2013
I ml por frascos fi
1 1 12500
2 1,5 5000
3 2 10000
4 2,5 7500
5 3 2500
Fonte: Autora
Idade, peso, renda familiar, pressão, entre outros, são exemplos também de vari-
áveis que podem ser representadas em escalas de razão.
5.1 Dados estatísticos e suas possíveis traduções

matemáticas
Agora que você já conheceu os quatro tipos de escalas, é importante também
saber diferenciar dados absolutos de dados relativos além de saber trabalhar com
algumas medidas, como: proporções, porcentagens, coeficientes, taxas, índices,
além das já estudadas em estatística.
Vamos em frente!
Unidade 2 73
5.2.1 Dados absolutos
Os dados absolutos são aqueles obtidos diretamente da fonte e apresentados exa-

tamente como coletados, sem que sofram qualquer cálculo estatístico.
Porém, mesmo sendo apresentados na íntegra, esses dados não conseguem re-
fletir de imediato as suas conclusões numéricas, tão logo, faz-se necessário es-
tatisticamente, que os profissionais busquem melhores informações nos dados
relativos.
5.2.2 Dados relativos
Os dados relativos são bastante utilizados em comparações, resultantes de quo-

cientes que envolvam dados absolutos, permitindo aos interessados interpretar
melhor suas variáveis.
Esses dados numéricos costumam ser descritos usando as medidas matemáticas

de: proporções, porcentagens, taxas, coeficientes, razões e alguns índices.
Vamos entender como aplicá-los, diferenciá-los?
a)Proporções:
São as razões obtidas pelo quociente da parcela em questão e o total de elementos

informados. As proporções são medidas matemáticas muito utilizadas ao se fazer
comparações entre grupos, pela sua melhor compreensão estatística.
Tabela 12 - Religião dos grupos A e B de idosos do SESC – Criciúma/SC–2012-1

Grupo A Grupo B
Religião Número de Número de
Proporção Proporção
idosos idosos
Espírita 18 0,26 10 0,2
Católica 35 0,5 20 0,4
Evangélica 9 0,13 12 0,24
Luterana 6 0,08 5 0,1
Outras 2 0,03 3 0,06
Total 70 1 50 1
Fonte: Autora
74 Unidade 2
Ao analisar a Tab. 12, pode-se comparar os grupos e perceber que no grupo A
existem mais católicos do que no grupo B; em contrapartida, o grupo B possui
mais evangélicos comparados ao grupo A. Essas comparações são facilitadas na
estatística graças ao cálculo proporcional.
Para calcular uma proporção, usa-se a fórmula: Nº DE ELEMENTOS DA CATEGORIA ,

TOTAL DE ELEMENTOS
ou seja, tomando como exemplo os evangélicos do grupo A, tem-se:
9 = 0,128 = 0,13.
70
b) Porcentagens
Após o cálculo das proporções, multiplica-se o resultado por 100 e obtêm-se o

que chamamos de porcentagem.
Para entender a porcentagem, vamos analisar a Tab. 12, ampliada por meio do
exemplo a seguir:
Tabela 13 - Religião dos grupos A e B de idosos do SESC – Criciúma/SC – 2012-1

Grupo A Grupo B
Religião Número de Número de
Proporção % Proporção %
idosos ( fi ) idosos ( fi )
Espírita 18 0,26 26 10 0,2 20
Católica 35 0,5 50 20 0,4 40
Evangélica 9 0,13 13 12 0,24 24
Luterana 6 0,08 8 5 0,1 10
Outras 2 0,03 3 3 0,06 6
TOTAL 70 1 100 50 1 100
Fonte: Autora
Se você observar, basta acrescentar à fórmula da proporção a multiplicação, ou se

ja: Nº DE ELEMENTOS DA CATEGORIA . 100
TOTAL DE ELEMENTOS
Tomando como exemplo os evangélicos do grupo A, tem-se:

9
70 . 100 = 0,13 . 100 = 13%.
Unidade 2 75
DICA
Na porcentagem, o total da distribuição resulta em 100 (%), enquanto a pro-
porção trabalha com total igual a 1,00. Preste atenção, ok!
c) Razão
A razão é obtido calculando o quociente entre dois números. Mas atenção:
Exemplo: O gerente de uma grande empresa resolveu avaliar a satisfação dos

funcionários quanto ao horário de intervalo e chegou aos resultados de uma
amostra significativa composta por 750 funcionários: 200 funcionários foram
favoráveis; 250 contra e 300 funcionários preferiram não opinar.
200
Ao calcular a razão entre os favoráveis e os contra obteve: 250 = 0,8 , ou
seja, a cada 0,8 dos funcionários a favor do horário de intervalo existe 1 fun-
cionário contra. A razão pode ser calculada também por meio da simplificação
matemática: 200 = 20 = 4 a cada 4 funcionários favoráveis existe 5 contra o
250 25 5
Coeficientes
▪ Existe diferença entre proporção e razão? Sim, pois

enquanto a proporção nunca será superior a 1, a razão
poderá ser maior que 1.
76 Unidade 2
d) Coeficientes
Os coeficientes podem ser entendidos como a razão entre o número de ocor-

rências positivas ou negativas e o número total de elementos.
No dia a dia, é comum o uso de alguns coeficientes, entre eles:
número de nascimentos
- Coeficiente de natalidade =
população total
número de óbitos
- Coeficientes de mortalidade =
população total
Coeficientes educacionais:
número de alunos evadidos

- Coeficiente de evasão escolar =
número inicial de matrículas
número de alunos aprovados
- Coeficiente de aproveitamento escolar =
número final de matrículas
- Coeficientes de recuperação escolar = número de alunos recuperados

número de alunos em recuperação
Por exemplo:
A Pré-Escola SSI, de Criciúma/SC, em fevereiro de 2011, matriculou 245 crian-

ças. Em novembro, de 2011, a matrícula era de apenas 205 crianças, apresentan-
do um coeficiente de evasão de:
Coeficiente de evasão escolar =
número de alunos evadidos = 245 - 205 = 40 = 0,1633

número inicial de matrículas 245 245
e) Taxas
As taxas são os coeficientes multiplicados por 10; 100; 1000... , ou seja, potên-
cias de 10.
Por exemplo: você estudou que o coeficiente de natalidade é o quociente do

número de nascidos pela população total, logo, ao multiplicar o resultado por
Unidade 2 77
1.000, obterá o que chamamos de taxa de natalidade. O mesmo se aplica à taxa
de mortalidade; já à taxa de evasão escolar, multiplica-se o coeficiente de evasão
escolar por 100.
Tomando o exemplo trabalhado no subitem coeficiente, tem-se como taxa de

evasão escolar na Pré-Escola SSI, em 2011, 16,33%, sendo esta uma taxa consid-
erável preocupante para a escola, por ser considerada alta.
Vamos analisar outro exemplo?
Texto complementar
O Estado A apresentou 733.986 matrículas na 1ª série, no

início do ano de 1994, e 683.816 no fim do ano. O Estado B
apresentou, respectivamente, 436.127 e 412.457 matrículas.
Qual o Estado que apresentou maior evasão escolar?
A -> TEE = 733.986 - 683.816 . 100 = 0,0683 . 100 = 6,83 = 6,8 %

733.986
B -> TEE = 436.127 – 412.457 . 100 = 0,0542 . 100 = 5,42 = 5,4 %
436.127
O Estado que apresentou maior evasão escolar foi o Estado A.
Fonte: Crespo (2009, p. 27)
f) Índices
Os índices são as razões entre duas grandezas distintas..
Entre os índices existentes, iremos nos ater aos índices mais utilizados: quo-
ciente intelectual; densidade demográfica; e índices econômicos, formulados
a seguir:
* Quociente intelectual = idade mental . 100

idade cronológica
* Densidade demográfica =
população
superfície
78 Unidade 2
* Índices econômicos:
° Produção per capita = valor total da população
população
° Consumo per capita = consumo do bem

população
° Renda per capita = renda

população
° Receita per capita = receita

população
Por exemplo: Suponha que você queira saber qual foi o índice de densidade
demográfico apresentado por Minas Gerais, em 1992, de acordo com o IBGE?
Neste caso, basta visitar o site do IBGE (http://www.ibge.gov.br) onde encon-

trará as informações:
População = 15.957,6 mil habitantes; e
Superfície = 586.624 km2
Tão logo, terá o resultado, por meio da fórmula apresentada:
Densidade demográfica =
=
população = 15 . 957,6 = 0,0272024 . 1000 = 27,2 hab/km2
superfície 586 . 624
5.3 Arredondamento de números
Existem situações estatísticas em que os resultados são apresentados com núme-
ros decimais (com casas após a vírgula); e nem sempre o almejado é a quantidade
de dígitos expostos. Logo, nestes casos, o correto é aplicar técnicas matemáticas
de arredondamento, transformando-os em números inteiro, decimal, centésimo
e assim por diante.
Antes de aplicar qualquer técnica, define-se o número de casas decimais deseja-
Unidade 2 79
das: quando inteiro (não possui casas após a vírgula; decimal (1 casa); centésimo
(2 casas) e; milésimo (3 casas). Na sequência, identificam-se os dígitos remanes-
cente e o dígito considerado e, assim, aplica-se uma das três regras a seguir:
Glossário
Na porcentagem, o total da distribuição resulta em 100 (%), enquanto a pro-

porção trabalha com total igual a 1,00. Preste atenção, ok!
a) Quando o dígito considerado for maior ou igual a 6, usa-se a regra por exces-
so, acrescentando-se ao dígito remanescente uma unidade, conforme mostra o
exemplo:
Dado o número 4,3842, quando arredondado para decimal, torna-se 4,4. Preste
atenção, o número remanescente é o algarismo 4 e o considerado é o 8.
b) Quando o dígito considerado for menor que 5, usa-se a regra por falta, man-
tendo-se o dígito remanescente, conforme mostra o exemplo:
Dado o número 2,3842, quando arredondado para inteiro, torna-se 2. Preste

atenção, o número remanescente é o algarismo 2 e o considerado é o 3.
Já quando o dígito considerado for o número 5, faz-se necessário dar atenção aos
dígitos seguidos dele e aplica-se uma das regras a seguir:
1 - Quando o dígito considerado for o 5, acompanhado de dígitos maiores que

zero, ao dígito remanescente, acrescenta-se uma unidade, conforme mostra o
exemplo:
Dado o número 4,38501, quando arredondado para centésimo, torna-se 4,39.

Preste atenção, o dígito considerado é o 5 e depois dele existe um dígito diferente
de zero.
2 - Quando o dígito considerado for o 5, seguido somente de dígitos iguais a zero

ou, não for seguido de nenhum outro número, aplicam-se as particularidades
mostradas nos exemplos a seguir:
80 Unidade 2
- Dado o número 7,38500, quando arredondado para centésimo, torna-se 7,38.
Preste atenção, o dígito considerado é o 5 seguido de números iguais a zero, e o
remanescente é um dígito par ( = 8).
- Dado o número 7,375, quando arredondado para centésimo, torna-se 7,38.

Preste atenção, o dígito considerado é o 5 e não está seguido de nenhum número,
e o remanescente é um dígito ímpar ( = 7).
DICA
Não será alterado se o dígito remanescente for par; caso contrário, quando o
remanescente for ímpar, será acrescido de uma unidade.
Síntese do módulo
Neste módulo, foram apresentados os quatro tipos de escalas: nominal, ordinal,
intervalar e de razão; além das medidas estatísticas: proporção, porcentagem, co-
eficientes, taxas, razão. Também foram mostrados os principais índices utilizados
no dia a dia, na área da estatística, permitindo aos gestores realizar comparações
em diferentes grupos, para que, quando cabível for, consigam determinar algu-
mas melhorias de processo e produto, entre outras decisões empresariais. Mas,
para que o estudo ficasse completo, também foram abordados os tipos possíveis
de arredondamento numérico: por excesso, falta e seguido de cinco; de forma
correta e não puramente com aplicação do “achismo”.
Unidade 2 81
ATIVIDADES

1) Calcule a taxa de aprovação na disciplina de Metodologia Científica, de uma

turma de 45 acadêmicos, do curso de Tecnologia Educacional, sabendo que obti-
veram aprovação 36 acadêmicos.
2) Dada a série estatística a seguir, calcule suas respectivas porcentagens e, na

sequência, preencha a 3ª coluna da tabela:
Tabela - Alunos Matriculados na Escola JAT em 2012
SÉRIES ALUNOS MATRICULADOS %

1ª 546
2ª 328
3ª 280
4ª 120
TOTAL 1274
Fonte: Crespo (2009, p. 28), adapatada.
3) Arredonde os seguintes números, de acordo com as normas estudadas, até 2

casas depois da vírgula:
a) 3,5450
b) 21,489
c) 6,3552
d) 8,7531
e) 63,823
82 Unidade 2
Módulo 6
Tabelas estatísticas
As tabelas são quadros que servem para apresentar um resumo dos dados ob-
servados na pesquisa. Elas devem mostrar o comportamento das variáveis, da
forma mais simples possível, para que a compreensão dos dados seja facilitada e
benéfica ao estudo.
Unidade 2 83
6.1 Componentes de uma tabela
Para apresentação de dados estatísticos devemos fazer uso de tabelas que con-
templam os elementos:título, cabeçalho, corpo, coluna indicadora, linhas e célu-
las, conforme mostra a FIG. 2:
Figura 2 - Número de Alunos Regulares

Coluna Matriculados nas Fases de Direito em 2013-1
Indicadora Cabeçalho
Fases Número de Alunos
1ª 50
Título
2ª 41
Corpo 3ª 38 Linhas
4ª 37
5ª 36
TOTAL 202 Total
Rodapé Fonte: Autora
Glossário
Corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo;
Cabeçalho: parte superior da tabela que traz o conteúdo das colunas (variáveis);
Coluna indicadora: parte da tabela que especifica o conteúdo das linhas;
Linhas: retas no sentido horizontal que facilitam a leitura dos dados;
Célula: cada retângulo (espaço específico) para um só dado, como na tabela acima o nú-
mero 50;
Título: Conjunto de informações que relate as respostas: Para?, O quê?, Quando?, Onde?, se
pretende mostrar do estudo em questão. O título deverá aparecer sempre no topo da tabela.
Mas como você pode observar, além dos componentes essenciais, podem apa-
recer os complementares como o total, caso se aplique à situação em estudo
(devendo este aparecer sempre em destaque); o rodapé com a fonte da pesquisa
(identificando o responsável, pessoa física ou jurídica); entre outros.
84 Unidade 2
Texto complementar
“De acordo com as normas, nas casas ou células, devemos

colocar:
- um traço horizontal ( – ) quando o valor é zero, não só quanto à natu-

reza das coisas, como quanto ao resultados do inquérito;
- três pontos ( ... ) quando não temos os dados;
- um ponto de interrogação ( ? ) quando temos dúvida quanto à exati-

dão de determinado valor;
- zero ( 0 ) quando o valor é muito pequeno para ser expresso pela

unidade utilizada. Se os valores são expressos em numerais decimais,
precisamos acrescentar à parte decimal, um número correspondente
de zeros ( 0,0; 0,00; 0,000; ...).”
(CRESPO, 2009, p. 18)
Quanto à entrada de variáveis, as tabelas estatísticas podem ser consideradas:
• Tabelas simples: quando possuem uma entrada simples (uma variável de entra-
da);
• Tabelas compostas: quando possuem duas variáveis de entradas; e
• Tabelas múltiplas: quando possuem mais variáveis de entrada. (BRUNI, 2008)
6.2 Séries estatísticas
Agora que você já conhece os principais elementos de uma tabela, vamos estudar
os tipos específicos de tabelas e como classificá-las?
Segundo Crespo (2009, p. 18) “denominamos série estatística toda tabela que
Unidade 2 85
apresenta a distribuição de um conjunto de dados estatísticos em função da épo-
ca, do local ou da espécie.”.
As séries estatísticas são classificados em séries:
a) Temporais, históricas ou cronológicas;
b) Geográficas ou de localização;
c) Específicas ou categóricas;
d) Conjugadas ou mistas; e
e) De distribuição de frequências.
a) Nas séries temporais, históricas ou cronológicas, o conjunto de dados apre-

senta uma informação que se altera com a variação do tempo, conforme mostra
o exemplo da Tabela 14.
Tabela 14 - Evolução do Número de
Telefones Convencionais em Serviço em
Salvador 1995/1999
Ano Número
1995 305.701
1996 361.010
1997 432.216
1998 477.992
Fonte: Bruni (2008, p. 17)
b) Já nas séries geográficas ou de localização, o conjunto de dados apresenta

uma informação que se altera com a variação do local, conforme mostra o exem-
plo da Tabela 15.
Tabela 15 - Duração Média dos Estudos

Superiores - 1994
Países Número de Anos
Itália 7,5
Alemanha 7
França 7
Holanda 5,9
Inglaterra Menos de 4
86 Unidade 2
c) Nas séries específicas ou categóricas, o conjunto de dados apresenta uma
informação que se altera com a variação do fato, conforme você pode observar
no exemplo da Tabela 16:
Tabela 16 - Número de Telefones em Serviço
em Salvador em 1995
Tipo de Terminal Número
Convencionais 305.701
Residenciais 225.621
Não-Residenciais 49.982
Troncos 21.396
Terminais para PS 82
Tup’s 8620
d) Nas séries conjugadas ou mistas, o conjunto de dados apresenta uma infor-

mação combinada pelo menos por duas das séries anteriores, conforme mostra
o exemplo da Tabela 17.
Tabela 17: Terminais Telefônicos em Serviço - 1991-93

Regiões 1991 1992 1993
Norte 342.938 375.658 403.494
Nordeste 1.287.813 1.379.101 1.486.649
Sudeste 6.234.501 6.729.467 7.231.634
Sul 1.497.315 1.608.989 1.746.232
Centro-Oeste 713.357 778.925 884.822
DICA
Para melhor compreensão, observe o resumo na Tabela 18 a seguir:

Tabela 18 – Resumo das séries estatísticas
o “ONDE” (ou o “QUANDO” (ou
Séries Estatísticas o “QUE” (ou o fato)
local) tempo)
Apresenta
Temporais Permanece fixo Permanece fixo
variações
Geográficas Permanece fixo Apresenta Permanece fixo
Apresenta
Específicas Permanece fixo Permanece fixo
variações
Fonte: Bruni (2008, p. 16 -17). Adaptado.
Unidade 2 87
Até o momento, foram estudadas as séries estatísticas que costumam ser empre-
gadas na apresentação de dados qualitativos. Agora, vamos nos ater à série dis-
tribuição de frequência empregada, principalmente, para dados quantitativos.
e) Distribuição de frequências, nesta série, os fatores diferenciais permanecem

fixos, a variação ocorre na intensidade do fenômeno pesquisado, ou seja, na sua
frequência. Por exemplo:
Tabela 19 - Estaturas de 60 Alunos da Turma A
de Estatística, Escola X – 2012-2
Estaturas em cm Número de Alunos
140 l 145 11
145 l 150 17
150 l 155 12
155 l 160 3
160 l 165 5
165 l 170 2
170 l 175 10
TOTAL 60
Fonte: Crespo (2009, p. 21), adaptada.
A distribuição de frequência é uma excelente ferramenta para iniciar uma

análise.
No exemplo dado, pode-se observar que os fatores: época, local e espécie per-
manecem fixos:
- época: 2012-2;
- local: Turma A de Estatística, Escola X; e
- espécie: Estatura de 60 alunos.
O que varia é a intensidade, ou seja, o número de vezes que a estatura aparece.

Observe: os dados do estudo são numéricos.
A distribuição de frequência é, na verdade, um método de agrupamento de

classes, do qual se faz uso para melhor compreensão dos resultados de uma
pesquisa, de forma organizada e, devido a sua relevância no estudo de Estatís-
tica, abordaremos essa série com maior ênfase na próxima unidade.
88 Unidade 2
Síntese do módulo
Neste módulo, você teve a oportunidade de visualizar quais são os elementos es-
senciais ao construir e apresentar uma tabela, entre eles: o título e o corpo e out-
ros e, quais são os complementares que compõem uma tabela; ferramenta esta
de grande valia na apresentação já organizada dos dados coletados durante uma
pesquisa. Ficou a par sobre os possíveis tipos de séries estatísticas: cronológicas,
geográficas, específicas e conjugadas, além da série Distribuição de Frequência
aplicada principalmente para dados quantitativos.
ATIVIDADES
1) De acordo com as normas para representação tabular de dados, quando o

valor de um dado é muito pequeno, para ser expresso com o número de casa
decimais utilizadas ou com a unidade de medida utilizada, deve-se colocar na
célula correspondente:
a) Um ponto de exclamação (!);

b) Um ponto de interrogação (?);
c) Um traço horizontal (-);
d) Três pontos (...);
e) Zero (0).
2) Considerando os dados apresentados na seguinte distribuição de frequência,

Tabela - Distribuição do Preço de um Determinado
Produto em 20 Lojas – Centro – Criciúma/SC
PREÇOS NÚMERO DE LOJAS
50 2
51 5
52 6
53 6
54 1
TOTAL 20
Fonte: Autora, Dados Hipotéticos.
Unidade 2 89
Responda:
a) Quantas lojas apresentaram um preço de R$52,00?
b) Quantas lojas apresentaram um preço de até R$52,00 (inclusive)?
c) Qual o percentual de lojas com preço maior de que R$51,00 e menor de que
R$54,00?
3) Confeccione, ou seja, construa uma tabela com seus elementos básicos estu-
dados para mostrar que, em determinado curso, o número de alunos matricula-
dos nas 1ª , 2ª e 3ª séries era, respectivamente, 40, 35 e 29, em 2010; e 42, 36 e
32, em 2012.
90 Unidade 2
Módulo 7
Gráficos estatísticos
Os gráficos são figuras que servem para transmitir inúmeras informações con-
tidas em diferentes conjuntos de dados. Essas figuras precisam apresentar sim-
plicidade (evitando excessos de detalhes sem importância), clareza dos dados e
veracidade em relação aos fenômenos estudados.
Unidade 2 91
7.1 Componentes de um gráfico
Existem vários tipos de representação de gráficos, mas, no geral, costumam ser

construído num plano cartesiano, podendo estes ser desenhados com apoio de
softwares específicos, planilhas eletrônicas ou no próprio papel, em que:
- No eixo horizontal (eixo das abscissas), a escala cresce da esquerda para direita
e costuma ser disponibilizada embaixo do eixo;
- No eixo vertical (eixo das ordenadas), a escala cresce de baixo para cima e cos-
tuma ser disponibilizada à esquerda do eixo.
- Nos dois eixos, devem estar definidas as variáveis que representam o estudo;
- Todos os gráficos devem possuir:
a) um título: que identifique a situação estudada, a época e o local;
b) a fonte da pesquisa que identifique o autor responsável pelos dados, podendo

ser uma pessoa física ou jurídica. A fonte deverá ser disponibilizada no rodapé
da figura.
- As linhas auxiliares (grades) para facilitar a leitura nos gráficos, são opcionais.
7.2 Tipologia de gráficos estatísticos

Entre os inúmeros modelos de gráficos, podem-se destacar três tipos básicos
quanto a sua forma os diagramas, cartogramas e pictogramas.
7.2.1 Diagramas
São os gráficos mais utilizados estatísticamente, pela sua simplicidade e familia-
ridade (BRUNI, 2008). Os dagramas, são gráficos numéricos representados em
duas dimensões (plano cartesiano).
Dentre os gráficos diagramas, destacam-se: gráfico de linhas, de colunas ou bar-

ras, de setores ou pizza, e polar.
92 Unidade 2
a) Gráfico de Linha: faz-se uso de uma linha poligonal para representar uma
série estatística, sendo essas geralmente temporais (histórica e/ou cronológica).
Para construir o gráfico de linha:

1– Desenhe os eixos das abscissas e das ordenadas;
2– Coloque as escalas (tempo) no eixo horizontal e a frequência na vertical;
3– Marque os pontos definidos na relação (par ordenado), ou seja, x = variável

tempo e y = frequência;
4– Una os pontos com uma linha ou curva, do ponto inicial ao último; e
5– Por último, não esqueça, coloque o título e a fonte.
Para melhor compreensão, verifique o exemplo a seguir:
Tabela 20 - Variações da poupança e da inflação entre maio de 2003 e

janeiro de 2004
Índices jun/03 jul/03 ago/03 set/03 out/03 nov/03 dez/03
Poupança 0.92 1.95 0.91 0.84 0.82 0.68 0.69
Inflação 0.42 0.55 0.40 0.34 0.32 0.18 0.19
Gráfico 3 - Variações da poupança e da inflação

entre maio de 2003 e janeiro de 2004
2
1,8
1,6
1,4
1,2
1 Poupança
0,8 Inflação
0,6
0,4
0,2
0
jun/03 jul/03 ago/03 set/03 out/03 nov/03 dez/03
Fonte: Gesser e Dalpiaz (2007, p. 65), adaptado.
Unidade 2 93
b) Gráfico de Colunas ou Barras: faz-se uso de retângulos colocados vertical-
mente, quando em colunas e, horizontalmente, quando em barras, para represen-
tar séries estatísticas, sendo estas geralmente específicas, temporais e geográficas.
DICA
“Quando em colunas, os retângulos têm a mesma base e as alturas são pro-
porcionais aos respectivos dados; enquanto, quando em barras, os retângulos
têm a mesma altura e os comprimentos são proporcionais aos respectivos dados.” Crespo
(2009, p.33)
Para construir o gráfico de colunas ou barras:

1 – Desenhe os eixos das abscissas e das ordenadas;
2 – Coloque os valores assumidos pela variável no eixo horizontal e a frequência

absoluta ou relativa no eixo vertical, quando em coluna. Já quando em barras,
faça o contrário, inverta os dados nos eixos.
3 – Desenhe as colunas ou as barras atento às informações dadas na dica anterior.
4 – Por último, não esqueça, coloque o título e a fonte.
Exemplos:
• Gráfico em Colunas:
Tabela 21 - Produção Brasileira de Carvão

Mineral Bruto – 1989 – 92
Anos Quantidade Produzida (1.000 t)

1989 18.196
1990 11.168
1991 10.468
1992 9.241
94 Unidade 2
Gráfico 4 - Produção Brasileira de
Carvão Mineral Bruto – 1989 – 92
20.000
18.000
16.000
14.000
12.000
10.000 Quantidade Produzida
8.000 (1.000 t)
6.000
4.000
2.000
0
1 2 3 4
• Gráfico em Barras:
Tabela 22 - Exportações Brasileiras – Março 1995
Estados Valor US$ milhões

São Paulo 1.344
Minas Gerais 542
Rio Grande do Sul 332
Espírito Santo 285
Paraná 250
Santa Catarina 202
Unidade 2 95
Gráfico 5 - Exportações Brasileiras – Março 1995
São Paulo
Minas Gerais
Rio Grande do Sul
Espírito Santo Valor US$ milhões
Paraná
Santa Catarina
0 500 1000 1500
Além dos gráficos em colunas ou barras simples, alguns momentos exigem que
os pesquisadores façam uso de gráficos em colunas ou barras múltiplas quando
querem representar dois ou mais fenômenos pesquisados, com intuito de com-
pará-los, como mostra o exemplo a seguir:
Tabela 23 - Balança Comercial do Brasil – 1989 – 93

VALOR (US$ 1.000.000)
ESPECIFICAÇÕES
1989 1990 1991 1992 1993
Exportação (FOB) 34.383 31.414 31.620 35.793 38.783
Importação 18.263 20.661 21.041 20.554 25.711

Fonte: Ministério da Fazenda apud Crespo (2009, p. 35)
96 Unidade 2
Gráfico 6 - Balança Comercial do Brasil – 1989 – 93
40000
30000
20000 Exportação (FOB)

Importação
10000
0
1989 1990 1991 1992 1993
Fonte: Ministério da Fazenda apud Crespo (2008, p. 35)
ESTUDO COMPLEMENTAR
Antes de dar continuidade a seus estudos, sugiro que leia as dicas para
a construção de gráficos de colunas e barras, e elabore alguns exemplos usando planilha
eletrônica ou algum software estatístico que conheça para ter um melhor entendimento a
respeito de séries estatísticas e suas representações.
DICA
- Sempre que os dizeres a serem inscritos são extensos, devemos dar preferên-
cia ao gráfico em barras (séries geográficas e específicas). Mas, se preferirem o
gráfico em colunas, os dizeres devem ser colocados de baixo para cima, nunca ao contrário.
– Se a série estatística for histórica a ordem a ser observada, deverá ser a cronológica, mas se
geográfica ou categórica, faça uso da decrescente.
Unidade 2 97
c) Gráfico em Setores: faz-se uso de um círculo de 360º, por isso, é conhecido
também como gráfico circular, ou em “pizza”, para representar uma série estatís-
tica, sendo essas geralmente geográficas ou, quando se pretende fazer compara-
ções, usando frequências relativas em porcentagens.
Essa representação é viável quando os valores das variáveis não são extensos, caso
contrário se torna inadequado, de difícil visualização e até mesmo compreensão.
Para construir o gráfico em setores:
1 – Desenhe um círculo com 360º;
2 – Divida o círculo em setores proporcionais às realizações de cada categoria por

meio de uma regra de três simples, na qual:
- a frequência total (ou o percentual total 100%) corresponde aos 360º; e
- a frequência ou a proporção de cada categoria corresponde a um valor desco-

nhecido em graus:
Grau de uma categoria = 360º . frequência (proporção)da categoria

frequência (proporção) total
Para melhor compreensão, verifique o exemplo a seguir:
João (projetista de sites), pretendendo conhecer melhor o perfil de seus clientes

com intuito de adequar seus produtos às preferências dos usuários, fez uma pes-
quisa e identificou algumas características dos visitantes de seus sites, entre elas:
sexo, idade e o provedor utilizado. Considerando uma amostra de 40 visitantes,
seguem os dados coletados quanto ao provedor:
Tabela 24 - Amostra de 40 visitantes em relação ao provedor utilizado
Visitante Provedor Visitante Provedor Visitante Provedor Visitante Provedor
1 C 11 C 21 B 31 A
2 A 12 A 22 A 32 A
3 B 13 B 23 A 33 B
4 B 14 D 24 B 34 C
5 C 15 A 25 A 35 B
6 B 16 B 26 A 36 D
7 D 17 B 27 B 37 B
8 B 18 C 28 D 38 B
9 B 19 D 29 D 39 B
10 A 20 B 30 C 40 C
Fonte: Barbetta, Reis e Bornia (2010, p. 54), adaptada.
98 Unidade 2
Na sequência, conforme já estudamos, é preciso construir a tabela de distribui-
ção de frequência, para isso, João contou quantos visitantes utilizam cada cate-
goria de provedor:
Tabela 25 - Distribuição de frequência do provedor usado pelos visitantes do site
Provedor Frequência Absoluta Frequência Relativa (%) Grau (º)
A 10 25 90
B 17 42,5 153
C 7 17,5 63
D 6 15 54
TOTAL 40 100 360
Fonte: Barbetta, Reis e Bornia (2010, p. 55)
DICA
Quando a frequência relativa já estiver calculada, basta multiplicar por 3,6
para obter o grau a ser usado no gráfico ao invés de aplicar uma regra de
três simples.
Por exemplo, você pode adotar um dos dois cálculos:
40 -> 360° x1 = 25,0 . 3.6 = 90°

10 -> x1 ou
40x 1 = 10 . 360
x1 = 3600 = 90°
40
E assim, sucessivamente, para as demais categorias.
Gráfico 7 - Setores para a apresentação da

distribuição de frequência do provedor
usado pelo visitante do site
A
15%
25% B
18%
C
42%
D
Unidade 2 99
d) Gráfico Polar: faz-se uso do sistema de coordenadas polares para representar
uma série estatística. Esse gráfico é excelente para representar as séries temporais
cíclicas, ou seja, com certa periodicidade, tais como: o consumo de energia elé-
trica dos consumidores do grupo A registrado pela CELESC, em agosto de 2013,
a variação da temperatura em Criciúma durante o final de semana, o número de
passageiros do expresso coletivo ao longo do mês de julho.
Para construir o gráfico polar, seguem-se os passos:
1– Trace uma circunferência de raio arbitrário (de preferência ao raio de compri-

mento proporcional à média dos valores da série);
2– Construa uma semirreta, de preferência na horizontal, partindo do polo (O)

e com uma escala (eixo polar);
3– Divida a circunferência em arcos de acordo com as unidades temporais;
4– Trace, a partir do polo (O) central, semirretas passando pelos pontos de divi-
são;
5– Marque os valores correspondentes da variável, iniciando pela semirreta ho-

rizontal (eixo polar);
6– Ligue os pontos encontrados com segmentos de reta; e
7– Se pretende fechar a poligonal obtida, utilize uma linha interrompida.
Exemplo:
Tabela 26 - Precipitação Pluviométrica na cidade de Recife – 1993

MESES Mm MESES Mm
Janeiro 49,6 Julho 183,6
Fevereiro 93,1 Agosto 161,3
Março 63,6 Setembro 49,2
Abril 135,3 Outubro 40,8
Maio 214,7 Novembro 28,6
Junho 277,9 Dezembro 33,3
Fonte: Ministério da Agricultura apud Crespo (2009, p. 45)
100 Unidade 2
Gráfico 8 - Precipitação Pluviométrica
Recife – 1993
Janeiro
300
Dezembro Fevereiro
200
Novembro Março
100
Outubro 0 Abril Mm
Setembro Maio
Agosto Junho
Julho
Fonte: Ministério da Agricultura apud Crespo (2009, p. 38)
7.2.2 Cartogramas
Esses gráficos são utilizados bastante nas áreas de Geografia, Historia e Demo-
grafia (BRUNI, 2008).
Os cartogramas podem ser adotados para representar: dados absolutos (popula-

ção) e dados relativos (densidade).
Por exemplo:
(segue mapa)... VER
Unidade 2 101
Gráfico 9 - Cartograma referente à população residente total por
municípios do Estado do Rio de Janeiro, segundo o Censo Demográfico 2010
ESTUDO COMPLEMENTAR
Você pode aprimorar seus conhecimentos fazendo download da ferramen-

ta WebCart para criar seuscartogramas, acessando no site do IBGE, o link: http://www.
ibge.gov.br/webcart
7.2.3 Pictograma
A representação desses gráficos se dá por meio de figuras ou conjuntos de figuras,

as quais devem ser autoexplicativas.
Em relação ao uso desse modelo de gráfico, Bruni (2008, p. 47) alerta que “devem
estabelecer comparações gerais, devendo ser evitados para interpretar afirma-
ções ou dados isolados.”
102 Unidade 2
Esses gráficos por serem geralmente atraentes e sugestivos, chamando atenção do
público em geral, costumam ser bastante utilizados em propagandas.
Os Gráfico 10 e 11 são exemplos de pictogramas:
Unidade 2 103
Síntese do módulo
Neste módulo foram apresentadas algumas figuras (gráficos estatísticos) que po-
derão ser utilizadas para apresentar dados de uma pesquisa, de forma simples, rá-
pida e eficaz, permitindo aos interessados visualizar, compreender os resultados
obtidos em suas pesquisas, sejam elas formais ou não. Os componentes essenciais
na construção de um gráfico foram abordados, com ênfase à informação de que
eles fazem uso, geralmente, do plano cartesiano, estudado desde o ensino funda-
mental. Foram explanadas também as três tipologias básicas de gráficos quanto a
sua forma, ou seja, os diagramas, cartogramas e pictogramas, cada qual com suas
características próprias e exemplos. Dentre as tipologias, foi dada maior impor-
tância aos diagramas, por serem os mais utilizados estatisticamente na prática,
sendo estes os gráficos: de linhas, de colunas ou barras, de setores ou pizza, e
polar.
ATIVIDADES

1) ( ) (CESPE, TCDF/95): Em relação aos tipos de gráficos, assinale a opção

correta:
a) ( ) Uma série categórica é melhor representada por um gráfico de linha.

b) ( ) Uma série cronológica é melhor representada por um gráfico de setores.
c) ( ) Se uma distribuição de frequência apresenta intervalos de tamanhos desi-

guais, o melhor gráfico para representá-la é um polígono de frequência.
d) ( ) O gráfico de barras é usado somente para séries geográficas.
e) ( ) O gráfico de setores é usado para comparar proporções.
104 Unidade 2
2) (UFPE) Os gráficos ilustram a distribuição percentual de energia elétrica no
Brasil dos diversos setores e do setor industrial. Assinale a alternativa incorreta
sobre o consumo de energia elétrica no Brasil:
Distribuição Percentual do consumo de

energia elétrica no setor industrial
11%
29%
12%
8%
40%
Outros Metais Papel Química Alimentos
Distribuição Percentual do consumo de

energia elétrica no Brasil
7%
9%
44%
26%
14%
Outros Público Residencial Comercial Industrial
Unidade 2 105
a) O setor de metais consome mais que o comercial.
b) O setor público consome mais que o de alimentos.
c) O setor residencial consome mais que, juntos, o químico e o de metais.
d) O setor de papel consome 4,1% do total de energia.
e) O setor químico e o de alimentos consomem juntos menos que o residencial.
3) Os dados do gráfico foram coletados por meio da Pesquisa Nacional por

Amostra de Domicílios. Supondo-se que, no Sudeste, 14900 estudantes foram
entrevistados nessa pesquisa, quantos deles possuíam telefone móvel celular?
a) 9.536
b) 8.344
c) 7.450
d) 6.556
e) 5.513
Estudantes que possuem telefone móvel celular

com idade de 10 anos ou mais
70
60
Porcentagem (%)
50
40
30
20
10
0
Norte Nordeste Sudeste Sul Centro-oeste
Regiões Brasileiras
Possuíam Não Possuíam

Fonte: IBGE. Disponível em: http://www.ibge.gov.br
Acesso em: 28 abr. 2010 (adaptado)
106 Unidade 2
1) (ESAF – Receita Federal, 2012) A taxa cobrada por uma empresa de logística
para entregar uma encomenda até determinado lugar é proporcional à raiz qua-
drada do peso da encomenda. Ana, que utiliza, em muito, os serviços dessa em-
presa, pagou para enviar uma encomenda de 25kg uma taxa de R$ 54,00. Desse
modo, se Ana enviar a mesma encomenda de 25kg dividida em dois pacotes de
16kg e 9kg, ela pagará o valor total de:
a) 54,32.
b) 54,86.
c) 76,40.
d) 54.00.
e) 75,60.
2) Observe os gráficos a seguir para responder à questão:
Participação de imposto do setor de TI no PIB versus índice de pirataria
Unidade 2 107
Evolução do índice de pirataria de software no
mundo
50
45
40
35
30
25
20
15
10
0
1994 1995 1996 1997 1998 1999 2000 2001 2002
Pirataria de software no Brasil: índice versus perdas

80 - 500.000
em milhares de dólares
- 400.000
perda de faturamento
60
índice de pirataria
- 300.000
40
- 200.000
20
- 100.000
0 -0
1994 1995 1996 1997 1998 1999 2000 2001 2002
índice de pirataria perdas de faturamento
A redução da pirataria de software no Brasil e no mundo é resultado de esforços

advindos da iniciativa privada e das entidades representativas do setor. Um estu-
do objetivando mensurar o índice de pirataria no mundo e os benefícios de sua
redução apresentaram os gráficos acima, obtidos de uma amostra de 57 países,
incluindo-se o Brasil.
108 Unidade 2
Com base nas informações apresentadas, é correto afirmar que:
I) a taxa de redução do índice de pirataria de software no mundo manteve-se

constante ano após ano no período mostrado.
II) o Brasil reduziu em torno de 25% seu índice de pirataria de software, compa-
rando os anos de 1994 e 2002.
III) o Brasil foi, entre os países mostrados, o que apresentou a maior redução do
índice de pirataria no período estudado.
IV) países com maior participação do setor de TI no PIB apresentam, normal-

mente, menores índices de pirataria.
V) o Brasil apresentou aumento de faturamento no período de 2000 a 2002, ape-

sar do aumento de pirataria.
Estão certos apenas os itens

a) I e II.
b) I e III.
c) II e IV.
d) III e V.
e) IV e V.
3) (ENADE, 2011) As condições gerais de fornecimento de energia elétrica que

estabelecem as disposições a serem observadas pelas distribuidoras de energia
elétrica e pelos consumidores encontram-se consolidadas na Resolução no. 414
da ANEEL – Agência Nacional de Energia Elétrica, em vigor desde 15/09/2010.
Essa regulamentação estabelece, para as unidades consumidoras do Grupo A e
com modalidade tarifária convencional, a obrigatoriedade de contratação de va-
lor único de demanda (kW) na vigência do contrato e aplicação de tarifa única
no faturamento desse item. A regulamentação anterior permitia contratação de
valores distintos para cada mês.
A Resolução determina, ainda, que o montante a ser faturado do consumidor,

com exceção de algumas classes especiais, é o maior valor entre a demanda con-
tratada e a demanda medida. Estabelece também que, se a demanda medida ul-
Unidade 2 109
trapassar em mais de 5% a demanda contratada, será cobrado um acréscimo na
tarifa (cerca de 3 vezes o valor normal) sobre o montante excedente (ultrapassa-
gem de demanda).
A tabela e o gráfico a seguir apresentam a evolução das demandas contratadas e

medidas de uma unidade consumidora do Grupo A e tarifa convencional, ante-
riores à entrada em vigor da nova legislação. Verifica-se que é necessária a atua-
lização do contrato com a concessionária de energia, com a contratação de valor
único para a demanda.
Mês Contratada (kW) Medida (kW)

Janeiro 4 750 4 257
Fevereiro 4 750 5 512
Março 5 000 6 267
Abril 5 000 6 071
Maio 4 000 4 769
Junho 4 000 3 082
Julho 4 000 2 701
Agosto 4 000 2 546
Setembro 4 000 3 876
Outubro 4 000 4 326
Novembro 4 750 5 098
Dezembro 4 750 4 435
7000
6000
5000
4000
3000
2000
1000
Contratada (kW) Medida (kW)
110 Unidade 2
Avaliando os dados apresentados, qual o valor aproximado a ser recomendado
para contratação de demanda, mantidas as condições de consumo apresentadas
no gráfico, de forma a se garantir que não haverá cobrança de ultrapassagem de
demanda dessa unidade consumidora?
a) 4 400 kW
b) 5 000 kW
c) 6 000 kW
d) 6 300 kW
e) 6 600 kW
4) Considere as distribuições do tipo de combustível doméstico usado nas cida-

des X e Y em Santa Catarina, em determinada época:
Tabela - Tipos de combustível adotados

nas Cidades X e Y
Tipo de
Total de residências
combustível
Cidade X Cidade Y
Eletricidade 23.800 3.450
Gás 67.450 31.800
Outros 6.450 3.850
TOTAL 97.700 39.100
Fonte: Departamento de Estatística – UnB. Disponível em
http://www.est.unb.br. Acesso em 30 de out 2013, as 10 h,
adaptada.
a) Analisando os dados da tabela, justifique a afirmação: “De forma relativa, a

cidade Y usa mais gás que a cidade X”.
b) Construa um gráfico adequado e na sequência compare as séries e relate seu

comentário estatisticamente.
5) (Adaptada – CESPE, BB / 2002): Após analisar os seguintes gráficos, desenvol-

va as questões a seguir assinalando a alternativa correta e na sequência justifique
suas respostas:
Unidade 2 111
O canal do Panamá em números
Países que mais usam o Canal Pouco explorado
Como origem ou destino das cargas Cargas destinadas ao Brasil ou dele originadas
Toneladas movimentadas (em milhões)
2,5%
EUA 132,7
Japão 34,5 2,0%
China 23,0
Chile 15,5 1,5%
Canadá 15,4
1,0%
Coréia do Sul 14,2
México 11,5 0,5%
Peru 10,4
Taiwan 10,0 0,0%
1996 1997 1998 1999 2000 2001
Venezuela 9,9
Gráfico I Gráfico II
Exportações brasileiras que passam pelo Canal

Em milhões de toneladas
Manufaturados de ferro 674,9
Madeira e produtos de madeira 554,1
Soja 284,3
Minérios e metais 209,9
Petróleo e derivados 21,1
Papel e produtos de papel 1,8
Gráfico III
5.1) O gráfico I apresenta uma série estatística do tipo:
a) Conjugada;
b) Distribuição de frequência;
c) Específica;
d) Geográfica;
e) Temporal.
POR QUÊ?
112 Unidade 2
5.2) O gráfico III apresenta uma série estatística do tipo:
a) Conjugada;
c) Específica;
d) Geográfica;
e) Temporal.
POR QUÊ?
5.3) O gráfico II apresenta uma série estatística do tipo:

a) Conjugada;
c) Específica;
d) Geográfica;
e) Temporal.
POR QUÊ?
Unidade 2 113
6) (Adaptado, CESPE – TCDF): Julgue os itens a seguir, assinalando a alternativa
correta e justifique sua resposta quando a opção estiver ERRADA:
6. a) Amplitude total é a diferença entre dois valores quaisquer do atributo.
( ) CORRETO ( ) ERRADO
6. b) Em Estatística, entende-se por população um conjunto de pessoas.
6. c) A variável é discreta quando pode assumir qualquer valor dentro de deter-

minado intervalo.
114 Unidade 2
6. d) A série estatística é cronológica quando o elemento variável é o tempo.
6. e) Frequência relativa de uma variável aleatória é o número de repetições dessa

variável.
7) A Confederação Nacional de Agricultura (CNA) realizou uma pesquisa a res-

peito da produtividade de mil famílias em assentamentos e constatou os seguin-
tes dados:
Produzem apenas o
suficiente para o
consumo da família
25% Não produzem
37%
Produzem o
suficiente para o
consumo da
família e vendem
o excedente
27% Não produzem o
suficiente nem para
própria família
11%
Unidade 2 115
Quantas famílias dentre as pesquisadas, produzem, pelo menos, o suficiente para
o seu consumo?
a) 250
b) 370
c) 420
d) 520
8) O Brasil começou o ano em janeiro de 2010, com um forte ritmo de contrata-

ções com carteira assinada. Analise o gráfico a seguir:
Gráfico - Número de empregos com carteira assinada criados

em alguns setores da economia, em janeiro de 2010
Indústria de transformação 68.920

Serviços 57. 889
Construção Civil 54.33 0
Série1
Agropecuária 4.143
Serviços de água, luz e gás 2.538
Indústria extrativa 1.192
Fonte: Ministério do Trabalho e Emprego, adaptado.
Quantas vagas com carteira assinada, a construção civil ofertou a mais do que o
setor agropecuário, no período de janeiro de 2010?
a) 53.746
b) 51.213
c) 50.187
d) 49.953
116 Unidade 2
Unidade 3
Distribuição de frequência
Estatisticamente, a tabela utilizada pelos pesquisadores para garantir
uma melhor compreensão dos dados descritos durante seus estudos
tem sido a série distribuição de frequência, por isso, essa unidade
tratará, em especial, desta abordagem com maiores detalhes.
Em um primeiro momento, será explicado como esses dados
coletados podem ser mais condensados, visto que, no decorrer
de uma pesquisa, encontram-se muitas vezes dados repetidos e,
quando esse número de dados é considerável, torna-se inviável
o uso de tabelas normais. Por isso, recomenda-se o uso de
uma tabela de distribuição de frequência na qual se trabalha
com intervalos ou classes de valores, ao invés de trabalhar
isoladamente todos os dados, poluindo o ambiente descrito.
Na sequência, serão apresentadas as representações gráficas
mais comuns, utilizadas pelos profissionais da área, como
mecanismo para análise e interpretação dos dados coletados,
no que tange a resultados exatos e tendências estatísticas. ■
Módulo 8
Apresentação tabular de uma

distribuição de frequência
Segundo, p. 53), a série distribuição de frequência é uma forma tabular de por-
ganizar os dados observados de acordo com suas frequências (ocorrências) no
decorrer do estudo. (BARBETTA, REIS e BORNIA , 2010).
Mas quais são os passos para que esses dados se apresentem de forma
organizada?
No decorrer deste módulo, este assunto será tratado com maiores detalhes, será
dado ênfase a sua apresentação em tabelas.
Unidade 3 119
8.1 Tabela primitiva - dados brutos
Nessas tabelas são apresentados os dados coletados durante uma pesquisa na sua
forma real, diretamente, extraídos sem ter sido organizado. Geralmente, esses
dados por si só não apresentam informações ao interessado no estudo. É neces-
sário organizá-los. (CRESPO, 2009)
Para a melhor compreensão dessa temática, sugere-se como base o uso do exem-
plo a seguir:
Suponha que, ao pesquisar a média semestral dos alunos da Turma A em Cálcu-

lo, no semestre 2012-2, você encontre os seguintes dados:
7,0; 5,0; 6,0; 2,0; 4,0; 8,0; 5,0; 6,0; 3,0; 2,0; 7,0; 5,0; 4,0; 6,0; 2,0; 5,0; 5,0; 5,0; 6,0; 4,0;
5,0; 3,0; 5,0; 3,0; 6,0; 4,0; 5,0; 6,0.
Por meio dos dados brutos, torna-se complexo tirar conclusões, assim, em esta-
tística, costuma-se organizar primeiramente estes dados para facilitar a sua con-
tagem, através do ROL (conjunto ordenado dos dados de forma crescente ou
decrescente).
Tomando o exemplo anterior, tem-se:

2,0; 2,0; 2,0; 3,0; 3,0; 3,0; 4,0; 4,0; 4,0; 4,0; 5,0; 5,0; 5,0; 5,0; 5,0; 5,0; 5,0; 5,0; 5,0; 6,0;
6,0; 6,0; 6,0; 6,0; 6,0; 7,0; 7,0; 8,0.
Com esses dados, consegue-se definir uma distribuição de frequência, ou seja, a

contagem de quantas vezes cada elemento (médias, no exemplo dado) aparece,
conforme mostra a Tabela 27:
Tabela 27 - Distribuição da Média Semestral
dos Alunos da Turma A em Cálculo, no
Semestre 2012-2 – Primeira Versão
Média Semestral Frequência (fi)
2 3
3 3
4 4
5 9
6 6
7 2
8 1
TOTAL 28
Fonte: Autora (dados hipotéticos)
120 Unidade 3
Porém, a sua apresentação ainda poderá ser melhorada, basta, para isso, na sequ-
ência, agrupar esses dados em classes segundo sua frequência, o que diminuiria
a relação de dados e aumentaria a capacidade de informação; processo este inte-
ressante, principalmente quando se trabalha com grandes amostras.
DICA
Frequência: é o número de vezes que certo valor se repete em um conjunto
de dados.
Tomando como exemplo o ROL da média semestral dos alunos da Turma A em

Cálculo, no semestre 2012-2, tem-se uma: Distribuição de Frequência Com In-
tervalos de Classe, na qual se adota o agrupamento dos dados em classes sig-
nificativas, neste exemplo com intervalo regular de 2 em 2, conforme mostra a
(Tabela 28):
Tabela 28 - Média Semestral dos Alunos da

Turma A em Cálculo - Semestre 2012-2 –
Versão Melhorada
Classes Frequências
02 l 04 6
04 l 06 13
06 l 08 8
08 l 10 1
TOTAL 28
Quando se agrupa os dados em intervalos, perde-se em

precisão, mas em contra partida se ganha em organiza-
ção, refletindo ao interessado a informação necessária
para as devidas conclusões.
Unidade 3 121
Mas, como pesquisador, poderá se deparar com situações em que à distribuição
de frequência apresenta-se na forma de distribuição sem intervalos de classe,
nos casos em que a pesquisa se dá por meio de variáveis discretas de variação
relativamente pequena, sendo assim tomado cada valor como um intervalo de-
generado.
Na coluna da frequência, os dados são condensados, conforme a repetição de

seus valores. Sua notação costuma ser também fi. Para o exemplo anterior, a dis-
tribuição de frequência certa seria:
Tabela 29 - Média Semestral dos Alunos

da Turma A em Cálculo - Semestre 2012-2
x fi (frequência)
2 3
3 3
4 4
5 9
6 6
7 2
8 1
TOTAL 28
Agora que já conhece como concentrar e resumir melhor os dados de uma pes-
quisa, vamos conhecer quais são os elementos de uma distribuição?
8.2 Elementos de uma distribuição de frequência
Uma distribuição de frequência com ou sem intervalos possui vários elementos,

entre eles: classe, limites de classe, amplitude do intervalo de classe, amplitude
total da distribuição, amplitude total da amostra (ROL), ponto médio da clas-
se e frequência.
Na sequência, você estudará cada um deles e, para melhor compreensão, sugiro

que adote como exemplo a (Tabela 30):
122 Unidade 3
Tabela 30: Estatura de 40 alunos do Colégio A
ESTATURAS (cm) FREQUÊNCIA

150 l 154 4
154 l 158 9
158 l 162 11
162 l 166 8
166 l 170 5
170 l 174 3
TOTAL 40
a) Classe: São os intervalos de variação da variável estudada, simbolizado por i e

o número total de classes por k.
Para os casos em que as variáveis quantitativas apresentam dados com grande

dispersão, marcadas pela presença de muitos valores diferentes, lembre-se: os
estatísticos, com intuito de melhorar a visualização tabular, trabalham com os
dados agrupados em classes.
Você deve estar se perguntando: como vou definir

o número de classes, correto?
Para determinar o número de classes (k), você deverá observar o número (n) de
elementos, ou seja:
- se o n
n=> 25: devem ser criadas 5 classes de frequência;
- se o n > 25: o número de classes deverá ser definido por meio de dois procedi-
mentos estatísticos: k = √(n ) ou k = 1 + 3,32 log (n) (fórmula de Sturges).
No exemplo da estatura dos 40 alunos, na Tab. 30, k = 6.
Unidade 3 123
b) Limites da classe: são os extremos da classe, sendo li o menor número da clas-
se (limite inferior) e o maior número Li o limite superior da classe.
No exemplo da Tab. 30, na 2ª classe 154 158 o l2 é igual a 154 e L2 é 158, com
i = 2.
DICA
Pela resolução 886/66 do IBGE, os intervalos de classe devem se apresenta-
dos na tabela, com o símbolo quando a classe inclui o limite inferior e
exclui o limite superior e quando os dois limites (l e L ) pertencem a classe.
i i
c) Amplitude de um intervalo de classe: também chamado intervalo de classe,

é o intervalo que define a classe, ou seja, é obtido por meio da diferença dos limi-
tes superior e inferior indicado por:
hi = Li - li
No exemplo da Tabela 30, h2 = L2 - l2 h2 = 158 – 154 = 4 h2 = 4 cm.
d) Amplitude total da distribuição: é a diferença entre o limite superior da últi-

ma classe (limite superior máximo) e o limite inferior da primeira classe (limite
inferior mínimo).
AT = L (Max) – l (min)
No exemplo da Tabela 30, AT = 174 – 150 = 24 24 cm.
e) Amplitude Amostral (AA): é a diferença entre o valor máximo e o valor mí-

nimo da amostra.
AA = x (máx.) – x (min.)
No exemplo da Tab. 30, AA = 173 – 150 = 23 AA = 23 cm.
124 Unidade 3
f) Ponto médio de uma classe: é a média aritmética da classe, ou seja, o ponto
que divide o intervalo da classe em duas partes iguais.
li + Li
2
No exemplo da Tabela 30, o ponto médio é dado por
xi = 154 + 158 = 156 xi = 156 cm.

2
O ponto médio é o ponto que irá representar a classe, no cálculo das medidas:
média, mediana e desvio padrão, medidas essas a serem estudadas nos próximos
módulos.
g) Frequência de uma classe ou de um valor individual: é o número de obser-

vações correspondentes a essa classe ou a esse valor individual.
Costumam ser simbolizadas por: fi (lê-se: frequência da classe i).
No exemplo da Tab. 30, destacam-se as frequências: f1 = 4; f2 = 9; f3 = 11; f4 = 8;

f5 = 5 e f6 = 3.
A soma de todas as frequências pode ser apresentada pela letra sigma (o símbolo
de somatório).
k
∑i =1
fi = n
Para o exemplo da Tab. 30, temos a distribuição = ∑6i=1 fi = 40,
ou simplesmente: ∑ fi = 40
Os intervalos (h) das classes são consequência da amplitude total dos dados, ou
seja:
h = (maior dos dados - menor dos dados) maior - menor

=
número de classes que devem ser criadas k
Unidade 3 125
Com o número de classes e o intervalo definido, constrói-se a tabela de frequ-
ência partindo do menor valor e somando gradualmente o intervalo obtido para
cada uma das classes até incluir o último valor.
Para o exemplo da estatura dos 40 alunos, teremos a Tabela. 31 da distribuição de

frequência a seguir:
Tabela 31 - Estatura de 40 alunos do colégio A

I ESTATURAS (cm) FREQUÊNCIA
1 150 I 154 4
2 154 I 158 9
3 158 I 162 11
4 162 I 166 8
5 166 I 170 5
6 170 I 174 3
 fi = 40
Entre o grupo de alunos pesquisados, pode-se concluir que 4 deles apresentam

estatura entre 150 cm e quase 154 cm. Mas cuidado! Os alunos de estatura 154
cm pertencem a segunda classe, não a primeira, e assim por diante.
8.3 Tipos de frequência
A distribuição de frequência pode ser apresentada de forma:
a) Absoluta;
b) Relativa;
c) Acumulada; e
d) Acumulada Relativa.
126 Unidade 3
8.3.1 Absoluta: quando mostra o número de elementos (indivíduos) de uma
classe, como descrito pela Tab. 31. Essas frequências absolutas, por notação, cos-
tumam serrepresentadas por fi (frequência do elemento i). Com o somatório des-
sas frequências,, lembre-se: obtêm-se o número total dos dados.
∑ fi = n
8.3.2 Relativa: quando se apresentam as porcentagens em relação aos ele-

mentos. Essas frequências devem ser calculadas pela razão das frequências sim-
ples e a frequência total, e apresentadas por fri:
fi
fri = . 100%
∑ fi
Sempre que estiver lidando com variáveis quantitativas, ainda se costuma traba-
lhar com mais dois tipos de frequência, as conhecidas também como comulativas
além de acumuladas.
8.3.3 Acumulada: obtida pelo total das frequências de todos os valores in-
feriores ao limite superior do intervalo de uma classe.
Essa frequência deverá ser simbolizada pela letra F (em maiúsculo), Fi ou FAci,
para diferenciá-la da frequência absoluta simples.
Calcula-se por meio da fórmula: FAci = ∑ fi
8.3.4 Acumulada Relativa: é o quociente da frequência acumulada

(FAci) da classe pela frequência total da distribuição. Denota-se como
Fri ou FAci %.
Calcula-se essa frequência usando a fórmula: FAci = FAci . 100%

∑ fi
Unidade 3 127
Considerando os diferentes tipos de frequência, para o exemplo trabalhado neste
módulo, da estatura dos 40 alunos, com intervalo de classes, obtêm-se a Tab. 32
de distribuição de frequência apresentada a seguir:
Tabela 32 - Frequências de Distribuição Completa da Estatura de 40 Alunos do Colégio A

Frequência Frequência
Estaturas Frequência Ponto Médio Frequência Relativa
I Acumulada Acumulada
(cm) Absoluta ( fi ) da Classe (xi) (fri) em %
(FAci) Relativa (FAci %)
1 150 I 154 4 152 0,100 = 10% 4 0,100 = 10 %
2 154 I 158 9 156 0,225 = 22,5 13 0,325 = 32,5
3 158 I 162 11 160 0,275 = 27,5 24 0,600 = 60,0
4 162 I 166 8 164 0,200 = 20 32 0,800 = 80,0
5 166 I 170 5 168 0,125 = 12,5 37 0,925 = 92,5
6 170 I 174 3 172 0,075 = 7,5 40 1,000 = 100
 fi = 40  = 1,000 ou 100%
Para lembrar!
O ponto médio é dado por: xi = li + Li

2
As frequências relativas devem ser multiplicadas por 100 para melhor
compreensão.
Com os dados resumidos apresentados numa única tabela de distribuição, as res-

postas à questões estatísticas tendem a ser simplificas e mais rápidas.
Por exemplo: Quantos alunos possuem estatura inferior a 162 cm? Basta obser-
var a tabela e verificar que existem 24 alunos, pois são os alunos que pertencem
às classes 1,2 e 3, tão logo: f1 + f2 + f3 = ∑ f 3= 24.
Para compreender melhor como pode ser construída uma distribuição de frequ-
ência, observe outros exemplos a seguir:
128 Unidade 3
8.4 Exemplos de distribuição de frequência
8.4.1 Para Variável Qualitativa
Considere os dados de um levantamento de uma amostra de 40 pessoas do grupo
A, em respeito à variável nível de instrução. Código (1 – fundamental; 2 – médio
e 3 – graduação):
33223133322122323333
33322313233231113333
Para construir uma tabela de distribuição de frequência com dados de uma va-
riável qualitativa, você precisa contar quantas vezes aparece cada categoria (fre-
quência absoluta) e, se preferir, poderá apresentá-las melhor por meio das suas
porcentagens (frequência relativa), conforme mostra a (Tabela 33):
Tabela 33 - Distribuição de frequência do nível de instrução do grupo
A, numa amostra de 40 pessoas, FIESC – SC, 2012-1
Nível de Instrução Frequência Absoluta (Fi) Frequência Relativa (Fi %)

Fundamental 6 15
Médio 11 27,5
Graduação 23 57,5
TOTAL 40 100
Fonte: Autora – dados hipotéticos
Como já mencionado, o uso de frequência relativa é de suma importância em
casos de comparações, imagine que a FIESC precise ter os dados dos Grupos A,
B e C, conforme mostra a (Tabela 34):
Tabela 34 - Distribuição de frequência do nívelde instrução, numa amostra de 120 pessoas,
dos grupos A, B e C, FIESC – SC, 2012-1
Nível de Instrução Grupo A Grupo B Grupo C
Frequência Frequência Frequênci Frequência Frequênci Frequência

Absoluta Relativa (%) a Absoluta Relativa (%) a Absoluta Relativa (%)
Fundamental 6 15 14 32,56 18 48,65

Médio 11 27,5 14 32,56 13 35,13
Graduação 23 57,5 15 34,88 6 16,22
TOTAL 40 100 43 100 37 100
Fonte: Autora – Dados Hipotéticos
Unidade 3 129
Se fosse fazer um comparativo, percebe-se que o Grupo A possui o melhor nível
de instrução, tendo mais de 50% graduados, enquanto o grupo C apresenta o pior
nível de escolaridade, quase 50% possui o ensino fundamental.
DICA
“Frequências absolutas são preferidas quando o número de observações
é pequeno. Por outro lado, quando queremos fazer comparações, como
estudar as distribuições de homens e mulheres em duas turmas, as relativas são mais
informativas.” Barbetta, Reis e Bornia (2010, p. 53)
As frequências relativas podem ser apresentadas, além de porcentagem, por meio de

índices, coeficientes e taxas.
8.4.2 Para Variáveis Quantitativas
A série dos dados brutos: 20; 18; 17; 21; 17; 18; 17; 21 representa a idade de um
grupo de alunos. Lembre-se: Em estatística costuma-se ordenar primeiramente
esses dados para facilitar a sua contagem, ou seja, constrói-se o ROL (conjunto
ordenado dos dados), mas não obrigatoriamente:
Rol: 17; 17; 17; 18; 18; 20; 21; 21.
Para melhor visualização, elabora-se a tabela de frequências, como no exemplo

de variáveis qualitativas anterior:
Tabela 35 - Distribuição de frequências da

idade de um grupo de alunos – 2012
Idade fi Fi %
17 3 37,5
18 2 25
20 1 12,5
21 2 25
 8 100
Fonte: Bruni (2008, p. 10), adaptada.
130 Unidade 3
Releia!
Quando as variáveis quantitativas são organizadas em

tabelas, pode-se trabalhar com outros dois tipos de fre-
quência, a frequência acumulada e a frequência acumulada rela-
tiva, como mostra a Tabela 36, e suas respectivas fórmulas matemáticas
por meio do somatório.
Tabela 36 - Distribuição de frequências da idade de um

grupo de alunos – 2012
Idade fi Fi % FAci FAci %
17 3 37,5 3 37,5
18 2 25 3 + 2 = 5 37,5 + 25 = 62,5
20 1 12,5 5 + 1 = 6 62,5 + 12,5 = 75
21 2 25 6+2=8 75 + 25 = 100
 8 100
Fonte: Bruni (2008, p. 10), adaptada.
Para calcular as frequências acumuladas, basta você usar:
a) Frequência acumuda simples: b) Frequência acumulada relativa:
FAci = ∑j=
i
f FAci = FAci . 100%
∑ji = 1 fi
1 i
Segue outro exemplo completo para sua análise:
- Suponha que o pesquisador queira analisar os pesos dos acadêmicos da turma

A, do curso de Educação Física, e se depara com o seguinte ROL: {36; 40; 49; 49;
49; 50; 50; 51; 52; 52; 52; 52; 54; 59; 60; 60; 60; 60; 61; 61; 61; 61; 62; 62; 63; 64; 64;
65; 65; 65; 67; 68; 74; 77; 77; 81; 81; 83; 87; 90}.
Para construir uma tabela com todos esses dados ficaria inviável sua análise, não
é mesmo?
Unidade 3 131
Neste caso, faz-se o procedimento de agrupamento em classes, ou seja:
1º. Organizam-se os dados, conforme o rol mostrado;
2º. Determina-se o número de classes a serem criadas; e
3º. Reagrupam-se os dados nas classes definidas, obedecendo às regras de inter-

valos.
No caso dos acadêmicos de Educação Física, o número de elementos (acadêmi-

cos observados) é 40, logo n > 25, assim se pode calcular k = √(40) = 6,3245553,
usa-se então o número de classes 6, sempre um número inteiro. O intervalo ou
90 - 36 , visto que o maior peso é 90 kg e o menor 36
range será igual a: h = 6
kg. Como serão criadas 6 classes, a amplitude para cada classe será 9.
Tabela 37 - Distribuição de frequência dos

acadêmicos da turma A do curso de Educação Física
Classe do peso (kg) fi Fi % FAci FAci %
36 I 45 2 5 2 5
45 I 54 10 25 12 30
54 I 63 12 30 24 60
63 I 72 8 20 32 80
72 I 81 3 7,5 35 87,5
81 I 90 5 12,5 40 100
 40 100
Fonte: Bruni (2008, p. 15).
DICA
Todos os elementos observados deverão fazer parte obrigatoriamente de
uma única classe. (BRUNI, 2008).
Sugestão de estudos complementares:
Você poderá visualizar melhor o processo de definição dos intervalos consultando o livro:
BRUNI, Adriano Leal. Estatística para Concursos: com mais de 400 questões solucionadas,
incluindo principais bancas examinadoras e provas importantes. São Paulo: Atlas, 2008,
p.13-14.
132 Unidade 3
Síntese do módulo
Neste módulo foi mostrado como trabalhar melhor os dados brutos obtidos em
uma pesquisa; num primeiro momento, organizando-os em um ROL; depois, se
necessário for, agrupá-los em intervalos de classe. Também foi detalhado cada
elemento de uma distribuição de frequência, podendo esta ser apresentada sem
ou com intervalos de classe, tendo sido mostrados por meio de alguns exemplos
voltados para variáveis qualitativas e quantitativas, com suas respectivas formas
de frequência: absoluta, relativa, acumulada simples e acumulada relativa.
ATIVIDADES

1) (Adaptado de FGV Min. Cultura Tec. Cont. / 06): A tabela a seguir mostra a
distribuição de salários dos 50 funcionários da empresa ABC, do Estado de Santa
Catarina:
Salários dos Número de
Funcionários Funcionários
500 l 700 20
700 l 900 25
900 l 1.300 2
1.300 l 1.900 3
Fonte: Autora, dados hipotéticos.
Qual é a porcentagem de empregados que têm salários de 900 a 1.900?

a) 2%
b) 3%
c) 5%
d) 6%
e) 10%
Unidade 3 133
2) Helena, ao realizar uma pesquisa, obteve, a pedido do diretor da Instituição,
a pontuação de 50 alunos na 1ª etapa do concurso, conforme apresenta os dados
da tabela a seguir:
68 85 33 52 65 77 84 65 74 57
71 35 81 50 35 64 74 47 54 68
80 61 41 91 55 73 59 53 77 45
41 55 78 48 69 85 67 39 60 76
94 98 66 66 73 42 65 94 88 89
Desenvolva o que os itens a seguir pedem:
a) Construa uma tabela de frequência iniciando com a pontuação 30 e aplicando

o intervalo de classe de amplitude igual a 10.
b) Mostre suas frequências acumuladas e as frequências relativas.
3) Em uma pesquisa a respeto de habitações em uma região de Criciúma, José, o

pesquisador responsável pela pesquisa, selecionou uma amostra aleatória forma-
da por 50 ruas. Os números de casas estão representados no ROL seguinte:
2 2 3 10 13 14 15 15 16 16
18 18 20 21 22 22 23 24 25 25
26 27 29 29 30 32 36 42 44 45
45 46 48 52 58 59 61 61 61 65
66 66 68 75 78 80 89 90 92 97
Na sequência, José construiu uma tabela de frequência com intervalos de classes,

com amplitude constante, usando um total de 5 intervalos. Com base nas infor-
mações apresentadas, resolva as seguintes questões:
3.1) Qual o intervalo de cada uma das classes?
a) 21
b) 19
c) 17
d) 15
e) 13
134 Unidade 3
3.2) Qual é o limite inferior ( li ) da 3ª classe?
a) 2
b) 20
c) 21
d) 40
e) 41
3.3) Qual é o limite superior da 4ª classe?
a) 49
b) 57
c) 66
d) 70
e) 78
Unidade 3 135
Módulo 9
Representação gráfica de uma

distribuição de frequência
Os gráficos apresentam as séries estatísticas de forma mais sugestiva e clara se
comparada a apresentação tabular. (BARBETTA, REIS e BORNIA, 2010).
Tão logo, neste módulo, você estudará as principais representações geométricas

específicas para apresentar uma distribuição de frequência. Entre elas: histogra-
ma, polígonos de frequência, polígonos de frequência acumulada e curvas de
frequência.
Unidade 3 137
9.1 Histograma
São figuras representadas num plano cartesiano através de retângulos justapos-

tos, feito sobre as classes da variável estudada.. Os retângulos representam a área
da frequência de dados observados ou sua proporcionalidade, em cada classe
analisada.
DICA
A diferença entre os histogramas e o gráfico de colunas é que no histogra-

ma os retângulos são grudados.
A altura do retângulo representa à frequência; a largura, a amplitude.Assim, quanto maior
for a frequência de uma classe mais alto será o retângulo.
Como construir um histograma?
Por meio de um plano cartesiano, representam-se as classes no eixo das abscissas

(eixo x) e as frequências no eixo das ordenadas (eixo y).
Os histogramas podem ser construídos tanto com frequências absolutas como

relativas, mas quando se faz uso da relativa, consegue-se visualizar a porcenta-
gem de uma classe em relação as demais classes.
Observe o exemplo a seguir:
Os dados brutos representam o tempo dado em segundos para carga de um apli-

cativo, num sistema compartilhado:
5.2; 6.4; 5.7; 8.3; 7.0; 5.4; 4.8; 9.1; 5.5; 6.2; 4.9; 5.7; 6.3; 5.1; 8.4; 6.2; 8.9; 7.3; 5.4; 4.8;
5.6; 6.8; 5.0; 6.7; 8.2; 7.1; 4.9; 5.0; 8.2; 9.9; 5.4; 5.6; 5.7; 6.2; 4.9; 5.1; 6.0; 4.7; 14.1;
5.3; 4.9; 5.0; 5.7; 6.3; 6.0; 6.8; 7.3; 6.9; 6.5; 5.9
Após organizar os dados (ROL), constrói-se a (Tab. 38):
138 Unidade 3
Tabela 38 - Distribuição de Frequência do Tempo (em Segundos) para
Carga de um Aplicativo, Num Sistema Compartilhado.
Porcentagem
Classes de Ponto Número de Porcentagem de
acumulada
tempo Médio observações ni observações 100 fi
100 Fi
4 l 5 4.5 7 14 14
5 l 6 5.5 18 36 50
6 l 7 6.5 13 26 76
7 l 8 7.5 4 8 84
8 l 9 8.5 5 10 94
9 l 10 9.5 2 4 98
10 l 11 10.5 0 0 98
11 l 12 11.5 0 0 98
12 l 13 12.5 0 0 98
13 l 14 13.5 0 0 98
14 l 15 14.5 1 2 100
TOTAL 50 100
Os mesmos dados poderão ser visualizados no histograma:
Gráfico 12 - Distribuição de frequência de 50 observações do

tempo de carga de certo aplicativo. Apresentação em
histograma de frequências.
20
18
18
16
14 13
12
10
8 7
6 5
4
4
2
2 1
0 0 0 0 0 0 0 0
0
DICA
A área de um histograma é proporcional à área das frequências.
Unidade 3 139
9.2 Polígono de frequência
O polígono de frequência é um gráfico em linha, com suas respectivas frequ-
ências marcadas perpendicularmente ao eixo das abscissas unidas aos pontos
médios dos intervalos de classe. (CRESPO, 2009)
Como construir um polígono de frequências?

Utilizando um histograma, calcula-se o ponto médio de cada retângulo e marca-
-se um ponto. Na sequência, unem-se os pontos por meio de uma linha.
Para a Tab. 31, trabalhada no módulo 8 e mostrada a seguir, constitui o seguinte

polígono de frequências:
Tabela 31 - Estatura de 40 Alunos do
Colégio A
I Estaturas (cm) fi
1 150 I 154 4
2 154 I 158 9
3 158 I 162 11
4 162 I 166 8
5 166 I 170 5
6 170 I 174 3
 fi = 40
Gráfico 13 - Polígono de frequências para

representar a estatura de 40 alunos do colégio A
12
9
Frequência fi
6 fi
0
148 152 156 160 164 168 172 176
Ponto Médio x
140 Unidade 3
9.3 Polígono de frequência acumulada
O Polígono de Frequência Acumulada (ou gráfico de Ogiva) pode ser caracteri-

zado como um gráfico de linha que serve para representar as frequências acumu-
ladas, exatamente como à distribuição de frequência acumulada.
Como construir um Polígono de Frequência Acumulada?
Para cada classe, marca-se um ponto do valor da frequência acumulada e, na

sequência, a cada dois pontos marcados, traça-se uma reta.
Calculando-se as frequências acumuladas para os dados da Tabela 31, apresenta-

da anteriormente, tem-se:
Tabela 39 - Estatura de 40 alunos do Colégio A com sua

distribuição de frequência acumulada
I Estaturas (cm) Frequência fi Fi % Faci Faci %
1 150 l 154 4 10 4 10
2 154 l 158 9 22,5 13 32,5
3 158 l 162 11 27,5 24 60
4 162 l 166 8 20 32 80
5 166 l 170 5 12,5 37 92,5
6 170 l 174 3 7,5 40 100
 fi = 40 100
Fonte: Crespo (2009, p.52), adaptada.
A mesma frequência acumulada pode ser apresentada pelo gráfico de Ogiva

(Gráf. 14): Gráfico 14 - Ogiva para representar a frequência
acumulada da estatura de 40 alunos do colégio A
40 40
37
32
30
24 Série1
20
13
10
4
0
154 158 162 166 170 174
Unidade 3 141
DICA
Ao desenhar o gráfico de frequência acumulada, não se esqueça, ao chegar
ao topo máximo encontra-se a frequência total, como no Gráf. 14 referente
à Tab. 40.
9.4 Curva de frequência

A curva de frequência também é conhecida como curva polida e resulta do po-
limento do polígono de frequência.
DICA
Enquanto o polígono de frequência apresenta a imagem real, a curva de
frequência serve para analisar as tendências, ou seja, apresenta a imagem
tendencial do fenômeno em estudo.
Com essa imagem tendencial, os pesquisadores conseguem prever com mais efi-
cácia algumas situações por meio de estudos desenvolvidos com apoio das dis-
tribuições normais, assim como conseguem usar melhor a probabilidade aliada
à estatística.
Como construir uma Curva de Frequência?

Geometricamente, basta eliminar os vértices da linha poligonal, mas para que
isso seja possível, algebricamente, usa-se a fórmula:
f + 2 f +f
fci = i-1 i i+1
4
Sendo:
fci frequência calculada da classe considerada;

fi – 1 frequência absoluta da classe anterior à classe considerada;
fi frequência absoluta simples da classe considerada; e
fi + 1 frequência absoluta da classe posterior à classe considerada.
142 Unidade 3
Adotando como exemplo a tabela de estatura dos 40 alunos já utilizada, têm-se:

Colégio A
I Estaturas (cm) fi fci
1 150 I 154 4 4,2
2 154 I 158 9 8,2
3 158 I 162 11 9,8
4 162 I 166 8 8
5 166 I 170 5 5,2
6 170 I 174 3 2,8
 fi = 40
Para uma melhor compreensão do processo, siga os passos:
1º) Calcule a fci para cada intervalo, resultando nos dados da 4ª coluna, por
exemplo:
f1-1 + 2 fi+ f1+1
fci = = 0 + 2 . 4 +9 = 17 = 4,25
4 4 4
e assim sucessivamente.
DICA
Como não existe frequência anterior a primeira classe considerada e poste-
rior a última classe considerada, usa-se 0 (zero). Para facilitar a sua represen-
tação geométrica, os dados poderão ser arredondados para uma casa decimal, de acordo
com o estudo do módulo 5, item 5.3.
2º) Marque no plano cartesiano, no eixo das abscissas, os intervalos de classe; e,

no eixo das ordenadas, as fci;
3º) Calcule os pontos médios dos intervalos e, na sequência, una-os às respecti-
Unidade 3 143
vas frequências fci, marcando seus pares ordenados; e
4º) Por fim, ligue-os com uma suave linha a qual resultará na curva de frequên-
cia, mostrada a seguir no Gráfico 15:
Gráfico 15 - Curva de Frequência para Representar a Estatura de 40 Alunos

do Colégio A
Essas curvas de frequência podem ser caracterizadas de acordo com as formas

descritas a seguir.
9.4.1 Curvas em Forma de Sino
Caracterizam-se por se apresentar com um valor máximo na região central, por

esse fato são conhecidas como curva de tendência normal.
Essas curvas classificam-se em simétrica e assimétrica:
a) Simétrica: quando apresentam o valor máximo no centro e os pontos equidis-

tantes a ele, possuem a mesma frequência, conforme mostra a Fig. 03.
144 Unidade 3
Figura 3 - Curva na Forma de Sino Simétrica
Fonte: Crespo (2009, p. 66), adaptado.
b) Assimétrica: quando apresentam uma cauda do lado do valor máximo,

sendo positiva se a cauda estiver à direita e negativa quando à esquerda. Para
diferenciá-las, observe a Figura 4:
Figura 4 – Curvas de Frequência Assimétricas Negativa e Positiva
Essas curvas costumam ser adotadas para apresentar distribuições relacionadas

à pesquisas sobre estatura de um grupo de pessoas; o peso dos alunos de uma
turma; o grau de QI medidos em testes educacionais; os preços relativos de de-
terminado produto. (CRESPO, 2009).
9.4.2 Curvas em Forma de Jota
São curvas utilizadas para apresentar distribuições quando extremamente assi-

métricas, sendo caracterizadas, por apresentarem o ponto mais alto no eixo y
Unidade 3 145
do plano cartesiano em uma das extremidades, formando um jota ou um jota
invertido, conforme à Fig. 05.
Figura 5 – Curvas de Frequência em forma de jota invertido e de jota

Os especialistas costumam usar esse formato para apresentar estudos relacio-
nados a fenômenos econômicos e financeiros, assim como na distribuição de
vencimentos ou rendas pessoais.
9.4.3 Curvas em Forma de U

Essas curvas são definidas por apresentarem as suas ordenadas máximas nas
duas extremidades, como mostra a Figura 6.
Figura 6 – Curva de frequência em forma de U
146 Unidade 3
As curvas em forma de U costumam ser aplicadas nas distribuições referentes à
mortalidade por idade, por exemplo:
Ao analisarmos uma curva desse tipo, sabe-se que enquanto o ser humano é
criança, geralmente, arrisca-se mais, quando brinca, sobe escada e desce corren-
do, podendo com isso apresentar um risco maior de morte. Ao chegar às idades
de jovens e adultos, isso se estabiliza mais, diminuindo os riscos e; quando ido-
sos, novamente o risco de morte tende a aumentar, por doenças muitas vezes da
própria idade, o que, sem dúvida, poderá ser bem representado pela curva em
forma de U.
9.5 Distribuição regular
Esta representação ocorre quando a distribuição é formada por classes, com a

mesma frequência, ou seja, à medida que os valores da abscissa aumentam, o
valor da ordenada se mantém. Na prática, são raras as aplicações.
Por exemplo: Imagine que você é professora de determinada escola e, por algum
motivo, não recebe aumento nos últimos três anos, isso poderá ser representado
por meio de uma distribuição regular, conforme o Gráfico 16:
Unidade 3 147
Síntese do módulo
Neste módulo, você estudou que as distribuições de frequência costumam ser
representadas graficamente por meio de três figuras: Histograma, Polígono de
frequência e Polígono de frequência acumulada, também conhecido por gráfico
de Ogiva, cada qual com suas características. Aprendeu os passos necessários
para desenhar uma curva de frequência, ou seja, uma representação estatística
que possibilita aos pesquisadores visualizar possíveis tendências, resultantes de
uma distribuição de frequência, relacionada ao estudo do fenômeno em questão.
Para fechar o módulo, conheceu as diferentes formas de apresentar as distribui-
ções, tais como: curvas na forma de sino (simétrica e assimétrica); em forma de
jota e jota invertido; na forma de U e distribuição regular.
ATIVIDADES

1) Atento à seguinte distribuição de frequência, construa os gráficos do tipo:

a) Histograma;
b) Polígono de frequência;
c) Gráfico de Ogiva; e
d) Curva de frequência.
Tabela - Distribuição de
Frequência
Classe fi
2 l 6 2
6 l 10 4
10 l 14 9
14 l 18 18
18 l 22 9
22 l 26 5
26 l 30 3
148 Unidade 3
Para lembrar!
Se achar por bem, poderá usar algum software voltado

a planilhas eletrônicas, para auxiliar você a confeccionar
esses gráficos.
2) Os gráficos apropriados para representar uma distribuição de frequência são:

a) Gráfico em setor, gráfico em barras e curva normal.
b) Curva de frequência e gráficos de coluna, barra e pizza.
c) Histograma e polígono de frequência.
d) Gráfico de coluna, curva de frequência e histograma.
e) Curva de frequência, gráfico de colunas e polígonos de frequência.
3) Na confecção dos gráficos histograma e polígono de frequência, em qual deles

usa-se, obrigatoriamente, as frequências acumuladas? Assinale a resposta corre-
ta:
a) Em ambos.
b) No primeiro.
c) Somente no segundo.
d) Em nenhum.
e) Dependendo do tipo de variável, no primeiro, às vezes.
Unidade 3 149
1) O diretor da empresa A, contratou um especialista em estatística para ajudá-

-lo a resolver determinadas situações, colocando-o a par da folha de pagamento
da empresa através da distribuição de frequência, referente aos salários de seus
funcionários.
Suponha que você seja o estatístico, após analisar a distribuição resolva a questão,
descrevendo sua justificativa.
Tabela – Distribuição de frequência salarial

Classe salarial (R$) fi
2.000,00 l 4.000,00 18
4.000,00 l 6.000,00 45
6.000,00 l 8.000,00 102
8.000,00 l 10.000,00 143
10.000,00 l 12.000,00 51
12.000,00 l 14.000,00 41
Fonte: Autora
Dentre os itens a seguir, qual é a opção que corresponde ao valor x que não é
operado (efetuado) por aproximadamente 90% das observações salariais.
a) 5.980,00
b) 9.000,00
c) 10.000,00
d) 11.380,00
e) 12.000,00
150 Unidade 3
JUSTIFICATIVA
2) O histograma a seguir, está representando dados de uma determinada amos-

tra, com o eixo horizontal representando os pontos médios das classes, todas
com a mesma amplitude e, o eixo vertical, as suas frequências relativas.
Após analisá-lo, responda a questão 2.1.
Gráfico Histograma
20
18
15
12
10
9
8
6
2,5 3 3,5 4 4,5 5 5,5 6 6,5

Ponto Médio da Classe
2.1) A probabilidade de um valor escolhido estar entre 4,25 e 6,25 é:

a) 68%
b) 60%
c) 55%
d) 48%
e) 42%
Unidade 3 151
3) (ENADE, 2008): Apesar do progresso verificado nos últimos anos, o Brasil
continua sendo um país em que há uma grande desigualdade de renda entre os
cidadãos. Uma forma de se constatar este fato é por meio da Curva de Lorenz,
que fornece, para cada valor de x entre 0 e 100, o percentual da renda total do
País auferido pelos x% de brasileiros de menor renda. Por exemplo, na Curva de
Lorenz para 2004, apresentada ao lado, constata-se que a renda total dos 60% de
menor renda representou apenas 20% da renda total.
Fonte: ENADE, 2008
De acordo com o mesmo gráfico, o percentual da renda total correspondente aos

20% de maior renda foi, aproximadamente, igual a:
a) 20%.
b) 40%.
c) 50%.
d) 60%.
e) 80%.
4) (Adaptado CESPE) Baseando-se nos dados da tabela a seguir, em que se de-

monstra a distribuição de frequência das receitas de todas as empresas de da
cidade X:
152 Unidade 3
Classes Receitas (R$) Quantidade de empresas
1 0 ll 200.000 1.100
2 200.001 ll 400.000 900
3 400.001 ll 600.000 550
4 600.001 ll 800.000 300
5 800.001 ll 1.000.000 150
Julgue o item a seguir.
A frequência acumulada relativa das empresas que estão nas classes de 1 a 3 é de

85%.
Por quê?
5) (Adaptado, IBGE) Uma obra foi dividida em 5 itens e, a partir de seus custos,
foi montada a curva ABC, apresentada no gráfico.
Unidade 3 153
Considerando que o custo total da obra é de R$ 25.000,00, afirma-se que:
a) A participação do item 2, no custo total da obra, é de 60%.
b) O item 5 é o mais oneroso da obra.
c) O custo do item 4 é de R$ 23.750,00.
d) O custo do item 3 é de R$ 5.000,00.
e) Os itens encontram-se dispostos, no eixo das abscissas, em ordem crescente de

participação em relação ao custo total da obra.
154 Unidade 3
Unidade 4
Medidas de posição e de
dispersão e estimação
Na unidade 3 foram estudadas algumas possibilidades relacionadas à
distribuição de frequência que permite aos interessados na pesquisa
descrever os grupos dos valores que uma variável pode assumir.
Com essas informações, consegue-se identificar a maior
concentração de valores de determinada distribuição, mas
somente de modo geral, ou seja, verificar sua localização (se no
início, meio ou ao final) e se há uma distribuição por igual.
Mas em algumas situações, necessita-se identificar as tendências
características de cada distribuição, de forma isolada, ou em
confronto com outras, isso só é possível por meio de números
que traduzam essas tendências, ou seja, das medidas de:
1) Posição;
2) Variabilidade ou dispersão;
3) Assimetria; e
4) Curtose. ■
Vamos estudá-las?
Módulo 10
Medidas de posição
As medidas de posição são estatísticas aplicadas para representar os dados de
uma distribuição, auxiliando os pesquisadores quanto a sua posição em relação
ao eixo das abscissas num plano cartesiano (CRESPO, 2009). Entre elas, desta-
cam-se:
a) As Medidas de Tendência Central:

– A Média Aritmética;
– A Mediana; e
– A Moda.
b) As Medidas Separatrizes:
– A Própria Mediana;
– Os Quartis; e
– Os Percentis.
Daremos início ao estudo, a partir das medidas de tendências centrais, nas

quais os dados observados tendem a se agrupar em torno dos valores centrais,
por isso, a sua denominação.
Unidade 4 157
10.1 Medidas de tendência central
Estas medidas (média, moda e mediana) podem ser calculadas e apresentadas

com dados não agrupados, com dados agrupados sem intervalos e com dados
agrupados com intervalos, conforme descrição dada a seguir:
10.1.1 Medidas de Posição Com Dados Não Agrupados
- Média (x)
Entre as medidas mais conhecidas dessa categoria, encontra-se a Média Aritmé-
tica (conhecida simplesmente por Média), simbolizada por ( x ), podendo ser do
tipo simples (quando os dados não estão agrupados) ou ponderada.
Obtém-se a média aritmética simples calculando-se a divisão da soma de todos

os valores observados da variável (xi) pela quantidade de observações (n), através
da fórmula:
∑ xi
x = n
Por exemplo: Ao observar as notas de 7 alunos da turma1 de estatística, obtêm-
-se o ROL: 4,0; 5,0; 5,0; 6,0; 6,0; 7,0; 7,0; 8,0. Qual será então a média aritmética
da turma 1?
Aplicando-se a fórmula, tem-se:

∑ xi = 6,0 + 6,0 + 7,0 + 7,0 + 8,0 = 6,0
=
x 4,0 + 5,0 + 5,0 +
n n
Logo, a média aritmética simples da turma1 de estatística é 6.
- Moda (Mo)
Assim como se fala no popular “a roupa da moda”, quer dizer, a roupa mais usada,
estatisticamente moda também é o que ocorre com mais frequência, neste caso,
o valor.
158 Unidade 4
Quando dois valores têm a máxima frequência, denomina-se BIMODAL; já
MULTIMODAL quando mais de dois valores têm a máxima frequência.
DICA
Para os casos impossíveis de determinar a moda, a distribuição é chamada
de AMODAL.
Por exemplo: Analisando a série 1; 2; 3; 4; 5; 5; 5; 6; 7; 8; 9, a moda (Mo) é igual a

5, pois é o elemento que mais aparece na série.
- Mediana (Md)
A mediana é caracterizada pelo valor do elemento central de uma série estatística

que a divide em duas partes com o mesmo número de elementos, estando esta
distribuição organizada em ordem crescente ou decrescente (CRESPO, 2009).
Para qualquer série de números, primeiramente, deve-se ordená-los e, na sequ-

ência obtêm-se a mediana (o valor que ocupa a posição), usando as fórmulas:
a) Md = n + 1 se n for ímpar; e
2
b) Md = a média aritmética dos termos n n
e + 1 se n for par.
2 2
Por exemplo:
a) Dada à série 13; 15; 10; 2; 5; 18; 6; 9; 16, a mediana será:
1º) Organiza-se a série (ROL): 2; 5; 6; 9; 10; 13; 15; 16; 18;

2º) Tendo n = 9 (ímpar) usa-se a fórmula:
Md = n+1 Md = 9 + 1 = 5, o 5º termo definirá a mediana, Md = 10.

2 2
Unidade 4 159
Já para uma série com o número de elementos par, por exemplo:
b) Dada à série 13; 15; 2; 5; 18; 6; 9; 16, a mediana será:
1º) Organiza-se a série (ROL): 2; 5; 6; 9; 13; 15; 16; 18;

2º) Tendo n = 8 (número par de elementos), usa-se a fórmula:
Md = a média aritmética dos termos n e n + 1 logo:

2 2
n = 8 = 4 (4º termo da série) e n + 1 = 8 + 1 = 4 + 1 = 5 (5º termo da série)
2 2 2 2
Md = x = 9 + 13 = 22 = 11 Md = 11
2 2
DICA
Quando os dados não estiverem agrupados e a série possuir um número
ímpar de elementos, o valor da mediana pertencerá à série, mas quando
a série possuir um número par de elementos, o valor mediano poderá não pertencerá à
série, pois ele ficará entre 2 elementos.
10.1.2 Medidas de Posição Com Dados Agrupados Sem In-

tervalos
- Média (x)
Neste caso, obtêm-se a média aritmética ponderada ou simplesmente média,
calculando-se a divisão da soma do produto de todos os valores observados da
variável (xi) e a sua frequência ( fi ), pelo somatório das frequências.
∑ xi. fi
x =
∑ fi
160 Unidade 4
Aqui, como os dados são agrupados sem intervalos de classe, o valor de xi é o
próprio número, por exemplo:
Tabela 41 - Média Aritmética de 5 Alunos da
Turma 2 de Estatística – Semestre 2012-2
Nota ( xi ) Frequência ( fi ) xi . fi
3 1 3
4 2 8
5 2 10
6 2 12
7 1 7
TOTAL 8 40
Aplicando-se a fórmula, tem-se:

∑x .f
x = i i = 3 . 1 + 4 . 2 + 5 . 2 + 6 . 2 + 7 . 1 = 40 = 5
∑ fi 8 8
Este é extremamente rotineiro na vida acadêmica:
Suponha que João queira calcular a sua média na disciplina de estatística, tendo
tirado 8,5 na 1ª avaliação; 7,5 na 2ª avaliação e, 5,0 na 3ª avaliação. Segundo as
informações disponíveis no plano de ensino, cada avaliação possui peso: 3; 3 e 4,
respectivamente, logo a média de João poderá ser calculada, conforme mostra a
(Tabela 42):
Tabela 42 - Média Ponderada em
Estatística – 2012-2
Nota (xi) Peso (fi) xi . f i
8,5 3 25,5
7,5 3 22,5
5 4 20
TOTAL 10 68
Fonte: Autora, dados hipotéticos
Unidade 4 161
∑ xi . fi
= 68,0 = 6,8
Logo, sua média é igual a:
x =
∑ fi 10
DICA
A média aritmética ponderada deve ser utilizada quando os valores variam
em grau de importância.
- Moda (Mo)
Para determinar essa medida de posição, basta analisar a maior frequência.
Por exemplo: Analisando a distribuição de frequência mostrada na (Tabela 43):
Tabela 43 - Distribuição de Frequência do

Número de Dependentes
Número De
Frequência fi
Dependentes
1 12
2 20
3 15
4 7
5 1
Conclui-se que a MODA (Mo) = 2, pois o valor da maior frequência é 20 referen-

te a 2, logo a moda neste caso é ter dois dependentes.
- Mediana (Md)
Numa distribuição de frequência sem intervalo de classe, a mediana é calculada
com base na frequência acumulada. Para esse cálculo, devemos adotar um dos
dois modelos apresentados a seguir, dependendo da situação. Vamos conhecê-
-los?
162 Unidade 4
Modelo 1: Dada a Tab. 46 de distribuição de frequência relacionada ao número
de dependentes de um grupo de indivíduos, mostrada na sequência, qual será
seu valor mediano?
Tabela 44 - Distribuição de Frequência do
Número de Dependentes
Número De
Frequência fi xi . f i Fi
Dependentes
1 11 11 11
2 20 40 31
3 15 45 46
4 7 28 53
5 1 5 54
TOTAL 54 129
Primeiro, calcula-se as frequências acumuladas, mostradas na 4ª coluna da tabe-

la; depois, calcula-se o somatório das frequências simples dividido por 2, ou seja
54 = 27, o que significa que agora é necessário procurar o vigésimo

: ∑ fi =
2 2
sétimo termo na coluna das frequências acumuladas.
Atento à Tab. 44, observe que a 1ª classe vai do elemento 1 ao 11, a 2ª do 12 ao 31

e assim por diante, o que implica o 27º pertencer a 2ª classe, logo, relacionando
esta posição ao número de dependentes, tem-se um número mediano de depen-
dentes igual a 2.
Mas para algumas distribuições, o modelo adotado é outro.

Modelo 2: Suponha a seguinte distribuição de frequência, apresentada na (Tabela
45):
Tabela 45 - Distribuição de Frequência Modelo2 para Cálculo da Mediana
xi Frequência fi Fi
10 1 1
17 2 3
24 1 4
31 2 6
38 1 7
45 1 8
TOTAL 8
Unidade 4 163
Então, primeiro como nas demais distribuições se calcula:
∑ fi = 8 = 4
, analisando a tabela, percebe-se que o 4º termo pertence a 2ª
2 2
classe, porém, nesse caso, o valor coincide (4 com 4), logo a mediana não será o
valor de xi imediato, mas sim a soma deste com o próximo, dividido por dois, ou
seja, neste exemplo tem-se:
Md = 24 + 31 = 27,5
2
10.1.3 Medidas de Posição Com Dados Agrupados Com In-

tervalos
- Média (x)
Nestes casos com intervalos de classe, faz-se necessário encontrar o ponto mé-
dio.
Releia!
O ponto médio obtém-se dividindo a soma dos limites su-

perior e inferior do intervalo em questão por dois, ou seja, Li + li.
xi =
2
Por exemplo: Ao se analisar a distribuição de frequência apresentada a seguir,

qual será a média das vendas realizadas?
Tabela 46 - Vendas de Impressora Multifuncional –
Janeiro de 2013
Impressoras
Classe fi Ponto Médio xi
Vendidas
1 1 l 4 7 1 + 4 = 5/2 = 2,5
2 4 l 7 10 5,5
3 7 l 10 15 8,5
4 10 l 13 5 11,5
5 13 l 16 5 14,5
6 16 l 19 5 17,5
7 19 l 22 3 20,5
TOTAL 50
164 Unidade 4
Para responder a esse questionamento, basta, após calcular os pontos médios
mostrados na 4ª coluna, aplicar a fórmula:
Logo, a média aritmética ponderada é:

∑ xi . fi 2,5 . 7 + 5,5 . 10 + 8,5 . 15 + 11,5 . 5 + 14,5 . 5 + 17,5 . 5 + 20,5 . 3
x = = = 479 = 9,58
∑ fi 50 50
- Moda (Mo)
Para os casos em que os dados estão agrupados com intervalos de classe, faz-se
necessário desenvolver o procedimento:
1º) Encontra-se a CLASSE MODAL (classe que tem a maior frequência);

2º) Aplica-se a fórmula:
Mo = xi = Li+ li utilizando-se a classe modal

2
Para o exemplo dado a seguir, tem-se:
Tabela 47 - Estaturas dos alunos da Turma 501
Classes (I) Estaturas em cm fI

1 150 l 160 15
2 160 l 170 20
3 170 l 180 10
TOTAL 45
Como a classe modal é 2, por possuir a maior frequência a:
Mo = xi = Li+ li = 170 + 160 = 165

2 2
Unidade 4 165
- Mediana (Md)
ATENÇÃO!
Na maioria das vezes, tem-se uma exceção para o cálculo da mediana:
Quando os dados agrupados possuem intervalos de classe, é preciso encontrar a

classe mediana. Para encontrá-la, é preciso aplicar a fórmula ∑ fi e, na sequên-
2
cia, com a classe mediana definida (aquela correspondente à frequência acumu-
lada imediatamente superior), aplica-se a fórmula da mediana a seguir:
md = l + (i
∑f
2
i - fac (ant) . h
fi
Sendo:
– li: limite inferior da classe mediana;

– ant: frequência acumulada anterior da classe mediana;
– h: amplitude; e
– fi: frequência da classe mediana.
Por exemplo, observe a Tabela 48, que apresenta as estaturas de um grupo de

jovens:
Tabela 48 - Estatura de um grupo de jovens – bairro X de
Criciúma
Classes (i) Estaturas em cm fi faci
1 150 l 160 4 4
2 160 l 170 10 14
3 170 l 180 20 34
4 180 l 190 6 40
5 190 l 200 6 46
6 200 l 210 2 48
166 Unidade 4
Para obter a mediana dessa distribuição:
1º) Encontra-se a classe mediana: ∑ fi 48 = 24

=
2 2
Observe que a classe 3, que está entre o intervalo 170 e 180, é quem tem a fre-
quência acumulada imediatamente superior a 24, logo essa é a classe mediana.
2º) Aplica-se a fórmula da mediana

∑ fi
md = li + (2 - fac (ant) . h como a amplitude é 180 – 170 = 10 e a
fi
frequência acumulada anterior à classe (3) é 14, tem-se:
md = 170 + (482 - 14 . 10 md = 170 + 5 md = 175

20
VAMOS REFLETIR?
Não existe uma ordem de prioridade quanto ao uso das medidas de posição
central, por isso, é importante que você saiba calcular e aplicar todas as estu-
dadas.
O que pode ajudar, é lembrar que:
Quando as distribuições são simétricas a MÉDIA e a MEDIANA são IGUAIS e; quando assimé-
tricas são DIFERENTES.
Tão logo, uma distribuição apresentada numa curva em forma de sino terá:
- x = Md = Mo, quando a curva for simétrica;
- Mo < Md < x , quando a curva for do tipo assimétrica positiva; e
- x < Md < Mo, nos casos em que a curva for assimétrica negativa.
Unidade 4 167
ESTUDO COMPLEMENTAR
Estas curvas poderão ser visualizadas na obra de Crespo (2009, p. 94 e 95).
Bibliografia completa: CRESPO, A. A.. Estatística fácil. 19ª Ed. Atual: São Paulo Saraiva, 2009.
10.2 Medidas separatrizes
As medidas separatrizes são também medidas de posição, mas que diferente das
de tendência central que caracterizam uma série estatística devido a sua posição
central, as separatrizes são medidas que dividem o conjunto de dados de uma
série estatística num certo número de partes iguais.
Entre estas medidas, destacam-se: a própria mediana, os quartis e os percentis.
As medianas, nesta categoria, encaixam-se pela propriedade de dividir a série

estatística em duas partes iguais.
Mas por já ter sido detalhada nas de tendência central, neste tópico serão abor-
dados as demais medidas de ordenamento:
- Os quartis
Como o próprio nome indica, os quartis são medidas separatrizes que dividem a
série em quatro partes iguais.
Uma distribuição de frequência divide-se em três quartis, sendo eles:
- O primeiro quartil (Q1): o valor situado de tal modo na série, em que uma
quarta parte, ou seja, 25% dos dados é menor que ele e o restante, as três quartas
partes (totalizando 75%) são maiores;
- O segundo quartil (Q2): é o valor que coincide com da mediana, ou seja, Q2 =

Md;
168 Unidade 4
- O terceiro quartil (Q3): o contrário do Q1, é o valor situado de tal modo que
as três quartas partes (75%) dos termos são menores que ele e uma quarta parte
(25%) é maior.
Você deve estar se perguntando, como proceder para calculá-los?
Em primeiro lugar, os dados devem estar organizados e, quando agrupados, bas-

ta aplicar o mesmo cálculo da mediana, trocando a fórmula:
∑ fi por: k . ∑ fi tendo como k o número de ordem do quartil.

2 4
Tão logo, tem-se:
Q1 = li + ( ∑ fi - fac (ant) . h
2 ; Q2 = Md e
fi
Q 3 = li + (3∑2 f - f
i
ac (ant) . h
fi
Por exemplo:
Para a distribuição de frequência apresentada na Tabela 49 a seguir:

Colégio A
Estaturas (cm) fi Fi
150 I 154 4 4
154 I 158 9 13
158 I 162 11 24
162 I 166 8 32
166 I 170 5 37
170 I 174 3 40
 fi = 40
Unidade 4 169
Têm-se os seguintes quartis:
Q1 (PRIMEIRO QUARTIL): Q3 (TERCEIRO QUARTIL):

k . ∑ fi 40 k . ∑ fi = 3 . 40 = 120 = 30
4 = 4 = 10
4 4 4
Q1 = 154 + (10 - 4) .4 Q3 =162 + (30-24) . 4 = 162 + 3 =
9 8
= 154 + 2,66 = 156,66
165
Q1 = 156,7 cm Q3 = 165 cm
- Os percentis
São as medidas dos 99 valores que separam a distribuição em 100 partes iguais
(CRESPO,2009).
Simbolicamente, representa-se por P1; P2; ... ; P53; ... P99
Para calcular os percentis, troca-se a fórmula da mediana por: ,

∑ fi k . ∑ fi
tendo como k o número de ordem do percentil.
2 100
Tomando como exemplo a distribuição (Tabela 49) trabalhada na medida quar-
til, tem-se como 8º percentil:
K =8
k . ∑ fi 8 . 40
= = 3,2
100 100
P8 = 150 + (3,2 - 0) . 4 = 150 + 12,8 = 150 + 3,2 = 153,2

4 4
P8 = 153,2 cm
170 Unidade 4
Síntese do módulo
No decorrer deste módulo, foram repassadas a você caro leitor, informações so-
bre:
– As medidas de posição de tendência central, nas quais os dados observados

tendem a se agrupar em torno dos valores centrais, entre elas a média, moda e
mediana;
– As medidas de posição separatrizes (quartis, percentis e a própria mediana)
por caracterizar-se como uma medida que além de definir a posição central pelo
maior valor da frequência, também separa, divide a distribuição dos dados em
partes iguais.
– Como calcular as medidas de posição, diferenciando-as quando necessário em

três grupos: dados não agrupados; dados agrupados sem intervalos e dados agru-
pados com intervalos de classe, podendo agora aplicá-los com suas característi-
cas próprias.
ATIVIDADES

mente, e na sequência, confira suas respostas ao final do livro.
1) Dadas às questões, faça o somatório das alternativas corretas:

(02) A média, a moda e a mediana são valores de posição.
(04) A média aritmética da série: 6; 2; 3; - 5; - 7; 2; 5; - 3; 0; 8; 10 é igual a – 1,9.
(08) A mediana da série 10; 15; 12; 7; 3; 8; 2 é igual a 8.
(16) Quando os dados não estiverem agrupados e a série possuir um número par
de elementos, o valor da mediana pertencerá à série, mas quando a série possuir
um número ímpar de elementos, o valor mediano não pertencerá à série, pois
ficará entre 2 elementos.
(32) Todas as alternativas estão incorretas.
TOTAL = ( )
Unidade 4 171
2) No conjunto a seguir, referente às notas de estatística de 15 acadêmicos:
{1,0; 2,0; 3,0; 8,0; 5,0; 7,0; 6,0; 9,0; 4,0; 6,0; 2,0; 10,0; 3,0; 5,0; 3,0},
José Antonio, professor da disciplina, conclui que a mediana é igual a:
a) 5,0 acadêmicos;
b) Nota 5,0;
c) 9,0 acadêmicos;
d) Nota 9,0;
3) (AMEC, Trabuco): Em 20 postos de combustíveis de uma cidade, foi realizada

uma pesquisa para avaliar o impacto da redução do preço da gasolina comum,
anunciada pelo governo, observando-se a seguinte distribuição de frequência:
Número de postos pesquisados 5 3 4 8

Preço da gasolina em reais 1,9 2,10 2,25 2,30
Da análise da tabela, pode-se concluir que a média, a moda e a mediana da dis-

tribuição correspondem, respectivamente, a:
a) 2,14; 2,30 e 2,25;

b) 2,14; 2,25 e 2,30;
c) 2,16; 2,30 e 2,10;
d) 2,16; 2,30 e 2,25;
e) 2,16; 2,10 e 2,25.
172 Unidade 4
Módulo 11
Medidas de dispersão ou de
variabilidade
As medidas de variabilidade são bastante aplicadas mercadologicamente, por
darem uma visibilidade complementar às medidas de posição estudadas, princi-
palmente no que tange à análise completa (interpretação dos dados mostrando
suas possíveis variações), contribuindo - e muito - para que os gestores tomem
decisões.
Dentre estas medidas, encontram-se :
– Amplitude Total;
– Variância;
– Desvio Padrão; e
– Coeficiente de Variação.
Unidade 4 173
11.1 Amplitude total (AT)
A medida de Amplitude total, conforme já mencionado, no módulo 8, é a dife-

rença entre o maior e o menor valor observado na pesquisa, que serve para medir
a dispersão total de um conjunto de dados.
Analisando o exemplo a seguir, tem-se as séries que representam as temperaturas

de 3 regiões nos últimos 3 dias de abril/2012, observe:
A = 25; 25; 25 B = 23; 25; 27 C = 5; 25; 45
Calculando a média aritmética (medida de tendência central), tem-se:
A = 25 + 25 + 25 = 25 B = 23 + 25 + 27 = 25 C = 5 + 25 + 45 = 25
3 3 3
As médias aritméticas das três regiões são iguais. Mas a amplitude total, vamos
calcular?
ATA = 25 – 25 = 0 ATB = 27 – 23 = 4 ATC = 45 – 5 = 40
Com a amplitude total, de acordo com o exemplo, pode-se ter uma ideia da varia-
ção dos dados, neste caso percebe-se que a região C teve um dia de temperatura
altíssima e dois dias depois extremamente baixa, o que os estatísticos não conse-
guem visualizar apenas com a média (medida de posição de tendência central).
A aplicação total é uma medida que se costuma adotar, quando se quer calcular a
variação: de vendas de produtos, de temperaturas, de idades, por exemplo.
Essa medida (AT) poderá ser calculada para: dados agrupados sem intervalos e
com intervalos de classe.
a) Os percentis
Dada a Tabela 50, observe:
174 Unidade 4
Tabela 50 - Exemplo de Amplitude Total
CLASSE (xi) FREQUÊNCIA (fi)

1 9
2 8
3 5
4 10
5 20
Neste exemplo, basta adotar:
AT = x(Max.) – x(mín.) AT = 5 – 1 = 4
Ou seja, quando os valores da distribuição apresentam-se sem intervalos de clas-

se, basta analisar a primeira coluna das classes e fazer a diferença da maior com
a menor.
b) AT para Dados Agrupados Com Intervalos de Classe
Dada a Tabela 51 observe:

Tabela 51 - Exemplo de Amplitude Total
Com Intervalo
Salário da Empresa A (xi) Frequência (fi)
500 l 1000 9
1000 l 1500 18
1500 l 2000 15
2000 l 2500 10
2500 l 3000 2
Neste exemplo, o processo é similar ao anterior, mas os limites serão os relacio-

nados ao intervalo de classe e não à classe diretamente, usa-se o limite inferior da
primeira classe e o limite superior da última classe, na sequência, basta aplicá-los
na fórmula:
Unidade 4 175
AT = L(Max.) – l(mín.) AT = 3000 – 500 = 2500
Não se esqueçam para realizar esse cálculo, os dados precisam estar agrupados
em uma tabela de distribuição de frequência.
Ao analisar os exemplos dados, conclui-se que a AT serve para medir a dispersão
total do conjunto de dados. Com essa medida, os interessados no objeto de pes-
quisa conseguem analisar o começo ou o menor valor e o maior valor da série,
que dependerá de cada série, mas basicamente não verificam os demais valores
da série.
Tão logo, mesmo com toda a facilitada em relação a seu cálculo, os estatísticos
dão preferência às demais medidas de dispersão, que consideram os demais va-
lores, como o desvio padrão e a variância, o que não significa não ser utilizada.
11.2 Variância (s2)
A variância é uma medida de dispersão encontrada a partir dos desvios em torno

da média aritmética, denotada por s2.
A fórmula geral da variância é dada por:
s2 = ∑ fi (xi - x)
2
n
Tomando como exemplo a Tab. 52:
Tabela 52 - Exemplo de Variância e Desvio Padrão
(xi – x)2
Item Idade xi – x
1 18 – 4,4 19,36
2 23 0,6 0,36
3 27 4,6 21,16
4 18 – 4,4 19,36
5 20 – 2,4 5,76
6 19 – 3,4 11,56
7 21 – 1,4 1,96
8 32 9,6 92,16
9 25 2,6 6,76
10 21 – 1,4 1,96
 224 0 180,40
176 Unidade 4
Observe como essas medidas de dispersão são calculadas:
1º) Primeiramente, determina-se a média:
∑ xi , neste caso, somando-se as idades encontra-se o valor 224, logo

x=
n
com 10 itens, tem-se a média dada por x = 224 = 22,4
10
2º) Calcula-se os valores da 3ª coluna, aplicando-se a diferença: da IDADE pela
média aritmética e obtêm-se xi - x como no modelo da Tabela 54, ou seja,
18 – 22,4 = – 4,4 e assim sucessivamente.
3º) Eleva-se ao quadrado os dados obtidos no 2º passo, ou seja, eleva-se ao 2

quadrado a diferença: da IDADE pela média aritmética e obtêm-se (xi - x) ,
como no modelo da Tab. 54, os valores da 4ª coluna: (– 4,4)2 = 19,36 e assim
sucessivamente.
Assim, a variância em relação aos dados da Tabela 54, é dada por:
s2 = ∑ (xi - x) = 180,40
2
= 18,04 idade
n 10
11.3 Desvio padrão (s)
Esta medida de dispersão trabalha com todos os valores da série, levando em

consideração o todo, o que permite aos pesquisadores uma análise completa da
variabilidade dos dados, por isso é a medida de maior aplicabilidade (DALPIAZ,
GESSER e TAFNER, 2004).
Essa medida baseia-se em torno da média aritmética e pode ser entendida como
a raiz quadrada da média simples dos quadrados dos desvios, denotada pela letra
s.
Para o cálculo do desvio padrão, dependendo de como os dados se apresentam,

faz-se uso das fórmulas:
Unidade 4 177
podendo ser substituído por
ou
Tomando como exemplo o enunciado trabalhado no item variância (s2), (Tabela

54), tem-se como desvio padrão o valor resultante da raiz quadrada da medida
de variância (s2), ou seja, aplica-se a 1ª fórmula:
= 4,247 = 4,25 idade
Assim como o desvio padrão pode ser definido por meio da variância, as demais
fórmulas também poderão ser utilizadas para facilitar seus cálculos, caso não
tenha em mãos o valor da variância.
Assim como acontece em outras medidas estatísticas, o desvio padrão também

poderá ser determinado com dados não agrupados, com dados agrupados sem
intervalos de classe e com dados agrupados com intervalos de classe. Estes serão
explicados na sequência pela autora, trabalhados diretamente com exemplos e
aplicabilidade das demais fórmulas para o cálculo da medida de dispersão:
11.3.1 Desvio Padrão Com Dados Não Agrupados
Tomando como exemplo os valores: 40; 45; 48; 52; 54; 62 e 70, o desvio padrão
será dado:
1º) Por praticidade, costuma-se colocá-los em uma tabela com duas colunas:
178 Unidade 4
uma para os valores da série e outra para calcular o valor dos seus quadrados,
conforme mostra a Tabela 53:
Tabela 53 - Modelo do cálculo de Desvio
Padrão com Dados Não Agrupados
xi xi2
40 1.600
45 2.025
48 2.304
52 2.704
54 2.916
62 3.844
70 4.900
 = 371  = 20.293
2º) Agora, com os dados em mãos, basta aplicá-los na fórmula:
Logo, tem-se s = 9,49.
11.3.2 Desvio Padrão Com Dados Agrupados Sem Intervalos de

Classe
Nestes casos, a existência das frequências precisa ser considerada, sendo

este um fato importante no cálculo.
Tomando como exemplo a distribuição de frequência apresentada a seguir

na Tabela 54, o desvio padrão será dado:
Unidade 4 179
1º) Por praticidade, costuma-se trabalhar com 4 colunas:
- a 1ª para os valores dos dados;
- a 2ª, suas respectivas frequências (número de vezes que os dados se repe-
tem);
- a 3ª para mostrar os cálculos do produto de fixi; e
- por fim, a 4ª para apresentar os valores de f ixi 2, (para isso basta multipli-
car f xi por xi).
Acompanhe o exemplo:
Tabela 54 - Modelo do cálculo de Desvio Padrão
com Dados Agrupados Sem Intervalos
NÚMERO DE
DEPENDENTES ( xi )
fi f ix i fi xi 2
0 2 0 0
1 6 6 6
2 12 24 48
3 7 21 63
4 3 12 48
 = 30  = 63  = 165
Fonte: Crespo (2009, p.109, adaptada.
2º) Agora, com os dados em mãos, basta aplicá-los na fórmula:
11.3.3 Desvio padrão com dados agrupados com intervalos

de classe
Nestes casos, o que muda são os dados apresentados em intervalos de classe e não
mais diretamente. Vamos analisar o exemplo:
180 Unidade 4
Dada a distribuição de frequência a seguir, apresentada na Tabela 55, tem-se
como desvio padrão o valor resultante de:
Tabela 55 - Modelo do cálculo de Desvio Padrão Com Dados Agrupados Em

Intervalos de Classes
2
I ESTATURAS EM cm fi xi (PONTO MÉDIO) fixi fixi
1 150 l 154 4 152 608 92.416
2 154 l 158 9 156 1.404 219.024
3 158 l 162 11 160 1.760 281.600
4 162 l 166 8 164 1.312 215.168
5 166 l 170 5 168 840 141.120
6 170 l 174 3 172 516 88.752
 = 40  = 6.440  = 1.038080
Agora, com os dados em mãos, basta aplicá-los na fórmula:
Logo, tem-se s = 5,57 cm.
Esse resultado significa que ao redor da média: 161, a variação está sendo 5,57
para cima ou para baixo, podendo existir alturas mais altas e algumas mais bai-
xas, mas o desvio padronizado em relação à média é de 5,57 cm.
DICA
• O desvio padrão de uma série será sempre um valor positivo.
• Quanto maior for o desvio padrão, maior será a dispersão entre os ele-
mentos.
Para fechar nossos estudos em relação às medidas de variabilidade, vamos aos

coeficientes de dispersão?
Unidade 4 181
11.4 Coeficiente de variação (CV)
É uma medida relativa de dispersão, expressa em porcentagem, denotada por
CV, destacando-se estatisticamente entre as demais medidas de dispersão, por
apresentar uma medida relativa.
O coeficiente de variação é de grande valia quando o objetivo é comparar, em

termos relativos, o grau de concentração, em torno da média de séries diferentes,
como por exemplo: verificar se a variação de uma caixa de suco (unidade em
litros) é maior ou menor do que a de uma caixa de barra de cereais (unidade em
gramas), visto que o resultado é dado em percentual, contribuindo assim na to-
mada de decisões mercadológicas.
Essa medida de dispersão é determinada, calculando-se o quociente do desvio

padrão (s) pela média aritmética (x) , multiplicado por 100, ou seja:
Para compreender melhor essa medida, acompanhe o exemplo:
Ao analisar o acesso a um determinado programa de TV, durante o mês de feve-

reiro de 2013, observa-se que a média de pessoas do sexo masculino é de 3500,
com desvio padrão de 900; e do sexo feminino é em média 2700, com desvio
padrão de 1100. Calculando-se os CV, tem-se:
Para o sexo masculino:
Para o sexo feminino:
O que permite concluir que a variação das mulheres é mais heterogênea, enquan-
to a dos homens mais homogênea, talvez por questões de programação ou não
necessariamente.
182 Unidade 4
Síntese do módulo
Durante este módulo, você recebeu informações relacionadas às medidas de dis-
persão: amplitude total (AT), variância (s2), desvio padrão (s) e os coeficientes
de variação (CV). Estudou como aplicá-las e quando, podendo concluir estatis-
ticamente que, a AT é uma medida que serve para resumir os dados do começo,
ou o menor valor e o maior valor da série, atendo-se aos extremos; enquanto
com a variância e o desvio padrão consegue-se ter uma visão melhor do todo
em relação à média e outras medidas de posição, tendo sido a média nosso foco
de estudo. Por meio da variância mostra-se o quanto os dados estão variando
no conjunto de dados e do desvio padrão, o quanto eles estão dispersos ou não
(heterogêneos ou homogêneos). Para finalizar, conheceu a medida: coeficientes
de variação, sendo esta extremamente aplicável pelo diferencial que apresenta,
visto que no mercado de trabalho, em muitas situações, existe a necessidade de
trabalhar com dados distintos, como produtos com medidas diferentes (litros e
gramas), que precisam ser comparadas, tão logo, isso só é viável com medidas
relativas (em porcentagem), obtidas através desses coeficientes.
ATIVIDADES
1) Analise os itens a seguir e, assinale a alternativa correta para cada item:
1.1) O coeficiente de variação (CV) é uma razão geralmente percentual, re-

sultante entre:
a) O desvio padrão e a mediana.

b) A média e a mediana.
c) A média ponderada e a moda.
d) O desvio padrão e a média aritmética.
e) A média e o número de casos observados.
Unidade 4 183
1.2) Para o conjunto de valores: 0; - 1; - 2; 5; 4; - 3; - 7; 2; - 4 e 6, tem-se:
a) A média 3,4 e a variância 16.
b) A média 0 e a variância 4.
c) A média 0 e a variância 16.
d) A média 3,4 e a variância 3,4.
e) A média 0, sendo a variância impossível de ser calculada.
2) Para cada série dada a seguir, determine as suas medidas de dispersão: ampli-
tude total (AT) e desvio padrão:
a) 1; 3; 5; 9.
b) 20; 14; 15; 19; 21; 22; 20.
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2.
d) – 10; - 6; 2; 3; 7; 9; 10.
e) Tabela: Distribuição do Exercício E
xi 2 3 4 5 6 7 8
fi 1 3 5 8 5 4 2
f) Tabela: Distribuição do Exercício F

CLASSES 1,5 l 1,6 1,6 l 1,7 1,7 l 1,8 1,8 l 1,9 1,9 l 2,0 2,0 l 2,1 2,1 l 2,2
fi 4 8 12 15 12 8 4
3) Em uma prova n – 1 da disciplina de Cálculo I, o grau médio de um grupo de

150 alunos foi 7,8 e o desvio padrão, 0,80. Em Estatística, entretanto, o grau mé-
dio final foi 7,3 e o desvio padrão, 0,76. Em qual disciplina foi maior a dispersão?
184 Unidade 4
Módulo 12
Medidas assimétricas e
medidas de curtose
Ao estudar as curvas de frequência em forma de sino, no módulo 9, falou-se a
respeito da natureza da assimetria, sendo essas curvas classificadas em simétrica
e assimétrica. Por meio dessas curvas, visualiza-se uma imagem tendencial do
estudo em questão, utilizadas pelos pesquisadores para analisar as tendências da
distribuição. Estes, como ferramenta de trabalho, usufruem também das medi-
das de assimetria, as quais procuram caracterizar como e quanto a distribuição
dos dados ou frequências se afastam da condição de simetria e das medidas de
curtose, que indicam o grau de achatamento de uma distribuição.
Vamos em frente?
Vamos à aquisição de novas informações?
Unidade 4 185
12.1 Medidas de assimetria
Estas medidas permitem aos interessados no fenômeno estudado, analisar uma

distribuição em função da relação que existe entre as medidas de posição: média,
mediana e moda, ou seja, revelam o grau de afastamento que uma distribuição
apresenta do seu eixo de simetria, também conhecido como eixo de referência.
O eixo de referência é o eixo traçado sobre a média da distribuição.
Mas quando uma distribuição se apresenta realmente na forma simétrica e assi-

métrica?
Será simétrica quando as medidas de posição da distribuição coincidirem, ou

seja, quando a média, mediana e moda forem iguais, tão logo:
E assimétrica quando a curva de frequência se afasta em relação ao eixo de sime-

tria, podendo essa simetria ser positiva ou negativa:
a) Positiva: quando se afasta à direita, tão logo ;e
b) Negativa: quando se afasta à esquerda, com a .
Para seu melhor entendimento, visualize essas formas na FIG. 7:
Figura 7 - Curvas de Frequência
Fonte: Crespo (2009, p. 116), adapatada.
Para determinar algebricamente o tipo de simetria que uma distribuição apre-

senta, basta calcular a diferença entre a medida da média e a moda ,
sendo:
186 Unidade 4
- simétrica, se (assimetria neste caso é nula);
- assimétrica positiva, se (afasta-se à direita); e
- assimétrica negativa, se (afasta-se à esquerda).
Tomando como exemplo a distribuição a seguir, tem-se:

Tabela 56 - Distribuição – Modelo A
Peso (kg) fi Ponto médio xi . fi

2 l 6 6 (2 + 6) / 2 = 4 4 . 6 = 24
6 l 10 30 8 240
10 l 14 24 12 288
14 l 18 12 16 192
18 l 22 6 20 120
 = 78  = 864
Com os dados das classes e da frequência em mãos, calcula-se o ponto médio,

multiplica-se por cada frequência e aplica-se na fórmula para encontrar a média
e assim definir sua forma:
e a moda, obtém-se por meio da classe
modal, ou seja, na classe que apresenta a maior frequência, aplica-se a fórmula:
para o exemplo dado (a > frequ

ência é 30)
Tão logo, como neste exemplo, a , ou seja, 11,1 – 8 = 3,1 kg > 0, a

curva de frequência é do tipo assimétrica positiva, afasta-se à direita, do eixo de
simetria.
ESTUDO COMPLEMENTAR
Caro leitor, para complementar seu conhecimento a respeito desse assun-
to, poderá visualizar o gráfico da distribuição A e buscar outros exemplos na obra intitulada
como Estatística Fácil, de autoria de Crespo. Segue a referência:CRESPO, A. A.. Estatística
Fácil. 19ª ed. Atual. São Paulo: Saraiva, 2009, p. 116- 118.
Unidade 4 187
12.1.1 Coeficiente de Assimetria de Pearson
Quando o intuito é comparar medidas, costuma-se dar preferência para medidas

relativas, por isso, o uso desse coeficiente.
Suponha que você tenha em mãos as medidas referentes a uma determinada dis-
tribuição já calculada, tais como:
x = 11,1 kg Md = 10,5 kg Mo = 8 kg e s (desvio padrão) = 4,20

kg, dados estes obtidos (extraídos) da distribuição A, mostrada na TAB. 56.
Aplicando a fórmula do Coeficiente de Assimetria de Pearson, tem-se:
Logo, como As = 0,429 < 1 a assimetria é positiva e moderada.
Mas, você deve estar se perguntando, como saber se é moderada ou forte?
Basta calcular o coeficiente de assimetria de Pearson utilizando:

e analisar o coeficiente:
Se 0,15 < |As| < 1 a assimetria será considerada moderada; e
Se |As| > 1 a assimetria será considerada forte.
Com a junção do estudado até o momento, pode-se encontrar uma assimetria

positiva ou negativa e ainda moderada ou forte.
12.1 Medidas de assimetria
A curtose representa o grau de achatamento que à distribuição em estudo apre-

senta comparada a uma distribuição padrão, conhecida também como curva
normal.
188 Unidade 4
Esse grau de achatamento da curva normal pode traduzir três situações palpá-
veis, sendo classificadas em:
a) Leptocúrtica, quando a distribuição em questão apresenta uma curva de fre-

quência muito pontuda, fechada, concentrada no meio;
b) Platicúrtica, quando os valores da distribuição estão bem dispersos, com a

distribuição apresentando uma curva de frequência mais aberta do que a curva
normal; e
c) Mesocúrtica quando a distribuição apresenta uma curva de frequência ten-

dendo à curva normal.
Para conhecê-las, observe a (Fig. 8):
12.2.1 Coeficiente de Curtose
Para o cálculo do grau de achatamento (curtose), adota-se a fórmula:
sendo Q (os quartis) e P (os Percentis), medidas de separa
trizes já explicadas.
C – Coeficiente de curtose;
Q1 – Primeiro quartis;
Q3 – Terceiro quartis;
P90 – Percentis de 90%; e
P10 – Percentis de 10%.
Unidade 4 189
Tendo como valor referência C = 0,263, a curva será:
a) Mesocúrtica: se o coeficiente C = 0,263;
b) Leptocúrtica: se C < 0,263; e
c) Platicúrtica: se C > 0,263.
Suponha que você obtenha em determinada distribuição os respectivos valores:
Q1 = 24,4; Q3 = 41,2; P90 = 20,2 e P10 = 49,5, aplicando-se a fórmula do cálculo

de curtose, obtêm-se:
Logo, conclui-se que no exemplo dado, tem-se uma distribuição platicúrtica em

relação à curva normal.
C > 0,263 0,287 > 0,263
190 Unidade 4
Síntese do módulo
Neste módulo, foram relatadas as medidas de forma: medidas de assimetria e de
curtose. Medidas de grande importância na aplicabilidade estatística probabi-
lística. Com elas, o pesquisador consegue estimar o quanto uma distribuição se
afasta do eixo de simetria, comparando suas medidas de posição: média, media-
na e moda, utilizando-se das medidas de assimetria. Conseguem também, com
as medidas de posição separatrizes, determinar o grau de achatamento em rela-
ção à curva normal. Neste módulo você teve a oportunidade de conhecer como
calcular os coeficientes de assimetria de Pearson e o coeficiente de curtose, assim
como conheceu também as possíveis classificações que uma curva de frequência
pode apresentar.
ATIVIDADES
1) Os momentos de venda a um grupo de clientes de um supermercado fornece-

ram os seguintes sumários: média aritmética = $ 1,20, mediana = $ 0,53 e a moda
= $ 0,25. Com base nessas informações, assinale a opção correta:
a) A distribuição é assimétrica à direita.
b) A distribuição é assimétrica à esquerda.
c) A distribuição é simétrica.
d) Entre os três indicadores de posição apresentados, a média aritmética e a me-

lhor medida de tendência central.
e) O segundo quartil dos dados acima é dado por $ 0,25.
Unidade 4 191
2) (ESAF AFPS / 02) Analise os dados da tabela seguinte. A tabela abaixo dá a
distribuição de frequência de um atributo X para uma amostra de tamanho 66.
As observações foram agrupadas em 9 classes de tamanho 5. Não existem obser-
vações coincidentes com os extremos das classes.
Tabela: Exercício 2 – Módulo 12
CLASSES FREQUÊNCIAS
4 l 9 5
9 l 14 9
14 l 19 10
19 l 24 15
24 l 29 12
29 l 34 6
34 l 39 4
39 l 44 3
44 l 49 2
Sabe-se que o desvio padrão da distribuição de X é aproximadamente 10. Assina-

le a opção que dá o valor do coeficiente de assimetria de Pearson que é baseado
na média, na mediana e no desvio padrão.
a) – 0,600 b) 0,191 c) 0,709 d) 0,603 e) – 0,610
3) José Antonio, especialista na área comercial, ao realizar uma pesquisa em San-

ta Catarina, 2012, observou o número dos 100 sapatos vendidos na sapataria SH
CALÇADOS e, como resultado do estudo, apresentou os dados conforme mostra
a tabela à seguir:
Tabela - Sapatos Vendidos na Sapataria SH CALÇADOS, SC - 2012
Número de sapato fi
25 l 28 2
28 l 31 9
31 l 34 17
34 l 37 35
37 l 40 20
40 l 43 10
43 l 46 7
 = 100
Fonte: Autora, Dados Hipotéticos.
192 Unidade 4
Atento às informações apresentadas por José Antonio, desenvolva os seguintes
itens:
a) Calcule as medidas: média, moda, mediana e desvio padrão; e
b) Classifique a assimetria e a curtose desses dados.
1) O proprietário de um restaurante, em Criciúma, resolveu avaliar a qualidade

do seu serviço. Durante a primeira semana, de outubro de 2013, convidou seus
clientes mais assíduos para avaliarem o serviço do restaurante, com uma den-
tre as três notas possíveis: 0 (zero), 5 (cinco) ou 10 (dez). Após a consolidação
dos dados coletados, observou que: 20 clientes atribuíram ao restaurante nota
zero; 200 clientes, nota cinco; 180 clientes, nota dez. Na análise dos resultados, o
proprietário resolveu calcular a média, a mediana e a moda das respostas. Se ao
menos uma das medidas calculadas estiver acima de 8,0, o proprietário prometeu
um bônus aos empregados, e caso a média seja inferior a 6,0, proporcionará um
bom desconto para seus clientes.
Com base nessas informações, o proprietário deve:
a) manter o funcionamento do restaurante como está, pois nenhuma das medi-

das ficou acima de 8,0 e a média foi superior a 6,0.
b) manter o funcionamento do restaurante como está, pois nenhuma das medi-

das ficou acima de 8,0 e a mediana e a moda foram superiores a 6,0.
c) providenciar o bônus para os empregados, pois o valor mediano ficou acima

do ponto de referência considerado para essa decisão.
d) providenciar o desconto a seus clientes, pois a média ficou abaixo do valor de

referência considerado para essa decisão.
e) providenciar o bônus para os empregados, pois a moda ficou acima do valor

de referência considerado para essa decisão.
Unidade 4 193
2) (Adaptada da prova do IBGE) Analise os dados agrupados com intervalo de
classe descritos a seguir para responder às questões de números 2.1 e 2.2.
Tabela - Distribuição de frequências das

idades de um grupo de crianças.
Classes (em anos) fi
0 l 2 5
2 l 4 2
4 l 6 4
6 l 8 2
8 l 10 7
2. 1) A média das idades dessas crianças, em anos, é:
a)5,8 b) 5,6 c) 5,4 d) 5,2 e) 5,0
2. 2) A mediana da distribuição de frequências apresentada é:
a) 5,9 b) 5,8 c) 5,7 d) 5,6 e) 5,5
3) (Adaptada da PROVA do IBGE) No mês de setembro de 2013, Paulo Roberto

realizou somente 8 ligações de seu aparelho celular cujas durações, em minutos,
estão descritas no ROL a seguir:
5; 2; 11; 8; 3; 8; 7; 4
3. 1) Paulo Roberto deseja saber o valor aproximado do desvio padrão desse con-
junto de tempos, em minutos, mas antes deseja classificar essa medida, com seu
conhecimento, como poderá ser classificada?
3. 2) O valor do desvio-padrão refere-se a:
a) 2,0 b) 2,2 c)2,5 d) 2,8 e)3,1
194 Unidade 4
4) Na cidade A, a média de salários é de 1200 unidades monetárias (u.m.) e o 3º
quartil é de 720 u.m..
a) Escolhendo-se um trabalhador, ao acaso, na cidade A, o que é mais provável:

ganhar mais ou menos do que 720 u.m.?
b) Em uma cidade B, a média de salários é de 840 u.m. e a variância é praticamen-

te zero, Em qual cidade você procuraria emprego? Justifique.
5) O coordenador da área exata da SATC, solicitou ao professor de duas turmas

um relato comparando as turmas A e B de Estatística, com base nas distribuições
das notas a seguir.
a) Turma A: média = 6 ; variância = 2
Turma B: média = 6 ; variância = 1
b) Turma A: Nota mínima = 1; 1º quartil = 3; 2º quartil = 4,5; 3º, quartil = 7; Nota

máxima = 8
Turma B: Nota mínima = 2 ; 1º quartil = 3; 2º quartil = 6; 3º quartil = 9; Nota

máxima = 10
Como o professor poderá compará-las, levando em consideração as medidas

apresentadas?
Comparação no item a:
Comparação no item b:
Unidade 4 195
6) (Adaptado, COPESE) O número de empresas notificadas para quitar suas pen-
dências trabalhistas junto ao INSS, é dependente do ano e foram agrupadas em
função do tempo gasto (em dias) para quitação de suas pendências. A partir des-
tas amostras anuais, o perito pode fazer algumas análises descritivas em função
do número de empresas.
Tabela – Número de empresas notificadas pelo
INSS, de 2005 a 2010
Ano Tempo
20 dias 30 dias 40 dias
2.005 28 33 39
2.006 33 32 37
2.007 35 29 35
2.008 43 31 33
2.009 47 32 29
2.010 48 27 25
Fonte: Adaptada pela autora ESAF
Com base nestas informações julgue as questões 6.1, 6.2, 6.3 e 6.4, assinalando a
alternativa CORRETA.
6.1) A média aritmética e a mediana do número de empresas que quitaram seus

débitos aos 20 dias valem respectivamente:
a) 46,50 e 38,50
b) 39,50 e 33,34
c) 39,00 e 36,00
d) 39,00 e 39,00
6.2) Quanto à moda dos dados apresentados na tabela, podemos afirmar que a
distribuição é:
a) Amodal
b) Unimodal
c) Bimodal
d) Trimodal
196 Unidade 4
6.3) Em que ano observou-se maior amplitude do número de empresas para qui-
tação de débito:
a) 2010
b) 2009
c) 2007
d) 2005
6.4) A variância do número de empresas que quitaram seus débitos ao longo do

ano de 2005 é aproximadamente:
a) 64,18
b) 42,78
c) 20,22
d) 30,33
7) (Adaptada, CESPE - TJ). Referindo-se ao formato das curvas de frequência,

considere as características descritas nos próximos itens e após julgá-los, assinale
a alternativa correspondente a questões CORRETAS.
I - As distribuições de frequências que têm a maior concentração de dados à es-

querda da média são denominadas assimétricas negativas.
II - As distribuições leptocúrticas apresentam alta concentração de frequências

numa faixa estreita de valores.
III - As distribuições normais são mesocúrticas e simétricas.
a) Somente I e II.
b) Somente II e III.
c) Somente I e III.
d) I, II e III.
e) Nenhuma.
Unidade 4 197
Unidade 5
Correlação e regressão linear

Em algumas situações, faz-se necessário estabelecer uma
relação entre duas ou mais variáveis. Com a matemática,
consegue-se isso, por meio das relações funcionais e as
correlações, por exemplo. Mas qual será a diferença entre
elas? Neste módulo, daremos ênfase a essas diferenças,
aos diagramas de dispersão, coeficiente de Pearson e as
interpolações e extrapolações, trabalhando, em um primeiro
momento, o tema correlação e, posteriormente, regressão.
Para melhor compreensão, este livro irá se ater à

correlação e regressão simples, ou seja, correlação e
regressão linear simples que envolvam duas variáveis,
mas nada impede de, posteriormente, estudar
estatisticamente o assunto de forma mais avançada. ■
Vamos nessa!
Módulo 13
Correlação e regressão
Para ingressar nestas relações, faz-se necessário primeiramente, compreen-
der algumas diferenças, tais como: as diferenças entre relações funcionais e
as correlações.
Enquanto as funcionais são relações expressas por sentenças matemáticas, tais

como: o perímetro de uma circunferênci a (C = 2 R), por exemplo, em que a
relação se dá entre o comprimento da circunferência e o valor do seu raio, as cor-
relações são relações estabelecidas após uma pesquisa realizada, nas quais com os
seus resultados, faz-se comparações que podem ou não conduzir a ligações entre
duas ou mais variáveis.
Unidade 5 201
13.1 Correlações
Por exemplo: A relação entre altura e peso de uma população de jovens, pode
caracterizar uma correlação, por existir uma relação estatística entre as duas va-
riáveis.
Assim, quando comprovadas as correlações, elas poderão ser classificadas em

positivas ou negativas. Sendo positivas, quando duas variáveis caminham juntas,
no mesmo sentido, ou seja, à medida que o valor da abscissa x cresce o valor de
y também cresce gradativamente, na mesma direção e proporção. Já as de cor-
relação negativa, caminham em sentido contrário e de forma não proporcional.
Para sua melhor compreensão duas variáveis, X e Y, estão positivamente correla-

cionadas quando:
elementos pequenos de X tendem a ter valores peque-

nos de Y e elementos com valores grandes de X tendem
a ter valores grandes de Y e, estão negativamente cor-
relacionadas quando elas caminham em sentidos opos-
tos, elementos com valores pequenos de X tendem a ter
valores grandes de Y e elementos com valores grandes
de X tendem a ter valores pequenos de Y. (BARBETTA,
REIS e BORNIA, 2010, p. 316)
Por exemplo: enquanto o faturamento de uma fábrica e o nível de utilização de

um sistema computacional implantado devem apresentar correlação positiva; a
quantidade de memória RAM e o tempo de processamento devem apresentar
correlação negativa.
Estatisticamente, primeiro adota-se a correlação, como instrumento eficaz para

descobrir e medir a relação que existe entre às variáveis do tipo quantitativas.
Uma vez caracterizada a relação, costuma-se defini-la por meio de uma função
matemática, sendo a regressão um instrumento indicado por especialistas da
área para especificar os parâmetros dessa função matemática.
202 Unidade 5
VAMOS REFLETIR?
Enquanto“a análise de regressão fornece uma função matemática que descre-
ve a relação entre duas ou mais variáveis, a análise de correlação determina um
número que expressa uma medida numérica do grau da relação encontrada.” (BRUNI, 2008,
p. 143).
13.2 Diagrama de dispersão
Para verificar se duas variáveis estão correlacionadas, costuma-se utilizar este

tipo de diagrama, no qual os valores das variáveis são representados por pontos,
através de um sistema cartesiano, conforme mostra o exemplo a seguir.
Considerando uma amostra aleatória, composta por 10 dos 98 alunos da 3ª fase

do curso de Engenharia da Faculdade X, com suas respectivas notas em duas
disciplinas: Cálculo e Estatística, obtêm-se, por exemplo, a Tab. 57 e o Graf. 17
de dispersão:
Tabela 57 - Amostra de 10 alunos de Engenharia

com as suas respectivas notas em cálculo e
estatística, semestre 2013-1
Notas
Aluno
Cálculo (Xi) Estatística (Yi)
1 5.0 6.0
8 8.0 9.0
24 7.0 8.0
38 10.0 10.0
44 6.0 5.0
58 7.0 7.0
59 9.0 8.0
72 3.0 4.0
80 8.0 6.0
92 2.0 2.0
Unidade 5 203
Os diagramas de dispersão, conforme mostra a Fig. 9 pode ser utilizada para
representar vários tipos de relações entre elas, uma correlação do tipo:
a) Linear Positiva, quando os pontos do diagrama têm como imagem uma reta
ascendente;
b) Linear Negativa: quando os pontos do diagrama têm como imagem uma

reta descendente, ou seja, reta decrescente;
c) Não Linear: se os pontos do diagrama têm como imagem uma curva; e
d) Não existir correlação: é quando o diagrama apresenta pontos totalmente

espalhados sem uma sequência lógica.
204 Unidade 5
Se você observar, os pontos do Gráf. 17 formam uma elipse em diagonal e sabe-
se que quanto mais fina for a elipse formada, mais se aproximará de uma reta,
ou seja, sua imagem será uma reta, por isso, o nome correlação linear.
Mas, caso não consiga visualizar imaginariamente o processo, basta para o ex-
emplo dado, ligar os pontos (pares ordenados) (2,2); (7,7) e (10,10) no Gráf. 17,
sem dúvida, irá compreender a correlação existente entre as disciplinas, con-
forme mostra o (Gráf. 18)
Unidade 5 205
13.3 Coeficiente de correlação de pearson
Este coeficiente serve para determinar a correlação linear (positiva ou negativa)

dos dados de duas variáveis aleatórias.
DICA
Mas cuidado, o valor do coeficiente de correlação não deve depender da uni-

dade de medida dos dados. Se o peso estiver em quilogramas ou em grama,
o coeficiente não altera.
Para calcular o coeficiente de correlação de Pearson, que estará entre os limites

de R = – 1 e 1, usa-se a fórmula:
Sendo n o número de elementos observados.

Para compreensão deste tipo de cálculo, faremos uso do exemplo trabalhado
anteriormente, considerando uma amostra aleatória, composta por 10 dos 98
alunos da 3ª fase do curso de Engenharia da Faculdade X, com suas respectivas
notas em duas disciplinas: Cálculo e Estatística, obtêm-se a (Tab. 58):
Tabela 58 - Coeficiente de Correlação de Pearson como exemplo de
uma amostra de 10 alunos de Engenharia com as suas respectivas
notas em cálculo e estatística, semestre 2013-1
Cálculo (x) Estatística (y) x.y x2 y2
5.0 6.0 30 25 36
8.0 9.0 72 64 81
7.0 8.0 56 49 64
10.0 10.0 100 100 100
6.0 5.0 30 36 25
7.0 7.0 49 49 49
9.0 8.0 72 81 64
3.0 4.0 12 9 16
8.0 6.0 48 64 36
2.0 2.0 4 4 4
 = 65  = 65  = 473  = 481  = 475
206 Unidade 5
Logo:
13.4 Interpretação do coeficiente de correlação
Para qualquer que seja o conjunto de dados analisados, pode-se, com o cálculo
de R definido anteriormente, determinar o coeficiente de correlação linear de
Pearson entre o intervalo – 1 e 1, o que possibilita encontrar:
- Coeficiente positivo, quando os dados apresentam correlação linear positiva; e

negativo quando os dados apresentam correlação linear negativa.
Na observação dos dados coletados, quanto mais forte for a relação de corre-
lação, o valor do coeficiente R estará mais se aproximará dos valores 1 ou – 1.
(BARBETTA, REIS, BORNIA, 2010)
R será igual a + 1 sempre que os pontos estiverem exatamente sobre uma reta as-
cendente, ou seja, haverá uma correlação positiva perfeita. Porém, sempre que se
deparar com uma correlação negativa, também conhecida como perfeita, os pon-
tos estarão exatamente sobre uma reta decrescente (descendente), logo R = – 1.
Além desses, ainda poderá se deparar com casos de R próximo de 0 (zero), quan-
do não houver uma correlação entre os dados.
Observe a Fig. 10, que mostra os possíveis valores de R e como são interpretados
em relação ao sentido (positivo ou negativo) e sua força:
Unidade 5 207
Ainda é comum a análise nos três casos em que o coeficiente encontra-se entre
determinados intervalos mostrados a seguir:
a) 0,6 < IRI < 1,0 - obtêm-se boas conclusões;
b) 0,3 < IRI < 0,6 - correlação fraca; e
c) 0 < IRI < 0,3 – praticamente, neste caso, não apresenta relação entre os dados.
No exemplo apresentado anteriormente, entre as disciplinas de Cálculo e Esta-

tística, a correlação entre as notas é positiva e altamente significativa, pois se
aproxima muito de 1.
13.4 Interpretação do coeficiente de correlação
ESTUDO COMPLEMENTAR
A palavra regressão teve origem no final do século XIX, com os trabalhos
de Galton (BARBETA, REIS e BORNIA, 2010).
Galton, através de seus estudos buscava mostrar as relações existentes entre as característi-
cas de um individuo com as características de seu pai, ou seja, como se estivesse analisando
as hereditariedades existentes, por exemplo, pais altos filhos consequentemente altos.
Com passar do tempo, estes trabalhos foram sendo aperfeiçoados, dando origem a técnica
estatística de regressão, com grandes aplicações nas Engenharias de Computação, Mecâni-
ca e outras.
208 Unidade 5
Logo, ao estudarmos a relação existente entre duas ou mais variáveis, a partir
da determinação obtida com base em amostras selecionadas, poderemos usar a
técnica para nos auxiliar a obtermos resultados mais confiáveis.
Por exemplo, os pesquisadores, ao se depararem com variáveis do tipo: a) peso

e altura de um grupo de indivíduos, o uso abusivo de bebidas ou cigarros e a in-
cidência do câncer, entre outras situações, forçam-se a utilizar essas técnicas de
análise para verificarem se existe alguma relação entre elas e o seu grau de relação
que os direcionem a uma maior eficácia em seus resultados.
Afinal qual é o objetivo dessa técnica estatisticamente?
A análise da regressão busca descrever, por meio de um modelo matemático, a

relação que existe entre duas variáveis, partindo de n observações da mesma.
Na regressão linear simples, a qual a autora está focando essa temática, faz-se uso
de duas variáveis:
- Variável dependente: também conhecida como variável resposta, sendo esta a

variável a qual se fará uma estimativa e,
- Variável independente ou variável explicativa: a outra variável da relação.
Na regressão, busca-se o ajustamento da reta.
Para o ajustamento da reta, deve-se ter o entendimento de que a função de uma

reta é dada pela fórmula matemática f(x) = ax + b, ou seja, y = ax + b. Logo, se faz
necessário obter os coeficientes a e b, sendo:
, observe que a encontra-se de forma parecida como no co
eficiente de Pearson, porém sem a raiz, o b será a média de y menos o valor de a

vezes a média de x, em que:
b = y – a x, sendo , lembre-se n é o número de elementos.
Unidade 5 209
Para compreender o processo, observe o exemplo dado anteriormente no estudo
de correlação linear, (considerando uma amostra aleatória, composta por 10 dos
98 alunos da 3ª fase do curso de Engenharia da Faculdade X, com suas respecti-
vas notas em duas disciplinas: Cálculo e Estatística), obtêm-se a (Tabela 59):
Tabela 59 - Amostra aleatória, composta por 10
dos 98 alunos da 3ª fase do curso de Engenharia
da Faculdade X, semestre 2013-1
Cálculo (x) Estatística (y) x.y x2
5.0 6.0 30 25
8.0 9.0 72 64
7.0 8.0 56 49
10.0 10.0 100 100
6.0 5.0 30 36
7.0 7.0 49 49
9.0 8.0 72 81
3.0 4.0 12 9
8.0 6.0 48 64
2.0 2.0 4 4
 = 65  = 65  = 473  = 481
Fonte: Crespo (2009, p.149), adaptado.
Calculando obtêm-se:
Com:
b=y –ax b = 6,5 – 0,86 . 6,5 b = 6,5 – 5,59 b = 0,91
Logo:
210 Unidade 5
DICA
A variável y será estimada, logo use .
Para traçar a reta no gráfico de dispersão, basta adotar dois de seus pontos dados
e assim se fecha a regressão, o ajustamento da reta no diagrama.
Por exemplo: Adotando x = 0 e x = 5, encontram-se:
= ax + b = 0,86x + 0,91 = 0,86 . 0 + 0,91 = 0,91
= ax + b = 0,86x + 0,91 = 0,86 . 5 + 0,91 = 5,21
Agora, traça-se a reta ajustada, unindo-se os pontos, conforme mostra o (Gráfico

19):
13.6 Interpolação e extrapolação

Ao analisar a Tab. 59, perceberá que não existe a nota 4,0 para a disciplina de
Cálculo, porém, estatisticamente, pode-se estimar essa nota fazendo o que cha-
mamos de interpolação. Para isso, basta substituir x na equação da reta ajustada
por 4,0.
Unidade 5 211
Aproveitando o exemplo anterior, tem-se:
= ax + b = 0,86x + 0,91 = 0,86 . 4,0 + 0,91 = 4,35
O mesmo poderá ser feito com a nota 1,0 (não existente na tabela), obtendo-se:
= ax + b = 0,86x + 0,91 = 0,86 . 1,0 + 0,91 = 1,77
Mas como 1,0 ao intervalo [2; 10], a esse processo dá-se o nome de extrapo-
lação.
DICA
Um princípio estatístico em equações é nunca extrapolar, a não ser, quando

algum estudo ou experimento realizado comprove que a equação possa ser
extrapolada. (CRESPO, 2009, p. 153).
VAMOS REFLETIR?
Por que estimar a nota x = 1,0 e não x = 11,0 se ambas ficam fora do intervalo
[2; 10]? Você já viu corretamente algum acadêmico com nota superior a 10,0,
não né! Por isso, o alerta anterior quanto ao cuidado com às extrapolações.
212 Unidade 5
Síntese do módulo
No decorrer desta unidade, você teve a oportunidade de conhecer algumas técni-
cas estatísticas que permitem relacionar variáveis por meio de funções matemá-
ticas, com dados obtidos de uma amostra significativa, podendo a partir daqui,
aplicá-las em seus cursos de Engenharia. Estudou as correlações, suas represen-
tações possíveis através do diagrama de dispersão, assim como aprendeu a calcu-
lar o coeficiente de correlação de Pearson, como fazer o ajustamento de uma reta
e como estimar valores por meio de interpolações e extrapolações para auxiliar
nas tomadas de decisões, com maior habilidade e certeza nos resultados obtidos,
nas áreas as quais estejam inseridos.
ATIVIDADES
1) A Empresa X, de Criciúma, pretende analisar por meio de um processo de
ajustamento linear (regressão), a relação entre o tempo (x) em dias e o nº de pro-
dutos vendidos, conforme mostra a tabela:
Tabela - produtos vendidos no período de 2 a 14 de julho de

2013, na empresa X de Criciúma
xi 2 4 6 8 10 12 14
yi 30 25 22 18 15 11 10
Fonte: Autora, dados fictícios
Após observar a tabela, determine:

a) A equação da reta ajustada; e
b) O diagrama de dispersão.
c) Analisando o diagrama, você pode concluir que a empresa X apresentou, no
Unidade 5 213
período de 2 a 14/julho, uma correlação de qual tipo? Justifique sua resposta.
2) Foram realizados dois testes, X e Y, obtidos por um grupo de acadêmicos do

Colégio A:
xi 11 14 19 19 22 28 30 31 34 37
yi 13 14 18 15 22 17 24 22 24 25
a) Verifique, pelo diagrama, se existe correlação retilínea.
b) Em caso afirmativo, calcule o coeficiente de correlação.
3) Para estudar a relação entre as variáveis “consumo de energia elétrica”(xi) e

“volume de produção nas empresas industriais” (yi), selecionou-se uma amostra-
gem com 20 empresas, com os respectivos valores:
 xi = 11,34,  yi = 20,72,  xi 2= 12,16,  yi =2 84,96 e  xi yi = 23,13.
Determine:
a) O coeficiente de correlação;
b) A equação de regressão de Y para X; e
c) A equação de regressão de X para Y.
214 Unidade 5
1) (ENADE) A regressão linear simples apresenta uma relação entre uma variável
dependente (Y) e uma variável independente (X) que mantêm estreito relaciona-
mento. O coeficiente angular é o parâmetro da equação relacionado com a taxa
de variação da variável Y em função de X. O coeficiente de correlação linear de
Pearson serve como um indicador da relação linear entre as duas variáveis me-
dindo o grau deste relacionamento.
No exemplo hipotético abaixo, da relação entre a idade e o peso total, em gramas,

de três espécies de peixes (A, B e C), foram encontradas a seguintes regressões:
Analisando as três retas de regressão ajustadas, conclui-se que:
a) A apresenta maior coeficiente angular e maior coeficiente de correlação.

b) B apresenta menor coeficiente angular e coeficiente de correlação intermedi-
ário.
c) B apresenta coeficiente angular intermediário e maior coeficiente de correla-

ção.
d) C apresenta menor coeficiente angular e maior coeficiente de correlação.
e) C apresenta coeficiente angular e coeficiente de correlação intermediários.
Unidade 5 215
2) (Adaptado, COPESE) Para os diferentes conjuntos de dados I, II, III e IV, fo-
ram apresentadas as seguintes representações gráficas em um par de eixos carte-
sianos X e Y.
Da perspectiva dos possíveis valores do coeficiente de correlação linear simples,

indique qual é a opção CORRETA dentre as opções descritas a seguir:
a) Correlação negativa – I; correlação positiva – II; correlação nula e mesma va-

riabilidade de X e Y - III; correlação nula com maior variabilidade de X em rela-
ção à variabilidade de Y – IV.
b) Correlação negativa – IV; correlação positiva – III; correlação nula e mesma

variabilidade de X e Y - II; correlação nula com maior variabilidade de X em re-
lação à variabilidade de Y – I.
c) Correlação negativa – III; correlação positiva – IV; correlação nula e mesma

variabilidade de X e Y - I; correlação nula com maior variabilidade de X em rela-
ção à variabilidade de Y – II.
d) Correlação negativa – III; correlação positiva – IV; correlação nula e mesma

variabilidade de X e Y - II; correlação nula com maior variabilidade de X em re-
lação à variabilidade de Y – I.
216 Unidade 5
3) (COPESE) Considere dois conjuntos de dados X e Y (com igual número de
dados entre si) onde X é a variável preditora de Y. Sabendo-se que o coeficiente
de correlação entre X e Y é diretamente proporcional e positivo, pergunta-se:
Qual é o tipo de gráfico, a ser realizado em planilha Excel da Microsoft Office
2007, que permitirá estimar corretamente a equação de regressão e coeficiente de
determinação da regressão linear entre X e Y.
a) Representação gráfica de dispersão.

b) Representação gráfica de linhas.
c) Representação gráfica setorial.
d) Representação gráfica em histograma.
Unidade 5 217
Unidade 6
Teoria da probabilidade
Esta teoria, que teve início com os jogos de azar, nos permite
trabalhar com experimentos cujos resultados não são
previamente conhecidos, podendo apresentar resultados
diferentes, mesmo se forem repetido inúmeras vezes, sob
as mesmas condições, sendo essas variações conhecidas
como o acaso. Com tantas incertezas, trabalha-se com a
chance de alguma resposta para determinado fenômeno.
Para o estudo dessa subárea estatística, recomenda-se que
antes de você começar a leitura dos módulos, faça uma revisão
do conteúdo matemático estudado em Análise Combinatória
durante o ensino médio, para sua melhor compreensão.
No decorrer desta unidade, abordaremos primeiramente
conceitos, propriedades e tipos de probabilidade para, na
sequência, entrarmos em Distribuições Probabilística dos
tipos discretas e contínuas e, posteriormente, trataremos a
respeito de alguns modelos probabilísticos que servirão como
pré-requisito para ingressar no mundo das inferências e, sem
dúvida, apoiá-lo (a) em cálculos que envolvam experimentos
aleatórios, tanto na academia como no mercado de trabalho. ■
Vamos em frente?
Módulo 14
Probabilidade
Probabilidade é a função matemática que quantifica as chances de ocorrer ou
não determinado fenômeno em números entre 0 e 1, 0 para resposta impossível
no fenômeno realizado e, 1 quando se tem certeza de que sairá a resposta, na
próxima jogada.
Por exemplo: ao lançar uma moeda para cima, a probabilidade de retornar cara é
0,5, pois como só existe cara e coroa, metade das opções apresentadas na moeda
representa o resultado esperado. Mas nem sempre é tão fácil, por isso, vamos aos
estudos detalhados dessa subárea?
Unidade 6 221
14.1 Espaço amostral
O espaço amostral refere-se ao conjunto de todas as possíveis ocorrências resul-

tantes num determinado experimento. BARBETTA, REIS e BORNIA, 2010).
Um experimento pode ser do tipo determinístico ou aleatório.
- Determinístico: são os experimentos que, realizados nas mesmas condições,

conduzem as pessoas a resultados praticamente iguais.
Por exemplo: Ao misturar azeite de oliva com suco de manga, a probabilidade de

o azeite ficar acima do suco é sempre a mesma, é conhecida e sempre acontecerá
isso com misturas heterogêneas, ou seja, você já conhece a possível resposta.
- Enquanto aleatórios: são os experimentos que, ao serem realizados repetidas

vezes, nas mesmas condições, conduzem as pessoas a resultados imprevisíveis.
Não se conhece a resposta antes de realizar o evento.
Em outras palavras são os experimentos sujeitos ao acaso, tão logo, como não se
pode prever seus resultados, os pesquisadores procuram descobrir as possibili-
dades de ocorrência de cada experimento aleatório, através da teoria da proba-
bilidade.
Por exemplo, se você for convidado a retirar um bilhete de uma urna num sorteio
de brindes, estando estes numerados de 1 a 50, ao retirar o bilhete não saberá
qual número irá sortear, não é mesmo? Neste caso, tem-se um experimento alea-
tório, foco de nossos estudos em probabilidade.
Um espaço amostral é geralmente denotado pela letra grega ) ou pelas letras S

e U. Em nossos estudos, adotaremos a representação .
São exemplos de espaço amostral:
a) Lançar um dado e observar a face voltada para cima: = { 1; 2; 3; 4; 5; 6}, pois

os resultados possíveis são dados por: 1; 2; 3; 4; 5; 6;
b) Pegar uma caixa de baralho com 52 cartas, escolher uma carta e observar seu
222 Unidade 6
Naipe: = {espadas; copas; ouros; paus};
c) Sortear uma vogal entre as vogais do alfabeto: = { a; e; i; o; u};
d) Observar o diâmetro, em mm, de um eixo produzido em uma =

{d, tal que d > 0}. Atenção: neste exemplo, como não há um limite superior, pode
haver infinitos valores.
Um espaço amostral pode ser classificado em DISCRETO ou CONTÍNUO.

Será discreto quando for finito ou infinito desde que seja enumerável e contínuo
quando for infinito definido por intervalos dentre o conjunto de números reais.
(BARBETTA, REIS e BORNIA, 2010) Mas, veremos maiores detalhes a respeito
desse conteúdo no próximo módulo.
14.1.1 Número De Elementos Do Espaço Amostral
Para determinar o número de elementos de um espaço amostral, você poderá

encontrá-lo: diretamente; por regras da multiplicação; fazendo uso de análise
combinatória e; outros.
Vamos estudar este conteúdo diretamente com alguns exemplos:
1 – Suponha que você queira determinar o ) ao realizar um experimento para

sortear uma carta de baralho com 52 cartas, qual seria a solução?
Neste caso, obtém-se diretamente o ) = 52, pois existem 52 resultados pos-

síveis.
2 – Soraia precisa determinar o número de elementos do espaço amostral ) ao

lançar simultaneamente um dado e uma moeda. Neste caso:
1º) Definem-se os espaços amostrais:
(Dado) 1 = {1; 2; 3; 4; 5; 6} e (Moeda) 2 = {cara; coroa}
Unidade 6 223
2º) Aplica-se a regra da multiplicação (Termo usado: SIMULTÂNEOS):
n( ) = n( 1
) . n( 2
) = 6 . 2 = 12
3 – Suzana quer determinar o ) ao realizar um experimento para sortear um

anagrama da palavra BRINCO:
Neste caso, usa-se análise combinatória. Como o número de anagramas de

BRINCO é 720, pois a permutação (P6) = 6! = 6 . 5 . 4 . 3 . 2 . 1 = 720, logo o
n( ) = 720.
DICA
Sempre que for mencionado o termo ANAGRAMA, trata-se de análise
combinatória do tipo PERMUTAÇÃO.
4 – Marivalda quer determinar o valor do ) ao lançar SUCESSIVAMENTE

dois dados:
Cada dado possui um espaço amostral = {1; 2; 3; 4; 5; 6} ) = 6, usando
o PRINCÍPIO FUNDAMENTAL DA CONTAGEM, tem-se:
n( ) = n( 1 ) . n( 2 ) = 6 . 6 = 36
Neste exemplo, também se aplica análise combinatória.
VAMOS REFLETIR?
Agora que você já sabe definir o número de elementos do espaço amostral,

quando trabalha com eventos simultâneos, que tal especificar quais são os
elementos do espaço amostral , no exemplo 2 dado anteriormente?
Como resposta ao questionamento, tem-se:
Sendo o n( ) = n( 1) . n( 2) = 6 . 2 = 12, 1 = {1; 2; 3; 4; 5; 6} e 2 = {cara – K;

coroa = C}, tão logo, os elementos que compõem esse espaço amostral são os
224 Unidade 6
elementos:
={(1,K); (1,C); (2,K); (2,C); (3,K); (3,C); (4,K); (4,C); (5,K); (5,C); (6,K);
(6,C)}
ESTUDO COMPLEMENTAR
Caro leitor, caso tenha dúvidas ou interesse em ampliar seu conhecimento
em Análise Combinatória, poderá buscar informações no livro: GIOVANNI,
José Ruy e BONDORJO, José Roberto. Matemática: uma nova abordagem, vol. 2, versão tri-
gonometria – São Paulo: FTD, 2000. (Coleção Matemática uma nova abordagem).
14.2 Evento
Evento pode ser compreendido como qualquer subconjunto do espaço amostral

( ), denotado por uma letra maiúscula do alfabeto, A; B; C; D; E; ...
Exemplos:
1 - Suponha que José Antonio, o gerente de uma empresa X, queira sortear dois
brindes durante uma confraternização, entre quatro dos seus funcionários (Ar-
tur; Beatriz; Helena e José) que mais venderam em 2012, de modo que cada fun-
cionário sorteado receba um brinde:
a) Qual será o espaço amostral?
Faz-se todas as combinações possíveis entre os 4 funcionários tomados dois a

dois:
= { ( A; B); (A; H); (A; J); (B; H); (B; J); (H; J)}, logo, o número de elementos
do espaço amostral é igual a 6, sendo representado por n ) = 6 combinações.
b) Qual será o evento A desse experimento onde um funcionário do sexo femi-

nino é sorteado?
Unidade 6 225
A = { (A; B); (A; H); (B; H); (B; J); (H; J)}, logo, o número de elementos do even-
to é: n (A) = 5 combinações.
2) Agora, considerando o experimento: lançamento de dois dados, um vermelho

e um azul, e observação da face superior:
a) Qual será o espaço amostral desse experimento e quantos elementos possui?
Faz-se todas as combinações possíveis entre os 2 dados tomados dois a dois, e

obtém-se:
= { (1; 1); (1; 2); (1; 3); (1; 4); (1; 5); (1; 6);
(2; 1); (2; 2); (2; 3); (2; 4); (2; 5); (2; 6);
(3; 1); (3; 2); (3; 3); (3; 4); (3; 5); (3; 6);
(4; 1); (4; 2); (4; 3); (4; 4); (4; 5); (4; 6);
(5; 1); (5; 2); (5; 3); (5; 4); (5; 5); (5; 6);
(6; 1); (6; 2); (6; 3); (6; 4); (6; 5); (6; 6) }.
Logo, o número de elementos do espaço amostral é igual a 36, simbolizado por n

( ) = 36 combinações.
b) Qual será o evento E definido pela ocorrência de números iguais nos 2 dados?
Com o espaço amostral já definido, basta selecionar as combinações com núme-

ros iguais e formar o evento, ou seja, E = { (1; 1); (2; 2); (3; 3); (4; 4); (5; 5); (6; 6)}
Tão logo se pode também afirmar que o número de elementos do evento é: n (E)
= 6 combinações.
c) Qual será o evento G para determinar a ocorrência de números cuja soma seja
4?
O processo é o mesmo, porém, neste caso, selecionam-se as combinações com

soma igual a 4, ou seja, G = { (1; 3); (2; 2); (3; 1) }, n (G) = 3 combinações.
226 Unidade 6
14.3 Tipos de eventos
Para conhecer os tipos de eventos, adotaremos a seguinte suposição, como exem-

plo:
Suponha que Jorge, aluno de estatística, queira, no lançamento de um dado e

observação da face superior, determinar:
O evento A e o número de elementos do evento A ocorrer um número

menor ou igual a 6?
O evento B: de ocorrer um número múltiplo de 2?
O evento C: de ocorrer um número maior que 6?
O evento D: de ocorrer um número 4?
O evento E: de ocorrer um número ímpar ou de um número par primo?

O evento F: de ocorrer um número par e múltiplo de 4?
O evento G: de ocorrer um número par e de ocorrer um número ímpar?
h) O evento H: ser o evento resultante de:
H1 - ocorrer um número par ou de não ocorrer um número par (o mesmo que

ocorrer um número ímpar)?
H2 - ocorrer um número par e de não ocorrer um número par (o mesmo que

Como Jorge irá proceder?
1º) Definirá o espaço amostral: = { 1; 2; 3; 4; 5; 6} )=6
Dessa forma, irá determinar os eventos:
a) Evento A: de ocorrer um número menor ou igual a 6:
A = { 1; 2; 3; 4; 5; 6} n(A) = 6
Unidade 6 227
A esse evento dá-se o nome de EVENTO CERTO: quando o espaço amostral é
igual ao evento, = A é porque o evento sempre ocorrerão por isso, sua classi-
ficação como Evento Certo.
b) O evento B: de ocorrer um número múltiplo de 2?
B = { 2; 4; 6} n(B) = 3
Neste caso, um EVENTO QUALQUER (B ): o evento determinado será um

subconjunto do espaço amostral, estará contido no espaço amostral.
c) O evento C: de ocorrer um número maior que 6?
C ={ } n(C) = 0 (conjunto vazio)
A esse evento dá-se o nome de EVENTO IMPOSSÍVEL C = : é quando o

evento NUNCA ocorrerá. Sua conclusão se dará pelo conjunto vazio.
d) Evento D: de ocorrer um número 4?
D={4} n(D) = 1
Neste caso, tem-se um EVENTO ELEMENTAR: o número de elementos do

evento em questão é igual a um (uma opção).
e) O evento E: de ocorrer um número ímpar ou de um número par primo?
Chamando A o evento de ocorrer um número ímpar e B o evento de ocorrer um

número par primo, tem-se:
A = { (1; 3; 5) };
B = { (2) };
E=A B = { ( 1; 3; 5) } { ( 2) } E = { (1; 2; 3; 5) } n ( E) = 4
A esse evento dá-se o nome de EVENTO UNIÃO: é a reunião de dois eventos
228 Unidade 6
f) O evento F: de ocorrer um número par e múltiplo de 4?
Adotando A como o evento de ocorrer um número par e B o evento de ocorrer

um número múltiplo de 4, obtém-se:
A = { (2; 4; 6) };
B = { (4) };
F=A B = { (2; 4; 6) } { (4) } F = { (4) } n (F) = 1
Neste caso, tem-se um EVENTO INTERSECÇÃO: é a intersecção de dois even-

tos. O evento resulta dos elementos comuns aos eventos em questão.
g) O evento G: de ocorrer um número par e de ocorrer um número ímpar?
Chamando A o evento de ocorrer um número par e B o evento de ocorrer um

número ímpar, tem-se:
A = { (2; 4; 6) };
B = { (1; 3; 5) };
G=A B = { (2; 4; 6) } { (1; 3; 5) } G= n (G) = 0
A esses eventos dá-se o nome de EVENTOS MUTUAMENTE EXCLUSIVOS:

são eventos que têm conjuntos disjuntos.
h) O evento H: ser o evento resultante de:
H1 - ocorrer um número par ou de não ocorrer um número par (o mesmo que

H2 - ocorrer um número par e de não ocorrer um número par (o mesmo que

Chamando A o evento de ocorrer um número par e A o evento de não ocorrer

um número par, tem-se:
Unidade 6 229
A = { (2; 4; 6) };
A= { (1; 3; 5) };
H1 = A A = { (2; 4; 6) } { ( 1; 3; 5) } = { (1; 2; 3; 4; 5; 6) } = (H) (o próprio
espaço amostral); e
H2 = A A = { (2; 4; 6) } { (1; 3; 5) } = (um é o oposto do outro, não possuem

nenhum elemento em comum).
A esses eventos dá-se o nome de EVENTOS COMPLEMENTARES: quando se
pretende pagar uma prestação, por exemplo, de R$ 200,00 e tem-se no momento
apenas R$ 110,00, o valor que está faltando é o complemento para sanar o débi-
to. O mesmo acontece com os eventos, sabendo-se que um evento pode ou não
ocorrer e que sempre irá existir uma relação entre eles.
Dois eventos podem ser complementares, quando um cobre o outro quanto a
suas faltas ou, um é o oposto do outro.
Matematicamente, também, se consegue representar dois eventos complementa-

res por meio de diagramas (união e intersecção de conjuntos).
DICA
Tão logo, atento aos exemplos de Jorge, conclui-se que os eventos podem
ser do tipo: Certo; Qualquer; Impossível, Elementar, União, Intersecção, Mu-
tuamente Exclusivos e Complementares.
Os eventos complementares, independentes e mutuamente exclusivos também
podem ser compreendidos e aplicados por meio dos conceitos da teoria dos con-
juntos. Considerando A e B eventos quaisquer, tem-se:
Tabela 60 - Operações de eventos
Evento ocorre
Operação Notação Conjunto
quando:
Reúne os elementos de ambos os Ocorrer pelo menos
União AB
conjuntos um deles (A, B, ambos)
Formado somente pelos elementos que Ocorrer ambos os

Intersecção AB
estão em A e B eventos (A e B)
Formado somente pelos elementos que Não ocorrer o evento A
Complementar A
não estão em A (não A)
230 Unidade 6
Vamos fazer mais uma “pausa”? Que tal você analisar os exemplos descritos a
seguir para compreender melhor a Tab. 60?
Considerando os eventos (conjuntos):

A = {2; 4; 6} os números pares de um dado.
B = {3; 4; 5; 6} os números maiores que 2 de um dado.
C = {6} o número 6 de um dado.
Tem-se como Eventos Complementares:

A = {1; 3; 5} os números ímpares de um dado.
B = {1; 2} os números menores ou igual a 2 de um dado.
C = {1; 2; 3; 4; 5} ou seja, o número não 6 de um dado.
União:
A B = {2; 3; 4; 5; 6} A C = {2; 4; 6} A A=
Intersecção:
A B = {4; 6} A C = {6} A A=
Releia!
Caso a intersecção de dois eventos A e B seja o conjunto

vazio, A B = eles são mutuamente exclusivos, pois não po-
derão ocorrer simultaneamente. .
Para facilitar sua interpretação, poderá fazer uso dos diagramas a seguir:
Unidade 6 231
14.4 Definição de probabilidade
A probabilidade de ocorrer um determinado evento (E), por exemplo, é denota-

da por P(E) e satisfaz as seguintes condições:
• 0 < P(E) < 1;

• ) = 1;
• Se A e B são eventos mutuamente exclusivos, tem-se P(A B) = P(A) + P(B);
• Se E1, E2, E3,... são mutuamente exclusivos, dois a dois, então se adota:
a) P( E ) = 1 – P (E);
b) Se E é um evento do tipo impossível, E = sua probabilidade será P(E)
= ) = 0; e
c) Se A e B são eventos quaisquer, sua probabilidade será determinada

por P(A B) = P(A) + P(B) – P(A B).
Para o cálculo da probabilidade, aplica-se a fórmula:
P (E) = n (E)
n( )
Sendo:
- n (E) o número de elementos do evento; e
-n ) o número de elementos do espaço amostral.
Exemplo: Voltando ao exemplo mencionado no item 14.2, suponha que José An-
tonio, o gerente de uma empresa X, queira sortear dois brindes durante uma con-
fraternização entre quatro dos seus funcionários (Artur; Beatriz; Helena e José)
que mais venderam em 2012, de modo que cada funcionário sorteado receba um
brinde. Qual a probabilidade de José ser sorteado?
1º) Defini-se o espaço amostral: = { (A; B); (A; H); (A; J); (B; H); (B; J); (H; J)};
232 Unidade 6
2º) Calcula-se o número de elementos do evento: E = { (A; J); (B; J); (H; J)}, logo,
n (E) = 3 combinações.
3º) Aplica-se a fórmula da probabilidade e obtém-se o resultado:
P (E) = n (E) = 3 = 1 = 0,5 ou 50%

n( ) 6 2
DICA
A probabilidade poderá ser dada em: fração, decimais ou porcentagem.
Para você compreender melhor o cálculo de probabilidade, vamos rever o exem-

plo do item 14.3, agora com foco na determinação da probabilidade de ocorrer
tais eventos?
Exemplo: Suponha agora que Jorge, aluno de Estatística, queira, no lançamento

de um dado e observação da face superior, determinar:
a) O espaço amostral:
= { 1; 2; 3; 4; 5; 6} )=6
b) Qual será a probabilidade de obter um número menor ou igual a 6?
* Probabilidade do Evento Certo:
Tão logo: A = { 1; 2; 3; 4; 5; 6} n(A) = 6 P (A) = 6 = 1

6
c) Qual será a probabilidade de obter um número múltiplo de 2?
* Probabilidade de um evento qualquer (B ) é um número real, tal

que: 0 < P(B) < 1, ou seja, a probabilidade estará entre 0 e 1.
Unidade 6 233
Logo: B = {2; 4; 6} n(B) = 3 P (B) = 3 = 1 = 0,5 ou 50%
6 2
d) Qual será a probabilidade de obter um número maior que 6?
* Probabilidade do EVENTO IMPOSSÍVEL, ou seja, igual a ; P(C) = 0.

0 =0
Nesta situação, tem-se: C = { } n(C) = 0 (conjunto vazio) P (C) =
6
e) Qual será a probabilidade de obter um número 4?
* Probabilidade de um EVENTO ELEMENTAR E qualquer: é, neste
1
caso, n(E) = 1; P (E) =
n
Logo, E = {4} n(E) = 1 P (E) = 1
6
Vamos agora analisar como proceder para situações que envolvam mais de um
evento. Vamos verißcar?
14.4.1 Probabilidade da união de dois eventos
Dados dois eventos A e B do mesmo espaço amostral , para o cálculo da pro-

babilidade aplica-se a fórmula da união:
P(A B) = P (A) + P (B) – P (A B)
Ou seja, a probabilidade de ocorrer o evento A ou B é igual a soma das proba-

bilidades dos eventos A e B, menos a probabilidade de ocorrer o evento A B.
Usando conjuntos, adotam-se os conjuntos A, B e U, conforme mostra a (Fig.12):
234 Unidade 6
Sabendo-se que: n (A B) = n (A) + n (B) – n (A B), dividindo-se tudo por n
(U),ou seja, n ), chega-se também à fórmula anterior:
n (A U B) n (A)
= + n (B) - n (A B)
n (U) n (U) n (U) n (U)
P (A B) = P (A) + P (B) – P (A B)
Caso a intersecção de A e B seja o conjunto vazio, tem-se:
P (A B) = P (A) + P (B)
Exemplo: Qual a probabilidade de se jogar um dado e se obter o número 6 ou um

número par?
1º) Define-se seu espaço amostral:
= {1; 2; 3; 4; 5; 6} n )=6
2º) Obtém-se seus eventos:
A = {6} e B = {2; 4; 6} n (A) = 1 e n (B) = 3
3º) Determina-se:
A B = {3} n (A B) = 1
4º) Por fim, aplica-se a fórmula:
P (A B) = P (A) + P (B) – P (A B)
= n (A) + n (B) - n (A B) = 1 + 3 - 1 = 3 = 1
n (U) n (U) n (U) 6 6 6 6 2
ou P (A B) = 50%
Caso prefira, poderá adotar o cálculo direto:
Unidade 6 235
Chamando de A o evento da ocorrência de obter um número 6 ou um número
par, tem-se:
A = {2; 4; 6} n (A) = 3
Portanto:
n (A)
P (A) = = = = 3 = 1 = 50%
n (U) 6 2
Isso só é possível sabendo aplicar o evento união de forma correta.
14.4.2 Probabilidade de eventos complementares

Sabendo-se que um evento pode ou não ocorrer e que sempre irá existir uma
relação entre eles, onde: p: refere-se ao sucesso, (a chance de ocorrer o evento) e
o seu complemento q a de não ocorrer o evento, para o mesmo evento, conforme
mostra a relação:
p+q=1
A soma da probabilidade de ocorrer e não ocorrer esse evento resultará sempre
em 100% ( porcentagem) ou 1 ( proporção).
Para lembrar!
Matematicamente, também se consegue dizer que dois eventos

são complementares quando:
A B= (não possuem nenhum elemento em comum), e

A B= (a união dos dois resulta no espaço amostral).
Por exemplo: Se a probabilidade de um evento ocorrer é p = 2 , a probabilidade

5
de que ele não ocorra é calculado por: p + q = 1 q=1–p q=1– 2 =3
5 5
Costuma-se, nestes casos, adotar também a simbologia P(A) = probabilidade de
ocorrer o evento; P(A) (P de NÃO A) = probabilidade de não ocorrer o evento,
o complementar de A, logo: P(A) + P (A)= 1
236 Unidade 6
14.4.3 Probabilidade de eventos independentes
Dois eventos são considerados independentes, quando a probabilidade de ocor-

rer ou não um deles não afeta a probabilidade do outro evento e vice-verso, são
eventos distintos.)
Exemplo: No lançamento de dois dados, a probabilidade de obter 2 no primeiro

dado e 5 no segundo dado é:
Adotando:
= {1; 2; 3; 4; 5; 6} )=6
A = {2} n(A) = 1 e B = {5} n(B) = 1
Logo: A probabilidade de obter 2 no primeiro dado é: P(A) = 1 e a probabili-

dade de obter 5 no segundo dado é: P(B) = 1 6
6
Portanto, a probabilidade de obter, simultaneamente, 2 no primeiro dado e 5 no
segundo dado é encontrada pela fórmula:
P = P (A) . P (B) P= 1 . 1 = 1
6 6 36
14.4.4 Probabilidade de eventos mutuamente exclusivos
Dois ou mais eventos são considerados mutuamente exclusivos, quando para que
um deles ocorra o outro não ocorrerá.
Tão logo, não podem ocorrer simultaneamente, sendo a intersecção desses even-
tos vazia, ou seja, A B = .
Exemplo: No lançamento de dois dados, a probabilidade de obter 2 no primeiro

dado ou 5 no segundo dado é:
Unidade 6 237
Adotando:
= {1; 2; 3; 4; 5; 6} )=6
A = {2} n(A) = 1
Logo: A probabilidade de obter 2 no primeiro dado é: P(A) = 1

6
Adotando:
= {1; 2; 3; 4; 5; 6} )=6
B = {5} n(B) = 1
Logo: A probabilidade de obter 5 no segundo dado é: P(B) = 1

6
Portanto, a probabilidade de obter 2 no primeiro dado ou 5 no segundo dado é
encontrada pela fórmula:
P = P (A) + P (B) P= 1 + 1 = 2 = 1
6 6 6 3
Para recordar e revisar!
A probabilidade para eventos complementares é dada

por: p + q = 1;
A probabilidade para eventos independentes é dada por: p = pA . pB e,

geralmente, aparece a palavra simultaneamente e a letra (e);
A probabilidade para eventos mutuamente exclusivos é dada por:

p = p A+ p eBgeralmente aparece o termo (ou).
238 Unidade 6
14.5 Probabilidade condicionada
Para calcular a probabilidade quando ocorrem eventos seguidos, tais como, lan-
çar mais de uma vez um dado, é necessário observar se a repetição se dá:
a) Com reposição; ou
b) Sem reposição.
Por exemplo:
1) Considere uma embalagem com 200 peças, sendo 190 perfeitas e 10 com de-
feito. Qual a probabilidade de retirarmos, ao acaso, duas peças com defeito dessa
embalagem?
Evento A = retirar a 1ª peça com defeito;
Evento B = retirar a 2ª peça com defeito.
Analisando:
a) Com reposição, teremos:
P (A) = n (A) = 10 = 1 = 0,05 e P (B) = n (B) = 10 = 1 = 0,05

n ) 200 20 n ) 200 20
b) Sem reposição, teremos:

9 = 0,045
P (A) = n (A) = 10 = 1 = 0,05 e P (B) = n (B) =
n( ) 200 20 n( ) 199
Pois a peça NÃO é devolvida antes de retirarmos a segunda peça.
2) De um baralho com 52 cartas foram retiradas duas cartas aleatoriamente e sem

reposição. Sabendo que a primeira carta retirada é de ouro, qual a probabilidade
de a segunda carta ser um rei vermelho?
Evento B: sair um rei vermelho. Evento A: sair uma carta de ouro
Unidade 6 239
Neste caso, perceba que a probabilidade de B está condicionada a de A, por isso,
probabilidade condicionada.
Mas, como proceder nestes casos?
Tratando-se de condicionada, denota-se P (B/A) e, lê-se: probabilidade de B se

ocorreu o evento A. Para determinar, calcula-se a Probabilidade de B, P(B) em
relação ao espaço amostral (A) e não ao original, total ):
Então, para resolver o exemplo, deve-se calcular:
Evento B: sair um rei vermelho Evento A: sair uma carta de ouro

n ( ) = 52 (cartas no baralho) n (B) = 13 (cartas de ouro) P (B) = 13
52
n (A B) = 1 (carta de ouro e rei) P (A B) = 1
52
Vamos dar mais uma pausa e analisar o exemplo descrito a seguir?
Exemplo: Dado um grupo de 55 turistas, distribuídos conforme mostra a

Tab. 61 a seguir, qual será a probabilidade de sortear, ao acaso, um turista
do sexo masculino, sabendo que ele é brasileiro?
Tabela 61 - Exercícios Probabilidade

SEXO
NACIONALIDADE TOTAL
F M
Brasileiro 25 15 40
Estrangeiro 5 10 15
TOTAL 30 25 55
Fonte: Souza e Vargas (2009, p. 38), adaptada.
A probabilidade será de P(B/A) = 25

40
240 Unidade 6
14.6 Teorema da multiplicação
Este teorema ajuda a calcular a probabilidade de ocorrência simultânea de dois

eventos a partir das probabilidades condicionais, ou seja:
P (A B) = P (A) . P (B/A), se A e B são eventos dependentes; e
P (A B) = P (A) . P (B), se A e B são eventos independentes.
Para determinar a probabilidade no exemplo 1, do item 14.5, para o caso com

reposição, poderia ter sido utilizado o teorema da multiplicação, fazendo-se:
P(A) . P(B) = 1 . 1 = 0,05 . 0,05 = 0.0025

20 20
Já para o sem reposição, adotar-se-ia o teorema da multiplicação, fazendo:
P(A) . P(B) (neste caso igual a P (B/A) = 1 . 9 = 0,05 . 0,045 = 0,0023

20 199
14.7 Teorema de bayes
Enquanto a probabilidade condicional permite obter a probabilidade de ocorrer

um evento A, dado que ocorreu o evento B anterior a A, o teorema de Bayes trata
o contrário, aborda a probabilidade de um anterior evento A ter ocorrido, saben-
do que um evento posterior B ocorreu.
A fórmula mais simples desse teorema pode ser dada por:
E que a probabilidade de ocorrer o evento B é dada por:
P (Aı) . P (B/Aı) + P (Az) . P (B/Az) + ... + P (A‹) . P (B/A‹)
Por exemplo: Suponha que a empresa X fabrica impressoras em duas fábricas A

e B. Uma impressora é escolhida ao acaso de um lote de produção. Nota-se que
Unidade 6 241
a impressora apresenta defeitos. De observações anteriores, a empresa sabe que
2% e 3% são as taxas de impressoras fabricadas com algum defeito em A e B, res-
pectivamente. Sabendo-se que a fábrica A é responsável por 40% da produção,
qual é a probabilidade de que a impressora escolhida tenha sido fabricada em A?
Portanto:
Evento A: impressora fabricada em A.
Evento B: impressora fabricada em B.

Evento D: impressora que apresenta defeito.
Como a empresa A é responsável por 40% da produção, a probabilidade P(A) =

40% e a P(B) = 60% (é o que sobra, complemento de A).
A probabilidade de a impressora ser defeituosa e ter sido fabricada em A, P(D/A)

= 2% e a probabilidade de a impressora ser defeituosa e ter sido fabricada em B,
P(D/B) = 3%, mas queremos saber a probabilidade de ter sido fabricado em A,
sabendo-se que é defeituosa, logo: P (A/D).
Pelo teorema de Bayes
Teremos o Evento de ser defeituoso dado por:
D = {“Defeituoso e fabricado em A” união com “ser defeituoso e fabricado em B”}
D = (D A) (D B), lembre-se intersecção (e), união (ou).
P (D) = P (D A) (D B), esses eventos são disjuntos, pois não pode ter sido
fabricado em A e B ao mesmo tempo, logo:
P (D) = P (D A) + (D B) P (D) = P (D/A) . P(A) + P (D/B) . P (B)
242 Unidade 6
aproximadamente.
Síntese do módulo
Caro leitor, neste módulo, foram abordados os conceitos de espaço amostral,
evento e probabilidade. Você estudou os tipos de eventos, como determinar o
número de elementos de um evento e como determiná-los. Aprendeu a calcular
a probabilidade de um evento e também a probabilidade de mais eventos, entre
elas:
- a probabilidade da união de dois eventos;

- a probabilidade de eventos complementares;
- a probabilidade de eventos independentes;
- a probabilidade de eventos mutuamente exclusivos; e
- a probabilidade condicional.
E, para fechar o assunto, foram descritos os teoremas da multiplicação e o teore-

ma de Bayes, relevantes na aplicação estatística no que tange a acasos, incertezas.
Unidade 6 243
ATIVIDADES
1) (Adaptado de Crespo (2009, p. 131 e 132): Uma loja dispõe de 12 geladeiras do

mesmo modelo, da marca Brastemp, das quais quatro apresentam defeitos.
a) Se um cliente vai comprar uma geladeira, qual será a probabilidade de comprar

uma geladeira defeituosa?
b) Se um cliente vai comprar duas geladeiras, qual será a probabilidade de com-

prar duas geladeiras defeituosas?
c) Se um cliente vai comprar duas geladeiras, qual será a probabilidade de com-

prar pelo menos uma geladeira defeituosa?
2) (Adaptado de Barbetta, Reis e Bornia (2008, p. 110): Os dados a seguir repre-
sentam o sumário de um dia de observação em um posto de qualidade, em que
se avalia o peso dos pacotes de leite produzidos num laticínio.
Tabela 61 - Exercícios Probabilidade
SEXO
NACIONALIDADE TOTAL
F M
Brasileiro 25 15 40
Estrangeiro 5 10 15
TOTAL 30 25 55
Retira-se, ao acaso, um pacote de leite da população de 6.850 unidades. Sejam D

e F eventos que representam as condições do peso da unidade retirada e B, C e U
eventos que representam os diferentes tipos de leite. Calcule:
a) P (D)
b) P (B)
c) P (D B)
d) P (D / B)
e) P (B / D)
f) A probabilidade de o pacote de leite estar fora das especificações.
244 Unidade 6
g) A probabilidade de o pacote de leite estar fora das especificações, sabendo-se
que é do tipo UHT.
3) De um total de cinco empresas, deseja-se selecionar, aleatoriamente, uma em-

presa, mas com probabilidade proporcional ao número de funcionários. Saben-
do-se que o número de funcionários da empresa A é 20; de B é 15; de C é 7; de D
é 5 e de E é 3.
a) Qual será a probabilidade de cada uma das empresas ser a selecionada?

b) Qual é a probabilidade da Empresa A não ser selecionada?
Unidade 6 245
Módulo 15
Distribuições de probabilidade
Os engenheiros e outros profissionais das áreas exatas costumam dar preferência
a situações problemas que envolvam variáveis quantitativas por acreditarem ser
mais palpáveis e até mesmo por possuírem maiores habilidades para lidar com
elas.Até o momento, em probabilidade, a maioria dos eventos foram apresenta-
dos de forma textual (verbal), tais como: a ocorrência de sair um número múlti-
plo de 4; de cair cara ao lançar uma moeda; e outros.
Você então deve estar se perguntado: será possível definir esses eventos por meio
de números? Sim, basta associar números aos resultados do espaço amostral ),
através de uma função denominada variável aleatória, (temática esta a ser abor-
dada na sequência), com o intuito de contribuir para que os interessados consi-
gam tomar decisões que envolvam incertezas com maior segurança, como: lançar
ou não um novo produto no mercado, se mudar a grade curricular afetará ou não
o público alvo ao ponto de aumentar a evasão escolar, etc.
Vamos em frente!
Unidade 6 247
15.1 Variáveis aleatórias
São variáveis quantitativas que apresentam resultados amarrados (depedentes)

de fatores aleatórios. (BARBETTA, REIS e BORNIA, 2010)
São exemplos de variáveis aleatórias:

a) O número de defeitos em um piso que sai da linha de produção;
b) Volume de água perdido por dia, num sistema de abastecimento;
c) Número de pessoas que visitam o site da empresa X, num certo período de

tempo;
d) Tempo de resposta de um sistema operacional;

e) Entre outros.
Todos os exemplos são quantitativos (reias) e, mesmo assim, não conseguimos

prever com garantia seus resultados, pois são dependentes de experimentos ale-
atórios.
Por exemplo: Suponha o Experimento Aleatório lançar duas vezes uma moeda
honesta e observar a face superior, com interesse em determinar o número de
coroas obtidas.
Ao analisar o experimento, obtêm-se o espaço amostral finito: = {(cara; co-

roa); (cara; cara); (coroa; coroa); (coroa; cara)} e, atento ao interesse da pesquisa
consegue-se definir uma variável aleatória do tipo discreta X, sendo X o número
de coroas nos dois lançamentos. Assim, os valores de X formam o conjunto {0;
1; 2}, onde:
0 = representa nenhuma coroa: (cara; cara);
1 = uma coroa: (cara; coroa); (coroa; cara); e
2 = duas coroas: (coroa; coroa).
Logo, os autores, assim como Barbetta, Reis e Bornia (2010, p. 117), formalizam
o conceito de variável aleatória como: “uma função que associa elementos do
espaço amostral ao conjunto de números reais”. Na verdade, o processo adotado
248 Unidade 6
no exemplo anterior.
As variáveis aleatórias costumam ser simbolizadas por uma letra maiúscula e

seus valores indicados por letras minúsculas.
Estas variáveispodem ser do tipo: DISCRETAS ou CONTÍNUAS.
- Nas discretas: os possíveis resultados estão contidos em um conjunto Finito

ou Infinito enumerável – ocorre quando o número de resultados possíveis é
infinito, mas podendo ser listados. Por exemplo, o número de bombons que são
doados na Páscoa: = {0; 1; 2; 3; ...}. Neste caso, só são possíveis valores inteiros,
mesmo não tendo limite superior;
– Contínuas: quando for Infinito, ou seja, – quando o número de resultados

possíveis (xi X) for infinito, formado por intervalos de números reais. Por exem-
plo: tempo de resposta de um sistema operacional; pesos de um grupo de indiví-
duos; temperaturas; idades dos acadêmicos e outros.
DICA
Uma variável aleatória é discreta quando assume valores que podem ser con-
tados; e contínua, quando assume valores de um determinado intervalo.
Mesmo as variáveis qualitativas podendo ser caracterizadas também como ale-

atórias discretas, daremos ênfase às quantitativas, em nossos estudos, pela rele-
vância no mercado de trabalho.
Ao se definir uma variável aleatória discreta, por exemplo, obtêm-se duas infor-
mações a respeito do que pode ocorrer no experimento aleatório, podendo estas
ser claras (diretas) ou suposições que respondam a:
- quais resultados podem ocorrer; e

- qual é a probabilidade de cada resultado acontecer.
Com esses dados, constrói-se a distribuição de probabilidade.
Unidade 6 249
15.2 Distribuição probabilística
Uma distribuição probabilística pode ser definida como a função matemática

que relaciona a cada elemento xi da série de uma variável aleatória X a probabili-
dade de xi acontecer p (xi), simbolizada por P (X = xi), desde que:
a) 0 < P (X = xi) < 1;
b)
DICA
Cuidado: existe diferença entre a distribuição de frequência e a distribuição
de probabilidade. Na de frequência são mostrados os valores observados com
efetivas realizações do experimento e na probabilidade são mostrados os possíveis valores,
alocados a partir de suposições a respeito do experimento aleatório.
A distribuição de probabilidade de uma variável aleatória X é apresentada pelos

pares ordenados (xi, p(xi)) e estes costumam ser representados em tabela, gráfi-
cos ou até mesmo quadros.
Exemplo 1: Suponha que no lançamento simultâneo de dois dados perfeitamente

homogêneos, você queira saber:
a) Qual a probabilidade de dar soma menor que 6?

b) Qual a probabilidade da soma entre os dois dados ficar entre 6 e 10?
1º) Monta-se o espaço amostral completo:

Quadro 1 – Espaço Amostral
(1; 1) (1; 2) (1; 3) (1; 4) (1; 5) (1; 6)
(2; 1) (2; 2) (2; 3) (2; 4) (2; 5) (2; 6)
= (3; 1) (3; 2) (3; 3) (3; 4) (3; 5) (3; 6)
(4; 1) (4; 2) (4; 3) (4; 4) (4; 5) (4; 6)
(5; 1) (5; 2) (5; 3) (5; 4) (5; 5) (5; 6)
(6; 1) (6; 2) (6; 3) (6; 4) (6; 5) (6; 6)
Fonte: Souza e Vargas (2009, p. 64), adaptado.
250 Unidade 6
2º) Define-se X pela soma entre os dados:
X = {1 + 1 = 2; 1 + 2 = 3; 1 + 3 = 4; ...; 6 + 6 = 12}
3º) Considerando que cada situação apresentada no espaço amostral tem a

mesma possibilidade de acontecer, ou seja, igual a 1/36; obtêm-se a distribuição
de probabilidade, mostrada no (QUADRO 2):
Quadro 2 – Distribuição de probabilidade

X 2 3 4 5 6 7 8 9 10 11 12
P (X = xi)
1 2 3 4 5 6 5 4 3 2 1
36 36 36 36 36 36 36 36 36 36 36
Fonte: Souza e Vargas (2009, p. 64)
Essa distribuição de probabilidade é, geralmente, apresentada em gráficos do tipo

haste, como mostrado no Gráf. 20, e quando histograma, precisa-se ter o cuidado
de considerar a área igual a 1 unidade.
Agora, basta responder:
a) Qual a probabilidade de dar soma menor que 6?
P (X < 6) = P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) =

1 2 3 4 10 5
+ + + = =
36 36 36 36 36 18
Unidade 6 251
b) Qual a probabilidade da soma entre os dois dados ficar entre 6 e 10?
P (6 < X < 10) = P(X = 7) + P(X = 8) + P(X = 9) =

6 5 4 15 5
+ + = =
36 36 36 36 12
Para compreender melhor a temática, vamos ao exemplo 2.
2) Suponha que tenha sido realizada uma pesquisa com uma turma de 30
jovens para identificar o número de integrantes na família e verificou-se que:
Quadro 3 – Integrantes de 30 Famílias

Nº de Integrantes (X) 2 3 4 5
Quantidade de Família 1 4 10 15
Fonte: Autora
Logo, calculando-se as probabilidades, obtêm-se sua respectiva distribuição de

probabilidade, mostrada no QUADRO 4 a seguir:
P(X = 2) = 1/30 P(X = 3) = 4/30 P(X = 4) = 10/30 P(X = 5) = 15/30
Quadro 4 – Distribuição de probabilidade dos integrantes de

30 famílias
P(X = xi) jan/30 abr/30 out/30 15/30
Fonte: Autora
A soma das probabilidades obtidas é sempre igual a 1,

caso não encontre 1, volte e refaça sua distribuição, há
algo errado!
252 Unidade 6
15.3 Função de distribuição acumulada
Outra forma de representar uma distribuição de probabilidades de uma variável

aleatória é por meio da função de distribuição acumulada, definida por:
A qual servirá para descrever a probabilidade de ocorrer um valor até x.
Aproveitando o exemplo trabalhado anteriormente, ou seja, suponha que tenha

sido realizada uma pesquisa com uma turma de 30 jovens para identificar o nú-
mero de integrantes na família. Após serem calculadas as suas probabilidades,
conforme mostra o QUADRO 4, consegue-se construir a distribuição de proba-
bilidades acumuladas aplicando, para este exemplo, os seguintes cálculos:
P(X < 2) = P(X = 2) = 1/30
P(X < 3) = P(X = 2) + P(X = 3) = 1/30 + 4/30 = 5/30
P(X < 4) = P(X = 2) + P(X = 3) + P(X = 4) = 1/30 + 4/30 + 10/30 = 15/30
P(X < 5) = P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = 1/30 + 4/30 + 10/30 +

15/30 = 30/30 = 1
Na sequência, basta disponibilizar os resultados em um quadro ou tabela.
Quadro 5 – Distribuição de probabilidade acumulada

dos integrantes de 30 famílias
P(X £ xi) jan/30 mai/30 15/30 30/30
Fonte: Autora
Conclui-se então, por exemplo, que a probabilidade de um jovem morar com, no

máximo, 3 integrantes é de 5/30 = 1/6 = 0.17 = 17%
As funções são muito similares, o que muda é que a acumulada trabalha com P
(X < xi ) ao invés de usar P ( X = xi ).
Unidade 6 253
Mas como proceder com variáveis aleatórias contínuas?
As variáveis aleatórias contínuas, como por exemplo:
a) Volume de água perdido em um sistema de abastecimento;
b) O tempo de vida de uma Fita Dat; e
c) Outros
Pertencem a um espaço amostral ) infinito, logo, a probabilidade dessas va-

riáveis aleatórias contínuas assumirem um valor exatamente igual a zero (xi) e
fazer uso de maior e menor como faz a variável discreta não apresenta sentido,
tão quanto, não tem porque ser representada por par ordenado (xi, p(xi)).
O melhor a fazer é definir uma variável aleatória contínua, por meio de uma
função.
15.4 Função densidade de probabilidade
Para representar uma variável aleatória contínua, usa-se uma função densidade
(não negativa) de probabilidade, conforme mostra a Fig. 13, definida para todos
os valores possíveis da variável aleatória.
A probabilidade de uma variável aleatória assumir valores entre dois valores

quaisquer, no caso da Fig. 13, a e b, pode ser obtida calculando-se a área abaixo
da curva entre a e b. Caso a área seja calculada entre I e m, os limites da função
têm que dar 1 (probabilidade total).
254 Unidade 6
Essa área poderá ser calculada através:
a) Do cálculo da integral da função no intervalo de interesse do pesquisador;
b) De fórmula matemáticas simples; e
c) De tabelas pré-calculadas, encontradas na maioria dos livros de estatística.
ESTUDO COMPLEMENTAR
Algumas tabelas estatísticas poderão ser conhecidas caso tenha interesse
nos anexos do livro: BARBETTA, P. A, Estatística: para cursos de engenharia e informática
/ Pedro Albert Barbetta, Marcelo Menezes Reis, Antonio Cezar Bornia. – 3. Ed. – São Paulo:
Atlas, 2010
Mas atenção:
As probabilidades de eventos relacionadas a uma variável aleatória contínua X

podem ser calculadas por meio da função densidade f, que deve satisfazer:
a)
b)
Analise o exemplo no texto a seguir:
TEXTO COMPLEMENTAR
Seja a variável aleatória T definida como o tempo de resposta na consulta

a um banco de dados, em minutos, suponha que essa variável aleatória tenha a seguinte
função densidade de probabilidade:
Vamos calcular a probabilidade da resposta demorar mais do que 3 minutos, isto é, P(T > 3).
P(T > 3) =
{
Gráfico 21 – Tempo de resposta
na consulta a um banco de dados
Unidade 6 255
15.4 Função densidade de probabilidade
Assim como no estudo da distribuição de frequências estudamos a respeito de

algumas medidas importantes. Para variáveis aleatórias, é relevante sabermos
calcular também:
a) Valor Médio ou Valor Esperado;

b) Variância; e
c) Desvio Padrão.
Façamos uso da seguinte distribuição de probabilidade:
Tabela 62 - Distribuição de Probabilidade

Valores possíveis Probabilidade
x1 p1
x2 p2
x3 p3
... ...
xk pk
Total 1
Valor Médio ou Valor Esperado, simbolizado por E(X), pode ser entendido
como a média aritmética simples, estudada na análise exploratória de dados,
utilizando as probabilidades ao invés das frequências, dado por:
A Variância é dada por:
, sendo
Para o cálculo do E(X) e a V(X) de variáveis aleatórias contínuas, exige-se o

cálculo de integrais da função densidade de probabilidades ou, quando se trata
de distribuições importantes estatisticamente, você poderá fazer uso das tabelas
estatísticas em função dos parâmetros de distribuição, já mencionadas.
256 Unidade 6
No mercado de trabalho, o cálculo do valor esperado é de grande valia quando
precisamos realizar comparações entre possíveis fornecedores, clientes, produ-
tos e outros, com foco no maior lucro ou prejuízo para empresa. (REIS, 2008).
Suponha que o gerente da empresa X tenha recebido duas propostas de compra,

uma do fornecedor A e outra do B e precisa decidir qual é a mais vantajosa.
Certamente, conseguirá tomar a melhor decisão, se calcular o valor esperado
com foco no maior lucro.
E o Desvio Padrão se obtém pela fórmula:
Para compreender melhor essas medidas, acompanhe a descrição a seguir:
Por exemplo: Dada a variável aleatória X: número obtido no lançamento de um

dado comum, pode-se determinar as seguintes probabilidades aos valores pos-
síveis de X, mostradas na (Tab. 63):
Tabela 63 - Distribuição de Probabilidade
Valores possíveis (x) Probabilidade p(x)
1 01/jun
2 01/jun
3 01/jun
4 01/jun
5 01/jun
6 01/jun
Total 1
Tendo a função da probabilidade dada por:

P(xi) = 1/6 (i = 1; 2; 3; 4; 5; 6)
Consegue-se calcular as medidas:
a) do valor médio ou valor esperado:
1 . 1/6 + 2 . 1/6 + 3 . 1/6 + 4 . 1/6 + 5 . 1/6 + 6 . 1/6 = 3,5
Unidade 6 257
b) a Variância dada por:
V(X) = E(X2) – [E(X)]2 sendo E(X2)
E(X2) = 12 . 1/6 + 22. 1/6 + 32 . 1/6 + 42 . 1/6 + 52 . 1/6 + 62 . 1/6 = 15,167
V(X) = E(X2) – [E(X)]2 = 15,167 – (3,5)2 = 2,92
c) e, por fim, o desvio padrão:
Síntese do módulo
Neste módulo, você aprendeu a conceituar uma variável aleatória e suas classifi-
cações: discreta e contínuas, cada qual com suas representações.
Foi exemplificado como construir uma distribuição de probabilidades deixando

claro sua diferença quanto à distribuição de frequência, ou seja, enquanto na
distribuição de frequência trabalha-se com os dados observados diretamente do
experimento, na probabilística, adotam-se as suposições que poderão acontecer
como resultados do experimento aleatório.
Para finalizar foi explicado como calcular as medidas de valor médio, variância e
desvio padrão para distribuição de probabilidades.
ATIVIDADES
1) Considerando o lançamento de 1 dado comum, mostre os elementos que cada

variável aleatória a seguir pode assumir:
a) Números ímpares da face voltada para cima;

b) Números pares da face voltada para cima;
c) Números da face voltada para cima.
258 Unidade 6
2) O quadro a seguir apresenta o número de acidentes com vítimas fatais durante
o feriadão de Corpus Christi, na BR101, do estado de Santa Catarina, em 2013.
Quadro – Vítima no feriadão de Corpus Christi

Número de vitimas fatais 0 1 2 3 4
Quantidade de acidentes 29 15 10 5 1
Fonte: Souza e Vargas (2009, p. 77), adaptado.
Considerando a variável aleatória X: o número de vítimas fatais em cada aciden-

te, durante o feriadão de Corpus Christi, na BR101, no estado de Santa Catarina,
construa uma distribuição de probabilidades para a variável X e determine as
medidas de: valor esperado, variância e desvio padrão.
3) (Adaptado de Barbetta, Reis e Bornia (2008, p. 125 e 126): Considere que um

produto pode estar perfeito (B), com defeito leve (DL) ou com defeito grave
(DG). Seja a seguinte distribuição do lucro (em R$), por unidade vendida desse
produto:
Tabela - Distribuição do lucro por unidade

vendida do produto
Produto x p (x)
Perfeito ( B) 6 0,7
Defeito leve ( DL) 0 0,2
Defeito grave ( DG) –2 0,1
Fonte: Barbetta, Reis e Bornia (2008, p. 125 e 126), adaptada.
Atento a tabela, determine:

a) O valor esperado do lucro;
b) A variância do lucro;
c) Sabe-se que com a redução de desperdícios foi possível aumentar uma unidade
no lucro de cada unidade do produto, qual será o novo valor esperado e a variân-
cia do lucro por unidade?
d) Mas caso o lucro tenha duplicado, qual será o novo valor esperado e a variân-
cia do lucro por unidade?
Unidade 6 259
Módulo 16
Modelos probabilísticos
Para cada tipo de variáveis aleatórias poderão ser construídos alguns Modelos
Probabilísticos.
Neste módulo, abordaremos alguns dos modelos padrões, os quais podem ser
usados em várias situações práticas. Para ter êxito em seus estudos é importante
que saiba definir qual o modelo adequado ao seu estudo em questão, no momen-
to de aplicá-lo.
Vamos conhecê-los?
Unidade 6 261
16.1 Modelos probabilísticos para variáveis aleató-
rias discretas
DICA
Lembre-se que, ao identificarmos uma variável aleatória discreta, precisamos
conhecer quais resultados podem ocorrer e quais são as suas probabilidades.
Entre os modelos probabilísticos discretos, temos:
16.1.1 Distribuição de Bernoulli
Este modelo de distribuição de probabilidade só poderá ser aplicado nos casos

em que a pergunta só admite duas respostas, tais como SIM ou NÃO.
Por exemplo:
a) A cor dos olhos de José é azul?
b) Saiu coroa no lançamento de uma moeda?
c) Ao lançar um dado, obteve-se o número 6?
d) O servidor X de Intranet está ativo?
e) O item observado ao acaso de uma linha de produção é defeituoso?
Para cada caso, adotam-se os termos sucesso e fracasso para os dois eventos
possíveis.
A distribuição de Bernoulli caracteriza-se por uma variável aleatória X, sendo X

= 1, usado quando a resposta for SIM (sucesso) e X = 0, se NÃO (fracasso).
A função de probabilidade de X é dada conforme mostra a (Tab. 64):
Tabela 64 - Distribuição de Bernoulli

X p (x)
0 1–p
1 P
TOTAL 1
262 Unidade 6
Onde p = P (sucesso)
Por exemplo:
a) Lançar uma moeda e observar se ocorre cara ou não?
Se a moeda for perfeitamente equilibrada e o lançamento da moeda for impar-

cial, p = 1 .
2
b) Lançar um dado e verificar se ocorre o número dois ou não?
Neste caso, p = 1 .
6
Algumas características de Bernoulli também precisam ser observadas, como:
1) E(X) = p
2) V(X) = p (1 – p)
3)
Portanto, a distribuição de Bernoulli é a distribuição discreta de = {0; 1}, com

as probabilidades P(0) = 1 – p = q e P(1) = p, tendo como função:
P(X = x) = px . q1 - x
Por exemplo:
Uma urna tem 30 bolas vermelhas e 20 amarelas. Retira-se uma bola dessa urna.
Seja X o número de bolas amarelas. Vamos calcular E(X), V(X) e determinar a
função P(X = x)?
Unidade 6 263
16.1.2 Distribuição Binomial
Essa distribuição resulta na distribuição de Bernoulli repetida n vezes.
Na distribuição binomial, os experimentos a serem considerados, de acordo com

Crespo (2009, p. 136), devem satisfazer as seguintes condições:
- O experimento deve ser repetido, nas mesmas condi-
ções, um número finito de vezes (n);
- As provas repetidas devem ser independentes, isto é, o
resultado de uma não deve afetar os resultados sucessivos;
- Em cada prova deve aparecer um dos dois possíveis re-

sultados: sucesso e fracasso;
- No decorrer do experimento, a probabilidade p do su-

cesso e a probabilidade q (q = 1 – p) do insucesso manter-
-se-ão constantes.
Para obter-se a probabilidade de uma distribuição binomial, basta aplicar a fór-

mula:
Sendo:
n = o número de vezes que o experimento ocorre;
x = o número de vezes que queremos que o sucesso ocorra x {0; 1; 2; ...; n};
p = é a probabilidade do sucesso (tem que ser constante em todos os experimen-

tos); e
q = é a probabilidade do fracasso, q = 1 – p.
DICA
Caso prefira, você pode representar
264 Unidade 6
Para esse modelo de distribuição, têm-se:
E(X) = Np V(X) = npq

Por exemplo:
Suponha que dois times de futebol: Criciúma ( C ) e Flamengo (F) joguem entre
si seis vezes. Qual será a probabilidade do Criciúma ganhar quatro jogos do Fla-
mengo?
Resolução:
N=6 x=4
16.1.3 Distribuição de Poisson
Este modelo de distribuição pode ser adotado para descrever quando um evento
aleatório ocorre durante um intervalo de tempo ou espaço (ou algum volume de
matéria). (SOUZA e VARGAS, 2009).
A sua função de distribuição de probabilidade é representada por:
Sendo:
= medida de ocorrência de x num determinado intervalo de tempo;
e = número de Euler, ou seja (e = 2,7182818284...); e
x = número de vezes que se pretende que o sucesso ocorra, x {0; 1; 2;3; 4;...}.
Em outras palavras, esta distribuição trabalha com suposições básicas, tais como:
Unidade 6 265
a) Independência entre as ocorrências do evento considerado;
b) Os eventos ocorrem de forma aleatória, de tal forma que não haja tendência de
aumentar ou reduzir as ocorrências do evento no intervalo considerado.
Este tipo de distribuição costuma ser utilizado para descrever eventos raros e com
um grande número de tentativas, tais como: o número de chamadas telefônicas a
cobrar recebidas durante 1 ano, número de defeitos em um m2 de piso cerâmico,
o número de consultas a um banco de dados em um minuto, entre outros.
Nessas distribuições, a variância V ( X) = E ( X) = = Np

Para compreender essa distribuição, acompanhe os exemplos a seguir:
1) A probabilidade de uma máquina de apitos produzir um apito com defeito é de

0,5 %. Qual é a probabilidade de, numa amostra de 1000 apitos, 3 apresentarem
defeitos?
Considerando X a variável aleatória, o número de peças defeituosas que segue

uma distribuição de Poisson, tem-se que:
(média) = Np = 1000 . 0,5 = 5, logo a probabilidade de encontrar 3 apitos
defeituosos é dada por: 100
2) Num posto de pedágio, os veículos chegam em média 30 por minuto. Qual a

probabilidade de em determinado minuto, chegarem 40 veículos?
(média) = 30 veículos/minuto
Logo, a probabilidade é dada por:
Para finalizar os modelos probabilísticos para variáveis aleatórias discretas, va-

mos a mais um exemplo:
266 Unidade 6
3) Suponha que as consultas num banco de dados ocorram de forma indepen-
dente com uma taxa média de 3 consultas por minuto. Qual a probabilidade de
que no próximo minuto ocorra menos do que 3 consultas ao banco?
Neste caso, tem-se como resolução do problema os seguintes itens:
(média) = 3 consultas/minuto
Logo, a probabilidade é dada por:
portanto:
P (X < 3) = P (X = 0) + P (X = 1) + P (X = 2)
ESTUDO COMPLEMENTAR
Caso você queira exercitar melhor os modelos probabilísticos estudados,
busque exemplos e exercícios na obra de MAGALHÃES, M. N.. Noções de
Probabilidade e Estatística / Marcos Nascimento Magalhães, Antonio Carlos Pedroso de
Lima – 7.ed. – São Paulo: Editora da Universidade de São Paulo, 2010.
Agora vamos nos ater aos modelos probabilísticos mais usados para variáveis
contínuas.
16.2 Modelos probabilísticos para variáveis aleató-

rias contínuas
Entre os modelos probabilísticos contínuos, tem-se:
16.1.3 Distribuição de Poisson
Ao se deparar com uma infinidade enumerável de dados, faz-se necessário traba-

lhar com distribuição contínua, por isso, vamos conhecer a distribuição normal,
pois é a que ocorre com mais frequência na natureza.
Unidade 6 267
A representação geométrica de uma distribuição normal pode ser visualizada
através da (Fig. 14):
O foco da distribuição normal é calcular a probabilidade de uma variável aleató-

ria assumir um valor em um determinado intervalo.
A distribuição normal apresenta as seguintes características:
a) A variável aleatória X pode assumir todo e qualquer valor real;
b) A representação gráfica da distribuição normal é uma curva em forma

de sino, simétrica em torno da média ( x ), que recebe o nome de curva normal
ou de Gauss;
c) A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já
que essa área corresponde à probabilidade de a variável aleatória X assumir qual-
quer valor real;
d) A curva normal é assimétrica em relação ao eixo das abscissas, isto é,

aproxima-se indefinidamente do eixo das abscissas, sem, contudo, alcançá-lo; e
e) Como a curva é simétrica em torno de x , a probabilidade de ocorrer

valor maior do que a média é igual a probabilidade de ocorrer valor menor do
que a média, isto é, ambas as probabilidades são iguais a 0,5. Escrevemos P(X
> x ) = P(X < x ) = 0,5.
A distribuição normal é determinada pelos parâmetros ( x ) (média) e (s)

(desvio padrão) e a sua função densidade de probabilidade é denotada por:
268 Unidade 6
Quando = 0 e = 1, temos o que chamamos de distribuição normal padrão ou
normal standard e, consequentemente, sua função densidade de probabilidade é
dada por:
Para cálculos probabilísticos, pode-se transformar toda distribuição normal dada

em uma distribuição normal padrão e fazer uso de tabelas Z de valores, conforme
tabela em anexo 2.
Na tabela Z, encontraremos todos os valores pré-calculados, que precisaremos

para desenvolver este processo, o que tende a facilitar e, muito nossos cálculos de
probabilidade.
Logo, se uma variável X, tem distribuição normal de média e variância 2 (X –

N( 2)), costuma-se transformar essa numa variável aleat ória z de distribuição
normal padrão de média 0 e variância 1 (Z – N(0, 1)), ou seja, numa distribuição
normal reduzida, por meio da fórmula:
Mas, como proceder? Basta seguir o esquema da Fig. 15:
Unidade 6 269
Para aplicar este processo faz-se necessário:
1 - saber a média e o desvio padrão da distribuição X;
2 – adotar z com média = 0 e desvio padrão = 1; e
3 – buscar as probabilidades de z nas suas respectivas tabelas, disponibilizada no
anexo 2, em livros de estatística e na própria Internet.
Para compreender este processo, acompanhe o seguinte exemplo:
a) Seja X a variável aleatória que representa os diâmetros dos pregos produzi-

dos por uma máquina. Suponhamos que uma variável tenha distribuição normal
com média = 2 e desvio padrão = 0,04 cm. Qual será a probabilidade de um
prego ter um diâmetro com valor entre 2 e 2,05 cm?
Sabendo-se que a probabilidade procurada P(2 < X < 2,05) corresponde à área
destacada na (Fig. 16):
Tendo como referência os dois valores de X, 2 e 2,05, respectivamente, em um

primeiro momento, calcula-se os valores de z, aplicando-se a fórmula:
Portanto:
Para X = 2, tem-se: e para X = 2,05,
270 Unidade 6
Agora, escrevem-se esses dados na forma simbólica, substituindo os valores e
trocando X por Z:
P ( 2 < X < 2,05) = P ( 0 < Z < 1,25)
Na sequência, busca-se o seu respectivo valor na tabela Z (anexo 2). Neste ex-
emplo, o valor de z = 1,25, pois, como já mencionado, tende a facilitar nossos
cálculos.
Na 1ª coluna, encontra-se o valor 1,2. Na sequência, en-

contra-se na 1ª linha o valor 5 (último algarismo de 1,25),
faz-se então a intersecção da linha e coluna correspon-
dentes e encontra-se, neste caso, o valor 0,3944.
Portanto:
A probabilidade de um prego ter um diâmetro entre a média a = 2 e o valor x =

2,05 é 0,3944, ou seja, P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 = 39,44%.
Visto que esse modelo probabilístico tende a ser constantemente aplicado na

prática em estatística, vejamos a seguir mais um exemplo, fazendo uso da tabela
Z (anexo 2), com a apresentação das suas respectivas curvas e a resolução de cada
enunciado:
Exemplo: Quais são as probabilidades de:

a) P (– 1,25 < Z < 0);
b) P (– 0,5 < Z < 1,48);
c) P ( 0,8 < Z < 1,23);
d) P ( Z > 0,6); e
e) P ( Z < 0,92).
a) Para a probabilidade solicitada, tem-se a curva representada na (Fig. 17):
Unidade 6 271
Logo:
Como P (0 < Z < 1,25) = 0,3944, pela simetria da curva, pode-se afirmar que:
P (– 1,25 < Z < 0) = P (0 < Z < 1,25) = 0,3944
b) Para a probabilidade P (– 0,5 < Z < 1,48) correspondente à parte pintada da

(Fig. 18):
Tem-se:
P (– 0,5 < Z < 1,48) = P (– 0,5 < Z < 0) + P ( 0 < Z < 1,48)
Logo, atentos à tabela Z (anexo X), obtém-se as probabilidades:
P (– 0,5 < Z < 0) = P ( 0 < Z < 0,5) = 0,1915 e P ( 0 < Z < 1,48) = 0,4306, tão logo:
P (– 0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221
c) Para a probabilidade P ( 0,8 < Z < 1,23), representada na parte em destaque da

(Fig. 19):
272 Unidade 6
Tem-se:
P (0,8 < Z < 1,23) = P (0 < Z < 1,23) – P (0 < Z < 0,8)
Como as probabilidades de acordo com a tabela Z (anexo X) de:
P (0 < Z < 1,23) = 0,3907 e P ( 0 < Z < 0,8) = 0,2881
A probabilidade P (0,8 < Z < 1,23) resultará em: 0,3907 – 0,2881 = 0,1026
d) A P (Z > 0,6), analisando sua respectiva curva na (Fig. 20):
Tem-se:
P ( Z > 0,6) = P ( Z > 0) – P (0 < Z < 0,6)
Como:
P ( Z > 0) = 0,5 e P (0 < Z < 0,6) = 0,2258, então:
A probabilidade P ( Z > 0,6) = 0,5 – 0,2258 = 0,2742
e) Agora, para encerrar nosso exemplo, vamos encontrar a probabilidade de Z <

0,92.
Unidade 6 273
Sendo a probabilidade procurada P (Z < 0,92) representada pela curva da (Fig.
21):
Tem-se:
P ( Z < 0,92) = P ( Z < 0) + P ( 0 < Z < 0,92)
Como de acordo com a tabela Z (anexo x), os valores de:
P ( Z < 0) = 0,5 e P ( 0 < Z < 0,92) = 0,3212
Obtém-se:
P( Z < 0,92) = 0,5 + 0,3212 = 0,8212
Vamos a mais uma suposição?
Suponha que o gerente da indústria X queira saber qual é a probabilidade de um

funcionário levar um tempo entre 75 e 81 segundos para montar determinada
peça industrial, como proceder?
1º) Estando esta probabilidade entre 75 e 81, tem-se: P (75< X < 81) que até então
é desconhecida.
2º) Trocando a variável X pela variável normal padronizada Z, por meio da fór-
mula
Encontra-se para:
X = 75, tem-se e para X = 81,
274 Unidade 6
Logo, P (75 < X < 81) = P ( 0 < Z < 1).
Buscando seus respectivos valores na tabela Z (anexo 2), determina-se a probabi-

lidade desejada, ou seja: P (75 < X < 81) = P (0 < Z < 1) = 0,3413.
O que permite ao gerente saber que a probabilidade de um funcionário levar um

tempo entre 75 e 81 segundos (= 6 segundos) para montar uma peça industrial é
de 0,3413 e concluir que 34,13% dos seus funcionários levar um tempo dentro do
intervalo 75 e 81 segundos, permitindo-lhe assim tomar decisões.
Síntese do módulo
Neste módulo, foram apresentados alguns modelos probabilísticos com concei-
tos, fórmulas para calcular as probabilidades e exemplos, tanto para variáveis
aleatórias discretas como contínuas.
Dentre os modelos probabilísticos discretos, destacam-se:
- A distribuição de Bernoulli, caracterizado por uma variável aleatória X, defini-

da por X = 1, se sucesso, X = 0, se fracasso, tão logo se faz aplicável em situações
pares com respostas SIM e NÃO;
- a distribuição binomial, aplicada em casos de distribuição de Bernoulli repetida
n vezes; e
- a distribuição de Paisson que serve para descrever a ocorrência de um evento

aleatório em um intervalo ou espaço.
Para variáveis aleatórias contínuas, mesmo existindo outros modelos, o livro se

ateve ao de maior aplicabilidade segundo sua vivência, ao modelo de distribuição
normal, sendo esta definida pelos parâmetros: média e desvio padrão.
Se uma variável aleatória X apresenta distribuição normal de média e variân-

cia, transforma-se numa variável aleatória Z de distribuição normal padrão com
média 0 e variância 1, usando a fórmula e, na sequência, faz-se uso
de valores tabelados para Z, o que tende a facilitar o trabalho dos envolvidos no
processo.
Não se esqueça! Toda curva normal padrão é simétrica em relação à média 0 e a

área sob essa curva é 1.
Unidade 6 275
ATIVIDADES
1) Suponha que a empresa X queira analisar um determinado componente ele-

trônico quanto a sua duração, sabendo-se que o componente eletrônico dura em
média 850 dias com desvio padrão de 40 dias, sendo a duração normalmente
distribuída, qual será a probabilidade desse componente eletrônico durar:
a) menos de 750 dias;

b) mais que 800 dias; e
c) entre 700 e 1.000 dias.
2) Durante um campeonato esportivo, os times de futebol Flamengo e Grêmio

jogam entre si, 6 vezes. Sendo assim, qual será a probabilidade de o Flamengo:
a) ganhar dois ou três jogos; e

b) ganhar pelo menos um jogo.
3) Suponha que o monitor de Cálculo I, da Faculdade SATC, receba, em média,

20 alunos por hora. Utilizando a distribuição de Poisson, qual será a probabilida-
de do monitor não receber nenhum aluno em 30 minutos?
EXERCÍCIOS COMPLEMENTARES
1) (FEPESE, 2013) Uma empresa tem 8 funcionários à disposição para os cargos

de presidente, primeiro secretário e segundo secretário. De quantas maneiras di-
ferentes esses cargos podem ser preenchidos?
276 Unidade 6
a) 24
b) 56
c) 336
d)
1680
e) 40320
2) Paulo, professor aposentado de Estatística, vem há muito tempo acompanhan-

do os dados sobre custos e faturamento do restaurante de sua esposa. Como o es-
tabelecimento comercial funciona todos os dias da semana, Paulo concluiu que:
o custo diário do estabelecimento segue uma distribuição normal, com média
igual a R$ 500,00 e desvio padrão igual a R$ 10,00 e que o faturamento diário,
também, apresenta uma distribuição normal, com média R$ 800,00 e desvio pa-
drão R$ 20,00. Paulo, entendendo bem de estatística, ele sabe que, se uma variá-
vel Z seguir uma distribuição normal padrão, então Z tem média 0 e variância 1.
Paulo também sabe que a probabilidade dessa variável Z assumir valores no in-
tervalo entre 0 < Z < 2, entre (a média 0 e o desvio padrão 2) é, aproximadamente,
igual a 0,4772. A esposa, preocupada com o futuro de seu estabelecimento, per-
guntou a Paulo se ele poderia verificar a probabilidade de, em um dia qualquer,
o custo ser maior do que R$ 520,00 e o faturamento ficar no intervalo entre R$
760,00 e R$ 840,00. Paulo, após fazer um cálculo afirmou que as probabilidades
são respectivamente, em percentuais, iguais a:
a) 2,28; 95,44.
b) 52,28; 95,44.
c) 2,28; 98,69.
d) 98,69; 95,44.
e) 98,65; 2,28.
3) (ENADE) Um baralho tem 52 cartas, organizadas em 4 naipes, com 13 valores

diferentes para cada naipe.
Os valores possíveis são: Ás, 2, 3, ..., 10, J, Q, K.
Unidade 6 277
No jogo de poker, uma das combinações de 5 cartas mais valiosas é o full house,
que é formado por três cartas de mesmo valor e outras duas cartas de mesmo va-
lor. São exemplos de full houses: i) três cartas K e duas 10 (como visto na figura)
ou ii) três cartas 4 e duas Ás.
Quantas possibilidades para full house existem em um baralho de 52 cartas?
a) 156.
b) 624.
c) 1872.
d) 3744.
e) 7488.
4) (ENADE) Em determinado período letivo, cada estudante de um curso uni-

versitário tem aulas com um de três professores, esses identificados pelas letras
X, Y e Z. As quantidades de estudantes (homens e mulheres) que têm aulas com
cada professor é apresentada na tabela de contingência abaixo.
Professor X Professor Y Professor Z

Estudantes
45 5 32
Homens
Estudantes
67 2 4
Mulheres
A partir do grupo de estudantes desse curso universitário, escolhe-se um estu-

dante ao acaso. Qual é a probabilidade de que esse estudante seja mulher, dado
que ele tem aulas apenas com o professor X?
a) 61 b) 61 c) 67 d) 61 e) 67
73 155 155 112 112
278 Unidade 6
5) (ENADE) Para o desenvolvimento de um projeto, determinada organização
precisa definir dois grupos de trabalho, um com três membros e outro com qua-
tro membros. Para o grupo de três elementos, o primeiro indivíduo nomeado
será o presidente, o segundo, o relator, e o terceiro será o auxiliar, enquanto que,
para o de quatro elementos, a ordem de nomeação não é relevante. Essa organi-
zação conta com um quadro de quatorze funcionários, todos igualmente aptos
a compor qualquer um dos grupos de trabalho, em qualquer função, sendo que
cada um deles integrará, no máximo, um desses grupos.
Nessa situação, representando por C(m, p) a combinação de m elementos p a p

e por A(m, p) o arranjo de m elementos p a p, conclui-se que a quantidade de
maneiras distintas que a organização citada dispõe para compor os seus dois
grupos de trabalho é igual a:
a) A(14, 4) × A(14, 3).

b) A(14, 4) × C(14, 3).
c) C(14, 4) × A(10, 3).
d) C(10, 3) × A(14, 4).
e) C(14, 4) × C(10, 3).
6) Três dados comuns e honestos serão lançados. A probabilidade de que o

número 6 seja obtido mais de uma vez é:
a 5/216
b) 6/216
c) 15/216
d) 16/216
e) 91/216
7) (IBGE) Seja H a variável aleatória que representa as alturas dos cidadãos de

certo país. Sabe-se que H tem distribuição normal com média 1,70 m e desvio
padrão 0,04 m. A probabilidade de que um cidadão desse país tenha mais do
que 1,75 m de altura é, aproximadamente,
a) 9,9% b) 10,6% c) 22,2% d) 39,4% e) 40,6%
Unidade 6 279
8) (ENADE) No Hemocentro de uma grande cidade, está havendo falta de
sangue tipo AB. Uma pesquisa nessa cidade revelou as seguintes proporções de
pessoas em cada tipo sanguíneo:
Tipo A Tipo B Tipo AB Tipo O
0,36 0,12 0,04 0,48
Se em um certo dia, dez pessoas, independentemente se apresentam para doar

sangue, a probabilidade de que três doem sangue do tipo A, duas do tipo B, três
do tipo AB e duas do tipo O é:
a)
b)
c)
d)
e)
9) Em uma determinada repartição pública do Estado do Tocantins, o número

de e-mails recebido mensalmente é normalmente distribuído, com uma média
de 5200 e desvio padrão de 400. A porcentagem de mês em que a repartição
recebe mais de 4200 e-mails é, a: (Considerando o valor da área igual a 0,4938
retirado da tabela Z).
a) 49,38
b) 49,53
c) 99,38
d) 0,62
280 Unidade 6
Unidade 7
Inferência estatística
Nesta unidade serão abordados temas relacionados a mais uma parte da
estatística: a inferência estatística, também conhecida como estatística indutiva.
A estatística inferencial é a subárea que engloba um conjunto de técnicas
aplicadas por interessados, em estudar uma população, através de evidências
encontradas em amostras significativas, das quais resultarão algumas
medidas importantes para pesquisa. (MAGALHÃES e LIMA, 2010)
Como dificilmente, se consegue agrupar todos os dados de uma população
para comparar as medidas com seus padrões específicos, o que significa
em outras palavras: para aferir o parâmetro desejado, faz-se necessário
trabalhar com estimativas de parâmetros populacionais para realizar
alguns testes estatísticos, os quais se baseiam em amostras.
Finalizando seus estudos, no módulo 17, você verificará como se relacionam
estatísticas com parâmetros, isto é, como se relacionam as características dos
elementos de uma amostra com as características dos elementos de uma
população além de conhecer como são calculados alguns estimadores, como
média, variância, desvio padrão populacional e proporção populacional.
Na sequência, no último módulo, será falado a respeito de testes de
hipóteses aplicados por estatísticos para testar a veracidade de
suas ideias sobre a população ou populações em questão, por meio
de dados amostrais, validando assim suas pesquisas. ■
Módulo 17
Estimação
Para ingressar no mundo da inferência estatística, faz-se necessário em um pri-
meiro momento, ter claro a que se referem alguns termos, depois sim se pode
começar a calcular algumas estimativas, entre elas: a média, variância/desvio pa-
drão e a proporção, para aplicá-los nos testes de significância (os quais) tendem a
colaborar com os gestores para tomadas de decisões mais eficazes.
Unidade 7 283
17.1 Parâmetros e estatísticas
Nos casos em que a amostragem é aleatória, principalmente quando aleatória

simples, consegue-se fazer inferências sobre a população, baseando-se na obser-
vação de uma amostra, conforme mostra a (Fig. 22):
Ao analisar a Fig. 21., consegue-se caracterizar a população e a amostra em ter-

mos da variável estudada. Suponha que você queira analisar se cada comprador
de uma revendedora de carros pretende ( x = 1) ou não pretende ( x = 0) com-
prar um carro zero em 2014, poderá representar a população pelo conjunto (xı;
xz; ...; xN), onde xI = 0 ou 1, dependendo se o i-ésimo elemento da população
pretende ou não comprar um carro zero.
Assim, como poderá representar a amostra de n elementos selecionados da po-

pulação por (Xı; Xz; ...; Xn), sendo Xı a variável aleatória que corresponde ao va-
lor de X ser 0 ou 1 na i-ésima observação. (BARBETTA; REIS; BORNIA, 2008).
E com essas representações consegue dar início aos cálculos paramétricos e es-
tatísticos.
Porém, antes é importante você saber que:
284 Unidade 7
a) Parâmetro, refere-se a um valor geralmente desconhecido e que está relaciona-
do a uma característica da população, enquanto;
b) Estatística, refere-se a algumas medidas (média, variância, proporção, etc.)

das variáveis aleatórias X1; X2; ...; Xn, relacionadas a amostra, conforme esquema
mostrado na (Fig. 23).
Agora que já sabemos diferenciar parâmetros e estatísticas, devemos estudar as

estimativas, que se refere aos valores resultantes de uma medida estatística, obti-
da sempre que precisamos ter uma noção do parâmetro de interesse no estudo.
Dentre estas estimativas, encontram-se a média; variância; desvio padrão e pro-

porção.
17.1.1 Estimador: Média ou Média Aritmética
Este parâmetro é o mais adotado para representar os valores de uma variável

aleatória. (SOUZA; VARGAS, 2009).
O valor do estimador da média populacional é obtido pelo quociente (divisão)

do somatório dos valores da variável pela quantidade total de valores, utiliza-se
a fórmula:
, onde:
Unidade 7 285
DICA
Quando se depara com n sendo igual ao tamanho da população, tem-se a
média populacional (lê-se: mi). Como nem sempre isso ocorre, fala-se que
x é um estimador de .
Por exemplo:
Suponha que o proprietário da loja JAT Modas, no município de Criciúma, com
o objetivo de verificar quantas peças de roupas, em média, são vendidas por
mês, tenha coletado as vendas, de três tipos de mercadorias, dos seis últimos
meses de 2012, conforme estão descritos na (Tab. 65):
Tabela 65 - Mercadorias vendidas na JAT Modas nos últimos 6 meses de 2012

Mês 1 2 3 4 5 6 TOTAL
Tipo de Mercadoria
Camisa gola a polo 21 15 14 31 18 22 121
Camiseta 52 36 27 59 31 61 266
Camisa Social 12 5 8 17 3 19 64
TOTAL 85 56 49 107 52 102 451
Fonte: Autora, dados fictícios
Considerando o número de vendas mensais a variável aleatória X, tem-se:
X = {85; 56; 49; 107; 52; 102}, logo n = 6. Aplicando-se a forma:
17.1.2 Estimador: Variância
Para fins de cálculo de estimadores, adota-se geralmen-

te quatro casas após a vírgula.
Este estimador serve para representar a variação, em relação à média, dos ele-
mentos de uma determinada variável aleatória. Dentre outros estimadores, a
variância é uma medida bastante utilizada na inferência estatística. (MAGA-
LHÃES; LIMA, 2010)
286 Unidade 7
O valor do estimador variância determina-se matematicamente pela fórmula:
sendo:
s2 = variância populacional;
Xi = os valores da variável;
x = média amostral; e
n = quantidade de valores.
DICA
Adota-se o denominador n – 1, ao invés de “n” no estimador da variância, so-

mente para obter uma estimação não tendenciosa. (SOUZA; VARGAS, 2009)
Mas, se ao invés do denominador “n – 1” fosse aplicado o tamanho da população,

ter-se-ia a variância populacional 2 (sigma ao quadrado). Como se sabe, nem
sempre se tem em mãos o tamanho da população. Logo, conclui-se que s2 é um
estimador de 2.
Para compreender o cálculo do estimador variância, acompanhe o exemplo dado

a seguir:
Tomando o exemplo da JAT Modas, mostrado na Tab. 65, qual será o valor esti-
mado da variância populacional das vendas mensais, por Vilton, o proprietário,
da loja?
Sendo a média ( x ) já conhecida igual a 75,1667 e n = 6, o valor do estimador

variância é dado por:
(85 - 75,1667)2 + (56 - 75,1667)2 + (49 - 75,1667)2 + (107 - 75,1667)2 + (52 - 75,1667)2 + (102 - 75,1667)2
6-1
Unidade 7 287
17.1.3 Estimador: Desvio Padrão
Como já foi estudado em outros módulos, o desvio padrão é o estimador deter-

minado por meio da raiz quadrada da medida da variância. Com este estimador
consegue-se ter uma ideia mais clara da variabilidade dos elementos da variável
aleatória.
Matematicamente, obtêm-se o valor do estimador desvio padrão aplicando-se a

fórmula: , sendo s o desvio padrão e s2 o valor da variância.
DICA
Se extrair a raiz quadrada da variância populacional, estará determinando o
desvio padrão populacional, (sigma), mas como nem sempre, se tem em
mãos a variância populacional, conclui-se que s é um estimador de .
Ainda tomando o caso da JAT Modas como exemplo, para Vilton calcular o valor
do desvio padrão estimado para as vendas da loja nos 6 meses, bastaria calcular
a raiz quadrada da variância conhecida, ou seja:
Sendo s2 = 683,7667, o estimador desvio padrão será igual a:
E, para finalizarmos os cálculos desses parâmetros, vamos ao da proporção.
17.1.4 Estimador: Proporção
Este estimador populacional simbolizado por ^p (p chapéu) de uma variável ale-

atória com uma determinada característica A, é calculado através da fórmula
matemática:
, sendo n (A) o número de elementos da variável aleatória, de tamanho

n, com a característica de interesse A.
Como os demais estimadores, se por ventura n fosse idêntico ao tamanho da po-

pulação, teríamos a proporção populacional p, e não o estimador ^p (p chapéu)
288 Unidade 7
de p.
Ainda para o exemplo da JAT Modas, caso Vilton tenha interesse conseguirá
estimar proporcionalmente suas vendas de camisa gola a polo e para as demais
mercadorias, bastando aplicar para cada item, descrito na (Tab. 65):
ou 26.83% (sua representação em porcentagem
torna-se mais compreensível).
ou 58,98%.
ou 14,19%
O que permitirá ao proprietário da loja saber que suas vendas foram melhor no
item camisetas, depois camisa gola a polo e, por fim, em blusas sociais, o que lhe
auxiliará a tomar decisões significativas para os próximos períodos.
Com o intuito de facilitar seus cálculos, aqui serão resumidos os parâmetros

(medidas para população) e estatísticas (medidas para amostra, estimadores po-
pulacionais) estudados até o momento, no (QUADRO 7):
Quadro 7 – Parâmetros e estatísticas

Parâmetros Parâmetros Estimadores populacionais
Populacionais populacionais (Estatisticas)
Média
Variância
Desvio Padrão
Proporção
Fonte: Barbetta, Reis e Bornia (2008, p. 171), adaptado.
Unidade 7 289
Síntese do módulo
Neste módulo, você teve início á subárea da estatística no que tange à estatística
indutiva. Conheceu os conceitos de parâmetros, estatísticas e estimativas. Estu-
dou que enquanto os parâmetros são medidas que servem para descrever certa
característica da população, as estatísticas são medidas que descrevem certa ca-
racterística dos elementos da amostra e que estimativa é o resultante obtido no
cálculo de determinada estatística, quando aplicada para se conhecer o parâme-
tro de interesse.
Foram trabalhados os estimadores de média, variância, desvio padrão e propor-

ção, cada qual com conceito, fórmula matemática e exemplo.
Para finalizar, foi apresentado um quadro resumo com os parâmetros e estatísti-

cas estudados.
ATIVIDADES
Analise cuidadosamente a tabela a seguir com os dados apresentados de uma

grande pesquisa a respeito da população fumante no Brasil e nas suas regiões. Os
dados estão descritos quanto ao sexo, área/sexo e área:
Tabela - Fumantes no Brasil

Regiões
Sexo Área/Sexo
Brasileiras
Total Homens Mulheres Urbana Rural
Total Homens Mulheres Total Homens Mulheres

Brasil 44.840.402 35.099.710 9.740.692 35.281.715 26.753.198 8.528.517 9.558.687 8.346.512 1.212.175
Região Norte 3.514.898 2.822.616 692.282 2.325.379 1.776.650 548.729 1.189.519 1.045.966 143.553
Região
12.763.114 10.129.040 2.634.074 8.375.218 6.311.667 2.063.551 4.387.896 3.817.373 570.523
Nordeste
Região
18.840.494 14.532.028 4.308.466 16.772.754 12.724.072 4.048.682 2.067.740 1.807.956 259.784
Sudeste
Região Sul 6.644.573 5.211.064 1.433.509 5.209.693 3.958.647 1.251.046 1.434.880 1.252.417 182.463
Região
3.077.323 2.404.962 672.361 2.598.671 1.982.162 616.509 478.625 422.800 55.852
Centro-Oeste
290 Unidade 7
Determine os itens solicitados nos exercícios 1, 2 e 3 a seguir, fazendo uso da
tabela acima.
1) A média de:
a) mulheres fumantes nas regiões brasileiras; e
b) homens fumantes na área urbana e rural das regiões brasileiras.
2) A variância e o desvio padrão:
a) Dos fumantes nas regiões brasileiras; e
b) Dos fumantes nas áreas urbana e rural das regiões brasileiras.
3) Qual região tem a maior proporção de mulheres fumantes (em relação ao total
de fumantes de cada região).
Unidade 7 291
Módulo 18
Testes de hipóteses
Também conhecidos como testes de significância, são de extrema relevância no
cotidiano dos gestores, estando estes inclusos na subárea estatística indutiva.
No módulo 17, você estudou estimadores populacionais, os quais são utilizados

para aplicação dos testes de hipóteses com o intuito de verificar se uma popula-
ção possui ou não determinado parâmetro. Estes testes também se baseiam nas
amostras, por isso, a preocupação por parte dos pesquisadores em trabalhar com
uma amostra significativa, que evite influências externas as observações obtidas.
Mas você deve estar se perguntando: para que serve e como realizar um teste de
hipótese, não é mesmo?
Vamos então em frente,

a busca da resposta!
Unidade 7 293
18.1 Definições introdutórias a testes de significân-
cia
Os testes de hipóteses são aplicados para analisar se a diferença que existe entre
um parâmetro e uma estimativa está relacionada à amostra ser aleatória ou se
existe distorção na seleção da amostra. Quando a diferença é muito grande, o
interessado deverá desconfiar da integridade na escolha da amostra.
A princípio, você deve estar se perguntado por que realizar estes testes, mas não
esqueça, no nosso cotidiano pode-se afirmar, muitas vezes, até erroneamente que
as coisas são iguais ou diferentes, mas estatisticamente isto não é permitido. Essas
conclusões só têm validade quando resultantes de algum teste, caso contrário,
nada é igual e nada é diferente!
Para realizarmos um teste, faz-se necessário definir duas hipóteses relacionadas à

verdade, sendo estas simbolizadas geralmente por H0 e H1.
A hipótese H0 denominada hipótese nula é na verdade, a hipótese que anula o

teste. A H1, conhecida por hipótese alternativa, trata-se da hipótese que o teste se
propõe a provar.
Por exemplo: Suponha que o INMETRO, numa pesquisa relacionada à qualidade

na embalagem do café queira verificar se o peso contido na embalagem de café
de determinada marca é menor que o valor X mencionado na embalagem. Nesse
caso:
Tem-se como:
H0: = X, a média do peso contido na embalagem de café é igual ao valor men-

cionado na embalagem; e
H1: < X, a média do peso contido na embalagem de café é menor que o valor
mencionado na embalagem.
Agora digamos que em uma pesquisa se pretende determinar se a média da idade

de uma população de acadêmicos que ingressam na Faculdade é diferente de 19
anos. Para este teste, formulam-se como hipóteses:
294 Unidade 7
H0: = 19, ou seja, a média populacional é igual a 19 anos; e
H1: = 19, ou seja, a média populacional é diferente de 19 anos.
Por mais que os pesquisadores, ao coletar os dados da pesquisa, se preocupem

em trabalhar com amostras significativas, a estimação desses dados nunca ou
quase nunca estará livre de erros.
Durante a realização dos testes de significância, trabalha-se com dois tipos pos-
síveis de erro: o erro do tipo I ou o erro do tipo II.
18.2 Erro do tipo I
Este erro se dá quando se rejeita a hipótese nula (Ho) quando, na verdade, deveria
ter sido aceita.
DICA
Para que a chance de rejeitarmos uma hipótese verdadeira seja pequena, é

necessário que a probabilidade de cometermos o erro do tipo I seja pequena.
(SOUZA; VARGAS, 2009)
A essa pequena probabilidade dai-se o nome de nível de significância do teste,

sendo ele representado pela letra grega .
Logo, o valor 1 – irá representar a probabilidade de aceitar uma hipótese ver-

dadeira quando ela é verdadeira.
A esse valor adota-se a nomenclatura de nível de confiança.
O valor de , ou seja, o nível de significância do teste

deverá ser definido no início do teste, para que o mesmo
não sofra distorções.
Unidade 7 295
18.3 Erro do tipo II
Já esse tipo de erro ocorre quando se aceita a hipótese nula (H0), devendo esta,
na verdade, ter sido rejeitada. Simbolicamente, o erro do tipo II é representado
pela letra grega .
Quando a probabilidade de cometer o erro do tipo II é pequena, a chance de

aceitar uma hipótese falsa também será pequena.
Ao valor 1 – , denomina-se de poder do teste, o qual representará a probabili-

dade de uma hipótese falsa ser rejeitada quando ela for falsa.
Para sua melhor compreensão, analise o resumo dos tipos de erros apresentados
no (QUADRO 8):
Quadro 8 – Erros do tipo I e II em testes de hipóteses

H0 verdadeira H0 falsa
Rejeitar H0 Erro do tipo I () Desição correta (1 – )
Decisão
Aceitar H0 Decisão correta (1 – ) Erro do tipo II ()
Fonte: Magalhães e Lima (2010, p. 264), adaptado.
DICA
Ao analisar o QUADRO 8, poderá verificar que o erro do tipo I ocorre quando
se rejeita a hipótese nula, enquanto o erro do tipo II ocorre quando se aceita
a hipótese nula.
Os pesquisadores mais experientes buscam um equilíbrio entre os dois erros

apresentados, mas os novatos tendem a fazer uso apenas do erro do tipo I.
18.4 Passos para realizar um teste de hipótese
Para se realizar um teste de significância, (hipótese), deve-se realizar o seguinte

processo:
296 Unidade 7
- Primeiramente, formulam-se as duas hipóteses: a hipótese nula (H0) e a alter-
nativa (H1);
- Baseando-se na hipótese alternativa (H1) e no nível de significância ( ), esta-
belece-se as regiões de aceitação e rejeição da hipótese nula (H0) e o valor crítico;
- No terceiro passo, calcula-se o valor da variável do teste; e
- Por fim, aceita-se ou rejeita-se a hipótese nula (H0) comparando-se o valor cal-
culado da variável do teste com a região de aceitação ou rejeição.
Existem vários testes de hipóteses, mas nos ateremos a dois deles pela sua aplica-
bilidade no mercado de trabalho:
- o teste de hipóteses para média; e
- o teste de hipóteses para a proporção.
Para facilitar a compreensão desses testes, iremos diretamente a exemplos:
18.4.1 Testes de Hipóteses Para a Média
Aqui se depara com duas situações prováveis:
a) Nos testes de significância para a média, quando o desvio padrão populacional

é conhecido, a estimativa amostral da média é padronizada pela fórmula:
b) Nos testes de significância para a média, quando o desvio padrão populacional

não é conhecido, a estimativa amostral da média é padronizada pela fórmula:
Nesta obra, nos ateremos apenas ao item a para exemplificá-lo, mas nada o impe-
de de buscar exemplos relacionados ao item b, em livros, vídeos e outros.
a) Imagine que o INMETRO faça uma inspeção numa fábrica de tijolos que diga
que o tamanho dos seus tijolos segue uma distribuição normal com
Unidade 7 297
= 20 cm e = 2 cm. Para verificar, o auditor recolhe uma amostra com 10
unidades obtendo as medidas: 18; 23; 20; 21; 22; 23; 22; 21; 21; 20. O INMETRO
trabalha, neste caso, com um erro estatístico de 5%, ou seja, o nível de significân-
cia é de 5%, logo com um nível de confiança de 95%.
1º) Separe os dados, irá facilitar seu trabalho:
N = 10 = 0,05 (5 dividido por 100) ∑ n = 211
Calculando-se a estimativa da média, tem-se:
Sendo o objetivo do INMETRO inspecionar se a média do tamanho dos tijolos é

diferente de 20, definem-se as seguintes hipóteses:
H0: = 20 cm e H1: = 20 cm
Como neste caso o desvio padrão é conhecido, trabalha-se com a distribuição

normal com = 0 e 2 = 1 e adota-se a fórmula para padronização:
Agora, para resolver o teste basta calcular o valor de z padronizado e o comparar

com os valores críticos tabelados ztab, sendo este determinado por meio da tabela
(anexo 2) com o valor 1 - / 2 = 1 – 0,025 = 0,975 assim ztab = 1,96.
Calculando
DICA
O valor 21,1 cm na curva normal é equivalente a 1,74 cm na curva normal
padrão.
Conclusões:
Caso a média amostral padronizada esteja na área de rejeição, neste caso maior
que o valor crítico 1,96 ou menor que o valor crítico simétrico – 1,96, deve-se
298 Unidade 7
rejeitar a hipótese nula, caso contrário, deve-se aceitar.
Para este exemplo, a média padronizada é de 1,74 cm, logo, - 1,96 < 1,74 < 1,96,
o que indica que 1,74 está na área de aceitação da hipótese nula.
Como as médias amostral e populacional são iguais num nível de significância de

5% ou de confiança de 95%, não tem como querer afirmar que as especificações
da empresa estão incorretas, pois temos 5% de chance de estarmos errados nesta
conclusão.
18.4.2 Teste de Hipótese para a Proporção Populacional
Nos testes de hipóteses para a população populacional, a estimativa amostral da

proporção é padronizada pela fórmula:
Vamos a um exemplo:
Imagine que o diretor de uma Instituição afirme que existe uma taxa de 15% de
reprovação. Para analisar se a taxa de reprovação é diferente, com = 2%, selecio-
nando-se, neste exemplo, aleatoriamente uma amostra de 300 alunos sabendo-se
que 36 reprovaram, como proceder?
1º) Reúnem-se os dados:
P = 15% = 0,15
Pela amostra selecionada aleatoriamente, estima-se uma proporção
, portanto, tem-se como hipóteses:
H0: p = 0,15 e H1: p = 0,15
Trabalhando-se que a distribuição da proporção amostral p chapéu pode ser

aproximada por um modelo normal, compara-se com o valor de z padronizado.
Unidade 7 299
O valor z para proporção, obtêm-se com:
Para comparar, tem-se z da tabela igual a 2,33 através do valor de 1 - /2 = 1 –

0,01 = 0,99
Conclusão:
Aceita-se a hipótese nula. Ao analisar, observa-se que a proporção populacional

não é diferente de 15% a um nível de significância de 2%. Essa conclusão é clara
pelo fato de o valor padronizado – 1,45 estar entre – 2,33 e 2,33, ou, se preferir,
representar de outra forma: (-2,33 < 1,455 < 2,33), está contida na região de aceite
da hipótese nula.
Síntese do módulo
Encerramos por aqui nossos conteúdos referentes à estatística. Neste módulo,
foram apresentados os conceitos de testes de hipóteses, tipos de hipóteses, os
tipos I e II de erros. Descreveram-se os níveis de significância, nível de confiança
e também se definiu o poder do teste.
Sabe-se que existem vários tipos de testes, mas preferimos se ater a dois específi-
cos, o teste de hipótese para a média e o teste de hipótese para proporção popu-
lacional, os quais foram explicados por meio de exemplo.
A inferência estatística é uma subárea da estatística que exige muito tempo e

alguns conhecimentos básicos para sua compreensão. Então, caro leitor, sugiro
que faça uso dos testes apresentados nesta unidade como referência básica, ape-
nas como um caminho inicial para seus estudos, complementando-o com outras
obras, vídeos e outros materiais que venham contribuir para sua aprendizagem.
300 Unidade 7
ATIVIDADES
1) Explique o que vem a ser:
a) Hipótese nula;
b) Hipótese alternativa; e
c) Os dois tipos de erro.
2) Determine as hipóteses H0 e H1, no seguinte teste:

Numa pesquisa que pretende verificar se a média dos acadêmicos de Cálculo I,
da população das engenharias, na Faculdade SATC, é diferente de 20.
3) Uma amostra de 25 elementos apresentou como média o valor 123. Sabendo-

-se que a variância populacional vale 81, ao nível de significância de 5%, teste a
hipótese que a média populacional é igual a 120, contra a hipótese que a média é
diferente de 120.
EXERCÍCIOS COMPLEMENTARES
1) Considere uma amostragem aleatória simples, sem reposição, de uma popu-

lação de tamanho muito grande. Qual o tamanho aproximado de amostra que
permite estimar a média de uma variável y, cujo desvio padrão populacional é
Unidade 7 301
igual a 5, com margem de erro 0,1, a um nível de confiança 95%?
a) 100
b) 400
c) 1.000
d) 4.000
e) 10.000
2) (ENADE) Hipótese é sinônimo de suposição. Neste sentido, Hipótese é uma

afirmação categórica, que tenta responder ao problema levantado, no tema esco-
lhido para pesquisa. É uma pré-solução para o problema levantado. O trabalho
de pesquisa, então, irá confirmar ou negar a Hipótese (ou suposição) levantada.
Analise a seguinte situação:
Uma área de preservação ambiental (APA) está parcialmente cercada por uma
comunidade agrícola em sua parte norte. Esta comunidade tem por costume
aplicar a queimada como forma de manejar sua pastagem. Na parte sul, uma área
mais preservada, não existe influência da queimada. Um pesquisador acredita
que a prática de queimada tem afetado a parte norte da APA e que os colibris
poderiam ser um indicador desta alteração. Então, decidiu fazer algumas medi-
ções nas partes norte e sul da APA. Ele mensurou: abundância floral, número de
posturas anuais, peso e frequência de ocorrência de colibris.
Para qual das seguintes hipóteses o pesquisador NÃO teria condição de fazer
inferências?
a) As queimadas diminuem o número de postura anual do colibri.
b) As queimadas afetam a floração na APA e, consequentemente, diminuem a

quantidade disponível de néctar.
c) Existe diferença na frequência de colibris entre as duas áreas.

d) Existe diferença no peso dos colibris que vivem nas diferentes áreas.
e) Os gases poluentes da área urbana afetam o vigor dos colibris.
302 Unidade 7
3) Suponha que as notas dos candidatos de um concurso público, em uma cer-
ta prova, sigam distribuição normal com média 7 e desvio padrão 1. A relação
candidato/vaga é de 40 para 1. A nota mínima necessária para aprovação nessa
prova é
a) 8,65 b) 8,96 c) 9,37 d) 9,58 e) 9,75
4) (IBGE) Nos testes de hipótese é possível comparar os resultados de duas amos-

tras independentes retiradas de uma mesma população através das curvas apro-
ximadamente normais. A representação gráfica (esquemática) desta comparação
é apresentada a seguir.
Com base no esquema acima, responda as questões 4.1 a 4.4: Assume-se que: H0:
hipótese da nulidade; HA: hipótese alternativa;
4.1) A área representada pelo “α” indicada no referido esquema representa;
a) A probabilidade de aceitar H0 sabendo-se que ela é verdadeira.

b) A probabilidade de aceitar H0 sabendo-se que ela é falsa.
c) A probabilidade de aceitar HA sabendo-se que ela é falsa.
d) A probabilidade de aceitar HA sabendo-se que ela é verdadeira.
Unidade 7 303
4.2) A área representada pelo “β” indicado no referido esquema representa:
a) A probabilidade de aceitar H0 sabendo-se que ela é verdadeira.

b) A probabilidade de aceitar H0 sabendo-se que ela é falsa.
c) A probabilidade de aceitar HA sabendo-se que ela é falsa.
d) A probabilidade de aceitar HA sabendo-se que ela é verdadeira.
4.3) No esquema apresentado o cálculo “1-α” representa:
a) O intervalo de confiança do teste.
b) A probabilidade de erro do teste.
c) A probabilidade de confiança do teste.
d) A margem de erro do teste.
4.4) Os erros tipo I e tipo II do teste de hipótese representam, respectivamente:
a) O “β” e o “α”
b) O “α” e o “1-α”
c) O “β” e o “1-β”
d) O “α” e o “β”
5) As notas de uma prova são normalmente distribuídas com média 73 e variân-

cia 225. Sabendo-se que os 20% melhores alunos recebem o conceito A, a nota
mínima(s) para pertencer a este grupo será: (Considerando o valor de Z tabelado
igual a 0,84):
a) 85,6
b) 78,2
c) 94,5
d) 262,0
304 Unidade 7
RESULTADO DAS ATIVIDADES
UNIDADE 1 – MÓDULO 1:
1.a) R: É descrito com o ESTUDO DO ESTADO. Estatística é uma área da mate-
mática aplicada que disponibiliza métodos e técnicas para sistematicamente: co-
letar dados, organizar, resumir, analisar e interpretá-los de forma concisa, eficaz
e concreta, deixando de lado o “achismo” nas interpretações.
1.b) R: Estatística Descritiva ou Dedutiva; Inferência Estatística ou Estatística

Indutiva; e Probabilidade.
1.c) R: Deve ser aplicado quando você tiver ao seu alcance um grande número de
dados, dificultando a conclusão do estudo em questão. Assim, ao aplicar técnicas
descritivas, você conseguirá reduzir ao máximo essas informações geradas, con-
seguindo interpretar e chegar a algumas conclusões.
1.d) R: Alternativa I: Descritiva.
2) R: Letra d: IBGE – Instituto Brasileiro de Geografia e Estatística.
3) R: ( X ) NÃO. O correto é o inverso. A Estatística Descritiva trabalha a coleta,

organização e a descrição dos dados, enquanto a Estatística Indutiva ou Inferen-
cial se atem a análise e a interpretação desses dados.
UNIDADE 1 – MÓDULO 2:
1) R: Ciências humanas e sociais.
2) R: Parâmetros: quando tratamos de população e estatísticas, quando examina-

mos uma amostra.
3.a) R: Coleta de dados; Crítica dos dados; Apuração dos dados; Apresentação
Unidade 7 305
dos dados; e Análise dos resultados.
3.b) R: Primário e secundário. Primário: quando o próprio pesquisador, o in-

teressado no estudo, faz a coleta dos dados; e secundário: quando os dados já
foram coletados por outra pessoa.
3.c) R: A coleta direta ocorre quando os dados coletados são obtidos via regis-
tros obrigatórios, ou por meio de inquéritos e questionários, aplicados pelo pró-
prio pesquisador interessado.
3.d) R: Contínua; Periódica e Ocasional.

3.e) R: Os registros de nascimento e óbitos são exemplos de coletas do tipo con-
tínua e os censos demográficos são classificados como coletas do tipo periódica.
3.f) R: Manualmente ou de forma eletrônica.

3.g) R: Por meio de tabelas ou gráficos.
UNIDADE 1 – MÓDULO 3
1) R: Alternativa C: Conjunto de todos os indivíduos, objetos ou informações
que apresentam pelo menos uma característica em comum.
2) R: Pessoal. Mas quanto aos conceitos apresentados população é o conjunto

de elementos que formam o universo de nosso estudo que são passíveis de ser
observados, sob as mesmas condições e amostra é parte dos elementos de uma
população. Exemplos: a resposta é pessoal.
3) R: Qualitativa: letra B.
Quantitativa discreta: letras A, C, D.

Quantitativa contínua: letras E, F.
306 Unidade 7
1) R: Amostra de 15% = 18,6 = 19 elementos: 011; 020; 021; 027; 036; 043; 047;
052; 053; 058; 063; 064; 075; 089; 095; 100; 112; 113; 116.
2) R: 021 – 095; 139 – 108; 089 – 071; 053 – 100; 027 – 123; 063 – 072; 036 – 095; 075 – 062; 064 -076;
052 - 120; 011 - 129; 116 - 085; 047 - 090; 112 - 137; 113 - 099; 095 - 092; 100 - 086; 043 - 128; 020 - 056;
058 - 095; 009 - 079; 077 - 116; 127 - 069; 014 - 091; 136 - 106; 041 – 081.
3) R: Total = 30 elementos (6 do 1º estrato; 9 do 2º estrato e 15 do 3º estrato).
1) R: 80%.
2) R:
Tabela: Alunos Matriculados na Escola JAT em 2012
1ª 546 42,9
2ª 328 25,7
3ª 280 22
4ª 120 9,4
TOTAL 1274 100
Fonte: Crespo (2009, p. 28), adapatado
3) R: a) 3,54 b) 21,49 c) 6,36 d) 8,7 e) 63,82
1) R: Alternativa letra E.
2.a) R: 6 lojas.
Unidade 7 307
2.b) R: 13 lojas.
2.c) R: 60 %.
3) R: Tabela: Alunos Matriculados na Escola JAT em 2012

1ª 546 42,9
2ª 328 25,7
3ª 280 22
4ª 120 9,4
TOTAL 1274 100
Fonte: Crespo (2009, p. 28), adapatado
1) R: Alternativa E (o gráfico de setores é usado para comparar proporções).
2) R: Alternativa D: o setor de papel consome 4,1% do total de energia.
3) R: Alternativa B: 8.344.
1) R: Alternativa E: 10 %.
2.a) R: Tabela - Distribuição de frequência

Notas Frequência Absoluta (fi )
30 l 40 4
40 l 50 6
50 l 60 8
60 l 70 12
70 l 80 9
80 l 90 7
90 l 100 4
 = 50
Fonte: Diretor da Instituição
308 Unidade 7
2.b)
Tabela - Distribuição de frequências
Frequência
Frequência Frequência Frequência
Notas Acumulada
Absoluta (fi) Relativa (fri) em % Acumulada (FAci)
Relativa (FAci %)
30 l 40 4 8 4 8
40 l 50 6 12 10 20
50 l 60 8 16 18 36
60 l 70 12 24 30 60
70 l 80 9 18 39 78
80 l 90 7 14 46 92
90 l 100 4 8 50 100
 = 50  = 100 %
Fonte: Diretor da Instituição
3.1) R: Alternativa B: 19
3.2) R: Alternativa D: 40.
3.3) R: Alternativa E: 78.
1.a) Gráfico – Histograma
Unidade 7 309
1.b) Gráfico - Polígono de frequência
1.c) Gráfico – Ogiva
310 Unidade 7
1.d) Gráfico - Curva de frequência
2) R: Alternativa C: Histograma e polígono de frequência.
3) R: Alternativa D: Em nenhum.
1) R: TOTAL = ( 10 )
2) R: Alternativa B: Nota 5,0.
3) R: Alternativa D: 2,16; 2,30 e 2,25.
1.3) R: Alternativa D: o desvio padrão e a média aritmética.
1.4) R: Alternativa C: a média 0 e a variância 16.
2.a) R: AT = 8 e desvio padrão = 2,96.
Unidade 7 311
2.b) R: AT = 8 e desvio padrão = 2,81.
2.c) R: AT = 9,2 e desvio padrão = 3,016.
2.d) R: AT = 20 e desvio padrão = 7,04.
2.e) R: AT = 6 e desvio padrão = 1,51.
2.f) R: AT = 0,7 e desvio padrão = 0,159.
3) R: Em estatística.
1) R: Alternativa A: a distribuição é assimétrica à direita.
2) R: Alternativa B: 0,191.
3.a) R: Média = 36,10 Mediana = 35,9 Moda = 35,5 e Desvio Padrão = 4,2.
3.b) R: Assimetria = 0,143 Curtose = 0,23. A distribuição é simétrica e a curva é

leptocúrtica. (Q1= 33,5 Q3 = 38,8 P10= 30,7 P90= 42,1).
1.a) R: = – 1,7x + 32,3

1.b) Gráfico - Diagrama de dispersão
312 Unidade 7
1.c) R: Correlação negativa está decrescendo. A justificativa é pessoal
2.a) R: Sim, existe.

2.b) R: Coeficiente de correlação é 0,89.
3.a) R: Coeficiente de correlação é 0,54.

3.b) R: = 1,81x + 0,01
3.c) R: x = 0,16 y + 0,40
1.a) R: 1 .
3
1.b) R: 1 .
11
1.c) R: 19 .
33
2.a) R: P (D) = 6.500/6.850
2.b) R: P (B) = 530/6.850
2.c) R: P (D B) = 500/6.850
2.d) R: P (D / B) = 500/530
2.e) R: P (B / D) = 500/6.500
2.f) R: 350/6.850 = 0,051
2.g) R: 50/1.550 = 0,032
3.a) R: P ( A) = 2/5; P ( B) = 15/50; P ( C) = 7/50; P ( D) = 1/10 e P ( E ) = 3/50.

3.b) R: 3/5
1.a) R: X = {1; 3; 5}.

1.b) R: X = {2; 4; 6}.
1.c) R: X = {1; 2; 3; 4; 5; 6}.
Unidade 7 313
2) R:
Quadro – Distribuição de probabilidades do exercício
X 0 1 2 3 4
P ( X = xi ) 29/60 01/abr 01/jun 01/dez jan/60
Fonte: Autora
Valor esperado é igual a 0,9. A variância é de aproximadamente 1,1234 e o des-

vio padrão 1,0599.
3.a) R: Valor esperado é 4.

3.b) R: A variância é de 9,6.
3.c) R: R: Valor esperado é 5 e a variância é de 9,6.
3.d) R: Valor esperado é 8 e a variância é de 38,4.
1.a) R: 0,0062
1.b) R: 0,8944
1.c) R: 0,9998.
2.a) R: 400/729
2.b) R: 665/729
3) R: Aproximadamente: 0,0000454
1.a) R: 1.948.138,4
1.b) R: 1.669.302,4
2.a) R: Média = 8.968.080,4

Variância = 45.425.934.496.443,3
Desvio padrão aproximadamente 6.739.876,4452.
2.b) R: Urbana:
314 Unidade 7
Média = 7.056.343
Variância = 35.452.762.559.481,5
Desvio padrão aproximadamente 5.954.222,2464
Rural:
Média = 1.911.737,4
Variância = 2.239.606.096.121,8
Desvio padrão aproximadamente 1.496.531,3549
3) R: A região sudeste com 0,2287.
1.a) R: A hipótese H0 denominada hipótese nula, é na verdade a hipótese que

anula o teste.
1.b) R: A H1 conhecida por hipótese alternativa, trata-se da hipótese que o teste

se propõe a provar.
1.c) R: Erro do tipo I: esse erro se dá quando se rejeita a hipótese nula (Ho)
quando, na verdade, deveria ter sido aceita. Erro do tipo II: ocorre quando se
aceita a hipótese nula (H0), devendo esta, na verdade, ter sido rejeitada.
2) R: H0: = 20 e H1: = 20.
3) R: Bilateral
H0: = 120
H1: ¹ 120
z = 1,6667
Para a/2 = 0,025 temos ztab = 1,96.
Conclusão: Aceitamos H0, pois -1,96 < 1,6667 < 1,96.
Unidade 7 315
Resultado dos exercícios complementares
UNIDADE 1
1) R: Pessoal, mas a principal estratégia é verificar primeiro a fonte da noticia,

se a notícia é real ou são informações errôneas.
2) R: Pessoal. Eticamente, o estatístico Dogbert aplica seu conhecimento sobre

uma fragilidade da média como medida de tendência central para manipular a
informação a ser extraída dela e obter vantagem pessoal.
Sendo que tecnicamente, Dogbert não deveria aplicar a média como medida de
tendência central dos “novos” salários, visto que o novo conjunto de dados tem
um valor muito distinto.
3) R: Alternativa E: México e Brasil
4. a) R: População: Todos os eleitores votantes no estado de Santa Catarina.
Amostra: Os eleitores selecionados nos maiores municípios de Santa Catarina

na pesquisa realizada.
4. b) R: População: Todas as mães de crianças recém-nascidas no segundo se-

mestre de 2012, do Estado de Santa Catarina.
Amostra: As mães de recém-nascidos entrevistadas na pesquisa realizada.
4. c) R: População: Todos os criciumenses que assistem TV.
Amostra: Os telespectadores entrevistados na pesquisa.
5) R: Variáveis:
Funcionário: Qualitativa nominal; Idade: Quantitativa contínua; Escolaridade:

Qualitativa ordinal; Salário: Quantitativa contínua; Tempo de empresa: Quanti-
tativa contínua.
6. a) R: Pessoal
316 Unidade 7
6. b) R: Enquanto no censo se analisa todos os elementos da população indivi-
dualmente, na amostragem, trabalha-se com parte significativa deste universo
que tenha condições de representar o todo.
7) R: Alternativa C.
8) R: Na Amostragem Estratificada, a escolha da amostra também é aleatória,

porém em grupos (estratos) com características em comum, buscando repre-
sentar significativamente a população.
Nesse caso, será escolhida uma amostra aleatória proporcional à amostra total
para cada estrato: professores integral (estrato1), horistas (estrato 2) e visitantes
(estrato 3). Por exemplo: Se existir 100 professores, uma amostra de 10% resulta
em 10 professores, os quais deverão ser selecionados aleatoriamente com algu-
ma técnica estatística adequada para que o número pertencente a cada tipo de
professores também seja de 10% para participar da pesquisa. Se 50 horistas (5
serão selecionados no estrato 2 para amostra), 30 integrais (10% = 3 do estrato
1) e 20 visitantes (10% do estrato 3 = 2 professores).
9) R: A descrição do exemplo é pessoal, mas entre os itens da resposta, precisa

constar que a amostragem será sistemática para não haver viés de opinião (re-
sultados distorcidos). O processo deverá seguir os passos:
1 – Calcula-se o intervalo de seleção, dado por (I = Intervalo; N = Nº

de elementos da população e n = Nº de elementos da amostra), desprezando as
decimais;
2 – Sorteia-se o primeiro elemento do conjunto definido pelo intervalo, (1; ...,

I); e
3 – Obtêm-se a amostra, retirando um elemento a cada I (intervalo definido).
Para finalizar os dados precisarão ser exemplificados, tais como população N =

100, amostra de 10% = 10 alunos e assim por diante, o exemplo deverá ser rela-
tado.
10) R: Alternativa B.
Unidade 7 317
UNIDADE 2
1) R: Alternativa E.
4. a) R: A cidade X utiliza 69,04 % de gás enquanto a cidade Y utiliza 122,96%

de gás. Essa sentença é verdadeira de acordo com sua frequência relativa.
4.b) R: Pessoal. Mas o gráfico que melhor representará as séries é o gráfico de

setores. Ao analisá-lo podemos perceber comparar em porcentagens seu consu-
mo de combustível:
A cidade X utiliza mais eletricidade que a cidade Y, enquanto o gás e outros ti-
pos de combustível são utilizados com maior frequência pela cidade Y
5.1) R: Alternativa D. Porque neste tipo de série o elemento variável é o local

(ONDE) enquanto o fato (QUE) e o tempo (QUANDO) permanecem constan-
tes.
5.2) R: Alternativa C. Porque neste tipo de série o elemento variável é o fato

(QUE) enquanto o local (ONDE) e o tempo (QUANDO) permanecem constan-
tes.
5.3) R: Alternativa E. Porque neste tipo de série o elemento variável é o tempo

(QUANDO) enquanto o local (ONDE) e o fato (QUE) permanecem constantes.
6. a) R: ERRADO. Amplitude total da distribuição: é a diferença entre o limite

superior da última classe (limite superior máximo) e o limite inferior da primei-
ra classe (limite inferior mínimo).
6. b) R: ERRADO. Em Estatística, entende-se por população não só um conjun-

to de pessoas, mas de objetos e outros que apresentem pelo menos uma caracte-
rística comum.
318 Unidade 7
6. c) R: ERRADO. A variável é continua.
6. d) R: CORRETO.
6. e) R: ERRADO. A Frequência relativa é quando se apresentam as porcenta-

gens em relação aos elementos. Essas frequências devem ser calculadas pela ra-
zão das frequências simples e a frequência total, e apresentadas por fri.
7) R: Alternativa D.
8) R: Alternativa C
UNIDADE 3
A justificativa é pessoal, mas o acadêmico deverá mostrar que o 90% refere-se à

frequência acumulada relativa da 5ª classe, logo 12.000,00 intervalo superior, o
não pertencente à classe, conforme mostra a tabela:
Tabela – Distribuição de frequência salarial

Classe salarial (R$) fi fri em % FAci FAci %
2.000,00 l 4.000,00 18 4,5 18 4,5
4.000,00 l 6.000,00 45 11,25 63 15,75
6.000,00 l 8.000,00 102 25,5 165 41,25
8.000,00 l 10.000,00 143 35,75 308 77
10.000,00 l 12.000,00 51 12,75 359 89,75
12.000,00 l 14.000,00 41 10,25 400 100
TOTAL 400 100
Fonte: Autora
2. 1) R: Alternativa E.
4) R: Está correto (C).
Unidade 7 319
A justificativa se dá com o cálculo da frequência acumulada relativa, basta cal-
cular ((1.100 + 900 + 550)/3000) . 100 = 85%
Sendo 1.100, 900 e 550 as frequências simples até a terceira classe, dividido pelo
total de empresas 3000. O mesmo poderá ser resolvido via tabela.
UNIDADE 4
1) R: Alternativa A, a média foi 7; a moda e mediana 5.
2.1) R: Alternativa C.
2.2) R: Alternativa E.
3.1) R: Medida de dispersão ou variabilidade.
3.2) R: Alternativa D.
4. a) R: O 3º quartil é um valor que deixa ¾ dos dados abaixo e ¼ acima dele.

Como o valor em questão é 720 u.m., existe um número maior de salários abai-
xo deste. Portanto, é mais provável que o trabalhador ganhe menos que 720
u.m..
4. b) R: Já que a variância é praticamente zero, os salários em geral, estão bem

próximos de 840 u.m.. Como foi dito, na cidade A 75% dos salários estão abaixo
de 720 u.m., então seria melhor procurar emprego em B.
5. a) R: As turmas A e B possuem a mesma média, porém as notas da turma B

têm uma melhor distribuição, estão mais próximas da média, devido à variância
ser menor.
5) b) R: A distribuição das notas da turma A é um pouco assimétrica positiva,

enquanto que a distribuição da turma B é simétrica. Apesar da amplitude das
320 Unidade 7
notas serem menor na turma A, a turma B apresenta melhores notas, já que
50% destas se encontram abaixo de 6 e na turma A abaixo de 4,5.
6.2) R: Alternativa B.
6.3) R: Alternativa A.
UNIDADE 5
3) R: Alternativa A.
UNIDADE 6
Unidade 7 321
UNIDADE 7
4.2) R: Alternativa B.
5) R: Alternativa A.
322 Unidade 7
REFERÊNCIAS BIBIOGRÁFICAS
BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 7. ed. rev

Florianópolis: Ed. da UFSC, 2007. 315p.
BARBETTA, Pedro Alberto. Estatística: para cursos de engenharia e informá-

tica / Pedro Alberto Barbetta, Marcelo Menezes Reis, Antonio Cezar Bornia. –
São Paulo: Atlas, 2008.
BARBETTA, Pedro Alberto. Estatística: para cursos de engenharia e informá-

tica / Pedro Alberto Barbetta, Marcelo Menezes Reis, Antonio Cezar Bornia. –
São Paulo: Atlas, 2010.
BRUNI, Adriano Leal. Estatística para concursos: com mais de 400 questões
solucionadas, incluindo principais bancas examinadoras e provas importan-
tes. São Paulo: Atlas, 2008.
CORREA, Sonia Maria Barros Barbosa. Probabilidade e Estatística / Sonia

Maria Barros Barbosa Correa. – 2ª ed. - Belo Horizonte: PUC Minas Virtual,
2003. 116 p.
COSTA NETO, Pedro Luiz de Oliveira. Estatística. 2ª. ed. rev. e atual. São Pau-
lo: Blucher, 2002. 266p.
CRESPO, Antônio Arnot. Estatística Fácil. 19ª Ed. Atual. São Paulo: Saraiva,
2009.
DALPIAZ, Márcia Vilma A. D.. Estatística: parte I / Kiliano Gesser, Márcia

Vilma A. D. Dalpiaz, José Tafner. Centro Universitário Leonardo da Vinci. – In-
daial: ASSELVI, 2004. 144 p.
GALLIANO, A. Guilherme. O Método Científico Teoria e Prática. São Paulo:

Habra, 1979.
GESSER, Kiliano. Caderno de estudos: estatística / Kiliano Gesser [e] Márcia

Vilma Aparecida Depiné Dalpiaz, Centro Universitário Leonardo da Vinci. –
Indaial: ASSELVI, 2007.
Unidade 7 323
GIOVANNI, José Ruy. Matemática 2: 2º grau: Trigonometria, matrizes, aná-
lise combinatória, geometria / José Ruy Giovanni, José Roberto Bonjorno. São
Paulo: FTD, 1992.
GIOVANNI, José Ruy e BONDORJO, José Roberto. Matemática: uma nova

abordagem, vol. 2, versão trigonometria. São Paulo: FTD, 2000. (Coleção Ma-
temática uma nova abordagem).
GONZÁLEZ, Norton. Estatística Básica. São Paulo: Editora Ciência Moderna,

2009. 248 p.
MAGALHÃES, Marcos Nascimento. Noções de Probabilidade e Estatística /

Marcos Nascimento Magalhães, Antonio Carlos Pedroso de Lima. – 7. Ed. – São
Paulo: Editora da Universidade de São Paulo, 2010 – (Acadêmica 40).
REIS, Marcelo Menezes. Estatística aplicada à administração. Florianópolis:

Departamento de Ciências da Administração / UFSC, 2008. 280 p.: Il.
SOUZA, André Marcelo Santos de. Caderno de estudos: Probabilidade e Esta-

tística / André Marcelo Santos de Souza [e] Saulo Vargas. Centro Universitário
Leonardo da Vinci. – Indaial: Grupo UNIASSELVI, 2009, x; 157 p.
SPIEGEL, Murray R.. Estatística. 3.ed. SÃO PAULO: Makron-Books, 1994.

643p.
<http://www.cTh.ufsc.br/gcn3506/documents/Aula2.pdf>, acesso em: 20 de jan.

2013:
Geografia da Saúde: Cartograma – Dengue no Estado do RJ. Disponível em:

<http://cartageografica.blogspot.com.br/2012_04_01_archive.html>. Acesso
em: 04 set. 2013
<www.google.com.br>. Acesso: em 23 de set. 2.013.
Imagens para a matemática. Disponível em: <http://matimage.blogspot.com.

br/2009/11/pictogramas.html#axzz2O6IVolOR> Acesso em: 18 mar. 2013
324 Unidade 7
Imagens para a matemática. <http://matimage.blogspot.com.br/search/label/
pictograma#axzz2O6IVolOR>. Acesso em: 18 mar. 2013, as 10:30 h
Instituto Brasileiro de Geografia e Estatística - IBGE. Disponível em: <http://

www.ibge.gov.br/brasil_em_sintese/>. Acesso em: 08 de jan. 2013.

www.ibge.gov.br/brasil_em_sintese/tabelas/populacao_tabela01.htm>. Acesso
em: 08 de jan. 2013.

www.ibge.gov.br>. Acesso em: 15 de jan. de 2013.
Ministério da Fazenda apud Crespo (2009, p. 35)
Ministério da Agricultura apud Crespo (2000, p. 45)
WEWCART. Disponível em: http://www.ibge.gov.br/webcart.
(CESPE, TCDF/95)
(UFPE)
FGV Min. Cultura Tec. Cont. / 06
AMEC, Trabuco
Unidade 7 325
ANEXO I – Tabela de números aleatórios
57720039848441796771402113975649865408932968745483
28805351590993988758702771771706320278621674696517
92591852873048869748352518887403629838586586424103
90381291743019758907506415597188137495305278301175
80911694675860820666904756184645111235324550411343
22017031329691927540165429727499009597610098243007
56241004302046299053531105844121647919762951626066
79449262029686643000945669302059878735442250977819
53996645088978507753372577412762380223576201416035
18928735885505213651392850146685793019797266643145
53085896630561257022504128966266436306630132798522
03588029287689511824888946474859192987031033996712
27078188656949980028047051300147189733218582454324
05210859010622249891811755446616077307661012317858
40361327843082333639694205586461123389278952667193
54602528858820001059610536613372010119016110512091
71516340767111737352373160458892734371280498090248
61020181739260667358533442682638340327449604466593
82559313463095265506961765917239799612495280632699
89985414217413576819862860894733152628774538480808
00998484146795137758901450794273633106604340125504
62415078204805884352980319939203049725849595036331
94279069246809921186076383193299511555710927026700
44892928843628251582877418972576106326760226745328
97307695332110542695666552049936584803089363581796
39165804448015595983909554668184396085388866333569
60781103266750340961313020769366308351093383647605
03192347628957779133884760593754394877674985384391
41285267562539599665513690322239330522990339979699
77549850392537425297100356049281668670014889558210
28634161916424838137344883279638716973067750256460
74244885401233596750149814264279791352896978804471
00240337964668750532421663332897263647277365383446
05414769694536167118955197220413239658600369487983
62698497974723665156130869115275592686818043009892
326 Unidade 7
ANEXO II – Tabela Z
z 0 1 2 3 4 5 6 7 8 9
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0438 0438 0478 0517 0557 0596 0636 0675 0714 0754
0,2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141
0,3 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517
0,4 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879
0,5 1915 1950 1985 2019 2054 2088 2123 2157 2190 2224
0,6 2258 2291 2324 2357 2389 2422 2454 2486 2518 2549
0,7 2580 2612 2642 2673 2704 2734 2764 2794 2823 2852
0,8 2881 2910 2939 2967 2996 3023 3051 3078 3106 3133
0,9 3159 3186 3212 3238 3264 3289 3315 3340 3365 3389
1,0 3413 3438 3461 3485 3508 3531 3554 3577 3599 3621
1,1 3643 3665 3686 3708 3729 3749 3770 3790 3810 3830
1,2 3849 3869 3888 3907 3925 3944 3962 3980 3997 4015
1,3 4032 4049 4066 4082 4099 4115 4131 4147 4162 4177
1,4 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319
1,5 4332 4345 4357 4370 4382 4394 4406 4418 4429 4441
1,6 4452 4463 4474 4484 4495 4505 4515 4525 4535 4525
1,7 4554 4564 4573 4582 4591 4599 4608 4616 4625 4633
1,8 4641 4649 4656 4664 4671 4678 4686 4693 4699 4706
1,9 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767
2,0 4772 4778 4783 4788 4793 4798 4803 4808 4812 4817
2,1 4821 4826 4830 4834 4838 4842 4846 4850 4854 4857
2,2 4861 4864 4868 4871 4875 4878 4881 4884 4887 4890
2,3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916
2,4 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936
2,5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952
2,6 4953 4955 4956 4957 4959 4960 4961 4962 4963 4964
2,7 4965 4966 4967 4968 4969 4970 4971 4972 4973 4974
2,8 4974 4975 4976 4977 4977 4978 4979 4979 4980 4981
2,9 4981 4982 4982 4983 4984 4984 4985 4985 4986 4986
3,0 4987 4987 4987 4988 4988 4989 4989 4989 4990 4990
3,1 4990 4991 4991 4991 4992 4992 4992 4992 4993 4993
3,2 4993 4993 4994 4994 4994 4994 4994 4995 4995 4995
3,3 4995 4995 4995 4996 4996 4996 4996 4996 4996 4997
3,4 4997 4997 4997 4997 4997 4997 4997 4997 4997 4998
3,5 4998 4998 4998 4998 4998 4998 4998 4998 4998 4998
3,6 4998 4998 4999 4999 4999 4999 4999 4999 4999 4999
3,7 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999
3,8 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Unidade 7 327

Livro - Estatistica

Enviado por

Direitos autorais:

Formatos disponíveis

Livro - Estatistica

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Livro - Estatistica

Enviado por

Direitos autorais:

Formatos disponíveis

Silvia Helena Mangili Tassi

Faculdade SATC Coordenação dos Cursos

Conheça a autora .................................................................................................5

Módulo 10 – Medidas de posição .................................................................. 157

Referências ..................................................................................................... 117

Mestre em Engenharia de Produção, na área de Mídia e Conhecimento pela

Veja: Coleta de Organização

Interpretação Análise dos Exposição dos

Então, que tal conhecermos melhor essa ciência e desenvolvermos habilidades

Na sequência, serão apresentadas algumas técnicas

Parece bastante coisa, não é mesmo? Mas com leitura

Se dividirmos a história em partes, podemos dizerrelatar que antigamente os ho-

■ O número de habitantes de um território;

■ Quantos óbitos ocorreram em determinado período; na tela, usar imagens

■ Entre outros, porém, tudo informalmente.

Já no século XVIII, a coleta de alguns

1.2 Conceito e aplicações

Estatística é uma área da matemática aplicada que disponibiliza métodos e téc-

Os dados coletados podem ser obtidos por pesquisas ou experimentos, permitin-

A estatística têm aplicações em várias áreas

Na área industrial, os engenheiros, por meio de dados estatísticos, conseguem

Na área tecnológica, a estatística tem forte participação, principalmente na jun-

Na área da saúde, é comum o uso de técnicas estatísticas para a pesquisa da situ-

Na educação, os especialistas em estatística ou os próprios matemáticos podem

Recomendamos que você leia:

1.3 Como a estatística está dividida?

- Estatística Descritiva ou Dedutiva;

1.3.1 Estatística Descritiva

A Estatística Descritiva pode ser usada para tratar dados, como:

- A média semestral dos alunos na disciplina de Estatística;

- O número de votos favoráveis por candidatos em pesquisas eleitorais;

- O custo de vida de determinada população;

- A taxa de desemprego na região carbonífera;

1.3.2 Inferência Estatística

Também conhecida como Estatística Indutiva, é a subárea da estatística que faz

A inferência estatística tem utilização constante no mercado de trabalho, princi-

▪ E, afinal, o que se entende por inferência?

De acordo com Crespo ( 2009, p. 3), “a coleta, a organização e a descrição dos

Pesquisas mais complexas podem trabalhar com as três

Figura 1 – Interação das Três Subdivisões Estatística

Fonte: Costa Neto (2.002, p. 4).

▪ então que tal começar o módulo 2 para conhecer

• aprender o verdadeiro significado de uma das áreas da matemática aplicada: a

1) Com base na leitura do módulo 1, desenvolva as seguintes questões, individu-

a) Como é descrito o termo estatística? Qual seu significado real?

c) Quando se deve fazer uso, principalmente, da Estatística Descritiva?

d) A média bimestral dos alunos do Terceiro Ano do ensino médio, da escola X,

2) Atualmente, qual é o órgão responsável pela montagem das estatísticas oficiais

Por quê? Justifique sua resposta.

Conceitos básicos aplicados à

▪ Afinal, o que significam esses termos?

Para Galliano (1979, p. 6), “método é um conjunto de etapas, ordenadamente

2.1.2 Métodos Científicos

Entre os métodos científicos se encontram os métodos experimentais e os esta-

2.1.2.1 Método Experimental

Por exemplo: a vacina da gripe A é resultado do experimento de alguns vírus por

2.1.2.2 Método Estatístico

Por exemplo, qual a viabilidade ou não do lançamento de um curso de informáti-

População também conhecida como universo refere-se ao conjunto de todos