Livro - Estatistica
Livro - Estatistica
Livro - Estatistica
Estatística
Criciúma
2014
SATC — Associação Beneficente da Faculdade Virtual SATC
Indústria Carbonífera de Santa Catarina Coordenador
Presidente de Honra Suenoni Paladini
Ruy Hülse Assessoria Pedagógica e de Capacitação
Diretor Executivo Christian Deboita Medeiros
Fernando Luiz Zancan Jaqueline Marcos Garcia de Godoi
Diretor Administrativo Financeiro Supervisor de Conteúdo
Vanderlei Antônio Milioli Cristiane Gonçalves Dagostim
Diretor de Relações Corporativas Diagramação e ilustrações
Iraide Antônio Piovesan Amanda Rodrigues Anselmo
Apresentação ...................................................................................................... 7
Unidade 1
■ Conhecendo um pouco da estatística ........................................................9
Módulo 1 – Introdução à estatística ................................................................. 11
Módulo 2 – Conceitos básicos aplicados à estatística ....................................... 21
Módulo 3 – Análise exploratória de dados I ..................................................... 31
Módulo 4 – Amostragem ................................................................................. 41
Unidade 2
■ Análise exploratória de dados 2 .............................................................. 67
Módulo 5 – Escalas e outras medidas estatísticas ............................................ 69
Módulo 6 – Tabelas estatísticas ........................................................................ 83
Módulo 7 – Gráficos estatísticos ...................................................................... 91
Unidade 3
■ Distribuição de frequência .................................................................... 117
Módulo 8 – Apresentação tabular e gráfica de uma distribuição de frequência ..... 119
Módulo 9 – representação gráfica de uma distribuição de frequência.............137
Unidade 4
■ Medidas de posição e de dispersão e estimação .................................... 155
Sumário
Unidade 5
■ Correlação e regressão linear ................................................................ 199
Módulo 13 – Correlação e regressão ............................................................. 201
Unidade 6
■ Teoria da probabilidade ........................................................................ 219
Módulo 14 – Probabilidade ........................................................................... 221
Módulo 15 – Distribuições de probabilidade ................................................. 247
Módulo 16 – Modelos probabilísticos ........................................................... 261
Unidade 7
■ Inferência estatística ............................................................................ 281
Módulo 17 – Estimação ................................................................................. 283
Módulo 18 – Testes de hipóteses ................................................................... 293
Unidade 1 5
Apresentação
Caros alunos, nós não podemos confundir o que realmente envolve a área da es-
tatística, para muitos, é apenas a análise dos dados, o que não está correto. A área
da estatística engloba todo um processo, desde a fase de planejamento de uma
pesquisa; a coleta dos dados; a análise dos dados, chegando à interpretação dos
dados que servirão para auxiliar os gestores de empresas na tomada de decisões.
Esta poderá gerar novos produtos, auxiliar a ganhar de concorrentes, aumentar a
produtividade, diminuir perdas de matéria-prima, identificar pontos positivos e
negativos nos negócios com o intuito de melhorar processos, entre outros.
No dia a dia, as pessoas - ao lerem jornais e revistas - se deparam com dados es-
tatísticos que precisam interpretar a fim de tirar suas conclusões. Esse é um fato
que vem crescendo consideravelmente, tanto na vida pessoal como profissional,
levando as pessoas a buscarem conhecer técnicas e ferramentas estatísticas para
seu melhor entendimento e até mesmo crescimento profissional.
Vamos em frente?!
Unidade 1 7
Unidade 1
Conhecendo um pouco da
estatística
Nesta unidade, você irá se familiarizar com a área da
Estatística. O objetivo aqui é apresentar definições básicas
com terminologias aplicadas nesta área matemática, dando-
lhe os subsídios teóricos necessários para contribuir com o seu
aprimoramento. Esta parte também mostrará como a estatística
está subdividida, algumas das suas aplicações no mercado de
trabalho, os tipos de variáveis possíveis de serem aplicadas,
entre outros assuntos relevantes a sua aplicabilidade.
Unidade 1 9
Módulo 1
Introdução à estatística
Para pôr em prática qualquer teoria que seja, faz-se ne-
cessário conhecer o ontem, o hoje e buscar um futuro provável,
não é mesmo? Pois bem! Na área da estatística não poderia ser
diferente. Então, neste primeiro momento serão apresentadas al-
gumas informações da área, com sua breve história, subdivisões
e como os profissionais estão atuando e poderão vir a atuar nesta
parte da ciência exata.
Unidade 1 11
1.1 Um breve histórico
A estatística é uma área da matemática que vem sendo utilizada por nós há mui-
tos e muitos anos, às vezes, de forma correta; em alguns casos, porém, com o
abuso de dados estatísticos distorcidos, quando não equivocados, errados.
Na idade média, essa ciência já podia ser percebida na área tributária. Porém,
somente a partir do século XVI, é que tivemos os primeiros números relativos
e as primeiras tábuas e tabelas sendo utilizadas para registrar os fatos sociais
ocorridos na época, como: registros de casamentos e acontecimentos religiosos.
(CRESPO, 2009).
A palavra estatística detem origem latina, como seu radical STATUS (significa
ESESTADO), logo, o termo estatística sigsignifica: o ESTUDO DO ESTADO
(BRUNI, 2008).
12 Unidade 1
Hoje, o IBGE - Instituto Brasileiro de Geografia e Estatística - é o órgão res-
ponsável pela montagem das estatísticas oficiais que atendem aà necessidades de
diversos segmentos da sociedade civil, bem como dos órgãos das esferas gover-
namentais: municipal, estadual e federal.
Unidade 1 13
em tratamentos e medicamentos, buscando melhorias na saúde municipal, esta-
dual e até mesmo nacional, quando não mundial.
+ LEITURA
Acesse a Internet e realize – por meio de site de busca – uma pesquisa por “aplicações da
estatística nas engenharias” para conhecer outros exemplos do que está sendo realizado e o
que você pode fazer com a estatística.
14 Unidade 1
Mas você deve estar se perguntando: quando
se deve fazer uso dessa subárea da estatística,
certo?
Deve ser aplicada, quando você tiver ao seu alcance um grande número de da-
dos, dificultando a conclusão do estudo em questão. Assim, ao aplicar técnicas
descritivas, por meio de tabelas e gráficos, você conseguirá reduzir ao máximo
as informações geradas, conseguindo interpretar e chegar a algumas conclusões.
- Entre outros.
Unidade 1 15
Sendo assim, é importante adquirir conhecimentos para lidar com essas técni-
cas e procedimentos estatísticos que permitam dar ao interessado um grau de
confiabilidade nas afirmações que faz à população, baseadas nos resultados das
amostras. Em outras palavras, saber trabalhar a área de inferência estatística é
relevante para atuar no mercado de trabalho.
DICA
1.3.3 Probabilidade
Esta área pode ser compreendida como uma teoria matemática que serve para
descrever os fenômenos aleatórios, fenômenos em que estão presentes algumas
incertezas.
Como, por exemplo: se você jogar um dado de forma honesta inúmeras vezes,
nunca poderá garantir qual será o próximo resultado antes do próximo lança-
mento. O mesmo ocorrerá ao jogar uma moeda, pois as possibilidades são incer-
tas, pode cair cara ou coroa, não é mesmo?
Resumindo, pode-se dizer que a probabilidade é a subárea que foca seus estu-
dos nos riscos e acasos em futuros eventos, determinando se é ou não possível
acontecer tal situação. Por isso, sua origem com os jogos de azar, nos quais já se
criavam estratégias para vencê-los (BRUNI, 2008).
16 Unidade 1
Posteriormente, abordaremos essa área com maiores detalhes por ser de extrema
relevância na engenharia.
Estatística Probabilidade
Descritiva
Inferência
Estatística
Unidade 1 17
Adaptado. As empresas públicas e privadas buscam profissionais que saibam tra-
balhar com dados para geração de novas informações, que demonstrem habili-
dades para lidar com eles, opinando - quando possível e viável for - com novos
conhecimentos para melhorias e ampliações de mercado.
Para que você não seja apenas mais um usuário, é importante saber lidar com
estatística,
Síntese do módulo
Neste módulo, você teve a oportunidade de:
• conhecer um breve histórico da área, como ela pode ser aplicada no dia a dia
por profissionais diretos e indiretos; e
• estudar suas subdivisões, o que lhe permitiu conhecer a diferença entre a esta-
tística descritiva, a inferência estatística e a probabilidade.
18 Unidade 1
ATIVIDADES
I) Descritiva
II) Probabilística
III) Inferencial.
c) ISSO
d) IBGE
e) MEC
Unidade 1 19
3) É correto afirmar que, no decorrer de uma pesquisa, enquanto a coleta, a or-
ganização e a descrição dos dados estão a cargo da Estatística Indutiva ou In-
ferencial, a análise e a interpretação desses dados ficam a cargo da Estatística
Descritiva?
( ) SIM ( ) NÃO
20 Unidade 1
Módulo 2
Unidade 1 21
2.1 Termos estatísticos
No decorrer da leitura deste livro e ao estudar estatística, você lerá muito a res-
peito de: 1) métodos; 2) métodos científicos; 3) população; 4) amostra; 5) parâ-
metros e outros termos.
2.1.1 Métodos
De forma simplificada, pode ser compreendido como um meio eficaz para alcan-
çar determinada meta.
Este método costuma ser bastante utilizado pelos físicos e químicos em suas ex-
periências.
22 Unidade 1
O método experimental é o método em que o pesquisador analisa o problema,
elabora suas hipóteses, realiza algumas experiências (testes), manipulando (con-
trolando) as variáveis referentes ao estudo e, na sequência, avalia as relações ob-
servadas entre causas e efeitos do fenômeno estudado.
Na prática, você pode conceituar método estatístico como uma técnica que tem
o objetivo de estruturar, organizar os momentos (fases, etapas) que precisam ser
estabelecidos ao realizar uma observação estatística.
Todas as variações precisam ser pontuadas, analisadas para se chegar a uma con-
clusão, por exemplo: o número de idosos interessados, o preço dos cursos ofe-
recidos na mesma região, a disponibilidade de horários. Tudo isso precisa ser
analisado, pois surtirão efeitos positivos ou negativos e auxiliarão a decidir se
vale a pena oferecer ou não o curso.
2.1.3 População
Unidade 1 23
- Os alunos aprovados no Vestibular 2013-1, da SATC;
2.1.4 Amostra
- Entre outros.
DICA
24 Unidade 1
Este assunto será abordado melhor na próxima unidade.
▪ Convite à reflexão:
Claro que não! Cuidado, nem sempre que aparece o termo todos signifi-
ca população!
2.1.5 Parâmetros
Os parâmetros são medidas usadas na área da Estatística para designar alguma
característica descritiva dos elementos da população (BARBETTA, REIS e BOR-
NIA, 2008). Como exemplos, pode-se citar:
- Entre outros.
Unidade 1 25
Existem outros termos relevantes na área da estatística que precisam ser compre-
endidos para se ter qualidade no trabalho, mas esses termos serão apresentados
mais tarde, no decorrer deste livro.
Agora, para fecharmos o módulo em estudo, vamos conhecer quais fases você
precisará percorrer ao desenvolver uma pesquisa?
a) Definição do problema;
b) Planejamento;
c) Coleta de dados;
Para facilitar o processo, ainda podemos resumir esse processo em cinco fases
(GESSER e DALPIAZ, 2007):
a) Coleta de dados;
b) Crítica dos dados;
26 Unidade 1
Primeiramente, define-se o problema a ser pesquisado; na sequência se faz a co-
leta dos dados relevantes ao problema; podendo estes dados ser do tipo:
A coleta direta ocorre quando os dados coletados são obtidos via registros obri-
gatórios, ou por meio de inquéritos e questionários, aplicados pelo próprio pes-
quisador interessado. São exemplos de informativos obrigatórios: as certidões de
óbito, casamento, nascimento, entre outros.0
As coletas quando do tipo diretas podem ser classificadas pelo fator tempo em
contínuas, periódicas ou ocasional. Será:
Após realizar a coleta dos dados, direta ou indiretamente, se faz necessária a crí-
tica desses dados para que possam ser evitados, ou até mesmo eliminados, re-
sultados de pesquisas com erros gravíssimos na conclusão de um trabalho, erros
estes causados, muitas vezes, por falta de percepção e atenção por parte dos pes-
quisadores ao selecionar os dados.
Unidade 1 27
to, conforme os critérios de classificação pré-definidos, podendo ser realizado
manualmente ou de forma eletrônica (o que hoje tem sido mais utilizado pelas
empresas).
Após apresentação dos dados tabulados, se faz a análise dos resultados obtidos
por meio dos métodos estatísticos definidos. Para fechar o ciclo, tiram-se as de-
vidas conclusões e até mesmo previsões empresariais. Estas deverão ser docu-
mentadas por profissionais com conhecimento, não necessariamente o gerente
ou um graduado em estatística. O responsável pela pesquisa então documenta o
resultado para que os possíveis interessados possam fazer uso dele para melho-
rias ou novos investimentos, tais como: lançamentos de processos e produtos ao
precisar tomar decisões.
Síntese do módulo
Neste módulo, você aprimorou seus conhecimentos com alguns termos estatísti-
cos de suma relevância para a compreensão dos próximos capítulos, no que tange
à estatística na teoria, possibilitando aplicá-la na prática.
28 Unidade 1
ATIVIDADES
Unidade 1 29
3) Você estudou que um processo estatístico aborda cinco fases, atento a esta
afirmação, responda:
d) Como pode ser classificada, de acordo com fator tempo, a coleta direta, isto é,
quando for obtida diretamente da fonte?
30 Unidade 1
Módulo 3
Vamos nesta!
Unidade 1 31
3.1 Variáveis
- Quantitativas.
32 Unidade 1
Essas variáveis ainda podem ser subdivididas em nominais e ordinais.
Serão nominais quando não apresentarem qualquer ordem entre seus valores
(MAGALHÃES e LIMA, 2010).
DICA
Idade, número de filhos, salário dos funcionários são também exemplos de
variáveis quantitativas, pois são expressos em números.
Unidade 1 33
DICA
As discretas são aquelas variáveis que podem assumir um número finito de
valores do conjunto de números inteiros. Já as variáveis contínuas são vari-
áveis que podem assumir qualquer valor pertencente ao conjunto dos números reais.
Variável Variável
Variável Qualitativa Variável
População Quantitativa Quantitativa
Nominal Qualitativa Ordinal
Contínua Ordinal
Professores Sexo Escolaridade Idade; Altura Nº de filhos
Qualidade do Quantidade em
Brinquedos Caro ou barato Preço em R$
produto estoque
Fonte: Autora
34 Unidade 1
Ao acessar o site do IBGE, você consegue visualizar a população brasileira entre
os anos de 1980 a 2010, por exemplo. Mas para que isso seja possível, a equipe
responsável precisou – em um primeiro momento – identificar a população, ou
seja, o total de habitantes no país em cada ano em estudo, conforme mostra o
Gráfico 1.
Existem populações que não são viáveis ou são impossíveis de serem estudadas;
às vezes, por motivos operacionais; outras vezes; de tempo, econômico, ético,
entre outros; nestes casos, trabalha-se com amostras da população. Por exem-
plo, analisar todas as águas no mar do Balneário Rincão para verificar se está
poluída é um processo inviável, tanto em questões econômicas como operacio-
nais, logo se faz essa pesquisa com uma amostra da água.
Unidade 1 35
As amostras podem ser compreendidas como parte, subconjunto do universo
estatístico, dos quais serão extraídos alguns dados. São partes significativas dos
elementos que contêm características comuns ao interesse da pesquisa, que seja
representativa ao estudo.
Por exemplo:
Para saber se uma macarronada está boa, você não precisa degustar tudo, basta
experimentar uma parte, esta se chama amostra.
36 Unidade 1
Esses objetos (dados estatísticos) também podem ser visualizados na tabela 3.
Outro exemplo: Vamos supor que você queira saber quantos por cento da
população criciumense são torcedores do time do Criciúma (Tigre).
Mas para que essas situações não ocorram, o pesquisador precisa definir uma
amostra representativa e, para isso, se faz uso de técnicas estatísticas, como
amostragem. Este assunto será discutido no próximo módulo.
Unidade 1 37
Síntese do módulo
ATIVIDADES
a) Conjunto de animais.
b) Conjunto de observações.
38 Unidade 1
menos uma característica em comum.
Unidade 1 39
40 Unidade 1
Módulo 4
Amostragem
Ao se realizar uma pesquisa, por questões econômicas,
éticas e outras, em alguns casos, faz-se necessário estudar
todos os elementos da população, mas na sua maioria,
trabalha-se com parte deste universo. Porém, para que essa
parte coletada para estudo seja representativa, necessita-
se que algumas técnicas sejam aplicadas. A essas técnicas
estatísticas damos o nome de amostragem e censo. ■
Vamos conhecê-los?
Unidade 1 41
4.1 Amostragem e censo
O que difere essas técnicas são os elementos envolvidos na coleta de dados. En-
quanto no censo se analisa todos os elementos da população individualmente, na
amostragem, trabalha-se com parte significativa deste universo que tenha condi-
ções de representar o todo.
Você deve estar se perguntando: quando devo usar Censo e quando devo usar
Amostragem. Vejamos:
Primeiro, é preciso analisar o tipo de pesquisa que irá desenvolver e quais seus
objetivos. Nos casos em que a população é muito grande ou infinita, o tempo de
pesquisa é curto, almeja-se um resultado rápido e, principalmente, quando os
recursos financeiros disponíveis para aplicar a pesquisa são escassos, os especia-
listas sugerem a aplicação da amostragem.
Mas, conforme alerta Barbetta, Reis e Bornia (2008, p. 26), “a amostragem preci-
sa ser feita com critérios, pois pretendemos ter amostras que permitam, a partir
de uma análise estatística apropriada, obter conclusões satisfatórias sobre toda a
população.”
Amostragens são técnicas utilizadas para garantir, tanto quanto possível, o acaso
ao escolher a amostra.
42 Unidade 1
Uma amostragem pode ser aplicada de várias formas, dependendo do conheci-
mento que os pesquisadores têm da população, quais recursos estão disponíveis
para o estudo em questão, entre outros fatores. Basicamente, a estatística conta
com dois métodos de amostragem. Vamos estudá-los?
Vamos estudá-los?
c) Amostragem Sistemática; e
Unidade 1 43
avulso, sem critérios de seleção.
Por exemplo: Para verificarmos qual é o editor de texto entre o Microsoft Word,
BrOffice.org Writer e o Google Writely mais utilizado em um universo estatístico
de 1000 usuários, se faz uma seleção aleatória (sorteio) de 10% dos usuários e
obtém-se uma amostra de 100 usuários, os quais responderão à entrevista e assim
se chegará a um dos editores apresentados como sendo o mais utilizado.
Outro exemplo prático pode ser estudado por meio da seguinte suposição:
4 – Mexa a embalagem com os papéis para misturar bem e retire, um a um, nove
papéis numerados para formar a amostra de 10% da população estudada; e
44 Unidade 1
Com o intuito de facilitar a vida dos pesquisadores, foi elaborada uma Tabela de
Números Aleatórios, na qual os dez algarismos de 0 a 9 são disponibilizados ao
acaso nas linhas e colunas, conforme mostra o anexo 1.
Assim, para entender como funciona a amostragem aleatória simples com uso da
tabela de números aleatórios, vamos rever o exemplo trabalhado anteriormente:
Vamos supor que você queira avaliar o conhecimento de estatística adquirido pe-
los acadêmicos das 1ª fases dos cursos de Engenharia de uma Faculdade, no final
do semestre 2012-2. Ao invés de aplicar uma prova nos 90 alunos matriculados
na disciplina, você poderá trabalhar com uma amostra de 10% dos acadêmicos
matriculados, usando a tabela de números aleatórios:
1 – Numere os acadêmicos de 01 a 90
2 – Adote, para este exemplo, a 18ª linha da tabela (anexo 1), mas não esqueça a
escolha da linha, coluna é combinada antes de iniciar o processo.
Unidade 1 45
número da população é o 90 e, esse possui dois algarismos;
Atento à tabela (anexo 1), você encontrará os números: 61; 02; 01; 81; 73; 92; 60;
66; 73; 58; 53; 34;
Exemplo prático:
46 Unidade 1
Retomando o exemplo tratado no item amostragem aleatória simples e supon-
do que dos 90 acadêmicos da 1ª fase dos cursos de Engenharia que cursaram a
disciplina de estatística, 54 sejam do sexo masculino e 36 do sexo feminino, para
obter uma amostra estratificada proporcional, trabalha-se, neste caso, com dois
estratos: o do sexo masculino e o do sexo feminino, e uma amostra de 10% dos
acadêmicos, conforme mostra à Tabela. 4:
Masculino 54 10 x 54
100
= 5,4 5
Feminino 36 10 x 36
100
= 3,6 4
Total 90 10 x 90
100 = 9,0 9
Fonte: Crespo (2009, p. 13), adaptada
57; 28; 92; 90; 80; 22; 56; 79; 53; 18; 53; 03; 27; 05 e 40.
Unidade 1 47
Agora, relaciona-se o número aos acadêmicos e aplica-se a prova de conheci-
mento com amostra de 10% da população para inferir um parecer final.
▪ Convite à reflexão:
▪ Você entendeu a diferença entre a estratificada e a
aleatória simples?
▪ Na aleatória simples corremos o risco de entrevistar
mais homens do que mulheres, enquanto que na es-
tratificada será selecionado aleatoriamente, porém de
forma proporcional, a cada grupo de sexo.
c) Amostragem Sistemática
48 Unidade 1
Para exemplificar, considere o problema de extrair uma amostra sistemática de
tamanho 5 da seguinte população de acadêmicos matriculados em Cálculo 1, na
turma X, sendo identificado cada aluno com seu número de registro do diário do
professor, conforme relação dada a seguir:
Outro exemplo:
Suponhamos um loteamento contendo 150 casas, das quais se deseja obter uma
amostra formada com 15 casas, ou seja, uma amostra de 10%.
Unidade 1 49
ado foi o 2, adota-se pelo lado direito ou esquerdo (o que for decidido) a 2ª casa
do loteamento; a 12ª; a 22ª; a 32ª; a 42ª; a 52ª; etc até formar a amostra com 15
elementos, retornando ao início do loteamento, pelo lado contrário.
Suponha, por exemplo, que você queira realizar uma pesquisa nas escolas esta-
duais do Estado de Santa Catarina para verificar como está o nível de satisfação
profissional dos professores do quadro efetivo, nos últimos dois anos.
50 Unidade 1
DICA
a) Amostragem Acidental;
b) Amostragem Intencional; e
a) Amostragem Acidental
Neste método, o pesquisador busca ser o mais aleatório possível, mas nem sem-
pre consegue, pois a característica desta amostragem é a formação da amostra
com elementos escolhidos ao acaso, acidentalmente, como o próprio nome in-
dica ou a esmo. (GESSER; DALPIAZ, 2007)
DICA
Por mais que a amostragem acidental em algumas situações pareça produzir
uma amostra similar a uma amostra obtida com o método de amostragem
aleatória simples, nem sempre isso ocorre, esses métodos são diferentes.
Unidade 1 51
Basta pensar no exemplo:
▪ Convite à reflexão:
▪ Sabe-se que a amostragem aleatória simples ga-
rante que cada elemento da população tenha a
mesma probabilidade de fazer parte da amostra,
então pode haver viés nos resultados da pesquisa?
A amostragem por cotas é muito parecida com a estratificada, porém nesta não
se aplica sorteio. Neste método, os elementos da população são subdivididos em
grupos e, consequentemente, as amostras formadas com número proporcional
ao tamanho dos subgrupos. (GESSER; DALPIAZ, 2007)
52 Unidade 1
Durante as campanhas eleitorais é comum ouvirmos falar em tendências elei-
torais de acordo com o IBOPE, mas como são realizadas essas pesquisas? Você
saberia dizer?
Para que a amostra definida seja realmente representativa e confiável, alguns es-
pecialistas costumam usar um processo com quatro fases que defina o tamanho
da amostra a ser trabalhada. Porém, esse conteúdo teoricamente ainda apresenta
certas desavenças e costuma, na prática, ser diferenciado para cada pesquisa de
acordo com o conhecimento dos profissionais envolvidos.
DICA
O E0 (erro) deverá ser usado em forma de coeficiente e nunca em %.
Por exemplo: 6% =
6 = 0,06.
100
Unidade 1 53
2º) Calcula-se a amostra mínima através da fórmula: n = N . n0
N + n0
Glossário
n0 = Tamanho referente à amostra ideal (conhecida como primeira aproximação);
E0 = Refere-se ao erro amostral permitido, ou seja, tolerável;
N = Tamanho da população; e
n = Tamanho da amostra propriamente dita.
54 Unidade 1
Logo:
n = 8516 . 400 =
3406400 = 382,05 = 382 acadêmicos
8516 + 400 8916
x = 38200 x = 4,49%
8516
4º) Agora, aplica-se o Estimador a cada estrato, (estrato vezes o estimador), ou
seja, multiplica-se o número de acadêmicos de cada curso pelo estimador:
Design Gráfico =
arredondando 39 acadêmicos.
Unidade 1 55
Aplicando esse cálculo para cada curso, obtêm-se a amostra, conforme mostra a
Tabela 6:
56 Unidade 1
Síntese do módulo
ATIVIDADES
Unidade 1 57
2) Os dados a seguir referem-se a uma população formada por 140 notas (pon-
tuação geral) resultantes da aplicação de uma prova de concurso para eletricista:
3) Suponha que uma população apresenta-se dividida conforme sua classe so-
cial: baixa, média e alta, respectivamente, com tamanhos: n1 = 40, n2 = 60 e n3 =
100. Sabendo-se que ao ser realizada uma amostragem do tipo estratificada, 15
elementos da amostra foram retirados do 3º estrato, determine o número total de
elementos da amostra.
58 Unidade 1
Exercícios complementares
Para fecharmos a unidade 1, sugiro que você exercite seus conhecimentos ad-
quiridos, desenvolvendo as atividades complementares com questões baseadas
em provas como as do ENADE; concursos do IBGE, CELESC e outros, sempre
atento ao apoio que a Estatística nos dá para tomada de decisões.
Unidade 1 59
História A História B
60 Unidade 1
3) Com objetivo de promover a inclusão digital, os países em desenvolvimento
buscam investir em tecnologias para uso da comunidade em geral. Um dos indi-
cadores empregados tem sido o número de computadores que estão conectados
à Internet. Observe como se deu a evolução do número de computadores conec-
tados à Internet (hosts) nos três países que lideram o setor na América Latina,
durante o período de 2000 a 2004, analisando a tabela e gráfico a seguir:
Tabela – Número de computadores conectados à Internet,
período 2000 a 2004
2000 2001 2002 2003 2004
Argentina 142470 270275 465359 495920 742358
Brasil 446444 876596 1644575 2237527 3163349
México 404873 559165 918288 1107795 1333406
Fonte: Internet Systems Consortium, adaptada.
3000000
2500000
2000000 Argentina
Brasil
1500000
México
1000000
500000
0
1999 2000 2001 2002 2003 2004 2005
a) Brasil e Argentina.
b) México e Argentina.
c) Argentina e México.
d) Argentina e Brasil.
e) México e Brasil
Unidade 1 61
4) População refere-se ao conjunto de indivíduos, objetos observados, portado-
res de pelo menos uma característica em comum. Mas, nem sempre se conse-
gue trabalhar com todos esses elementos, por questões financeiras e de tempo,
estatisticamente, faz-se necessário estudar amostras significativas, subconjunto,
parte da população. Com foco nos conceitos descritos, leia as sentenças a seguir
e identifique a população e amostra referente a cada item:
Para dar início ao processo como deverão ser classificadas as variáveis envolvi-
das?
62 Unidade 1
6) (Adaptado, ENADE 2011) A Educação a Distância (EaD) é a modalidade de
ensino que permite que a comunicação e a construção do conhecimento entre os
usuários envolvidos possam acontecer em locais e tempos distintos. São neces-
sárias tecnologias cada vez mais sofisticadas para essa modalidade de ensino não
presencial, com vistas à crescente necessidade de uma pedagogia que se desen-
volva por meio de novas relações de ensino-aprendizagem.
Unidade 1 63
7) (IBGE, 2.010) Para evitar o grande gasto de tempo e de recursos que haveria se
toda a população tivesse de responder ao questionário completo, o IBGE adota
a técnica de:
64 Unidade 1
Para reduzir os custos de implantação, Pedro poderá trabalhar somente com
4.000 contratos, considerando assim os 40.000 contratos a sua população de in-
teresse. Estando os contratos numerados de 1 a 40.000, com os primeiros 30.000
correspondendo aos contratos em dia financeiramente. Pedro precisa estimar a
média da idade do financeiramente. Por experiência, na área, sabe que a popula-
ção quanto mais jovem, maior é o índice de inadimplência.
Unidade 1 65
Unidade 2
Unidade 2 67
Módulo 5
Tão logo, este módulo irá apresentar os tipos de escalas que os especialistas cos-
tumam utilizar durante o desenvolvimento estatístico, assim como outras medi-
das matemáticas que podem vir a ser aplicadas, como: proporção, índices, coefi-
cientes e outros.
Vamos em frente?!
1
De acordo com Gesser e Dalpiaz (2007, p. 17), “as escalas são séries de unidades que
representam o grau de variação da dimensão que está sendo medida”.
Unidade 2 69
5.1 Escalas estatísticas
a) Escala Nominal
b) Escala Ordinal
70 Unidade 2
mostrada, usando-se: numerais ou ranking.
c)Escala Intervalar
Unidade 2 71
Por meio dessas escalas intervalares, podem-se calcular as medidas de tendência
central, posição, dispersão, correlações e inferências, medidas estas a serem estu-
dadas posteriormente.
d) Escala De Razão
Para construção da escala, define-se um valor como sendo o ponto zero (fixo e
absoluto) e, a partir deste, constroem-se as razões, conforme mostra a Tabela 10.
I ml por frascos fi
1 500 12500
2 750 5000
3 1000 10000
4 1250 7500
5 1500 2500
Fonte: Autora
72 Unidade 2
Usando 500 ml como o ponto zero, pode-se chegar às seguintes razões com os
demais pontos para construir a tabela da escala de razão final:
I ml por frascos fi
1 1 12500
2 1,5 5000
3 2 10000
4 2,5 7500
5 3 2500
Fonte: Autora
Idade, peso, renda familiar, pressão, entre outros, são exemplos também de vari-
áveis que podem ser representadas em escalas de razão.
Vamos em frente!
Unidade 2 73
5.2.1 Dados absolutos
Porém, mesmo sendo apresentados na íntegra, esses dados não conseguem re-
fletir de imediato as suas conclusões numéricas, tão logo, faz-se necessário es-
tatisticamente, que os profissionais busquem melhores informações nos dados
relativos.
a)Proporções:
74 Unidade 2
Ao analisar a Tab. 12, pode-se comparar os grupos e perceber que no grupo A
existem mais católicos do que no grupo B; em contrapartida, o grupo B possui
mais evangélicos comparados ao grupo A. Essas comparações são facilitadas na
estatística graças ao cálculo proporcional.
9 = 0,128 = 0,13.
70
b) Porcentagens
Para entender a porcentagem, vamos analisar a Tab. 12, ampliada por meio do
exemplo a seguir:
Unidade 2 75
DICA
Na porcentagem, o total da distribuição resulta em 100 (%), enquanto a pro-
porção trabalha com total igual a 1,00. Preste atenção, ok!
c) Razão
200
Ao calcular a razão entre os favoráveis e os contra obteve: 250 = 0,8 , ou
seja, a cada 0,8 dos funcionários a favor do horário de intervalo existe 1 fun-
cionário contra. A razão pode ser calculada também por meio da simplificação
matemática: 200 = 20 = 4 a cada 4 funcionários favoráveis existe 5 contra o
250 25 5
Coeficientes
▪ Convite à reflexão:
76 Unidade 2
d) Coeficientes
número de nascimentos
- Coeficiente de natalidade =
população total
número de óbitos
- Coeficientes de mortalidade =
população total
Coeficientes educacionais:
Por exemplo:
e) Taxas
As taxas são os coeficientes multiplicados por 10; 100; 1000... , ou seja, potên-
cias de 10.
Unidade 2 77
1.000, obterá o que chamamos de taxa de natalidade. O mesmo se aplica à taxa
de mortalidade; já à taxa de evasão escolar, multiplica-se o coeficiente de evasão
escolar por 100.
Texto complementar
f) Índices
Entre os índices existentes, iremos nos ater aos índices mais utilizados: quo-
ciente intelectual; densidade demográfica; e índices econômicos, formulados
a seguir:
* Densidade demográfica =
população
superfície
78 Unidade 2
* Índices econômicos:
° Produção per capita = valor total da população
população
Por exemplo: Suponha que você queira saber qual foi o índice de densidade
demográfico apresentado por Minas Gerais, em 1992, de acordo com o IBGE?
Densidade demográfica =
=
população = 15 . 957,6 = 0,0272024 . 1000 = 27,2 hab/km2
superfície 586 . 624
5.3 Arredondamento de números
Existem situações estatísticas em que os resultados são apresentados com núme-
ros decimais (com casas após a vírgula); e nem sempre o almejado é a quantidade
de dígitos expostos. Logo, nestes casos, o correto é aplicar técnicas matemáticas
de arredondamento, transformando-os em números inteiro, decimal, centésimo
e assim por diante.
Unidade 2 79
das: quando inteiro (não possui casas após a vírgula; decimal (1 casa); centésimo
(2 casas) e; milésimo (3 casas). Na sequência, identificam-se os dígitos remanes-
cente e o dígito considerado e, assim, aplica-se uma das três regras a seguir:
Glossário
a) Quando o dígito considerado for maior ou igual a 6, usa-se a regra por exces-
so, acrescentando-se ao dígito remanescente uma unidade, conforme mostra o
exemplo:
Dado o número 4,3842, quando arredondado para decimal, torna-se 4,4. Preste
atenção, o número remanescente é o algarismo 4 e o considerado é o 8.
b) Quando o dígito considerado for menor que 5, usa-se a regra por falta, man-
tendo-se o dígito remanescente, conforme mostra o exemplo:
Já quando o dígito considerado for o número 5, faz-se necessário dar atenção aos
dígitos seguidos dele e aplica-se uma das regras a seguir:
80 Unidade 2
- Dado o número 7,38500, quando arredondado para centésimo, torna-se 7,38.
Preste atenção, o dígito considerado é o 5 seguido de números iguais a zero, e o
remanescente é um dígito par ( = 8).
DICA
Não será alterado se o dígito remanescente for par; caso contrário, quando o
remanescente for ímpar, será acrescido de uma unidade.
Síntese do módulo
Neste módulo, foram apresentados os quatro tipos de escalas: nominal, ordinal,
intervalar e de razão; além das medidas estatísticas: proporção, porcentagem, co-
eficientes, taxas, razão. Também foram mostrados os principais índices utilizados
no dia a dia, na área da estatística, permitindo aos gestores realizar comparações
em diferentes grupos, para que, quando cabível for, consigam determinar algu-
mas melhorias de processo e produto, entre outras decisões empresariais. Mas,
para que o estudo ficasse completo, também foram abordados os tipos possíveis
de arredondamento numérico: por excesso, falta e seguido de cinco; de forma
correta e não puramente com aplicação do “achismo”.
Unidade 2 81
ATIVIDADES
a) 3,5450
b) 21,489
c) 6,3552
d) 8,7531
e) 63,823
82 Unidade 2
Módulo 6
Tabelas estatísticas
As tabelas são quadros que servem para apresentar um resumo dos dados ob-
servados na pesquisa. Elas devem mostrar o comportamento das variáveis, da
forma mais simples possível, para que a compreensão dos dados seja facilitada e
benéfica ao estudo.
Unidade 2 83
6.1 Componentes de uma tabela
Para apresentação de dados estatísticos devemos fazer uso de tabelas que con-
templam os elementos:título, cabeçalho, corpo, coluna indicadora, linhas e célu-
las, conforme mostra a FIG. 2:
Glossário
Corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo;
Cabeçalho: parte superior da tabela que traz o conteúdo das colunas (variáveis);
Célula: cada retângulo (espaço específico) para um só dado, como na tabela acima o nú-
mero 50;
Título: Conjunto de informações que relate as respostas: Para?, O quê?, Quando?, Onde?, se
pretende mostrar do estudo em questão. O título deverá aparecer sempre no topo da tabela.
Mas como você pode observar, além dos componentes essenciais, podem apa-
recer os complementares como o total, caso se aplique à situação em estudo
(devendo este aparecer sempre em destaque); o rodapé com a fonte da pesquisa
(identificando o responsável, pessoa física ou jurídica); entre outros.
84 Unidade 2
Texto complementar
• Tabelas simples: quando possuem uma entrada simples (uma variável de entra-
da);
Agora que você já conhece os principais elementos de uma tabela, vamos estudar
os tipos específicos de tabelas e como classificá-las?
Segundo Crespo (2009, p. 18) “denominamos série estatística toda tabela que
Unidade 2 85
apresenta a distribuição de um conjunto de dados estatísticos em função da épo-
ca, do local ou da espécie.”.
As séries estatísticas são classificados em séries:
a) Temporais, históricas ou cronológicas;
b) Geográficas ou de localização;
c) Específicas ou categóricas;
d) Conjugadas ou mistas; e
e) De distribuição de frequências.
86 Unidade 2
c) Nas séries específicas ou categóricas, o conjunto de dados apresenta uma
informação que se altera com a variação do fato, conforme você pode observar
no exemplo da Tabela 16:
Tabela 16 - Número de Telefones em Serviço
em Salvador em 1995
Tipo de Terminal Número
Convencionais 305.701
Residenciais 225.621
Não-Residenciais 49.982
Troncos 21.396
Terminais para PS 82
Tup’s 8620
Fonte: Bruni (2008, p. 17)
DICA
Unidade 2 87
Até o momento, foram estudadas as séries estatísticas que costumam ser empre-
gadas na apresentação de dados qualitativos. Agora, vamos nos ater à série dis-
tribuição de frequência empregada, principalmente, para dados quantitativos.
88 Unidade 2
Síntese do módulo
Neste módulo, você teve a oportunidade de visualizar quais são os elementos es-
senciais ao construir e apresentar uma tabela, entre eles: o título e o corpo e out-
ros e, quais são os complementares que compõem uma tabela; ferramenta esta
de grande valia na apresentação já organizada dos dados coletados durante uma
pesquisa. Ficou a par sobre os possíveis tipos de séries estatísticas: cronológicas,
geográficas, específicas e conjugadas, além da série Distribuição de Frequência
aplicada principalmente para dados quantitativos.
ATIVIDADES
Com base na leitura do módulo 6, desenvolva as seguintes questões, individual-
mente e, na sequência, confira suas respostas ao final do livro.
Unidade 2 89
Responda:
a) Quantas lojas apresentaram um preço de R$52,00?
b) Quantas lojas apresentaram um preço de até R$52,00 (inclusive)?
c) Qual o percentual de lojas com preço maior de que R$51,00 e menor de que
R$54,00?
3) Confeccione, ou seja, construa uma tabela com seus elementos básicos estu-
dados para mostrar que, em determinado curso, o número de alunos matricula-
dos nas 1ª , 2ª e 3ª séries era, respectivamente, 40, 35 e 29, em 2010; e 42, 36 e
32, em 2012.
90 Unidade 2
Módulo 7
Gráficos estatísticos
Os gráficos são figuras que servem para transmitir inúmeras informações con-
tidas em diferentes conjuntos de dados. Essas figuras precisam apresentar sim-
plicidade (evitando excessos de detalhes sem importância), clareza dos dados e
veracidade em relação aos fenômenos estudados.
Unidade 2 91
7.1 Componentes de um gráfico
- No eixo horizontal (eixo das abscissas), a escala cresce da esquerda para direita
e costuma ser disponibilizada embaixo do eixo;
- No eixo vertical (eixo das ordenadas), a escala cresce de baixo para cima e cos-
tuma ser disponibilizada à esquerda do eixo.
- Nos dois eixos, devem estar definidas as variáveis que representam o estudo;
- As linhas auxiliares (grades) para facilitar a leitura nos gráficos, são opcionais.
7.2.1 Diagramas
São os gráficos mais utilizados estatísticamente, pela sua simplicidade e familia-
ridade (BRUNI, 2008). Os dagramas, são gráficos numéricos representados em
duas dimensões (plano cartesiano).
92 Unidade 2
a) Gráfico de Linha: faz-se uso de uma linha poligonal para representar uma
série estatística, sendo essas geralmente temporais (histórica e/ou cronológica).
Unidade 2 93
b) Gráfico de Colunas ou Barras: faz-se uso de retângulos colocados vertical-
mente, quando em colunas e, horizontalmente, quando em barras, para represen-
tar séries estatísticas, sendo estas geralmente específicas, temporais e geográficas.
DICA
“Quando em colunas, os retângulos têm a mesma base e as alturas são pro-
porcionais aos respectivos dados; enquanto, quando em barras, os retângulos
têm a mesma altura e os comprimentos são proporcionais aos respectivos dados.” Crespo
(2009, p.33)
Exemplos:
• Gráfico em Colunas:
94 Unidade 2
Gráfico 4 - Produção Brasileira de
Carvão Mineral Bruto – 1989 – 92
20.000
18.000
16.000
14.000
12.000
10.000 Quantidade Produzida
8.000 (1.000 t)
6.000
4.000
2.000
0
1 2 3 4
Fonte: Crespo (2008, p. 34)
• Gráfico em Barras:
Unidade 2 95
Gráfico 5 - Exportações Brasileiras – Março 1995
São Paulo
Minas Gerais
Paraná
Santa Catarina
Além dos gráficos em colunas ou barras simples, alguns momentos exigem que
os pesquisadores façam uso de gráficos em colunas ou barras múltiplas quando
querem representar dois ou mais fenômenos pesquisados, com intuito de com-
pará-los, como mostra o exemplo a seguir:
96 Unidade 2
Gráfico 6 - Balança Comercial do Brasil – 1989 – 93
40000
30000
10000
0
1989 1990 1991 1992 1993
ESTUDO COMPLEMENTAR
Antes de dar continuidade a seus estudos, sugiro que leia as dicas para
a construção de gráficos de colunas e barras, e elabore alguns exemplos usando planilha
eletrônica ou algum software estatístico que conheça para ter um melhor entendimento a
respeito de séries estatísticas e suas representações.
DICA
- Sempre que os dizeres a serem inscritos são extensos, devemos dar preferên-
cia ao gráfico em barras (séries geográficas e específicas). Mas, se preferirem o
gráfico em colunas, os dizeres devem ser colocados de baixo para cima, nunca ao contrário.
– Se a série estatística for histórica a ordem a ser observada, deverá ser a cronológica, mas se
geográfica ou categórica, faça uso da decrescente.
Unidade 2 97
c) Gráfico em Setores: faz-se uso de um círculo de 360º, por isso, é conhecido
também como gráfico circular, ou em “pizza”, para representar uma série estatís-
tica, sendo essas geralmente geográficas ou, quando se pretende fazer compara-
ções, usando frequências relativas em porcentagens.
Essa representação é viável quando os valores das variáveis não são extensos, caso
contrário se torna inadequado, de difícil visualização e até mesmo compreensão.
98 Unidade 2
Na sequência, conforme já estudamos, é preciso construir a tabela de distribui-
ção de frequência, para isso, João contou quantos visitantes utilizam cada cate-
goria de provedor:
Tabela 25 - Distribuição de frequência do provedor usado pelos visitantes do site
A 10 25 90
B 17 42,5 153
C 7 17,5 63
D 6 15 54
TOTAL 40 100 360
Fonte: Barbetta, Reis e Bornia (2010, p. 55)
DICA
Quando a frequência relativa já estiver calculada, basta multiplicar por 3,6
para obter o grau a ser usado no gráfico ao invés de aplicar uma regra de
três simples.
A
15%
25% B
18%
C
42%
D
Unidade 2 99
d) Gráfico Polar: faz-se uso do sistema de coordenadas polares para representar
uma série estatística. Esse gráfico é excelente para representar as séries temporais
cíclicas, ou seja, com certa periodicidade, tais como: o consumo de energia elé-
trica dos consumidores do grupo A registrado pela CELESC, em agosto de 2013,
a variação da temperatura em Criciúma durante o final de semana, o número de
passageiros do expresso coletivo ao longo do mês de julho.
4– Trace, a partir do polo (O) central, semirretas passando pelos pontos de divi-
são;
Exemplo:
100 Unidade 2
Gráfico 8 - Precipitação Pluviométrica
Recife – 1993
Janeiro
300
Dezembro Fevereiro
200
Novembro Março
100
Outubro 0 Abril Mm
Setembro Maio
Agosto Junho
Julho
7.2.2 Cartogramas
Esses gráficos são utilizados bastante nas áreas de Geografia, Historia e Demo-
grafia (BRUNI, 2008).
Por exemplo:
Unidade 2 101
Gráfico 9 - Cartograma referente à população residente total por
municípios do Estado do Rio de Janeiro, segundo o Censo Demográfico 2010
ESTUDO COMPLEMENTAR
7.2.3 Pictograma
Em relação ao uso desse modelo de gráfico, Bruni (2008, p. 47) alerta que “devem
estabelecer comparações gerais, devendo ser evitados para interpretar afirma-
ções ou dados isolados.”
102 Unidade 2
Esses gráficos por serem geralmente atraentes e sugestivos, chamando atenção do
público em geral, costumam ser bastante utilizados em propagandas.
Unidade 2 103
Síntese do módulo
Neste módulo foram apresentadas algumas figuras (gráficos estatísticos) que po-
derão ser utilizadas para apresentar dados de uma pesquisa, de forma simples, rá-
pida e eficaz, permitindo aos interessados visualizar, compreender os resultados
obtidos em suas pesquisas, sejam elas formais ou não. Os componentes essenciais
na construção de um gráfico foram abordados, com ênfase à informação de que
eles fazem uso, geralmente, do plano cartesiano, estudado desde o ensino funda-
mental. Foram explanadas também as três tipologias básicas de gráficos quanto a
sua forma, ou seja, os diagramas, cartogramas e pictogramas, cada qual com suas
características próprias e exemplos. Dentre as tipologias, foi dada maior impor-
tância aos diagramas, por serem os mais utilizados estatisticamente na prática,
sendo estes os gráficos: de linhas, de colunas ou barras, de setores ou pizza, e
polar.
ATIVIDADES
104 Unidade 2
2) (UFPE) Os gráficos ilustram a distribuição percentual de energia elétrica no
Brasil dos diversos setores e do setor industrial. Assinale a alternativa incorreta
sobre o consumo de energia elétrica no Brasil:
11%
29%
12%
8%
40%
7%
9%
44%
26%
14%
Outros Público Residencial Comercial Industrial
Unidade 2 105
a) O setor de metais consome mais que o comercial.
b) O setor público consome mais que o de alimentos.
a) 9.536
b) 8.344
c) 7.450
d) 6.556
e) 5.513
60
Porcentagem (%)
50
40
30
20
10
0
Norte Nordeste Sudeste Sul Centro-oeste
Regiões Brasileiras
106 Unidade 2
Para fecharmos a unidade 2, sugiro que você exercite seus conhecimentos ad-
quiridos, desenvolvendo as atividades complementares com questões baseadas
em provas como as do ENADE; concursos do IBGE, CELESC e outros, sempre
atento ao apoio que a Estatística nos dá para tomada de decisões.
1) (ESAF – Receita Federal, 2012) A taxa cobrada por uma empresa de logística
para entregar uma encomenda até determinado lugar é proporcional à raiz qua-
drada do peso da encomenda. Ana, que utiliza, em muito, os serviços dessa em-
presa, pagou para enviar uma encomenda de 25kg uma taxa de R$ 54,00. Desse
modo, se Ana enviar a mesma encomenda de 25kg dividida em dois pacotes de
16kg e 9kg, ela pagará o valor total de:
a) 54,32.
b) 54,86.
c) 76,40.
d) 54.00.
e) 75,60.
Unidade 2 107
Evolução do índice de pirataria de software no
mundo
50
45
40
35
30
25
20
15
10
0
1994 1995 1996 1997 1998 1999 2000 2001 2002
em milhares de dólares
- 400.000
perda de faturamento
60
índice de pirataria
- 300.000
40
- 200.000
20
- 100.000
0 -0
1994 1995 1996 1997 1998 1999 2000 2001 2002
108 Unidade 2
Com base nas informações apresentadas, é correto afirmar que:
b) I e III.
c) II e IV.
d) III e V.
e) IV e V.
Unidade 2 109
trapassar em mais de 5% a demanda contratada, será cobrado um acréscimo na
tarifa (cerca de 3 vezes o valor normal) sobre o montante excedente (ultrapassa-
gem de demanda).
7000
6000
5000
4000
3000
2000
1000
110 Unidade 2
Avaliando os dados apresentados, qual o valor aproximado a ser recomendado
para contratação de demanda, mantidas as condições de consumo apresentadas
no gráfico, de forma a se garantir que não haverá cobrança de ultrapassagem de
demanda dessa unidade consumidora?
a) 4 400 kW
b) 5 000 kW
c) 6 000 kW
d) 6 300 kW
e) 6 600 kW
Unidade 2 111
O canal do Panamá em números
Países que mais usam o Canal Pouco explorado
Como origem ou destino das cargas Cargas destinadas ao Brasil ou dele originadas
Toneladas movimentadas (em milhões)
2,5%
EUA 132,7
Japão 34,5 2,0%
China 23,0
Chile 15,5 1,5%
Canadá 15,4
1,0%
Coréia do Sul 14,2
México 11,5 0,5%
Peru 10,4
Taiwan 10,0 0,0%
1996 1997 1998 1999 2000 2001
Venezuela 9,9
Gráfico I Gráfico II
Gráfico III
a) Conjugada;
b) Distribuição de frequência;
c) Específica;
d) Geográfica;
e) Temporal.
POR QUÊ?
112 Unidade 2
5.2) O gráfico III apresenta uma série estatística do tipo:
a) Conjugada;
b) Distribuição de frequência;
c) Específica;
d) Geográfica;
e) Temporal.
POR QUÊ?
b) Distribuição de frequência;
c) Específica;
d) Geográfica;
e) Temporal.
POR QUÊ?
Unidade 2 113
6) (Adaptado, CESPE – TCDF): Julgue os itens a seguir, assinalando a alternativa
correta e justifique sua resposta quando a opção estiver ERRADA:
6. a) Amplitude total é a diferença entre dois valores quaisquer do atributo.
( ) CORRETO ( ) ERRADO
( ) CORRETO ( ) ERRADO
( ) CORRETO ( ) ERRADO
114 Unidade 2
6. d) A série estatística é cronológica quando o elemento variável é o tempo.
( ) CORRETO ( ) ERRADO
( ) CORRETO ( ) ERRADO
Produzem o
suficiente para o
consumo da
família e vendem
o excedente
27% Não produzem o
suficiente nem para
própria família
11%
Unidade 2 115
Quantas famílias dentre as pesquisadas, produzem, pelo menos, o suficiente para
o seu consumo?
a) 250
b) 370
c) 420
d) 520
Quantas vagas com carteira assinada, a construção civil ofertou a mais do que o
setor agropecuário, no período de janeiro de 2010?
a) 53.746
b) 51.213
c) 50.187
d) 49.953
116 Unidade 2
Unidade 3
Distribuição de frequência
Estatisticamente, a tabela utilizada pelos pesquisadores para garantir
uma melhor compreensão dos dados descritos durante seus estudos
tem sido a série distribuição de frequência, por isso, essa unidade
tratará, em especial, desta abordagem com maiores detalhes.
Em um primeiro momento, será explicado como esses dados
coletados podem ser mais condensados, visto que, no decorrer
de uma pesquisa, encontram-se muitas vezes dados repetidos e,
quando esse número de dados é considerável, torna-se inviável
o uso de tabelas normais. Por isso, recomenda-se o uso de
uma tabela de distribuição de frequência na qual se trabalha
com intervalos ou classes de valores, ao invés de trabalhar
isoladamente todos os dados, poluindo o ambiente descrito.
Na sequência, serão apresentadas as representações gráficas
mais comuns, utilizadas pelos profissionais da área, como
mecanismo para análise e interpretação dos dados coletados,
no que tange a resultados exatos e tendências estatísticas. ■
Módulo 8
Mas quais são os passos para que esses dados se apresentem de forma
organizada?
No decorrer deste módulo, este assunto será tratado com maiores detalhes, será
dado ênfase a sua apresentação em tabelas.
Unidade 3 119
8.1 Tabela primitiva - dados brutos
Nessas tabelas são apresentados os dados coletados durante uma pesquisa na sua
forma real, diretamente, extraídos sem ter sido organizado. Geralmente, esses
dados por si só não apresentam informações ao interessado no estudo. É neces-
sário organizá-los. (CRESPO, 2009)
Para a melhor compreensão dessa temática, sugere-se como base o uso do exem-
plo a seguir:
7,0; 5,0; 6,0; 2,0; 4,0; 8,0; 5,0; 6,0; 3,0; 2,0; 7,0; 5,0; 4,0; 6,0; 2,0; 5,0; 5,0; 5,0; 6,0; 4,0;
5,0; 3,0; 5,0; 3,0; 6,0; 4,0; 5,0; 6,0.
Por meio dos dados brutos, torna-se complexo tirar conclusões, assim, em esta-
tística, costuma-se organizar primeiramente estes dados para facilitar a sua con-
tagem, através do ROL (conjunto ordenado dos dados de forma crescente ou
decrescente).
120 Unidade 3
Porém, a sua apresentação ainda poderá ser melhorada, basta, para isso, na sequ-
ência, agrupar esses dados em classes segundo sua frequência, o que diminuiria
a relação de dados e aumentaria a capacidade de informação; processo este inte-
ressante, principalmente quando se trabalha com grandes amostras.
DICA
Frequência: é o número de vezes que certo valor se repete em um conjunto
de dados.
Unidade 3 121
Mas, como pesquisador, poderá se deparar com situações em que à distribuição
de frequência apresenta-se na forma de distribuição sem intervalos de classe,
nos casos em que a pesquisa se dá por meio de variáveis discretas de variação
relativamente pequena, sendo assim tomado cada valor como um intervalo de-
generado.
x fi (frequência)
2 3
3 3
4 4
5 9
6 6
7 2
8 1
TOTAL 28
Fonte: Autora (dados hipotéticos)
Agora que já conhece como concentrar e resumir melhor os dados de uma pes-
quisa, vamos conhecer quais são os elementos de uma distribuição?
122 Unidade 3
Tabela 30: Estatura de 40 alunos do Colégio A
Para determinar o número de classes (k), você deverá observar o número (n) de
elementos, ou seja:
- se o n
n=> 25: devem ser criadas 5 classes de frequência;
- se o n > 25: o número de classes deverá ser definido por meio de dois procedi-
mentos estatísticos: k = √(n ) ou k = 1 + 3,32 log (n) (fórmula de Sturges).
Unidade 3 123
b) Limites da classe: são os extremos da classe, sendo li o menor número da clas-
se (limite inferior) e o maior número Li o limite superior da classe.
No exemplo da Tab. 30, na 2ª classe 154 158 o l2 é igual a 154 e L2 é 158, com
i = 2.
DICA
Pela resolução 886/66 do IBGE, os intervalos de classe devem se apresenta-
dos na tabela, com o símbolo quando a classe inclui o limite inferior e
exclui o limite superior e quando os dois limites (l e L ) pertencem a classe.
i i
hi = Li - li
No exemplo da Tabela 30, h2 = L2 - l2 h2 = 158 – 154 = 4 h2 = 4 cm.
AT = L (Max) – l (min)
AA = x (máx.) – x (min.)
124 Unidade 3
f) Ponto médio de uma classe: é a média aritmética da classe, ou seja, o ponto
que divide o intervalo da classe em duas partes iguais.
li + Li
2
No exemplo da Tabela 30, o ponto médio é dado por
A soma de todas as frequências pode ser apresentada pela letra sigma (o símbolo
de somatório).
k
∑i =1
fi = n
ou simplesmente: ∑ fi = 40
Os intervalos (h) das classes são consequência da amplitude total dos dados, ou
seja:
Unidade 3 125
Com o número de classes e o intervalo definido, constrói-se a tabela de frequ-
ência partindo do menor valor e somando gradualmente o intervalo obtido para
cada uma das classes até incluir o último valor.
a) Absoluta;
b) Relativa;
c) Acumulada; e
d) Acumulada Relativa.
126 Unidade 3
8.3.1 Absoluta: quando mostra o número de elementos (indivíduos) de uma
classe, como descrito pela Tab. 31. Essas frequências absolutas, por notação, cos-
tumam serrepresentadas por fi (frequência do elemento i). Com o somatório des-
sas frequências,, lembre-se: obtêm-se o número total dos dados.
∑ fi = n
Sempre que estiver lidando com variáveis quantitativas, ainda se costuma traba-
lhar com mais dois tipos de frequência, as conhecidas também como comulativas
além de acumuladas.
8.3.3 Acumulada: obtida pelo total das frequências de todos os valores in-
feriores ao limite superior do intervalo de uma classe.
Essa frequência deverá ser simbolizada pela letra F (em maiúsculo), Fi ou FAci,
para diferenciá-la da frequência absoluta simples.
Fri ou FAci %.
Unidade 3 127
Considerando os diferentes tipos de frequência, para o exemplo trabalhado neste
módulo, da estatura dos 40 alunos, com intervalo de classes, obtêm-se a Tab. 32
de distribuição de frequência apresentada a seguir:
Para lembrar!
Por exemplo: Quantos alunos possuem estatura inferior a 162 cm? Basta obser-
var a tabela e verificar que existem 24 alunos, pois são os alunos que pertencem
às classes 1,2 e 3, tão logo: f1 + f2 + f3 = ∑ f 3= 24.
Para compreender melhor como pode ser construída uma distribuição de frequ-
ência, observe outros exemplos a seguir:
128 Unidade 3
8.4 Exemplos de distribuição de frequência
8.4.1 Para Variável Qualitativa
Considere os dados de um levantamento de uma amostra de 40 pessoas do grupo
A, em respeito à variável nível de instrução. Código (1 – fundamental; 2 – médio
e 3 – graduação):
33223133322122323333
33322313233231113333
Para construir uma tabela de distribuição de frequência com dados de uma va-
riável qualitativa, você precisa contar quantas vezes aparece cada categoria (fre-
quência absoluta) e, se preferir, poderá apresentá-las melhor por meio das suas
porcentagens (frequência relativa), conforme mostra a (Tabela 33):
Tabela 33 - Distribuição de frequência do nível de instrução do grupo
A, numa amostra de 40 pessoas, FIESC – SC, 2012-1
Unidade 3 129
Se fosse fazer um comparativo, percebe-se que o Grupo A possui o melhor nível
de instrução, tendo mais de 50% graduados, enquanto o grupo C apresenta o pior
nível de escolaridade, quase 50% possui o ensino fundamental.
DICA
“Frequências absolutas são preferidas quando o número de observações
é pequeno. Por outro lado, quando queremos fazer comparações, como
estudar as distribuições de homens e mulheres em duas turmas, as relativas são mais
informativas.” Barbetta, Reis e Bornia (2010, p. 53)
A série dos dados brutos: 20; 18; 17; 21; 17; 18; 17; 21 representa a idade de um
grupo de alunos. Lembre-se: Em estatística costuma-se ordenar primeiramente
esses dados para facilitar a sua contagem, ou seja, constrói-se o ROL (conjunto
ordenado dos dados), mas não obrigatoriamente:
Idade fi Fi %
17 3 37,5
18 2 25
20 1 12,5
21 2 25
8 100
Fonte: Bruni (2008, p. 10), adaptada.
130 Unidade 3
Releia!
FAci = ∑j=
i
f FAci = FAci . 100%
∑ji = 1 fi
1 i
Para construir uma tabela com todos esses dados ficaria inviável sua análise, não
é mesmo?
Unidade 3 131
Neste caso, faz-se o procedimento de agrupamento em classes, ou seja:
DICA
Todos os elementos observados deverão fazer parte obrigatoriamente de
uma única classe. (BRUNI, 2008).
Você poderá visualizar melhor o processo de definição dos intervalos consultando o livro:
BRUNI, Adriano Leal. Estatística para Concursos: com mais de 400 questões solucionadas,
incluindo principais bancas examinadoras e provas importantes. São Paulo: Atlas, 2008,
p.13-14.
132 Unidade 3
Síntese do módulo
Neste módulo foi mostrado como trabalhar melhor os dados brutos obtidos em
uma pesquisa; num primeiro momento, organizando-os em um ROL; depois, se
necessário for, agrupá-los em intervalos de classe. Também foi detalhado cada
elemento de uma distribuição de frequência, podendo esta ser apresentada sem
ou com intervalos de classe, tendo sido mostrados por meio de alguns exemplos
voltados para variáveis qualitativas e quantitativas, com suas respectivas formas
de frequência: absoluta, relativa, acumulada simples e acumulada relativa.
ATIVIDADES
1) (Adaptado de FGV Min. Cultura Tec. Cont. / 06): A tabela a seguir mostra a
distribuição de salários dos 50 funcionários da empresa ABC, do Estado de Santa
Catarina:
Salários dos Número de
Funcionários Funcionários
500 l 700 20
700 l 900 25
900 l 1.300 2
1.300 l 1.900 3
Fonte: Autora, dados hipotéticos.
b) 3%
c) 5%
d) 6%
e) 10%
Unidade 3 133
2) Helena, ao realizar uma pesquisa, obteve, a pedido do diretor da Instituição,
a pontuação de 50 alunos na 1ª etapa do concurso, conforme apresenta os dados
da tabela a seguir:
68 85 33 52 65 77 84 65 74 57
71 35 81 50 35 64 74 47 54 68
80 61 41 91 55 73 59 53 77 45
41 55 78 48 69 85 67 39 60 76
94 98 66 66 73 42 65 94 88 89
2 2 3 10 13 14 15 15 16 16
18 18 20 21 22 22 23 24 25 25
26 27 29 29 30 32 36 42 44 45
45 46 48 52 58 59 61 61 61 65
66 66 68 75 78 80 89 90 92 97
Fonte: Autora, dados hipotéticos.
a) 21
b) 19
c) 17
d) 15
e) 13
134 Unidade 3
3.2) Qual é o limite inferior ( li ) da 3ª classe?
a) 2
b) 20
c) 21
d) 40
e) 41
a) 49
b) 57
c) 66
d) 70
e) 78
Unidade 3 135
Módulo 9
Unidade 3 137
9.1 Histograma
DICA
5.2; 6.4; 5.7; 8.3; 7.0; 5.4; 4.8; 9.1; 5.5; 6.2; 4.9; 5.7; 6.3; 5.1; 8.4; 6.2; 8.9; 7.3; 5.4; 4.8;
5.6; 6.8; 5.0; 6.7; 8.2; 7.1; 4.9; 5.0; 8.2; 9.9; 5.4; 5.6; 5.7; 6.2; 4.9; 5.1; 6.0; 4.7; 14.1;
5.3; 4.9; 5.0; 5.7; 6.3; 6.0; 6.8; 7.3; 6.9; 6.5; 5.9
138 Unidade 3
Tabela 38 - Distribuição de Frequência do Tempo (em Segundos) para
Carga de um Aplicativo, Num Sistema Compartilhado.
Porcentagem
Classes de Ponto Número de Porcentagem de
acumulada
tempo Médio observações ni observações 100 fi
100 Fi
4 l 5 4.5 7 14 14
5 l 6 5.5 18 36 50
6 l 7 6.5 13 26 76
7 l 8 7.5 4 8 84
8 l 9 8.5 5 10 94
9 l 10 9.5 2 4 98
10 l 11 10.5 0 0 98
11 l 12 11.5 0 0 98
12 l 13 12.5 0 0 98
13 l 14 13.5 0 0 98
14 l 15 14.5 1 2 100
TOTAL 50 100
Fonte: Barbetta, Reis e Bornia (2010, p. 61)
DICA
Unidade 3 139
9.2 Polígono de frequência
O polígono de frequência é um gráfico em linha, com suas respectivas frequ-
ências marcadas perpendicularmente ao eixo das abscissas unidas aos pontos
médios dos intervalos de classe. (CRESPO, 2009)
9
Frequência fi
6 fi
0
148 152 156 160 164 168 172 176
Ponto Médio x
Fonte: Crespo (2009, p. 62)
140 Unidade 3
9.3 Polígono de frequência acumulada
24 Série1
20
13
10
4
0
154 158 162 166 170 174
Unidade 3 141
DICA
Ao desenhar o gráfico de frequência acumulada, não se esqueça, ao chegar
ao topo máximo encontra-se a frequência total, como no Gráf. 14 referente
à Tab. 40.
DICA
Enquanto o polígono de frequência apresenta a imagem real, a curva de
frequência serve para analisar as tendências, ou seja, apresenta a imagem
tendencial do fenômeno em estudo.
Com essa imagem tendencial, os pesquisadores conseguem prever com mais efi-
cácia algumas situações por meio de estudos desenvolvidos com apoio das dis-
tribuições normais, assim como conseguem usar melhor a probabilidade aliada
à estatística.
142 Unidade 3
Adotando como exemplo a tabela de estatura dos 40 alunos já utilizada, têm-se:
1º) Calcule a fci para cada intervalo, resultando nos dados da 4ª coluna, por
exemplo:
f1-1 + 2 fi+ f1+1
fci = = 0 + 2 . 4 +9 = 17 = 4,25
4 4 4
e assim sucessivamente.
DICA
Como não existe frequência anterior a primeira classe considerada e poste-
rior a última classe considerada, usa-se 0 (zero). Para facilitar a sua represen-
tação geométrica, os dados poderão ser arredondados para uma casa decimal, de acordo
com o estudo do módulo 5, item 5.3.
Unidade 3 143
vas frequências fci, marcando seus pares ordenados; e
4º) Por fim, ligue-os com uma suave linha a qual resultará na curva de frequên-
cia, mostrada a seguir no Gráfico 15:
144 Unidade 3
Figura 3 - Curva na Forma de Sino Simétrica
Unidade 3 145
do plano cartesiano em uma das extremidades, formando um jota ou um jota
invertido, conforme à Fig. 05.
146 Unidade 3
As curvas em forma de U costumam ser aplicadas nas distribuições referentes à
mortalidade por idade, por exemplo:
Ao analisarmos uma curva desse tipo, sabe-se que enquanto o ser humano é
criança, geralmente, arrisca-se mais, quando brinca, sobe escada e desce corren-
do, podendo com isso apresentar um risco maior de morte. Ao chegar às idades
de jovens e adultos, isso se estabiliza mais, diminuindo os riscos e; quando ido-
sos, novamente o risco de morte tende a aumentar, por doenças muitas vezes da
própria idade, o que, sem dúvida, poderá ser bem representado pela curva em
forma de U.
Por exemplo: Imagine que você é professora de determinada escola e, por algum
motivo, não recebe aumento nos últimos três anos, isso poderá ser representado
por meio de uma distribuição regular, conforme o Gráfico 16:
Unidade 3 147
Síntese do módulo
Neste módulo, você estudou que as distribuições de frequência costumam ser
representadas graficamente por meio de três figuras: Histograma, Polígono de
frequência e Polígono de frequência acumulada, também conhecido por gráfico
de Ogiva, cada qual com suas características. Aprendeu os passos necessários
para desenhar uma curva de frequência, ou seja, uma representação estatística
que possibilita aos pesquisadores visualizar possíveis tendências, resultantes de
uma distribuição de frequência, relacionada ao estudo do fenômeno em questão.
Para fechar o módulo, conheceu as diferentes formas de apresentar as distribui-
ções, tais como: curvas na forma de sino (simétrica e assimétrica); em forma de
jota e jota invertido; na forma de U e distribuição regular.
ATIVIDADES
b) Polígono de frequência;
c) Gráfico de Ogiva; e
d) Curva de frequência.
Tabela - Distribuição de
Frequência
Classe fi
2 l 6 2
6 l 10 4
10 l 14 9
14 l 18 18
18 l 22 9
22 l 26 5
26 l 30 3
Fonte: Bruni (2008, p. 35)
148 Unidade 3
Para lembrar!
a) Em ambos.
b) No primeiro.
c) Somente no segundo.
d) Em nenhum.
Unidade 3 149
Exercícios complementares
Para fecharmos a unidade 3, sugiro que você exercite seus conhecimentos ad-
quiridos, desenvolvendo as atividades complementares com questões baseadas
em provas como as do ENADE; concursos do IBGE, CELESC e outros, sempre
atento ao apoio que a Estatística nos dá para tomada de decisões.
Suponha que você seja o estatístico, após analisar a distribuição resolva a questão,
descrevendo sua justificativa.
Dentre os itens a seguir, qual é a opção que corresponde ao valor x que não é
operado (efetuado) por aproximadamente 90% das observações salariais.
a) 5.980,00
b) 9.000,00
c) 10.000,00
d) 11.380,00
e) 12.000,00
150 Unidade 3
JUSTIFICATIVA
Gráfico Histograma
20
18
15
12
10
9
8
6
b) 60%
c) 55%
d) 48%
e) 42%
Unidade 3 151
3) (ENADE, 2008): Apesar do progresso verificado nos últimos anos, o Brasil
continua sendo um país em que há uma grande desigualdade de renda entre os
cidadãos. Uma forma de se constatar este fato é por meio da Curva de Lorenz,
que fornece, para cada valor de x entre 0 e 100, o percentual da renda total do
País auferido pelos x% de brasileiros de menor renda. Por exemplo, na Curva de
Lorenz para 2004, apresentada ao lado, constata-se que a renda total dos 60% de
menor renda representou apenas 20% da renda total.
a) 20%.
b) 40%.
c) 50%.
d) 60%.
e) 80%.
152 Unidade 3
Classes Receitas (R$) Quantidade de empresas
1 0 ll 200.000 1.100
2 200.001 ll 400.000 900
3 400.001 ll 600.000 550
4 600.001 ll 800.000 300
5 800.001 ll 1.000.000 150
( ) CORRETO ( ) ERRADO
Por quê?
5) (Adaptado, IBGE) Uma obra foi dividida em 5 itens e, a partir de seus custos,
foi montada a curva ABC, apresentada no gráfico.
Unidade 3 153
Considerando que o custo total da obra é de R$ 25.000,00, afirma-se que:
a) A participação do item 2, no custo total da obra, é de 60%.
154 Unidade 3
Unidade 4
Medidas de posição e de
dispersão e estimação
Na unidade 3 foram estudadas algumas possibilidades relacionadas à
distribuição de frequência que permite aos interessados na pesquisa
descrever os grupos dos valores que uma variável pode assumir.
Com essas informações, consegue-se identificar a maior
concentração de valores de determinada distribuição, mas
somente de modo geral, ou seja, verificar sua localização (se no
início, meio ou ao final) e se há uma distribuição por igual.
Mas em algumas situações, necessita-se identificar as tendências
características de cada distribuição, de forma isolada, ou em
confronto com outras, isso só é possível por meio de números
que traduzam essas tendências, ou seja, das medidas de:
1) Posição;
2) Variabilidade ou dispersão;
3) Assimetria; e
4) Curtose. ■
Vamos estudá-las?
Módulo 10
Medidas de posição
As medidas de posição são estatísticas aplicadas para representar os dados de
uma distribuição, auxiliando os pesquisadores quanto a sua posição em relação
ao eixo das abscissas num plano cartesiano (CRESPO, 2009). Entre elas, desta-
cam-se:
Unidade 4 157
10.1 Medidas de tendência central
- Média (x)
Entre as medidas mais conhecidas dessa categoria, encontra-se a Média Aritmé-
tica (conhecida simplesmente por Média), simbolizada por ( x ), podendo ser do
tipo simples (quando os dados não estão agrupados) ou ponderada.
- Moda (Mo)
Assim como se fala no popular “a roupa da moda”, quer dizer, a roupa mais usada,
estatisticamente moda também é o que ocorre com mais frequência, neste caso,
o valor.
158 Unidade 4
Quando dois valores têm a máxima frequência, denomina-se BIMODAL; já
MULTIMODAL quando mais de dois valores têm a máxima frequência.
DICA
Para os casos impossíveis de determinar a moda, a distribuição é chamada
de AMODAL.
- Mediana (Md)
a) Md = n + 1 se n for ímpar; e
2
b) Md = a média aritmética dos termos n n
e + 1 se n for par.
2 2
Por exemplo:
Unidade 4 159
Já para uma série com o número de elementos par, por exemplo:
b) Dada à série 13; 15; 2; 5; 18; 6; 9; 16, a mediana será:
DICA
Quando os dados não estiverem agrupados e a série possuir um número
ímpar de elementos, o valor da mediana pertencerá à série, mas quando
a série possuir um número par de elementos, o valor mediano poderá não pertencerá à
série, pois ele ficará entre 2 elementos.
- Média (x)
Neste caso, obtêm-se a média aritmética ponderada ou simplesmente média,
calculando-se a divisão da soma do produto de todos os valores observados da
variável (xi) e a sua frequência ( fi ), pelo somatório das frequências.
∑ xi. fi
x =
∑ fi
160 Unidade 4
Aqui, como os dados são agrupados sem intervalos de classe, o valor de xi é o
próprio número, por exemplo:
Tabela 41 - Média Aritmética de 5 Alunos da
Turma 2 de Estatística – Semestre 2012-2
Nota ( xi ) Frequência ( fi ) xi . fi
3 1 3
4 2 8
5 2 10
6 2 12
7 1 7
TOTAL 8 40
Fonte: Autora, dados hipotéticos.
Suponha que João queira calcular a sua média na disciplina de estatística, tendo
tirado 8,5 na 1ª avaliação; 7,5 na 2ª avaliação e, 5,0 na 3ª avaliação. Segundo as
informações disponíveis no plano de ensino, cada avaliação possui peso: 3; 3 e 4,
respectivamente, logo a média de João poderá ser calculada, conforme mostra a
(Tabela 42):
Tabela 42 - Média Ponderada em
Estatística – 2012-2
Nota (xi) Peso (fi) xi . f i
8,5 3 25,5
7,5 3 22,5
5 4 20
TOTAL 10 68
Fonte: Autora, dados hipotéticos
Unidade 4 161
∑ xi . fi
= 68,0 = 6,8
Logo, sua média é igual a:
x =
∑ fi 10
DICA
A média aritmética ponderada deve ser utilizada quando os valores variam
em grau de importância.
- Moda (Mo)
Número De
Frequência fi
Dependentes
1 12
2 20
3 15
4 7
5 1
Fonte: Autora, dados hipotéticos.
- Mediana (Md)
Numa distribuição de frequência sem intervalo de classe, a mediana é calculada
com base na frequência acumulada. Para esse cálculo, devemos adotar um dos
dois modelos apresentados a seguir, dependendo da situação. Vamos conhecê-
-los?
162 Unidade 4
Modelo 1: Dada a Tab. 46 de distribuição de frequência relacionada ao número
de dependentes de um grupo de indivíduos, mostrada na sequência, qual será
seu valor mediano?
Tabela 44 - Distribuição de Frequência do
Número de Dependentes
Número De
Frequência fi xi . f i Fi
Dependentes
1 11 11 11
2 20 40 31
3 15 45 46
4 7 28 53
5 1 5 54
TOTAL 54 129
Fonte: Autora, dados hipotéticos.
Unidade 4 163
Então, primeiro como nas demais distribuições se calcula:
∑ fi = 8 = 4
, analisando a tabela, percebe-se que o 4º termo pertence a 2ª
2 2
classe, porém, nesse caso, o valor coincide (4 com 4), logo a mediana não será o
valor de xi imediato, mas sim a soma deste com o próximo, dividido por dois, ou
seja, neste exemplo tem-se:
Md = 24 + 31 = 27,5
2
Releia!
1 1 l 4 7 1 + 4 = 5/2 = 2,5
2 4 l 7 10 5,5
3 7 l 10 15 8,5
4 10 l 13 5 11,5
5 13 l 16 5 14,5
6 16 l 19 5 17,5
7 19 l 22 3 20,5
TOTAL 50
Fonte: Autora, dados hipotéticos.
164 Unidade 4
Para responder a esse questionamento, basta, após calcular os pontos médios
mostrados na 4ª coluna, aplicar a fórmula:
- Moda (Mo)
Para os casos em que os dados estão agrupados com intervalos de classe, faz-se
necessário desenvolver o procedimento:
Unidade 4 165
- Mediana (Md)
ATENÇÃO!
md = l + (i
∑f
2
i - fac (ant) . h
fi
Sendo:
– h: amplitude; e
166 Unidade 4
Para obter a mediana dessa distribuição:
fi
frequência acumulada anterior à classe (3) é 14, tem-se:
VAMOS REFLETIR?
Não existe uma ordem de prioridade quanto ao uso das medidas de posição
central, por isso, é importante que você saiba calcular e aplicar todas as estu-
dadas.
O que pode ajudar, é lembrar que:
Quando as distribuições são simétricas a MÉDIA e a MEDIANA são IGUAIS e; quando assimé-
tricas são DIFERENTES.
Tão logo, uma distribuição apresentada numa curva em forma de sino terá:
- x < Md < Mo, nos casos em que a curva for assimétrica negativa.
Unidade 4 167
ESTUDO COMPLEMENTAR
Estas curvas poderão ser visualizadas na obra de Crespo (2009, p. 94 e 95).
Bibliografia completa: CRESPO, A. A.. Estatística fácil. 19ª Ed. Atual: São Paulo Saraiva, 2009.
As medidas separatrizes são também medidas de posição, mas que diferente das
de tendência central que caracterizam uma série estatística devido a sua posição
central, as separatrizes são medidas que dividem o conjunto de dados de uma
série estatística num certo número de partes iguais.
Mas por já ter sido detalhada nas de tendência central, neste tópico serão abor-
dados as demais medidas de ordenamento:
- Os quartis
Como o próprio nome indica, os quartis são medidas separatrizes que dividem a
série em quatro partes iguais.
- O primeiro quartil (Q1): o valor situado de tal modo na série, em que uma
quarta parte, ou seja, 25% dos dados é menor que ele e o restante, as três quartas
partes (totalizando 75%) são maiores;
168 Unidade 4
- O terceiro quartil (Q3): o contrário do Q1, é o valor situado de tal modo que
as três quartas partes (75%) dos termos são menores que ele e uma quarta parte
(25%) é maior.
Q1 = li + ( ∑ fi - fac (ant) . h
2 ; Q2 = Md e
fi
Q 3 = li + (3∑2 f - f
i
ac (ant) . h
fi
Por exemplo:
Unidade 4 169
Têm-se os seguintes quartis:
165
Q1 = 156,7 cm Q3 = 165 cm
- Os percentis
São as medidas dos 99 valores que separam a distribuição em 100 partes iguais
(CRESPO,2009).
Simbolicamente, representa-se por P1; P2; ... ; P53; ... P99
K =8
k . ∑ fi 8 . 40
= = 3,2
100 100
170 Unidade 4
Síntese do módulo
No decorrer deste módulo, foram repassadas a você caro leitor, informações so-
bre:
ATIVIDADES
(16) Quando os dados não estiverem agrupados e a série possuir um número par
de elementos, o valor da mediana pertencerá à série, mas quando a série possuir
um número ímpar de elementos, o valor mediano não pertencerá à série, pois
ficará entre 2 elementos.
(32) Todas as alternativas estão incorretas.
TOTAL = ( )
Unidade 4 171
2) No conjunto a seguir, referente às notas de estatística de 15 acadêmicos:
{1,0; 2,0; 3,0; 8,0; 5,0; 7,0; 6,0; 9,0; 4,0; 6,0; 2,0; 10,0; 3,0; 5,0; 3,0},
José Antonio, professor da disciplina, conclui que a mediana é igual a:
a) 5,0 acadêmicos;
b) Nota 5,0;
c) 9,0 acadêmicos;
d) Nota 9,0;
172 Unidade 4
Módulo 11
Medidas de dispersão ou de
variabilidade
As medidas de variabilidade são bastante aplicadas mercadologicamente, por
darem uma visibilidade complementar às medidas de posição estudadas, princi-
palmente no que tange à análise completa (interpretação dos dados mostrando
suas possíveis variações), contribuindo - e muito - para que os gestores tomem
decisões.
– Amplitude Total;
– Variância;
– Desvio Padrão; e
– Coeficiente de Variação.
Unidade 4 173
11.1 Amplitude total (AT)
A = 25 + 25 + 25 = 25 B = 23 + 25 + 27 = 25 C = 5 + 25 + 45 = 25
3 3 3
As médias aritméticas das três regiões são iguais. Mas a amplitude total, vamos
calcular?
Com a amplitude total, de acordo com o exemplo, pode-se ter uma ideia da varia-
ção dos dados, neste caso percebe-se que a região C teve um dia de temperatura
altíssima e dois dias depois extremamente baixa, o que os estatísticos não conse-
guem visualizar apenas com a média (medida de posição de tendência central).
A aplicação total é uma medida que se costuma adotar, quando se quer calcular a
variação: de vendas de produtos, de temperaturas, de idades, por exemplo.
Essa medida (AT) poderá ser calculada para: dados agrupados sem intervalos e
com intervalos de classe.
a) Os percentis
174 Unidade 4
Tabela 50 - Exemplo de Amplitude Total
AT = x(Max.) – x(mín.) AT = 5 – 1 = 4
Unidade 4 175
AT = L(Max.) – l(mín.) AT = 3000 – 500 = 2500
Não se esqueçam para realizar esse cálculo, os dados precisam estar agrupados
em uma tabela de distribuição de frequência.
Ao analisar os exemplos dados, conclui-se que a AT serve para medir a dispersão
total do conjunto de dados. Com essa medida, os interessados no objeto de pes-
quisa conseguem analisar o começo ou o menor valor e o maior valor da série,
que dependerá de cada série, mas basicamente não verificam os demais valores
da série.
Tão logo, mesmo com toda a facilitada em relação a seu cálculo, os estatísticos
dão preferência às demais medidas de dispersão, que consideram os demais va-
lores, como o desvio padrão e a variância, o que não significa não ser utilizada.
s2 = ∑ fi (xi - x)
2
n
Tomando como exemplo a Tab. 52:
Tabela 52 - Exemplo de Variância e Desvio Padrão
(xi – x)2
Item Idade xi – x
1 18 – 4,4 19,36
2 23 0,6 0,36
3 27 4,6 21,16
4 18 – 4,4 19,36
5 20 – 2,4 5,76
6 19 – 3,4 11,56
7 21 – 1,4 1,96
8 32 9,6 92,16
9 25 2,6 6,76
10 21 – 1,4 1,96
224 0 180,40
Fonte: Autora, dados hipotéticos.
176 Unidade 4
Observe como essas medidas de dispersão são calculadas:
s2 = ∑ (xi - x) = 180,40
2
= 18,04 idade
n 10
Essa medida baseia-se em torno da média aritmética e pode ser entendida como
a raiz quadrada da média simples dos quadrados dos desvios, denotada pela letra
s.
Unidade 4 177
podendo ser substituído por
ou
Assim como o desvio padrão pode ser definido por meio da variância, as demais
fórmulas também poderão ser utilizadas para facilitar seus cálculos, caso não
tenha em mãos o valor da variância.
Tomando como exemplo os valores: 40; 45; 48; 52; 54; 62 e 70, o desvio padrão
será dado:
1º) Por praticidade, costuma-se colocá-los em uma tabela com duas colunas:
178 Unidade 4
uma para os valores da série e outra para calcular o valor dos seus quadrados,
conforme mostra a Tabela 53:
Tabela 53 - Modelo do cálculo de Desvio
Padrão com Dados Não Agrupados
xi xi2
40 1.600
45 2.025
48 2.304
52 2.704
54 2.916
62 3.844
70 4.900
= 371 = 20.293
Fonte: Crespo (2009, p.108), adaptada.
Unidade 4 179
1º) Por praticidade, costuma-se trabalhar com 4 colunas:
- a 1ª para os valores dos dados;
- a 2ª, suas respectivas frequências (número de vezes que os dados se repe-
tem);
- a 3ª para mostrar os cálculos do produto de fixi; e
- por fim, a 4ª para apresentar os valores de f ixi 2, (para isso basta multipli-
car f xi por xi).
Acompanhe o exemplo:
Tabela 54 - Modelo do cálculo de Desvio Padrão
com Dados Agrupados Sem Intervalos
NÚMERO DE
DEPENDENTES ( xi )
fi f ix i fi xi 2
0 2 0 0
1 6 6 6
2 12 24 48
3 7 21 63
4 3 12 48
= 30 = 63 = 165
Fonte: Crespo (2009, p.109, adaptada.
Nestes casos, o que muda são os dados apresentados em intervalos de classe e não
mais diretamente. Vamos analisar o exemplo:
180 Unidade 4
Dada a distribuição de frequência a seguir, apresentada na Tabela 55, tem-se
como desvio padrão o valor resultante de:
Esse resultado significa que ao redor da média: 161, a variação está sendo 5,57
para cima ou para baixo, podendo existir alturas mais altas e algumas mais bai-
xas, mas o desvio padronizado em relação à média é de 5,57 cm.
DICA
• O desvio padrão de uma série será sempre um valor positivo.
• Quanto maior for o desvio padrão, maior será a dispersão entre os ele-
mentos.
Unidade 4 181
11.4 Coeficiente de variação (CV)
É uma medida relativa de dispersão, expressa em porcentagem, denotada por
CV, destacando-se estatisticamente entre as demais medidas de dispersão, por
apresentar uma medida relativa.
O que permite concluir que a variação das mulheres é mais heterogênea, enquan-
to a dos homens mais homogênea, talvez por questões de programação ou não
necessariamente.
182 Unidade 4
Síntese do módulo
Durante este módulo, você recebeu informações relacionadas às medidas de dis-
persão: amplitude total (AT), variância (s2), desvio padrão (s) e os coeficientes
de variação (CV). Estudou como aplicá-las e quando, podendo concluir estatis-
ticamente que, a AT é uma medida que serve para resumir os dados do começo,
ou o menor valor e o maior valor da série, atendo-se aos extremos; enquanto
com a variância e o desvio padrão consegue-se ter uma visão melhor do todo
em relação à média e outras medidas de posição, tendo sido a média nosso foco
de estudo. Por meio da variância mostra-se o quanto os dados estão variando
no conjunto de dados e do desvio padrão, o quanto eles estão dispersos ou não
(heterogêneos ou homogêneos). Para finalizar, conheceu a medida: coeficientes
de variação, sendo esta extremamente aplicável pelo diferencial que apresenta,
visto que no mercado de trabalho, em muitas situações, existe a necessidade de
trabalhar com dados distintos, como produtos com medidas diferentes (litros e
gramas), que precisam ser comparadas, tão logo, isso só é viável com medidas
relativas (em porcentagem), obtidas através desses coeficientes.
ATIVIDADES
Com base na leitura do módulo 11, desenvolva as seguintes questões, individual-
mente e, na sequência, confira suas respostas ao final do livro.
Unidade 4 183
1.2) Para o conjunto de valores: 0; - 1; - 2; 5; 4; - 3; - 7; 2; - 4 e 6, tem-se:
a) A média 3,4 e a variância 16.
b) A média 0 e a variância 4.
2) Para cada série dada a seguir, determine as suas medidas de dispersão: ampli-
tude total (AT) e desvio padrão:
a) 1; 3; 5; 9.
b) 20; 14; 15; 19; 21; 22; 20.
d) – 10; - 6; 2; 3; 7; 9; 10.
e) Tabela: Distribuição do Exercício E
xi 2 3 4 5 6 7 8
fi 1 3 5 8 5 4 2
Fonte: Crespo (2009, p. 115)
184 Unidade 4
Módulo 12
Medidas assimétricas e
medidas de curtose
Ao estudar as curvas de frequência em forma de sino, no módulo 9, falou-se a
respeito da natureza da assimetria, sendo essas curvas classificadas em simétrica
e assimétrica. Por meio dessas curvas, visualiza-se uma imagem tendencial do
estudo em questão, utilizadas pelos pesquisadores para analisar as tendências da
distribuição. Estes, como ferramenta de trabalho, usufruem também das medi-
das de assimetria, as quais procuram caracterizar como e quanto a distribuição
dos dados ou frequências se afastam da condição de simetria e das medidas de
curtose, que indicam o grau de achatamento de uma distribuição.
Vamos em frente?
Vamos à aquisição de novas informações?
Unidade 4 185
12.1 Medidas de assimetria
186 Unidade 4
- simétrica, se (assimetria neste caso é nula);
- assimétrica positiva, se (afasta-se à direita); e
ESTUDO COMPLEMENTAR
Caro leitor, para complementar seu conhecimento a respeito desse assun-
to, poderá visualizar o gráfico da distribuição A e buscar outros exemplos na obra intitulada
como Estatística Fácil, de autoria de Crespo. Segue a referência:CRESPO, A. A.. Estatística
Fácil. 19ª ed. Atual. São Paulo: Saraiva, 2009, p. 116- 118.
Unidade 4 187
12.1.1 Coeficiente de Assimetria de Pearson
Suponha que você tenha em mãos as medidas referentes a uma determinada dis-
tribuição já calculada, tais como:
188 Unidade 4
Esse grau de achatamento da curva normal pode traduzir três situações palpá-
veis, sendo classificadas em:
trizes já explicadas.
C – Coeficiente de curtose;
Q1 – Primeiro quartis;
Q3 – Terceiro quartis;
P90 – Percentis de 90%; e
P10 – Percentis de 10%.
Unidade 4 189
Tendo como valor referência C = 0,263, a curva será:
a) Mesocúrtica: se o coeficiente C = 0,263;
190 Unidade 4
Síntese do módulo
Neste módulo, foram relatadas as medidas de forma: medidas de assimetria e de
curtose. Medidas de grande importância na aplicabilidade estatística probabi-
lística. Com elas, o pesquisador consegue estimar o quanto uma distribuição se
afasta do eixo de simetria, comparando suas medidas de posição: média, media-
na e moda, utilizando-se das medidas de assimetria. Conseguem também, com
as medidas de posição separatrizes, determinar o grau de achatamento em rela-
ção à curva normal. Neste módulo você teve a oportunidade de conhecer como
calcular os coeficientes de assimetria de Pearson e o coeficiente de curtose, assim
como conheceu também as possíveis classificações que uma curva de frequência
pode apresentar.
ATIVIDADES
Com base na leitura do módulo 12, desenvolva as seguintes questões, individual-
mente e, na sequência, confira suas respostas ao final do livro.
c) A distribuição é simétrica.
Unidade 4 191
2) (ESAF AFPS / 02) Analise os dados da tabela seguinte. A tabela abaixo dá a
distribuição de frequência de um atributo X para uma amostra de tamanho 66.
As observações foram agrupadas em 9 classes de tamanho 5. Não existem obser-
vações coincidentes com os extremos das classes.
Tabela: Exercício 2 – Módulo 12
CLASSES FREQUÊNCIAS
4 l 9 5
9 l 14 9
14 l 19 10
19 l 24 15
24 l 29 12
29 l 34 6
34 l 39 4
39 l 44 3
44 l 49 2
Fonte: Bruni (2008, p. 136)
192 Unidade 4
Atento às informações apresentadas por José Antonio, desenvolva os seguintes
itens:
a) Calcule as medidas: média, moda, mediana e desvio padrão; e
Exercícios complementares
Para fecharmos a unidade 4, sugiro que você exercite seus conhecimentos ad-
quiridos, desenvolvendo as atividades complementares com questões baseadas
em provas como as do ENADE; concursos do IBGE, CELESC e outros, sempre
atento ao apoio que a Estatística nos dá para tomada de decisões.
Unidade 4 193
2) (Adaptada da prova do IBGE) Analise os dados agrupados com intervalo de
classe descritos a seguir para responder às questões de números 2.1 e 2.2.
194 Unidade 4
4) Na cidade A, a média de salários é de 1200 unidades monetárias (u.m.) e o 3º
quartil é de 720 u.m..
Comparação no item a:
Comparação no item b:
Unidade 4 195
6) (Adaptado, COPESE) O número de empresas notificadas para quitar suas pen-
dências trabalhistas junto ao INSS, é dependente do ano e foram agrupadas em
função do tempo gasto (em dias) para quitação de suas pendências. A partir des-
tas amostras anuais, o perito pode fazer algumas análises descritivas em função
do número de empresas.
Tabela – Número de empresas notificadas pelo
INSS, de 2005 a 2010
Ano Tempo
20 dias 30 dias 40 dias
2.005 28 33 39
2.006 33 32 37
2.007 35 29 35
2.008 43 31 33
2.009 47 32 29
2.010 48 27 25
Fonte: Adaptada pela autora ESAF
Com base nestas informações julgue as questões 6.1, 6.2, 6.3 e 6.4, assinalando a
alternativa CORRETA.
a) 46,50 e 38,50
b) 39,50 e 33,34
c) 39,00 e 36,00
d) 39,00 e 39,00
6.2) Quanto à moda dos dados apresentados na tabela, podemos afirmar que a
distribuição é:
a) Amodal
b) Unimodal
c) Bimodal
d) Trimodal
196 Unidade 4
6.3) Em que ano observou-se maior amplitude do número de empresas para qui-
tação de débito:
a) 2010
b) 2009
c) 2007
d) 2005
a) 64,18
b) 42,78
c) 20,22
d) 30,33
a) Somente I e II.
b) Somente II e III.
c) Somente I e III.
d) I, II e III.
e) Nenhuma.
Unidade 4 197
Unidade 5
Correlação e regressão
Para ingressar nestas relações, faz-se necessário primeiramente, compreen-
der algumas diferenças, tais como: as diferenças entre relações funcionais e
as correlações.
Unidade 5 201
13.1 Correlações
Por exemplo: A relação entre altura e peso de uma população de jovens, pode
caracterizar uma correlação, por existir uma relação estatística entre as duas va-
riáveis.
Uma vez caracterizada a relação, costuma-se defini-la por meio de uma função
matemática, sendo a regressão um instrumento indicado por especialistas da
área para especificar os parâmetros dessa função matemática.
202 Unidade 5
VAMOS REFLETIR?
Enquanto“a análise de regressão fornece uma função matemática que descre-
ve a relação entre duas ou mais variáveis, a análise de correlação determina um
número que expressa uma medida numérica do grau da relação encontrada.” (BRUNI, 2008,
p. 143).
Unidade 5 203
Os diagramas de dispersão, conforme mostra a Fig. 9 pode ser utilizada para
representar vários tipos de relações entre elas, uma correlação do tipo:
a) Linear Positiva, quando os pontos do diagrama têm como imagem uma reta
ascendente;
204 Unidade 5
Se você observar, os pontos do Gráf. 17 formam uma elipse em diagonal e sabe-
se que quanto mais fina for a elipse formada, mais se aproximará de uma reta,
ou seja, sua imagem será uma reta, por isso, o nome correlação linear.
Mas, caso não consiga visualizar imaginariamente o processo, basta para o ex-
emplo dado, ligar os pontos (pares ordenados) (2,2); (7,7) e (10,10) no Gráf. 17,
sem dúvida, irá compreender a correlação existente entre as disciplinas, con-
forme mostra o (Gráf. 18)
Unidade 5 205
13.3 Coeficiente de correlação de pearson
DICA
206 Unidade 5
Logo:
Para qualquer que seja o conjunto de dados analisados, pode-se, com o cálculo
de R definido anteriormente, determinar o coeficiente de correlação linear de
Pearson entre o intervalo – 1 e 1, o que possibilita encontrar:
Na observação dos dados coletados, quanto mais forte for a relação de corre-
lação, o valor do coeficiente R estará mais se aproximará dos valores 1 ou – 1.
(BARBETTA, REIS, BORNIA, 2010)
R será igual a + 1 sempre que os pontos estiverem exatamente sobre uma reta as-
cendente, ou seja, haverá uma correlação positiva perfeita. Porém, sempre que se
deparar com uma correlação negativa, também conhecida como perfeita, os pon-
tos estarão exatamente sobre uma reta decrescente (descendente), logo R = – 1.
Além desses, ainda poderá se deparar com casos de R próximo de 0 (zero), quan-
do não houver uma correlação entre os dados.
Observe a Fig. 10, que mostra os possíveis valores de R e como são interpretados
em relação ao sentido (positivo ou negativo) e sua força:
Unidade 5 207
Ainda é comum a análise nos três casos em que o coeficiente encontra-se entre
determinados intervalos mostrados a seguir:
c) 0 < IRI < 0,3 – praticamente, neste caso, não apresenta relação entre os dados.
ESTUDO COMPLEMENTAR
A palavra regressão teve origem no final do século XIX, com os trabalhos
de Galton (BARBETA, REIS e BORNIA, 2010).
Galton, através de seus estudos buscava mostrar as relações existentes entre as característi-
cas de um individuo com as características de seu pai, ou seja, como se estivesse analisando
as hereditariedades existentes, por exemplo, pais altos filhos consequentemente altos.
Com passar do tempo, estes trabalhos foram sendo aperfeiçoados, dando origem a técnica
estatística de regressão, com grandes aplicações nas Engenharias de Computação, Mecâni-
ca e outras.
208 Unidade 5
Logo, ao estudarmos a relação existente entre duas ou mais variáveis, a partir
da determinação obtida com base em amostras selecionadas, poderemos usar a
técnica para nos auxiliar a obtermos resultados mais confiáveis.
Na regressão linear simples, a qual a autora está focando essa temática, faz-se uso
de duas variáveis:
Unidade 5 209
Para compreender o processo, observe o exemplo dado anteriormente no estudo
de correlação linear, (considerando uma amostra aleatória, composta por 10 dos
98 alunos da 3ª fase do curso de Engenharia da Faculdade X, com suas respecti-
vas notas em duas disciplinas: Cálculo e Estatística), obtêm-se a (Tabela 59):
Tabela 59 - Amostra aleatória, composta por 10
dos 98 alunos da 3ª fase do curso de Engenharia
da Faculdade X, semestre 2013-1
Cálculo (x) Estatística (y) x.y x2
5.0 6.0 30 25
8.0 9.0 72 64
7.0 8.0 56 49
10.0 10.0 100 100
6.0 5.0 30 36
7.0 7.0 49 49
9.0 8.0 72 81
3.0 4.0 12 9
8.0 6.0 48 64
2.0 2.0 4 4
= 65 = 65 = 473 = 481
Fonte: Crespo (2009, p.149), adaptado.
Calculando obtêm-se:
Com:
Logo:
210 Unidade 5
DICA
Para traçar a reta no gráfico de dispersão, basta adotar dois de seus pontos dados
e assim se fecha a regressão, o ajustamento da reta no diagrama.
Unidade 5 211
Aproveitando o exemplo anterior, tem-se:
O mesmo poderá ser feito com a nota 1,0 (não existente na tabela), obtendo-se:
Mas como 1,0 ao intervalo [2; 10], a esse processo dá-se o nome de extrapo-
lação.
DICA
VAMOS REFLETIR?
Por que estimar a nota x = 1,0 e não x = 11,0 se ambas ficam fora do intervalo
[2; 10]? Você já viu corretamente algum acadêmico com nota superior a 10,0,
não né! Por isso, o alerta anterior quanto ao cuidado com às extrapolações.
212 Unidade 5
Síntese do módulo
No decorrer desta unidade, você teve a oportunidade de conhecer algumas técni-
cas estatísticas que permitem relacionar variáveis por meio de funções matemá-
ticas, com dados obtidos de uma amostra significativa, podendo a partir daqui,
aplicá-las em seus cursos de Engenharia. Estudou as correlações, suas represen-
tações possíveis através do diagrama de dispersão, assim como aprendeu a calcu-
lar o coeficiente de correlação de Pearson, como fazer o ajustamento de uma reta
e como estimar valores por meio de interpolações e extrapolações para auxiliar
nas tomadas de decisões, com maior habilidade e certeza nos resultados obtidos,
nas áreas as quais estejam inseridos.
ATIVIDADES
Com base na leitura do módulo 13, desenvolva as seguintes questões, individual-
mente e, na sequência, confira suas respostas ao final do livro.
1) A Empresa X, de Criciúma, pretende analisar por meio de um processo de
ajustamento linear (regressão), a relação entre o tempo (x) em dias e o nº de pro-
dutos vendidos, conforme mostra a tabela:
b) O diagrama de dispersão.
Unidade 5 213
período de 2 a 14/julho, uma correlação de qual tipo? Justifique sua resposta.
xi 11 14 19 19 22 28 30 31 34 37
yi 13 14 18 15 22 17 24 22 24 25
Fonte: Crespo (2009, p. 154)
Determine:
a) O coeficiente de correlação;
b) A equação de regressão de Y para X; e
214 Unidade 5
Exercícios complementares
Para fecharmos a unidade 5, sugiro que você exercite seus conhecimentos ad-
quiridos, desenvolvendo as atividades complementares com questões baseadas
em provas como as do ENADE; concursos do IBGE, CELESC e outros, sempre
atento ao apoio que a Estatística nos dá para tomada de decisões.
1) (ENADE) A regressão linear simples apresenta uma relação entre uma variável
dependente (Y) e uma variável independente (X) que mantêm estreito relaciona-
mento. O coeficiente angular é o parâmetro da equação relacionado com a taxa
de variação da variável Y em função de X. O coeficiente de correlação linear de
Pearson serve como um indicador da relação linear entre as duas variáveis me-
dindo o grau deste relacionamento.
Unidade 5 215
2) (Adaptado, COPESE) Para os diferentes conjuntos de dados I, II, III e IV, fo-
ram apresentadas as seguintes representações gráficas em um par de eixos carte-
sianos X e Y.
216 Unidade 5
3) (COPESE) Considere dois conjuntos de dados X e Y (com igual número de
dados entre si) onde X é a variável preditora de Y. Sabendo-se que o coeficiente
de correlação entre X e Y é diretamente proporcional e positivo, pergunta-se:
Qual é o tipo de gráfico, a ser realizado em planilha Excel da Microsoft Office
2007, que permitirá estimar corretamente a equação de regressão e coeficiente de
determinação da regressão linear entre X e Y.
Unidade 5 217
Unidade 6
Teoria da probabilidade
Esta teoria, que teve início com os jogos de azar, nos permite
trabalhar com experimentos cujos resultados não são
previamente conhecidos, podendo apresentar resultados
diferentes, mesmo se forem repetido inúmeras vezes, sob
as mesmas condições, sendo essas variações conhecidas
como o acaso. Com tantas incertezas, trabalha-se com a
chance de alguma resposta para determinado fenômeno.
Para o estudo dessa subárea estatística, recomenda-se que
antes de você começar a leitura dos módulos, faça uma revisão
do conteúdo matemático estudado em Análise Combinatória
durante o ensino médio, para sua melhor compreensão.
No decorrer desta unidade, abordaremos primeiramente
conceitos, propriedades e tipos de probabilidade para, na
sequência, entrarmos em Distribuições Probabilística dos
tipos discretas e contínuas e, posteriormente, trataremos a
respeito de alguns modelos probabilísticos que servirão como
pré-requisito para ingressar no mundo das inferências e, sem
dúvida, apoiá-lo (a) em cálculos que envolvam experimentos
aleatórios, tanto na academia como no mercado de trabalho. ■
Vamos em frente?
Módulo 14
Probabilidade
Probabilidade é a função matemática que quantifica as chances de ocorrer ou
não determinado fenômeno em números entre 0 e 1, 0 para resposta impossível
no fenômeno realizado e, 1 quando se tem certeza de que sairá a resposta, na
próxima jogada.
Por exemplo: ao lançar uma moeda para cima, a probabilidade de retornar cara é
0,5, pois como só existe cara e coroa, metade das opções apresentadas na moeda
representa o resultado esperado. Mas nem sempre é tão fácil, por isso, vamos aos
estudos detalhados dessa subárea?
Unidade 6 221
14.1 Espaço amostral
Em outras palavras são os experimentos sujeitos ao acaso, tão logo, como não se
pode prever seus resultados, os pesquisadores procuram descobrir as possibili-
dades de ocorrência de cada experimento aleatório, através da teoria da proba-
bilidade.
Por exemplo, se você for convidado a retirar um bilhete de uma urna num sorteio
de brindes, estando estes numerados de 1 a 50, ao retirar o bilhete não saberá
qual número irá sortear, não é mesmo? Neste caso, tem-se um experimento alea-
tório, foco de nossos estudos em probabilidade.
b) Pegar uma caixa de baralho com 52 cartas, escolher uma carta e observar seu
222 Unidade 6
Naipe: = {espadas; copas; ouros; paus};
Unidade 6 223
2º) Aplica-se a regra da multiplicação (Termo usado: SIMULTÂNEOS):
n( ) = n( 1
) . n( 2
) = 6 . 2 = 12
DICA
Sempre que for mencionado o termo ANAGRAMA, trata-se de análise
combinatória do tipo PERMUTAÇÃO.
VAMOS REFLETIR?
224 Unidade 6
elementos:
={(1,K); (1,C); (2,K); (2,C); (3,K); (3,C); (4,K); (4,C); (5,K); (5,C); (6,K);
(6,C)}
ESTUDO COMPLEMENTAR
Caro leitor, caso tenha dúvidas ou interesse em ampliar seu conhecimento
em Análise Combinatória, poderá buscar informações no livro: GIOVANNI,
José Ruy e BONDORJO, José Roberto. Matemática: uma nova abordagem, vol. 2, versão tri-
gonometria – São Paulo: FTD, 2000. (Coleção Matemática uma nova abordagem).
14.2 Evento
Exemplos:
1 - Suponha que José Antonio, o gerente de uma empresa X, queira sortear dois
brindes durante uma confraternização, entre quatro dos seus funcionários (Ar-
tur; Beatriz; Helena e José) que mais venderam em 2012, de modo que cada fun-
cionário sorteado receba um brinde:
= { ( A; B); (A; H); (A; J); (B; H); (B; J); (H; J)}, logo, o número de elementos
do espaço amostral é igual a 6, sendo representado por n ) = 6 combinações.
Unidade 6 225
A = { (A; B); (A; H); (B; H); (B; J); (H; J)}, logo, o número de elementos do even-
to é: n (A) = 5 combinações.
b) Qual será o evento E definido pela ocorrência de números iguais nos 2 dados?
Tão logo se pode também afirmar que o número de elementos do evento é: n (E)
= 6 combinações.
c) Qual será o evento G para determinar a ocorrência de números cuja soma seja
4?
226 Unidade 6
14.3 Tipos de eventos
A = { 1; 2; 3; 4; 5; 6} n(A) = 6
Unidade 6 227
A esse evento dá-se o nome de EVENTO CERTO: quando o espaço amostral é
igual ao evento, = A é porque o evento sempre ocorrerão por isso, sua classi-
ficação como Evento Certo.
B = { 2; 4; 6} n(B) = 3
D={4} n(D) = 1
A = { (1; 3; 5) };
B = { (2) };
E=A B = { ( 1; 3; 5) } { ( 2) } E = { (1; 2; 3; 5) } n ( E) = 4
228 Unidade 6
f) O evento F: de ocorrer um número par e múltiplo de 4?
A = { (2; 4; 6) };
B = { (4) };
A = { (2; 4; 6) };
B = { (1; 3; 5) };
Unidade 6 229
A = { (2; 4; 6) };
A= { (1; 3; 5) };
H1 = A A = { (2; 4; 6) } { ( 1; 3; 5) } = { (1; 2; 3; 4; 5; 6) } = (H) (o próprio
espaço amostral); e
DICA
Tão logo, atento aos exemplos de Jorge, conclui-se que os eventos podem
ser do tipo: Certo; Qualquer; Impossível, Elementar, União, Intersecção, Mu-
tuamente Exclusivos e Complementares.
Os eventos complementares, independentes e mutuamente exclusivos também
podem ser compreendidos e aplicados por meio dos conceitos da teoria dos con-
juntos. Considerando A e B eventos quaisquer, tem-se:
Tabela 60 - Operações de eventos
Evento ocorre
Operação Notação Conjunto
quando:
Reúne os elementos de ambos os Ocorrer pelo menos
União AB
conjuntos um deles (A, B, ambos)
230 Unidade 6
Vamos fazer mais uma “pausa”? Que tal você analisar os exemplos descritos a
seguir para compreender melhor a Tab. 60?
União:
A B = {2; 3; 4; 5; 6} A C = {2; 4; 6} A A=
Intersecção:
A B = {4; 6} A C = {6} A A=
Releia!
Para facilitar sua interpretação, poderá fazer uso dos diagramas a seguir:
Unidade 6 231
14.4 Definição de probabilidade
P (E) = n (E)
n( )
Sendo:
Exemplo: Voltando ao exemplo mencionado no item 14.2, suponha que José An-
tonio, o gerente de uma empresa X, queira sortear dois brindes durante uma con-
fraternização entre quatro dos seus funcionários (Artur; Beatriz; Helena e José)
que mais venderam em 2012, de modo que cada funcionário sorteado receba um
brinde. Qual a probabilidade de José ser sorteado?
1º) Defini-se o espaço amostral: = { (A; B); (A; H); (A; J); (B; H); (B; J); (H; J)};
232 Unidade 6
2º) Calcula-se o número de elementos do evento: E = { (A; J); (B; J); (H; J)}, logo,
n (E) = 3 combinações.
DICA
a) O espaço amostral:
= { 1; 2; 3; 4; 5; 6} )=6
Unidade 6 233
Logo: B = {2; 4; 6} n(B) = 3 P (B) = 3 = 1 = 0,5 ou 50%
6 2
234 Unidade 6
Sabendo-se que: n (A B) = n (A) + n (B) – n (A B), dividindo-se tudo por n
(U),ou seja, n ), chega-se também à fórmula anterior:
n (A U B) n (A)
= + n (B) - n (A B)
n (U) n (U) n (U) n (U)
P (A B) = P (A) + P (B) – P (A B)
P (A B) = P (A) + P (B)
= {1; 2; 3; 4; 5; 6} n )=6
3º) Determina-se:
A B = {3} n (A B) = 1
P (A B) = P (A) + P (B) – P (A B)
= n (A) + n (B) - n (A B) = 1 + 3 - 1 = 3 = 1
n (U) n (U) n (U) 6 6 6 6 2
ou P (A B) = 50%
Unidade 6 235
Chamando de A o evento da ocorrência de obter um número 6 ou um número
par, tem-se:
A = {2; 4; 6} n (A) = 3
Portanto:
n (A)
P (A) = = = = 3 = 1 = 50%
n (U) 6 2
Isso só é possível sabendo aplicar o evento união de forma correta.
p+q=1
A soma da probabilidade de ocorrer e não ocorrer esse evento resultará sempre
em 100% ( porcentagem) ou 1 ( proporção).
Para lembrar!
236 Unidade 6
14.4.3 Probabilidade de eventos independentes
Adotando:
= {1; 2; 3; 4; 5; 6} )=6
P = P (A) . P (B) P= 1 . 1 = 1
6 6 36
Dois ou mais eventos são considerados mutuamente exclusivos, quando para que
um deles ocorra o outro não ocorrerá.
Tão logo, não podem ocorrer simultaneamente, sendo a intersecção desses even-
tos vazia, ou seja, A B = .
Unidade 6 237
Adotando:
= {1; 2; 3; 4; 5; 6} )=6
A = {2} n(A) = 1
= {1; 2; 3; 4; 5; 6} )=6
B = {5} n(B) = 1
P = P (A) + P (B) P= 1 + 1 = 2 = 1
6 6 6 3
238 Unidade 6
14.5 Probabilidade condicionada
Para calcular a probabilidade quando ocorrem eventos seguidos, tais como, lan-
çar mais de uma vez um dado, é necessário observar se a repetição se dá:
a) Com reposição; ou
b) Sem reposição.
Por exemplo:
1) Considere uma embalagem com 200 peças, sendo 190 perfeitas e 10 com de-
feito. Qual a probabilidade de retirarmos, ao acaso, duas peças com defeito dessa
embalagem?
Evento A = retirar a 1ª peça com defeito;
Analisando:
Unidade 6 239
Neste caso, perceba que a probabilidade de B está condicionada a de A, por isso,
probabilidade condicionada.
240 Unidade 6
14.6 Teorema da multiplicação
Unidade 6 241
a impressora apresenta defeitos. De observações anteriores, a empresa sabe que
2% e 3% são as taxas de impressoras fabricadas com algum defeito em A e B, res-
pectivamente. Sabendo-se que a fábrica A é responsável por 40% da produção,
qual é a probabilidade de que a impressora escolhida tenha sido fabricada em A?
Portanto:
Evento A: impressora fabricada em A.
P (D) = P (D A) (D B), esses eventos são disjuntos, pois não pode ter sido
fabricado em A e B ao mesmo tempo, logo:
242 Unidade 6
aproximadamente.
Síntese do módulo
Caro leitor, neste módulo, foram abordados os conceitos de espaço amostral,
evento e probabilidade. Você estudou os tipos de eventos, como determinar o
número de elementos de um evento e como determiná-los. Aprendeu a calcular
a probabilidade de um evento e também a probabilidade de mais eventos, entre
elas:
- a probabilidade condicional.
Unidade 6 243
ATIVIDADES
Com base na leitura do módulo 14, desenvolva as seguintes questões, individual-
mente e, na sequência, confira suas respostas ao final do livro.
a) P (D)
b) P (B)
c) P (D B)
d) P (D / B)
e) P (B / D)
244 Unidade 6
g) A probabilidade de o pacote de leite estar fora das especificações, sabendo-se
que é do tipo UHT.
Unidade 6 245
Módulo 15
Distribuições de probabilidade
Os engenheiros e outros profissionais das áreas exatas costumam dar preferência
a situações problemas que envolvam variáveis quantitativas por acreditarem ser
mais palpáveis e até mesmo por possuírem maiores habilidades para lidar com
elas.Até o momento, em probabilidade, a maioria dos eventos foram apresenta-
dos de forma textual (verbal), tais como: a ocorrência de sair um número múlti-
plo de 4; de cair cara ao lançar uma moeda; e outros.
Você então deve estar se perguntado: será possível definir esses eventos por meio
de números? Sim, basta associar números aos resultados do espaço amostral ),
através de uma função denominada variável aleatória, (temática esta a ser abor-
dada na sequência), com o intuito de contribuir para que os interessados consi-
gam tomar decisões que envolvam incertezas com maior segurança, como: lançar
ou não um novo produto no mercado, se mudar a grade curricular afetará ou não
o público alvo ao ponto de aumentar a evasão escolar, etc.
Vamos em frente!
Unidade 6 247
15.1 Variáveis aleatórias
Por exemplo: Suponha o Experimento Aleatório lançar duas vezes uma moeda
honesta e observar a face superior, com interesse em determinar o número de
coroas obtidas.
Logo, os autores, assim como Barbetta, Reis e Bornia (2010, p. 117), formalizam
o conceito de variável aleatória como: “uma função que associa elementos do
espaço amostral ao conjunto de números reais”. Na verdade, o processo adotado
248 Unidade 6
no exemplo anterior.
DICA
Uma variável aleatória é discreta quando assume valores que podem ser con-
tados; e contínua, quando assume valores de um determinado intervalo.
Ao se definir uma variável aleatória discreta, por exemplo, obtêm-se duas infor-
mações a respeito do que pode ocorrer no experimento aleatório, podendo estas
ser claras (diretas) ou suposições que respondam a:
Unidade 6 249
15.2 Distribuição probabilística
b)
DICA
Cuidado: existe diferença entre a distribuição de frequência e a distribuição
de probabilidade. Na de frequência são mostrados os valores observados com
efetivas realizações do experimento e na probabilidade são mostrados os possíveis valores,
alocados a partir de suposições a respeito do experimento aleatório.
250 Unidade 6
2º) Define-se X pela soma entre os dados:
X = {1 + 1 = 2; 1 + 2 = 3; 1 + 3 = 4; ...; 6 + 6 = 12}
Unidade 6 251
b) Qual a probabilidade da soma entre os dois dados ficar entre 6 e 10?
2) Suponha que tenha sido realizada uma pesquisa com uma turma de 30
jovens para identificar o número de integrantes na família e verificou-se que:
252 Unidade 6
15.3 Função de distribuição acumulada
As funções são muito similares, o que muda é que a acumulada trabalha com P
(X < xi ) ao invés de usar P ( X = xi ).
Unidade 6 253
Mas como proceder com variáveis aleatórias contínuas?
As variáveis aleatórias contínuas, como por exemplo:
a) Volume de água perdido em um sistema de abastecimento;
c) Outros
O melhor a fazer é definir uma variável aleatória contínua, por meio de uma
função.
Para representar uma variável aleatória contínua, usa-se uma função densidade
(não negativa) de probabilidade, conforme mostra a Fig. 13, definida para todos
os valores possíveis da variável aleatória.
254 Unidade 6
Essa área poderá ser calculada através:
a) Do cálculo da integral da função no intervalo de interesse do pesquisador;
b) De fórmula matemáticas simples; e
c) De tabelas pré-calculadas, encontradas na maioria dos livros de estatística.
ESTUDO COMPLEMENTAR
Algumas tabelas estatísticas poderão ser conhecidas caso tenha interesse
nos anexos do livro: BARBETTA, P. A, Estatística: para cursos de engenharia e informática
/ Pedro Albert Barbetta, Marcelo Menezes Reis, Antonio Cezar Bornia. – 3. Ed. – São Paulo:
Atlas, 2010
Mas atenção:
a)
b)
Analise o exemplo no texto a seguir:
TEXTO COMPLEMENTAR
Vamos calcular a probabilidade da resposta demorar mais do que 3 minutos, isto é, P(T > 3).
P(T > 3) =
{
Gráfico 21 – Tempo de resposta
na consulta a um banco de dados
Fonte: Barbetta, Reis e Bornia (2008, p. 144)
Unidade 6 255
15.4 Função densidade de probabilidade
Valor Médio ou Valor Esperado, simbolizado por E(X), pode ser entendido
como a média aritmética simples, estudada na análise exploratória de dados,
utilizando as probabilidades ao invés das frequências, dado por:
, sendo
256 Unidade 6
No mercado de trabalho, o cálculo do valor esperado é de grande valia quando
precisamos realizar comparações entre possíveis fornecedores, clientes, produ-
tos e outros, com foco no maior lucro ou prejuízo para empresa. (REIS, 2008).
Unidade 6 257
b) a Variância dada por:
V(X) = E(X2) – [E(X)]2 sendo E(X2)
Síntese do módulo
Neste módulo, você aprendeu a conceituar uma variável aleatória e suas classifi-
cações: discreta e contínuas, cada qual com suas representações.
Para finalizar foi explicado como calcular as medidas de valor médio, variância e
desvio padrão para distribuição de probabilidades.
ATIVIDADES
Com base na leitura do módulo 15, desenvolva as seguintes questões, individual-
mente e, na sequência, confira suas respostas ao final do livro.
258 Unidade 6
2) O quadro a seguir apresenta o número de acidentes com vítimas fatais durante
o feriadão de Corpus Christi, na BR101, do estado de Santa Catarina, em 2013.
b) A variância do lucro;
c) Sabe-se que com a redução de desperdícios foi possível aumentar uma unidade
no lucro de cada unidade do produto, qual será o novo valor esperado e a variân-
cia do lucro por unidade?
d) Mas caso o lucro tenha duplicado, qual será o novo valor esperado e a variân-
cia do lucro por unidade?
Unidade 6 259
Módulo 16
Modelos probabilísticos
Para cada tipo de variáveis aleatórias poderão ser construídos alguns Modelos
Probabilísticos.
Neste módulo, abordaremos alguns dos modelos padrões, os quais podem ser
usados em várias situações práticas. Para ter êxito em seus estudos é importante
que saiba definir qual o modelo adequado ao seu estudo em questão, no momen-
to de aplicá-lo.
Vamos conhecê-los?
Unidade 6 261
16.1 Modelos probabilísticos para variáveis aleató-
rias discretas
DICA
Lembre-se que, ao identificarmos uma variável aleatória discreta, precisamos
conhecer quais resultados podem ocorrer e quais são as suas probabilidades.
Entre os modelos probabilísticos discretos, temos:
Por exemplo:
Para cada caso, adotam-se os termos sucesso e fracasso para os dois eventos
possíveis.
262 Unidade 6
Onde p = P (sucesso)
Por exemplo:
1) E(X) = p
2) V(X) = p (1 – p)
3)
P(X = x) = px . q1 - x
Por exemplo:
Uma urna tem 30 bolas vermelhas e 20 amarelas. Retira-se uma bola dessa urna.
Seja X o número de bolas amarelas. Vamos calcular E(X), V(X) e determinar a
função P(X = x)?
Unidade 6 263
16.1.2 Distribuição Binomial
Sendo:
n = o número de vezes que o experimento ocorre;
x = o número de vezes que queremos que o sucesso ocorra x {0; 1; 2; ...; n};
q = é a probabilidade do fracasso, q = 1 – p.
DICA
264 Unidade 6
Para esse modelo de distribuição, têm-se:
Resolução:
N=6 x=4
Este modelo de distribuição pode ser adotado para descrever quando um evento
aleatório ocorre durante um intervalo de tempo ou espaço (ou algum volume de
matéria). (SOUZA e VARGAS, 2009).
Sendo:
x = número de vezes que se pretende que o sucesso ocorra, x {0; 1; 2;3; 4;...}.
Em outras palavras, esta distribuição trabalha com suposições básicas, tais como:
Unidade 6 265
a) Independência entre as ocorrências do evento considerado;
b) Os eventos ocorrem de forma aleatória, de tal forma que não haja tendência de
aumentar ou reduzir as ocorrências do evento no intervalo considerado.
Este tipo de distribuição costuma ser utilizado para descrever eventos raros e com
um grande número de tentativas, tais como: o número de chamadas telefônicas a
cobrar recebidas durante 1 ano, número de defeitos em um m2 de piso cerâmico,
o número de consultas a um banco de dados em um minuto, entre outros.
(média) = 30 veículos/minuto
266 Unidade 6
3) Suponha que as consultas num banco de dados ocorram de forma indepen-
dente com uma taxa média de 3 consultas por minuto. Qual a probabilidade de
que no próximo minuto ocorra menos do que 3 consultas ao banco?
(média) = 3 consultas/minuto
portanto:
P (X < 3) = P (X = 0) + P (X = 1) + P (X = 2)
ESTUDO COMPLEMENTAR
Caso você queira exercitar melhor os modelos probabilísticos estudados,
busque exemplos e exercícios na obra de MAGALHÃES, M. N.. Noções de
Probabilidade e Estatística / Marcos Nascimento Magalhães, Antonio Carlos Pedroso de
Lima – 7.ed. – São Paulo: Editora da Universidade de São Paulo, 2010.
Agora vamos nos ater aos modelos probabilísticos mais usados para variáveis
contínuas.
Unidade 6 267
A representação geométrica de uma distribuição normal pode ser visualizada
através da (Fig. 14):
c) A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já
que essa área corresponde à probabilidade de a variável aleatória X assumir qual-
quer valor real;
268 Unidade 6
Quando = 0 e = 1, temos o que chamamos de distribuição normal padrão ou
normal standard e, consequentemente, sua função densidade de probabilidade é
dada por:
Unidade 6 269
Para aplicar este processo faz-se necessário:
1 - saber a média e o desvio padrão da distribuição X;
2 – adotar z com média = 0 e desvio padrão = 1; e
3 – buscar as probabilidades de z nas suas respectivas tabelas, disponibilizada no
anexo 2, em livros de estatística e na própria Internet.
Sabendo-se que a probabilidade procurada P(2 < X < 2,05) corresponde à área
destacada na (Fig. 16):
Portanto:
Para X = 2, tem-se: e para X = 2,05,
270 Unidade 6
Agora, escrevem-se esses dados na forma simbólica, substituindo os valores e
trocando X por Z:
Na sequência, busca-se o seu respectivo valor na tabela Z (anexo 2). Neste ex-
emplo, o valor de z = 1,25, pois, como já mencionado, tende a facilitar nossos
cálculos.
Portanto:
Unidade 6 271
Logo:
Como P (0 < Z < 1,25) = 0,3944, pela simetria da curva, pode-se afirmar que:
P (– 1,25 < Z < 0) = P (0 < Z < 1,25) = 0,3944
Tem-se:
P (– 0,5 < Z < 1,48) = P (– 0,5 < Z < 0) + P ( 0 < Z < 1,48)
Logo, atentos à tabela Z (anexo X), obtém-se as probabilidades:
P (– 0,5 < Z < 0) = P ( 0 < Z < 0,5) = 0,1915 e P ( 0 < Z < 1,48) = 0,4306, tão logo:
P (– 0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221
272 Unidade 6
Tem-se:
P (0,8 < Z < 1,23) = P (0 < Z < 1,23) – P (0 < Z < 0,8)
Como as probabilidades de acordo com a tabela Z (anexo X) de:
P (0 < Z < 1,23) = 0,3907 e P ( 0 < Z < 0,8) = 0,2881
A probabilidade P (0,8 < Z < 1,23) resultará em: 0,3907 – 0,2881 = 0,1026
Tem-se:
P ( Z > 0,6) = P ( Z > 0) – P (0 < Z < 0,6)
Como:
P ( Z > 0) = 0,5 e P (0 < Z < 0,6) = 0,2258, então:
A probabilidade P ( Z > 0,6) = 0,5 – 0,2258 = 0,2742
Unidade 6 273
Sendo a probabilidade procurada P (Z < 0,92) representada pela curva da (Fig.
21):
Tem-se:
P ( Z < 0,92) = P ( Z < 0) + P ( 0 < Z < 0,92)
Como de acordo com a tabela Z (anexo x), os valores de:
P ( Z < 0) = 0,5 e P ( 0 < Z < 0,92) = 0,3212
Obtém-se:
P( Z < 0,92) = 0,5 + 0,3212 = 0,8212
1º) Estando esta probabilidade entre 75 e 81, tem-se: P (75< X < 81) que até então
é desconhecida.
2º) Trocando a variável X pela variável normal padronizada Z, por meio da fór-
mula
Encontra-se para:
274 Unidade 6
Logo, P (75 < X < 81) = P ( 0 < Z < 1).
Síntese do módulo
Neste módulo, foram apresentados alguns modelos probabilísticos com concei-
tos, fórmulas para calcular as probabilidades e exemplos, tanto para variáveis
aleatórias discretas como contínuas.
Unidade 6 275
ATIVIDADES
Com base na leitura do módulo 16, desenvolva as seguintes questões, individual-
mente e, na sequência, confira suas respostas ao final do livro.
EXERCÍCIOS COMPLEMENTARES
Para fecharmos a unidade 6, sugiro que você exercite seus conhecimentos ad-
quiridos, desenvolvendo as atividades complementares com questões baseadas
em provas como as do ENADE; concursos do IBGE, CELESC e outros, sempre
atento ao apoio que a Estatística nos dá para tomada de decisões.
276 Unidade 6
a) 24
b) 56
c) 336
d)
1680
e) 40320
a) 2,28; 95,44.
b) 52,28; 95,44.
c) 2,28; 98,69.
d) 98,69; 95,44.
e) 98,65; 2,28.
Unidade 6 277
No jogo de poker, uma das combinações de 5 cartas mais valiosas é o full house,
que é formado por três cartas de mesmo valor e outras duas cartas de mesmo va-
lor. São exemplos de full houses: i) três cartas K e duas 10 (como visto na figura)
ou ii) três cartas 4 e duas Ás.
a) 156.
b) 624.
c) 1872.
d) 3744.
e) 7488.
a) 61 b) 61 c) 67 d) 61 e) 67
73 155 155 112 112
278 Unidade 6
5) (ENADE) Para o desenvolvimento de um projeto, determinada organização
precisa definir dois grupos de trabalho, um com três membros e outro com qua-
tro membros. Para o grupo de três elementos, o primeiro indivíduo nomeado
será o presidente, o segundo, o relator, e o terceiro será o auxiliar, enquanto que,
para o de quatro elementos, a ordem de nomeação não é relevante. Essa organi-
zação conta com um quadro de quatorze funcionários, todos igualmente aptos
a compor qualquer um dos grupos de trabalho, em qualquer função, sendo que
cada um deles integrará, no máximo, um desses grupos.
a 5/216
b) 6/216
c) 15/216
d) 16/216
e) 91/216
Unidade 6 279
8) (ENADE) No Hemocentro de uma grande cidade, está havendo falta de
sangue tipo AB. Uma pesquisa nessa cidade revelou as seguintes proporções de
pessoas em cada tipo sanguíneo:
a)
b)
c)
d)
e)
a) 49,38
b) 49,53
c) 99,38
d) 0,62
280 Unidade 6
Unidade 7
Inferência estatística
Nesta unidade serão abordados temas relacionados a mais uma parte da
estatística: a inferência estatística, também conhecida como estatística indutiva.
A estatística inferencial é a subárea que engloba um conjunto de técnicas
aplicadas por interessados, em estudar uma população, através de evidências
encontradas em amostras significativas, das quais resultarão algumas
medidas importantes para pesquisa. (MAGALHÃES e LIMA, 2010)
Como dificilmente, se consegue agrupar todos os dados de uma população
para comparar as medidas com seus padrões específicos, o que significa
em outras palavras: para aferir o parâmetro desejado, faz-se necessário
trabalhar com estimativas de parâmetros populacionais para realizar
alguns testes estatísticos, os quais se baseiam em amostras.
Finalizando seus estudos, no módulo 17, você verificará como se relacionam
estatísticas com parâmetros, isto é, como se relacionam as características dos
elementos de uma amostra com as características dos elementos de uma
população além de conhecer como são calculados alguns estimadores, como
média, variância, desvio padrão populacional e proporção populacional.
Na sequência, no último módulo, será falado a respeito de testes de
hipóteses aplicados por estatísticos para testar a veracidade de
suas ideias sobre a população ou populações em questão, por meio
de dados amostrais, validando assim suas pesquisas. ■
Módulo 17
Estimação
Para ingressar no mundo da inferência estatística, faz-se necessário em um pri-
meiro momento, ter claro a que se referem alguns termos, depois sim se pode
começar a calcular algumas estimativas, entre elas: a média, variância/desvio pa-
drão e a proporção, para aplicá-los nos testes de significância (os quais) tendem a
colaborar com os gestores para tomadas de decisões mais eficazes.
Unidade 7 283
17.1 Parâmetros e estatísticas
E com essas representações consegue dar início aos cálculos paramétricos e es-
tatísticos.
284 Unidade 7
a) Parâmetro, refere-se a um valor geralmente desconhecido e que está relaciona-
do a uma característica da população, enquanto;
, onde:
Unidade 7 285
DICA
Quando se depara com n sendo igual ao tamanho da população, tem-se a
média populacional (lê-se: mi). Como nem sempre isso ocorre, fala-se que
x é um estimador de .
Por exemplo:
Suponha que o proprietário da loja JAT Modas, no município de Criciúma, com
o objetivo de verificar quantas peças de roupas, em média, são vendidas por
mês, tenha coletado as vendas, de três tipos de mercadorias, dos seis últimos
meses de 2012, conforme estão descritos na (Tab. 65):
Este estimador serve para representar a variação, em relação à média, dos ele-
mentos de uma determinada variável aleatória. Dentre outros estimadores, a
variância é uma medida bastante utilizada na inferência estatística. (MAGA-
LHÃES; LIMA, 2010)
286 Unidade 7
O valor do estimador variância determina-se matematicamente pela fórmula:
sendo:
s2 = variância populacional;
Xi = os valores da variável;
x = média amostral; e
n = quantidade de valores.
DICA
Tomando o exemplo da JAT Modas, mostrado na Tab. 65, qual será o valor esti-
mado da variância populacional das vendas mensais, por Vilton, o proprietário,
da loja?
(85 - 75,1667)2 + (56 - 75,1667)2 + (49 - 75,1667)2 + (107 - 75,1667)2 + (52 - 75,1667)2 + (102 - 75,1667)2
6-1
Unidade 7 287
17.1.3 Estimador: Desvio Padrão
DICA
Se extrair a raiz quadrada da variância populacional, estará determinando o
desvio padrão populacional, (sigma), mas como nem sempre, se tem em
mãos a variância populacional, conclui-se que s é um estimador de .
Ainda tomando o caso da JAT Modas como exemplo, para Vilton calcular o valor
do desvio padrão estimado para as vendas da loja nos 6 meses, bastaria calcular
a raiz quadrada da variância conhecida, ou seja:
288 Unidade 7
de p.
Ainda para o exemplo da JAT Modas, caso Vilton tenha interesse conseguirá
estimar proporcionalmente suas vendas de camisa gola a polo e para as demais
mercadorias, bastando aplicar para cada item, descrito na (Tab. 65):
ou 58,98%.
ou 14,19%
O que permitirá ao proprietário da loja saber que suas vendas foram melhor no
item camisetas, depois camisa gola a polo e, por fim, em blusas sociais, o que lhe
auxiliará a tomar decisões significativas para os próximos períodos.
Média
Variância
Desvio Padrão
Proporção
Unidade 7 289
Síntese do módulo
Neste módulo, você teve início á subárea da estatística no que tange à estatística
indutiva. Conheceu os conceitos de parâmetros, estatísticas e estimativas. Estu-
dou que enquanto os parâmetros são medidas que servem para descrever certa
característica da população, as estatísticas são medidas que descrevem certa ca-
racterística dos elementos da amostra e que estimativa é o resultante obtido no
cálculo de determinada estatística, quando aplicada para se conhecer o parâme-
tro de interesse.
ATIVIDADES
Com base na leitura do módulo 17, desenvolva as seguintes questões, individual-
mente e, na sequência, confira suas respostas ao final do livro.
Região Norte 3.514.898 2.822.616 692.282 2.325.379 1.776.650 548.729 1.189.519 1.045.966 143.553
Região
12.763.114 10.129.040 2.634.074 8.375.218 6.311.667 2.063.551 4.387.896 3.817.373 570.523
Nordeste
Região
18.840.494 14.532.028 4.308.466 16.772.754 12.724.072 4.048.682 2.067.740 1.807.956 259.784
Sudeste
Região Sul 6.644.573 5.211.064 1.433.509 5.209.693 3.958.647 1.251.046 1.434.880 1.252.417 182.463
Região
3.077.323 2.404.962 672.361 2.598.671 1.982.162 616.509 478.625 422.800 55.852
Centro-Oeste
Fonte: Souza e Vargas (2009, p. 116), adaptada.
290 Unidade 7
Determine os itens solicitados nos exercícios 1, 2 e 3 a seguir, fazendo uso da
tabela acima.
1) A média de:
3) Qual região tem a maior proporção de mulheres fumantes (em relação ao total
de fumantes de cada região).
Unidade 7 291
Módulo 18
Testes de hipóteses
Também conhecidos como testes de significância, são de extrema relevância no
cotidiano dos gestores, estando estes inclusos na subárea estatística indutiva.
Mas você deve estar se perguntando: para que serve e como realizar um teste de
hipótese, não é mesmo?
Unidade 7 293
18.1 Definições introdutórias a testes de significân-
cia
Os testes de hipóteses são aplicados para analisar se a diferença que existe entre
um parâmetro e uma estimativa está relacionada à amostra ser aleatória ou se
existe distorção na seleção da amostra. Quando a diferença é muito grande, o
interessado deverá desconfiar da integridade na escolha da amostra.
A princípio, você deve estar se perguntado por que realizar estes testes, mas não
esqueça, no nosso cotidiano pode-se afirmar, muitas vezes, até erroneamente que
as coisas são iguais ou diferentes, mas estatisticamente isto não é permitido. Essas
conclusões só têm validade quando resultantes de algum teste, caso contrário,
nada é igual e nada é diferente!
Tem-se como:
H1: < X, a média do peso contido na embalagem de café é menor que o valor
mencionado na embalagem.
294 Unidade 7
H0: = 19, ou seja, a média populacional é igual a 19 anos; e
Durante a realização dos testes de significância, trabalha-se com dois tipos pos-
síveis de erro: o erro do tipo I ou o erro do tipo II.
Este erro se dá quando se rejeita a hipótese nula (Ho) quando, na verdade, deveria
ter sido aceita.
DICA
Unidade 7 295
18.3 Erro do tipo II
Já esse tipo de erro ocorre quando se aceita a hipótese nula (H0), devendo esta,
na verdade, ter sido rejeitada. Simbolicamente, o erro do tipo II é representado
pela letra grega .
Para sua melhor compreensão, analise o resumo dos tipos de erros apresentados
no (QUADRO 8):
DICA
Ao analisar o QUADRO 8, poderá verificar que o erro do tipo I ocorre quando
se rejeita a hipótese nula, enquanto o erro do tipo II ocorre quando se aceita
a hipótese nula.
296 Unidade 7
- Primeiramente, formulam-se as duas hipóteses: a hipótese nula (H0) e a alter-
nativa (H1);
- Baseando-se na hipótese alternativa (H1) e no nível de significância ( ), esta-
belece-se as regiões de aceitação e rejeição da hipótese nula (H0) e o valor crítico;
- No terceiro passo, calcula-se o valor da variável do teste; e
- Por fim, aceita-se ou rejeita-se a hipótese nula (H0) comparando-se o valor cal-
culado da variável do teste com a região de aceitação ou rejeição.
Existem vários testes de hipóteses, mas nos ateremos a dois deles pela sua aplica-
bilidade no mercado de trabalho:
- o teste de hipóteses para média; e
- o teste de hipóteses para a proporção.
Nesta obra, nos ateremos apenas ao item a para exemplificá-lo, mas nada o impe-
de de buscar exemplos relacionados ao item b, em livros, vídeos e outros.
a) Imagine que o INMETRO faça uma inspeção numa fábrica de tijolos que diga
que o tamanho dos seus tijolos segue uma distribuição normal com
Unidade 7 297
= 20 cm e = 2 cm. Para verificar, o auditor recolhe uma amostra com 10
unidades obtendo as medidas: 18; 23; 20; 21; 22; 23; 22; 21; 21; 20. O INMETRO
trabalha, neste caso, com um erro estatístico de 5%, ou seja, o nível de significân-
cia é de 5%, logo com um nível de confiança de 95%.
H0: = 20 cm e H1: = 20 cm
Calculando
DICA
O valor 21,1 cm na curva normal é equivalente a 1,74 cm na curva normal
padrão.
Conclusões:
Caso a média amostral padronizada esteja na área de rejeição, neste caso maior
que o valor crítico 1,96 ou menor que o valor crítico simétrico – 1,96, deve-se
298 Unidade 7
rejeitar a hipótese nula, caso contrário, deve-se aceitar.
Para este exemplo, a média padronizada é de 1,74 cm, logo, - 1,96 < 1,74 < 1,96,
o que indica que 1,74 está na área de aceitação da hipótese nula.
Vamos a um exemplo:
Imagine que o diretor de uma Instituição afirme que existe uma taxa de 15% de
reprovação. Para analisar se a taxa de reprovação é diferente, com = 2%, selecio-
nando-se, neste exemplo, aleatoriamente uma amostra de 300 alunos sabendo-se
que 36 reprovaram, como proceder?
P = 15% = 0,15
Unidade 7 299
O valor z para proporção, obtêm-se com:
Conclusão:
Síntese do módulo
Encerramos por aqui nossos conteúdos referentes à estatística. Neste módulo,
foram apresentados os conceitos de testes de hipóteses, tipos de hipóteses, os
tipos I e II de erros. Descreveram-se os níveis de significância, nível de confiança
e também se definiu o poder do teste.
Sabe-se que existem vários tipos de testes, mas preferimos se ater a dois específi-
cos, o teste de hipótese para a média e o teste de hipótese para proporção popu-
lacional, os quais foram explicados por meio de exemplo.
300 Unidade 7
ATIVIDADES
Com base na leitura do módulo 18, desenvolva as seguintes questões, individual-
mente e, na sequência, confira suas respostas ao final do livro.
a) Hipótese nula;
b) Hipótese alternativa; e
EXERCÍCIOS COMPLEMENTARES
Para fecharmos a unidade 7, sugiro que você exercite seus conhecimentos ad-
quiridos, desenvolvendo as atividades complementares com questões baseadas
em provas como as do ENADE; concursos do IBGE, CELESC e outros, sempre
atento ao apoio que a Estatística nos dá para tomada de decisões.
Unidade 7 301
igual a 5, com margem de erro 0,1, a um nível de confiança 95%?
a) 100
b) 400
c) 1.000
d) 4.000
e) 10.000
Uma área de preservação ambiental (APA) está parcialmente cercada por uma
comunidade agrícola em sua parte norte. Esta comunidade tem por costume
aplicar a queimada como forma de manejar sua pastagem. Na parte sul, uma área
mais preservada, não existe influência da queimada. Um pesquisador acredita
que a prática de queimada tem afetado a parte norte da APA e que os colibris
poderiam ser um indicador desta alteração. Então, decidiu fazer algumas medi-
ções nas partes norte e sul da APA. Ele mensurou: abundância floral, número de
posturas anuais, peso e frequência de ocorrência de colibris.
Para qual das seguintes hipóteses o pesquisador NÃO teria condição de fazer
inferências?
302 Unidade 7
3) Suponha que as notas dos candidatos de um concurso público, em uma cer-
ta prova, sigam distribuição normal com média 7 e desvio padrão 1. A relação
candidato/vaga é de 40 para 1. A nota mínima necessária para aprovação nessa
prova é
Com base no esquema acima, responda as questões 4.1 a 4.4: Assume-se que: H0:
hipótese da nulidade; HA: hipótese alternativa;
Unidade 7 303
4.2) A área representada pelo “β” indicado no referido esquema representa:
a) O “β” e o “α”
b) O “α” e o “1-α”
c) O “β” e o “1-β”
d) O “α” e o “β”
a) 85,6
b) 78,2
c) 94,5
d) 262,0
304 Unidade 7
RESULTADO DAS ATIVIDADES
UNIDADE 1 – MÓDULO 1:
1.a) R: É descrito com o ESTUDO DO ESTADO. Estatística é uma área da mate-
mática aplicada que disponibiliza métodos e técnicas para sistematicamente: co-
letar dados, organizar, resumir, analisar e interpretá-los de forma concisa, eficaz
e concreta, deixando de lado o “achismo” nas interpretações.
1.c) R: Deve ser aplicado quando você tiver ao seu alcance um grande número de
dados, dificultando a conclusão do estudo em questão. Assim, ao aplicar técnicas
descritivas, você conseguirá reduzir ao máximo essas informações geradas, con-
seguindo interpretar e chegar a algumas conclusões.
UNIDADE 1 – MÓDULO 2:
1) R: Ciências humanas e sociais.
3.a) R: Coleta de dados; Crítica dos dados; Apuração dos dados; Apresentação
Unidade 7 305
dos dados; e Análise dos resultados.
3.c) R: A coleta direta ocorre quando os dados coletados são obtidos via regis-
tros obrigatórios, ou por meio de inquéritos e questionários, aplicados pelo pró-
prio pesquisador interessado.
UNIDADE 1 – MÓDULO 3
1) R: Alternativa C: Conjunto de todos os indivíduos, objetos ou informações
que apresentam pelo menos uma característica em comum.
3) R: Qualitativa: letra B.
306 Unidade 7
UNIDADE 1 – MÓDULO 4
1) R: Amostra de 15% = 18,6 = 19 elementos: 011; 020; 021; 027; 036; 043; 047;
052; 053; 058; 063; 064; 075; 089; 095; 100; 112; 113; 116.
2) R: 021 – 095; 139 – 108; 089 – 071; 053 – 100; 027 – 123; 063 – 072; 036 – 095; 075 – 062; 064 -076;
052 - 120; 011 - 129; 116 - 085; 047 - 090; 112 - 137; 113 - 099; 095 - 092; 100 - 086; 043 - 128; 020 - 056;
058 - 095; 009 - 079; 077 - 116; 127 - 069; 014 - 091; 136 - 106; 041 – 081.
UNIDADE 2 – MÓDULO 5
1) R: 80%.
2) R:
Tabela: Alunos Matriculados na Escola JAT em 2012
SÉRIES ALUNOS MATRICULADOS %
1ª 546 42,9
2ª 328 25,7
3ª 280 22
4ª 120 9,4
TOTAL 1274 100
Fonte: Crespo (2009, p. 28), adapatado
UNIDADE 2 – MÓDULO 6
1) R: Alternativa letra E.
2.a) R: 6 lojas.
Unidade 7 307
2.b) R: 13 lojas.
2.c) R: 60 %.
UNIDADE 2 – MÓDULO 7
3) R: Alternativa B: 8.344.
UNIDADE 3 – MÓDULO 8
1) R: Alternativa E: 10 %.
308 Unidade 7
2.b)
Tabela - Distribuição de frequências
Frequência
Frequência Frequência Frequência
Notas Acumulada
Absoluta (fi) Relativa (fri) em % Acumulada (FAci)
Relativa (FAci %)
30 l 40 4 8 4 8
40 l 50 6 12 10 20
50 l 60 8 16 18 36
60 l 70 12 24 30 60
70 l 80 9 18 39 78
80 l 90 7 14 46 92
90 l 100 4 8 50 100
= 50 = 100 %
Fonte: Diretor da Instituição
3.1) R: Alternativa B: 19
UNIDADE 3 – MÓDULO 9
Unidade 7 309
1.b) Gráfico - Polígono de frequência
310 Unidade 7
1.d) Gráfico - Curva de frequência
3) R: Alternativa D: Em nenhum.
UNIDADE 4 – MÓDULO 10
1) R: TOTAL = ( 10 )
UNIDADE 4 – MÓDULO 11
Unidade 7 311
2.b) R: AT = 8 e desvio padrão = 2,81.
2.c) R: AT = 9,2 e desvio padrão = 3,016.
2.d) R: AT = 20 e desvio padrão = 7,04.
2.e) R: AT = 6 e desvio padrão = 1,51.
2.f) R: AT = 0,7 e desvio padrão = 0,159.
3) R: Em estatística.
UNIDADE 4 – MÓDULO 12
2) R: Alternativa B: 0,191.
3.a) R: Média = 36,10 Mediana = 35,9 Moda = 35,5 e Desvio Padrão = 4,2.
UNIDADE 5 – MÓDULO 13
312 Unidade 7
1.c) R: Correlação negativa está decrescendo. A justificativa é pessoal
UNIDADE 6 – MÓDULO 14
1.a) R: 1 .
3
1.b) R: 1 .
11
1.c) R: 19 .
33
2.a) R: P (D) = 6.500/6.850
2.b) R: P (B) = 530/6.850
2.c) R: P (D B) = 500/6.850
2.d) R: P (D / B) = 500/530
2.e) R: P (B / D) = 500/6.500
2.f) R: 350/6.850 = 0,051
2.g) R: 50/1.550 = 0,032
UNIDADE 6 – MÓDULO 15
Unidade 7 313
2) R:
Quadro – Distribuição de probabilidades do exercício
X 0 1 2 3 4
P ( X = xi ) 29/60 01/abr 01/jun 01/dez jan/60
Fonte: Autora
UNIDADE 6 – MÓDULO 16
1.a) R: 0,0062
1.b) R: 0,8944
1.c) R: 0,9998.
2.a) R: 400/729
2.b) R: 665/729
3) R: Aproximadamente: 0,0000454
UNIDADE 7 – MÓDULO 17
1.a) R: 1.948.138,4
1.b) R: 1.669.302,4
2.b) R: Urbana:
314 Unidade 7
Média = 7.056.343
Variância = 35.452.762.559.481,5
Desvio padrão aproximadamente 5.954.222,2464
Rural:
Média = 1.911.737,4
Variância = 2.239.606.096.121,8
Desvio padrão aproximadamente 1.496.531,3549
UNIDADE 7 – MÓDULO 18
1.c) R: Erro do tipo I: esse erro se dá quando se rejeita a hipótese nula (Ho)
quando, na verdade, deveria ter sido aceita. Erro do tipo II: ocorre quando se
aceita a hipótese nula (H0), devendo esta, na verdade, ter sido rejeitada.
3) R: Bilateral
H0: = 120
H1: ¹ 120
z = 1,6667
Para a/2 = 0,025 temos ztab = 1,96.
Conclusão: Aceitamos H0, pois -1,96 < 1,6667 < 1,96.
Unidade 7 315
Resultado dos exercícios complementares
UNIDADE 1
Sendo que tecnicamente, Dogbert não deveria aplicar a média como medida de
tendência central dos “novos” salários, visto que o novo conjunto de dados tem
um valor muito distinto.
5) R: Variáveis:
6. a) R: Pessoal
316 Unidade 7
6. b) R: Enquanto no censo se analisa todos os elementos da população indivi-
dualmente, na amostragem, trabalha-se com parte significativa deste universo
que tenha condições de representar o todo.
7) R: Alternativa C.
Nesse caso, será escolhida uma amostra aleatória proporcional à amostra total
para cada estrato: professores integral (estrato1), horistas (estrato 2) e visitantes
(estrato 3). Por exemplo: Se existir 100 professores, uma amostra de 10% resulta
em 10 professores, os quais deverão ser selecionados aleatoriamente com algu-
ma técnica estatística adequada para que o número pertencente a cada tipo de
professores também seja de 10% para participar da pesquisa. Se 50 horistas (5
serão selecionados no estrato 2 para amostra), 30 integrais (10% = 3 do estrato
1) e 20 visitantes (10% do estrato 3 = 2 professores).
10) R: Alternativa B.
Unidade 7 317
UNIDADE 2
1) R: Alternativa E.
2) R: Alternativa C.
3) R: Alternativa C.
A cidade X utiliza mais eletricidade que a cidade Y, enquanto o gás e outros ti-
pos de combustível são utilizados com maior frequência pela cidade Y
318 Unidade 7
6. c) R: ERRADO. A variável é continua.
6. d) R: CORRETO.
7) R: Alternativa D.
8) R: Alternativa C
UNIDADE 3
1) R: Alternativa E.
2. 1) R: Alternativa E.
3) R: Alternativa D.
Unidade 7 319
A justificativa se dá com o cálculo da frequência acumulada relativa, basta cal-
cular ((1.100 + 900 + 550)/3000) . 100 = 85%
Sendo 1.100, 900 e 550 as frequências simples até a terceira classe, dividido pelo
total de empresas 3000. O mesmo poderá ser resolvido via tabela.
5) R: Alternativa D.
UNIDADE 4
2.1) R: Alternativa C.
2.2) R: Alternativa E.
3.2) R: Alternativa D.
320 Unidade 7
notas serem menor na turma A, a turma B apresenta melhores notas, já que
50% destas se encontram abaixo de 6 e na turma A abaixo de 4,5.
6.1) R: Alternativa D.
6.2) R: Alternativa B.
6.3) R: Alternativa A.
6.4) R: Alternativa D.
7) R: Alternativa B.
UNIDADE 5
1) R: Alternativa C.
2) R: Alternativa D.
3) R: Alternativa A.
UNIDADE 6
1) R: Alternativa C.
2) R: Alternativa D.
3) R: Alternativa D.
4) R: Alternativa E.
5) R: Alternativa C.
Unidade 7 321
6) R: Alternativa D.
7) R: Alternativa B.
8) R: Alternativa C.
9) R: Alternativa C.
UNIDADE 7
1) R: Alternativa E.
2) R: Alternativa E.
3) R: Alternativa B.
4.1) R: Alternativa C.
4.2) R: Alternativa B.
4.3) R: Alternativa C.
4.4) R: Alternativa D.
5) R: Alternativa A.
322 Unidade 7
REFERÊNCIAS BIBIOGRÁFICAS
BRUNI, Adriano Leal. Estatística para concursos: com mais de 400 questões
solucionadas, incluindo principais bancas examinadoras e provas importan-
tes. São Paulo: Atlas, 2008.
COSTA NETO, Pedro Luiz de Oliveira. Estatística. 2ª. ed. rev. e atual. São Pau-
lo: Blucher, 2002. 266p.
CRESPO, Antônio Arnot. Estatística Fácil. 19ª Ed. Atual. São Paulo: Saraiva,
2009.
Unidade 7 323
GIOVANNI, José Ruy. Matemática 2: 2º grau: Trigonometria, matrizes, aná-
lise combinatória, geometria / José Ruy Giovanni, José Roberto Bonjorno. São
Paulo: FTD, 1992.
324 Unidade 7
Imagens para a matemática. <http://matimage.blogspot.com.br/search/label/
pictograma#axzz2O6IVolOR>. Acesso em: 18 mar. 2013, as 10:30 h
(CESPE, TCDF/95)
(UFPE)
AMEC, Trabuco
Unidade 7 325
ANEXO I – Tabela de números aleatórios
57720039848441796771402113975649865408932968745483
28805351590993988758702771771706320278621674696517
92591852873048869748352518887403629838586586424103
90381291743019758907506415597188137495305278301175
80911694675860820666904756184645111235324550411343
22017031329691927540165429727499009597610098243007
56241004302046299053531105844121647919762951626066
79449262029686643000945669302059878735442250977819
53996645088978507753372577412762380223576201416035
18928735885505213651392850146685793019797266643145
53085896630561257022504128966266436306630132798522
03588029287689511824888946474859192987031033996712
27078188656949980028047051300147189733218582454324
05210859010622249891811755446616077307661012317858
40361327843082333639694205586461123389278952667193
54602528858820001059610536613372010119016110512091
71516340767111737352373160458892734371280498090248
61020181739260667358533442682638340327449604466593
82559313463095265506961765917239799612495280632699
89985414217413576819862860894733152628774538480808
00998484146795137758901450794273633106604340125504
62415078204805884352980319939203049725849595036331
94279069246809921186076383193299511555710927026700
44892928843628251582877418972576106326760226745328
97307695332110542695666552049936584803089363581796
39165804448015595983909554668184396085388866333569
60781103266750340961313020769366308351093383647605
03192347628957779133884760593754394877674985384391
41285267562539599665513690322239330522990339979699
77549850392537425297100356049281668670014889558210
28634161916424838137344883279638716973067750256460
74244885401233596750149814264279791352896978804471
00240337964668750532421663332897263647277365383446
05414769694536167118955197220413239658600369487983
62698497974723665156130869115275592686818043009892
326 Unidade 7
ANEXO II – Tabela Z
z 0 1 2 3 4 5 6 7 8 9
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0438 0438 0478 0517 0557 0596 0636 0675 0714 0754
0,2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141
0,3 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517
0,4 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879
0,5 1915 1950 1985 2019 2054 2088 2123 2157 2190 2224
0,6 2258 2291 2324 2357 2389 2422 2454 2486 2518 2549
0,7 2580 2612 2642 2673 2704 2734 2764 2794 2823 2852
0,8 2881 2910 2939 2967 2996 3023 3051 3078 3106 3133
0,9 3159 3186 3212 3238 3264 3289 3315 3340 3365 3389
1,0 3413 3438 3461 3485 3508 3531 3554 3577 3599 3621
1,1 3643 3665 3686 3708 3729 3749 3770 3790 3810 3830
1,2 3849 3869 3888 3907 3925 3944 3962 3980 3997 4015
1,3 4032 4049 4066 4082 4099 4115 4131 4147 4162 4177
1,4 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319
1,5 4332 4345 4357 4370 4382 4394 4406 4418 4429 4441
1,6 4452 4463 4474 4484 4495 4505 4515 4525 4535 4525
1,7 4554 4564 4573 4582 4591 4599 4608 4616 4625 4633
1,8 4641 4649 4656 4664 4671 4678 4686 4693 4699 4706
1,9 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767
2,0 4772 4778 4783 4788 4793 4798 4803 4808 4812 4817
2,1 4821 4826 4830 4834 4838 4842 4846 4850 4854 4857
2,2 4861 4864 4868 4871 4875 4878 4881 4884 4887 4890
2,3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916
2,4 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936
2,5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952
2,6 4953 4955 4956 4957 4959 4960 4961 4962 4963 4964
2,7 4965 4966 4967 4968 4969 4970 4971 4972 4973 4974
2,8 4974 4975 4976 4977 4977 4978 4979 4979 4980 4981
2,9 4981 4982 4982 4983 4984 4984 4985 4985 4986 4986
3,0 4987 4987 4987 4988 4988 4989 4989 4989 4990 4990
3,1 4990 4991 4991 4991 4992 4992 4992 4992 4993 4993
3,2 4993 4993 4994 4994 4994 4994 4994 4995 4995 4995
3,3 4995 4995 4995 4996 4996 4996 4996 4996 4996 4997
3,4 4997 4997 4997 4997 4997 4997 4997 4997 4997 4998
3,5 4998 4998 4998 4998 4998 4998 4998 4998 4998 4998
3,6 4998 4998 4999 4999 4999 4999 4999 4999 4999 4999
3,7 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999
3,8 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Unidade 7 327