Probabilidade e Estatisca

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 148

PROBABILIDADE E

ESTATSTICA

autor do original
VALRIA APARECIDA FERREIRA

1 edio
SESES
rio de janeiro 2015
Conselho editorial sergio cabral, claudete veiga, claudia regina de brito

Autor do original Amir Abdala

Projeto editorial roberto paes

Coordenao de produo rodrigo azevedo de oliveira

Projeto grfico paulo vitor bastos

Diagramao fabrico

Reviso lingustica aderbal torres bezerra

Imagem de capa nome do autor shutterstock

Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida
por quaisquer meios (eletrnico ou mecnico, incluindo fotocpia e gravao) ou arquivada em
qualquer sistema ou banco de dados sem permisso escrita da Editora. Copyright seses, 2015.

Dados Internacionais de Catalogao na Publicao (cip)

F383p Ferreira, Valria


Probabilidade e estatstica / Valria Ferreira.
Rio de Janeiro : SESES, 2015.
128 p. : il.

ISBN 978-85-5548-091-1

1. Estatstica. 2. Estatstica aplicada. 3. Matemtica. 4. Probabilidades.


I. SESES. II. Estcio.
CDD 519.5

Diretoria de Ensino Fbrica de Conhecimento


Rua do Bispo, 83, bloco F, Campus Joo Ucha
Rio Comprido Rio de Janeiro rj cep 20261-063
Sumrio

Prefcio 7

1. Introduo Estatstica:
Anlise Exploratria de Dados 10

Breve histrico 11
Definio de Estatstica 11
Distribuio de frequncias 14
Mtodos grficos 20

2. Medidas de Posio 34

Mdia 34
Mediana (Md) 36
Moda (Mo) 37
Medidas Separatrizes: Quartis, Decis e Percentis 46

3. Medidas de Disperso 64

Exemplo Introdutrio 64
Amplitude Total (R) 65
Amplitude interquartil 66
Desvio-Padro (s) 66
Varincia (s2) 68
Coeficiente de Variao (cv) 69
Exemplo de aplicao das medidas de disperso
para dados no tabulados 69
Desvio-padro para dados tabulados 72
Varincia para dados tabulados 73
Exemplo de aplicao das medidas de disperso para dados tabulados 74

4. Noes de Probabilidade 86

Princpio Fundamental da Contagem (PFC) 87


Fatorial de um nmero natural 89
Arranjo 90
Permutao 91
Combinao 92
Breve histrico 93
Experimento Aleatrio, Espao Amostral, Evento 94
Operaes com Eventos 95
Probabilidade 98
Regras Bsicas de Probabilidade 100
Probabilidade Condicional 104
Independncia de eventos 107
Teorema de Bayes 109

5. Variveis aleatrias 118

Varivel Aleatria 118


Funo discreta de probabilidade 118
Valor esperado e varincia de uma varivel aleatria discreta 124
Modelos probabilsticos para variveis aleatrias Discretas 130
Prefcio
Prezados(as) alunos (as)

Estatstica uma palavra de origem latina, que significou por muito tem-
po cincia dos negcios do Estado. Ela pode ser vista como uma Matemtica
Aplicada, uma disciplina da rea das cincias exatas que tem aplicao em pra-
ticamente todas as reas de estudo. Esse fato serve para desmistificar o temor
vivido pelos alunos com relao ao ensino da matemtica em si (aquela que
ns aprendemos at o ensino mdio). As dificuldades enfrentadas e a falta de
conexo com a prtica so talvez os fatores que mais contribuem para que este
temor ocorra.
No entanto, o ensino da Estatstica, mesmo provocando sentimentos seme-
lhantes aos estudantes, proporciona a esses uma viso prtica do contedo que
est sendo abordado. Mais que isso, ele possibilita, a quem o est aplicando, a
obteno de importantes informaes do fato que est sendo estudado. O co-
nhecimento mnimo em Estatstica se tornou pr-requisito para ler um jornal
ou uma revista conceituada, pois muitas informaes se encontram resumidas
em tabelas ou grficos que grande parte da populao no tem condies de in-
terpretar e por isso ignoram (ou no entendem) reportagens importantes para a
formao de uma pessoa esclarecida social, econmica e politicamente.
Procuramos, aqui, apresentar a Estatstica de forma clara e prtica. No com
o intuito de formar especialistas nessa rea, mas sim de proporcionar a voc,
futuro gestor, uma compreenso dos elementos bsicos que compem essa
cincia, visando a aplicao na sua rea de atuao. No tivemos a inteno de
esgotar o assunto, mas sim de apresentar os elementos necessrios para que
voc realize uma leitura satisfatria da realidade que o cerca e das informaes
que tm a sua volta.
Estudaremos duas reas da Estatstica: Estatstica Descritiva e a Probabili-
dade. No Captulo 1 apresentaremos os conceitos bsicos da Estatstica bem
como descrio de tcnicas para organizao e apresentao dos dados. Nos
Captulos 2 e 3 aprenderemos a calcular e interpretar as medidas de posio e
disperso. E, introduziremos, nos Captulos 4 e 5, conceitos de Probabilidade.
Abordaremos o clculo de probabilidades atravs do mtodo clssico e frequen-
cial e estudaremos a distribuio de probabilidade Binomial.

7
Muitos dos exemplos aqui apresentados so hipotticos. So exemplos de
situaes que ocorrem de forma semelhante na realidade, mas os dados apre-
sentados no so reais, foram criados apenas para ilustrar a aplicao do conte-
do apresentado.
1
Introduo
Estatstica: Anlise
Exploratria de Dados
1 Introduo Estatstica:
Anlise Exploratria de Dados

Neste primeiro captulo, apresentaremos alguns conceitos bsicos utilizados


pela Estatstica, alm de fornecer recursos de organizao, resumo e apresenta-
o de dados atravs de tabelas e grficos.
Quando realizamos uma coleta de dados, geralmente estamos lidando com
uma quantidade muito grande de informaes. Portanto, torna-se imprescin-
dvel a utilizao de certas tcnicas visando simplificar a leitura de tais informa-
es. Para que se tenha uma viso do todo (sobre o fenmeno que est sendo
estudado) precisamos, por exemplo, dispor as informaes em tabelas ou apre-
sent-las em grficos. o que estaremos abordando num primeiro momento.
Logicamente, h mais tcnicas que podem ser aplicadas, mas elas sero vistas
nos prximos captulos.

OBJETIVOS
Aps o estudo dos conceitos e tcnicas apresentados neste captulo, esperamos que voc
consiga identificar os diferentes tipos de variveis que podem estar presentes em uma pes-
quisa, bem como, organizar, resumir e apresentar, atravs de tabelas e grficos de frequn-
cias, as informaes contidas em grandes conjuntos de dados.

REFLEXO
Voc se lembra de j ter visto tabelas em jornais, livros ou revistas, em que eram utilizados
percentuais para indicar as frequncias de ocorrncias de respostas em uma pesquisa? Ou
com os percentuais referentes avaliao de um governo? Neste captulo, veremos como
(e para qu) construir tabelas dessa natureza, alm de elaborar grficos que representam os
resultados dessas tabelas.

10 captulo 1
1.1 Breve histrico

O interesse por levantamento de dados no algo que surgiu somente nos dias
atuais. H indcios de que 3000 anos A.C. j se faziam censos na Babilnia, Chi-
na e Egito. Havia interesse dos governantes das grandes civilizaes antigas
por informaes sobre suas populaes e riquezas. Usualmente estas informa-
es eram utilizadas para taxao de impostos e alistamento militar.
A palavra Estatstica surgiu, pela primeira vez, no sc. XVIII. Alguns autores
atribuem esta origem ao alemo Gottfried Achemmel (1719-1772), que teria uti-
lizado pela primeira vez o vocbulo Estatstica, em 1746.
Na sua origem, a Estatstica estava ligada ao Estado. Na atualidade, a Esta-
tstica no se limita apenas ao estudo de dados demogrficos e econmicos. Ela
empregada em praticamente todas as reas do conhecimento, sempre que
estiverem envolvidas coleta e anlise de dados.

CONEXO
Para saber um pouco sobre a evoluo histrica da Estatstica, assista ao vdeo Histria da
Estatstica produzido pela Fundao Universidade de Tocantins, disponvel em: http://www.
youtube.com/watch?v=jCzMPL7Ub2k&feature=related

1.2 Definio de Estatstica

A Estatstica uma cincia que trata de mtodos cientficos para a coleta, or-
ganizao, descrio, anlise e interpretao (concluso) de um conjunto de
dados, visando a tomada de decises.
Podemos dividir a aplicao da Estatstica basicamente em trs etapas, que
so descritas resumidamente a seguir:
1. Refere-se coleta de dados, na qual devemos utilizar tcnicas estatsti-
cas que garantiro uma amostra representativa da populao.
2. Depois dos dados coletados, devemos resumi-los em tabelas de frequ-
ncias e/ou grficos e, posteriormente, encontrar as medidas de po-
sio e variabilidade (quantidades). Esta etapa tambm conhecida
como Estatstica Descritiva ou Dedutiva.

captulo 1 11
3. Esta etapa envolve a escolha de um possvel modelo que explique o com-
portamento dos dados para posteriormente se fazer a inferncia dos
dados para a populao de interesse. Esta etapa tambm chamada de
Estatstica Inferencial ou Indutiva. Nesta etapa, se faz necessrio um
conhecimento mais aprofundado, principalmente no que se refere aos
tpicos de probabilidades.
A probabilidade fornece mtodos para quantificar a incerteza exis-
tente em determinada situao, usando ora um nmero ora uma
funo matemtica.

Podemos citar inmeros exemplos da Estatstica em vrias reas do conhe-


cimento, mas s para convenc-lo da importncia das tcnicas estatsticas, va-
mos dar alguns exemplos:
1. Se estamos interessados em abrir um supermercado em um determinado
local precisamos saber se fatores como sexo, grau de escolaridade, idade,
estado civil, renda familiar, entre outros, interferem na abertura deste su-
permercado e os tipos de produtos que devem ser priorizados nesse esta-
belecimento, alm de definir as estratgias de marketing mais eficientes.
2. Uma empresa, quando est interessada em lanar um novo produto no
mercado, precisa saber as preferncias dos consumidores. Para isso,
necessrio realizar uma pesquisa de mercado.
3. O gestor precisa saber escolher uma amostra representativa de uma po-
pulao de interesse para no perder muito tempo e, consequentemen-
te, dinheiro da empresa em que trabalha.
4. Para se lanar um novo medicamento no mercado farmacutico, ne-
cessrio a realizao de vrias experincias. O medicamento deve ser
testado estatsticamente quanto sua eficincia no tratamento a que
se destina e quanto aos efeitos colaterais que pode causar, antes de ser
lanado no mercado.
5. Para uma empresa, muito importante fazer previses de demanda de
seus produtos. Para isto existem vrias tcnicas estatsticas como re-
gresso linear, regresso logstica, anlise de sries temporais, etc.
6. Controles estatsticos de qualidade (ou controles estatsticos do proces-
so) so indispensveis em todos os tipos de empresas. Eles so realizados
atravs de um conjunto de tcnicas estatsticas, geralmente aplicadas
por engenheiros de produo e administradores, para garantir o nvel de
qualidade exigido para a produo (ou servio) dentro de uma indstria.

12 captulo 1
So inmeras e diversificadas as aplicaes de tcnicas estatsticas que o
gestor pode utilizar. No conseguiremos falar sobre todas elas, mas apresen-
taremos os principais conceitos e tcnicas que quando utilizados podem au-
xiliar na tomada de decises. Comearemos por apresentar alguns conceitos
elementares bastante utilizados no processo estatstico.
Populao: o conjunto total de elementos (objetos, itens, medidas, etc.)
que tm determinada caracterstica que se deseja estudar.
Amostra: uma parte da populao de interesse que se tem acesso para de-
senvolver o estudo estatstico. Se a amostra no for fornecida no estudo, deve-
mos retir-la da populao atravs de tcnicas de amostragem adequadas, para
que os resultados fornecidos sejam confiveis.
Estatstica Descritiva: a parte da estatstica que trata da organizao e do
resumo do conjunto de dados por meio de grficos, tabelas e medidas descriti-
vas (quantidades).
Estatstica Indutiva: a parte que se destina a encontrar mtodos para tirar
concluses (ou tomar decises) sobre a populao de interesse, geralmente, ba-
seado em informaes retiradas de uma amostra desta populao.
Varivel: a caracterstica de interesse no estudo. Vamos estudar dois tipos
de variveis: quantitativas e qualitativas.
Variveis quantitativas: so aquelas cujas respostas da varivel so expres-
sas por nmeros (quantidades). Podemos distinguir dois tipos de variveis
quantitativas: quantitativa contnua e discreta.
Variveis quantitativas contnuas: so aquelas que podem assumir, teorica-
mente, infinitos valores entre dois limites (num intervalo), ou seja, podem as-
sumir valores no inteiros. Por exemplo: altura (em metros) de alunos de uma
determinada faixa etria, peso (em kg), salrio, etc.
Variveis quantitativas discretas: so aquelas que s podem assumir valores
inteiros. Por exemplo: nmero de filhos por casal, nmero de livros em uma
biblioteca, nmero de carros vendidos, etc.
Variveis qualitativas: so as variveis cujas respostas so expressas por um atri-
buto. Podemos distinguir dois tipos de variveis qualitativas: nominal e ordinal.
Variveis qualitativas nominais: definem-se como aquelas em que as res-
postas so expressas por um atributo (nome) e esse atributo no pode ser orde-
nado. Por exemplo: tipo sanguneo, religio, estado civil, etc.
Variveis qualitativas ordinais: tm suas respostas expressas por um atributo
(nome) e esse atributo pode ser ordenado. Por exemplo: grau de instruo, classe
social, etc.

captulo 1 13
1.3 Distribuio de frequncias

Para entendermos a ideia de distribuio de frequncias, vamos analisar a se-


guinte situao: quando um pesquisador termina de coletar os dados para sua
pesquisa, geralmente fica com muitos questionrios em mos (respondidos
pelas pessoas que foram sorteadas para pertencer a sua amostra) ou com os
dados digitados em alguma planilha eletrnica. O fato que os dados brutos
(sem tratamento) no trazem as informaes de forma clara, por isso devemos
tabular esses dados. Quando tabulamos os dados estamos resumindo as infor-
maes para melhor compreenso da varivel em estudo. A esta tabulao da-
mos o nome de distribuio de frequncias (ou tabela de frequncias).
Distribuio de frequncias uma tabela em que se resumem grandes quanti-
dades de dados, determinando o nmero de vezes que cada dado ocorre (frequn-
cia) e a porcentagem com que aparece (frequncia relativa).
Para facilitar a contagem do nmero de vezes que cada dado ocorre, pode-
mos ordenar os dados. A uma sequncia ordenada (crescente ou decrescente)
de dados brutos damos o nome de Rol.
Os tipos de frequncias com os quais iremos trabalhar so:
Frequncia absoluta ou simplesmente frequncia (f): o n de vezes que
cada dado aparece na pesquisa.

Frequncia relativa ou percentual (fr): o quociente da frequncia absoluta


pelo nmero total de dados. Esta frequncia pode ser expressa em porcenta-
gem. O valor de (fr x100) definido como fr (%).
Frequncia acumulada (fa): a soma de cada frequncia com as que lhe so
anteriores na distribuio.
Frequncia relativa acumulada (fra): o quociente da frequncia acumulada
pelo nmero total de dados. Esta frequncia tambm pode ser expressa em
porcentagem. O valor de (fra x100) definido como fra (%).

Exemplo 1.1: Dada a tabela abaixo, vamos definir qual a varivel em estu-
do e qual o tipo de varivel. Depois, completaremos a tabela de distribuio de
frequncias encontrando a frequncia relativa (%).

14 captulo 1
FAIXA DE FREQUNCIA
RENDA (EM NMERO DE RELATIVA
SALRIOS OPERRIOS (f) (%) (fr)
MNIMOS)
0 | 2 43 39,09

2 | 4 39 35,45

4 | 6 16 14,55

6 | 8 8 7,27

8 | 10 4 3,64

Total 110 100

Tabela 1.1 Distribuio de renda de operrios de uma determinada empresa.

Em todos os nossos exemplos, na distribuio de frequncias construda com intervalos


de classes, vamos considerar que o intervalo de classe fechado esquerda e aberto
direita. Por exemplo, no caso dessa tabela, considerando a terceira classe de frequn-
cia, podemos dizer que os 16 operrios que esto nesta classe recebem de 4 a menos
que 6 salrios mnimos por ms.

Resoluo
A varivel em estudo a renda dos operrios de uma determinada empre-
sa. Esta varivel classificada como quantitativa contnua, pois pode assumir
qualquer valor dentro de um intervalo numrico.
As frequncias absolutas (f) so fornecidas no problema. As frequncias rela-
tivas (fr(%)) so encontradas dividindo cada frequncia absoluta (de cada classe de
frequncia) pelo total de operrios (110) e multiplicando por 100.

captulo 1 15
Uma distribuio de frequncias apresenta, basicamente, as 3 colunas
apresentadas na tabela 1.1. Desta maneira, conseguimos organizar de forma
resumida um conjunto de dados.
Em alguns estudos podemos ter interesse em outras quantidades relacio-
nadas tabela, como, por exemplo, a frequncia acumulada ou a frequncia
acumulada (%). Veremos mais adiante que a frequncia acumulada utilizada
na construo de um grfico denominado Ogiva. A tabela 1.2 apresenta a frequ-
ncia acumulada e a frequncia relativa acumulada (%).

FAIXA DE NMERO
RENDA (EM DE FREQUNCIA
SALRIOS OPERRIOS fr(%) ACUMULADA fra (%)
MNIMOS) (f) (fa)

0 | 2 43 39,09 43 39,09

2 | 4 39 35,45 82 75,55

4 | 6 16 14,55 98 89,09

6 | 8 8 7,27 106 96,36

8 | 10 4 3,64 110 100,00

Total 110 100

Tabela 1.2 Distribuio das frequncias acumuladas da varivel faixa de renda.

A coluna frequncia acumulada (fa) de cada classe obtida somando a fre-


quncia da respectiva classe com as que lhe so anteriores e a fra (%) obtida
dividindo a fa pelo nmero total de dados e multiplicando por 100.

Exemplo 1.2: Uma determinada empresa resolveu traar o perfil socioeco-


nmico de seus empregados. Uma das variveis estudadas foi o nmero de fi-
lhos, com idade inferior a 18 anos, de cada um dos empregados. A tabela 1.3
fornece a frequncia e a frequncia relativa (%) para cada valor obtido.

16 captulo 1
NMERO DE
NMERO DE FILHOS fr (%)
OPERRIOS (f)
0 6 13,33

1 11 24,44

2 13 28,89

3 7 15,56

4 5 11,11

NMERO DE
NMERO DE FILHOS fr (%)
OPERRIOS (f)
5 1 2,22

6 2 4,44

Total 45 100,00

Tabela 1.3 Distribuio de frequncias dos empregrados, segundo o nmero de filhos.

Para encontrarmos a fa e a fra (%) seguimos o mesmo procedimento que foi


utilizado na Tabela 1.2.

1.3.1 Agrupamento em classes

Como vimos no exemplo 1.1, para representar a varivel contnua renda, or-
ganizamos os dados em classes. Portanto, podemos dizer que a varivel renda
foi dividida em 5 classes de frequncias.
Quando agrupamos em classes de frequncias perdemos informaes, pois
no sabemos exatamente quais so os valores que esto contidos em cada uma das
classes (a no ser que seja possvel pesquisar esta informao no conjunto de da-
dos brutos). Na anlise das tabelas de frequncias com intervalos de classes pode-
mos identificar os seguintes valores:

captulo 1 17
Limite inferior (Li): o menor valor que a varivel pode assumir em uma
classe de frequncia.

Limite superior (Ls): serve de limite para estabelecer qual o maior valor que a
varivel pode assumir em uma classe de frequncia, mas, geralmente, os valores
iguais ao limite superior no so computados naquela classe e sim na seguinte.

Ponto mdio (Pm): a mdia aritmtica entre o Li e o Ls da mesma classe, ou

Li + Ls
seja, Pm = .
2

Amplitude (h): a diferena entre o Ls e o Li da classe, ou seja, h = Ls Li.

Amplitude total (ht): a diferena entre o LS da ltima classe de frequncia e


o Li da primeira classe, ou seja: ht = Ls Li.

Na construo de uma distribuio de frequncias com intervalos de clas-


ses devemos determinar o nmero de classes que uma tabela deve ter e qual o
tamanho (ou a amplitude) destas classes. Podemos usar o bom senso e escolher
arbitrariamente quantas classes e qual a amplitude que estas classes devem ter.
Em algumas situaes, iremos tabular dados para comparar os resultados com
informaes de outras tabelas. Nesse caso, melhor considerar as mesmas
classes das tabelas que iremos comparar.
Quando no tivermos nenhuma referncia sobre qual deve ser o nmero de
classes a se trabalhar, podemos utilizar o critrio que sugerido por vrios au-
tores. Chama-se regra da raiz e ser apresentado a seguir
Considere:

R
k n e h
k

onde k o nmero de classes que vamos construir na tabela de frequncias;


n o tamanho da amostra que estamos trabalhando; h a amplitude de cada
uma das classes e R a amplitude total dos dados.

18 captulo 1
Os valores de k e h devem ser arredondados sempre para o maior valor. Por exemplo,
para uma amostra de tamanho n = 50 cujo menor valor 4 e o maior valor 445
temos que R = 441 (maior valor menor valor). O nmero de classes seria dado por
k n = 50 = 7, 07106 8 (maior inteiro depois de 7) e a amplitude (tamanho)
R 441
de cada uma das 8 classes acima dever ser h = = 55,125 56 (maior
k 8
inteiro depois de 55). Ou seja, deveramos, para este exemplo, montar uma tabela com
8 classes e de amplitude 56. A tabela pode ser iniciada pelo menor valor do conjunto
de dados.

Resumindo, para montar uma tabela de frequncias com intervalos de clas-


ses devemos:
Achar o mnimo e o mximo dos dados.
Determinar as classes de frequncias, o que na verdade nada mais do que
escolher intervalos de mesmo comprimento que cubra a amplitude entre
o mnimo e o mximo. Para determinar o nmero de classes, usaremos
k n e para determinar o tamanho das classes usaremos h R .
K
Contar o nmero de observaes que pertencem a cada intervalo de clas-
se. Esses nmeros so as frequncias observadas da classe.
Calcular as frequncias relativas e acumuladas de cada classe.
De modo geral, a quantidade de classes no deve ser inferior a 5 e nem
superior a 25.

Um outro critrio utilizado para construir distribuio de frequncias com


intervalos de classes a regra de Sturges.
Neste critrio, o nmero de classes a serem construdas obtido utilizando
a seguinte frmula:

k 1 + 3, 3 log n

onde:
k:nmero de classes
n:total da amostra
log n: logaritmo na base 10 de n

captulo 1 19
A amplitude de cada intervalo de classe obtida por:

amplitude total R
=h =
k k

Devemos arredondar o valor de k para o nmero inteiro mais prximo, pois o nmero
de classes deve ser sempre inteiro. O arredondamento de h deve ser sempre efetuado
para cima usando o mesmo nmero de casas decimais dos elementos da amostra para
que nenhum elemento fique fora da tabela.

1.4 Mtodos grficos

O objetivo da utilizao de grficos em anlise de dados o de facilitar a com-


preenso do fenmeno estatstico por meio do efeito visual imediato que os
grficos proporcionam.

1.4.1 Tipos de grficos

Existem vrios tipos de grficos. Os mais usados so: grfico em linhas, diagra-
mas de rea (como por exemplo: grfico em colunas, grfico em barras e grfico
em setores) e grficos para representar as distribuies de frequncias cons-
trudas com intervalos de classes (como por exemplo: polgono de frequncias,
histograma e ogiva).
Vamos saber um pouco quando usar e como construir cada um destes grficos.

CONEXO
Vamos refletir um pouco sobre a necessidade de abordagens pedaggicas para o ensino e
a aprendizagem de grficos acessando o endereo http://www.ufrrj.br/emanped/paginas/
conteudo_producoes/docs_22/carlos.pdf.

20 captulo 1
1.4.1.1 Grfico em linhas
Sempre que os dados estiverem distribudos segundo uma varivel no tempo
(meses, anos, etc.), assim como sucede com os dados do exemplo 1.3 figura
1.1, os dados podem, tambm, ser descritos atravs de um grfico em linhas.
Esse tipo de grfico retrata as mudanas nas quantidades com respeito ao tem-
po atravs de uma srie de segmentos de reta. muito eficiente para mostrar
possveis tendncias no conjunto de dados.

Exemplo 1.3: A tabela 1.4 fornece uma lista do nmero de assinantes de


telefones celulares, em milhes, de 1997 a 2007, do pas X. Construa um grfico
para resumir os dados da tabela a seguir.

ANO ASSINANTES (EM MILHES)


1997 1,1

1998 1,3

1999 1,5

2000 1,9

2001 2,4

2002 2,6

2003 3,1

2004 7,4

2005 18,6

2006 21,5

2007 29

Tabela 1.4 Assinantes de telefones celulares, em milhes, de 1997 a 2007.

captulo 1 21
O grfico que melhor representa este conjunto de dados o grfico em li-
nhas, j que os dados se reportam a uma srie no tempo (srie temporal). O
grfico est ilustrado na figura 1.1.

35

30 29

25 21,5
Assistentes (em milhes)

20 18,6

15

10 7,4

5 2,4 2,6 3,1


1,1 1,3 1,5 1,9
0
1996 1998 2000 2002 2004 2006 2008
Anos

Figura 1.1 Grfico em linha para os dados de assinantes de telefones celulares.

1.4.1.2 Grfico (ou Diagrama) em Barras (ou Colunas)


Os diagramas em barras (ou colunas) so bastante utilizados quando trabalhamos
com variveis qualitativas (dados categricos). No eixo horizontal especificamos os
nomes das categorias e no eixo vertical construmos uma escala com a frequncia
ou a frequncia relativa. As barras tero bases de mesma largura e alturas iguais
frequncia ou frequncia relativa. O grfico em barras, quando as barras esto
dispostas no sentido vertical, tambm chamado de grfico em colunas.

ATENO
Quando construmos o grfico de barras para variveis qualitativas e as barras so arranja-
das em ordem descendente de altura, a partir da esquerda para a direita, com o atributo que
ocorre com maior frequncia aparecendo em primeiro lugar, denominamos este grfico de
barras de Diagrama de Pareto.

22 captulo 1
Exemplo 1.4: Uma grande indstria de materiais de construo, com diver-
sas lojas espalhadas pelo pas, fez um levantamento das principais causas de
perda de ativos durante o ano de 2007 e as informaes esto dispostas na ta-
bela seguinte.

VALOR PERDIDO (MILHES DE


CAUSAS REAIS)
M administrao 5,2

Roubos de funcionrios 3,9

Fraudes nas vendas 5,5

Assaltos s lojas 1,8

Perda do estoque 1,6

Atendimento ruim 0,8

Tabela 1.5 Causas de perda de ativos durante o ano de 2007.

Graficamente, podemos representar este conjunto de dados de trs formas


diferentes: grfico em colunas, grfico em barras e o grfico em setores (ou piz-
za ou circular), que ser apresentado no prximo item.
Valor Perdido (milhes de reais)

0
Roubos de funcionrios

Fraudes nas vendas

Assaltos s lojas

Perda de estoque

Atendimento ruim
M administrao

Figura 1.2a Grfico em colunas para a varivel Causas de perdas de ativos.

captulo 1 23
Atendimento ruim

Perda do estoque

Causas Assalto s lojas

Fraudes nas vendas

Roubos de funcionrios

M administrao

0 1 2 3 4 5 6
Valor perdido (milhes de reais)

Figura 1.2b Grfico em barras para a varivel Causas de perdas de ativos.

1.4.1.3 Grfico (ou Diagrama) em Setores


O diagrama em setores, tambm conhecido como grfico de pizza, um dos
grficos mais utilizados para representar variveis qualitativas (ou categricas)
e bastante apropriado quando se deseja visualizar a proporo que cada cate-
goria representa do total.
Vamos utilizar os dados do Exemplo 1.4 para mostrar um grfico em setores.

Valor Perdido (milhes de reais)

Perda de estoque Atendimento ruim


8%

Assaltos s lojas M administrao


10%

Roubos de
Fraudes nas vendas Funcionrios
29% 21%

Figura 1.3 Grfico em setores para a varivel Causas de perdas de ativos.

24 captulo 1
Os grficos que sero apresentados a seguir so grficos construdos segun-
do uma distribuio de frequncias com intervalos de classes. So eles: o histo-
grama, o polgono de frequncias e a ogiva.

1.4.1.4 Histograma
Um histograma semelhante ao diagrama de barras, porm refere-se a uma
distribuio de frequncias para dados quantitativos contnuos. Por isso,
apresenta uma diferena: no h espaos entre as barras. Os intervalos de
classes so colocados no eixo horizontal enquanto as frequncias so colo-
cadas no eixo vertical. As frequncias podem ser absolutas ou relativas.
Exemplo 1.5: A tabela a seguir apresenta o salrio de funcionrios de uma
empresa no interior de Minas Gerais.

FREQ. ACUMULADA
SALRIO (R$) FREQ. ABSOLUTA (f) (fa)
400,00 | 800,00 38 38

800,00 | 1.200,00 18 56

1.200,00 | 1.600,00 12 68

1.600,00 | 2.000,00 8 76

2.000,00 | 2400,00 8 84

2.400,00 | 2.800,00 5 89

2.800,00 | 3.200,00 3 92

3.200,00 | 3.600,00 0 92

3.600,00 | 4.000,00 2 94

4.000,00 | 4.400,00 0 94

4.400,00 | 4.800,00 1 95

Total 95

Tabela 1.6 Distribuio de frequncias dos salrios dos funcionrios de uma empresa no
interior de Minas Gerais.

captulo 1 25
Como os dados da tabela 1.6 esto apresentados em intervalos de classes po-
demos represent-los graficamente atravs de um histograma ou do polgono de
frequncias, como mostram as figuras 1.4 e 1.5, respectivamente.

40
35
30
25
Frequncia

20
15
10
5
0
1200,00 | 1600,00

1600,00 | 2000,00

2000,00 | 2400,00

2400,00 | 2800,00

2800,00 | 3200,00

3200,00 | 3600,00

3600,00 | 4000,00

4000,00 | 4400,00

4400,00 | 4800,00
800,00 | 1200,00
400,00 | 800,00

Salrio (R$)

Figura 1.4 Histograma dos salrios dos funcionrios de uma empresa no interior de Minas
Gerais.

1.4.1.5 Polgono de Frequncias


Podemos dizer que o polgono de frequncias um grfico de linha de uma
distribuio de frequncias. No eixo horizontal so colocados os pontos m-
dios de cada intervalo de classe e no eixo vertical so colocadas as frequncias
absolutas ou relativas (como no histograma). Para se obter as interseces do
polgono com o eixo das abscissas, devemos encontrar o ponto mdio da classe
anterior primeira e o ponto mdio da classe posterior ltima.

CONEXO
Para se ter uma ideia da importncia da organizao dos dados em tabelas de frequncias e
da construo do histograma, leia A Estatstica na Prtica em: ANDERSON, David R.; SWE-
ENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada administrao e economia. So
Paulo: Pioneira Thomson Learning, 2003, pp. 37 e 38.

26 captulo 1
O histograma e o polgono de frequncias so grficos alternativos e con-
tm a mesma informao. Fica a critrio de quem est conduzindo o estudo a
escolha de qual deles utilizar.
Considerando os dados do exemplo 1.5, temos o polgono de frequncias
representado pela figura 1.5.

40
38

35

30

25
Frequncia

20
18

15

12
10
8 8

5 5
3
2
1
0 0 0 0

200 600 1000 1400 1800 2200 2600 3000 3400 3800 4200 4600 5000

Ponto mdio das faixas salariais (R$)

Figura 1.5 Polgono de frequncias dos salrios dos funcionrios de uma empresa no
interior de Minas Gerais.

Para finalizarmos o estudo de grficos, vamos apresentar um grfico deno-


minado ogiva.

1.4.1.6 Ogiva
Uma ogiva um grfico para uma distribuio de frequncias acumuladas. Uti-
lizando o exemplo 1.5, a terceira coluna traz a frequncia acumulada dos dados
e a ogiva fica representada pela figura 1.6.

captulo 1 27
Para construir um grfico de ogiva, devemos usar o limite superior de cada intervalo
no eixo horizontal e a frequncia acumulada no eixo vertical. A frequncia acumulada
relacionada com o limite inferior da primeira classe sempre zero.

100
90
80
70
60
Frequncia Acumulada

50
40
30
20
10
0
400 800 1200 1600 2000 2400 2800 3200 3600 4000 4400 4800
Salrio (R$)

Figura 1.6 Ogiva dos salrios dos funcionrios de uma empresa no interior de Minas Gerais.

ATIVIDADE
1. Classifique as variveis a seguir em quantitativas (discretas ou contnuas) ou qualitativas
(nominal ou ordinal).
a) Cor dos olhos.
b) Nmero de peas produzidas por hora.
c) Dimetro externo.
d) Nmero de pontos em uma partida de futebol.
e) Produo de algodo.
f) Salrios dos executivos de uma empresa.
g) Nmero de aes negociadas na bolsa de valores.
h) Sexo dos filhos.
i) Tamanho de pregos produzidos por uma mquina.
j) Quantidade de gua consumida por uma famlia em um ms.

28 captulo 1
k) Grau de escolaridade.
l) Nvel social.
m) Tipo sanguneo.
n) Estado civil.

2. A seguir temos as idades dos funcionrios de uma determinada empresa. Fazer uma
distribuio de frequncias, agrupando os dados em classes. OBS.: A tabela de distri-
buio de frequncias deve ser completa com f, fr e fa.

Idades (dados brutos)

48 28 37 26 29 59 27 28 30 40 42 35 23 22 31
21 51 19 27 28 36 25 40 36 49 28 26 27 41 29

Baseado na tabela de frequncias construda, responda:


a) Quantos so os funcionrios com idade inferior a 33 anos?
b) Que porcentagem de funcionrios tem idade igual ou superior a 47 anos?
c) Quantos so os funcionrios com idade maior ou igual a 26 anos e no tenham
mais que 40 anos?
d) Qual a porcentagem de funcionrios com idade abaixo de 40 anos?
e) Qual a porcentagem de funcionrios que tm no mnimo 40 anos?

3. Uma agncia de turismo est interessada em saber o perfil dos seus clientes com relao
varivel estado civil. Para isso, o gerente desta agncia pediu ao funcionrio do setor de ven-
das para fazer um grfico que resuma estas informaes. Construa o grfico e interprete-o.

ESTADO CIVIL NMERO DE CLIENTES

Solteiro 2600

Casado 900

Vivo 345

Separado 1200

Outros 1020

Total 6065

captulo 1 29
4. Um consultor estava interessado em saber quanto, geralmente, cada pessoa gastava em um
determinado supermercado no primeiro sbado aps receberem seus pagamentos (sal-
rios). Para isso ele entrevistou 50 clientes que passaram pelos caixas entre 13h e 18h, e
anotou os valores gastos por cada um deles. Estes valores esto listados a seguir:

4,89 11,00 5,60 73,85 24,83 98,00 186,00 234,87 58,00 198,65

223,86 341,42 94,76 445,76 82,80 35,00 455,00 371,00 398,60 234,00

64,90 54,98 48,80 68,90 120,32 126,98 76,43 6,35 9,98 12,68

243,00 18,65 134,90 11,10 321,09 290,76 74,00 48,80 74,52 138,65

26,00 210,13 15,78 197,45 75,00 76,55 32,78 166,09 105,34 99,10

Analisando o conjunto de dados, responda os seguintes itens:


a) Qual a varivel em estudo? Classifique-a.
b) Construa uma tabela de frequncias a partir do conjunto de dados brutos.
c) Construa um histograma e um polgono de frequncias para a tabela construda no
item b).

5. Analise o grfico a seguir e responda:

50 45
45
40
35
30
Frequncia

25
20 17
15 12
10 4 3 3 2
5
0
500| 800

800| 1100

1100| 1400

1400| 1700

1700| 2100

2100| 2400

2400| 2700

Salrio (R$)

d) Qual a varivel em estudo? Classifique-a.


a) Quantos funcionrios ganham entre R$ 800,00 (inclusive) e
R$ 1.100,00 (exclusive)?
b) Qual o nmero de funcionrios total desta empresa?
c) Qual a porcentagem de funcionrios que ganham R$ 1.700,00 ou mais?

30 captulo 1
d) Qual a porcentagem de funcionrios que ganham entre R$ 500,00 (inclusive) e no
mais que R$ 1.100,00?
e) A partir do histograma, monte uma tabela de distribuio de frequncias.

REFLEXO
Estamos encerrando nosso primeiro captulo. Vimos, aqui, alguns conceitos que sero funda-
mentais na compreenso do restante do contedo de Estatstica. J deve ter dado para
perceber que, mesmo estando no incio da disciplina, as aplicaes prticas que voc poder
fazer na sua rea de atuao sero muitas. A compreenso e interpretao das mais variadas
informaes, com as quais nos deparamos em nosso cotidiano, dependem, em parte, do co-
nhecimento de certos elementos estatsticos.
Estamos apenas no comeo. Muitas tcnicas (muito interessantes!) ainda sero abordadas.
E lembre-se que o conhecimento e o domnio da Estatstica certamente levaro voc, futuro
gestor, s decises mais acertadas.

LEITURA
Recomendamos a leitura do texto Como analisar de forma simples um grande nmero de
dados?, disponvel no endereo:
< http://www.klick.com.br/materia/20/display/0,5912,POR-20-91-931-,00.html >
Este texto aborda de maneira clara alguns procedimentos que podem ser utilizados quando
nos deparamos com situaes em que precisamos resumir as informaes de grandes
conjuntos de dados.

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.

COSTA NETO, Pedro Luiz de Oliveira. Estatstica, So Paulo: Edgard Blucher, 2002.

DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.

captulo 1 31
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro: LTC, 2003.

MEMRIA, Jos M. P. Breve Histria da Estatstica. Disponvel em: <http://www.im.ufrj.


br/~lpbraga/prob1/historia_estatistica.pdf>. Acesso em: 25 setembro 2014.

TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 1999.

VIEIRA, Sonia. Elementos de estatstica. So Paulo: Atlas, 2003.

NO PRXIMO CAPTULO
Se at agora vimos como organizar, resumir e apresentar os dados (informaes) em tabelas
e grficos, no prximo captulo iremos incrementar esse processo atravs da insero das
medidas de posio e disperso. So medidas que iro, de certa forma, representar o con-
junto como um todo. Um exemplo bem conhecido de medida de posio (ou de tendncia
central) a mdia e com relao medida de disperso podemos citar o desvio-padro. No
so raras as situaes em que a mdia utilizada para representar a tendncia central dos
dados e o desvio-padro para representar a variabilidade do conjunto de dados.
Alm destas, veremos outras tambm importantes e com larga aplicao no estudo dos dados.

32 captulo 1
2
Medidas de Posio
2 Medidas de Posio
Nesse captulo, aprenderemos como caracterizar um conjunto de dados atravs
de medidas numricas que sejam representativas de todo o conjunto.
As medidas de posio, tambm chamadas de medidas de tendncia central,
tm o objetivo de representar o ponto central de um conjunto de dados. As mais
conhecidas so a mdia, a mediana e a moda. Alm dessas medidas, podemos
citar outras medidas de posio importantes, que no necessariamente so
centrais. So ela os quartis, os decis e os percentis. Vamos estudar cada uma
dessas medidas de posio (estatsticas).
Primeiramente, vamos fazer um estudo para os dados no tabulados, ou seja,
quando os dados no estiverem na forma de distribuio de frequncia. Em se-
guida, as mesmas medidas sero calculadas com base em dados tabulados.

OBJETIVOS
Por meio do estudo deste captulo, esperamos que voc seja capaz de calcular e de interpre-
tar as medidas de posio aplicadas a conjuntos de dados.

REFLEXO
Voc se lembra das situaes para as quais j calculou uma mdia? Que tipo de informao
essa medida fornece? Para que serve? Para aplicar e interpretar medidas como ela, ne-
cessrio conhec-las bem. Vamos, ento, realizar um estudo detalhado da mdia e de outras
medidas de mesma natureza.

2.1 Mdia

A mdia aritmtica a mais comum e mais simples de ser calculada dentre to-
das as medidas de posio mencionadas.

34 captulo 2
Para calcul-la, basta fazer a diviso da soma de todos os valores (x1, x2, ..., xn )
da varivel pelo nmero deles (n):

n
xi
x= i =1
(2.1)
n
em que:
x = a mdia aritmtica;
xi = os valores da varivel;
n = o nmero de valores.

Outro tipo de mdia que podemos encontrar a mdia geomtrica. Ela muito
utilizada no clculo da taxa mdia de retorno de investimentos.
A mdia geomtrica entre nmeros reais x1 x2,,xn definida como sendo a
raiz n-sima do produto dos n termos (ou, alternativamente) o produto dos n ter-
mos elevado ao inverso do nmero de termos, ou seja:

G= n x1 x 2 x 3 ... x n

ou

( )
1 1
(x1 x 2 x 3... x n ) n = n
i =1 xi n

em que i = 1 x i indica o produtrio de xi, para i variando de 1 a n.


n

Em algumas circunstncias no faz sentido calcular a mdia geomtrica:


Quando um dos valores do conjunto de dados for zero. Neste caso, o produ-
to dos valores ser zero e, consequentemente, G = 0.
Quando o produto dos valores for negativo e o nmero total de observa-
es for par. Neste caso, teramos que calcular uma raiz de ndice de par de
um nmero negativo, o que impossvel no conjunto dos nmeros reais.

A mdia geomtrica ser sempre menor ou igual a mdia aritmtica.

captulo 2 35
2.2 Mediana (Md)

A mediana outra medida de posio, dita mais robusta que a mdia, pois, da
forma como ela determinada, no permite que alguns valores muito altos ou
muito baixos interfiram de maneira significativa em seu valor. Desta forma, se
o conjunto de dados apresentar alguns poucos valores discrepantes em relao
maioria dos valores do conjunto de dados, em geral, aconselhvel usar a
mediana em vez da mdia.

ATENO
A mediana a medida de posio mais frequentemente usada quando a varivel em estudo
for renda (R$), pois algumas rendas extremamente elevadas podem inflacionar a mdia.
Neste caso, a mediana uma melhor medida de posio central.

A mediana encontrada ordenando os dados do menor para o maior valor e


em seguida identificando o valor central destes dados ordenados. uma medi-
da que divide o conjunto de dados ao meio, deixando a mesma quantidade de
valores abaixo dela e acima.
A determinao da mediana difere no caso do tamanho (n) do conjunto de
dados ser par ou mpar. Vejamos a seguir.
Se o nmero de elementos do conjunto de dados for mpar, ento a mediana
ser exatamente o valor do meio, ou seja:

Md = x n +1 (2.2)

2

Se o nmero de elementos do conjunto de dados for par, ento a mediana


ser exatamente a mdia dos dois valores do meio, isto :

x n + x n


+1
Md =
2 2 (2.3)
2

36 captulo 2
x n , x n + 1 x n
onde e +1 indicam as posies onde os dados

2
2 2
se encontram.

2.3 Moda (Mo)

A moda de um conjunto de dados o valor (ou valores) que ocorre com maior
frequncia. A moda, diferentemente das outras medidas de posio, tambm
pode ser encontrada quando a varivel em estudo for qualitativa. Existem con-
juntos de dados em que nenhum valor aparece mais vezes que os outros. Neste
caso, dizemos que o conjunto de dados no apresenta moda.
Em outros casos, podem aparecer dois ou mais valores de maior frequncia
no conjunto de dados. Nestes casos, dizemos que o conjunto de dados bimo-
dal e multimodal, respectivamente.
Por conta das definies diferentes, a mdia, a mediana e a moda fornecem,
muitas vezes, informaes diferentes sobre o centro de um conjunto de dados,
embora sejam todas medidas de tendncia central.
No exemplo 2.1 apresentaremos os clculos das medidas de posio para
dados no tabelados (dados brutos).

Exemplo 2.1: Um gerente de banco quis estudar a movimentao de pes-


soas em sua agncia na segunda semana de determinado ms. Ele constatou
que no primeiro dia entraram 1.348 pessoas, no segundo dia, 1.260 pessoas, no
terceiro, 1.095, no quarto, 832 e no ltimo dia do levantamento, 850 pessoas.
Encontre a mdia aritmtica, a mediana e a moda para este conjunto de dados
e interprete os resultados.

Resoluo
A mdia aritmtica dada por:

n
xi 1.348 + 1.260 + 1.095 + 832 + 850 5.385
i =1
x= = = = 1.077
n 5 5

captulo 2 37
O nmero mdio de pessoas que entraram na agncia bancria na segunda
semana do ms foi 1.077 pessoas. Isto quer dizer que, alguns dias entraram me-
nos que 1.077 e outros dias entraram mais, ou seja, 1.077 um valor em torno
do qual o nmero de pessoas que entraram na agncia, durante a segunda se-
mana de cada ms, se concentra.
Para encontrar a mediana, devemos, primeiramente, ordenar os dados em
ordem crescente (pode ser decrescente tambm):

832, 850, 1095, 1260, 1348

Como a quantidade de dados (n) um nmero mpar, a mediana exata-


mente o valor que se encontra no meio do conjunto de dados. Nesse caso, a
mediana Md = 1095 pessoas. Isto significa que temos o mesmo nmero de
observaes menores ou iguais ao valor da mediana e o mesmo nmero de ob-
servaes maiores ou iguais ao valor da mediana.
Este conjunto de dados no possui moda, pois no existe nenhum valor que
aparece com mais frequncia que os outros.
Agora, vamos fazer um estudo para os dados tabulados, ou seja, quando os
dados estiverem na forma de uma distribuio de frequncias.
Quando os dados estiverem tabulados, ou seja, na forma de distribuio
de frequncias, a maneira de se calcular a mdia aritmtica muda um pouco.
Como as frequncias so nmeros que indicam quantas vezes aparece deter-
minado valor ou quantos valores tm em cada classe de frequncia, elas funcio-
naro como fatores de ponderao. Estas situaes sero apresentadas nos
exemplos 2.2 e 2.3, respectivamente.

Mdia Aritmtica
No caso de dados tabulados, o clculo da mdia aritmtica dada por:
k
x i fi
i =1
x= k
(2.4)

fi
i =1

38 captulo 2
Onde:
xi o valor da varivel (ou o ponto mdio de uma classe de frequncia).
fi a frequncia referente a cada valor (ou classe).
k
a soma dos valores das frequncias.
i =1

A expresso (2.4) apresentada anteriormente tambm conhecida como


frmula da mdia ponderada.
No caso de distribuies de frequncias que no apresentam intervalos de
classes, a mediana e a moda so encontradas da maneira descrita nos itens 2.2
e 2.3, respectivamente.

Exemplo 2.2
Em um determinado ms, foi computado o nmero x de faltas ao trabalho,
por motivos de sade, que cada funcionrio de uma determinada empresa teve.
Os dados esto apresentados na tabela abaixo:

NMERO DE FALTAS f
0 31

1 20

2 8

3 2

4 0

5 1

6 1

Total 63

Tabela 2.1: Nmero de faltas ao trabalho, por motivos de sade.

captulo 2 39
Resoluo
Mdia Aritmtica
k
x i fi (0 31)+ (1 20)+ (2 8)+ (3 2)+ (4 0)+ (5 1)+ (6 1) 53
x = i =1 k
= = @ 0, 84
63 63
fi
i =1

ou seja, nesta empresa ocorreram, em mdia, 0,84 faltas por funcionrio,


por motivo de sade.

Mediana
Como os dados esto tabelados, eles j se encontram ordenados. Para ficar
mais fcil encontrar o valor da mediana, vamos incluir na distribuio de frequ-
ncias uma coluna com as frequncias acumuladas.

NMERO DE FALTAS f fa
0 31 31

1 20 51

2 8 59

3 2 61

4 0 61

5 1 62

6 1 63

Total 63

40 captulo 2
Agora, identificaremos a frequncia acumulada imediatamente superior
metade do somatrio das frequncias simples:
k
fi 63
i =1
= = 3,15
2 2

A frequncia acumulada imediatamente superior a 31,5 fa = 51. Portanto, o


valor da mediana o valor da varivel associado fa = 51, ou seja,

Md = 1 falta

Ento, pelo menos 50% das observaes so maiores ou iguais a 1 falta.

k
fi
No caso do valor i = 1 ser exatamente igual a uma das frequncias acumuladas fa, o
2
clculo da mediana ser a mdia aritmtica entre dois valores da varivel: xi e x(i+1).
k
fi
O valor da varivel xi ser aquele cujo i = 1 = fa e o valor da varivel xi+1 ser aquele
2
que est imediatamente aps xi na distribuio de frequncia.

Moda
O valor que tem a maior frequncia para este conjunto de dados de x = 0,
ou seja, mais frequente encontrar funcionrios que no faltam.
No caso do Exemplo 2.3 veremos que os dados esto agrupados em interva-
los de classes. Quando o conjunto de dados for apresentado sob a forma agru-
pada perdemos a informao dos valores das observaes. Neste caso, vamos
supor que todos os valores dentro de uma classe tenham seus valores iguais ao
ponto mdio desta classe.
Os clculos da mdia, da moda e da mediana para tabelas de frequncias
agrupadas em classes esto apresentados a seguir.

captulo 2 41
Vale ressaltar que, sempre que possvel, as medidas de posio e disperso
devem ser calculadas antes dos dados serem agrupados.

ATENO
As medidas resumo calculadas quando os dados estiverem agrupados em intervalos de clas-
ses so apenas aproximaes dos verdadeiros valores, pois substitumos os valores das obser-
vaes pelo ponto do mdio do intervalo de classe.

Exemplo 2.3
A tabela abaixo apresenta a distribuio de frequncias do tempo de vida de
60 componentes eletrnicos (medido em dias) submetidos experimentao
num laboratrio especializado. Calcular as medidas de posio.

TEMPO DE VIDA
f PONTO MDIO (XI)
(DIAS)
3 18 3 10,5

18 33 4 25,5

33 48 4 40,5

48 63 8 55,5

63 78 10 70,5

78 93 28 85,5

93 108 2 100,5

108 123 1 115,5

Total 60

Tabela 2.2: Tempo de vida de componentes eletrnicos.

42 captulo 2
Resoluo
Neste tipo de tabela, como temos classes de frequncias, devemos encon-
trar um valor que represente cada classe, para que possamos efetuar os clcu-
los. Por exemplo, considerando a primeira classe de frequncia,

TEMPO DE VIDA
f PONTO MDIO (XI)
(DIAS)
3 18 3 10,5

sabemos que 3 componentes eletrnicos tiveram tempo de vida entre 3 e 18


dias, porm, no sabemos exatamente qual foi o tempo de vida de cada um. Se
considerarmos o limite inferior da classe (3) para efetuarmos os clculos, esta-
remos subestimando as estimativas. Por outro lado, se considerarmos o limite
superior da classe (18) estaremos superestimando as estimativas. Portanto, va-
mos utilizar o ponto mdio de cada classe para podermos fazer os clculos sem
grandes prejuzos. A terceira coluna da tabela apresentada contm os pontos
mdios calculados para cada intervalo de classe. O valor do ponto mdio passa
a ser o nosso valor xi a ser utilizado nos clculos. Vamos aprender como se faz:

Mdia Aritmtica
k
x i fi
i =1
x= k
=
fi
i =1

=
(10, 5 3)+ (25, 5 4)+ (40, 5 4)+ (55, 5 8)+ (70, 5 10)+ (85, 5 28)+ (100, 5 2)+ (115, 5 1)
60
4155
= = 69, 25
60

Podemos dizer, atravs da mdia aritmtica, que os componentes eletrni-


cos tm uma durao mdia de 69 dias e 6 horas (69,25 dias).

captulo 2 43
Mediana
Como os dados esto tabelados em classes de frequncias, o clculo da me-
diana fica um pouquinho mais complicado. Agora, teremos que encontrar a
mediana atravs da seguinte frmula:

A md fi
Md = linf md + - Fmd -1 (2.5)
Fmd 2

onde:
linfmd o limite inferior da classe que contm a mediana;

fi o nmero total de observaes da distribuio de frequncias;

Fmd1 a frequncia acumulada da classe anterior classe que contm a me-


diana;
fmd o nmero de observaes da classe que contm a mediana;
Amd a amplitude do intervalo de classe que contm a mediana.

No clculo da mediana para os dados da tabela 2.2 temos que primeiramen-


te encontrar a classe que contm a mediana. Esta classe corresponde classe

associada frequncia acumulada imediatamente superior fi


.
2

Como fi
=
60
= 30 , temos que a classe que contm a mediana de
2 2
78 93 (pois fa = 57).

44 captulo 2
Tempo PM
f x1 fa
de vida
N de observaes
3|18 3 10,5 3 da classe que
18|33 4 21,5 7 contm a mediana

Classe que 33|48 4 40,5 11 fa da classe


contm a 48|63 8 55,5 19 anterior classe
mediana que contm a
63|78 10 70,5 29 Md
78|93 28 85,5 57
93|108 2 10,5 59
108|123 3 115,5 60
Total 60

fi
Alm disso, temos:

fi = nmero total de observaes da distribuio de frequncias.

Portanto, fi = 60 .

Fmd1 = frequncia acumulada da classe anterior classe que contm a mediana.


Portanto, Fmd1 = 29.
fmd = nmero de observaes da classe que contm a mediana.
Portanto, fmd = 28.
Amd = amplitude do intervalo da classe que contm a mediana.
Portanto, Amd = 93 78=15.

Agora, basta substituirmos todos os valores encontrados na frmula 2.5


para encontrarmos o valor da mediana:

15 60 15
Md = 78 + 29 = 78 + ( 30 29 ) = 78 + 0, 54 78, 5
28 2 28

captulo 2 45
Atravs da mediana podemos dizer que pelo menos 50% dos componentes
eletrnicos avaliados tm durao igual ou inferior a 78 dias e 12 horas.

Moda
No clculo da moda para dados agrupados devemos primeiramente iden-
tificar a classe modal, ou seja, a classe que apresenta a maior frequncia.
Aps a identificao da classe modal, utilizaremos a seguinte frmula para
calcular a moda bruta:

l+L
Mo = (2.6)
2
onde:
l:limite inferior da classe modal
L:limite superior da classe modal

CONEXO
Sugerimos os vdeos: Novo Telecurso E. Fundamental Matemtica Aula 34 (parte 1) e
Novo Telecurso E. Fundamental Matemtica Aula 34 (parte 2) disponveis, respectiva-
mente em http://www.youtube.com/watch?v=SyWbYOtAIYc&NR=1 e http://www.youtube.
com/watch?v=ejMyWfuSO5k que apresenta de modo bem prtico a utilizao das medidas
de posio.

Agora, vamos comentar sobre outras medidas de posio, menos utilizadas,


porm importantes em algumas situaes. So elas: quartis, decis e percentis.

2.4 Medidas Separatrizes: Quartis, Decis e Percentis

Os quartis, decis e percentis so muito similares mediana, uma vez que tam-
bm subdividem a distribuio de dados de acordo com a proporo das frequ-
ncias observadas.

46 captulo 2
ATENO
Perceba que o 2 quartil, o 5 decil e o 50 percentil representam a prpria mediana, ou seja,
todas estas medidas separatrizes (Q2, D5, e P50), dividem a distribuio dos dados ao meio,
deixando 50% dos dados abaixo delas e 50% acima.

J vimos que a mediana divide a distribuio em duas partes iguais, ento, os


quartis (Q1, Q2 e Q3), como o prprio nome sugere, divide a distribuio dos dados
ordenados em quatro partes, sendo, Q1 o quartil que separa os 25% valores infe-
riores dos 75% superiores, Q2 o que divide o conjunto ao meio ( igual mediana)
e Q3 o que separa os 75% valores inferiores dos 25% superiores. No h um con-
senso universal sobre um procedimento nico para o clculo dos quartis, e dife-
rentes programas de computador muitas vezes produzem resultados diferentes.
Os decis, por sua vez, dividem a distribuio dos dados em 10 partes (Di, i =
1, 2, ..., 9) e os percentis dividem a distribuio em 100 partes (Pi, i = 1, 2, ..., 99)
As medidas separatrizes, geralmente, s so calculadas para grandes quan-
tidades de dados.
No Excel, por exemplo, temos a opo de pedir o clculo de tais medidas.
Com os clculos dos quartis, juntamente com os valores mnimo e mxi-
mo do conjunto de dados, podemos construir um grfico chamado desenho
esquemtico ou boxplot. A anlise deste grfico bastante til no sentido de
informar, entre outras coisas, a variabilidade e a simetria dos dados.

CONEXO
Para se entender quais so os procedimentos utilizados na construo de um boxplot, bem
como sua interpretao, leia o texto: Diagrama de Caixa (Boxplots) em: TRIOLA, Mario F..
Introduo estatstica. 10.ed.Rio de Janeiro: LTC, 2008, pp.98 a 102

captulo 2 47
2.4.1 Clculo dos quartis e dos percentis para dados no agrupados em classes

Como os quartis so medidas separatrizes precisamos, primeiramente, orde-


nar o conjunto de dados.

n
O primeiro quartil (Q1) ser o valor da varivel que ocupar a posio . O se-
4

gundo quartil (Q2) ser o valor da varivel que ocupar a posio


2n e o terceiro
4

3n
quartil (Q3) ser o valor da varivel que ocupar a posio . Quando fazemos
4

estas divises para encontrar as posies dos quartis, pode acontecer do resul-
tado ser um nmero inteiro ou um nmero fracionrio. Ento, adotaremos a
seguinte conveno:
Se a diviso resultar num nmero fracionrio, arredonde-o para cima e
o valor do quartil ser a resposta da varivel encontrada nesta posio.
Se a diviso for um nmero inteiro, o quartil ser a mdia aritmtica da
resposta da varivel que ocupar a posio encontrada com a resposta da
varivel que ocupar a posio seguinte.

Exemplo 2.4
Um escritrio que presta consultoria em administrao levantou os tempos
de espera de pacientes que chegam a uma clnica de ortopedia para atendimen-
to de emergncia. Foram coletados os seguintes tempos, em minutos, durante
uma semana. Encontre os quartis.

2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7

48 captulo 2
Resoluo:
Para encontrarmos os quartis, precisamos ordenar o conjunto de dados.
Ento:
2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14

n 18
Posio do primeiro quartil (Q1): = = 4, 5
4 4
Como a diviso resultou em um valor fracionrio, vamos arredondar para 5.
Portanto, o primeiro quartil o valor que est na quinta posio.

Q1 = 3

Ento, pelo menos 25% das observaes so menores ou iguais a 3 minutos.

2xn 2 x 18
Posio do segundo quartil (Q2 ): = = 9
4 4
Como a diviso resultou em um valor inteiro, o segundo quartil ser o resul-
tado da mdia aritmtica entre o valor que est na nona posio e o valor que
est na dcima posio.

6+7
Q2 = = 6, 5
2

Temos que pelo menos 50% das observaes so maiores ou iguais a 6,5 mi-
nutos.

3 x n 3 x 18
Posio do terceiro quartil (Q3 ): = = 13, 5
4 4
Como a diviso resultou em um valor fracionrio, vamos arredondar para
14. Portanto, o terceiro quartil o valor que est na dcima quarta posio.

Q3 = 8

Neste conjunto de dados, pelo menos 25% das observaes so maiores ou


iguais a 8 minutos.

captulo 2 49
Agora que j aprendemos a calcular e interpretar os quartis para dados no
agrupados, vamos passar para o conceito de percentis.
Da mesma forma que nos quartis, o conjunto de dados deve estar ordenado.
Quando dividimos o conjunto de dados em 100 partes, obtemos 99 percentis.

O percentil pk ser a resposta da varivel que ocupar a posio (k x n)


100
Adotaremos a seguinte conveno:
Se a diviso resultar num nmero fracionrio, arredonde-o para cima e
o valor do percentil ser a resposta da varivel encontrada nesta posio.
Se a diviso for um nmero inteiro, o percentil ser a mdia aritmtica da
resposta da varivel que ocupar a posio encontrada com a resposta da
varivel que ocupar a posio seguinte.

Exemplo 2.5
Vamos encontrar o trigsimo quinto percentil do conjunto de dados do
exemplo 2.4.

2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14

Resoluo
O percentil p35 ser a resposta da varivel que ocupar a posio
( 35 x 18) = 6, 3 .
100

Como a diviso resultou em um valor fracionrio, vamos arredondar para


7. Portanto, o trigsimo quinto percentil o valor que est na stima posio.

P35 = 4

Ento, aproximadamente 35% das observaes so menores ou iguais a 4


minutos.

50 captulo 2
2.4.2 Clculo dos quartis e dos percentis para dados agrupados em classes

Para calcular os quartis quando os dados esto organizados em intervalos de


classes, utilizaremos o mesmo procedimento descrito para o clculo da media-
na (Q2) para dados agrupados em classes.
Para o clculo do Q1 utilizamos a seguinte frmula:

A q1 fi
Q1 = linf q1 + Fq11 (2.7)
f q1 4
onde:
linf o limite inferior da classe que contm o primeiro quartil;
q1

fi o nmero total de observaes da distribuio de frequncias;


Fq11 a frequncia acumulada da classe anterior classe que contm o pri-
meiro quartil;
fq1 o nmero de observaes da classe que contm o primeiro quartil;
Aq1 a amplitude do intervalo de classe que contm o primeiro quartil.

De maneira semelhante, o clculo do Q3 ser feito utilizando a seguinte fr-


mula:

A q3 3 x fi
Q3 = linf q3 + Fq3 1 (2.8)
f q3 4
onde:
linf o limite inferior da classe que contm o terceiro quartil;
q3

fi o nmero total de observaes da distribuio de frequncias;


Fq31 a frequncia acumulada da classe anterior classe que contm o ter-
ceiro quartil;
fq3 o nmero de observaes da classe que contm o terceiro quartil;
Aq3 a amplitude do intervalo de classe que contm o terceiro quartil.

captulo 2 51
Exemplo 2.6
Vamos utilizar os dados do exemplo 2.3 para encontrar o primeiro e o ter-
ceiro quartil.

PM
TEMPO DE VIDA f fa
xI
3 18 3 10,5 3

18 33 4 25,5 7

33 48 4 40,5 11

48 63 8 55,5 19

63 78 10 70,5 29

78 93 28 85,5 57

93 108 2 100,5 59

108 123 1 115,5 60

Total 60

Resoluo
Primeiramente, temos que encontrar a classe que contm o primeiro quar-
til. Esta classe corresponde classe associada frequncia acumulada imedia-

tamente superior fi
.
4

52 captulo 2
Como fi = 60 , temos que a classe que contm o primeiro quartil de
4 4
4863 (pois fa = 19).

Alm disso, temos:


fi = nmero total de observaes da distribuio de frequncias. Por-

tanto, fi =60.

Fq1 = frequncia acumulada da classe anterior classe que contm o primei-


ro quartil. Portanto, fq1 = 11.
fq1 = nmero de observaes da classe que contm o primeiro quartil. Por-
tanto, fq1 = 8.
Aq1 = amplitude do intervalo da classe que contm o primeiro quartil. Por-
tanto, Aq1 = 63 48 = 15.

Agora, basta substituirmos todos os valores encontrados na frmula 2.7 e


encontrar o valor do primeiro quartil:

15 60 15
Q1 = 48 + 11 = 48 + (15 11) = 18 + 7, 5 = 55, 5
8 4 8

De acordo com o resultado obtido podemos esperar que aproximadamente


25% dos dados so menores ou iguais a 55,5, ou seja, aproximadamente 25%
dos componentes eletrnicos tm durao inferior a 55 dias e 12 horas.
Agora, vamos encontrar a classe que contm o terceiro quartil. Esta classe
corresponde classe associada frequncia acumulada imediatamente supe-

3 x fi
rior .
4

Como 3 x fi 3 x 60 , temos que a classe que contm o terceiro quar-


=
4 4
til de 7893 (pois f_a=57).

captulo 2 53
Alm disso, temos:

fi = nmero total de observaes da distribuio de frequncias. Por-

tanto, fi = 60.
Fq3= frequncia acumulada da classe anterior classe que contm o terceiro
quartil. Portanto, Fq3 = 29.
fq3= nmero de observaes da classe que contm o terceiro quartil. Portan-
to, fq3 = 28.
Aq3 = amplitude do intervalo da classe que contm o terceiro quartil. Portan-
to, Aq3 = 93 78 = 15.

Agora, basta substituirmos todos os valores encontrados na frmula 2.8 e


encontrar o valor do terceiro quartil:

15 3 x 60 15
Q3 = 78 + 29 = 78 + ( 45 29 ) = 78 + 8, 57 86, 57
28 4 28

De acordo com o resultado obtido podemos esperar que aproximadamente


75% dos dados so menores ou iguais a 86,57, ou seja, aproximadamente 75%
dos componentes eletrnicos tm durao inferior a 86 dias e 14 horas.

Agora, vamos passar para o clculo dos percentis.


No caso dos dados estarem organizados em intervalos de classes, os percen-
tis so calculados utilizando a seguinte frmula:

A pk k x fi
Pk = linf pk + Fpk 1
f pk 100 (2.9)

em que k = 1,2,,99.

O procedimento para encontrar as quantidades que devem ser substitudas na


frmula 2.9 so os mesmos que utilizamos para encontrar os quartis.

54 captulo 2
Exemplo 2.7
Vamos utilizar os dados do exemplo 2.3 para encontrar o dcimo quinto
percentil.

PM
TEMPO DE VIDA f fa
xI
3 18 3 10,5 3

18 33 4 25,5 7

33 48 4 40,5 11

48 63 8 55,5 19

63 78 10 70,5 29

78 93 28 85,5 57

93 108 2 100,5 59

108 123 1 115,5 60

Total 60

Primeiramente, temos que encontrar a classe que contm o dcimo quinto


percentil. Esta classe corresponde classe associada frequncia acumulada

imediatamente superior
15 x fi .
100

Como
15 x fi = 15 x 60 = 9 , temos que a classe que contm o dci-
100 100
mo quinto percentil de 3348 (pois fa = 11).

captulo 2 55
Alm disso, temos:
fi = nmero total de observaes da distribuio de frequncias. Por-

tanto, fi = 60.
Fp15 = frequncia acumulada da classe anterior classe que contm o dci-
mo quinto percentil. Portanto, Fp15 = 7.
fp15 = nmero de observaes da classe que contm o dcimo quinto percen-
til. Portanto,fp15 = 4.
Ap15= amplitude do intervalo da classe que contm o dcimo quinto percen-
til. Portanto, Ap15 = 48 33=15.

Agora, basta substituirmos todos os valores encontrados na frmula 2.9 e


encontrar o valor do dcimo quinto percentil:

15 15 x 60 15
P15 = 33 + 7 = 33 + ( 9 7 ) = 33 + 7, 5 = 40, 5
4 100 4

De acordo com o resultado obtido podemos esperar que aproximadamente


15% dos dados so menores ou iguais a 40,5, ou seja, aproximadamente 15%
dos componentes eletrnicos tm durao inferior a 40 dias e 12 horas.

CONEXO
Agora que j abordamos como se calcula os quartis e percentis, faa uma leitura do texto:
Decis (Dk) em TIBONI, Conceio G.R. Estatstica bsica - para os cursos de Administra-
o, Cincias Contbeis, Tecnolgicos e de Gesto. So Paulo: Atlas, 2010.

56 captulo 2
ATIVIDADE
1. Quais as vantagens e desvantagens do modelo linear?Os dados abaixo referem-se ao
nmero de horas extras de trabalho de uma amostra de 64 funcionrios de uma deter-
minada empresa localizada na capital paulista.

10 10 12 14 14 14 15 16

18 18 18 18 18 19 20 20

20 20 20 21 22 22 22 22

22 22 22 22 22 22 22 22

23 23 24 24 24 24 24 24

24 25 25 25 25 26 26 26

26 26 26 27 27 27 28 28

29 30 30 32 35 36 40 41

Pede-se:
a) Calcule e interprete as seguintes medidas descritivas calculadas para os dados bru-
tos (dados no tabulados): mdia aritmtica; mediana; moda.
b) Construir uma distribuio de frequncias completa (com freq. absoluta, freq. relativa,
freq. acumulada e ponto mdio).
c) Com a tabela construda no item b), encontre as seguintes medidas: mdia aritmtica;
mediana; moda; 1 quartil; 7 decil; 99 percentil. Interprete os resultados.
d) Construa o histograma para este conjunto de dados.

captulo 2 57
2. Os dados abaixo representam as vendas mensais (em milhes de reais) de vendedores
de gnero alimentcios de uma determinada empresa.

VENDAS MENSAIS (EM MILHES DE NMERO DE VENDEDORES


REAIS)
01 6

12 12

23 20

34 48

45 14

56 10

Total 110

a) Qual a varivel em estudo? Que tipo de varivel esta?


b) Encontre a mdia, a mediana e a moda e interprete os resultados.
c) Encontre as medidas separatrizes Q3, D1, e P80 e interprete os resultados.
d) Qual a porcentagem de vendedores com vendas mensais inferiores a 2 milhes
de reais?
e) Qual a porcentagem de vendedores com vendas mensais superiores a 4 milhes
de reais?
f) Qual a porcentagem de vendedores com vendas mensais entre 3 (inclusive) e 5 (ex-
clusive) milhes de reais?
g) Qual a porcentagem de vendedores que vendem, pelo menos, 3 milhes de reais
mensais?

58 captulo 2
3. Numa pesquisa realizada com 91 famlias, levantaram-se as seguintes informaes com
relao ao nmero de filhos por famlia:

NMERO DE FILHOS 0 1 2 3 4 5

FREQUNCIA DE FAMLIAS 19 22 28 16 2 4

Calcule e interprete os resultados da:


a) mdia aritmtica
b) mediana
c) moda

4. O histograma abaixo representa a distribuio das idades dos funcionrios de uma agn-
cia bancria. Com base no histograma abaixo, responda:

16 Histograma
15
14
13
12
11
10
9
Frequncia

8
7
6
5
4
3
2
1
0
20 | 25 25 | 30 30 | 35 35 | 40 40 | 45 45| 50

Idade

a) Qual a varivel em estudo?


b) Quantos funcionrios trabalham nesta agncia bancria?
c) Quais so a mdia, a mediana e a moda para a idade dos funcionrios desta agn-
cia? Interprete os resultados.
d) Qual o valor do primeiro quartil? Interprete o resultado.
e) Quantos funcionrios tm menos que 30 anos?
f) Qual a porcentagem de funcionrios com mais de 45 anos?
g) Qual a porcentagem de funcionrios com no mnimo 30 anos?

captulo 2 59
5. Define-se a mdia aritmtica de n nmeros dados como o resultado da diviso por n da
soma dos n nmeros dados. Sabe-se que 4,2 a mdia aritmtica de 2.7; 3.6; 6.2; e x.
Determine o valor de x.

REFLEXO
Que a mdia a medida de posio mais utilizada em nosso dia a dia talvez nem seria neces-
srio dizer. Mas preciso tomar certo cuidado quando utilizamos a mdia como parmetro
de um conjunto de dados. Voc sabe que, se a mdia de sua turma em Estatstica for igual
a 7,0 (por exemplo), no quer dizer que toda ela, ou a maioria, teve bom desempenho nem
que metade da turma teve desempenho igual ou superior a 7,0. Outras medidas, como vimos,
podem complementar as informaes dadas pela mdia.

LEITURA
Como a mdia uma medida descritiva muito utilizada no dia a dia, sugerimos que voc oua
o udio Mdias que interessam, da Srie: Problemas e Solues. H dois mdulos cujos
contedos alertam par ao cuidado que se deve ter na interpretao da mdia, mostram uma
aplicao da mdia ponderada e fazem uma anlise crtica da utilizao da mdia como uma
informao nica. O endereo para acesso : http://m3.ime.unicamp.br/recursos/1315.

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.

BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatstica bsica. So Paulo: Saraiva, 2003.

COSTA NETO, Pedro Luiz de Oliveira. Estatstica. So Paulo: Edgard Blucher, 2002.

DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.

60 captulo 2
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro: LTC, 2003.

TIBONI, Conceio G. Rebelo. Estatstica Bsica - para os cursos de Administrao, Cin-


cias Contbeis, Tecnolgicos e de Gesto. So Paulo: Atlas, 2010.

NO PRXIMO CAPTULO
Abordaremos no prximo captulo aspectos especficos do desenho departamental, assim como
as diversas formas de departamentalizao utilizadas pelas organizaes, tais como a departa-
mentalizao funcional, divisional e suas diversas categorias, tais como projetos, produtos ou
servios, territorial, por clientes etc.

captulo 2 61
3
Medidas de
Disperso
3 Medidas de Disperso
Estas medidas servem para indicar o quanto os dados se apresentam dispersos em
torno da regio central. Fornecem, portanto, o grau de variao existente no con-
junto de dados. Dois ou mais conjuntos de dados podem, por exemplo, ter a mes-
ma mdia, porm os valores podero estar muito mais dispersos num conjunto do
que no outro. Ou seja, podem ter maior ou menor grau de homogeneidade.

OBJETIVOS
Por meio do estudo deste captulo, esperamos que voc seja capaz de calcular e interpretar
as medidas de disperso aplicadas a conjuntos de dados, com o objetivo de avaliar o grau
de homogeneidade.

REFLEXO
Voc se lembra de alguma vez em que saiu de casa tendo quase certeza de que ficaria preso
em um engarrafamento no trnsito? No preciso ser muito observador para perceber que,
em determinadas horas do dia, dependendo do dia da semana, o trnsito (nas grandes e nas
mdias cidades) estar congestionado. Talvez o melhor seria deixar para sair outra hora (se
isto for possvel). O fluxo de veculos, nesses momentos, apresenta certa homogeneidade,
ou seja, quase sempre est intenso. Dificilmente, num dia como esses, voc ter um fluxo
acentuadamente menor (ou maior) do que o que voc verifica todos os dias. Vamos estudar
situaes como essas, em que a informao sobre o grau de homogeneidade (ou heteroge-
neidade) nos ajudar a tomar a deciso mais adequada.

3.1 Exemplo Introdutrio

Vamos analisar um exemplo bem simples que nos d a ideia da importncia de


se conhecer as medidas de disperso para a tomada de algumas decises.

Exemplo 3.1: Imagine que estamos interessados em fazer uma viagem para
Honolulu (Hava) ou Houston (Texas) e para arrumar as malas necessitamos sa-
ber se a localidade a ser visitada faz calor, faz frio ou ambos. Se tivssemos ape-

64 captulo 3
nas a informao de que a temperatura mdia diria (medida durante um ano)
das duas localizaes fosse igual a25 C, poderamos colocar na mala apenas
roupas de vero? A resposta no. Por exemplo, se estivssemos interessados
em viajar para o Hava (em Honolulu), poderamos levar apenas roupas de ve-
ro, pois a temperatura mnima observada durante um ano foi de 21 C e a m-
xima foi de 29 C. Porm, se resolvermos ir ao Texas (Houston), devemos tomar
cuidado com a poca, pois as temperaturas, durante um ano, variaram de 4 C
(mnima) a 38 C (mxima). Com estas informaes, conclumos que as tempe-
raturas em Honolulu variam pouco em torno da mdia diria, ou seja, podemos
levar uma mala apenas com roupas leves. Porm, em Houston, as temperaturas
variam muito, com perodos de muito frio ou muito calor. Portanto, para ir
Houston sem perigo de sofrer com a temperatura, devemos analisar o perodo
do ano para saber se a temperatura estar alta ou baixa.

ATENO
As medidas de disperso indicam o grau de variabilidade das observaes. Estas medidas
possibilitam que faamos distino entre conjuntos de observaes quanto sua homoge-
neidade. Quanto menor as medidas de disperso, mais homogneo o conjunto de dados.

Percebemos, atravs desse exemplo bem simples, que uma simples medida
de disperso (a amplitude, por exemplo) j ajudaria muito a tomar certos cuida-
dos com a arrumao das bagagens.
Veremos, nos prximos itens, como calcular e interpretar as seguintes me-
didas de disperso: amplitude, amplitude interquartil, desvio-padro, varin-
cia e coeficiente de variao.
Primeiramente, vamos apresentar os clculos das medidas de disperso
para dados no-tabulados, ou seja, quando os dados no estiverem na forma de
distribuio de frequncias.

3.2 Amplitude Total (R)

A amplitude total a diferena entre o maior e o menor valor observado no con-


junto de dados, ou seja:

R = x ( mximo) - x ( mnimo) (3.1)

captulo 3 65
A amplitude no uma medida muito utilizada, pois s leva em conta dois
valores de todo o conjunto de dados e muito influenciada por valores extre-
mos. No prximo item estudaremos uma medida de disperso mais resistente
a valores extremos.

3.3 Amplitude interquartil

A amplitude interquartil, ou distncia interquartil, uma medida de variabili-


dade que no facilmente influenciada por valores discrepantes no conjunto
de dados. Ela engloba 50% das observaes centrais do conjunto de dados e seu
clculo definido como:

Amplitude interquartil = Q3 Q1 (3.2)

Agora, vamos estudar uma medida de disperso muito utilizada e que leva
em conta todos os valores do conjunto de dados: o desvio-padro.

3.4 Desvio-Padro (s)

Primeiramente, vamos entender qual a definio da palavra desvio em estats-


tica. Desvio nada mais do que a distncia entre qualquer valor do conjunto de
dados em relao mdia aritmtica deste mesmo conjunto de dados.
Existem vrias medidas de disperso que envolvem os desvios. So elas: o
desvio-padro (mais utilizada), a varincia e o coeficiente de variao.

ATENO
O valor do desvio-padro nunca negativo. zero apenas quando todos os valores do conjunto
de dados so os mesmos. A unidade do desvio-padro a mesma unidade dos dados originais.

O desvio-padro a medida mais utilizada na comparao de diferenas


entre grupos, por ser mais precisa e estar na mesma medida do conjunto de
dados. Matematicamente, sua frmula dada pela raiz quadrada da mdia arit-
mtica aproximada dos quadrados dos desvios, ou seja:

66 captulo 3
n
( x i - x )2 ( x1 - x ) 2 + ( x 2 - x ) 2 + + ( x n - x ) 2
i =1
s= = (3.3)
n -1 n -1

onde xi cada uma das observaes do conjunto de dados, x a mdia do


conjunto de dados e n o nmero total de observaes do conjunto de dados.
Desenvolvendo a frmula (3.3) chegamos a frmula (3.4) que, para alguns
casos, tornam os clculos mais simples e rpidos.

( x )
2


i
x i2 -
s= n (3.4)
n -1

onde:
x i2 a soma de cada valor da varivel ao quadrado;
( x ) o quadrado da soma de todos os valores da varivel;
2
i

n o nmero total de valores do conjunto de dados.

Como o desvio-padro uma medida de disperso e mede a variabilidade


entre os valores, temos que valores muito prximos resultaro em desvios-pa-
dres pequenos, enquanto que valores mais espalhados resultaro em desvios-
-padres maiores.

3.4.1 Uma regra prtica para interpretar o desvio-padro

Depois que calculamos o desvio-padro, surge uma pergunta: como inter-


pret-lo?

CONEXO
Para se entender um pouco mais sobre o conceito de variabilidade, acesse o endereo
http://www.gaussconsulting.com.br/si/site/05072.

captulo 3 67
Para conjuntos de dados que tenham distribuio em forma de sino, valem
as seguintes consideraes:
Cerca de 68% das observaes do conjunto de dados ficam a 1 desvio-pa-
dro da mdia, ou seja, ( x s) e ( x + s).
Cerca de 95% das observaes do conjunto de dados ficam a 2 desvios-pa-
dres da mdia, ou seja, ( x 2s) e ( x + 2s) .
Cerca de 99,7% das observaes do conjunto de dados ficam a 3 desvios-
-padres da mdia, ou seja, ( x 3s) e ( x + 3s) .

3.5 Varincia (s2)

A varincia de um conjunto de dados nada mais do que o valor do des-


vio-padro elevado ao quadrado, ou seja,

n
( x i - x )2
i =1
s2 = (3.5)
n -1

ou

( x )
2


i
x i2 -
s2 = n (3.6)
n -1

A varincia no uma medida muito utilizada para mostrar a disperso de


um conjunto de dados, pois, expressa o seu resultado numa medida ao quadra-
do, no sendo possvel interpretar o seu valor. Portanto, na anlise descritiva
dos dados, no vamos trabalhar com esta medida constantemente. Se um de-
terminado problema fornecer a varincia do conjunto de dados, basta calcular-
mos a raiz quadrada deste valor (varincia) e obteremos o desvio-padro, que
facilmente interpretado por estar na mesma medida do conjunto de dados.

68 captulo 3
3.6 Coeficiente de Variao (cv)

O coeficiente de variao (cv) definido como o quociente entre o desvio-pa-


dro e a mdia, e frequentemente expresso em porcentagem. Ele mede o grau
de variabilidade do conjunto de dados. Quando calculamos o desvio-padro,
obtemos um valor que pode ser grande ou pequeno, dependendo da varivel
em estudo. O fato de ele ser um valor considerado alto relativo, pois depen-
dendo da varivel que est sendo estudada e da mdia, esta variao dos dados
pode ser relativamente pequena. Ento, o coeficiente de variao serve para cal-
cular o grau de variao dos dados em relao mdia aritmtica. E obtido
atravs do seguinte clculo:

s
cv = 100 (3.7)
x

onde s o desvio-padro e x a mdia aritmtica.

Alguns autores consideram a seguinte regra emprica para a interpretao


do coeficiente de variao:
Baixa disperso: C.V 15%
Mdia: C.V . 15% 30%
Alta: C.V 30%

Em geral, o coeficiente de variao uma estatstica til para comparar a


variao para valores originados de diferentes variveis (por exemplo: peso, em
Kg e altura, em cm), pois ele adimensional.

3.7 Exemplo de aplicao das medidas de disperso para dados


no tabulados

Vamos exemplificar o clculo da amplitude, da amplitude interquartil, do des-


vio-padro, da varincia e do coeficiente de variao utilizando o exemplo 2.1,
que apresenta o conjunto de dados brutos.

captulo 3 69
Exemplo 3.2: Um gerente de banco quis estudar a movimentao de pes-
soas em sua agncia na segunda semana de determinado ms. Ele constatou
que no primeiro dia entraram 1.348 pessoas, no segundo dia, 1.260 pessoas, no
terceiro, 1.095, no quarto, 832 e no ltimo dia do levantamento, 850 pessoas.
Encontre a amplitude, o desvio-padro, a varincia e o coeficiente de variao
para este conjunto de dados e interprete os resultados.

Resoluo
A amplitude dada por:

R = x (mximo) - x (mnimo) = 1.348 - 832 = 516 pessoas.

A diferena, no nmero de pessoas que entram na agncia, entre o dia de


maior movimento e o dia de menor movimento de 516 pessoas.
Para encontrarmos a amplitude interquartil, precisamos calcular o primei-
ro e o terceiro quartil. Para isto, vamos seguir os procedimentos descritos no
item 2.4.1.

Posio do primeiro quartil (Q1): n 5


= = 1, 25
4 4

Como a diviso resultou em um valor fracionrio, vamos arredondar para 2.


Portanto, o primeiro quartil o valor que est na segunda posio do conjunto
de dados ordenados.

Q1 = 850

3xn 3x5
Posio do terceiro quartil (Q3 ): = = 3, 75 .
4 4
Como a diviso resultou em um valor fracionrio, vamos arredondar para 4.
Portanto, o terceiro quartil o valor que est na quarta posio.

Q3 = 1260

70 captulo 3
Ento:

Amplitude interquartil = Q3 Q1
=1260 850
=410 pessoas

Ento, a amplitude do intervalo que contm 50% das observaes centrais


410 pessoas.

O desvio-padro obtido atravs das frmulas (3.3) ou (3.4). Como a mdia


aritmtica um nmero inteiro e existem poucos dados, a frmula (3.3) mais
rpida de ser calculada. Porm, fica a critrio de cada um a utilizao de uma ou
de outra. Lembrando que a mdia aritmtica encontrada anteriormente igual
a 1.077 e utilizando a frmula (3.3), temos:

n
( x i - x )2
i =1
s= =
n -1

=
(1.348 -1.077)2 + (1.260 -1.077)2 + (1.095 -1.0777)2 + (832 -1.077)2 + (850 -1.077)2 =
5 -1

=
(271)2 + (183)2 + (18)2 + (-245)2 + (-227)2 =
4

=
(73.441)+ (33.489)+ (324)+ (60.025)+ (51.529) =
4
218.808
= = 54.702 @ 233 , 88 pessoas
4

Neste exemplo, entram na agncia, em mdia, 1.077 pessoas por dia. O n-


mero de pessoas que entra na agncia varia, mas, tipicamete, a diferena em
relao mdia foi de aproximadamente 234 pessoas.
A varincia, como vimos, obtida atravs das frmulas (3.5) ou (3.6), ou sim-
plestemente, como j temos o desvio-padro, basta elevarmos o valor encontra-
do ao quadrado. Para o nosso exemplo, temos:

s2= (233,88 pessoas)2 = 54699,85 pessoas2

captulo 3 71
Nesse caso, no h como interpretar a expresso pessoas2. Por esse motivo,
utilizamos o desvio-padro no lugar da varincia.
O coeficiente de variao, dado pela frmula (3.7), muito fcil de ser obti-
do desde que j conheamos os valores da mdia aritmtica e do desvio-padro.
Pela frmula podemos observar que basta fazermos uma simples diviso. Para
este exemplo, temos que:

s 233, 88
cv = = @ 0, 2172 ou 21, 72%
x 1.077

Utilizando a regra emprica, podemos dizer que o conjunto de dados apre-


senta uma mdia disperso.
Agora, vamos aprender a calcular as medidas de disperso atravs de dados
tabulados.
Quando os dados estiverem na forma tabulada, haver uma pequena dife-
rena no clculo das mdias de disperso, pois agora ser necessrio conside-
rar as frequncias, que funcionaro como fatores de ponderao, referentes
a cada valor da varivel.

3.8 Desvio-padro para dados tabulados

Se os dados estiverem tabulados, o desvio-padro pode ser encontrado da se-


guinte forma:

k
( x i - x )2 fi
i =1
s= (3.8)
n -1

Desenvolvendo a frmula (3.8) chegamos frmula (3.9) que tambm uti-


lizada para o clculo do desvio-padro:

( x f )
2

x i2
i i
f -
i
s= n (3.9)
n -1

72 captulo 3
onde, para ambas as frmulas (3.8) e (3.9), xi representa cada uma das obser-
vaes do conjunto de dados ou, se os dados estiverem agrupados em classes de
frequncias, xi representa o ponto mdio da classe, x a mdia do conjunto de
dados, fi a frequncia associada a cada observao (ou classe de observaes) do
conjunto de dados e n o nmero de total de observaes no conjunto de dados.

3.9 Varincia para dados tabulados

A varincia de um conjunto de dados agrupados dada por:

k
( x i - x )2 fi
i =1
s2 = (3.10)
n -1

ou

( x f )
2


i i
x i2 f -
i
s2 = n
n -1 (3.11)

A amplitude, a amplitude interquartil e o coeficiente de variao no sofrem


modificaes significativas. A amplitude continua sendo a diferena entre o
maior e o menor valor (se os dados estiverem em classes de frequncias, R ser a
diferena entre o limite superior da ltima classe e o limite inferior da primeira
classe). A amplitude interquartil continua sendo a diferena entre o terceiro e o
primeiro quartil e o clculo do coeficiente de variao feito utilizando a frmula
(3.7), porm, se os dados estiverem em classes de frequncias, o desvio-padro e a
mdia aritmtica so obtidos utilizando xi como o ponto mdio da classe.

captulo 3 73
3.10 Exemplo de aplicao das medidas de disperso para dados
tabulados

Para demonstrao dos clculos para dados tabelados, vamos continuar utili-
zando os exemplos desenvolvidos no item 2.3 (Exemplos 2.2 e 2.3).
Exemplo 3.3: Em um determinado ms, foi computado o nmero x de faltas
ao trabalho, por motivos de sade, que cada funcionrio de uma determinada
empresa teve. Os dados esto apresentados na tabela a seguir:

NMERO DE FALTAS f
0 31

1 20

2 8

3 2

4 0

5 1

6 1

Total 63

Tabela 3.1 Nmero de faltas ao trabalho, por motivos de sade.

Encontre a amplitude, o desvio-padro, a varincia e o coeficiente de varia-


o para este conjunto de dados e interprete os resultados.

74 captulo 3
Resoluo

A amplitude para este conjunto de dados dada por:

R = x(mximo) X(mnimo) = 6 0 = 6 faltas

A maior diferena entre os nmeros de faltas ao trabalho, por motivo de sa-


de, que funcionrios de uma determinada empresa tiveram no perodo de um
ms, 6 faltas.

A amplitude interquartil dada por:

Amplitude interquartil = Q3 Q1 = 1 0 = 1 falta

O desvio-padro obtido atravs das frmulas (3.8) ou (3.9). Para exemplifi-


car, vamos trabalhar com a frmula (3.9). Para facilitar, vamos montar um qua-
dro com os resultados que nos interessa para aplicar tal expresso.

NMERO DE 2
FALTAS X1 fi Xi X fi Xi - fi

0 31 0 0

1 20 20 20

2 8 16 32

3 2 6 18

4 0 0 0

5 1 5 25

6 1 6 36

Total () 63 53 131

captulo 3 75
Substituindo os valores encontrados no quadro acima na frmula 3.9, obtemos:

( x f )
2
(53)
2


i i
x i2 f -
i 131 -
s= n = 63 =
n -1 63 -1
2809
131 -
= 63 @ 131 - 44, 59 @
62 62
@ 1, 3938 @ 1,18 faltas

Podemos dizer que, em mdia, ocorre aproximadamente 1 falta por funcio-


nrio, por ms. Na verdade, sabemos que esse nmero de faltas por funcionrio
varia em torno da mdia, mas, tipicamente, a diferena em relao mdia
de, aproximadamente, 1 falta.

A varincia obtida atravs das frmulas (3.10) ou (3.11), porm, como j


temos o desvio-padro, basta elevarmos o valor encontrado ao quadrado. Por-
tanto, temos:

s2 = (1,18 faltas)2 = 1,3924 faltas2

Como 1,3924 faltas2 no tem interpretao, utilizamos o desvio-padro em


vez da varincia para interpretar o comportamento dos dados.

O coeficiente de variao para este exemplo dado por:

s 1,18
cv = = @ 1, 4048 ou 140,48%
x 0, 84

O coeficiente de variao nos diz que este conjunto de dados apresenta uma
alta disperso.
Para finalizarmos, vamos fazer os clculos para os dados agrupados em
classes de frequncias. Para isto, vamos utilizar o exemplo 2.3 que se encontra
no item 2.3.

76 captulo 3
Exemplo 3.4: A tabela a seguir apresenta a distribuio de frequncias do
tempo de vida de 60 componentes eletrnicos (medido em dias) submetidos
experimentao num laboratrio especializado.

TEMPO DE VIDA (DIAS) f PONTO MDIO (Xi)


3 18 3 10,5

18 33 4 25,5

33 48 4 40,5

48 63 8 55,5

63 78 10 70,5

78 93 28 85,5

93 108 2 100,5

108 123 1 115,5

Total 60

Tabela 3.2 Tempo de vida de componentes eletrnicos.

Calcule a amplitude, o desvio-padro, a varincia e o coeficiente de variao


para este conjunto de dados e interprete os resultados.

Resoluo
A amplitude para este conjunto de dados dada por:
R = x(mximo) X(mnimo) = 123 3 = 120 dias.

A maior diferena entre os tempos de vida (em dias) dos componentes ele-
trnicos foi de 120 dias, ou seja, o componente com maior sobrevivncia durou
120 dias a mais do que o componente que durou menos tempo.

captulo 3 77
Para o clculo da amplitude interquartil vamos utilizar os resultados obti-
dos no exemplo 2.6. Portanto:

Amplitude interquartil = Q3 Q1 = 86,57 55,5 = 31,07 dias

De acordo como valor obtido, conclumos que 50% das observaes centrais do
conjunto de dados esto contidas em um intervalo cuja amplitude 31,07 dias.
Para o clculo do desvio-padro, podemos utilizar as frmulas (3.8) ou (3.9),
onde o termo xi o ponto mdio de cada classe de frequncia. Como a mdia
aritmtica envolve valores decimais, mais simples efetuar os clculos atravs
da frmula (3.9). Como no exemplo anterior, vamos construir um quadro acres-
centando as colunas que fornecero os valores que precisamos para substituir
na frmula 3.9.

CLASSES DE 2
f PM (Xi) Xi - fi Xi - fi
FREQUNCIAS
3 18 3 10,5 31,5 330,75

18 33 4 25,5 102 2601

33 48 4 40,5 162 6561

48 63 8 55,5 444 24642

63 78 10 70,5 705 49702,5

78 93 28 85,5 2394 204687

93 108 2 100,5 201 20200,5

108 123 1 115,5 115,5 13340,25

Total 60 4155 322065

78 captulo 3
Com os valores obtidos, temos:

( x f )
2
(4155)2 17264025

i i
x i2 f -
i 322065 - 322065 -
s= n = 60 = 60 @
n -1 60 -1 59
322065 - 287733, 75
@ @ 581, 89 @ 24,12 dias
59

Em mdia, os componentes eletrnicos tm durao de 69 dias e 6 horas


com uma variao de, aproximadamente, 24 dias e 3 horas para mais ou para
menos com relao mdia.
A varincia, como j sabemos, o desvio-padro ao quadrado. Assim, temos:

s2 = (24,12 dias)2 = 581,77 dias2

Como 581,77 dias2 no tem interpretao, utilizamos o desvio-padro para


interpretar o comportamento dos dados.
O coeficiente de variao para este exemplo :

s 24,12
cv = = @ 0, 3483 ou 34,83%
x 69, 25
o que indica uma variabilidade alta no conjunto de dados.

captulo 3 79
ATIVIDADE
1. Vamos utilizar, entre outros exerccios, os mesmos da captulo 2, porm encontrando as
medidas de disperso.
Os dados abaixo referem-se ao nmero de horas extras de trabalho de uma amostra de
64 funcionrios de uma determinada empresa localizada na capital paulista.

10 10 12 14 14 14 15 16
18 18 18 18 18 19 20 20
20 20 20 21 22 22 22 22
22 22 22 22 22 22 22 22
23 23 24 24 24 24 24 24
24 25 25 25 25 26 26 26
26 26 26 27 27 27 28 28
29 30 30 32 35 36 40 41

a) Calcule e interprete as seguintes medidas de disperso, calculadas para os dados


brutos (dados no tabulados): amplitude, desvio-padro, varincia e coeficiente de
variao e interprete os resultados.
b) Por meio da distribuio de frequncias (dados tabulados) construda para este con-
junto de dados (no captulo anterior), encontre a amplitude, o desvio-padro, a varin-
cia e o coeficiente de variao e interprete os resultados.

80 captulo 3
2. Os dados abaixo representam as vendas mensais (em milhes de reais) de vendedores
de gnero alimentcios de uma determinada empresa.

VENDAS MENSAIS (EM MILHES NMERO DE VENDEDORES


DE REAIS)
0 | 1 6

1 | 2 12

2 | 3 20

3 | 4 48

4 | 5 14

5 | 6 10

Total 110

Encontre a amplitude, o desvio-padro, a varincia e o coeficiente de variao e inter-


prete os resultados

3. Os dados a seguir representam as notas de 5 disciplinas de um determinado candidato


em um concurso pblico. So elas:

2, 5, 8, 8, 9

Calcule a amplitude, o desvio-padro, a varincia e o coeficiente de variao. Interprete


os resultados.

captulo 3 81
4. Numa pesquisa realizada com 91 famlias, levantaram-se as seguintes informaes com
relao ao nmero de filhos por famlia:

NMERO DE FILHOS 0 1 2 3 4 5

FREQUNCIA DE 19 22 28 16 2 4
FAMLIAS

Calcule e interprete os resultados:


a) da amplitude;
b) do desvio-padro;
c) do coeficiente de variao.

5. O histograma abaixo representa a distribuio das idades dos funcionrios de uma agn-
cia bancria. Com base no histograma abaixo, responda:

Histograma

16
15
14
13
12
11
10
Frequncia

9
8
7
6
5
4
3
2
1
0
20 | 25 25 | 30 30 | 35 35 | 40 40 | 45 45| 50

Idade

Quais so a amplitude, o desvio-padro, a varincia e o coeficiente de variao para as


idades dos funcionrios? Interprete os resultados.

82 captulo 3
6. Um fabricante de caixas de cartolina fabrica trs tipos de caixa. Testa-se a resistncia
de cada caixa, tomando-se uma amostra de 100 caixas e determinando-se a presso
necessria para romper cada caixa. Seguem os resultados dos testes:

TIPOS DE CAIXAS A B C
Presso mdia de ruptura (bria) 15 20 30

Desvio-padro das presses (bria) 4 5 6

a) Que tipo de caixa apresenta a menor variao absoluta na presso de ruptura?


b) Que tipo de caixa apresenta a maior variao relativa na presso de ruptura?

REFLEXO
Vimos, neste captulo, que to importante quanto conhecer a mdia de um conjunto de dados
determinar o seu grau de variabilidade (ou disperso).
Por exemplo, num bairro nobre da capital paulista est uma das maiores favelas de So Pau-
lo. Se analisarmos somente o valor da renda mdia do bairro certamente vamos concluir que
o valor obtido comparvel s melhores economias do mundo. Porm, devemos levar em
conta que a discrepncia entre os diversos valores da renda deve ser muito grande. Ento,
para quantificar a variabilidade dos valores da varivel em estudo fundamental calcular as
medidas de disperso, particularmente o desvio-padro.

LEITURA
Aqui, sugerimos a leitura do artigo E se todos fossem ao mesmo cinema ao mesmo tempo?
do professor Luiz Barco, disponvel em http://super.abril.com.br/ciencia/lei-regularidade-es-
tatistica-se-todos-fossem-ao-mesmo-cinema-ao-mesmo-tempo-439499.shtml. Ele retrata,
de forma bem interessante, a questo da regularidade dos fenmenos relacionados ao com-
portamento social.

captulo 3 83
REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.

BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatstica bsica. So Paulo: Saraiva, 2003.

COSTA NETO, Pedro Luiz de Oliveira. Estatstica. So Paulo: Edgard Blucher, 2002.

DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.

FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro: LTC, 2003.

NO PRXIMO CAPTULO
Nos captulos j vistos, estudamos formas de organizar e resumir dados por meio de distribui-
es de frequncias e de medidas descritivas. So processos que, geralmente, nos passam
informaes sobre algo que j ocorreu. Tais informaes tambm so de fundamental impor-
tncia para que possamos prever o que ir acontecer no futuro. Para isso, no prximo captulo,
estudaremos a teoria de probabilidades, que, entre outras coisas, auxilia-nos na determinao
de ocorrncia de eventos futuros, tais como: vai chover amanh, qual ser minha receita no
prximo ms, qual o nvel de demanda de meu produto no prximo ano, entre muitos outros.

84 captulo 3
4
Noes de
Probabilidade
4 Noes de Probabilidade
Nos captulos anteriores vimos como organizar e descrever conjuntos de dados
atravs de grficos, tabelas e medidas resumo, tais como: medidas de posio
e disperso. Observamos que os resultados obtidos nos auxiliam na anlise e
interpretao dos dados.
Neste captulo estudaremos conceitos bsicos de probabilidade.

OBJETIVOS
Com o estudo dos conceitos abordados neste captulo, voc ser capaz de identificar ex-
perimentos aleatrios e calcular as probabilidades de ocorrncia de determinados eventos,
atravs da definio de probabilidade e de suas propriedades.

REFLEXO
Voc se lembra do significado da palavra probabilidade? Sabe qual o seu real sentido? E
qual a sua importncia em nosso dia a dia? Certamente voc j deve ter feito perguntas cujas
respostas dependiam do clculo de probabilidades. Por exemplo:
Qual a probabilidade de chover no prximo final de semana prolongado?
Qual a probabilidade de se ganhar na Mega - Sena jogando um volante com seis nmeros?
Qual a probabilidade das vendas de determinado produto decrescer se aumentarmos o
preo do produto?
O clculo destas e outras probabilidades nos auxiliam na tomada de decises.

Introduo
O clculo efetivo de uma probabilidade depende frequentemente do uso dos
resultados da anlise combinatria. A anlise combinatria a parte da Mate-
mtica que desenvolve tcnicas e mtodos de contagem.
Apresentaremos, nos itens a seguir, um resumo dos principais resultados
dessa rea da Matemtica elementar.

86 captulo 4
4.1 Princpio Fundamental da Contagem (PFC)

Para entendermos este conceito, vamos analisar o exemplo a seguir.

Exemplo 4.1
Um quiosque de praia no Rio de Janeiro lanou a seguinte promoo duran-
te uma temporada de vero:

Combinado de sanduche natural e suco a R$ 10,00

O cliente pode escolher trs opes de sanduche (frango, atum e queijo


branco) e duas opes de suco (laranja e uva).
Considerando estas opes, de quantas formas distintas o cliente pode es-
colher seu combinado?
O cliente poder optar por trs sabores do lanche: frango (F), atum (A) e
queijo branco (Q).
Para cada uma das possibilidades anteriores, a escolha do suco pode ser
feita de duas maneiras: laranja (L) e uva (U).

A representao dessas possibilidades pode ser feita por meio de um diagra-


ma conhecido como diagrama de rvore.
Temos:

1 Etapa (escolha do 2 Etapa (escolha do Resultado combinado


sanduche) suco)
laranja (F,L)
Frango
uva (F,U)

laranja (A,L)
Atum
uva (A,U)

laranja (Q,L)
Queijo branco
uva (Q,U)

captulo 4 87
Podemos observar que o nmero de combinados possveis 32=6.
Este exemplo nos ajuda a entender a definio a seguir.
Suponha que uma sequncia ordenada seja formada por k elementos (a1,a2,
,ak ), em que:
a1 pode ser escolhido de n1 maneiras distintas;
a2 pode ser escolhido de n2 maneiras distintas, a partir de cada uma das
possibilidades anteriores;

ak pode ser escolhido de nk maneiras distintas, a partir das escolhas ante-
riores;

Ento, o nmero de possibilidades para se construir a sequncia (a1, a2,,ak ) :

n1 n2 ... nk

Esse resultado conhecido como Princpio Fundamental da Contagem


(PFC) e serve de base para a resoluo de problemas de contagem.

Exemplo 4.2
Quantos nmeros de trs algarismos podemos formar com os algarismos
0,1,2,3,4,5 e 6?

Resoluo:
O primeiro algarismo pode ser escolhido de seis maneiras distintas, pois o
nmero que ser formado no pode comear por zero. Observe que 021 = 21;
O segundo algarismo pode ser escolhido de sete maneiras distintas, pois
pode haver repetio de algarismo;
O terceiro algarismo tambm pode ser escolhido de sete maneiras dis-
tintas.

Ento, pelo PFC, a quantidade de nmeros que podemos formar :

6 7 7 = 294

88 captulo 4
Agora, passaremos ao conceito de fatorial de um nmero. Tal conceito
uma ferramenta de clculo importante em Anlise Combinatria.

4.2 Fatorial de um nmero natural

Definimos fatorial de um nmero natural n, n 2, e indicamos por n! (lemos


fatorial de n ou n fatorial), o produto obtido pela multiplicao de n por
todos os seus antecessores naturais positivos, ou seja:

n! = n (n 1) (n 2) ... 321,para n 2

Observao: Consideremos 0! = 1
Assim, temos, por exemplo:
3! = 3 2 1 = 6
6! = 6 5 4 3 2 1 = 720

7 ! = 7 6 5 4 3 2 1 = 7 6!

6!

Exemplo 4.3

12 !
Vamos encontrar o valor de .
8!
Resoluo
Para encontrar o valor de 12!/8!, podemos desenvolver o fatorial do nmero
maior (12) at chegarmos ao fatorial do nmero menor (8).
Ento:

12! 12 11 10 9 8!
= = 11880
8! 8!

Podemos dividir o 8! do numerador com o 8! do denominador, obtendo


como resultado 1. Ento, o resultado final ser a multiplicao de 12 11 10 9.
Agora, vamos estudar mtodos de contagem de determinados agrupamen-
tos, baseados no PFC, que simplificaro a resoluo de muitos problemas.

captulo 4 89
4.3 Arranjo

Dado um conjunto com n elementos distintos, chamamos arranjo dos n ele-


mentos, tomados k a k, a qualquer sequncia ordenada de k elementos distin-
tos escolhidos entre os n existentes.
Expressamos a definio acima da seguinte maneira:

n!
A n ,k = ,nk
(n - k )!

Exemplo 4.4
Dado o conjunto A={1,2,3,4,5,6}, quantos arranjos desses seis elementos
tomados dois a dois podemos formar?

Resoluo
Vamos escrever todas as sequncias ordenadas de dois elementos distintos
escolhidos entre os seis elementos do conjunto A:

(1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5)

Da sequncia descrita acima, observamos que cada arranjo difere dos demais:
pela natureza dos elementos escolhidos:
(1,3) (3,5)
pela ordem dos elementos escolhidos:
(1,3) (3,1)

J sabemos que a quantidade de arranjos que pode ser formada 30. Utili-
zando a frmula, obtemos:

6! 6! 6 5 4!
A 6, 2 = = = = 30
( 6 2 )! 4! 4!

Na resoluo do exemplo, listamos todos os possveis arranjos somente


para facilitar a compreenso do conceito.

90 captulo 4
A quantidade de arranjos que pode ser formada tambm pode ser obtida atravs do PFC:

6 5 = 30

n de opes para a n de opes para a


escolha do 1 elemento do par escolha do 2 elemento do par

4.4 Permutao

H situaes em que devemos escolher n elementos distintos, entre os n dis-


ponveis, para formar uma sequncia ordenada (arranjo). Nestas situaes, o
nome dado a estes arranjos permutao.
Assim, o nmero de permutaes de n elementos distintos dado por:

Pn = n!

Podemos observar que a permutao um caso particular do arranjo, pois:

Exemplo 4.5
Quantos so os anagramas (diferentes disposies das letras de uma pala-
vra) da palavra PAZ?

Resoluo
Vamos listar todos os anagramas:

PAZ PZA APZ AZP ZPA ZAP

O nmero de anagramas que pode ser formado :

P3 = 3! = 3 2 1 = 6

captulo 4 91
4.4.1 Permutao com elementos repetidos

Em uma permutao com elementos repetidos, a troca de posio desses ele-


mentos repetidos no altera o resultado do anagrama.
Ento, se temos n elementos, dos quais n1 so iguais a a1 (a1 representa, por
exemplo, uma letra), n2 so iguais a a2 (a2 representa outra letra), ..., nr so iguais
a ar, o nmero de permutaes possveis dado por:

n!
P nn1,n 2 ,...,n r =
n1 !n 2 !...n r !

Para ficar mais claro este conceito, vamos analisar o exemplo a seguir.

Exemplo 4.6
Vamos determinar o nmero de anagramas formados com a palavra ARIT-
MTICA.

Resoluo
A palavra ARITMTICA possui 10 letras, sendo 2 letras iguais a A, 2 iguais a
I e 2 letras T. Ento, temos um caso de permutao com elementos repetidos.
O nmero de anagramas que podemos formar :

10 9 8 7 6 5 4 3 2! 1814400
P102,2,2 = = = 453600
2!2!2! 4

4.5 Combinao

Na definio de arranjo vimos que, quando tomamos k elementos distintos de


n existentes, formamos uma sequncia ordenada.
H casos em que s interessam os elementos que compem a
sequncia, no importando a ordem em que ali figuram. Nestes casos, temos,
ento, o que se chama de combinao de n elementos tomado k a k:

n!
Cn ,k =
k !( n k )!

92 captulo 4
Exemplo 4.7
Maria quer escolher dois sabores de torta doce para servir em sua festa de
final de ano. A doceria oferece os seguintes sabores: limo (L), chocolate (C),
morango (M) e floresta negra (F). De quantas formas distintas Maria poder
fazer essa escolha?

Resoluo
Neste exemplo conseguimos perceber que no importa a ordem em que os
sabores so escolhidos. Escolher, por exemplo, torta de chocolate e morango
{C,M} o mesmo que escolher torta de morango e chocolate {M,C}. Cada pos-
svel escolha de Maria representa, portanto, uma combinao de quatro sabo-
res tomados dois a dois.
O nmero de formas distintas de Maria escolher os sabores :

4! 4 3 2!
C 4, 2 = = =6
2 !( 4 2 )! 2!2

Vamos listar as possveis formas para melhor entendimento do conceito de


combinao:
{L,C} {L,M} {L,F} {C,M} {C,F} {M,F}

Agora que j relembramos conceitos da anlise combinatria que so uteis


no clculo de probabilidades, vamos estudar como se calcula probabilidades
em diversas situaes. Antes disto, vamos conhecer brevemente um pouco da
histria da probabilidade.

4.6 Breve histrico

Quando estudamos a histria da probabilidade, o nome de Gerolamo Cardano


sempre citado. Ele foi o primeiro homem na histria a sistematizar dados e a
entender a lgica de alguns processos que at ento eram tidos como aleatrios
para grande parte da humanidade.
A probabilidade que conhecemos e estudamos nos dias atuais surgiu em
meados do sculo XVII, a partir dos estudos de De Mre, Blaise Pascal e Pierre
de Fermat. Segundo BRUNI (2010), os estudos feitos por Pascal e Fermat sobre
vrias situaes de jogos deram origem ao desenvolvimento da Teoria de Pro-
babilidades as Leis do Acaso.

captulo 4 93
Com o desenvolvimento das teorias de probabilidades, houve uma evoluo da
cincia atuarial e das aplicaes no mercado de seguros. Bernoulli, em 1730, pes-
quisou, com base em estudos com recm-nascidos, um novo modo de se calcular
o nmero esperado de sobreviventes aps n anos.
A etapa moderna da Teoria das Probabilidades teve incio em 1933, com Andrei
Kolmogorov. Ele lanou as bases axiomticas da probabilidade, baseada na Teoria
dos Conjuntos, reduzindo a Teoria das Probabilidades Teoria da Integrao.

CONEXO
Para voc conhecer um pouco mais sobre a histria da probabilidade sugerimos ouvir o
udio Histria da Probabilidade, disponvel em http://m3.ime.unicamp.br/recursos/1253.

4.7 Experimento Aleatrio, Espao Amostral, Evento

Antes de passarmos definio de probabilidade vamos apresentar alguns con-


ceitos bsicos necessrios para efetuar seu clculo.
Experimento Aleatrio: uma situao ou acontecimento cujo resultado
no pode ser previsto com certeza. Cada experimento poder ser repeti-
do inmeras vezes sob condies essencialmente inalteradas. Embora
no possamos afirmar qual ser o resultado de um particular experimen-
to, podemos descrever o conjunto dos possveis resultados.
Espao Amostral: o conjunto formado por todos os resultados do expe-
rimento aleatrio. Indicamos este conjunto pela letra grega mega .
Cada elemento do espao amostral denominado ponto amostral.
Evento: um subconjunto do espao amostral (indicado por letras mai-
sculas do nosso alfabeto). O evento que possui somente um elemento
denominado evento simples.

Exemplo 4.8
Considere o experimento aleatrio que consiste no lanamento de um
dado. Neste experimento, o espao amostral definido como {1,2,3,4,5,6}.

94 captulo 4
Alguns dos eventos que podem ser definidos neste experimento so:

A: sada de face par


A = {2,4,6}
B: sada de face mpar
B = {1,3,5}
C: sada de face maior que 6
C = . Neste caso indica o conjunto vazio. Este evento denominado even-
to impossvel.
D: sada de face menor que 2
D = {1}, que denominado evento simples.
E: sada de face menor ou igual a 6
E = {1,2,3,4,5,6}, que o prprio espao amostral . Este evento denomi-
nado evento certo.

Podemos observar, pelos eventos definidos anteriormente, que um even-


to pode no conter elementos (conjunto vazio), conter somente um elemento
(evento simples), conter mais de um elemento e, finalmente, pode ser constitu-
do por todos os elementos do espao amostral, ou seja, o evento o prprio .

4.8 Operaes com Eventos

4.8.1 Unio

Dados dois eventos A e B, temos que a unio destes dois eventos o evento
que contm os pontos amostrais pertencentes a A, ou a B ou a ambos. Denota-
mos a unio por A B. O diagrama de Venn, na figura 4.1, descreve a unio dos
eventos A e B.

A B

Figura 4.1 Unio de dois eventos

captulo 4 95
4.8.2 Interseco

A interseco de dois eventos A e B, denotado por A B, o evento que contm


os pontos amostrais que pertencem simultaneamente aos eventos A e B.

A B

Figura 4.2 Interseco de dois eventos

Se A B = temos que A e B so eventos mutuamente exclusivos, ou seja,


quando um ocorre o outro no pode ocorrer.

A B

Figura 4.3 Eventos mutuamente exclusivos

Observao
Quando estamos interessados na interseco de dois eventos utilizamos
a conjuno e, ou seja, queremos encontrar os elementos que pertencem ao
evento A e ao evento B. No caso da unio de dois eventos utilizamos a conjun-
o ou, ou seja, so elementos que pertencem ao evento A, ou ao B ou a ambos.

96 captulo 4
4.8.3 Complementao

O complemento do evento A, denotado por Ac , definido como o evento que con-


tm todos os pontos amostrais que no pertencem ao evento A, ou seja, Ac = W A


AC

Figura 4.4 Complementar do evento A

Exemplo 4.9
Considerando o experimento aleatrio do exemplo 4.8 temos que W
={1,2,3,4,5,6}.
Definindo os eventos A e B como:
A: sada de face par
A = {2,4,6}
B: sada de face menor ou igual a 4
B = {1,2,3,4}

Determinar A B, A B, Ac ,Bc , Ac Bc, Ac Bc , Ac B , Bc A

Resoluo
A B = {1,2,3,4,6}
A B = {2,4}
Ac = {1,3,5}
Bc = {5,6}
Ac Bc = {1,3,5,6}
Ac Bc = {5}
Ac B = {1,3}
Bc A = {6}

captulo 4 97
4.9 Probabilidade

A probabilidade um nmero que mede a possibilidade de ocorrncia de um


evento. O clculo da probabilidade pode ser efetuado de trs maneiras: atravs
da definio clssica de probabilidade, atravs da definio frequencial de pro-
babilidade e atravs do mtodo subjetivo.
Vamos concentrar nossos estudos na definio clssica e frequencial. No
mtodo subjetivo, a probabilidade estimada com base no conhecimento de
circunstncias relevantes. Por exemplo, dado o estado de sade do paciente e
a extenso dos ferimentos, um mdico pode sentir que esse paciente tem uma
chance de 95% de se recuperar completamente.

4.9.1 Definio Clssica

Aplicamos esta definio quando os pontos amostrais do espao amostral so


equiprovveis, ou seja, tm a mesma probabilidade de ocorrer. Por exemplo,
quando jogamos um dado equilibrado todas as faces tm a mesma probabili-
dade de ocorrer, ou seja, 1/6.
Dado um evento A, a probabilidade de A, representada por P(A), obtida
atravs da definio clssica por:

nmero de resultados favorveis ao evento A


P (A )= (4.1)
nmero total de resultados possveis

Exemplo 4.10
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabili-
dade de sair um rei?

Resoluo
O espao amostral deste experimento :

W = {A O ,..., K O , A E ,..., K E , A P ,..., K P , A C ,..., K C }

ou seja, temos 52 pontos amostrais igualmente provveis de ocorrer. O


evento A: sair um rei o subconjunto A = {ko, KE, Kp, Kc}.

98 captulo 4
Utilizando a definio clssica de probabilidade temos:

4
P (A )=
52

Podemos expressar os resultados das probabilidades em forma de fraes, decimais


4
ou percentuais. Nesse caso, podemos indicar o resultado por P ( A ) = , 0, 0769, ou,
52
ainda, 7,69%.

4.9.2 Definio Frequencial

Vimos que a definio clssica de probabilidade s pode ser aplicada quando


os pontos amostrais so igualmente provveis de ocorrer. Em situaes em que
isto no ocorre podemos determinar a probabilidade atravs da definio fre-
quencial. Esta definio baseia-se em observaes repetidas do experimento
aleatrio. Seja A o evento de interesse. A probabilidade P(A) obtida atravs da
definio frequencial dada por:

nmero vezes que o evento A ocorreu


P(A) = (4.2)
nmero de repeties do exp erimento aleatrio

em que o nmero de repeties deve ser grande.

A ideia utilizada nesta definio a mesma da frequncia relativa definida


no primeiro captulo.

Exemplo 4.11
Uma loja de varejo tem registrado em seus arquivos que dos
2.000 televisores, de determinada marca, vendidas em certo perodo,
400 precisaram de reparos dentro da garantia de um ano. Qual a probabilida-
de de que um consumidor que compre uma televiso dessa marca no precise
utilizar a garantia?

captulo 4 99
Resoluo
Pelas informaes, temos que 1.600 televisores no precisaram de reparos
durante a garantia. Sendo o evento A: a televiso no precisa de reparo durante
a garantia e utilizando a teoria frequencial, temos:

1.600 4
P(A) = = = 0, 8
2.000 5

Ou seja, o consumidor tem uma probabilidade 0,8 de no precisar usar


a garantia.

Utilizamos aqui o conhecimento histrico para fazer uma previso, ou seja, utilizamos a
frequncia relativa do evento, obtida de dados coletados, para estimar a probabilidade.

4.10 Regras Bsicas de Probabilidade

Sejam A e B dois eventos do espao amostral W. Ento:

c) 0 P(A) 1
d) P(W) = 1
e) P (A B) = P(A) + P(B) P(A B)
f) Se A e B forem mutuamente exclusivos, ento P (A B) = P(A) + P(B)
g) P(Ac) = 1 P(A)

Exemplo 4.12
Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabili-
dade de sair um nove ou uma carta de paus?

Resoluo
Neste experimento aleatrio, temos que o espao amostral formado por
52 pontos amostrais, ou seja, W = {Ao,...,Ko, AE,... KE, AP,...KP,AC,...,Kc}. Vale re-
lembrar que todos os pontos amostrais so equiprovveis, com isso podemos
utilizar a definio clssica de probabilidade. Devemos observar tambm que o

100 captulo 4
enunciado nos pede para encontrar a probabilidade do evento sair nove ou do
evento sair carta de paus, o que caracteriza a unio de dois eventos.
Portanto devemos utilizar P(A B) = P(A) + P(B) P(A B).

Os eventos definidos pelo exerccio so:

A: sada de uma carta nove

A: {9O , 9E , 9C , 9P }, por tan to , P (A )=


4
52
B: sada de uma carta de paus

B:{A P , 2P ,..., K P }, por tan to, P (B)=


13
52
A B = {9P }, por tan to, P (A B)=
1
52

Assim,

P (A B)= P (A )+ P (B)- P (A B)
4 13 1
P (A B)= + -
52 52 52
16
P (A B)=
52

Exemplo 4.13
Uma urna contm 30 bolas vermelhas, 12 bolas azuis e 7 bolas pretas. Ex-
traindo-se aleatoriamente uma bola, qual a probabilidade de ser:
a) vermelha

30
P (V )=
49

b) azul

12
P (A )=
49

captulo 4 101
c) azul ou preta

12 7 19
P (A P )= P (A )+ P (P )= + =
49 49 49

( ) ( ) () ( )
Aqui no utilizamos P A P = P A + P P - P A P , pois no h
a interseco A P (uma bola no pode ser azul e preta), ou seja, A e B so
eventos mutuamente exclusivos.

d) nem azul nem vermelha

7
P (P )=
49

Exemplos 4.14
Em um congresso cientfico existem 25 administradores e 17 matemticos.
Qual a probabilidade de ser formar uma comisso com 8 membros, na qual
figurem 5 administradores e 3 matemticos?

Resoluo
Vamos definir o evento A como: a comisso formada por 5 administrado-
res e 3 matemticos.
O nmero total de comisses que conseguimos formar com 8 membros :

42
= 118.030.185
8

Agora, o nmero de comisses que conseguimos formar com 5 administra-


dores e 3 matemticos :

25 17
= 36.128.400
5 3

102 captulo 4
Portanto:

36.128.400
P (A) = = 0, 3061 x 100 = 30, 61%
118.030.185

O clculo das combinaes foi feito utilizando uma calculadora cientfica.

Exemplo 4.15
Em uma prova caram dois problemas. Sabe-se que 132 alunos acertaram o
primeiro, 86 erraram o segundo, 120 acertaram os dois e 54 acertaram apenas
um problema. Qual a probabilidade de que um aluno, escolhido ao acaso:
a) no tenha acertado nenhum problema?
b) tenha acertado apenas o segundo problema?

Resoluo
Este exemplo um exerccio tpico de clculo de probabilidades envolvendo
teoria dos conjuntos.
Do enunciado, temos:
120 acertaram os dois problemas;
Se 120 acertaram os dois, 132 120 = 12 acertaram somente o primeiro;
Se 54 acertaram apenas um e 12 acertaram somente o primeiro, 54 12 =
42 acertaram somente o segundo;
A informao de que 86 erraram o segundo significa que esta quantidade
acertou somente o primeiro ou no acertou nenhum deles. Se temos 12
que s acertaram o primeiro, 86 12 = 74 erraram os dois;
Com esta anlise conseguimos encontrar o nmero total de alunos que
fizeram a prova: 120 + 12 + 42 + 74 = 248.

Podemos colocar estas informaes no diagrama de Venn:

P1 P2

12 120 42

74

captulo 4 103
Ento:
a) Definindo o evento A: o aluno no acertou nenhum problema, temos:

74
P (A) = = 29, 84%
248

b) Definindo o evento B: o aluno acertou apenas o segundo problema, temos:

42
P (A) = = 16, 94%
248

4.11 Probabilidade Condicional

Em muitas situaes, podemos ter interesse em encontrar a probabilidade de


ocorrncia de um evento levando em conta que outro evento j ocorreu. Esta pro-
babilidade recebe o nome de Probabilidade Condicional e definida a seguir.

4.11.1 Definio de Probabilidade Condicional

Dados dois eventos A e B, a probabilidade condicional de A, dado que B ocor-


reu, representada por P(A|B) e calculada por:

P (A B)
P (A / B)= , com P (B)> 0 (4.3)
P (B)

Lemos a notao P(A|B) como a probabilidade de A ocorrer sabendo que


B ocorreu.
Da definio apresentada obtemos a regra da multiplicao, de grande apli-
cao no clculo de probabilidades, dada por:

P (A B)= P (B).P (A | B) (4.4)

104 captulo 4
Exemplo 4.16
H 100 candidatos para uma vaga numa empresa multinacional. Alguns
tm curso superior, outros no. Alguns tm experincia no ramo, outros no.
Os dados so:

POSSUI NO POSSUI
CURSO CURSO TOTAL
SUPERIOR SUPERIOR
Com experincia
35 45 80
anterior

Sem experincia
15 5 20
anterior

Total 50 50 100

Considerando que o candidato escolhido para a vaga possui curso superior,


qual a probabilidade de ele ter experincia anterior no ramo?

Resoluo
Este exemplo se refere a um caso de probabilidade condicional, pois j sa-
bemos que o candidato escolhido possui curso superior. Definindo os eventos
e analisando o quadro temos:

A: ter experincia no ramo (definimos desta maneira, pois a pergunta do


exerccio).
B: possui curso superior (definimos desta maneira, pois o evento que sa-
bemos que ocorreu).

captulo 4 105
50
P(B) =
100
e
35
P (A B)=
100

Por tan to:

35 / 100 35
P (A | B)= = = 0,, 7
50 / 100 50

Note que o valor que aparece no denominador o total de casos do evento que sa-
bemos que ocorreu. Neste exemplo sabamos que o candidato escolhido tinha curso
superior e o total de candidatos com este perfil 50, justamente o valor que aparece no
denominador do clculo da probabilidade condicional.

Conforme TRIOLA (2008, pp. 138),

[...] acreditar incorretamente que P(B|A) e P(A|B) sejam iguais ou usar um valor no lugar
do outro , s vezes, chamado confuso do inverso. Estudos mostram que mdicos for-
necem informaes bastante enganosas quando eles confundem os inversos. Com base
em estudos reais, eles tenderam a confundir P(cncer|teste positivo) com P(teste positi-
vo|cncer). Cerca de 95% dos mdicos estimaram P(cncer|teste positivo) como cerca
de 10 vezes mais alta, com a consequncia de que os pacientes receberam diagnsticos
enganosos e ficaram desnecessariamente angustiados pela informao incorreta.

106 captulo 4
4.12 Independncia de eventos

Sejam A e B dois eventos do espao amostral W, com P(B) > 0. O evento A dito
independente do evento B se

P (A | B)= P (A ) (4.5)

ou seja, o evento A independente do evento B se a probabilidade de A no


afetada pela ocorrncia ou no de B.
Se A e B so independentes temos que:

P (A B)= P (A ).P (B) (4.6)

Exemplo 4.17
Numa caixa com 20 lmpadas, 4 so defeituosas. Extraindo-se aleatoria-
mente duas lmpadas, sem reposio, qual a probabilidade de:
a) nenhuma ser defeituosa;
b) ambas serem defeituosas.
c) considerando a extrao das duas lmpadas, com reposio, encontre a
probabilidade de nenhuma delas ser defeituosa.

Resoluo
Neste exemplo os eventos so dependentes, pois no h reposio das lm-
padas na caixa, ou seja, o resultado obtido na extrao da segunda lmpada
afetado pelo resultado obtido na primeira extrao.

a) Nenhuma lmpada ser defeituosa significa que as duas so perfeitas.


Vamos indicar por P1 primeira lmpada ser perfeita e por P2 segunda
lmpada ser perfeita. Como queremos encontrar a probabilidade da pri-
meira ser perfeita e da segunda ser perfeita tambm devemos utilizar o
conceito da regra da multiplicao,

P (P1 P2 )= P (P1 ).P (P2 | P1 )

P (P1 P2 )=
16 15 240
. = = 0, 6316
20 19 380

captulo 4 107
b) Indicando por D1 primeira lmpada ser defeituosa e por D2 segunda lm-
pada ser defeituosa temos:

P (D1 D 2 )= P (D1 ).P (D 2 | D1 )

P (D1 D 2 )=
4 3 12
. = = 0, 0316
20 19 380

c) Vamos indicar por primeira lmpada ser perfeita e por segunda lm-
pada ser perfeita. Neste caso, as duas extraes so independentes, pois
o resultado da segunda extrao no afetado pelo primeiro resultado.
Ento:

P ( P1 P2 ) = P ( P1 ) ( P2 )
16 16
P ( P1 P2 ) = = 64%
20 20

Exemplo 4.18:
Para testar se um sistema especialista responde satisfatoriamente a um usu-
rio, foram feitas cinco perguntas, cada uma com quatro alternativas de resposta.
Se o sistema escolhe as alternativas aleatoriamente, qual a probabilidade de ele
responder corretamente a todas as cinco perguntas?

Resoluo
Definindo os eventos:
P1: acertar a pergunta 1
P2 :acertar a pergunta 2
P3: acertar a pergunta 3
P4: acertar a pergunta 4
P5: acertar a pergunta 5

Como o sistema escolhe as alternativas aleatoriamente, a probabilidade de

ele acertar a pergunta


1 (pois de 4 alternativas, somente 1 correta).
4

108 captulo 4
O fato do sistema ter escolhido uma alternativa (correta ou errada) em de-
terminada pergunta no afeta as probabilidades de escolhas das outras pergun-
tas. Portanto, os eventos so independentes. Ento:

1 1 1 1 1
P ( P1 P2 P3 P4 P5 ) = P ( P1 ) P ( P2 ) P ( P3 ) P ( P4 ) P ( P5 ) =
4 4 4 4 4
1
= = 0, 0977%
1024

Estudaremos, no prximo item, uma das relaes mais importantes envol-


vendo probabilidades condicionais. A ideia central atualizarmos valores pr-
vios de probabilidades calculando as probabilidades adicionais, denominadas
probabilidades posteriores.

4.13 Teorema de Bayes

Antes de apresentarmos a frmula do teorema de Bayes, vamos analisar o exem-


plo a seguir.

Exemplo 4.19
Um certo programa pode ser usado com uma entre duas sub-rotinas A e
B, dependendo do problema. A experincia tem mostrado que a sub-rotina A
usada 40% das vezes e B usada 60% das vezes. Se A usada, existe 75% de
chance de que o programa chegue a um resultado dentro do limite de tempo.
Se B usada, a chance de 50%. Se o programa foi realizado dentro do limite
de tempo, qual a probabilidade de que a sub-rotina A tenha sido a escolhida?

Resoluo
A probabilidade que temos que encontrar uma probabilidade condicio-
nal, pois j sabemos que o programa foi realizado dentro do limite de tempo.
Ento, de acordo com o que estudamos no item 4.11.1, podemos definir os
seguintes eventos:
A: sub-rotina A foi a escolhida.
R: o programa foi realizado dentro do limite de tempo.
Pela frmula da probabilidade condicional, queremos encontrar:

captulo 4 109
P (A R )
P (A | R ) =
P (R )

Agora, a interpretao da probabilidade que est no denominador funda-


mental para o entendimento deste teorema.

A probabilidade do evento R ocorrer est associada utilizao de duas sub-


-rotinas.
Sabemos que o programa foi realizado dentro do limite de tempo, mas no
sabemos qual sub-rotina foi utilizada. Com isto, precisamos considerar estas
duas situaes:
R A foi realizado dentro do limite de tempo e utilizada a rotina A;
R B foi realizado dentro do limite de tempo e utilizada a rotina B.

Ento, o clculo de P(R) dado por:

P(R) = P(R A) + P(R B)

ou seja, a probabilidade do evento R ocorrer a soma das duas situaes


possveis.
As probabilidades informadas no enunciado so:
P(A) = 0,40 probabilidade obtida atravs da definio frequencial;
P(B) = 0,60 probabilidade obtida atravs da definio frequencial;
P(R|A)=0,75 probabilidade do programa ser realizado dentro do tempo,-
se (sabendo que) A usada;
P(R|B) = 0,50 probabilidade do programa ser realizado dentro do tempo,-
se (sabendo que) B usada.

Como vamos encontrar P(R A) e P(R B)? Utilizaremos a regra da multi-


plicao, abordada no item 4.11.1.

110 captulo 4
Esta regra nos diz que a probabilidade da interseco dos dois eventos pode
ser obtida da seguinte maneira:

P(R A) = P(R|A) P(A)


e
P(R B) =P (R|B) P(B)

As probabilidades que esto do lado direito da igualdade so fornecidas no


enunciado. Ento:

P(R A) = P(R A) P(A) = 0,75 0,40 = 0,30


e
P(R B) = P(R B) P(B) = 0,50 0,60 = 0,30

Finalmente, conseguiremos calcular a probabilidade procurada:

P (A R ) P (A R ) P (R | A) P (A)
P (A | R ) = = =
P (R ) P ( R A ) + P ( R B) P ( R | A ) P ( A ) + P ( R | B) P ( B)
0, 30 0, 30
P (A | R ) = = = 0, 5 = 50%
0, 30 + 0, 30 0, 60

No Teorema de Bayes, a quantidade do numerador sempre ser um dos termos que


est no denominador. Vale ressaltar tambm que P(A B) = P(B A).

Agora, vamos formalizar o Teorema de Bayes.

Seja C1,C2,,Cn uma partio do espao amostral , isto ,

Ci Cj= , sempre que i j,


C1 C2 Cn = .

captulo 4 111
Considere um evento qualquer A em . Supomos conhecidas as probabili-
dades P(Ci) e P(ACi ),i = 1,2,,n. A probabilidade de ocorrncia do evento Ci,
supondo-se a ocorrncia do evento A, dada por:

P (Ci )P (A | Ci )
P (Ci | A )=
j =1 P (C j )P (A | C j )
n

para todo i = 1,2,,n.

ATIVIDADE
1. Uma biblioteca acaba de receber, por doao, 40 novos livros, inclusive 15 romances his-
tricos. Se 3 desses livros so escolhidos aleatoriamente, sem reposio, qual a proba-
bilidade de:
a) nenhum ser um romance histrico;
b) todos serem romances histricos;
c) pelo menos um ser romance histrico.

2. Como parte de uma campanha de promoo em So Paulo e no Rio de Janeiro, uma in-
dstria de produtos de limpeza oferecer um prmio de R$ 50.000,00 a quem enviar seu
nome em um formulrio, com a opo de incluir um rtulo de um dos produtos da indstria.
A distribuio dos 200.000 formulrios recebidos est a seguir:

COM RTULO SEM RTULO


So Paulo 100.000 40.000

Rio de Janeiro 45.000 15.000

Escolhendo aleatoriamente um dos formulrios e definindo os eventos A: o formulrio


escolhido de So Paulo e B: o formulrio escolhido tem um rtulo do produto, determi-
ne as seguintes probabilidades:
a) P(A)
b) P(B)

112 captulo 4
c) P(A | B)
d) P(Ac | Bc)
e) P(Ac | Bc)
f) P(B | Ac)

3. Uma loja de cosmticos tem os seguintes dados sobre a idade e o estado civil de
150 clientes.

ESTADO CIVIL

SOLTEIRO CASADO

30 70 20
IDADE
MAIS DE 30 30 30

Selecionando aleatoriamente a ficha de um cliente, determinar:


a) probabilidade deste cliente ser solteiro;
b) probabilidade deste cliente ter mais de 30 anos;
c) se na ficha consta que o cliente solteiro, qual a probabilidade de ele ter mais de
30 anos;
d) probabilidade deste cliente ser casado sabendo que ele tem menos de 30 anos.

4. Uma agncia de locao de carros fez um levantamento sobre o perfil dos seus clientes e
obteve os seguintes resultados: 45% haviam alugado um carro no ltimo ano por razes de
negcios, 50% haviam alugado um carro no ltimo ano por razes pessoais e 20% haviam
alugado um carro no ltimo ano tanto por razes de negcios como por razes pessoais.
a) Qual a probabilidade de que um cliente tenha alugado um carro durante o ltimo ano
por razes pessoais ou por razes de negcios?
b) Qual a probabilidade de que um cliente no tenha alugado um carro durante o ltimo
ano nem por razes pessoais nem por razes de negcios?

captulo 4 113
5. Um satlite em rbita tem trs painis solares, e todos eles devem permanecer ativos a fim
de garantir o bom desempenho do aparelho. Os painis funcionam independentemente uns
dos outros. A chance de falha de cada um 0,01. Qual a probabilidade de o satlite funcionar
perfeitamente durante a misso? (Essa probabilidade a chamada confiabilidade do sistema
Farias, Soares e Csar, pg. 65)

6. Uma rede local de computadores composta por um servidor e cinco clientes (A, B, C, D e
E). Registros anteriores indicam que dos pedidos de determinado tipo de processamento,
realizados atravs de uma consulta, cerca de 10% vm do cliente A, 15% do B, 15% do C,
40% do D e 20% do E. Se o pedido no for feito de forma adequada, o processamento
apresentar erro. Usualmente, ocorrem os seguintes percentuais de pedidos inadequados:
1% do cliente A, 2% do cliente B, 0,5% do cliente C, 2% do cliente D e 8% do cliente E.
a) Qual a probabilidade de o sistema apresentar erro?
b) Qual a probabilidade de que o processo tenha sido pedido pelo cliente E, sabendo-
-se que apresentou erro?

REFLEXO
O estudo de probabilidades, que iniciamos neste captulo, tem muitas aplicaes no dia a dia
do gestor. At o momento, nos preocupamos em apresentar a teoria referente ao assunto. No
entanto, as aplicaes que podemos fazer do clculo de probabilidades so muito diversifi-
cadas: determinar a margem de erro e o grau de confiana de uma pesquisa, fazer previses
(com certo grau de confiana) de eventos futuros, auxiliar na tomada de decises, calcular
riscos de certos investimentos, etc.
Procure assimilar bem todos os procedimentos e conceitos apresentados neste captulo para
que possa acompanhar o desenvolvimento dos mtodos que sero apresentados mais adiante..

LEITURA
Recomendamos a leitura do texto possvel quantificar o acaso?, disponvel no endereo
http://www.klick.com.br/materia/20/display/0,5912,POR-20-89-957-,00.html, que apre-
senta uma interessante situao sobre o estudo de probabilidades.

114 captulo 4
REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.

BARBETTA, Pedro A.; REIS, Marcelo M.; BORNIA, Antonio C. Estatstica: para os cursos de
engenharia e informtica. So Paulo: Atlas, 2004.

BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.

FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro,: LTC, 2003.

FARBER, Larson. Estatstica aplicada. So Paulo: Pearson Prentice Hall, 2004.

IEZZI, Gelson; DOLCE, Osvaldo; DEGENSZAJN David; PRIGO, Roberto. Matemtica: volu-
me nico. So Paulo: Atual, 2007.

MORETTIN, Luiz G. Estatstica Bsica Volume I Probabilidade. 7.ed. So Paulo: Makron


Books, 1999.

TOMAZ, Priscilla S.S. Anais do IX Seminrio Nacional de Histria da Matemtica. Disponvel


em: <http://www.each.usp.br/ixsnhm/Anaisixsnhm/Comunicacoes/1_Tomaz_P_S_S_Ge-
rolamo_Cardano.pdf>. Acesso em: 30 set. 2014..

NO PRXIMO CAPTULO
No prximo captulo apresentaremos as variveis aleatrias, que so uma forma de associar
valores aos resultados do experimento aleatrio. Isso ir nos permitir ampliar a capacidade de
aplicao da teoria de probabilidades.

captulo 4 115
5
Variveis aleatrias
5 Variveis aleatrias
O espao amostral, em muitos experimentos, no consiste s em nmeros
como, por exemplo, o espao amostral referente ao lanamento de uma moeda,
que tem como pontos amostrais cara ou coroa. Em Estatstica, muitas vezes, es-
tamos interessados em resultados numricos. Para transformar os resultados
do espao amostral em nmeros utilizamos o conceito de varivel aleatria.

OBJETIVOS
Que voc seja capaz calcular o valor esperado e o desvio padro de uma varivel aleatria
discreta e que consiga identificar as situaes nas quais podemos aplicar o modelo de pro-
babilidade binomial, bem como calcular as probabilidades associadas a tal modelo.

REFLEXO
Voc se lembra dos conceitos de mdia e desvio-padro apresentados nos captulos 2 e 3?
E dos conceitos de probabilidade abordados no captulo 4? Neste captulo, combinaremos
aqueles conceitos ao desenvolvermos as distribuies de probabilidade, que descrevem o
que provavelmente acontecer, ao invs do que realmente aconteceu.

5.1 Varivel Aleatria

Uma varivel aleatria (v.a.) uma varivel que associa um valor numrico a
cada ponto do espao amostral. Ela denominada discreta quando pode assu-
mir apenas um nmero finito ou infinito enumervel de valores e dita cont-
nua quando assume valores num intervalo da reta real.
comum utilizarmos letras latinas para representarmos variveis aleatrias.

5.2 Funo discreta de probabilidade

Funo Discreta de Probabilidade a funo que atribui a cada valor da v.a. sua
probabilidade, ou seja,
P(X = xi) = p(xi), i = 1, 2, ...., n (5.1)

118 captulo 5
Vamos considerar aqui que a v.a. discreta tem um nmero finito de valores
possveis.
A distribuio de probabilidade de uma v.a. discreta X uma tabela que as-
socia a cada valor de X sua probabilidade.

x p(x)
x1 p(x1)

x2 p(x2)

x3 p(x3)

. .

xn p(xn)

Tabela 5.1 Distribuio de probabilidade da v.a. X

Na tabela 5.1, os valores x1, x2, x3,..., xn so aqueles que a v.a. pode assumir e
p(x1) , p(x2), p(x3),..., p(xn) suas respectivas probabilidades.
Uma distribuio de probabilidade deve satisfazer as seguintes condies:

0 p(xi) 1, i = 1,2,...,n

Exemplo 5.1: Vamos considerar o experimento aleatrio que consiste no


lanamento de trs moedas. O espao amostral deste experimento :
W = {(c, c, c), (c, c, r), (c, r, c), (c, r, r), (r, c, c), (r, c, r), (r, r, c), (r, r,r)}
onde c = cara e r = coroa.

Podemos definir a varivel aleatria de interesse como sendo o nmero de


coroas obtidas no lanamento das trs moedas, ou seja, X: nmero de coroas.

captulo 5 119
De acordo com a definio da varivel aleatria podemos associar a cada ponto
amostral um nmero, como mostra o quadro seguinte:

RESULTADOS X
c,c,c 0

c,c,r 1

c,r,c 1

c,r,r 2

r,c,c 1

r,c,r 2

r,r,c 2

r,r,r 3

Vemos que a cada resultado do experimento est associado um valor da v.a.


X, a saber, 0, 1, 2 e 3. Temos que:
X = 0, com probabilidade 1/8 se, e somente se, ocorre o resultado
c,c,c;
X = 1, com probabilidade 1/8 + 1/8 +1/8 = 3/8 se, e somente se, ocorrem
os resultados c,c,r ou c,r,c ou r,c,c, que so mutuamente exclusivos;
X = 2 com probabilidade 1/8 + 1/8 + 1/8 = 3/8 se, e somente se, ocorrem
os resultados c,r,r ou r,c,r ou r,r,c, que so mutuamente exclusivos;
X = 3 com probabilidade 1/8 se, e somente se, ocorre o resultado
r,r,r.

120 captulo 5
Na tabela 5.2 apresentamos a distribuio de probabilidade da v.a. X.

x p(x)
0 1/8

1 3/8

2 3/8

3 1/8

Tabela 5.2 Distribuio de probabilidade da v. a. X = nmero de coroas

A distribuio de probabilidade satisfaz as condies 0 p(xi) 1 e

, para i = 1, 2, 3, 4.

Exemplo 5.2: Uma companhia analisa diariamente o nmero de vendas de


seus novos funcionrios durante um perodo de experincia de 90 dias. Os re-
sultados para um novo funcionrio so apresentados a seguir.

VENDAS POR DIA NMERO DE DIAS


0 15

1 17

2 12

3 18

4 8

captulo 5 121
VENDAS POR DIA NMERO DE DIAS
5 10

6 9

7 1

Tabela 5.3: Distribuio do nmero de vendas do novo funcionrio

c) Obtenha a probabilidade de cada resultado


d) Organize os dados em uma distribuio de probabilidade.

Resoluo
a) Para encontrarmos a probabilidade de cada resultado, vamos usar a de-
finio frequencial de probabilidade, ou seja, as probabilidades nada
mais so que as frequncias relativas de cada resultado:

VENDAS POR DIA NMERO DE DIAS PROBABILIDADE


0 15 0,1667

1 17 0,1889

2 12 0,1333

3 18 0,2000

4 8 0,0889

5 10 0,1111

6 9 0,1000

7 1 0,0111

122 captulo 5
A primeira probabilidade foi encontrada fazendo , a segunda probabili-
dade e assim por diante.

b) Uma distribuio de frequncia uma tabela que contm os resultados


da varivel aleatria com suas respectivas probabilidades, ou seja:

VENDAS POR DIA PROBABILIDADE


0 0,1667

1 0,1889

2 0,1333

3 0,2000

4 0,0889

5 0,1111

6 0,1000

7 0,0111

Total 1

Tabela 5.4: Distribuio de probabilidade do nmero de vendas por dia.

captulo 5 123
5.3 Valor esperado e varincia de uma varivel aleatria discreta

Para as distribuies de probabilidade podemos definir as mesmas medidas de


tendncia central e de disperso estudadas nas distribuies de frequncias.

A mdia de uma v.a. X tambm chamada de valor esperado ou esperana


matemtica representada por E(X) e definida como:

(5.2)

Observamos, pela definio de E(X), que para se calcular a mdia de uma


v.a. precisamos multiplicar cada valor da v.a. por sua correspondente probabi-
lidade e somar os produtos resultantes.
Podemos interpretar o valor esperado de uma v.a. como uma mdia ponde-
rada dos xi, onde os pesos so as probabilidades associadas.

Propriedades da mdia
Sejam a e b constantes e X uma varivel aleatria. Ento:
i) E(a) = a
ii) E(bX) = bE(X)
iii) E(X + a) = E(X) + a
iv) E(a + bX) = a + bE(X)
A varincia de uma v.a. X definida como:

(5.3)

J vimos anteriormente que o desvio-padro (s) a raiz quadrada da varin-


cia, portanto:

(5.4)

124 captulo 5
Propriedades da varincia
Sejam a e b constantes e X uma varivel aleatria. Ento:
i) Var(a) = 0
ii) Var(bX) = b2Var(X)
iii) Var(X + a) = Var(X)
iv) Var(a + bX) = b2Var(X)
Observao: Indicaremos a mdia e a varincia de uma v.a. X por:

E(X) = m
Var(X) = s2

Exemplo 5.3: Utilizando os dados do exemplo 5.1, vamos calcular a mdia e


a varincia da v.a. X: nmero de coroas.

x p(x) x p(x) x2 p(x)


0 1/8 0 0

1 3/8 3/8 3/8

2 3/8 6/8 12/8

3 1/8 3/8 9/8

Total 1 12/8 24/8

Resoluo
Substituindo os valores do quadro apresentado nas respectivas frmulas
temos:

captulo 5 125
Portanto, temos que o valor esperado do nmero de coroas, obtido no lana-

mento de 3 moedas, 1,5 e o desvio-padro 0,866 .

Exemplo 5.4
Num teste de digitao, o tempo em minutos (T) que os candidatos levam
para digitar um texto modelado, de forma aproximada, pela seguinte funo
de probabilidade:

T P(T)
3 0,1

4 0,1

5 0,2

6 0,2

7 0,2

8 0,1

9 0,1

126 captulo 5
O candidato recebe 4 pontos se faz em 9 minutos, 5 se faz em 8 minutos e
assim por diante. Determine a mdia e a varincia do nmero de pontos obti-
dos no teste.
Resoluo
Como o exerccio est pedindo a mdia e a varincia do nmero de pontos
obtidos, precisamos definir uma nova varivel aleatria:

P: nmero de pontos obtidos no teste

O nmero de pontos obtidos depende do tempo que o candidato leva para digi-
tar o texto. De acordo com o texto, se o candidato digitar o texto em 3 minutos, ele
recebe 10 pontos. E, a probabilidade dele receber 10 pontos a mesma probabili-
dade dele digitar em 3 minutos, ou seja, 0,1. Portanto:

T P(T)
10 0,1

9 0,1

8 0,2

7 0,2

6 0,2

5 0,1

4 0,1

captulo 5 127
Definida a funo distribuio de probabilidade da varivel P, encontramos
a mdia e a varincia acrescentando duas colunas no quadro acima:

P P(P) PP(P) P2 P(P)


10 0,1 1 10

9 0,1 0,9 8,1

8 0,2 1,6 12,8

7 0,2 1,4 9,8

6 0,2 1,2 7,2

5 0,1 0,5 2,5

4 0,1 0,4 1,6

Total 1 7 52

Agora, basta substituirmos os valores encontrados nas respectivas frmulas:

Ento, o nmero mdio de pontos obtidos no teste 7 e a varincia 3 pontos2.


Para encontrarmos o desvio padro, basta extrairmos a raiz quadrada da varincia.

128 captulo 5
Exemplo 5.5
Na produo de uma pea so empregadas duas mquinas. A primeira utili-
zada para efetivamente produzir as peas, e o custo de produo de R$ 50,00 por
unidade. Das peas produzidas nessa mquina, 90% so perfeitas. As peas de-
feituosas (produzidas na primeira mquina) so colocadas na segunda mquina
para a tentativa de recuperao (torn-las perfeitas). Nessa segunda mquina o
custo por pea de R$ 25,00, mas apenas 60% das peas so de fato recuperadas.
Sabendo que cada pea perfeita vendida por R$ 90,00, e que cada pea defei-
tuosa vendida por R$ 20,00, calcule o lucro por pea esperado pelo fabricante.

Resoluo
Neste exemplo, a varivel aleatria de interesse :

X: lucro

Para entendermos melhor as informaes contidas no enunciado, vamos


montar um quadro:

X
CUSTO VENDA P(X)
(LUCRO)
peas perfeitas na 1
50 90 40 0,9
mquina

peas perfeitas na 2
50+25 90 15 0,06
mquina

50+25 20 -55 0,04 peas defeituosas

As informaes contidas na primeira linha nos indicam que o lucro ser de


R$ 40,00, pois Lucro = Venda Custo. Noventa por cento das peas produzidas
na primeira mquina so perfeitas. Ento, a probabilidade do lucro assumir o
valor R$ 40,00 de 0,9.

captulo 5 129
Na segunda linha esto as informaes das peas que precisaram ir para a se-
gunda mquina e que tornaram-se perfeitas. O custo, nesta situao, ser de R$
75,00, pois o custo por pea na segunda mquina de R$ 25,00, adicionados aos
R$ 50,00 de custo da primeira mquina. Agora, vamos entender o porqu do valor
da probabilidade ser 0,06. Se 90% das peas produzidas pela primeira mquina so
perfeitas, 10% so defeituosas.
Destas 10% de peas defeituosas, apenas 60% so recuperadas pela segunda
mquina. Portanto, 0,10*0,6 = 0,06. Ento, a probabilidade do lucro assumir o
valor R$ 15,00 de 0,06.
E, na terceira linha, temos a informao das peas defeituosas. Neste caso,
a empresa ter prejuzo, pois o custo continuar sendo de R$ 75,00, e a pea
ser vendida por R$ 20,00. A probabilidade do lucro (que ser um prejuzo) as-
sumir o valor de R$ 55,00 0,04, pois das peas defeituosas, 40% no so recu-
peradas pela segunda mquina. Portanto, 0,10*0,4 = 0,04.
Agora, com os valores obtidos no quadro, conseguimos encontrar o lucro
por pea esperado pelo fabricante.

CUSTO VENDA X P(x)


40 0,9 40 0,9 = 36,00

15 0,06 15 0,06 = 0,90

-55 0,04 55 0,04= 2,20

Total 1 34,70

O lucro esperado, por pea, R$ 34,70.

5.4 Modelos probabilsticos para variveis aleatrias Discretas

Algumas variveis aleatrias aparecem com frequncia em muitas situaes pr-


ticas do nosso dia a dia. Um estudo detalhado dessas variveis muito importan-
te para a construo de modelos probabilsticos com o objetivo de estimar seus
parmetros e calcular probabilidades. Uma das distribuies discretas de pro-
babilidade mais importante a distribuio binomial que ser descrita a seguir.

130 captulo 5
5.4.1 Distribuio Binomial

Uma v.a. tem distribuio binomial se o experimento aleatrio consiste em:


n tentativas sob condies idnticas;
cada tentativa independente de todas as outras;
h somente dois resultados possveis em cada tentativa designados por
sucesso(S) e fracasso(F);
a probabilidade de sucesso a mesma em cada tentativa.

Na distribuio binomial a v.a. X corresponde ao nmero de sucessos em n


tentativas do experimento aleatrio.
A funo de probabilidade definida como:

(5.5)

onde:
n o nmero de tentativas do experimento aleatrio;
p = P(S) a probabilidade de sucesso em uma nica tentativa;
q = P(F) a probabilidade de fracasso em uma nica tentativa;
p + q = 1.

denominado nmero binomial e dado pela frmula

Os termos n! e k! so denominados n fatorial e k fatorial e so dados pela multiplica-


o de todos os valores inteiros positivos entre entre 1 e n e entre 1 e k. Por exemplo,
5! = 5 4 3 2 1 = 120.

Quando a v.a. X tiver distribuio binomial, com parmetros n e p, indicare-


mos por X ~ b(n,p).

captulo 5 131
O valor esperado e a varincia de uma v.a. binomial, com parmetros n e p
so, respectivamente, dados por:

(5.6)

Exemplo 5.6: Uma pesquisa mostrou que 60% das famlias residentes na
grande So Paulo tm pelo menos dois carros. Determine a probabilidade de
que dentre 15 famlias selecionadas aleatoriamente nesta regio:
a) exatamente 5 tenham pelo menos dois carros;
b) de 8 a 10 tenham pelo menos dois carros.

Neste exemplo vamos definir a v.a. como tendo distribuio binomial, pois:
o experimento est sendo realizado 15 vezes, ou seja, 15 famlias foram
selecionadas para o estudo;
h somente dois resultados possveis: sucesso, se a famlia tem pelo me-
nos dois carros e fracasso, se a famlia no tem pelo menos dois carros;
as respostas so independentes umas das outras, ou seja, uma famlia
ter pelo menos dois carros no afeta a probabilidade das outras famlias
terem ou no pelo menos dois carros.

O primeiro passo para iniciar a resoluo de problemas deste tipo definir


a v.a.. Neste caso, como estamos interessados no nmero de famlias com pelo
menos dois carros, a v.a. definida como:

X: nmero de famlias com pelo menos dois carros.

A v.a. X pode assumir os valores 0,1,2,...,15, pois, das 15 famlias seleciona-


das, pode acontecer de nenhuma ter pelo menos dois carros, 1 pode ter pelo
menos dois carros, 2 podem ter pelo menos dois carros , assim por diante, at
as 15 famlias com pelo menos dois carros.

132 captulo 5
a) Este item pede a probabilidade de que exatamente 5 tenham pelo
menos dois carros, ou seja,

e o nmero de tentativas n = 15 famlias selecionadas. com P(sucesso) =


0,60, pois o enunciado nos informa que 60% das famlias tm pelo menos dois
carros, P(fracasso) = 0,40
Fazendo os clculos chegamos que

b) A probabilidade pedida neste item pode ser escrita como:

Observao: Estes clculos so facilmente efetuados com o auxlio de uma


calculadora cientfica.

Exemplo 5.7
Se 7% das peas produzidas por uma mquina so defeituosas, qual a pro-
babilidade de que em dez peas escolhidas aleatoriamente:
a) no haja peas defeituosas;
b) pelo menos 3 peas sejam defeituosas;
c) exatamente 5 peas sejam defeituosas;
d) entre 2 e 4 peas sejam defeituosas.

captulo 5 133
Resoluo
Temos aqui um experimento binomial com:
X: nmero de peas defeituosas
X = 0,1,2,3,...,10.
n = 10 peas
P(Sucesso) = p = 0,07
P(Fracasso) = q = 0,93

Note que a probabilidade de sucesso que a pea seja defeituosa, pois a vari-
vel aleatria est definida como o nmero de peas defeituosas.

a)

b) )

Neste caso podemos simplificar os clculos utilizando o complementar do


evento, isto ,

c)

d)

134 captulo 5
CONEXO
O clculo de probabilidades para variveis aleatrias cuja distribuio binomial tambm
pode ser feita no Excel. Para compreender a funo que deve ser utilizada, leia Utilizando
o Microsoft Excel para Obter Probabilidades Binomiais, que se encontra no livro Estatstica:
Teoria e Aplicaes Usando Microsoft Excel em Portugus, pp. 196.

ATIVIDADE
1. Uma urna contm 3 bolas brancas e 7 bolas verdes. Trs bolas so retiradas com repo-
sio. Seja X: nmero de bolas verdes. Calcule E(X) e Var(X).

2. Uma companhia area tem as probabilidades

0,05 0,20 0,35 0,15 0,10 0,15

de receber 0, 1, 2, 3, 4 ou 5 reclamaes sobre desvio de bagagem por dia. Quantas


reclamaes a companhia espera (valor esperado ou mdia) receber por dia?

3. Um comerciante tem a oportunidade de adquirir um embarque de seda pura por R$


30.000,00. A probabilidade de ele vender essa seda por R$ 26.000,00 de 0,40 e a
probabilidade de ele vend-la por R$ 35.000,00 de 0,60. Qual o lucro bruto espe-
rado do comerciante?

4. O tempo T, em minutos, necessrio para um operrio processar certa pea uma v.a.
com a seguinte distribuio de probabilidade:

T 2 3 4 5 6 7

p(T) 0,1 0,1 0,3 0,2 0,2 0,1

captulo 5 135
Fonte: Bussab e Morettin, pag. 140.
a) Calcule o tempo mdio de processamento.

Para cada pea processada, o operrio ganha um fixo de R$ 2,00, mas, se ele pro-
cessa a pea em menos de seis minutos, ganha R$ 0,50 em cada minuto poupado.
Por exemplo, se ele processa a pea em quatro minutos, recebe a quantia adicional
de R$ 1,00.

b) Encontre a distribuio, a mdia e a varincia da v.a. G: quantia em R$ ganha por


pea.

5. Um curso de treinamento aumenta a produtividade dos funcionrios da rea de aten-


dimento ao consumidor em 80% dos casos. Se quinze funcionrios participam desse
curso, qual a probabilidade de:
a) exatamente quatro funcionrios aumentarem a produtividade;
b) de 5 a 7 funcionrios aumentarem a produtividade;
c) pelo menos dois funcionrios no aumentarem a produtividade.

6. Um lote com mquinas digital recebida por uma empresa. 30 aparelhos so inspeciona-
dos. O lote rejeitado se pelo menos 3 mquinas apresentarem defeito. Sabendo-se que
1% das mquinas defeituosa, calcule a probabilidade da empresa rejeitar todo o lote.

7. Um vendedor de seguros vende aplices a 5 homens, todos da mesma idade e de boa


sade. De acordo com as tabelas atuariais, a probabilidade de um homem, dessa idade
particular, estar vivo daqui a 30 anos de 2/3. Determinar a probabilidade de estarem
ainda vivos daqui a 30 anos:
a) todos os 5 homens;
b) pelo menos 3;
c) apenas 2;
d) pelo menos 1 homem.

8. A probabilidade de um estudante, que ingressa em uma universidade, graduar-se, de 0,4.


Determinar a probabilidade de, entre 5 estudantes:
a) nenhum graduar-se;
b) um graduar-se;
c) pelo menos um graduar-se.

136 captulo 5
9. Um aluno marca ao acaso as respostas em um teste mltipla escolha com 10 questes e
cinco alternativas por questo. Qual a probabilidade dele acertar exatamente 4 questes?

10. Uma pesquisa concluiu que 30% das mulheres brasileiras consideram a leitura sua ati-
vidade favorita de lazer. Voc seleciona ao acaso seis mulheres e pergunta a elas se a
leitura sua atividade favorita de lazer. Obtenha a probabilidade de que:
a) exatamente duas delas respondam sim.
b) menos do que duas respondam sim.

REFLEXO
Neste captulo vimos que a varivel aleatria fornece uma descrio numrica de um experi-
mento aleatrio. Com os resultados que uma varivel aleatria pode assumir juntamente com
suas respectivas probabilidade obtemos a distribuio de probabilidade e podemos calcular o
valor esperado (mdia) e o desvio padro para a varivel aleatria. Podemos interpretar o valor
esperado como uma mdia ponderada dos valores que a varivel aleatria pode assumir. Os
pesos so as probabilidades. Estudamos, tambm, uma distribuio discreta de probabilidade
que tem muitas aplicaes: distribuio binomial. Desde que o experimento em estudo satis-
faa os requisitos necessrios para que a varivel aleatria tenha distribuio binomial, encon-
tramos facilmente, com o auxlio de uma calculadora cientfica, as probabilidades de interesse.

LEITURA
Sugerimos que voc assista ao vdeo Revendo a Moratria, da srie: Matemtica na Escola.
Ele apresenta uma aplicao do conceito de valor esperado. O endereo para acesso http://
m3.ime.unicamp.br/recursos/1170. Vale a pena conferir!

REFERNCIAS BIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.

captulo 5 137
BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.

FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro,: LTC, 2003.

FARBER, Larson. Estatstica aplicada. So Paulo: Pearson Prentice Hall, 2004.

LEVINE, David M.; BERENSON, Mark L.; STEPHAN, David. Estatstica: Teoria e Aplicaes
Usando Microsoft Excel em Portugus. Rio de Janeiro: LTC, 2000.

MAGALHES, Marcos Nascimento; LIMA, Antnio Carlos Pedroso de. Noes de probabili-
dade e estatstica. So Paulo: Editora da Universidade de So Paulo, 2004.

SPIEGEL Murray R. Estatstica. 3.ed. So Paulo: Makron Books, 1993.

EXERCCIO RESOLVIDO
Captulo 1

1.
a) qualitativa nominal
b) quantitativa discreta
c) quantitativa contnua
d) quantitativa discreta
e) quantitativa contnua
f) quantitativa contnua
g) quantitativa discreta
h) qualitativa nominal
i) quantitativa contnua
j) quantitativa contnua
k) qualitativa ordinal
l) qualitativa ordinal
m) qualitativa nominal
n) qualitativa nominal

138 captulo 5
2.
K 6 classes e amplitude da classe h 7

Tabela 1 Distribuio de frequncias das idades dos funcionrios.

IDADES f fr fa
19| 26 5 0,1667 5

26| 33 13 0,4333 18

33| 40 4 0,1333 22

40| 47 4 0,1333 26

47| 54 3 0,1000 29

54| 61 1 0,0333 30

Total 30 1

a) 18
b) 13,33%
c) 17
d) 73,33%
e) 26,67%

captulo 5 139
3.

Outros
16,82%
Solteiro
42,87%
Separado
19,79%

Vivo
Casado
5,69
14,84%

Atravs do grfico, podemos dizer que aproximadamente 43% dos clientes desta agn-
cia de turismo so solteiros, 20% so separados, 17% tm outro tipo de estado civil,
15% so casados e apenas 5% so vivos. Esta informao importante na hora de
lanar pacotes de viagens. A agncia deve se lembrar que grande parte de seus clientes
so solteiros. Tambm pode criar estratgias para trazer mais clientes casados ou vivos,
que provavelmente devem ter outro tipo de perfil.

4.
a) Valores gastos com supermercado. Varivel quantitativa contnua.
b) Tabela 1: Distribuio de frequncias para a varivel Valores gastos com supermercado.

CLASSES (GASTOS EM R$) f fr fa


4,89| 61,89 17 0,34 17

61,89| 118,89 13 0,26 30

118,89| 175,89 5 0,10 35

140 captulo 5
CLASSES (GASTOS EM R$) f fr fa
175,89| 232,69 5 0,10 40

232,89| 289,89 3 0,06 43

289,89| 346,89 3 0,06 46

346,89| 403,89 2 0,04 48

403,89| 460,89 2 0,04 50

Total 50 1

c)

Histograma
18
16
14
12
10
8
6
4
2
0
4,98 | 61,89

61,89 | 118,89

118,89 | 175,89

175,89 | 232,89

232,89 | 289,89

289,89 | 346,89

346,89 | 403,89

403,89 | 460,89

Gastos (R$)

captulo 5 141
18 Polgono de Frequncias
17
16
14
13
12
Frequncia 10
8
6
5
4 5
3
2 3 2 2
2 0 0
0 33,39 90,38 147,39 204,39 261,39 318,39 375,39 432,39 489,39
Ponto mdio das classes Gastos (R$)

5.
a) Salrio de funcionrios de uma empresa. Esta varivel classificada como quantitativa
contnua.
b) 45 funcionrios
c) 86 funcionrios
d) 9,30%
e) 72,09%

f)

SALRIO (R$) f fr fa
500,00| 800,00 17 19,77 17

800,00| 1.100,00 45 52,33 62

1.100,00| 1.400,00 12 13,95 74

1.400,00| 1.700,00 4 4,65 78

142 captulo 5
1.700,00| 2.100,00 3 3,49 81

2.100,00| 2.400,00 3 3,49 84

2.400,00| 2.700,00 2 2,33 86

Total 86 100,00

Tabela 1 Distribuio de frequncias dos salrios dos funcionrios de uma empresa.

Captulo 2

Antes das respostas, gostaramos de deixar claro que as interpretaes das questes ficam
a cargo do estudante. Se ocorrerem dvidas, entrar em contato com o tutor.

1.
a) x 23,1, Md = 22,5 e Mo = 22
b)

CLASSES f fr fa Pm
10 14 3 0,0469 3 12

14 18 5 0,0781 8 16

18 22 12 0,1875 20 20

captulo 5 143
22 26 25 0,3906 45 24

26 30 12 0,1875 57 28

30 34 3 0,0469 60 32

34 38 2 0,0313 62 36

38 42 2 0,0313 64 40

Total 64 1,0000

c) x 24,6 Md 23,9 Md = 24 Q1 = 20,7 D1 26 P99 = 40,7


d)
Histograma

24
22
20
18
16
Frequncia

14
12
10
8
6
4
2
0
14

18

22

26

30

34

38

42
|

|
10

14

18

22

26

30

34

38

N de horas

2.
a) Vendas mensais. Varivel quantitativa contnua.
b) x 3,2 Md = 3,4 Mo = 3,5
c) Q3 20,7 D1 1,4 P80 = 4,1
d) 16,36%
e) 21,82%
f) 56,36%
g) 65,45%

144 captulo 5
3.
a) x 17,1
b) Md = 2
c) Mo = 2

4.
a) Idade dos funcionrios
b) 48
c) x 30,9 Md 29,7 Mo 27,8
d) Q1 25,7
e) 25
f) 4,17%
g) 47,9%

5. 4,3

Captulo 3

As interpretaes das questes ficam a cargo do estudante. Se ocorrerem dvidas,


entrar em contato com o tutor.

1.
a) R = 31s 6,1 s2 37,2 cv 0,2633 ou 26,33%
b) R = 32 s 5,8 s2 33,6 cv 0,2358 ou 23,58%

2. R = 6 s 1,24 s2 1,54 cv 0,3875 ou 38,75%

3. R = 7 s 2,88 s2 8,29 cv0,45 ou 45%

4. R = 5 s 1,29 cv 0,7588 ou 75,88%

captulo 5 145
5. R = 30 s 6,9 s2 47,6 cv 0,2233 ou 22,33%

6.
a) Caixa A (menor variao absoluta (s))
b) Caixa A (maior variao relativa (cv))

Captulo 4

1.
a) 0,2328
b) 0,0461
c) 0,7672

2.
a) 0,7
b) 0,725
c) 0,6897
d) 0,7143
e) 0,2727
f) 0,75

3.
a) 0,6667
b) 0,4
c) 0,3
d) 0,2222

4.
a) 0,75 b) 0,25

146 captulo 5
5. 5. 0,9703

6.
a) 0,02875 b) 0,5565

Captulo 5

1. E(X) = 2,1 Var(X) = 0,63

2. 2,5

3. R$ 1.400,00

4.
a) 4,6 b) E(G) = 2,75 Var(G) = 0,4125

5.
a) 0,000011 b) 0,0042 c) 0,8329

6. 0,0033

7.
a) 0,1317 c) 0,1646
b) 0,7901 d) 0,9959

captulo 5 147
8.
a) 0,0778 b) 0,2592 c) 0,9222

9.
a) 0,0881

10.
a) 0,324135 b) 0,420175

148 captulo 5

Você também pode gostar