LT - Unidade III

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 52

ESTATÍSTICA

Unidade III
7 DISTRIBUIÇÕES DE PROBABILIDADES

Vimos as maneiras que se apresentam dados estatísticos, conceituamos frequência simples


e posteriormente frequência relativa. Vimos, ainda, que probabilidades podem ser definidas
como as frequências simples de eventos ocorridos quando houver uma quantidade de repetições
considerável do experimento.

Como decorrência disso nós podemos estabelecer o conceito de distribuição de probabilidades em


analogia com as distribuições de frequências com algumas diferenças:

• Na distribuição de frequências normalmente utilizávamos como informação principal a frequência


simples. Na distribuição de probabilidades priorizaremos as frequências relativas, agora chamadas
de probabilidades.

• Distribuições de frequências são informações reais, exatas, decorrência de observações efetuadas.


Já distribuições de probabilidade são previsões feitas a partir daquelas observações, portanto
não são reais, são evidentemente prováveis.

• Enquanto em estatística descritiva utilizamos nos cálculos os dados apresentados na forma de


tabelas, nesta etapa será mais frequente o uso das informações na forma de gráficos.

7.1 Conceitos de distribuição de probabilidades

Definimos anteriormente tabela ou distribuições de frequências como sendo uma relação entre os
valores possíveis dentro de uma amostra com o número de vezes que esse valor ou classe de valores
ocorreu. Por exemplo, em uma prova 20 alunos tiraram nota 10 ou então 27 funcionários da minha
empresa são casados. Perceba o tempo verbal, no passado ou no presente.

De modo semelhante podemos definir distribuição ou tabela de probabilidades. É a relação entre


os valores possíveis de ocorrer e a probabilidade que esse valor venha a ocorrer. Por exemplo, 15% dos
alunos de estatística serão aprovados sem exame ou, então, ter terminado o curso superior aumentará
em 25% o seu salário. O tempo verbal agora está no futuro.

A distribuição de probabilidades, à semelhança com distribuição de frequências, é uma listagem dos


valores possíveis com suas respectivas probabilidades. Essa listagem pode ser na forma de tabela ou de
gráfico, ou ambas.

159
Unidade III

Como trabalhamos muitas vezes com variáveis discretas e outras tantas com variáveis contínuas,
dividimos as distribuições de probabilidades em dois grandes grupos, cada um deles com modelos
matemáticos específicos:

• Distribuições de probabilidades discretas:

—― Distribuição binomial.

— Distribuição de Poisson.

— Distribuição hipergeométrica.

• Distribuições de probabilidades contínuas:

— Distribuição normal.

— Distribuição exponencial.

O modelo de distribuição a ser utilizado depende dos aspectos específicos da situação – problema
que está sendo estudado. De modo geral, para os cálculos que envolvam as distribuições discretas,
utilizamos equações estatísticas para calcular as probabilidades. Já para as contínuas nos valemos de
gráficos e de tabelas deles decorrentes.

Como as distribuições binomiais, de Poisson e em especial as distribuições normais são as mais


utilizadas na prática, concentraremos nossos estudos nessas três. As demais distribuições apresentam
modelos matemáticos diferenciados (fórmulas e gráficos se alteram de uma para outra), mas
seguem padrões de cálculos semelhantes, o que facilitará o estudo futuro para aqueles que assim
necessitarem e desejaram.

Saiba mais

Todos nós temos uma tendência de raciocinar segundo uma função


de 1º grau. A regra de três parece solucionar todas as nossas dúvidas.
Mas a realidade não é assim e pode ser surpreendente descobrir que não
estamos preparados para o raciocínio exponencial. Em um curto vídeo de
pouco mais de sete minutos, Mauricio Féo mostra as consequências desse
desconhecimento. Veja o vídeo apresentado na matéria a seguir:

OLIVEIRA, E. Enigma da vitória-régia vira exemplo em vídeo que explica o


que é o crescimento exponencial da pandemia. G1., 10 abr. 2020. Disponível
em: http://glo.bo/3G9gp0D. Acesso em: 3 nov. 2022.

160
ESTATÍSTICA

7.2 Distribuições para variáveis discretas

Variáveis discretas são aquelas que podem apresentar apenas determinados valores preestabelecidos
dentro da lógica do experimento. São variáveis contáveis e não mensuráveis, e, portanto, normalmente
números inteiros, como número de filhos numa família; número de funcionários em determinado setor da
empresa; número de chutes na direção do gol de um time em certa partida.

7.2.1 Cálculo de distribuições binomiais a partir de probabilidades com poucos eventos

A distribuição de binomial é uma distribuição para variáveis discretas e, como o nome indica,
é utilizada quando temos a presença de dois eventos complementares. É uma generalização do
binômio de Newton e adapta-se às situações estatísticas que seguem o princípio de Bernoulli, que
são os seguintes:

• Em cada repetição do experimento, nomeado como tentativa, existem dois e apenas dois resultados
possíveis, complementares chamados por conveniência de sucesso e insucesso.

• A série de tentativas é composta de eventos independentes.

• As probabilidades de sucesso e insucesso permanecem constantes ao longo das tentativas. É um


processo estacionário.

Para entender o funcionamento e a utilidade da distribuição binomial vamos recuperar um tipo de


problema que já equacionamos anteriormente:

Exemplo 1

Um vendedor sabe que, ao sair para fazer um determinado tipo de venda, tem 20% de probabilidade
de concretizá-la. Num dia qualquer ele sai para atender a três clientes, qual é a probabilidade de fazer
exatamente duas vendas?

O problema pode ser resolvido usando os conceitos aprendidos antes. Mas, veja bem, isso só é
possível porque ele pretende fazer poucas visitas. Caso ele saísse para fazer dez visitas, a resolução seria
demasiadamente trabalhosa.

Vamos começar pelo caso mais fácil. A árvore de decisões apresentada a seguir mostra três caminhos
nos quais o vendedor consegue efetivar exatamente duas vendas.

161
Unidade III

0,2 Efetua a Caminho 1


Efetua a compra 0,2 x 0,2 x 0,2 = 0,23 x 0,80 = 0,0080
0,2 3º Cliente
compra Não efetua Caminho 2
0,8 a compra 0,2 x 0,2 x 0,8 = 0,22 x 0,81 = 0,0320
Efetua a
2º Cliente
0,2 compra
0,2 Efetua a Caminho 3
Não efetua compra 0,2 x 0,8 x 0,2 = 0,22 x 0,81 = 0,0320
0,8 3º Cliente
a compra Não efetua Caminho 4
0,8 a compra 0,2 x 0,8 x 0,8 = 0,21 x 0,82 = 0,1280
1º Cliente
0,2 Efetua a Caminho 5
Efetua a compra 0,8 x 0,2 x 0,2 = 0,22 x 0,81 = 0,0320
0,2 3º Cliente
compra
Não efetua Caminho 6
0,8 a compra 0,8 x 0,2 x 0,8 = 0,21 x 0,82 = 0,1280
0,8 Não efetua
2º Cliente
a compra
0,2 Efetua a Caminho 7
Não efetua compra 0,8 x 0,8 x 0,2 = 0,21 x 0,82 = 0,1280
0,8 3º Cliente
a compra
Não efetua Caminho 8
0,8 a compra 0,8 x 0,8 x 0,8 = 0,20 x 0,83 = 0,5120
Somatório das probabilidades de todos os caminhos = 1

Figura 43

O vendedor efetiva exatamente duas vendas se ocorrer um desses caminhos (possibilidades): 2; 3 e 5.

Como vimos anteriormente a probabilidade de o vendedor realizar exatamente duas vendas será a
soma das probabilidades dos três caminhos.

P (exatamente duas vendas ) = P (caminho 2) + P (caminho 3) + P (caminho5)

P ( exatamente duas vendas ) = 0,0320 + 0,0320 + 0,0320 = 0,0960 ou 9,60%

Desse modo, a probabilidade de o vendedor conseguir efetivar exatamente duas vendas é de 9,60%.

Observe alguns dados interessantes sobre esse cálculo que acabamos de fazer:

• Todos os caminhos têm o mesmo cálculo: 0,22 x 0,81 = 0,0320. Note que 0,2 é a probabilidade de
se concretizar a venda e o expoente dele, 2, é o número de vendas que queremos concretizar; 0,8
é a probabilidade de não se concretizar a venda e o expoente dele, 1, é o número de vendas que
não iremos concretizar.
• Observe também que existem três caminhos possíveis. Você deve lembrar que esse valor se refere
às combinações possíveis de três elementos (os clientes visitados) tomados dois a dois (o número
de vendas que queremos efetivar):

n! 3! 3! 1× 2 × 3
Cn,x = → C3,2 = = = =3
x! (n − x )! 2! ( 3 − 2 )! 2!× 1! 1× 2 × 1
162
ESTATÍSTICA

Dessa forma conseguimos encontrar uma fórmula para calcular qualquer quantidade de eventos,
com muito menos trabalho, como no seguinte exemplo.

Exemplo 2

Um vendedor sabe que, ao sair para fazer um determinado tipo de venda, tem 30% de probabilidade
de concretizá-la. Num dia qualquer ele sai para atender 20 clientes, qual é a probabilidade de fazer
exatamente oito vendas?

Nessa questão os números envolvidos são muito maiores que o exemplo anterior, causando um
trabalho braçal muito grande quando resolvido “na raça” como no exemplo anterior. Mas agora, como
já conhecemos o funcionamento da distribuição, é só usá-lo:

• Probabilidade de se efetivar uma venda: 30% ou 0,3.

• Número de vendas que quero efetivar: oito.

• Probabilidade de não se efetivar uma venda: 70% ou 0,7 (lembre-se: são eventos complementares).

• Número de vendas que não se efetivarão: 12 (lembre-se: se o vendedor vai fazer 20 visitas e
concretiza a venda em oito delas, não concretizará vendas em 12 delas, obviamente).

Aplicando a fórmula:

• Número de caminhos:

n! 20!
Cn,x = → C20,8 = = 125.970
x! (n − x )! 8! ( 20 − 8 )!

• Probabilidade de ocorrência de cada caminho: 0,38 x 0,712 = 0,0000009081.

• Probabilidade de se efetivarem exatamente oito vendas: 125.970 x 0,0000009081 = 0,1144


ou 11,44%.

Perceba que, apesar de os números envolvidos serem difíceis de trabalhar, ainda é muito mais simples
que o raciocínio da árvore.

Formalmente, a fórmula para o cálculo da distribuição binomial é a seguinte:


n− x
P ( X = x ) = Cn,x × px × (1 − p)

163
Unidade III

Onde:

• P ( X = x ) é a probabilidade que o número de sucessos obtidos seja exatamente igual a x.

• n é o número de tentativas realizadas, ou seja, o número de vezes que o experimento é realizado.

• x é o número de sucessos que desejamos obter.

• p é a probabilidade de sucesso numa única tentativa.

No exemplo a seguir vamos efetuar o cálculo usando diretamente a fórmula da distribuição binomial.

Exemplo 3

Num ano qualquer, 55% das ações negociadas na Bolsa de Valores de São Paulo sofreram alta,
enquanto 45% se mantiveram estáveis ou sofreram baixas. Uma corretora de ações separa dez ações de
sua carteira ao acaso. Qual é a probabilidade de que, dessas dez ações:

• Exatamente oito ações tenham tido alta?

• Todas as dez ações tenham tido altas?

• No máximo duas ações tenham tido altas?

Perceba que temos que, para usar a fórmula, determinar o valor de três grandezas: n; p; x.

Nos cálculos dos três itens solicitados, o valor de n e p não se alteram. O que vai alterar de um item
para outro é apenas o valor de x:

• Número de tentativas: n = 10.

• Probabilidade de sucesso: p = 0,55 (probabilidades de uma ação ter alta).

Para responder às questões, basta determinar o valor de x específico e aplicar a fórmula:

• Na primeira pergunta, o valor de x é oito: x = 8, logo, o cálculo será:

n− x 10 −8
P ( X = x ) = Cn,x × px × (1 − p) → P ( X = 8) = C10,8 × 0,558 × (1 − 0,55)

10! 10 −8
P ( X = 8) = × 0,558 × (1 − 0,55) = 45 × 0,558 × 0,452 = 45 × 0,0084 × 0,2025
8! (10 − 8)!

164
ESTATÍSTICA

P ( X = 8) = 0,0765 ou 7,65%

P(X = 8) = 0,0765 = 7,65%

• Na segunda pergunta, o valor de x é dez: x = 10, e o cálculo será:

n− x 10 −10
P ( X = x ) = Cn,x × px × (1 − p) → P ( X = 10) = C10,10 × 0,5510 × (1 − 0,55)

10! 10 −10
P ( X = 10) = × 0,5510 × (1 − 0,55) = 1 × 0,5510 × 0,450
10! (10 − 10)!

P ( X = 10) = 0,0025 ou 0,25%

• Na terceira pergunta, o valor de x é 0; 1 e 2, porque queremos no máximo duas ações com altas,
ou seja, nenhuma ação com alta ou uma ação com alta ou duas ações com alta.

Observação

A fórmula da distribuição binomial nos permite calcular a probabilidade


de exatamente uma possibilidade. Quando queremos as probabilidades de
várias possibilidades, devemos calculá-las separadamente e somar os
valores encontrados.

Vamos então fazer os três cálculos e somar os valores:

10 −0
P ( X = 0) = C10,0 × 0,550 × (1 − 0,55) = 0,0003

10 −1
P ( X = 1) = C10,1 × 0,551 × (1 − 0,55) = 0,0042

10 −2
P ( X = 2) = C10,2 × 0,552 × (1 − 0,55) = 0,0229

P ( X = no máximo duas ações em alta) = 0,0003 + 0,0042 + 0,0229 = 0,0274 ou 2,74%

Nos exemplos calculamos algumas possibilidades, mas a rigor a distribuição de probabilidades


binomial seria uma tabela, com todos os possíveis resultados (possibilidades) associados às suas
probabilidades correspondentes. A tabela a seguir faz isso para os dados da questão das ações
negociadas em Bolsa.

165
Unidade III

Tabela 69

Número de ações em Cálculos das probabilidades para Probabilidade


alta (x) n = 10 e p = 0,55 de ocorrência
0 P (X = 0) = C10,0 x 0,550 x (1 - 0,55) 10-0 0,03%
1 P (X = 1) = C10,1 x 0,551 x (1 - 0,55) 10-1 0,42%
2 P (X = 2) = C10,2 x 0,55 x (1 - 0,55)
2 10-2
2,29%
3 P (X = 3) = C10,3 x 0,55 x (1 - 0,55)
3 10-3
7,46%
4 P (X = 4) = C10,4 x 0,55 x (1 - 0,55)
4 10-4
15,96%
5 P (X = 5) = C10,5 x 0,55 x (1 - 0,55)
5 10-5
23,40%
6 P (X = 6) = C10,6 x 0,55 x (1 - 0,55)
6 10-6
23,84%
7 P (X = 7) = C10,7 x 0,55 x (1 - 0,55)
7 10-7
16,65%
8 P (X = 8) = C10,8 x 0,55 x (1 - 0,55)
8 10-8
7,63%
9 P (X = 9) = C10,9 x 0,55 x (1 - 0,55)
9 10-9
2,07%
10 P (X = 10) = C10,10 x 0,55 x (1 - 0,55)
10 10-10
0,25%
Somatório 100,00%

Observe a tabela anterior e verifique a semelhança com a apresentação feita na parte de estatística
descritiva para as amostras. Lembre-se de que, a partir de informações desse tipo, definíamos as medidas
de posição e as medidas de dispersão para as amostras. De maneira semelhante iremos agora definir
as mesmas medidas para as populações, com a diferença que para amostras são valores reais e para
população valores prováveis, ou esperados.

Como fizemos com as tabelas de frequências, poderíamos apresentar esses mesmos dados na forma
gráfica, com um histograma, por exemplo:
30,00%

25,00%
Probabilidade de ocorrência (%)

20,00%

15,00%

10,00%

5,00%

0,00%
0 1 2 3 4 5 6 7 8 9 10
Número de ações em alta (x)

Figura 44

166
ESTATÍSTICA

7.2.2 Definição e cálculo de valores esperados (esperança matemática) e desvio padrão


esperado para a binomial

Vimos que as amostras apresentam medidas estatísticas importantes calculáveis a partir da


distribuição ou tabela de frequências. Com as populações ocorre algo similar. Podemos calcular as
mesmas medidas a partir das distribuições de probabilidades com a diferença que os valores obtidos são
prováveis, e não reais e exatos.

Por exemplo, a nota média final que você tirou em uma matéria do primeiro semestre é algo real,
definido e exato. É uma média amostral. Já a média que você tirará numa matéria do oitavo semestre
é um valor provável (apesar de poder ser estimada tomando os devidos cuidados). Chamamos esta de
média populacional. O que se reproduz para as demais medidas estatísticas.

Observação

Alguns autores diferenciam as medidas estatísticas amostrais das


populacionais atribuindo a essas últimas o termo “parâmetros estatísticos”.
Neste texto, sempre que necessário, utilizaremos os termos amostral e
populacional para estabelecer a diferença. Aparecerá o termo “esperado”
para significar algo provável.

A média de uma população é um valor provável ou, se preferir, esperado, e é calculado de maneira
semelhante ao que foi calculado na amostra, mas utilizando-se os valores de probabilidades ao invés
das frequências.

Utiliza-se como símbolo da média populacional a letra grega µ (mi), ou então o símbolo E(x),
significando a esperança de x ou o valor esperado para x, e é obtida pela fórmula:

n
E ( x ) = p1x1 + p2x2 + p3x 3 + …+ pnxn = ∑pixi
i=1

Usando os dados do exemplo 3, vamos efetuar o cálculo do valor esperado ou média populacional.
Perceba a semelhança com o cálculo da média amostral feita em estatística descritiva.

167
Unidade III

Tabela 70

A B C D=AxC
Probabilidade de Probabilidade de
Número de ações em alta ocorrência em percentual ocorrência em decimal pi × xi
xi pi
0 0,03% 0,0003 0,0000
1 0,42% 0,0042 0,0042
2 2,29% 0,0229 0,0458
3 7,46% 0,0746 0,2238
4 15,96% 0,1596 0,6384
5 23,40% 0,2340 1,1700
6 23,84% 0,2384 1,4304
7 16,65% 0,1665 1,1655
8 7,63% 0,0763 0,6104
9 2,07% 0,0207 0,1865
10 0,25% 0,0025 0,0250
Somatório E (x)= 5,5000

Isso significa que o valor esperado de ações em alta nessa Bolsa é de 5,5 ações, das dez consideradas.
Podemos afirmar que, em cada dez ações acompanhadas, 5,5 devem estar em alta. Perceba que não é
uma certeza, é um valor sujeito à variabilidade.

Observação

É costumeiro nos referir ao valor esperado com termos variados como


esperança matemática, média provável, média populacional etc. São termos
equivalentes. A simbologia usada para as medidas populacionais são letras
do alfabeto grego. A média populacional, como já dito, é µ, o desvio padrão
é σ e a variância é σ2.

A variabilidade a que nos referimos é medida pela variância (ou pela sua raiz quadrada o
desvio padrão), que tem as mesmas definição e características daquela definida para a amostra e é
calculada pela fórmula:

( )
Var ( x ) = E x2 − E ( x )
2

A tabela a seguir mostra o cálculo da variância, semelhante ao feito para as amostras.

168
ESTATÍSTICA

Tabela 71

A B C D=AxC E=AxA F=ExC


Probabilidade Valor (n. de
Número de Probabilidade de
de ocorrência ações) ao
ações em alta ocorrência decimal pi × xi pi × x2i
percentual quadrado
xi pi x2i
0 0,03% 0,0003 0,0000 0 0
1 0,42% 0,0042 0,0042 1 0,0042
2 2,29% 0,0229 0,0458 4 0,0916
3 7,46% 0,0746 0,2238 9 0,6714
4 15,96% 0,1596 0,6384 16 2,5536
5 23,40% 0,2340 1,1700 25 5,8500
6 23,84% 0,2384 1,4304 36 8,5824
7 16,65% 0,1665 1,1655 49 8,1585
8 7,63% 0,0763 0,6104 64 4,8832
9 2,07% 0,0207 0,1865 81 1,6767
10 0,25% 0,0025 0,0250 100 0,2500
Somatório E (x) 5,5000 E (x ) 2
32,721

( )
Var ( x ) = E x2 − E ( x ) → Var ( x ) = 32,7 − [5,5] = 32,7 − 30,3 = 2,4
2 2

Lembrete

A fórmula Var(x) = E(x2) - [E(x)]2 é lida da seguinte forma: “variância de


x é igual ao valor esperado do x ao quadrado menos o valor esperado
do quadrado de x”.

Você se lembra de que o desvio padrão é a raiz quadrada da variância? O símbolo do desvio padrão
populacional é a letra grega σ (sigma), portanto:

σ = Var ( x )

Nesse exemplo, o desvio padrão é dado por:

σ = Var ( x ) → σ = 2,4 = 1,5

Todas essas informações estatísticas, que acabamos de ver e calcular para o caso do lote de ações
da Bolsa de Valores, podem ser apresentadas na forma gráfica, de modo semelhante ao que fizemos
para as amostras.

169
Unidade III

Observe que, enquanto no eixo horizontal continuamos a colocar os valores envolvidos, no eixo
vertical colocamos agora as probabilidades, e não mais as frequências. De resto são gráficos bastante
semelhantes, com a já sabida e repisada diferença de que um apresenta valores reais (quando trabalhamos
com amostras) e o outro, valores prováveis (para a população).

25%

20%

15%
Probabilidades

10%

5%

0%
0 1 2 3 4 5 6 7 8 9 10

µ-σ µ+σ
µ
Número de ações em alta

Figura 45

No gráfico podemos definir:

• As probabilidades de cada ocorrência (determinado número de ações em alta), representadas


pelas colunas verticais.

• A média (µ) ou valor esperado para essa distribuição, representada pela linha tracejada central.

• A variação de um desvio padrão (σ) para mais, representada pela linha traço ponto da direita.

• A variação de um desvio padrão (σ) para menos, representada pela linha traço ponto da esquerda.

• Uma curva que passa pelo topo de todas as colunas, centrada na média e com inflexões nos
desvios padrões para mais e para menos.

Essa curva extremamente importante para a estatística é a normal. Verifique, por ora, que é evidente
o fato de que, quanto maior for o número de colunas, mais definida será a referida curva, em outras
palavras a distribuição binomial tende à distribuição normal quando o número de elementos envolvidos
aumenta. Veremos mais à frente que, quando n ≥ 30, as distribuições praticamente se confundem.

170
ESTATÍSTICA

7.2.3 Definição e cálculo de distribuição de Poisson

A distribuição de Poisson é uma distribuição discreta de probabilidades usada para determinar a


probabilidade do número de ocorrências num determinado intervalo de tempo ou espaço. Por exemplo,
quando desejamos saber a probabilidade de que em determinada hora de atendimento no caixa de um
banco comparecem exatamente cinco clientes.

Essa distribuição trata de eventos relativamente raros e tem como característica o fato de contar
os sucessos, mas não os fracassos. Perceba que o número de clientes que comparecem à uma agência
bancária é relativamente pequeno em comparação ao total de clientes dessa agência.

Outra característica importante é que nessa distribuição é possível contar os sucessos, mas não
os insucessos ou falhas. Por exemplo, podemos contar o número de clientes que vão à uma agência
bancária, mas não os que não vão.

A distribuição binomial é utilizada quando desejamos saber a probabilidade de ocorrência de um


determinado número de sucessos dentro de uma série de repetições. Já a distribuição de Poisson pesquisa
a probabilidade de ocorrência de um número específico de resultados dentro de um determinado
intervalo de tempo ou espaço.

O uso da distribuição de Poisson deve satisfazer às seguintes condições:

• Devemos contar o número de vezes que determinado evento ocorre num intervalo de tempo
ou espaço.

• A probabilidade de que o evento venha a ocorrer é a mesma em cada intervalo considerado.

• O número de ocorrências em um intervalo independe do número de ocorrências em outros intervalos.

Nessas condições, a probabilidade que ocorra exatamente x ocorrências em um intervalo é dada por:

P (x) =
( λt ) e −λt
x

x!

Onde:

P (x) = probabilidade de ocorrer exatamente x sucessos

λ = número médio de sucesso em um determinado intervalo (de tempo ou espaço)

t = intervalo de tempo ou espaço contínuo de observações

e = constante neperiana cujo valor aproximado é de 2,7183

x = número de sucessos no intervalo desejado

171
Unidade III

Observação

A constante neperiana muitas vezes é chamada de constante de Euler;


constante de Napier, número de Neper; número neperiano; constante
matemática, número exponencial entre outros termos. É a base dos logaritmos
naturais e seu valor aproximado é de 2,718281828459045235360287, sendo
um valor irracional, usaremos o valor com quatro casas decimais 2,7183.

Através de exemplos, entenderemos melhor o uso dessa ferramenta.

Exemplo 1

Uma grande agência bancária recebe em seus caixas em média dez clientes por hora. Qual a
probabilidade de que em um intervalo de meia hora receba exatamente quatro clientes?

Temos que:

λ =10 (clientes por hora)

t = 0,5 (hora)

x=4

P (x) =
( λt )x e−λt → P (10 × 0,5)4 e−(10×0,5) = 54 × e −5
(4 ) = =
x! 4! 1× 2 × 3 × 4
625x0,00674 4,21250
= = = 0,1755 ou 17,55%
24 24

A probabilidade de exatamente quatro clientes comparecerem no intervalo de meia hora nos caixas
dessa agência é de 17,55%.

Exemplo 2

Uma pesquisa do Ibama revelou que em determinada região amazônica existem uma média de
2,6 onças por 100 km2. Qual a probabilidade de serem encontradas exatamente duas onças numa área
florestal com 25 km2?

Temos que:

172
ESTATÍSTICA

(
λ = 2,6 onças por 100 km2 )
( )
t = 25 km2

x=2

( λt ) e −λt ( 2,6 × 0,25) e −(2,6×0,25) 0,652 × e −0,65


x 2
P (x) = (2,6)→P = = =
x! 2! 1× 2
0,4225x0,5220 0,2205
= = = 0,1103 ou 11,03%
2 2

Existe 11,03% de probabilidade na área considerada existirem exatamente duas onças.

Exemplo 3

Uma grande siderúrgica tem uma média de 14 acidentes por ano. Qual a probabilidade que ela passe
um mês sem nenhum acidente?

Temos que:

λ = 14 (acidentes por ano)

t = 1 (mês)

x=0
0  1
 1  −14×12 
 14 ×  e
P(x) =
( λt ) e
x −λt
→ P (0) =  12 
=
1× e−1,667
=
x! 0! 1
1x0,3114 0,3114
= = = 0,3114 ou 31,14%
1 1

A probabilidade de a siderúrgica não ter acidentes durante um mês inteiro é de 31,14%.

Como na distribuição binomial a média, a variância e o desvio padrão podem ser calculados por
fórmulas previamente demonstradas, são elas:

Média: µ = λ ⋅ t

Variância: σ2 = λ ⋅ t

Desvio padrão : σ = λ ⋅ t

173
Unidade III

Exemplo 4

Uma máquina automática de venda de refrigerantes apresenta em média três falhas por semana.
Calcular para um intervalo de 210 dias de funcionamento.

• Qual o número esperado de falhas nesse período?

Temos

3
λ = 3 falhas por semana ou por dia
7

t = 210 dias

3
µ = λ ⋅ t = × 210 = 90 falhas
7

• Qual o desvio padrão do número de falhas esperadas?

3
σ = λ⋅t = × 210 = 90 = 9,5 falhas
7

Exemplo de aplicação

Uma refinaria de petróleo tem capacidade de receber e abastecer de gasolina no máximo quatro
caminhões por dia. Caso receba mais do que quatro caminhões, o excesso deverá pernoitar num
estacionamento próximo. Sabe-se que em média chegam três caminhões por dia. Qual a probabilidade
de, em dado dia, alguns caminhões terem de pernoitar para abastecer no dia seguinte?

Resolução

A necessidade de pernoite ocorre quando há mais do que quatro caminhões para serem abastecidos,
logo, quando há menos do que isso, a refinaria atende no mesmo dia. Devemos então calcular a
probabilidade da presença de quatro ou de três ou de dois ou de um ou de zero caminhões. Nesses casos,
todos serão atendidos, portanto a probabilidade complementar corresponde aos não atendimentos.

Assim temos que:

λ = 3 (caminhões por dia)

t = 1 (dia)

x = 0; 1; 2; 3; 4

174
ESTATÍSTICA

( λt ) e −λt ( 3 × 1) e −(3×1) 1 × e −3
x 0
P (x) = →P ( 0) = = = 0,0498
x! 0! 1

( λt ) e −λt ( 3 × 1) e −(3×1) 3 × e −3
x 1
P (x) = → P (1) = = = 0,1494
x! 1! 1

( λt ) e −λt ( 3 × 1) e −(3×1) 9 × e −3
x 2
P (x) = →P (2 ) = = = 0,2240
x! 2! 2

( λt ) e −λt ( 3 × 1) e −(3×1) 27 × e −3
x 3
P (x) = →P (3) = = = 0,2240
x! 3! 6

( λt ) e −λt ( 3 × 1) e −(3×1) 81 × e −3
x 4
P (x) = →P (4 ) = = = 0,1680
x! 4! 24

Assim a probabilidade de haver uma quantidade de caminhão compatível com a capacidade da refinaria
é de:

P (dentro da capacidade) = P ( 0) + P (1) + P (2) + P (3) + P (4 ) =

P (dentro da capacidade) = 0,0498 + 0,1494 + 0,2240 + 0,2240 + 0,1680 = 0,8152

A probabilidade de não atendimento é o complementar da de atendimento:

P ( fora da capacidade) = 1 − P (dentro da capacidade) = 1 − 0,8152 = 0,1848 ou 18,48%

A probabilidade de um caminhão ter que pernoitar para ser abastecido é de 18,48%.

8 DISTRIBUIÇÕES PARA VARIÁVEIS CONTÍNUAS

Vimos a mais importante distribuição de probabilidades discretas, a distribuição binomial. Para


variáveis contínuas, a mais importante distribuição é a distribuição normal ou de Gauss. Aliás, essa é a
mais importante entre todas as distribuições de probabilidades e a mais usada. Uma enorme quantidade
de situações estatísticas recai na distribuição normal.

O gráfico já apresentado e repetido a seguir mostra o surgimento da curva a partir de um histograma


de probabilidades, com suas características principais:

• centrado na média;
• com sua forma definida pelo valor do desvio padrão.
175
Unidade III

25%

20%

15%
Probabilidades

10%

5%

0%
0 1 2 3 4 5 6 7 8 9 10

µ-σ µ+σ
µ
Número de ações em alta

Figura 46

Vamos entender a distribuição normal a partir da próxima tabela. Nela estão relacionados dados
referentes às ações em alta de três diferentes bolsas de valores. Foram acompanhadas 30 diferentes
ações em cada uma das bolsas e calculados os comportamentos estatísticos, através dos conceitos de
valores esperados para a binomial. Cada uma delas com um comportamento diferente expresso pela
média e pelo desvio padrão.

Tabela 72

Bolsa de Número de Probabilidade de Média de ações Desvio padrão de


valores observações ações em alta em alta ações em alta
A 30 30% 9 2,51
B 30 50% 15 2,74
C 30 80% 24 2,19

Observação

A média e o desvio padrão de cada uma das bolsas foram


calculados através das fórmulas de esperança matemática.
Para a Bolsa A, por exemplo, temos: µ = np = 30 × 0,3 = 9 e
σ = n × p × (1 − p) = 30 × 0,3 × (1 − 0,3) = 2,51.

Essas mesmas informações estão mostradas no gráfico a seguir. Perceba que retiramos as colunas
do histograma e mantivemos apenas a curva. Essas curvas são as chamadas distribuições normais.
Quando o número de observações (tentativas) numa distribuição binomial aumenta, ela se aproxima

176
ESTATÍSTICA

cada vez mais da distribuição normal, até que ficam indistinguíveis. Chama-se a isso de aproximação da
binomial pela normal.

20%
f (x) Bolsa C (24; 2,19)
18%
Bolsa A (9; 2,51)
16%
Bolsa B (15; 2,74)
14%
12%
10%
8%
6%
4%
2%
0%
0 5 10 15 20 25 30
Número de ações em alta (x)

Figura 47

Observando atentamente o gráfico anterior percebemos que na Bolsa C é praticamente impossível


(ou seja, a probabilidade é muito próxima de zero) que existam menos de 15 ações em alta. Para a
Bolsa A é o oposto, é praticamente impossível que tenha mais do que 16 ou 17 ações em alta. Já para
a Bolsa B o mais provável é que haja 15 ações em alta.

Lembrete

As probabilidades estão relacionadas às áreas entre a curva e o eixo


horizontal. Quando não existe área, não existe probabilidade. É o caso da
curva C após o valor 17 (aproximadamente). Ela praticamente toca o eixo
dos x, reduzindo a área correspondente a praticamente zero.

Percebe-se também que a curva que apresenta o maior desvio padrão é a mais baixa e achatada
(Bolsa B) e a que apresenta menor desvio padrão mais alta e afilada (Bolsa C).

A Bolsa com maior probabilidade de ter ações em alta (Bolsa C) possui o gráfico deslocado para a
direita, enquanto a com menor probabilidade (Bolsa A) está deslocada para a esquerda. A Bolsa B, que
tem 50% de suas ações em alta, está localizada exatamente em torno do valor central e, percebe-se, é
mais regular, menos “deformada” que as outras.

Resumindo, a curva normal é determinada em todos os seus aspectos pela média e pelo
desvio padrão. Conhecendo esses dois parâmetros, conheceremos o comportamento probabilístico
do experimento.
177
Unidade III

8.1 Distribuição normal – definição

Observe agora a curva referente à Bolsa B. Perceba que ela é absolutamente simétrica em
relação ao eixo vertical. O lado esquerdo dela em relação à média é idêntico ao lado direito.
Em outras palavras, metade da área sob essa curva está do lado esquerdo da média e metade está do
lado direito; a probabilidade de se ter 15 ações ou mais em alta nessa bolsa é de 50%, assim como a
probabilidade de se ter 15 ações ou menos. Essa é uma importante decorrência das distribuições contínuas,
entre elas a normal: as probabilidades são proporcionais às áreas definidas pelos valores envolvidos.

A questão proposta a seguir demonstra a utilidade destes conceitos:

Exemplo 1

Uma empresa de pneumáticos acompanhou a vida útil de uma quantidade considerável de pneus
de um determinado tipo e chegou à conclusão que essa vida útil é normalmente distribuída e tem uma
média de 42.000 km com desvio padrão de 5.800 km. Um cliente adquire um desses pneus e o instala
no seu automóvel. Qual é a probabilidade que ele dure mais do que 50.000 km?

Antes de mais nada, vamos entender os procedimentos operacionais envolvidos. O fabricante


não acompanha todos os pneus que fabrica, evidentemente, acompanha uma pequena fração
deles, anotando a quilometragem durante a qual eles foram utilizados. Com esses dados, que
devem ser em quantidade considerável, ele calcula a média e o desvio padrão, como nós o fizemos
em estatística descritiva, e assume que, se ele tivesse acompanhado todos os pneus fabricados,
os valores seriam muito próximos. Ele consegue observar também se o experimento segue ou
não a curva normal.

Feita essa observação, veja o gráfico a seguir (dados fictícios).

Área na qual estão


localizados os pneus que
têm vida útil maior ou igual
a 50.000 km
Densidade

Vida útil
42 em milhares de km
0 5 20 35 50 65

Figura 48

178
ESTATÍSTICA

Na área sob a curva estão representados todos os possíveis pneus desse tipo, desde o que menos
rodou ou rodará até o que mais rodou ou rodará, ou seja, está representada a população dos pneus desse
tipo. Perceba que o pneu que menos roda faz isso por aproximadamente 25.000 km e o mais resistente
roda cerca de 65.000 km.

Se todos os pneus estão representados pela área total (At) e os pneus que duram 50.000
ou mais quilômetros, na área vermelha (Ap = área pedida), então é lógico deduzir a partir
do que já sabemos:

Ap
P (pneurodar
P(pneu rodar 50.000
50.000 km ou mais)) =
oumais
At
Nessas circunstâncias, calcular a probabilidade significa calcular duas áreas. Não é uma tarefa fácil,
matematicamente, mas foram desenvolvidos procedimentos que facilitam esses cálculos.

Logo a seguir mostraremos como são esses procedimentos. Por ora, você acreditará quando digo que
a área dada desse exercício corresponde a 8,38% da área total, portanto:

P(pneu rodar 50.000 km ou mais) = 0,0838 = 8,38%

Saiba mais
As ferramentas estatísticas, em especial a distribuição normal, são
ferramentas vitais do método científico. Às vezes se confundem com ele. Mas
um risco grande é utilizá-las para distorcer a verdade, aproveitando do amplo
desconhecimento de como elas funcionam. Estudos pseudocientíficos giram as
redes sociais semeando a falsidade. Isso não é de hoje. Em 1994 o lançamento
do livro A curva do sino provocou reações violentas por pretensamente “provar”
teorias racistas. Leia o artigo pelo qual Marco Chiaretti mostra como o livro não
seguia os ditames científicos e falseava a verdade:
CHIARETTI, M. Uma questão de inteligência: livro A curva normal não é
científico. SuperInteressante, 31 jan. 1995. Disponível em: https://bit.ly/3tm4oNN.
Acesso em: 28 out. 2022..

8.2 Cálculo de probabilidades através da curva normal

Como notamos na resolução da questão anterior, o cálculo de uma probabilidade que segue
a distribuição normal é relativamente fácil e pouco trabalhoso; o grande problema é calcular as
áreas envolvidas.

Esse tipo de cálculo é matematicamente muito trabalhoso e teria que ser refeito a cada problema a
se resolver, visto que, como cada curva normal é caracterizada pela média e pelo desvio padrão, qualquer

179
Unidade III

alteração nesses parâmetros provocaria uma mudança na curva e consequentemente o recálculo das
áreas envolvidas.

Para facilitar esses cálculos que são repetidos centenas de milhares de vezes, foi estabelecida uma
curva padrão, chamada de curva normal reduzida, a partir da qual, por analogia, determinam-se as
áreas de situações práticas.

P (z)

Z
-4 -3 -2 -1 0 1 2 3 4
68,2%*
95,4%*
99,7%*
100,0%*

Figura 49

Essa curva tem várias características interessantes que facilitarão nossos cálculos:

• Utiliza-se a variável reduzida (padrão) z para diferenciar da variável real, aquela que envolve
os problemas práticos que continuaremos a chamar de x (por exemplo, vida útil do pneu do
nosso exemplo).

• É construída para uma média igual a zero e um desvio padrão igual a 1 (µ=0; σ=1).

• A área total sob a curva normal reduzida é igual a 1.

• A curva varia, no eixo z, desde -4 até mais 4, ou seja, de menos quatro desvios padrões da média
até mais quatro desvios padrões da média.

• Todas as áreas são tabeladas (vide tabela do Anexo).

• A relação entre a curva normal reduzida e a curva normal real é feita pela fórmula:
x−µ
z=
σ
180
ESTATÍSTICA

Onde:

z é a variável reduzida
x é a variável real
µ é a média real
σ é o desvio padrão real

Como veremos logo a seguir, os cálculos de probabilidades através da distribuição normal são feitos
por analogia entre uma situação real, caracterizada por valores específicos de µ e σ, e uma situação
padrão caracterizada por uma média igual a zero e um desvio padrão igual a 1.

Perceba que, entre um desvio padrão para menos, em relação à média, e um desvio padrão para mais,
a área é de 68,2% do total. Entre dois desvios padrões para menos e dois desvios padrões para mais, a
área é de 95,4% do total e assim por diante. Perceba que não existe área antes de quatro vezes o desvio
padrão para menos e depois de quatro vezes o desvio padrão para mais, ou seja, é estatisticamente
impossível ocorrer algo que se distancie mais do que quatro vezes o desvio padrão da média.

Os cálculos das probabilidades envolvendo distribuições normais são basicamente a determinação


das áreas envolvidas, através do uso da tabela da curva normal reduzida, acessada através de analogia
com a situação real que estamos trabalhando. Precisamos então entender o funcionamento da tabela
da curva normal reduzida que você encontra no Anexo.

O critério básico da tabela é que as áreas tabeladas começam sempre da extrema esquerda da curva
e terminam no valor de z que se está trabalhando. Como exemplo, vamos calcular a área tabelada para
z = -1,65, ou seja, o valor da área que começa na extremidade esquerda da curva e termina no valor -1,65.

P (z)

At

Z
-4 -3 -2 -1 0 1 2 3 4
z = -1,65

Figura 50

181
Unidade III

A área marcada começa na extrema esquerda e termina em z = -1,65, portanto é uma área tabelada
e o valor dela é obtido na tabela da seguinte forma:

Tabela 73

Z 0 1 2 3 4 5 6 7 8 9
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294

-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367

-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455

-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559

-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681

Perceba que a tabela tem duas páginas. Uma para valores de z positivos e outra para valores de z
negativos. No exemplo anterior usamos a tabela para valores de z negativos, obviamente. Na coluna
da esquerda localizamos os dois primeiros algarismos do z dado, ou seja, 1,6. Na linha de cabeçalho
localizamos o valor do último algarismo de z, o algarismo 5. A área tabelada é obtida pelo cruzamento
das duas informações. A área tabelada, mostrada no gráfico é, portanto, 0,0495.

Como já vimos, os valores de z serão obtidos por analogia com o problema que efetivamente
estivermos trabalhando. A questão a seguir mostrará todos os cálculos possíveis e imagináveis que
podem ser feitos nessa situação.

Exemplo 2

A produção mensal de um produto químico é normalmente distribuída com uma média de 12.500 toneladas
e desvio padrão de 1.200 toneladas. Calcular as probabilidades para se ter:

A) Uma produção mensal inferior a 11.000 toneladas.

Nessa questão usaremos, inicialmente, a imagem das duas curvas. Uma supõe a situação real
(a produção do produto químico), a outra é a normal reduzida. Com isso conseguiremos mostrar a
analogia a ser feita.

A área que desejamos calcular está localizada à esquerda do valor 11.000 toneladas, ou seja, nos
meses em que produção está abaixo de 11.000 toneladas. Veja o gráfico:

182
ESTATÍSTICA

Ap

11.000 12.500 Produção mensal


P (z)

Ap = At

Z
-4 -3 -2 -1 0 1 2 3 4
z = -1,25
Figura 51

O valor 11.000 toneladas, na situação real, corresponde ao valor -1,25 na situação reduzida, como
mostra a fórmula de conversão:

x − µ 11.000 − 12.500
z= = = −1,25
σ 1.200
Note que a média 12.500 corresponde à média zero na curva reduzida; o desvio padrão 1.200 ao
desvio padrão reduzido 1; o valor 11.000 ao valor reduzido -1,25, então podemos dizer que as duas áreas
sombreadas nos gráficos também são correspondentes. Sabendo o valor percentual de uma, sabemos o
valor percentual da outra.

Observe que as áreas tabeladas são sempre as que estão entre a extrema esquerda e o valor de z.
Exatamente o que ocorre nesse caso. Basta, portanto, obter o valor da área na tabela da curva normal reduzida.

Tabela 74

Z 0 1 2 3 4 5 6 7 8 9
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379

183
Unidade III

z = −1,25 → A t = 0,1056 ou10,56%

Nesse caso : Ap = A t = 10,56%

A probabilidade de que num mês qualquer se produza menos de 11.000 toneladas de produto químico
é de 10,56%.

B) Uma produção mensal superior a 13.800 toneladas.

A área que desejamos calcular está localizada à direita do valor 13.800 toneladas, ou seja, nos meses
em que a produção é superior a 13.800 toneladas.

Ap

Produção mensal
12.500 13.000
P (z)

Ap = 1 - At

Z
-4 -3 -2 -1 0 1 2 3 4
z = 1,08
Figura 52

O valor 13.800 toneladas na situação real corresponde ao valor 1,08 na situação reduzida:

x − µ 13.800 − 12.500
z= = = 1,08
σ 1.200
184
ESTATÍSTICA

Portanto, se a média 12.500 corresponde à média zero na curva reduzida; o desvio padrão 1.200 ao
desvio padrão reduzido 1; o valor 13.800 ao valor reduzido 1,08, então podemos dizer que as duas áreas
sombreadas nos gráficos anteriores também são correspondentes. Sabendo o valor percentual de uma,
podemos calcular o valor percentual da outra.

Observe, no entanto, que as áreas tabeladas são sempre as que estão entre a extrema esquerda
e o valor de z, o que não ocorre nesse caso. Temos então que estabelecer uma relação entre as
áreas envolvidas.

Note que a área total sob a curva normal reduzida é igual a 1. A área que permanece em branco no
gráfico é tabelada, portanto, a área que desejamos é igual a um menos a área tabelada:

Tabela 75

Z 0 1 2 3 4 5 6 7 8 9
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

z = 1,08 → A t = 0,8599 ou85,99%

Nesse caso : Ap = 1 − A t = 1 − 0,8599 = 0,1401ou14,01%

Assim a probabilidade de que num mês qualquer se produza acima de 13.800 toneladas é de 14,01%.

C) Uma produção mensal que esteja entre 12.000 e 13.500 toneladas.

A área que desejamos calcular está localizada entre os valores 12.000 e 13.500 toneladas, ou seja,
corresponde aos meses em que se produz mais de 12.000 toneladas e menos de 13.500 toneladas.

185
Unidade III

P (z)

Ap
At1

Z
-4 -3 -2 -1 0 1 2 3 4
z1 = - 0,42 z2 = 0,83
12.000 13.500 Produção mensal
12.500
P (z) P (z)

Ap = At1 - At2

At2

Z Z
-4 -3 -2 -1 0 1 2 3 4 -4 -3 -2 -1 0 1 2 3 4
z1 = - 0,42 z2 = 0,83 z1 = - 0,42 z2 = 0,83

Figura 53

O valor 12.000 toneladas na situação real corresponde ao valor -0,42 na situação reduzida e o valor
13.500 a 0,83. Veja os cálculos a seguir:

x − µ 12.000 − 12.500
z1 = = = −0,42
σ 1.200

x − µ 13.500 − 12.500
z2 = = = 0,83
σ 1.200

Como vimos anteriormente, podemos fazer a analogia: se a média 12.500 corresponde à média
zero na curva reduzida; o desvio padrão 1.200 ao desvio padrão reduzido 1; o valor 12.000 ao valor
reduzido – 0,42 e o valor 13.500 ao valor 0,83, então podemos dizer que as duas áreas também são
correspondentes.

Observe que as áreas tabeladas são sempre as que estão entre a extrema esquerda e o valor de z, o
que não ocorre nesse caso. Assim sendo, temos que efetuar um raciocínio que permita o cálculo.

186
ESTATÍSTICA

Note que, se entrarmos na tabela com o valor de z igual a – 0,42 iremos obter a área 0,3372. Essa
área é a localizada à esquerda de z1 = - 0,42. No gráfico é a área tabelada 1 (At1).

Para o valor z2 igual a 0,83, a área obtida é 0,7967. Essa área está à esquerda de z2. No gráfico é a
área tabelada 2 (At2).

Tabela 76

Z 0 1 2 3 4 5 6 7 8 9
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133

Perceba que a área de 0,7967 nada mais é do que a área 0,3372 mais a área cujo valor estamos
procurando, logo, o valor da área procurada é a diferença das áreas que lemos na tabela, ou seja:

Ap = A t2 − A t1 = 0,7967 − 0,3372 = 0,4595 ou 45,95%

Portanto a probabilidade de que num mês qualquer se produza entre 12.000 e 13.500 é de 45,95%.

As questões a seguir serão resolvidas sem mostrarmos os gráficos e tabela, já que são repetitivos em
relação aos três anteriores.

D) Uma produção mensal que esteja entre 13.000 e 15.000 toneladas.

Como desejamos calcular uma probabilidade e, consequentemente, uma área entre dois valores,
devemos calcular a área à esquerda de cada um deles e depois subtrair a menor da maior:

x − µ 13.000 − 12.500
z1 = = = 0,42 → tabela → A t1 = 0,6628
σ 1.200

x − µ 15.000 − 12.500
z2 = = = 2,08 → tabela → A t2 = 0,9812
σ 1.200

Ap = A t2 − A t1 = 0,9812 − 0,6628 = 0,3184 = 31,84%

A probabilidade de num determinado mês serem produzidas entre 13.000 e 15.000 toneladas de
produto químico será de 31,84%.

E) Uma produção mensal que seja inferior a 14.200 toneladas.

Como desejamos calcular a probabilidade de a produção ser inferior a 14.200 toneladas, basta
calcular a área à esquerda do valor de z correspondente:
187
Unidade III

x − µ 14.200 − 12.500
z= = = 1,42 → tabela → A t = 0,9222
σ 1.200

Ap = A t = 0,9222 ou 92,22%

A probabilidade de num determinado mês serem produzidos menos de 14.200 toneladas de produto
químico é de 92,22%.

F) Uma produção mensal que seja superior a 10.000 toneladas.

Como desejamos a probabilidade de a produção ser superior a 10.000 toneladas, devemos calcular a
área à esquerda do valor de z correspondente e tirá-la de 1:

x − µ 10.000 − 12.500
z= = = −2,08 → tabela → A t = 0,0188
σ 1.200

Ap = 1 − A t = 1 − 0,0188 = 0,9812 ou 98,12%

Portanto, a probabilidade de num determinado mês serem produzidas mais de 10.000 toneladas de
produto químico é de 98,12%.

8.3 Cálculo das condições correspondentes a probabilidades da curva normal

No exercício do item anterior verificamos como se calcula a probabilidade de ocorrência de um evento


que segue a distribuição normal (os mais comuns dos eventos). Ocorre que muitas vezes precisamos
fazer o cálculo ao contrário, ou seja, saber qual é o valor de uma determinada probabilidade e quais os
valores que a definem.

A questão a seguir demonstra esse raciocínio e os cálculos decorrentes.

Exemplo 1

Uma oficina automotiva efetua seus consertos no tempo médio de 45 minutos com desvio padrão
de oito minutos, normalmente distribuído. Nessas circunstâncias pergunta-se:

• Qual é a previsão de tempo de trabalho que a oficina deve passar ao cliente para que tenha 90%
de probabilidades de efetuar o trabalho dentro do prazo?

• Qual é a previsão de tempo de trabalho que a oficina deve passar ao cliente para que tenha no
máximo 30% risco de efetuar o trabalho fora do prazo?

188
ESTATÍSTICA

Resolução da primeira questão

Observe a figura a seguir. A área sombreada corresponde a 90% da área total e é limitada pelo valor z,
que desejamos achar. O problema se resolve obtendo na tabela o valor de z correspondente a uma área
de 90% ou aproximada. Note, portanto, que utilizamos a tabela no sentido oposto que fizemos nos
exercícios anteriores.

P (z)

Ad = At = 90% ou 0,9000

Z
-4 -3 -2 -1 0 1 2 3 4
z=?

Figura 54

Tabela 77 – Valor mais próximo na tabela de 0,9000 (90%)

Z 0 1 2 3 4 5 6 7 8 9
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830

1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015

1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177

Portanto, para que a área sombreada tenha o valor de 90%, é necessário que z seja igual a 1,28,
correspondente à área de 0,8997 (valor da tabela mais próximo de 0,9000 ou 90%).

Tendo esse valor, é só aplicar a fórmula de conversão devidamente adaptada:

x−µ
z= ∴ x = µ + zσ → x = 45 + (1,28) × 8 → x = 55,24
σ

Dessa maneira, se a oficina estimar em 55,24 minutos o tempo de conserto, ela terá uma probabilidade
de 90% de não ultrapassar o tempo.

189
Unidade III

Resolução da segunda questão

O cálculo é semelhante ao item anterior, com a diferença de que a área dada está à direita do gráfico,
como mostra a figura.

P (z)

At = 1 - Ad = 1 - 0,3000 = 0,7000

Ad = 30% ou 0,3000

Z
-4 -3 -2 -1 0 1 2 3 4
z=?

Figura 55

Por causa disso, devemos entrar na tabela com a área de 70%. Lembre-se de que todas as áreas
tabeladas começam na extremidade esquerda da curva. Para uma área de 70%, o valor de z deverá
ser 0,52, portanto:

x −µ
z= ∴ x = µ + zσ → x = 45 + ( 0,52 ) × 8 → x = 49,16
σ

Dessa maneira, se a oficina estimar em 49,16 minutos o tempo de conserto, ela terá uma probabilidade
de 70% de não ultrapassar o tempo, ou seja, um risco de 30% de não cumprir ao prometido.

Exemplo de aplicação

A empresa Doces Venenos S.A. produz e comercializa o produto químico environmental detonation,
conhecido pela sigla ED. As vendas mensais do ED são normalmente distribuídas com média de 1.000
caixas e desvio padrão de 200 caixas. As quantidades mensais produzidas também se distribuem
normalmente com média de 1.200 caixas e desvio padrão de 300 caixas. Nessas condições apresentadas
deseja-se saber:

• Qual é a probabilidade de vender mais do que 1.500 caixas em um determinado mês?


• Qual é a probabilidade de produzir menos do que 850 caixas em um determinado mês?
• Qual é o valor máximo de vendas ocorrido em 15% dos piores meses (naqueles em que
menos se vende)?
190
ESTATÍSTICA

• Qual a produção mínima ocorrida em 25% dos melhores meses (naqueles em que mais se produz)?

• Em determinado mês as vendas foram limitadas pela empresa a 700 caixas. Qual a probabilidade
de faltar produto para ser entregue aos clientes?
• Em determinado mês, a produção foi orientada a produzir exatamente 1.200 caixas. Qual a
probabilidade de faltar produto?

• Considerando que não sejam feitas limitações externas de qualquer tipo, qual a probabilidade de
se gerar estoques em algum mês em particular?

Resolução

A probabilidade de se venderem mais do que 1.500 caixas é dada por uma área da curva normal à
direita da desse valor. Portanto, devemos localizar na tabela a área à esquerda do valor de z e tirar de 1
(ou 100%). Assim temos:

x − µ 1.500 − 1.000
z= = = 2,50 → A t = 0,9938
σ 200

Ap = 1 − A t = 1 − 0,9938 = 0,0062 ou 0,62%

A probabilidade de que se venda mais do que 1.500 caixas de ED é de apenas 0,62%.

A probabilidade de se produzirem menos que 850 caixas num mês é dada por uma área à esquerda
do valor, portanto, basta calcular a área tabelada.

x − µ 850 − 1.200
z= = = −1,17 → A t = 0,1210
σ 300

Ap = A t = 0,1210 ou 12,10%

Existe uma probabilidade de 12,10% que em um determinado mês sejam produzidas menos do que
850 caixas de produto.

Os piores meses de vendas estão localizados do lado esquerdo da curva normal das vendas. Os 15%
piores meses correspondem a uma área de 0,1500 à esquerda cujo valor da variável reduzida limitante
é z = -1,04 (valor mais aproximado correspondente na verdade a uma área de 0,1492). Com esses dados
podemos calcular o valor máximo de vendas que ocorre nesses piores meses.

x = µ + zσ = 1.000 + ( −1,04 ) × 200 = 792 caixas

Nos 15% piores meses de vendas a empresa vende 792 caixas ou menos.
191
Unidade III

Os melhores meses de produção estão localizados do lado direito da curva normal de produção,
e 25% dos melhores meses de produção correspondem a uma área de 0,2500 à direita. Essa área não é
tabelada, mas, se tirarmos ela de 1 (ou 100%), encontraremos a área tabelada.

A t = 1 − A d = 1 − 0,2500 = 0,7500 → tabela → z = 0,67

x = µ + zσ = 1.200 + ( 0,67) × 300 = 1.401 caixas

Em 25% dos melhores meses de produção a empresa produz no mínimo 1.401 caixas de produto.

A empresa limitou as vendas em determinado mês a 700 caixas. Isso significa que ela terá de produzir
700 caixas ou mais para que nenhum cliente fique sem ser atendido. A probabilidade de que a empresa
produza menos do que 700 caixas é de:

x − µ 700 − 1.200
z= = = −1,67 → A t = 0,0475
σ 300

Ap = A t = 0,0475 ou 4,75%

Existe uma probabilidade de 4,75% de que a empresa, mesmo tendo vendido pouco, não consiga
atender a todos os clientes porque sua produção foi excepcionalmente ruim.

A produção está limitada a exatamente 1.200 caixas, logo não pode ser vendida mais do que essa
quantidade, sob o risco de não se atender a todos os pedidos. A probabilidade de que isso ocorra é:

x − µ 1.200 − 1.000
z= = = 1,00 → A t = 0,8413
σ 200

Ap = 1 − A t = 1 − 0,8413 = 0,1587 ou 15,87%

Nessas condições, existe uma probabilidade de 15,87% de que se venda mais do que a produção
fixada e nem todos os clientes sejam atendidos.

Estoque, nesse contexto, é definido como a diferença entre produção e vendas. Numa situação
que não houvesse variações, o estoque seria calculado simplesmente subtraindo o volume vendido do
valor produzido, ou seja, o estoque gerado mensalmente seria de 200 caixas (1.200 produzidas menos
1.000 vendidas).

Ocorre, no entanto, que existem variações, caracterizadas pelos desvios padrões e elas têm de ser
consideradas. Em um mês pode-se vender muito mais e produzir muito menos e aí o estoque seria
menor ou inexistente ou, ao contrário, produzir muito mais e vender menos, gerando estoques maiores.
192
ESTATÍSTICA

Essa análise é feita através da distribuição normal, como mostra a figura a seguir:
Produção Vendas Estoque

σP = 300 σV = 200 σE = 3002 + 2002 = 361

# P>V(gera estoque)
P<V(falta produto)
#
0
µP = 1.200 µV = 1.000 µE = µp - µV = 1.200 - 1.000 = 200

Figura 56

O comportamento estatístico tanto das vendas como da produção são distribuições normais e
consequentemente o comportamento dos estoques também o será. O cálculo da média esperada de
estoques é intuitivo. É a diferença entre o que é produzido e o que é vendido:

µE = µP − µ V = 1.200 − 1.000 = 200

Já o cálculo do desvio padrão dos estoques necessita de duas observações.

Os efeitos dos desvios padrões se somam, e não se subtraem. Um desvio padrão é a expressão das
variações ocorridas num processo qualquer (no caso produção e vendas). Essas variações evidentemente
se somam e não se subtraem. Uma subtração imaginaria a compensação dos problemas de um
processo pelos do outro.

O desvio padrão toma os desvios ao quadrado, então a soma deles deve ser considerada com o
mesmo critério.

Assim temos:

σE = σP2 + σ2V = 3002 + 2002 = 361

A partir daí seguimos os cálculos já feitos anteriormente. Como desejamos calcular a probabilidade
de gerar estoques devemos calcular a área acima de 0 (zero seria a situação em que não sobraria nem
faltaria produto). A área sombreada, portanto, corresponde à probabilidade de gerar estoque e segue os
cálculos conhecidos.

x − µ 0 − 200
z= = = −0,55 → tabela → A t = 0,2912
σ 361

P (gerar estoques ) : Ap = 1 − A t = 1 − 0,2912 = 0,7088 ou 70,88%

Existem 70,88% de probabilidade de a operação dessa empresa gerar estoque.

193
Unidade III

Observação

Quando a empresa limita suas vendas, o atendimento depende da


produção, visto que as vendas estão fixadas. Já quando a produção está
fixada, o atendimento ao cliente é dado pela variação de vendas. Ou seja,
quem limita as vendas é a produção e quem limita a produção são as vendas.

194
ESTATÍSTICA

Resumo
Distribuições de probabilidades são modelos matemáticos que
descrevem fenômenos que são em alguma medida dependentes do acaso, da
aleatoriedade. Apesar de originalmente elas terem sido estudadas visando
o entendimento dos jogos de azar, são ferramentas que podem nos ajudar
a prover situações futuras nas diversas áreas do conhecimento humano.

Usamos as distribuições de probabilidades para pesquisar aspectos


administrativos, econômicos e contábeis, para ficar na nossa área de
concentração, mas praticamente em todos os aspectos profissionais e
científicos elas são utilizadas.

Existem diversas distribuições de probabilidade, cada uma delas


destinada a fenômenos específicos. Determinar qual delas usar é a primeira
tarefa a ser executada. A primeira característica a ser observada é a natureza
da variável estatística, se discreta ou contínua. Ainda que no limite as
distribuições para variáveis discretas possam ser aproximadas pela normal
nos casos de amostras de menor quantidade de elementos, devemos usar a
distribuição específica.

A distribuição de probabilidades normal, destinada a variáveis contínuas,


é a mais utilizada de todas as distribuições. Entre as destinadas às variáveis
discretas se sobressaem as distribuições binomial e de Poisson.

Além da natureza da variável envolvida, outras características devem ser


analisadas na escolha do modelo matemático a ser usado: independência
dos eventos; complementariedade dos eventos; possibilidade ou não de
contar sucessos e falhas etc.

Diante de uma situação problema, identificando-se a distribuição de


probabilidades adequada e as medidas estatísticas pertinentes, podemos
determinar as probabilidades de uma ocorrência ou então o valor
correspondente a determinada probabilidade.

Assim poderemos determinar com boa margem de acerto o resultado


de uma eleição, ou então a produtividade esperada de um processo, ou o
índice de inflação no próximo período ou ainda as necessidades de capital
de giro de uma empresa.

Grande parte das decisões que um profissional deve tomar, portanto,


são facilitadas ou até possibilitadas a partir de pesquisa estatísticas que
envolvem os modelos matemáticos estudados.
195
Unidade III

Exercícios

Questão 1. Um dado honesto é lançado três vezes. A probabilidade de que, nesses três lançamentos,
obtenhamos a face 1 duas vezes é aproximadamente igual a:

A) 0,50.

B) 0,25.

C) 0,18.

D) 0,07.

E) 0,03.

Resposta correta: alternativa D.

Análise da questão

O dado honesto tem seis faces, numeradas de 1 a 6.

Vamos considerar as situações a seguir.

Sucesso (S): ocorrência da face 1 no lançamento do dado.

Fracasso (F): não ocorrência da face 1 no lançamento do dado.

Em cada lançamento do dado honesto, temos o que segue.

Probabilidade de sucesso (p): p = 1/6.

Probabilidade de fracasso (q): q = 1 - p = 1 - 1/6 → q=5/6

O espaço amostral Ω da situação em estudo é o que segue.

Ω = {SSS, SSF, SFS, SFF, FSS, FSF, FFS, FFF}

Queremos conhecer o número total de sucessos, que corresponde ao número de vezes em que temos
a face 1 em três lançamentos de um dado honesto. Para isso, construímos a árvore de probabilidades
mostrada na figura a seguir.

196
ESTATÍSTICA

p S

p S q F

S p S
p q
F q F
p S

q p S q F

F p S
q
F q F

Figura 57 – Árvore de probabilidades para a situação em estudo

Pela análise da árvore de probabilidades, podemos construir a tabela a seguir, em que X representa o
número de sucessos. Nela, indicamos a probabilidade procurada em negrito, que equivale a p (X=2) = 0,0694.
Ou seja, a probabilidade solicitada pelo enunciado é aproximadamente igual a 0,07.

Tabela 78 – Número de sucessos e probabilidade

Evento(s) X (n. de sucessos) Probabilidade


FFF 0 q =(5/6)3 = 0,5787
3

SFF, FSF, FFS 1 3pq2 = 3(1/6)(5/6)2 = 0,3472


SSF, SFS, FSS 2 3p2q = 3(1/6)2(5/6) = 0,0694
SSS 3 p3 = (1/6)3 = 0,0046

Alternativamente, poderíamos ter resolvido o problema usando o modelo de probabilidade binomial,


em que procuramos a X=2 sucessos em n=3 ensaios de Bernoulli independentes e com a mesma
probabilidade p=1/6 de sucesso. Nesse modelo, fazemos o cálculo a seguir.

 n!  k n−k
P(X = k) =  pq
 k! (n − k )! 

2 1
 3!   1   5 
P(X = 2) =     
 2! (3 − 2)!   6   6 

3!  1  5  3.2!  1  5  5
P(X = 2) =    =    = = 0,0694 ≅ 0,07
2!1!  36  6  2!  36  6  72

197
Unidade III

Questão 2. (Enade 2014) Suponha que a distância percorrida por um ciclista que pedala regularmente
pode ser inferida pela variável aleatória x, com densidade de probabilidade normal, tal que:


( x −µ )2
1 2σ2
f(x : µ, σ2 ) = e
2πσ2

Na expressão, temos μ=25 km e σ2=25 km2. A duração média do seu treino é de 1h15min.

Com base nesses dados, avalie as afirmativas:

I – A velocidade média de cada treino é de 21,7 km/h.

II – A distância média percorrida em cada treino é de 25 km.

III – A área média percorrida em cada treino é de 25 km2.

IV – A distância percorrida de cada treino, em um desvio padrão, está entre 20 km e 30 km.

V – A velocidade média de cada treino, em um desvio padrão, está entre 16 km/h e 24 km/h.

É correto apenas o que se afirma em:

A) I.

B) I e IV.

C) II e III.

D) III e V.

E) II, IV e V.

Resposta correta: alternativa E.

Análise das afirmativas

Antes de fazermos a análise das afirmativas, precisamos lembrar que a distribuição normal de
probabilidades é uma curva em formato de sino dada por:


( x −µ )2
1 2σ2
f(x : µ, σ2 ) = e
2πσ2

198
ESTATÍSTICA

Na expressão, μ é o valor médio da distribuição e σ é seu desvio padrão.

O valor médio está associado ao pico da distribuição normal e é o valor mais frequente. O desvio
padrão está relacionado à largura da curva da distribuição de probabilidades e, consequentemente, ao
“espalhamento” dos dados em torno da média.

No caso da distribuição normal, conforme indicado na figura a seguir, temos que:

• a probabilidade de se obter um dado no intervalo μ±σ é de 68%;

• a probabilidade de se obter um dado no intervalo μ±2σ é de 95%;

• a probabilidade de se obter um dado no intervalo μ±3σ é superior a 99%.

0,13% 0,13%
2,14% 13,60% 34,13% 34,13% 13,60% 2,14%

-3 -2 -1 0 1 2 3
Desvios padrões

Figura 58 – Distribuição normal com indicação de probabilidades

I – Afirmativa incorreta.

Justificativa: a velocidade média é a razão entre o espaço percorrido e o tempo gasto nesse trajeto.
Logo, no caso em estudo, a velocidade média é a razão entre a distância média de 25 km e o tempo de
1h15min (1,25 h) gasto no percurso, conforme segue.

µ 25
v= = = 20km / h
∆t 1,25

199
Unidade III

II – Afirmativa correta.

Justificativa: a média da distribuição de probabilidades é μ=25 km. Logo, a distância média percorrida
em cada treino é igual a esse valor.

III – Afirmativa incorreta.

Justificativa: o problema não faz referência alguma à área, já que a quantidade σ2=25 km2 representa
a variância, ou seja, o quadrado do desvio padrão dos dados.

IV – Afirmativa correta.

Justificativa: a distância percorrida em cada treino, considerando-se um desvio padrão, está no


intervalo μ±σ, ou seja, 25±5 km. Logo, a distância percorrida em cada treino, nessa situação, está
entre 20 km e 30 km.

V – Afirmativa correta.

Justificativa: considerando-se o intervalo de um desvio padrão, a velocidade média em cada treino


pode ser calculada conforme segue.

   25  5
v  
t 1, 25
25  5 25  5
v1   24 km / h e v2   16 km / h
125
, 1, 25

Logo, a velocidade média, nessa situação, está entre 16 km/h e 24 km/h.

200
REFERÊNCIAS

Audiovisuais

MONEYBALL. Direção: Bennett Miller. Estados Unidos: Columbia Pictures, 2011. 133 min.

QUEBRANDO a banca. Direção: Robert Luketic. Estados Unidos: Relativity Media, 2008. 123 min.

Textuais

AGRA, A. A. Estatística básica. Campinas: Ourograf, 2003.

AGRESTI, A.; FINLAY, B. Métodos estatísticos para ciências sociais. 4. ed. Porto Alegre: Penso, 2012.

ALBIERI, S. Pesquisas por amostragens: política de divulgação de estimativas com baixa precisão
amostral. In: V CONFERÊNCIA NACIONAL DE ESTATÍSTICA (Confest), 5., 2006, Rio de Janeiro. Rio de
Janeiro: IBGE, 2006. Disponível em: https://bit.ly/3TvQy6m. Acesso em: 27 out. 2022.

ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística aplicada à administração e economia.


2. ed. São Paulo: Thomson Learning, 2007.

APRENDENDO GESTÃO. Árvores de decisão: exemplo completo. [s.d.]. Disponível em: https://bit.ly/3EmH4pE.
Acesso em: 3 nov. 2022.

BARROW, M. Estatística para economia, contabilidade e administração. São Paulo: Ática, 2007.

BRAULE, R. Estatística aplicada com Excel para os cursos de administração e economia.


Rio de Janeiro: Elsevier, 2001.

BRUNI, A. B. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2013.

BUSSAB, W. O.; MORETIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, 2004.

CASELLA, G.; BERGER, R. L. Inferência estatística. São Paulo: Cengage Learning, 2010.

CHIARETTI, M. Uma questão de inteligência: livro A curva normal não é científico. SuperInteressante,
31 jan. 1995. Disponível em: https://bit.ly/3tm4oNN. Acesso em: 28 out. 2022.

COSTA, G. G. O. Curso de estatística básica: teoria e prática. São Paulo: Atlas, 2011.

COSTA, G. G. O. Curso de estatística inferencial e probabilidades: teoria e prática. São Paulo: Atlas, 2012.

COSTA NETO, P. L. O. Estatística. São Paulo: Edgard Blücher, 1977.

201
COSTA NETO, P. L. O.; CYMBALISTA, M. Probabilidades. São Paulo: Edgard Blücher, 1974.

CRESPO, A. A. Estatística fácil. 17. ed. São Paulo: Saraiva, 2001.

DOWNING, D.; CLARK, J. Estatística aplicada. 2. ed. São Paulo: Saraiva 2003.

FERREIRA, A. B. H. Novo Aurélio século XXI: o dicionário da língua portuguesa. Rio de Janeiro, Nova
Fronteira, 1999.

FONSECA, J. S.; MARTINS, G. A.; TOLETO, G. L. Estatística aplicada. São Paulo: Atlas, 1995.

GUERRA, M.; GUERRA, M. J.; DONAIRE, D. Estatística aplicada. São Paulo: Ciência e Tecnologia, 1991.

HOUAISS, A. Dicionário Houaiss de língua portuguesa. Rio de Janeiro: Objetiva, 2009.

IBGE. Índice Nacional de Preço ao Consumidor – IPCA. [s.d.]. Disponível em: https://bit.ly/3E3O2yv.
Acesso em: 29 out. 2022.

IGNACIO, S. A. Importância da estatística para o processo de conhecimento e tomada de decisão.


Revista paranaense de desenvolvimento, Curitiba, n. 118, p. 175-192, jan./jun. 2010

JOHNSON, R.; KUBY, P. Estat. São Paulo: Cegange Learning, 2013.

KAZMIER, L. J. Estatística aplicada à economia e administração. São Paulo: Makron Books, 1982.

KUNE, H. Métodos estatísticos para a melhoria da qualidade. São Paulo: Gente, 1993.

LAPPONI, J. A. Estatística usando Excel. 4. ed. Rio de Janeiro: Elsevier, 2005.

LARSON, R.; FARBER, B. Estatística aplicada. 2. ed. São Paulo: Prentice Hall, 2004.

LEVINE, D. M.; BERENSON. M. L.; STEPHAN, D. Estatística: teoria e aplicações. Rio de Janeiro:
LTC, 2000.

LEWIS, M. Moneyball: o homem que mudou o jogo. Rio de Janeiro: Intrínseca, 2015.

MARTINS, G. A. Estatística geral e aplicada. 2. ed. São Paulo: Atlas, 2002.

MARTINS, G. A.; DONAIRE, D. Princípios de estatística. 4. ed. São Paulo: Atlas, 1990.

MARTINS, G. A.; DOMINGUES, O. Estatística geral e aplicada. 5. ed. São Paulo: Atlas, 2014.

MATOS, O. C. Econometria básica: teoria e aplicações. 2. ed. São Paulo: Atlas, 1997.

202
MAXIMIANO, A. C. A. Introdução à administração. 2. ed. c. rev. e at. São Paulo: Atlas, 2011.

MEDEIROS, E. et al. Estatística para os cursos de economia, administração e ciências contábeis. 4. ed.
São Paulo: Atlas, 2010. (v. 1 e 2)

MEDEIROS, E. et al. Tabelas de estatística para os cursos de economia, administração e ciências


contábeis. 2. ed. São Paulo: Atlas, 1999.

MEYER, P. L. Probabilidade: aplicações à estatística. Rio de Janeiro: LTC, 1976.

MILONE, G.; ANGELINI, F. Estatística aplicada. São Paulo: Atlas, 1995.

MOORE, D. A estatística básica e sua prática. Rio de Janeiro: LTC, 2000.

MOORE, D. et al. A prática da estatística empresarial: como usar dados para tomar decisões.
Rio de Janeiro: LTC, 2006.

NEUFELD, J. L. Estatística aplicada à administração usando Excel. São Paulo: Pretince Hall, 2003.

NOVAES, D. V.; COUTINHO, C. Q. S. Estatística para educação profissional. São Paulo: Atlas, 2009.

OLIVEIRA, E. Enigma da vitória-régia vira exemplo em vídeo que explica o que é o crescimento
exponencial da pandemia. G1., 10 abr. 2020. Disponível em: http://glo.bo/3G9gp0D. Acesso em:
3 nov. 2022.

PORTAL DO GOVERNO. Conheça Atibaia, a cidade que tem o 2º melhor clima do mundo. 31 dez. 2009.
Disponível em: https://bit.ly/3Ur8Mai. Acesso em: 27 out. 2022.

ROCHA, S. Estatística geral e aplicada para os cursos de engenharia. São Paulo: Atlas, 2014.

SARTORIS, A. Estatística e introdução à econometria. São Paulo: Saraiva, 2003.

SMAILES, J.; MCGRANE, A. Estatística aplicada à administração com Excel. São Paulo: Atlas, 2002.

SPIEGEl, M. R. Estatística. São Paulo: Makron Books, 1993.

STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Habra, 1981.

TIBONI, C. G. R. Estatística básica: para os cursos de administração, ciências contábeis, tecnológicos e


de gestão. São Paulo: Atlas, 2010.

TRIOLA, M. F. Introdução à estatística: atualização da tecnologia. 11. ed. Rio de Janeiro: LTC, 2015.

WITTE, R. S.; WITTE, J. S. Estatística. 7. ed. Rio de Janeiro: LTC, 2005.


203
ANEXO

Áreas sob a curva normal reduzida


Valores da variável reduzida negativos - Área entre -3,99 e z
y

Z 0 1 2 3 4 5 6 7 8 9
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641

204
Áreas sob a curva normal reduzida
Valores da variável reduzida positivos - Área entre z e 3,99
y

Z 0 1 2 3 4 5 6 7 8 9
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

205
206
207
208
Informações:
www.sepi.unip.br ou 0800 010 9000

Você também pode gostar