Estatística Basica - Leandro

Graduação
PEDAGOGIA COM EDUCAÇÃO ESPECIAL

II - SEMESTRE
DISCIPLINA: ESTATÍSTICA BÁSICA
PROFESSOR: LEANDRO RAMOS FURTADO
Ano: 2024
Sumário
1 Conceitos básicos
1.1 População x Amostra
1.2 Censo x Amostragem
1.3 Dado x Variável
1.4 Parâmetros x estatísticas
1.5 Arredondamento de dados
1.6 Fases do método estatístico
2 Representação tabular
2.1 Representação esquemática
2.2 Elementos de uma tabela
2.3 Séries estatísticas
2.4 Distribuição de frequência
3 Representação gráfica
3.1 Gráficos de Linhas
3.2 Gráficos de colunas ou barras
3.3 Gráficos circulares ou de Setores (Pie Charts)
3.4 Gráfico Pictorial - Pictograma
3.5 Gráfico Polar
3.6 Cartograma
3.7 Gráficos utilizados para a análise de uma distribuição de frequência
4 Medidas descritivas
4.1 Medidas de posição
4.2 Medidas de variabilidade ou dispersão
4.3 Medidas de dispersão relativas
4.4 Momentos, assimetria e curtose
4.5 Exercícios
5 Probabilidade e variáveis aleatórias

5.1 Modelos matemáticos
5.2 Conceitos em probabilidade
5.3 Conceitos de probabilidade
5.4 Exercícios
5.5 Teorema de Bayes
5.6 Variáveis aleatórias
5.7 Função de probabilidade
5.8 Exemplos
5.9 Exercícios
6 Distribuições de Probabilidade
6.1 Distribuições discretas de probabilidade
6.2 Exercícios
6.2 Distribuições contínuas de probabilidade
6.4 Exercícios
7 Amostragem
7.1 Conceitos em amostragem
7.2 Planos de amostragem
6.3 Tipos de amostragem
7.4 Amostragem com e sem reposição
7.5 Representação de uma distribuição amostral
7.6 Distribuições amostrais de probabilidade
7.7 Exercícios
7.8 Estatísticas amostrais
7.9 Tamanho da amostra
8 Estimação de parâmetros
8.1 Estimação pontual
8.2 Estimação intervalar
8.3 Exercícios
9 Testes de hipóteses
9.1 Principais conceitos
8.2 Teste de significância
9.3 Exercícios
9.4 Testes do Qui-quadrado
9.5 Exercícios
10 Regressão e Correlação
10.1 Introdução
10.2 Definição
10.3 Modelo de Regressão
10.4 Método para estimação dos parâmetros α e β
10.5 Decomposição da variância Total
10.6 Análise de Variância da Regressão
10.7 Coeficiente de Determinação (r²)
10.8 Coeficiente de Correlação (r)
10.9 Exercícios
11 Referências bibliográficas
1. Conceitos Básicos
1.1 População x Amostra
• População (N): Conjunto de todos os elementos relativos a um determinado

fenômeno que possuem pelo menos uma característica em comum, a população é o
conjunto Universo, podendo ser finita ou infinita.
• Finita - apresenta um número limitado de observações, que é passível de contagem.

• Infinita - apresenta um número ilimitado de observações que é impossível de contar e geralmente
esta
Associada a processos.
• Amostra (n): É um subconjunto da população e deverá ser considerada finita, a

amostra deve ser selecionada seguindo certas regras e deve ser representativa, de
modo que ela represente todas as características da população como se fosse uma
fotografia desta.
Uma população pode, mediante processos operacionais, ser considerada infinita, pois a mesma irá
depender do tamanho da amostra. Se a frequência relativa entre amostra e população for menor do
que 5% ela é considerada infinita, se a frequência relativa for maior do 5% ela é considerada finita.
1.2 Censo x Amostragem
• Pesquisa Estatística: É qualquer informação retirada de uma população ou

amostra, podendo ser através de Censo ou Amostragem.
• Censo: É a coleta exaustiva de informações das "N" unidades populacionais.
• Amostragem: É o processo de retirada de informações dos "n" elementos

amostrais, no qual deve seguir um método criterioso e adequado (tipos de
amostragem).
1.3 Dado x Variável
• Dados estatísticos: é qualquer característica que possa ser observada ou medida

de alguma maneira. As matérias-primas da estatística são os dados observáveis.
1
• Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão,
geralmente as variáveis para estudo são selecionadas por processos de amostragem.
Os símbolos utilizados para representar as variáveis são as letras maiúsculas do
alfabeto, tais como X, Y, Z, ... que pode assumir qualquer valor de um conjunto de
dados. As variáveis podem ser classificadas dos seguintes modos:
- Qualitativas (ou atributos): São características de uma população que não
pode ser medidas.
Nominal: são utilizados símbolos, ou números, para representar determinado

tipo de dados, mostrando, assim, a qual grupo ou categoria eles pertencem.
Ordinal ou por postos: quando uma classificação for dividida em categorias
ordenadas em graus convencionados, havendo uma relação entre as categorias
do tipo “maior do que”, “menor do que”, “igual a”, os dados por postos consistem
de valores relativos atribuídos para denotar a ordem de primeiro, segundo,
terceiro e, assim, sucessivamente.
- Quantitativas: São características populacionais que podem ser quantificadas,

sendo classificadas em discretas e contínuas.
Discretas: são aquelas variáveis que pode assumir somente valores inteiros num
conjunto de valores. É gerada pelo processo de contagem, como o número de
veículos que passa em um posto de gasolina, o número de estudantes nesta sala
de aula. Contínuas: são aquelas variáveis que podem assumir um valor dentro de
um intervalo de valores. É gerada pelo processo de medição. Neste caso serve
como exemplo o volume de água em um reservatório ou o peso de um pacote de
cereal.
1.4 Parâmetros x Estatísticas
• Parâmetros: são medidas populacionais quando se investiga a população em sua

totalidade, neste caso é impossível fazer inferências, pois toda a população foi
investigada.
• Estatísticas ou Estimadores: são medidas obtidas da amostra, torna-se possível

neste caso utilizarmos as teorias inferências para que possamos fazer conclusões
sobre a população.
2
1.5 Arredondamento de Dados
Regras: Portaria 36 de 06/07/1965 - INPM ⇒ Instituto Nacional de Pesos e

Medidas.
1a) Se o primeiro algarismo após aquele que formos arredondar for de 0 a 4,

conservamos o algarismo a ser arredondado e desprezamos os seguintes. Ex.:
7,34856 (para décimos) → 7,3
2a) Se o primeiro algarismo após aquele que formos arredondar for de 6 a 9,

acrescenta-se uma unidade no algarismo a ser arredondado e desprezamos
os seguintes.
Ex.: 1,2734 (para décimos) → 1,3
3a) Se o primeiro algarismo após aquele que formos arredondar for 5, seguido
apenas de zeros, conservamos o algarismo se ele for par ou aumentamos
uma unidade se ele for ímpar, desprezando os seguintes.
Ex.: 6,2500 (para décimos) → 6,2 12,350 (para
décimos) → 12,4
Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero, aumentamos
uma unidade no algarismo e desprezamos os seguintes.
Ex.: 8,2502 (para décimos) → 8,3 8,4503 (para
décimos) → 8,5
4a) Quando, arredondarmos uma série de parcelas, e a soma ficar alterada,

devemos fazer um novo arredondamento (por falta ou por excesso), na maior
parcela do conjunto, de modo que a soma fique inalterada.
Ex.: 17,4% + 18,4% + 12,3% + 29,7% + 22,2% = 100

%
arredondando para
inteiro:
17% + 18% + 12% + 30% + 22% = 99%
3
17% + 18% + 12% + 31% + 22% = 100%
1.6 Fases do método estatístico
O método estatístico abrange as seguintes fases:
a) Definição do Problema Consiste na:
- formulação correta do problema;

- examinar outros levantamentos realizados no mesmo campo (revisão da
literatura);
- saber exatamente o que se pretende pesquisar definindo o problema
corretamente
(variáveis, população, hipóteses, etc.)
b) Planejamento
Determinar o procedimento necessário para resolver o problema:
- Como levantar informações;
- Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial).

- Cronograma, Custos, etc.
c) Coleta ou levantamento dos dados

Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer.
A coleta pode ser: Direta - diretamente da fonte; Indireta

- feita através de outras fontes.
Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no

registro de terceiros (secundários).
d) Apuração dos Dados ou sumarização

Consiste em resumir os dados, através de uma contagem e agrupamento. É um
trabalho de coordenação e de tabulação.
Apuração: manual, mecânica, eletrônica e eletromecânica.
e) Apresentação dos dados

É a fase em que vamos mostrar os resultados obtidos na coleta e na
organização.
Esta apresentação pode ser: Tabular (apresentação numérica)
4
Gráfica (apresentação geométrica)
f) Análise e interpretação dos dados

É a fase mais importante e também a mais delicada. Tirar conclusões que
auxiliam o pesquisador a resolver seu problema.
2. Representação tabular
Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado.

A elaboração de tabelas obedece à Resolução n o 886, de 26 de outubro de 1966, do
Conselho Nacional de Estatística. As normas de apresentação são editadas pela
Fundação Brasileira de Geografia e Estatística (IBGE).
2.1 Representação esquemática
Título
Cabeçalho
Corpo
Rodapé
2.2 Elementos de uma tabela
• Título: O título deve responder as seguintes questões:

- O que? (Assunto a ser representado (Fato));
- Onde? (O lugar onde ocorreu o fenômeno (local));
- Quando? (A época em que se verificou o fenômeno (tempo)).
• Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada

coluna.
• Corpo: parte da tabela composta por linhas e colunas.
• Linhas: parte do corpo que contém uma sequência horizontal de informações.
• Colunas: parte do corpo que contém uma sequência vertical de informações.
• Coluna Indicadora: coluna que contém as discriminações correspondentes aos

valores distribuídos pelas colunas numéricas.
5
• Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma
coluna.
• Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas
as notas de natureza informativa (fonte, notas e chamadas).
• Fonte: refere-se à entidade que organizou ou forneceu os dados expostos.
• Notas e Chamadas: são esclarecimentos contidos na tabela (nota - conceituação geral; chamada -
esclarecer minúcias em relação a uma célula).
2.3 Séries Estatísticas
Uma série estatística é um conjunto de dados ordenados segundo uma

característica comum, as quais servirão posteriormente para se fazer análises e
inferências.
• Série Temporal ou Cronológica: É a série cujos dados estão dispostos em

correspondência com o tempo, ou seja, varia o tempo e permanece constante o fato
e o local.
Produção de Petróleo Bruto no Brasil de 1976 a 1980 (x 1000 m³)
Anos Produção
1976 9 702
1977 9 332
1978 9 304
1979 9 608
1980 10 562
Fonte: Conjuntura Econômica (fev. 1983)
• Série Geográfica ou Territorial: É a série cujos dados estão dispostos em

correspondência com o local, ou seja, varia o local e permanece constante a época e
o fato.
População Urbana do Brasil em 1980 (x 1000)
Região Populaçã
o
Norte 3 037
Nordeste 17 568
Sudeste 42 810
Sul 11 878
Centro- 5 115
Oeste
6
Total 80 408
Fonte: Anuário Estatístico (1984)
• Série Específica ou Qualitativa: É a série cujos dados estão dispostos em

correspondência com a espécie ou qualidade, ou seja, varia o fato e permanece
constante a época e o local.
População Urbana e Rural do Brasil em 1980 (x 1000)
Localizaçã População
o
Urbana 80 408
Rural 38 566
Total 118 974
• Série Mista ou Composta: A combinação entre duas ou mais séries constituem

novas séries denominadas compostas e apresentadas em tabelas de dupla entrada. O
nome da série mista surge de acordo com a combinação de pelo menos dois
elementos.
Local + Época = Série Geográfica Temporal
População Urbana do Brasil por Região de 1940 a 1980 (x 1000)
REGIÕES
Anos
N NE SE S CO
1940 406 3 7 1 271
381 232 591
1950 581 4 10 2 424
745 721 313
1960 958 7 17 4 1 007
517 461 361
1970 1 11 28 7 2 437
624 753 965 303
1980 3 17 42 11 5 115
037 567 810 878
7
2.4 Distribuição de Frequência
É o tipo de série estatística na qual permanece constante o fato, o local e a época.

Os dados são colocados em classes preestabelecidas, registrando a frequência de
ocorrência. Uma distribuição de frequência pode ser classificada em discreta e
intervalar.
a) Distribuição de Frequência Discreta ou Pontual: É uma série de dados

agrupados na qual o número de observações está relacionado com um ponto real.
Notas do Aluno "X" na Disciplina de Estatística segundo critérios

de avaliação do DE da UFSM – 1990
Xi fi
6.3 2
8.4 3
5.3 2
9.5 3
6.5 5
Σ 15
Fonte: Departamento de Estatística (1990)
b) Distribuição de Frequências Intervalar: Na distribuição de frequência, os

intervalos parciais deverão ser apresentados de maneira a evitar dúvidas quanto à
classe a que permanece determinado elemento.
O tipo de intervalo mais usado é do tipo fechado a esquerda e aberto a direita,

representado pelo símbolo: |---.
Altura em centímetros de 160 alunos do Curso de Administração da UFSM -

1990
Altura (cm) Xi fi
150 |--- 15 154 18
8
158 |--- 16 162 25
6
166 |--- 17 170 20
4
8
174 |--- 18 178 52
2
182 |--- 19 186 30
0
190 19 194 15
8
---- 160
Elementos de uma Distribuição de Frequências:
Classe ou Classe de Frequência (K): É cada subintervalo (linha) na qual dividimos

o fenômeno.
Para determinar o número de classes a partir dos dados não tabelados, podemos
usar a Fórmula de Sturges, mas deve-se saber que existem outros métodos de
determinação do número de classes em uma tabela de frequência. O que se deseja
fazer é apenas comprimir um conjunto de dados em uma tabela, para facilitar a
visualização e interpretação dos mesmos.
n(K) = 1+ 3.3 log n , onde “n” é no de informações.
Além da Regra de Sturges, existem outras fórmulas empíricas para resolver o problema para
determinação do número de classes [n(k)], há quem prefira n(k) ≅ n . Entretanto, a verdade é que
essas fórmulas não nos levam a uma decisão final; esta vai depender na realidade de um julgamento
pessoal, que deverá estar ligado a natureza dos dados, procurando, sempre que possível, evitar
classes com frequências nulas ou frequências relativas exageradamente grandes.
Limite de Classe (li ou Li): São os valores extremos de cada classe.
li = limite inferior da i-ésima classe; Li =

limite superior da i-ésima classe;
Amplitude do intervalo de classe (h): É a
diferença entre dois limites inferiores ou
superiores consecutivos.
h = ln −ln−1 ou h = Ln − Ln−1
A amplitude do intervalo de classe deve ser constante em todo a distribuição de frequências
intervalar.
9
Amplitude total (H): É a diferença entre o limite superior da última classe e o
limite inferior da 1ª classe, ou a diferença entre último e o primeiro elemento de um
conjunto de dados postos em ordem crescente.
H = Ln −l1
Ponto médio de classe (Xi): É a média aritmética simples do limite inferior com o
limite superior de uma mesma classe.
li + Li
X i=
2
ou a partir do X1 os demais pontos médios pode ser determinado por:

Xn =Xn−1 +h
Quando substituirmos os intervalos de classes pelos pontos médios (X i), ter-se-á uma distribuição
de frequência pontual.
Frequência absoluta (fi): É a quantidade de valores em cada classe

n
n =∑fi = f1 + f2 +...+f n
i=1
Frequência Acumulada (Fi): É o somatório da frequência absoluta da i-ésima

classe com a frequência absoluta das classes anteriores, ou a frequência acumulada
da classe anterior.
n
Fn = ∑f = ni
i=1
Frequência Relativa (fri): É o quociente entre a frequência absoluta da i-ésima

classe com o somatório das frequências.
n
fri = nfi Obs.: ∑fr =1i
∑f i i=1
i=1
10
Frequência Relativa Acumulada (Fri): É o somatório da frequência relativa da i-
ésima classe com as frequências relativas das classes anteriores.
n
Frn =∑fri =1
i=1
3 Representação gráfica
Os gráficos são uma forma de apresentação visual dos dados. Normalmente,

contém menos informações que as tabelas, mas são de mais fácil leitura. O tipo de
gráfico depende da variável em questão
3.1 Gráficos de Linhas
Usado para ilustrar uma série temporal.
Produção de Petróleo Bruto no Brasil de 1976 a 1980 (x 1000 m³)

11000
10500
10000
Produção
9500
9000
8500
1976 1977 1978 1979 1980
Anos
Fonte: Conjuntura Econômica (Fev. 1983)
3.1.1 Gráfico de linhas comparativas
11
45000
40000
35000 NE
30000 N
25000 SE
20000 S
CO
15000
10000
5000
0
1940 1950 1960 1970 1980

3.2 Gráficos de colunas ou barras
Representação gráfica da distribuição de frequências. Este gráfico é utilizado

para variáveis nominais e ordinais.
Características:
- todas as barras devem ter a mesma largura
- devem existir espaços entre as barras
3.2.1 Gráfico de Colunas
Usado para ilustrar qualquer tipo de série.

50000 42810
40000
30000
Pop. 17568
20000 11878
3037 5115
10000
0
N NE SE S CO
Regiões
Fonte: Anuário
Estatístico (1984)
As larguras das barras que deverão ser todas iguais podendo ser adotado qualquer dimensão, desde
que seja conveniente e desde que não se superponham. O número no topo de cada barra pode ou não
omitido, se forem conservados, a escala vertical pode ser omitida.
3.2.2.1 Gráfico de colunas comparativas
a) Colunas Justapostas (gráfico comparativo)
12
45000
40000
35000 N
30000 NE
25000 SE
20000 S
15000
CO
10000
5000
0
1940 1950 1960 1970 1980

b) Colunas Sobrepostas (gráfico comparativo)

3.2.2 Gráfico de Barras
As regras usadas para o gráfico de barras são iguais as usadas para o gráfico de
colunas.

CO 5115
S 11878
Regiões SE 42810
NE 17568
N 3037
0 10000 20000 30000 40000 50000

População
Assim como os gráficos de Colunas podem ser construídos gráficos de barras comparativas.
3.3 Gráficos circulares ou de Setores (Pie Charts)
Representação gráfica da frequência relativa (percentagem) de cada categoria

da variável. Este gráfico é utilizado para variáveis nominais e ordinais. É uma opção ao
gráfico de barras quando se pretende dar ênfase à comparação das percentagens de
cada categoria. A construção do gráfico de setores segue uma regra de 3 simples, onde
as frequências de cada classe correspondem ao ângulo que se deseja representar em
relação a frequência total que representa o total de 360°.
Características:
13
- A área do gráfico equivale à totalidade de casos (360o = 100%);
- Cada “fatia” representa a percentagem de cada categoria
População Urbana e Rural do Brasil em 1980 (x 1000)
32%
Urban
a
Rural
68%
Fonte: Anuário
Estatístico (1984)
3.4 Gráfico Pictorial - Pictograma
Tem por objetivo despertar a atenção do público em geral, muito desses gráficos
apresentam grande dose de originalidade e de habilidade na arte de apresentação dos
dados.
Evolução da matricula no Ensino Superior no Brasil de 1968 a 1994 (x 1000)
1500
1250
1000
750
500
250
0
1968 1974 1980 1986 1990 1994
Fonte: Grandes números da educação brasileira março de 1996
3.4.1 Exemplos de pictogramas
14
Evolução da frota nacional de carros à álcool de 1979 à 1987
Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes

entrevistados no Canadá
Devastação Selvagem: extração de madeiras no Brasil
Pinus
6 ,8%
Eucalipto
Madeira 24 ,4%
nativa
68 ,8%
3.5 Gráfico Polar
15
É o tipo de gráfico ideal para representar séries temporais cíclicas, ou seja, toda
a série que apresenta uma determinada periodicidade.
4.5.1 Como construir um gráfico polar
1) Traça-se uma circunferência de raio arbitrário (preferencialmente, a um raio

de comprimento proporcional a média dos valores da série);
2) Constrói-se uma semi-reta (de preferência horizontal) partindo do ponto 0

(pólo) e com uma escala (eixo polar);
3) Divide-se a circunferência em tantos arcos forem as unidades temporais;
4) Traça-se semi-retas a partir do ponto 0 (pólo) passando pelos pontos de

divisão;
5) Marca-se os valores correspondentes da variável, iniciando pela semi-reta

horizontal (eixo polar);
6) Ligam-se os pontos encontrados com segmentos de reta;
7) Para fechar o polígono obtido, emprega-se uma linha interrompida.
Precipitação pluviométrica do município de Santa Precipitação pluviométrica do município de Santa

Maria – RS- 1999 Maria – RS- 1999
Meses Precipitação (mm)

Janeiro 174,8
Fevereiro 36,9
Março 83,9
Abril 462,7
Maio 418,1
Junho 418,4
Julho 538,7
Agosto 323,8
Setembro 39,7
Outubro 66,1
Novembro 83,3
Dezembro 201,2 Fonte: Base Aérea de Santa Maria Fonte: Base Aérea de
Santa Maria
Média = 237,31 mm
16
3.6 Cartograma
É a representação de uma carta geográfica. Este tipo de gráfico é empregado

quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com as
áreas geográficas ou políticas
Dados absolutos (população) – usa-se pontos proporcionais aos dados.
Dados relativos (densidade) – usa-se hachaduras.
Exemplo:
População da Região Sul do Brasil - 1990
Estado População (hab.) Área (m 2) Densidad

e
Paraná 9.137.700 199.324 45,8
Santa Catarina 4.461.400 95.318 46,8
Rio Grande do 9.163.200 280.674 32,6
Sul
Fonte: IBGE
População da Região Sul do Brasil – 1990 Densidade populacional da Região Sul do Brasil – 1990
Fonte: IBGE
Fonte: IBGE
17
3.7 Gráficos utilizados para a análise de uma distribuição de frequência
3.7.1 Histograma
Altura em centímetros de 160 alunos do Curso de Administração da UFSM - 1990
3.7.2 Polígono de Frequências
Fonte: Departamento
de Estatística (1990)
3.6.3 Ogivas
Altura em centímetros de 160 alunos do Curso de Administração da UFSM – 1990
Ogiva Crescente Ogiva Decrescente
18
3.7.4 Gráfico em segmentos de reta vertical
É utilizado para representar uma distribuição de frequência pontual, onde os

segmentos de reta são proporcionais às respectivas frequências absolutas.
3.7.5 Como se interpreta um histograma?
A representação gráfica da distribuição da variável, por histogramas. Este gráfico é

utilizado para variáveis contínuas.
Características:
- Cada barra representa a frequência do intervalo
respectivo; - Os intervalos devem ter a mesma amplitude; -
As barras devem estar todas juntas.
A simples observação da forma Figura 4.1 Histograma
do histograma permite algumas
conclusões.
Veja a figura 4.1. A medida dos dados está 60 no centro do
desenho. As frequências mais altas também 50 estão no
centro da figura. Nos processos industriais, 40 esta é a
forma desejável. 30
20
10
0
19
A figura 4.2 apresenta um Figura 4.2 Histograma com assimetria
histograma com assimetria positiva. A positiva
média dos dados está localizada à 60
esquerda do centro da figura e a cauda à 50
direita é alongada. Esta ocorre quando o 40
limite inferior é controlado ou quando 30
não podem ocorrer valores abaixo de 20
determinado limite. 10
0
A figura 4.3 apresenta um

histograma com assimetria negativa. A
média dos dados está localizada à direita
do centro da figura e a cauda à esquerda A figura 4.4 mostra um histograma
é alongada. Esta forma ocorre quando o em plateau, Isto é, com exceção das
limite superior é controlado ou quando primeiras e das últimas classes, todas as
não podem ocorrer valores acima de outras têm frequências quase iguais.
certo Essa forma ocorre quando se misturam
limite várias distribuições com diferentes
médias.
Figura 4.3 Histograma com assimetria Figura 4.4 Histograma em plateau

negativa
60
60 50
50 40
40 30
30 20
20 10
10 0
0
A figura 4.5 mostra um Figura 4.5 Histograma com

histograma dois picos, ou duas dois picos
com modas. As
20
frequências são baixas no centro da figura, 60 mas existem
dois picos fora do centro. Esta forma 50 ocorre
quando duas distribuições com médias bem 40 diferentes se
misturam. Podem estar misturados, por 30 exemplo, os
produtos de dois turnos de trabalho. 20
10
0
Os histogramas também mostram o grau de dispersão da variável. Veja a figura

4.6. O histograma à esquerda mostra pouca dispersão, mas o histograma à direita
mostra grande dispersão.
Figura 4.6 Histogramas com dispersões diferentes
Frequência Frequência
60 60
50 50
40 40
30 30
20 20
10 10
0 0
3.7.6 Curva de frequência – curva polida
Como, em geral, os dados coletados pertencem a uma amostra extraída de uma

população, pode-se imaginar as amostras tornando-se cada vez mais amplas e a
amplitude das classes ficando cada vez menor, o que nos permite concluir que o
contorno do polígono de frequências tende a se transformar numa curva (curva de
frequência), mostrando, de modo mais evidente, a verdadeira natureza da distribuição
da população.
Pode-se dizer, então, que, enquanto que o polígono de frequência nos dá a
imagem real do fenômeno estudado, a curva de frequência nos dá a imagem
tendenciosa.
Assim, após o traçado de um polígono de frequência, é desejável, muitas vezes,
que se faça um polim ento, de modo a mostrar o que seria tal polígono com um
número maior de dados.
Esse procedimento é claro, não nos dará certeza absoluta que a curv a polida
seja tal qual a curva resultante de um grande número de dados. Porém, pode-se afirmar
que ela assemelha-se mais a curva de frequência que o polígono de frequência obtido
de uma amostra limitada.
O polimento, geometricamente, corresponde à eliminação dos vértices da linha
poligonal. Consegue-se isso com a seguinte fórmula:
21
fant. + 2fi + fpost. fc i =
4
onde:
fci = frequência calculada da classe considerada; fi

= frequência absoluta da classe i; f ant. = frequência
absoluta da classe anterior a i; fpost. = frequência
absoluta da classe posterior a i;
Quando for em fazer o uso da curva polida convém mostrar as frequências absolutas, por
meio de um pequeno circulo, de modo que qualquer interessado possa julgar se esse ponto
se o ponto é um dado original ou um dado polido.
Altura em centímetros de 40 alunas do Curso de Enfermagem da UFSM -

1996
Altura (cm) Xi fi fci

150 |--- 154 152 4 (0+ 2 x 4 + 9)/4 =
4,25
154 |--- 158 156 9 (4 + 2 x 9 + 11)/4 =
8,25
158 |--- 162 160 11 (9 + 2 x 11 + 8)/4 =
9,75
162 |--- 166 164 8 (11 + 2 x 8 + 5)/4 =
8,00
166 |--- 170 168 5 (8 + 2 x 5 + 3)/4 =
5,25
170 |--- 174 172 3 (5 + 2 x 3 + 0)/4 =
2,75
Σ ---- 40 ---
Fonte: Departamento de Estatística (1997
22
Altura em centímetros de 40 alunas do Curso de Enfermagem da UFSM
- 1996
3.7.7 Curvas em forma de sino
As curvas em forma de sino caracterizam-se pelo fato de

apresentarem um valor máximo na região central.
Distinguem-se as curvas em forma de sino em: simétrica e

assimétrica
a) Curva simétrica
Esta curva caracteriza-se por apresentar o valor máximo no ponto

central e os pontos equidistantes desse ponto terem a mesma
frequência.
b) Curvas assimétricas
Na prática, não se encontram distribuições perfeitamente

simétricas. As distribuições obtidas de medidas reais são mais ou menos
assimétricas, em relação à frequência máxima. Assim, as curvas
correspondentes a tais distribuições apresentam a cauda de um lado da
ordenada máxima mais longa do que o outro. Se a cauda mais longa fica
31
a direita é chamada assimétrica positiva ou enviesada à direita, se a
cauda se alonga a esquerda, a curva é chamada assimétrica negativa
ou enviesada à esquerda.
Assimétrica Positiva Assimétrica Negativa
32
4 Medidas Descritivas
Tem por objetivo descrever um conjunto de dados de forma

organizada e compacta que possibilita a visualização do conjunto
estudado por meio de suas estatísticas, o que não significa que estes
cálculos e conclusões possam ser levados para a população.
Podemos classificar as medidas de posição conforme o esquema
abaixo:
4.1 Medidas de Posição
Média Aritmética
Representativas - Médias Média Geométrica
Média Harmônica
Mediana
Separatrizes Quartis
Decis
Centis ou Percentis
Dominantes Moda de Czuber

Moda de King
Moda de Pearson
4.1.1 Representativas (Médias)
São medidas descritivas que tem por finalidade representar um

conjunto de dados.
a) Média Aritmética: Amostral (X); Populacional (µ)
Dados Não Tabelados
n N
∑X i ∑X i
33
X= i=1 ou m=
i=1 n N
Dados Tabelados com Valores Ponderados
X
Média Aritmética Ponderada ( w ), (onde Wi é o peso)
Nota do aluno "X" n
1° semestre de 1994 - UFSM ∑X .W i i
Xw = i=1 n
Notas Pesos
∑W i (Xi) (Wi)
i=1
7.8 2
8.3 3
8.2 2
5.8 3
Σ 10 Fonte: Dados Hipotéticos
Distribuição de frequências
- Média Aritmética (X)
Altura em centímetros de 160 alunos do n
Curso de Administração da UFSM - 1990 ∑X .f i i
34
Altura (cm) Xi fi Xi . fi
150 |--- 15 154 18 2763,0
8
158 |--- 16 162 25 4037,5
6
166 |--- 17 170 20 3390,0
4
174 |--- 18 178 52 9230,0
2
182 |--- 19 186 30 5565,0
0
190 19 194 15 2917,55
8
---- 16 27903
0
X= i=1n
∑f i
i=1
- Características da Média Aritmética Simples
1a) A Média Aritmética Simples deverá estar entre o menor e o maior

valor observado,
Xmin.≤X≤Xmax.
2a) A soma algébrica dos desvios calculados entre os valores

observados e a média aritmética é igual a zero; desvios = d = x i
−m
n n
∑ d= ∑ (xi −m) = zero

i=1 i=1
35
3a) Somando-se ou subtraindo-se todos os valores (Xi) da série por
uma constante "k" (k ≠ 0), a nova média aritmética será igual a
média original somada ou subtraída por esta constante "k".
xi yi = x i ± k
⇓ ⇓
X Y=X±k
4a) Multiplicando-se ou dividindo-se todos os valores (Xi) da série

por uma constante
"k" (k ≠ 0), a nova média aritmética será igual a média original
multiplicada ou dividida por esta constante "k".
xi yi =xi ×k yi =xi ÷k
⇓ ⇓ ⇓
X Y=X×k Y=X÷k
b) Média Geométrica: (Xg):
A aplicação da média geométrica deve ser feita, quando os valores

do conjunto de dados considerado se comportam segundo uma
progressão geométrica (P.G.)ou dela se aproximam.
n
Xg= n ∏X
i =1
i =n X1.X2 . ... .X n
Dados Tabelados
n n
∑ f n ∑ f
Xg = i=1 i ∏X ifi = i=1 i X1f1.X2f2 . ... .Xnfn

i=
1
Usando um artifício matemático, pode-se usar para calcular a
média geométrica a seguinte fórmula:
n1
) 1 ∑
(f1.logX1+f2.logX2+...+fn.logXn n
n
fi.logXi
∑fi ∑fi i=1
36
Xg =10i=1 =10i=1
c) Média Harmônica (Xh)
É usada para dados inversamente proporcionais.
Ex.: Velocidade Média, Preço de Custo Médio
4.1.2 Emprego da média
1)Deseja-se obter a medida de posição que possui a maior

estabilidade;
2)Houver necessidade de um tratamento algébrico ulterior.
=
Xh n n = n
1 1 + 1 + ... + 1
∑ i=1 Xi X1 X2 Xn
Dados Tabelados
n
X h= ∑∑ ni=1
f
f ii = f1 f1++ ff22 ++......++f
i= 1 Xi X1 X2 Xn
Deve-se observar esta propriedade entre as médias X≥Xg ≥Xh
4.1.3 Separatrizes (Mediana, Quartis, Decis e Centis ou

Percentis)
São medidas de posição que divide o conjunto de dados em partes

proporcionais, quando os mesmos são ordenados.
37
a) Dados não tabelados
Antes de determinarmos as separatrizes devemos em primeiro

lugar encontrar a posição da mesma.
- Se o número de elementos for par ou ímpar, as separatrizes

seguem a seguinte ordem:
Posição= i(n +1)

S
 i=1 1 ≤ i ≤ 3
se for mediana S =2 se for quartis  S = 4
1 ≤ i ≤ 9 1 ≤ i ≤ 99
se for decis  =10 se for centis  S =100  S
Dados Tabelados
b) Distribuição de frequências pontual: segue a mesma

regra usada para dados não tabelados c) Distribuição de
frequências intervalar
 i.n − Fant .h
S i = l Si +  S 
f Si
onde:
Si = Md⇒ i =1; Si
= Qi ⇒ 1≤ i ≤ 3;
Si = Di ⇒ 1≤ i ≤ 9;
Si = Ci ou Pi ⇒ 1≤ i ≤ 99
⇒ limite inferior da classe que contém a separatriz;
lSi
i.n
⇒ posição da separatriz;
S
⇒ frequência acumulada da classe anterior a que contém a separatriz;
Fant
38
h ⇒ amplitude do intervalo de classe;
⇒ frequência absoluta da classe que contém a separatriz;
fSi
4.1.4 Emprego da mediana
1)Quando se deseja obter um ponto que divide a distribuição

em partes iguais;
2)Há valores extremos que afetam de uma maneira

acentuada a média;
3)A variável em estudo é salário.
4.1.5 Dominantes - Moda (Mo)
É definida como sendo a observação de maior frequência.
a) Dados não tabelados
Ex.: 3 4 4 4 5 5 6 6 7 8 ⇒ Mo = 4 (unimodal)
9
5 6 7 8 9 10 11 12 ⇒ Mo = ∃/ (amodal)
13
1 1 2 2 3 3 3 4 5 5 ⇒ Mo1 = 3 Mo2 = 5
5 (bimodal)
5 5 6 6 7 7 8 8 ⇒ Mo = ∃/ (amodal)
5 5 6 6 7 7 8 ⇒ Mo1 = 5 Mo2 = 6 Mo3 = 7 (multimodal)
Acima de 3 modas usamos o termo multimodal.

Dados Tabelados
a) Distribuição de frequências pontual
- Moda Bruta (Mob): é o ponto médio da classe de maior

frequência
Mo b = Xi
b) Distribuição de frequências intervalar
39
- Moda de Czuber (Moc): O processo para determinar a moda
usado por Czuber leva em consideração as frequências anteriores e
posteriores à classe modal.
 ⇒ 
 ∆1 .h  ∆∆21 == ffMoMo −−ffantpos

Moc = lMo + ∆1 +∆2  
onde:
l
Mo ⇒ limite inferior da classe
f
modal; Mo ⇒ frequência absoluta
da classe modal;
h ⇒ amplitude do intervalo de classe;
f
ant ⇒ frequência absoluta da classe anterior a classe
f
modal; pos ⇒ frequência absoluta da classe posterior
a classe modal;
- Moda de King (Mok): O processo proposto por King

considera a influência existente das classes anterior e posterior sobre a
classe modal. A inconveniência deste processo é justamente não levar
em consideração a frequência máxima.
Mo k = lMo + f posf pos+ fant .h
- Moda de Pearson (Mop): O processo usado por Pearson

pressupõe que a distribuição seja aproximadamente simétrica, na qual a
média aritmética e a mediana são levadas em consideração.
Mop = 3 Md - 2 X
40
Um distribuição é considerada simétrica quando X ≡ Md ≡ Mo .
4.1.6 Emprego da moda
1) Quando se deseja obter uma medida rápida e aproximada de

posição;
2) Quando a medida de posição deve ser o valor mais típico da

distribuição.
4.1.7 Posição relativa da média, mediana e moda
Quando uma distribuição é simétrica, as três medidas coincidem.

Porém, a assimetria torna-as diferentes e essa diferença é tanto maior
quanto maior é a assimetria. Assim, em uma distribuição temos:
x = Md = Mo → curva simétrica
x < Md < Mo → curva assimétrica negativa
Mo < Md < x → curva assimétrica positiva
x =Md =Mo
M od a
M ed ian a
M é di a
Mo Md x x Md Mo
4.1.8 Exercícios
Para os dados abaixo calcule: Md; Q1; Q3; D3; C70
41
1)
3 7 8 10 12 13 15 17 18 21
4 6 8 11 13 14 17 18 19 22 25
2)
Alturas dos alunos da
Turma “X” no 1o sem. de
1994 - UFSM
Alturas fi
63 15
75 25
84 30
91 20
Σ 90
Fonte: Dados Hipotéticos
3)
Alturas dos alunos da
Turma “Y” no 1o sem. de
1994 – UFSM
Alturas fi Fi
61 |--- 65 12 12
65 |--- 69 23 35
69 |--- 73 34 69
73 |--- 77 26 95
77 |--- 81 15 11
0
Σ 11 11
0 0
Fonte: Dados Hipotéticos
4.2 Medidas de Variabilidade ou Dispersão
Visam descrever os dados no sentido de informar o grau de

dispersão ou afastamento dos valores observados em torno de um valor
central representativo chamado média. Informa se um conjunto de
dados é homogêneo (pouca variabilidade) ou heterogêneo (muita
variabilidade).
42
As medidas de dispersão podem ser:
- Desvio extremo - amplitude

Absoluta - Desvio Médio
- Desvio Padrão
- Desvio quadrático - Variância
Para estudarmos as medidas de variabilidade para dados não
tabelados usaremos um exemplo prático. Supomos que uma empresa
esteja querendo contratar um funcionário, e no final da concorrência
sobraram dois candidatos para uma única vaga. Então foi dado 4 tarefas
para cada um, onde as mesmas tiveram como registro o tempo (em
minutos) de execução.
TAREFAS 1 2 3 4
OPERÁRIO 1 55 45 52 48
(TEMPO)
OPERÁRIO 2 (TEMPO 30 70 40 60
- Análise Gráfica
- Medidas de dispersão Absoluta:
- Desvio Extremo ou Amplitude de Variação (H): É a diferença

entre o maior e o menor valor de um conjunto de dados
H=Xmax−Xmin
- Desvio Médio (d ): Em virtude do ∑ (X

n
i − X )= 0, usamos para
calcular o desvio
i=1
43
médio ∑ X − X = 0, assim ficando:
n
i
i=1
Para dados não tabelados
∑ n
i 1
Xi − X
X1 − X + X2 − X +...+ Xn − X
d= = =
n n
Para dados tabelados
( )
d =∑i=n1 fi nX i − X = f1 X1 − X + f2 X2 n− X + ... + f n X n − X
∑ f∑ i fi i=1 i=1
- Desvio Quadrático ou Variância : S2 (amostra) ou σ2

(população)
Para dados não tabelados:
s 2 =∑i=n1 (X i −X)2 = (X1 −X)2 +(X2 −X)2 +...+(X n −X
) 2 n n
Xi −X
S 2 =∑i=n1 ( ) = (X −X) +(X −X) +...+(X
2 1
2
2
2
n −X)2
n−1 n−1
2 ∑ f (X
n i i − X )2 1( 1 ) 2 2( 2 ) 2 n ( n ) 2
−
s= i=1 n =fX−X+f X n X +... + f X−X
44
∑ fi ∑ fi i=1 i=1
S2 = ∑ i=1 in f (X i − X )2 = f1(X − X )2 + f2(X 2n − X )2 +...+ fn (X n −

X )2 n
1
∑ fi −1 ∑ fi −1
i=1 i=1
- Desvio Padrão: S (amostra) ou σ (população)
Para dados não tabelados:
∑ (X −X )
n
2
s = i =1
i
=
(X 1
− X ) +(X 2 −X ) +... +(X n −X )
2 2 2
n n
∑ (X −X )
n
2
S= i =1
i
=
(X 1
− X ) +(X 2 −X ) +... +(X n −X )
2 2 2
n −1 n −1
∑ f (X −X )
n
2
f 1 (X 1 −X ) + f 2 (X 2 −X ) +... + f n (X n −X )
i i 2 2 2
i =1
s = n
= n
∑f i ∑f i
i =1 i =1
∑ f (X −X )
n
2
f1 (X 1 −X ) + f 2 (X 2 −X ) +... + f n (X n −X )
i i 2 2 2
i =1
S= n
= n
∑f i
−1 ∑f i
−1
i =1 i =1
(n - 1) é usado como um fator de correção, onde devemos considerar a variância

amostral como uma
estimativa da variância populacional.
- Propriedades da Variância
1ª) Somando-se ou subtraindo-se uma constante k a cada valor observado a

variância não será alterada;
45
2ª) Multiplicando-se ou dividindo-se por uma constante k cada valor observado a
variância ficará multiplicada ou dividida pelo quadrado dessa constante.
Outra forma de calcular o desvio padrão
O desvio padrão mede bem a dispersão de um conjunto de dados,

mas é difícil de calcular. Então, você pode obter o desvio padrão através
da seguinte relação:
σˆ =
R d2
onde R é a amplitude e o valor de d2 , que depende do tamanho da

amostra, é encontrado na tabela a seguir. Este método de calcular o
desvio padrão fornece boas estimativas para amostras de pequeno
tamanho (n=4, 5 ou 6), mas perde a eficiência se n>10. De qualquer
forma, é essa relação entre a amplitude e o desvio padrão de uma
amostra que permite fazer gráficos de controle X −R.
TABELA 1: - Fatores para construir um gráfico de controle
n 2 3 4 5 6 7 8 9 10 11 12 13 14
d2 1,12 1,693 2,05 2,32 2,534 2,70 2,84 2,97 3,078 3,17 3,258 3,33 3,40
8 9 6 4 7 0 3 6 7
n 15 16 17 18 19 20 21 22 234 24 25 --- ---
d2 0,34 3,532 3,53 3,64 3,689 3,73 3,77 3,81 3,858 3,39 3,391 --- ---
7 2 0 5 8 9 1
Fonte: Montgomery, D.C. Statical Quality Control. Nova York, Wyley. 1991.
4.3 Medidas de Dispersão Relativa
- Variância relativa
Relativ
a
- Coeficiente de Variação (Pearson)
É a medida de variabilidade que em geral é expressa em

porcentagem, e tem por função determinar o grau de concentração dos
dados em torno da média, geralmente utilizada para se fazer a
46
comparação entre dois conjuntos de dados em termos percentuais, esta
comparação revelará o quanto os dados estão próximos ou distantes da
média do conjunto de dados.
- Variância Relativa
V.R.=σ22 ou S22 µ
X
- Coeficiente de Variação de Pearson
σ S
C.V. = ou x 100 µ
X
C.V. ≤ 50% ⇒ a média é representativa

C.V. ≅ 0 ⇒ é a maior representatividade da média (S = 0)
4.4 Momentos, assimetria e curtose
As medidas de assimetria e curtose complementam as medidas de

posição e de dispersão no sentido de proporcionar uma descrição e
compreensão mais completa das distribuições de frequências. Estas
distribuições não diferem apenas quanto ao valor médio e à
variabilidade, mas também quanto a sua forma (assimetria e curtose).
Para estudar as medidas de assimetria e curtose, é necessário o

conhecimento de certas quantidades, conhecidas como momentos.
4.4.1 Momentos
São medidas descritivas de caráter mais geral e dão origem às

demais medidas descritivas, como as de tendência central, dispersão,
assimetria e curtose. Conforme a potência considerada tem-se a ordem
ou o grau do momento calculado.
- Momentos simples ou centrados na origem (mr)
O momento simples de ordem “r” é definido como:
∑X r
m r= i
, para dados não
n tabelados;
47
∑X r
f para dados
m r= i i , tabelados.
∑f i
onde:
r é um número inteiro
positivo; m0 = 1; m1 =
média aritmética.
- Momentos centrados na média (Mr)
O momento de ordem “r” centrado na média, é definido como:
∑(X − X) ∑d
i
r r
i
M r= = , para dados não-tabelados n

n
∑(X − X) f =∑d f , para dados tabelados

i r i ir i
M r=
∑f i n
onde: M0 = 1;
M1 = 0;
M2 = variância (s2).
- Momentos abstratos (αr)
São definidos da seguinte forma:
αr = Mr
sr
onde: s = desvio padrão.
4.4.2 Assimetria
Uma distribuição de valores sempre poderá ser representada por

uma curva (gráfico). Essa curva, conforme a distribuição, pode
apresentar várias formas. Se considerarmos o valor da moda da
distribuição como ponto de referência, vemos que esse ponto sempre
corresponde ao valor de ordenada máxima, dando-nos o ponto mais alto
48
da curva representativa da distribuição considerada, logo a curva será
analisada quanto à sua assimetria.
- Distribuição Simétrica: É aquela que apresenta a X ≡ Mo ≡ Md e os

quartis Q1 e Q3 equidistantes do Q2.
X ≡ Mo ≡ Md
- Distribuição Assimétrica Mo < Md <

X
Assimétrica
Negativa
Assimétrica
Positiva
X<
Md <
Mo
Podemos medir a assimetria de uma distribuição, calculando os
coeficientes de assimetria. Sendo o mais utilizado o Coeficiente de
Assimetria de Pearson.
As = X − Mo
S
- Se As < 0 ⇒ a distribuição será Assimétrica Negativa;
- Se As > 0 ⇒ a distribuição será Assimétrica Positiva;
- Se As = 0 ⇒ a distribuição será Simétrica.

Quando não tivermos condições de calcularmos o desvio padrão podemos usar a
seguinte fórmula:
As= Q3 +Q1−2Md
49
Q3− Q1
- Coeficiente momento de assimetria ( α3): É o terceiro

momento abstrato.
α3 = Ms33
O campo de variação do coeficiente de assimetria é: -1 ≤ α3 ≤ +1
- Intensidade da
assimetria:
|α3 | < 0,2 ⇒ simetria;
0,2 < |α3| < 1,0 ⇒ assimetria

fraca;
|α3| > 1,0 ⇒ assimetria
forte.
4.4.3 Curtose
Já apreciamos as medidas de tendência central, de dispersão e de

assimetria. Falta somente examinarmos mais uma das medidas de uso
comum em Estatística, para se positivarem as características de uma
distribuição de valores: são as chamadas Medidas de Curtose ou de
Achatamento, que nos mostra até que ponto a curva representativa de
uma distribuição é a mais aguda ou a mais achatada do que uma curva
normal, de altura média.
- Curva Mesocúrtica (Normal): É considerada a curva

padrão.
- Curva Leptocúrtica: É uma curva mais alta do que a

normal. Apresenta o topo relativamente alto, significando que os valores
se acham mais agrupados em torno da moda.
- Curva Platicúrtica: É uma curva mais baixa do que a

normal. Apresenta o topo achatado, significando que várias classes
apresentam frequências quase iguais.
50
- Coeficiente de Curtose
K= Q3 −Q1
2(P90 −P10)
- Se K > 0.263 ⇒ a distribuição será Platicúrtica.
- Se K = 0.263 ⇒ a distribuição será Mesocúrtica;
- Se K < 0.263 ⇒ a distribuição será Leptocúrtica;
Coeficiente momento de curtose (α4 ): Corresponde ao momento

abstrato de quarta ordem.
α4 = Ms44
onde: M4 = momento centrado de quarta ordem.
Interpretação:
- Se α4 < 3 ⇒ curva Platicúrtica;
- Se α4 = 3 ⇒ curva Mesocúrtica;
- Se α4 > 3 ⇒ curva Leptocúrtica.
4.5 Exercícios
Para os exercícios abaixo construa uma tabela de dispersão o

suficiente para determinar as medidas de posição (média aritmética,
51
mediana e moda de czuber), dispersão (desvio padrão e variância,
coeficiente de variação de Pearson), assimetria (coeficiente de
assimetria, e coeficiente de curtose). Faça um relatório referente ao
comportamento dos dados em função dos resultados obtidos.
1) De um exame final de Estatística, aplicado a 50 alunos da

Universidade Luterana, Ano 1999 resultaram as seguintes notas:
4,0 4,2 4,3 4,4 4,5 4,5 4,6 5,0 5,1 5,2
5,3 5,3 5,5 5,7 5,8 6,0 6,1 6,3 6,4 6,5
6,6 6,7 6,8 6,9 7,0 7,2 7,5 7,6 7,7 7,9
8,0 8,3 8,5 8,6 8,8 8,9 9,0 9,1 9,2 9,3
9,3 9,4 9,4 9,5 9,5 9,6 9,7 9,8 9,9 10,0
2) Os dados a seguir refere-se a altura em centímetros de 70

alunos da PUCC, turma 6, ano 2000.
153 154 155 156 158 160 160 161 161 161
162 162 163 163 164 164 165 166 167 167
168 168 169 169 170 170 170 171 171 172
172 173 173 174 174 175 175 176 177 178
179 179 180 182 183 184 185 186 186 187
188 188 189 189 190 191 192 192 192 192
193 194 194 195 197 197 199 200 201 205
3) Os dados a seguir referem-se aos salários anuais pagos em

dólares a 60 funcionários da Empresa “PETA S.A.” em 1997.
50,0 52,5 53,5 54,0 54,2 55,5 56,3 56,50 57,0 58,1
0 0 0 0 0 0 0 0 0
58,5 59,0 60,3 61,5 62,0 62,9 63,5 64,00 64,3 65,0
0 0 0 0 0 0 0 0 0
66,0 66,2 67,5 68,0 68,7 69,5 70,0 72,00 75,0 76,5
0 5 0 0 0 0 0 0 0
77,0 78,0 80,0 81,5 82,5 83,5 85,0 87,30 88,0 89,1
0 0 0 0 0 0 0 0 0
90,0 91,3 92,1 93,2 94,0 95,2 96,0 97,00 98,0 99,8
0 5 0 0 0 5 0 0 0
100,1 100,2 101,0 102,0 103,4 104,3 105,0 107,0 108,0 109,1
0 0 0 0 0 0 0 0 0 0
52
5 Probabilidade e Variáveis
Aleatórias
5.1 Modelos Matemáticos
Podem-se distinguir dois tipos de modelos matemáticos:
6.1.1 Modelos Determinísticos

Refere-se a um modelo que estipule que as condições sob as
quais um experimento seja executado determinem o resultado do
experimento. O modelo determinístico requer o uso de parâmetros
pré-determinados em equações que definem processos precisos.
Em outras palavras, um modelo determinístico emprega

"Considerações Físicas" para prever resultados.
6.1.2 Modelos Não Determinísticos ou Probabilísticos

São aqueles que informam com que chance ou probabilidade os
acontecimentos podem ocorrer. Determina o "grau de credibilidade" dos
acontecimentos. (Modelos Estocásticos).
Em outras palavras, um modelo probabilístico emprega uma

mesma espécie de considerações para especificar uma distribuição de
probabilidade.
5.2 Conceitos em Probabilidade

Os conceitos fundamentais em probabilidade são experimentos
aleatórios, espaço
amostral e eventos.
53
5.2.1 Experimento aleatório (W)
Qualquer processo aleatório, capaz de produzir observações, os
resultados surgem ao acaso, podendo admitir repetições no futuro. Um
experimento aleatório apresenta as seguintes características:
a - os resultados podem repetir-se n vezes (n →∞) ;

b - embora não se possa prever que resultados ocorrerão,
pode-se descrever o conjunto de resultados possíveis;
c - a medida que se aumenta o número de repetições, aparece

uma certa regularidade nos resultados.
5.2.2 Espaço Amostral (S)

É o conjunto de resultados possíveis, de um experimento
aleatório. Quanto ao número de elementos pode ser:
5.2.2.1 Finito
Número limitado de elementos;
Ex.: S = {1, 2, 3, 4, 5, 6}
5.2.2.2 Infinito
Número ilimitado de elementos, pode ser sub-dividido em:
a - Enumerável
Quando os possíveis resultados puderem ser postos em
concordância biunívoca com o conjunto dos números naturais (N) (caso
das variáveis aleatórias discretas).
Ex.: N
b - Não Enumerável
Quando os possíveis resultados não puderem ser postos em
concordância biunívoca com o conjunto dos números naturais (caso das
variáveis aleatórias contínuas).
Ex.: R
54
5.2.3 Evento (E)
Um evento (E) é qualquer subconjunto de um espaço amostral
(S).
Pode-se ter operações entre eventos da mesma forma que com
conjuntos, como mostra a seguir.
5.2.4 Operações com Eventos
5.2.4.1 A união B
Símbolo utilizado "", é o evento que ocorrerá se, e somente se, A
ou B ou ambos ocorrerem;
A B
FIGURA 6.1 - Evento A união B
5.2.4.2 A interseção B
Símbolo utilizado "", é o evento que ocorrerá se, e somente se, A

e B ocorrem simultaneamente.
AU B
A B
FIGURA 6.2 - Evento A interseção B
55
5.2.4.3 Complementar de A
_
Simbologia " A", é o evento que ocorrerá se, e somente se A não

ocorrer.
FIGURA 6.3 - Evento complementar de A (A )
5.2.5 Tipos de eventos
5.2.5.1 Eventos Mutuamente Excludentes

São ditos eventos mutuamente excludentes, quando a ocorrência
de um implica ou não ocorrência de outro, isto é, não pode ocorrer
juntos, e consequentemente, A  B é o conjunto vazio (∅).
FIGURA 6.4 - Eventos mutuamente excludentes
5.2.5.2 Eventos Não Excludentes ou Quaisquer

São ditos eventos não excludentes quando a ocorrência de um
implica na ocorrência do outro, isto é, são aqueles que ocorrem ao
mesmo tempo, AB ≠∅.
56
FIGURA 6.5 - Evento não excludentes
5.2.5.3 Eventos Independentes

São aqueles cuja ocorrência de um evento, não possui efeito
algum na probabilidade
de ocorrência do outro.
A B ≠∅ , se A e B forem Quaisquer;
AB=∅, se A e B forem Mutuamente Excludentes.
logo,
P(A B) = P(A) . P(B)
Ex.: A e B eventos Quaisquer
S = { 1, 2, 3, 4 } A = {1, 2 } B= A B = { 2
{ 2, 4 } }
P(A B)= P(A) . P(B)
P(A) = P(B) = P(A B) =
5.2.5.4 Eventos Dependentes ou Condicionados
Existem varias situações onde a ocorrência de um evento pode

influenciar fortemente
57
na ocorrência de outro.
Assim, se (A) e (B) são eventos, deseja-se definir uma quantidade

denominada probabilidade condicional do evento (A) dado que o evento
(B) ocorre, ou sob a forma simbólica

P
( )
AB .
Assim, dá-se a seguinte definição:
( )
P AB = P(AP(B)B)
onde P(B) > 0. Se P(B) = 0, tem-se que

P
(A B) não é definida.
5.2.5.5 Eventos Coletivamente
Exaustivos São aqueles que ocorrem
se nenhum outro ocorrer.
ABCD =∅
FIGURA 6.6 - Evento coletivamente exaustivos
5.3 Conceitos de Probabilidade
5.3.1 Conceito Empírico de Probabilidade

O problema fundamental da probabilidade consiste em atribuir
um número a cada evento (E), o qual avaliará quão possível será a
ocorrência de "E", quando o experimento for realizado.
58
Uma possível maneira de tratar a questão seria determinar a
frequência relativa do evento E (fr(E)),
número de ocorrências do evento (E) fr

(E) =
.
número de repetições do experimento (Ω)
Surgem, no entanto, dois problemas: a - Qual deve ser o número
de repetições do experimento (Ω); b - A sorte ou habilidade do
experimentador poderá influir nos resultados, de forma
tal que a probabilidade é definida como sendo:
P(E) = limn→∞fr (E),
onde "n" é o número de repetições do experimento Ω.
5.3.2 Definição Clássica ou Enfoque "A priori" de

Probabilidade
Se existe "a" resultados possíveis favoráveis a ocorrência de um

evento "E" e "b" resultados possíveis não favoráveis, sendo os mesmos
mutuamente excludentes, então:
a
P(E) = ,
a+b
onde os resultados devem ser verossímeis (possível e verdadeiro) e

permite a observação dos valores da probabilidade antes de ser
observado qualquer amostra do evento (E).
5.3.3 Definição Axiomática
Seja (Ω) um experimento, seja (S) um espaço amostral associado

a (Ω). A cada evento (E) associa-se um número real representado por
P(E) e denominaremos de probabilidade de E, satisfazendo as seguintes
propriedades:
59
a - 0 ≤ P(E) ≤ 1; b - P(S) = 1; c - Se A e B
são eventos mutuamente excludentes,
então:
P(A  B) = P(A) + P(B).
d - Se A1, A2, ..., An são eventos mutuamente excludentes dois a

dois, então:
P(A1  A2  ...  An ) = P(A1) + P(A2) + ... +P(An)

ou
n n
P(i=1A i) = ∑P(A i).

i=1
As propriedades anteriores são conhecidas como axiomas da

teoria da probabilidade. Os axiomas, muitas vezes, se inspiram em
resultados experimentais e que, assim, definem a probabilidade de
forma que possa ser confirmada experimentalmente.
5.3.4 Teoremas Fundamentais
Teorema 1 - Se ∅ for evento vazio, então P(∅) = 0.
Prova: Seja um evento A = ∅. Assim, A = A  ∅, como A  ∅ = ∅, de

acordo com o item (3.2.3.4), A e ∅ são mutuamente excludentes,
então:
P(A) = P(A  ∅)
P(A) = P(A) + P(∅)
P(∅) = P(A) - P(A)
P(∅) = 0.
_ _
Teorema 2 - Se o evento A for o evento complementar de A, então

P(A)=1-P(A).
_ _
60
Prova: A  A = S, mas A e A são mutuamente excludentes, então:
P(A  A) = P(S)
_ _
P(A  A) = P(A) + P(A)

_
P(A) + P(A ) = 1
logo,
_
P(A) = 1 - P(A).
Teorema 3 - Se A e B são eventos quaisquer, então:
P(A  B) = P(A) + P(B) - P(A  B)
Prova: Para provar o Teorema 3 devemos transformar A  B em eventos

mutuamente excludentes, conforme a FIGURA 6.
FIGURA 6 - Decomposição de eventos quaisquer em mutuamente

excludentes
Tem-se então que:
(A  B) = A  (B  A )
e
_
B = (A  B)  (B  A )
61
logo pela propriedade (c) temos:
P(A  B) = P[A  (B  A )]
_
()
P(A  B) = P(A) + P(B 
A) e
_
P(B) = P[(A  B)  (B  A)]

_
P(B) = P(A  B) + P(B 

A) ou
_
()
P(B  A) = P(B) - P(A  B)
substituindo-se a equação () na equação () tem-se:
P(A  B) = P(A) + P(B) - P(A  B).
Decorrências do Teorema 3:
Sejam A, B e C eventos quaisquer:
P(A  B  C) = P[(A  B)  C]
P(A  B  C) = P(A  B) + P(C) - P[(A  B)  C]
P(A  B  C) = P(A) + P(B) + P(C) - P(A  B) - P[(AC)  (BC)]
P(A  B  C) = P(A) + P(B) + P(C) - P(A B) - [P(AC) + P(BC) -

P(ABC)]
P(A  B  C) = P(A) + P(B) + P(C) - P(A B) - P(AC) - P(BC) +

P(ABC)
Sejam A1, A2, ..., An eventos quaisquer:
n n n
P(A1 A2 ...An ) =∑P(Ai ) − ∑P(A i A j) + ∑P(A Ai j A k ) +
62
i=1 i<j=2 i< j<k=3
−
∑P(A A
i j Ak A)+...+(−1)n−1P(A1 A 2 ...A n).
i<j<k<=4
RESUMO
Mutuamente Excludente s ⇒ P(A B) = P(A) +P(B)

 A B =∅

+ (OU)  Quaisquer ⇒ P(A B) = P(A)+ P(B) - P(A B)
 A B ≠ ∅
 Independentes ⇒ P(A B) = P(A) x P(B)

 A B ≠∅
 ⇒ P(A B) = P(A) x P(B/A) x
(E)Dependentes

63
5.4 Exercícios
1) A probabilidade de 3 jogadores marcarem um penalti é

respectivamente: 2/3; 4/5; 7/10 cobrando uma única vez.
a)todos acertarem. (28/75)
b)apenas um acertar. (1/6)
c) todos errarem. (1/50)
2)Numa bolsa com 5 moedas de 1,00 e 10 moedas de 0,50. Qual a

probabilidade de ao retirarmos 2 moedas obter a soma 1,50.
(10/21)
3)Uma urna contém 5 bolas pretas, 3 vermelhas e 2 brancas. Três

bolas são retiradas. Qual a probabilidade de retirar 2 pretas e 1
vermelha ?
a)sem reposição (1/4)
b)com reposição (9/40)
4 ) Numa classe há 10 homens e 20 mulheres, metade dos homens

e metade das mulheres possuem olhos castanhos. Ache a
probabilidade de uma pessoa escolhida ao acaso ser homem ou
ter olhos castanhos. (2/3)
5) A probabilidade de um homem estar vivo daqui a 20 anos é de

0.4 e de sua mulher é de 0.6 . Qual a probabilidade de que:
a)ambos estejam vivos no período ? (0.24)
b)somente o homem estar vivo ? (0.16)
c) ao menos a mulher estar viva ? (0.6)
d)somente a mulher estar viva? (0.36)
6) Faça o exercício anterior considerando 0,5 a chance do homem

estar vivo e 0,2 a chance da mulher estar viva e compara os
resultados.
7) Uma urna contém 5 fichas vermelhas e 4 brancas. Extraem-se

sucessivamente duas ficha, sem reposição e constatou-se que a 1ª
é branca.
a)qual a probabilidade da segunda também ser branca ? (3/8)
b)qual a probabilidade da 2ª ser vermelha ? (5/8)
8) Numa cidade 40 % da população possui cabelos castanhos, 25%

olhos castanhos e 15% olhos e cabelos castanhos. Uma pessoa é
selecionada aleatoriamente.
64
a) se ela tiver olhos castanhos, qual a probabilidade de também ter
cabelos castanhos?
b) se ela tiver cabelos castanhos, qual a probabilidade de ter olhos
castanhos ? (3/5) (3/8)
9) Um conjunto de 80 pessoas tem as características abaixo:
BRASILEIR ARGENTINO URUGUAI TOTAL

O O
MASCULIN 18 12 10 40
O
FEMININO 20 05 15 40
TOTAL 38 17 25 80
Se retirarmos uma pessoa ao acaso, qual a

probabilidade de que ela seja: a) brasileira ou uruguaia.
(63/80)
b)do sexo masculino ou tenha nascido na argentina. (9/16)
c) brasileiro do sexo masculino. (18/80)
d)uruguaio do sexo feminino. (15/80)
e)ser mulher se for argentino. (5/17)
10) Um grupo de pessoas está assim formado:
Médico Engenhei Veteriná

ro rio
Masc. 21 13 15
Femin. 12 08 17
Escolhendo-se, ao acaso, uma pessoa do grupo, qual a

probabilidade de que seja: a) Uma mulher que fez o curso de
medicina ?
b)Uma pessoa que fez o curso de medicina ?
c) Um engenheiro dado que seja homem ?
d)Não ser médico dado que não seja homem ?
11) Num ginásio de esportes, 26% dos frequentadores jogam

vôlei, 36% jogam basquete e 12% praticam os dois esportes. Um
dos frequentadores é sorteado para ganhar uma medalha.
Sabendo-se que ele joga basquete, qual a probabilidade de que
também jogue vôlei ?
65
12) A probabilidade de um aluno resolver um determinado
problema é de 1/5 e a probabilidade de outro é de 5/6. Sabendo
que os alunos tentam solucionar o problema independentemente.
Qual a probabilidade do problema ser resolvido :
a)somente pelo primeiro ?
b)ao menos por um dos alunos ?
c) por nenhum ?
5.5 Teorema de Bayes
Definição: Seja S um espaço amostral e A1, A2, ..., Ak , k eventos.

Diz-se que A1, A 2, ..., Ak , formam uma partição de S se:
Ai ≠∅, i = 1, 2, ..., k
k
A i =S,
i=1
Ai A j =∅, i ≠ j
A1, A2 , A3, A4 , A5, ..., Ak formam uma partição de S.
FIGURA 6.7 - Diagrama representativo do Teorema de Bayes
Seja B um evento qualquer de S, onde:
B = (B  A1)  (B  A2 ) ... (B  A k )
66
 B
P(B) =∑k P(A j ).P 

 , j = 1, 2, ..., k ( ) j=1  A j
 
P(B A i) = P(Ai ).P BAi  , ()
como
PAi B  = P(BP(B)A i ) , ()
substituindo as equações () e () na equação () temos:
PAi B= ∑ P(PA(A ).P )BBA

k i j i j  , j = 1, 2, ..., k .
j=1 .P A 
Exemplo:
Urna U1 U2 U3
Azul 3 4 3
Cores
Branca 1 3 3
Preta 5 2 3
Escolhe-se uma urna ao acaso e dela extrai-se uma bola ao acaso,
verificando-se que
ela é branca. Qual a probabilidade dela ter saído da urna:
U1 ? U2 ? U3 ?
2) Temos 2 caixas: na primeira há 3 bolas brancas e 7 pretas e

na segunda, 1 branca e 5 pretas. De uma caixa escolhida
aleatoriamente, selecionou-se uma bola e verificou-se que é preta.
67
Qual a probabilidade de que tenha saído da primeira caixa ? segunda
caixa ?
5.6 Variáveis aleatórias
Ao descrever um espaço amostral (S) associado a um

experimento (Ω) especifica-se que um resultado individual
necessariamente, seja um número. Contudo, em muitas situações
experimentais, estaremos interessado na mensuração de alguma coisa e
no seu registro como um número.
Definição: Seja (Ω) um experimento aleatório e seja (S) um espaço

amostral associado ao
experimento. Uma função de X, que associe a cada elemento s
∈ S um número real x(s), é denominada variável aleatória.
FIGURA 1 - Representação de uma variável aleatória
Uma variável X será discreta (V.A.D.) se o número de valores de

x(s) for finito ou infinito numerável. Caso encontrarmos x(s) em forma de
intervalo ou um conjunto de intervalos, teremos uma variável aleatória
contínua (V.A.C.).
5.7 Função de Probabilidade
A probabilidade de que uma variável aleatória "X" assuma o valor

"x" é uma função
68
de probabilidade, representada por P(X = x) ou P(x).
5.7.1 Função de Probabilidade de uma V.A.D.
A função de probabilidade para uma variável aleatória discreta é

chamada de função de probabilidade no ponto, ou seja, é o conjunto de
pares (xi;P(xi)), i = 1, 2, ..., n, ..., conforme mostra a FIGURA 9.
FIGURA 6.1 - Distribuição de probabilidade de uma V.A.D.
Para cada possível resultado de x teremos:

0 ≤ P(X) ≤1;
∞
∑P(X ) =1
i
i=
5.7.2 Função de Repartição para V.A.D.
Seja X uma variável aleatória discreta.
Define-se Função de Repartição da Variável aleatória X, no ponto

xi, como sendo a
probabilidade de que X assuma um valor menor ou igual a xi, isto é:
F(X) = P(X ≤ xi)

Propriedades:
69
1a) F(X) = ∑ (x )P
i
xi ≤x
6a) P(a < x < b)= F(b) − F(a) − P(X = b)
lim F(X) = F Xo)

7a) F(X) é contínua à direita ⇒ x →x0 (
a
8 ) F(X) é descontínua à esquerda, nos pontos em que a
probabilidade é diferente de zero.
( )
xlim→x0 F(X) ≠ F Xo , para P(X= xo) ≠ 0
9a) A função não é decrescente, isto é, F(b) ≥ F(a) para b > a.
5.6.3 Esperança Matemática de V.A.D.
Definição: Seja X uma V.A.D., com valores possíveis x1, x2, ...,
xn,... ; Seja P(xi) =
P(X = xi), i = 1, 2, ..., n, ... . Então, o valor esperado de X (ou Esperança
Matemática de X), denotado por E(X) é definido como
E(X) = ∑x P(x )
i i
i=1
∞ ∞
se a série E(X) = ∑x i P(xi ) convergir absolutamente, isto é, se ∑|x | P(x )

i i
<∞, este
i=1 i=1
número é também denominado o valor médio de X, ou expectância de X.
5.7.4 Variância de uma V.A.D.
Definição: Seja X uma V.A.D. . Define-se a variância de X,
denotada por V(X) ou σ2x, da seguinte maneira:
70
∞
=
V(X) ∑(x − E(X)) .P(x ) ou V(X) = E(X ) − E(X)
i
2
i
2 2
i=1
∞
onde E(X2) =∑x2i P(xi ) e a raiz quadrada positiva de V(X) é denominada o

desvio-padrão
i=1
de X, e denotado por σx.
5.7.5 Função de Probabilidade de uma V.A.C.
No instante em que X é definida sobre um espaço amostral

contínuo, a função de probabilidade será contínua, onde a curva
limitada pela área em relação ao valores de x será igual a 1.
FIGURA 6.2 - Distribuição de probabilidade de uma V.A.C.
Se quisermos calcular a probabilidade de X assumir um valor x

entre "a" e "b" devemos calcular:
P(a ≤ x ≤ b) = ∫ f(x) dx
b
Pelo fato de que a área representa probabilidade, e a mesma tem

valores numéricos positivos, logo a função precisa estar inteiramente
acima do eixo das abscissas (x).
71
Definição: A função f(x) é uma Função Densidade de
Probabilidade (f.d.p.) para uma V.A.C. X, definida nos
reais quando
f(x) ≥ 0;
f(x) dx = 1;
P(a ≤ x ≤ b) = ∫a
b
f(x) dx .
5.7.6 Função de Repartição para V.A.C.
Seja X uma variável aleatória contínua.
Define-se Função de Repartição da Variável aleatória X, no ponto

xi, como sendo:
x
F(X) dx
P(a≤x≤b)=P(a<x<b)=P(a<x≤b)=P(a≤x<b)
5.7.7 Esperança Matemática de uma V.A.C.
Definição: Seja X uma V.A.C. com f.d.p. f(x). O valor esperado de

X é definido como
E(X) x.f(x) dx
pode acontecer que esta integral imprópria não convirja.
Consequentemente, diremos que E(X) existirá se, e somente se,
x | f(x) for
finita.
5.7.8 Variância de uma V.A.C.
72
Definição: Seja X uma V.A.C. de uma função distribuição de
probabilidade (f.d.p.). A variância de X é:
E(X)
V(X) ) f(x) dx ou V(X) = E(X ) − E(X)
2 2 2
onde
E(X2 ) f(x) dx
5.8 Exemplos
- Variável Aleatória Discreta
Seja X o lançamento de duas moedas e descrever o experimento

em função da obtenção do número de caras:
i) determinar a função de probabilidade e

represente graficamente; ii) construir a função de
repartição e represente graficamente; iii) Use as
propriedades para determinar:
a) P(0 < x < 2); b) P(0 ≤ x ≤ 1); c) P(0 < x ≤ 2); d) F(1); e) F(2)
iv) E(X) e V(X)
i) Representação gráfica
0 ,6
0,5
0,4
0,3
0,2
0,1
0
0 1 2
73
ii) Rep
res
ent
açã
o
gráfica
F(x) = 0 se x<0
F(X) = 1/4 se 0 ≤ x < 1
F(X) = 3/4 se 1 ≤ x < 2
F(X) = 1 se x ≥ 2
ii
i)
a) P
P
b)
c) P
d) F(1) = 3/4 e) F(2) = 1
iv) Esperança Matemática

∞
E(X)
=
∑x P(x ) = 0 .
i i +1 . +2 . =1
i=1
Variância 2
) =∑∞ x2i P(xi )=
02 12 22
.+ .+ . 41 64
74
E(X=
i=1
V(X) = E(X2 ) − E(X) 2 = = = 05.

- Variável Aleatória Contínua
Seja X uma variável aleatória contínua:
2x, para 0 < x <1

f (x) = 
 0, para qualquer outro valor
i) represente graficamente função densidade de

probabilidade; ii) determinar a função de
repartição e represente graficamente;
 1 3  1 
iii) Determine P  ≤x≤ eP ≤x<1
4 4 4 
iv)E(X) e V(X)
i)
i
i)
para x<0 ⇒ F(X) = ∫ 0 dx = 0

x
−∞
para 0 ≤ x < 1 ⇒ F
75
para x ≥ 1 ⇒ F
Representação gráfica

iii) P

∫  
iv) E(X)
= ∫ 0
1
x f(x) dx 2x dx f(x)
dx = 23 [ ]
3 10 = 23 x
E(X )
2
f(x) dx 2x dx= f(x) dx =
2
4 [x ]
4
10=
1
2
logo,
1 2  2 9 −8 1
V(X) = E(X ) −[E(X)] =
2 2
2 − 3  = 18 = 18
5.9 Exercícios
1) Admita que a variável X tome valore 1, 2 e 3 com

probabilidades 1/3, 1/6 e 1/2 respectivamente.
76
a)Determine sua função de repartição e represente graficamente.
b)Calcule usando as propriedades:
b.1) a) P(1 < x < 3); b) P(1 ≤ x ≤ 2); c) P(1 < x ≤ 3); d) F(1); e)
F(2)
c) E(X) e V(X)
2) No lançamento simultâneo de dois dados, considere as

seguintes variáveis aleatórias:
X = número de pontos obtidos no 1o dado.

Y = número de pontos obtidos no 2o dado.
a) Construir a distribuição de probabilidade através de uma

tabela e gráfico das seguinte variáveis:
i) W = X -
Y ii) A =
2 Y iii) Z
=X.Y
b)Construir a função de repartição das Variáveis W, A e Z

c) Aplicar as propriedades e determinar:
i) P (-3 < W ≤ 3) v) P (Z = 3) ii) P (0 ≤ W ≤ 4)

vi) P (A ≥ 11) iii) P (A > 6) vii) P (20 ≤ Z ≤ 35)
iv) P (Z ≤ 5.5) viii) P 3,5 < Z < 34)
d) Determine E(W), E(A), E(Z), V(W), V(A) e V(Z)
3) Uma variável aleatória discreta tem a distribuição de

probabilidade dada por:
P X =
( ) K
x para x = 1, 3, 5 e 7
a) calcule o valor de k b) Calcular P(X=5)
77
c) E(X) d) V(X)
4) Seja Z a variável aleatória correspondente ao número de

pontos de uma peça de dominó.
a)Construir a tabela e traçar o gráfico P(Z).
b)Determinar F(Z) e traçar o gráfico.
c) Calcular P(2≤ Z < 6).
d)Calcular F(8).
e)E(Z) e V(Z).
5)Seja f(x) = 2 (1− x2), 0 < x <1,

3
 0, caso contrário
i) Ache a função de repartição e esboce o gráfico.
ii) Determine E(X) e V(X).

6)Seja f(x) = 12 x, 0 ≤ x ≤ 2 ,
0, caso contrário
i) Ache a função de repartição e esboce o gráfico.
ii) P(1< x < 1,5).
iii) E(X) e V(X).
7)Uma variável aleatória X tem a seguinte f.d.p.:

x<0 f(x) = 0
0≤x<2 f(x) = k
2≤x<4 f(x) = k(x -
1)
x≥4 f(x) = 0
a)Represente graficamente f(x).

b)Determine k.
c) Determine F(X) e faça o gráfico
d)E(X) e V(X)
78
6x(1− x), 0 < x <1
8) A função de probabilidade de uma V.A.C. X é f(x) =
 0, caso contrário
a) Determine F(X) e represente graficamente.
 1
P x≤
b)Calcule  2
c) E(X) e V(X)
9) Uma variável aleatória X tem a seguinte f.d.p.:
f(x) = 0 x < 0 f(x) = Ax 0 ≤
x < 500
f(x) = A(100 - x) 500 ≤ x < 1000
f(x) = 0 x ≥ 1000
a) Determine o valor de A.
b)P (250 ≤ x ≤ 750).
10) Dada a função de repartição:

F(X) = 0 para x < -1
x+1 para -1 ≤ x
F(X) = 2 <1
F(X) = 1 para x ≥ 1
P − 1 ≤ x≤ 1 
a) Calcule:  2 2  , b) P(X = 0)
79
6 Distribuições de Probabilidade
Após termos visto as definições de V.A.D. e V.A.C., citaremos as

principais distribuições de probabilidade relacionadas a estas variáveis.
6.1 Distribuições Discretas de Probabilidade
6.1.1 Distribuição de Bernoulli
Consideramos uma única tentativa de um experimento aleatório

podemos ter sucesso ou fracasso nessa tentativa. Seja "p" a
probabilidade de sucesso e "q" a probabilidade de fracasso, onde p + q
= 1.
Seja X o número de sucesso em uma única tentativa, logo X pode

assumir:
X = 0 se ocorrer fracasso e X = 1 se ocorrer sucesso,
ou ainda:
0, se for fracasso, com P(X = 0) = q

X =
1, se for sucesso, com P(X =1) = p .
Supondo que em uma única tentativas o número de casos

possíveis sejam:
A, A, ..., A, A, A, ..., A

x sucessos n-x fracassos
sendo os resultados independentes, temos:
80
P(AA...AAA...A) = P(A).P(A). ... . P(A).P(A).P(A). ... . P(A)
_ P(A).P(A).
... .P(A) . P(A).P(A). ... .P(A) , onde P(A)= p

e P(A ) = q,
x sucessos n-x fracassos
nessa condição a variável aleatória X tem distribuição de Bernoulli, e

sua função de probabilidade (f. p.) (função de probabilidade) é dada por:
P(X = x) = px.qn−x.
6.1.1.1 Esperança Matemática da Distribuição de Bernoulli
E(X) = ∑x P(x )i i
i=1
E(X) = x1P(x1) + x2P(x2 )

E(X) = 0.P(0) +1.P(1)
E(X) = 0.q + 1.p
E(X) = p
6.1.1.2 Variância da Distribuição de Bernoulli
V(X) = E(X2 ) − E(X) 2
onde
∞
E(X2) =∑x2i P(xi )

i=1
E(X2)
E(X2) = 0.q + 1.p = p
logo
V(X) = p− p2
V(X) = p.(1-p)
81
V(X) = p . q
6.1.2 Distribuição Binomial
O termo "Binomial" é utilizado quando uma variável aleatória

esta agrupada em duas classes ou categorias. As categorias devem ser
mutuamente excludentes, de modo a deixar bem claro a qual categoria
pertence determinada observação; e as classes devem ser coletivamente
exaustivas, de forma que nenhum outro resultado fora delas é possível
Sejam, "p" probabilidades de sucesso e "q" probabilidades de

falha, ou seja p + q = 1.
A probabilidade de x sucessos em x tentativas é dado por px e

de (n - x) falhas em (n - x) tentativas é dado por qn-x, onde o número de
vezes em que pode ocorrer x sucessos e
(n-x) falhas é dado por:
n n!
Cn,x =x= x! (n − x)!
logo, a probabilidade de ocorrer x sucessos com n tentativas será
n x q n−x P(X

= x) =xp
Propriedades necessárias para haver uma utilização da

Distribuição Binomial:
1a) Número de tentativas fixas;

2a) Cada tentativa deve resultar numa falha ou sucesso;
3a) As probabilidades de sucesso devem ser iguais para
todas as tentativas; 4a) Todas as tentativas devem ser
independentes.
6.1.2.1 Esperança Matemática de Distribuição Binomial
82
E(X) = ∑x P(x )
i i
i=1
n x q n−x
E(X) = x.xp como P(X) segue uma
Distribuição de Probabilidade, temos:
∑ ∞
= P(X = xi ) =1 ou ∑ ∞
nx xq
n−x =1 p
i1
logo,
E(X) = x. n! ∑ ∞ px qn−x x(x-

1)!(n -x)! x=1
E(X) = n. p q n−x , ou seja para s = x - 1 e x = s + 1, temos

x
E(X) = n.∑∞ ns-1 ps+1q n−(s+1)

x=1 
∑ n -1 s.p q(n −1)−s E(X)
∞
= n.  s  p
x=1 
∑ ∞
n -1 s . q (n−1)−s
E(X) = n.p  s  p
x =1  
1
E(X) = n . p
83
6.1.2.2 Variância de uma Distribuição Binomial
V(X) = E(X2 )− E(X) 2
onde
∞
E(X2) =∑x2i P(xi )

i=1
n!
E(X2) = x.x ∑∞
q
x n−x
, para s= x -1 e x =
s+1, temos: p
x.(x−1)!(n −x)! x=1
n!
E(X2) = (s+1) ∑ ∞
ps+1qn−(s+1)
s!(n− (s+1))! x=1
E(X2) = s.n∑∞ (n -1)! ps.p qn−1−s + n∑∞ (n-

1)! ps.p qn−1−s x=1 s!(n-1-s)! x=1 s!(n-1-s)!
 
E(X
2) = n.psns−1∑x(∞=n1−1)pps .p qn−1−s +∑x∞=1ns-

11ps qn−1−s 
E(X2) = n.p(n−1)p +1
E(X2) = n.p(np −p +1
E(X2) = n2p2 − np2 + np
V(X) = n2p2 − np2 + np - (np)2
V(X) = n.p.(1- p)
V(X) = n. p.q
6.1.2.3 Esperança Matemática e Variância para a

Probabilidade de Sucesso (p) de uma Distribuição Binomial
84
E(p) = p e V(p) =
p.q
n
6.1.3 Distribuição de Poisson
Quando numa distribuição binomial o tamanho "n" das

observações for muito grande e a probabilidade "p" de sucesso for muito
pequena, a probabilidade x de ocorrência de um determinado número de
observações segue uma Distribuição de Poisson.
A aplicação da distribuição segue algumas restrições:
- Somente a chance afeta o aparecimento do evento,

contando-se apenas com a sua ocorrência, ou seja, a probabilidade de
sucesso "p".
- Uma vez não conhecido o número total de eventos, a

distribuição não pode ser aplicada.
Se n → ∞ em conseqüência n >> x assim,
n! x
= n.(n−1).(n−2). ... .(n- x+1) ≈ n

(n − x)! logo,
P(x) = nx pxqn−x .
x!
=
Se p → 0 e n >> x logo, q n−x ≈ qn (1− p) n
assim,
P(x) = (n.p)x(1− p)n
x!
P(x) = ( n.px!) x 1− n.p + n(n2.−11) (−p) 2 +...
85
P(x) ≅ (n.p) x
1− n.p +
(n.2p!)2 +... x! 
(n.p) xe-n.p
P(x) =
x!
Substituindo o valor esperado n.p por λ e considerando-o como
sendo o número médio de ocorrência expresso em unidades de tempo,
pode-se dizer que λ é a taxa média de falhas (falha / unid. tempo) e t o
tempo, logo o número médio de falhas será λt, assim,
P(x) =
λxt . e-λ
x!
fornece a probabilidade de x falhas no período de tempo t.
A probabilidade de zero falhas no tempo t é a confiabilidade do

componente em função do tempo.
P(0) = R(t) = e−λ t
6.1.3.1 Esperança Matemática da Distribuição de Poisson
E(X) xi P(xi )
i=1
= ∑ ∞
x e-λλx E(X)
x=1 x!
∞ e-λλx
E(X) =∑ , substituindo s = x -1 e x = s + 1 temos:
x=1 (x-1)!
∞
E(X) = ∑ e-λλs+1
x=1 s!
∞ e-λλs
86
E(X)
E(x) = λ
6.1.3.2 Variância da Distribuição de Poisson
V(X) = E(X2 ) − E(X) 2
onde
E(X2) =∑x2i P(xi )

i=1
e-λλx
E(X2) =∑x.x , substituindo s = x - 1 e x =
s + 1 temos: ∞
x=1 x(x-1)!
) = ∑∞
2
(s+1) e-λλs+1 E(X

x=1 s!
∞
E(X2) =λ ∑(s+1) e-λλs

x=1 s!
 
2
) =λ ∑∞ s e-λλs +∑∞ e-λλs 
E(X
x=1s! x=1s!
 E(X) 1 
E(X)2 =λ2 +λ
V(X) =λ2 +λ− (λ)2
V(X) =λ
6.2 Exercícios
87
1) Admitindo-se o nascimento de meninos e meninas sejam
iguais, calcular a probabilidade de um casal com 6 filhos ter:
a) 4 filhos e 2 filhas b) 3 filhos e 3 filhas
2) Em 320 famílias com 4 crianças cada uma, quantas se

esperaria que tivessem:
a) nenhuma menina; b) 3 meninos c) 4 meninos
3) Um time X tem 2/3 de probabilidade de vitória sempre que

joga. Se X jogar 5 partidas, calcule a probabilidade de:
a)X vencer exatamente 3 partidas;
b)X vencer ao menos uma partida;
c) X vencer mais da metade das partidas;
d)X perder todas as partidas;
4) A probabilidade de um atirador acertar um alvo é 1/3. Se ele

atirar 6 vezes, qual a probabilidade de:
a) acertar exatamente 2 tiros;b) não acertar nenhum tiro.
5)Num teste de certo-errado, com 100 perguntas, qual a

probabilidade de um aluno, respondendo as questões ao acaso,
acertar 70% das perguntas ?
6)Se 5% das lâmpadas de certa marca são defeituosas, achar a
probabilidade de que, numa amostra de 100 lâmpadas,
escolhidas ao acaso, tenhamos:
a)nenhuma defeituosa (use binomial e poisson)
b)3 defeituosas;
c) mais do que uma boa;
7) Uma fabrica de pneus verificou que ao testar seus pneus nas

pistas, havia em média um estouro de pneu a cada 5.000 km.
a) qual a probabilidade que num teste de 3.000 km haja no
máximo um pneu estourado ?
b) Qual a probabilidade de um carro andar 8.000 km sem
estourar nenhum pneu ?
88
8) Certo posto de bombeiros recebe em média 3 chamadas por
dia. Calcular a probabilidade de:
a)receber 4 chamadas num dia;
b)receber 3 ou mais chamadas num dia;
c) 22 chamadas numa semana.
9) A média de chamadas telefônicas em uma hora é 3. Qual

a probabilidade: a) receber exatamente 3 chamadas numa
hora;
b)receber 4 ou mais chamadas em 90 minutos;
c) 75 chamas num dia;
10) Na pintura de paredes aparecem defeitos em média na

proporção de 1 defeito por metro quadrado. Qual a
probabilidade de aparecerem 3 defeitos numa parede 2 x 2 m ?
11) Suponha que haja em média 2 suicídios por ano numa

população de 50.000 hab. Em uma cidade de 100.000
habitantes, encontre a probabilidade de que um dado ano
tenha havido: a) nenhum suicídio; b) 1 suicídio; c) 2 ou mais
suicídios.
12) Suponha 400 erros de impressão distribuídos

aleatoriamente em um livro de 500 páginas. Encontre a
probabilidade de que uma dada página contenha:
a)nenhum erro;
b)100 erros em 200 páginas.
6.3 Distribuições Contínuas de Probabilidade
6.3.1 Distribuição Uniforme
89
É uma distribuição de probabilidade usada para variáveis
aleatórias contínuas, definida num intervalo a,b , e sua função densidade
de probabilidade é dada por:
1
f(x) = b − ase a ≤ x ≤ b .
 0 se x < a ou x > b
FIGURA 6.1 - Representação de uma Distribuição Uniforme
6.3.1.1 Esperança Matemática da Distribuição Uniforme
E(X) x f(x) dx
1
E(X) = ∫ ax b
dx b - a
1 x 2 b
E(X) = b - a 2 a
E(X) = b2 − a2 2(b−
a)
E(X) = (b-a) (b +a)
2(b −a)
E(X) =
6.3.1.2 Variância da Distribuição Uniforme
90
V(X) = E(X2 )− E(X) 2
E(X 2 ) f(x) dx
1
E(X 2 ) = ∫ b
x 2
dx a b - a
E(X 2 ) x 2 dx
E(X
=
2
) b1-a x33  ba
E(X2) = b3 − a3
3(b−a)
E(X2) = (b-a)(b2 +ab+a2 )
3(b −a)
2
) = b2 +ab+a2
E(X
3
V(X) = b2 + ab + a 2 − b + a 2

3 2
V(X) = − a2
3 4
4b2 +4ab+ 4a2 −3b2 −6ab −3a2
V(X) =
12
b2 − 2ab+ a2
V(X) =
12
V(X) = (b − a)2
12
6.3.2 Distribuição Normal ou Gaussiana
É um modelo de distribuição contínua de probabilidade, usado

tanto para variáveis aleatórias discretas como contínuas.
91
Uma variável aleatória X, que tome todos os valores reais -∞ < x
< +∞ tem
distribuição normal quando sua função densidade de probabilidade
(f.d.p.) for da forma:
1
−
2 
1 
σ 2
x −µ ,−∞< x < +∞
f(x) =e
2π σ
Os parâmetros µ e σ seguem as seguintes condições:
−∞ < µ < +∞ e σ > 0.
6.3.2.1 Propriedades da Distribuição Normal
a) f é uma f.d.p. legítima para f(x)≥0, logo
f(x) d(x) =1
x−µ
fazendo t = temos:
σ
f(x) d(x) I.
Para calcular esta integral usaremos um artifício, ou seja, no
lugar de I usaremos I².
t s
1 +∞ −2 +∞ −
I =
2
∫
2π −∞
e dt . ∫ −∞
e 2 ds
( t 2 +s 2 )
1 +∞ +∞ −
I =
2
2 π
∫
- ∫
-
e 2 dt ds
∞ ∞
introduzindo coordenadas polares para realizar o cálculo dessa integral

dupla, temos:
s = r cosα e t = r senα
92
consequentemente o elemento de área ds dt se torna r dr dα.
Como , portanto
I 2= ∫ ∫re
0 0 dr dα
2π
+∞
2 
I= ∫ e  dα 2π 0  0
I2 = 1 α 20π
2π
I2 = 2π =1
I² = 1 , logo I = 1 como queríamos mostrar.
b) O aspecto gráfico da função f tem:
- Semelhança de um sino, unimodal e simétrico em relação a

média µ.
- A especificação da média µ e do desvio padrão σ é
completamente evidenciado. - A área total da curva equivale a
100%.
- A área total da curva equivale a 100%.
93
FIGURA 7.2 - Distribuição Normal em função da µ e σ
6.3.2.2 Esperança Matemática da Distribuição Normal
E(X) x f(x) dx
E(X) =∫+∞x 1 e−12 xσ−µ2 dx

−∞
σ 2π
fazendo z e x = z σ +µ,
1 ∞
E(X) = ∫ (σ z + µ) e 2 dz
2π −∞
z z
1 σ +∞ −2 1 +∞ −
E(X) = ∫ z e dz
2π −∞ 
+µ ∫ e dz
2π −∞
2
+ −z
     
zero um
E(X) = µ
6.3.2.3 Variância da Distribuição Normal
V(X) = E(X2 ) − E(X) 2
E(X 2 ) f(x) dx
E(X 2 ) =∫+∞x 2 1 e−12 xσ−µ2 dx
94
−∞
σ 2π fazendo z
e x = z σ +µ,
E(X 2 ) = 1 σ∫+∞(σ z + µ) 2
e− z2 dz σ 2π −∞
= 1 σ 2 ∫ z 2 e 2 dz + 1 2µ σ∫ z e 2 dz +µ 2 1 ∫ e 2
+ + +
E(X 2 ) ∞
2π −∞
−z ∞ 2π −∞−z
∞ −
z dz π −∞
 2     
um
zero
E(X 2 ) = 1 σ2 ∫+∞ z 2 e−2 z dz +µ 2
2π −∞
integrando por partes temos que ∫ u dv = u dv - ∫ v du
z2 = u dv dz
du = 1 −z2
dz =−e 2
z
1 −
−∫ − e
2 2 2
E(X ) =
2
σ z e 
z dz + µ
2
2
2π 
z
E(X 2 )
E(X2) = σ2 +µ2
logo,
V(X) = σ²
6.3.2.4 Distribuição Normal Padronizada
Tem como objetivo solucionar a complexidade da f(x) através da

mudança de
variável. f(z).
95
FIGURA 7.4 - Complemento da Distribuição Normal Padronizada
= x−µ
Fazendo z e z ~ N(0,1)
temos que σ
1
f(z) = ∫+∞ e− z2 ,
2
2π −∞
com E(z) = 0 e VAR(z) =

1. onde:
z = número de desvios padrões a

contar da média x = valor arbitrário µ
= média da distribuição normal
σ = desvio padrão da distribuição normal
Estas probabilidades estão tabeladas e este caso particular é

chamado de Forma Padrão da Distribuição Normal.
6.3.3 Distribuição “t” de Student
Trata-se de um modelo de distribuição contínua que se assemelha

à distribuição normal padrão, N ~ (0,1). Ë utilizada para inferências
estatísticas, particularmente, quando se tem amostras com tamanhos
inferiores a 30 elementos.
96
A distribuição t também possui parâmetros denominado "grau de
liberdade - ϕ". A média da distribuição é zero e sua variância é dada por:
[ ] ( )
VAR tϕ =σ2 tϕ = ϕ
ϕ −2 , para ϕ > 2.
A distribuição t é simétrica em relação a sua média.
6.4 Exercícios
1) As alturas dos alunos de uma determinada escola são

normalmente distribuídas com média 1,60 m e desvio padrão
0,30 m. Encontre a probabilidade de um aluno escolhido ao
acaso medir:
a) entre 1,50 e 1,80 b) mais que 1,75
m m
c) menos que 1,48 d) entre 1,54 e
m 1,58 m
e) menos que 1,70 f) exatamente
m 1,83 m
2) A duração de certo componente eletrônico tem média 850 dias
e desvio padrão 45 dias. Qual a probabilidade do componente
durar:
a) entre 700 e 1000 dias b) menos que 750 dias c) mais que 850
dias
d) Qual deve ser o número de dias necessários para que
tenhamos de repor 5% dos componentes. (R = 776 dias)
3) Um produto pesa, em média, 10 g, com desvio padrão de 2 g. É

embalado em caixas com 50 unidades. Sabe-se que as caixas
vazias pesam 500 g, com desvio padrão de 25 g. Admitindo-se
uma distribuição normal dos pesos e independência entre as
variáveis dos pesos do produto e da caixa, calcule a
probabilidade de uma caixa cheia pesar mais de 1050 g.
Xgeral = 1000, Vgeral = 50Vp + Vc , Sgeral = Vgeral = 28.73 (R = 0.04093)
97
4) Em uma distribuição normal 28% dos elementos são
superiores a 34 e 12% inferiores a 19. Encontrar a média e a
variância da distribuição. (R = X = 29.03, S2 = 73.44)
5) Suponha que a duração de vida de dois equipamentos E1 e E2

tenham respectivamente distribuições N(45 ; 9) e N(40 ; 36).
Se o equipamento tiver que ser usado por período de 45 horas,
qual deles deve ser preferido? (R = E1)
6) A precipitação pluviométrica média em certa cidade, no mês

de dezembro, é de 8,9 cm. Admitindo a distribuição normal
com desvio padrão de 2,5 cm, determinar a probabilidade de
que, no mês de dezembro próximo, a precipitação seja (a)
inferior a 1,6 cm, (b) superior a 5 cm mas não superior a 7,5
cm, (c) superior a 12 cm.
7) Em uma grande empresa, o departamento de manutenção tem

instruções para substituir as lâmpadas antes que se queimem
(não esperar que queimem para então substituí-las). Os
registros indicam que a duração das lâmpadas tem
distribuição N(900 ; 75) (horas). Quando devem ser
substituídas as lâmpadas de modo que no máximo 10% delas
queimem antes de serem trocadas? (R = 889 horas)
8) Os registros indicam que o tempo médio para se fazer um teste

é aproximadamente N(80 ; 20) (min.). Determinar:
a)a percentagem de candidatos que levam menos de 60 min ?
b)se o tempo concedido é de 1h, que percentagem não
conseguirá terminar o teste ?
9) A profundidade dos poços artesianos em um determinado local

é uma variável aleatória N(20 ; 3) (metros). Se X é a
profundidade de determinado poço, determinar (a) P(X < 15),
(b) P(18 < X < 23), (c) P (X > 25).
98
10) Certa máquina de empacotar determinado produto oferece
variações de peso com desvio padrão de 20 g. Em quanto deve
ser regulado o peso médio do pacote para que apenas 10%
tenham menos que 400 g? Calcule a probabilidade de um
pacote sair com mais de 450 g. [R = a) µ = 425.6 b) 0.11123 )]
7 Amostragem
7.1 Conceitos em Amostragem
Inferência Estatística - é o processo de obter informações

sobre uma população a partir de
resultados observados ma Amostra.
Amostragem: É o processo de retirada de informações dos "n"

elementos amostrais, na qual deve seguir um
método adequado (tipos de amostragem).
7.2 Plano de Amostragem
1o) Definir os Objetivos da Pesquisa
99
2o) População a ser Amostrada
- Parâmetros a ser Estimados (Objetivos)
3o) Definição da Unidade Amostral
- Seleção dos Elementos que farão parte da amostra
4o) Forma de seleção dos elementos da população
Aleatoria Simples

Sistematica
- Tipo de Amostragem 
Estratificada
por Conglomerados
5o) Tamanho da Amostra
Ex.: Moradores de uma Cidade (população alvo)
própria um piso

 
Objetivo: Tipo de Residência alugada dois pisos
 
emprestada tres ou mais pisos
Unidade Amostral: Domicílios (residências)
Elementos da População: Família por domicílio
aleatória simples

Tipo de Amostragem: sistemática

estratificada
7.3 Tipos de Amostragem
7.3.1 Amostragem Simples ou Ocasional
100
É o processo mais elementar e frequentemente utilizado. Todos
os elementos da população tem igual probabilidade de serem escolhidos.
Para uma população finita o processo deve ser sem reposição. Todos os
elementos da população devem ser numerados. Para realizar o sorteio
dos elementos da população devemos usar a Tabela de Números
Aleatórios.
7.3.2 Amostragem Sistemática
Trata-se de uma variação da Amostragem Aleatória Ocasional,

conveniente quando a população está naturalmente ordenada, como
fichas em um fichário, lista telefônica, etc.
= N
Ex.: N = 5000 n = 50, então r
=10, (P.A. de razão
10) n
Sorteia-se usando a Tabela de Números

Aleatórios um número entre 1 e 10,
(x=3), o número sorteado refere-se ao 1o
elemento da amostra, logo os elementos
da amostra serão:
3 13 23 33 43 ......
Para determinar qualquer elemento da amostra podemos usar a

fórmula do termo geral de uma P.A.
an = a1 + (n −1).r
7.3.3 Amostragem Estratificada
É um processo de amostragem usado quando nos depararmos

com populações heterogêneas, na qual pode-se distinguir subpopulações
mais ou menos homogêneas, denominados estratos.
Após a determinação dos estratos, seleciona-se uma amostra

aleatória de cada uma
subpopulação (estrato).
101
As diversas subamostras retiradas das subpopulações devem ser
proporcionais aos respectivos números de elementos dos estratos, e
guardarem a proporcionalidade em relação a variabilidade de cada
estrato, obtendo-se uma estratificação ótima.
Tipos de variáveis que podem ser usadas em estratificação:

idade, classes sociais, sexo, profissão, salário, procedência, etc.
7.3.4 Amostragem por Conglomerados (ou Agrupamentos)
Algumas populações não permitem, ou tornam-se extremamente

difícil que se identifiquem seus elementos, mas podemos identificar
subgrupos da população. Em tais casos, uma amostra aleatória simples
desses subgrupos (conglomerados) podem ser escolhida, e uma
contagem completa deve ser feita no conglomerado sorteado.
Agregados típicos são: quarteirões, famílias, organizações,

agências, edifícios, etc.
7.4 Amostragem "COM" e "SEM" reposição
Seja "N" o número de elementos de uma população, e seja "n" o

número de elementos de uma amostra, então:
Se o processo de retirada dos elementos for COM reposição (pop.

infinita (f ≤ 5%) ),
o número de amostras possíveis será:
no de amostras = Nn
Se o processo de retirada de elementos for SEM reposição (pop.

finita (f > 5%) ), o
número de amostras possíveis será:
= N!
no de amostras = C N,n
n! (N - n)!
Ex.: Supondo N = 8 e n = 4
com reposição: no de amostras = Nn = 84 = 4096
102
sem reposição: no de amostras = CN,n = n! (NN - n! )! = C8 4, =
4!8 !4! = 70
Ex.: Processo de Amostragem Aleatória Simples

(Distribuição Amostral das Médias)
- (com reposição)
N = { 1, 2, 3, 4} n = 2 no de amostras = Nn = 42 =
16
{11, } {12, } {13, } {14, }
{21, } {2 2, } {2,3} {2,4}
{31, } {3 2, } {33, } {34, }
{41, } {4 2, } {4,3} {4,4}
- (sem reposição)
=
no de amostras = C4 2,
4!
N = { 1, 2, 3, 4} n = 2
= 6 2!
2!
{1,2} {1,3} {1,4}

}
{2,3} {2,4} {3,4
Para ilustrar melhor as estatísticas amostrais usaremos o

processo com reposição.
{41, }⇒ x = 2,5 {4 3, }⇒ x = 35,
{11, }⇒ x =10,{12, }⇒ x =15, {4 2, }⇒ x = 3 0, {14, }⇒ x = 2 5,
{21, }⇒ x = 15, {2,2}⇒ x = 2 0, {13, }⇒ x = 2,0 {2,4}⇒ x = 3 0,
{31, }⇒ x = 2 0, {3 2, }⇒ x = 2 5, {2,3}⇒ x = 2 5, {3 4, }⇒ x = 3 5,
{33, }⇒ x = 3 0, {4 4, }⇒ x = 4 0,
7.5 Representações de uma Distribuição Amostral
- Tabela
103
xi P(X = xi )
1,0 1/16
1,5 2/16
2,0 3/16
2,5 4/16
3,0 3/16
3,5 2/16
4,0 1/16
Σ 16/16
- Gráfico
7.6 Estatísticas Amostrais
- Esperança Matemática
µ(x)= E(x)= ∑ x P(X = x ) =

n
i i = 2 5,
i=1
-Variância
ou VAR(x) = E x2 ( ) −[E(x)]2
onde E
i=1
7.7 TAMANHO DA AMOSTRA
7.7.1 Introdução
104
Os pesquisadores de todo o mundo, na realização de pesquisas
científicas, em qualquer setor da atividade humana, utilizam as técnicas
de amostragem no planejamento de seus trabalhos, não só pela
impraticabilidade de poderem observar, numericamente, em sua
totalidade determinada população em estudo, como devido ao aspecto
econômico dessas investigações, conduzidos com um menor custo
operacional, dentro de um menor tempo, além de possibilitar maior
precisão nos respectivos resultados, ao contrário, do que ocorre com os
trabalhos realizados pelo processo censitário (COCHRAN, 1965; CRUZ,
1978).
A técnica da amostragem, a despeito de sua larga utilização,

ainda necessita de alguma didática mais adequada aos pesquisadores
iniciantes.
Na teoria da amostragem, são consideradas duas dimensões:
1a) Dimensionamento da Amostra;
2a) Composição da Amostra.
7.7.2 Procedimentos para determinar o tamanho da

amostra
1o) Analisar o questionário, ou roteiro da entrevista e escolher

uma variável que julgue mais importante para o estudo. Se
possível mais do que uma;
2o) Verificar o nível de mensuração da variável: nominal, ordinal

ou intervalar;
3o) Considerar o tamanho da população: infinita ou finita
4o) Se a variável escolhida for:
- intervalar e a população considerada infinita, você poderá

determinar o tamanho da amostra pela fórmula:
n = Z d. σ 2
onde: Z = abscissa da curva normal padrão, fixado um nível de
confiança (1- α)
105
Z = 1,65 → (1 - α) = 90%
Z = 1,96 → (1 - α) = 95%
Z = 2,0 → (1 - α) = 95.5%
Z = 2,57 → (1 - α) = 99%
Geralmente usa-se Z = 2
σ = desvio padrão da população, expresso na unidade variável,

onde poderá ser determinado por:
• Especificações Técnicas
• Resgatar o valor de estudos semelhantes
• Fazer conjeturas sobre possíveis valores
d = erro amostral, expresso na unidade da variável. O erro amostral

é a máxima
diferença que o investigador admite suportar entre µ e x, isto é: µ− x <
d.
- intervalar e a população considerada finita, você poderá

determinar o tamanho da amostra pela fórmula:
= 2 Z 2 . σ2 . N2 2
n d (N −1) + Z . σ
onde: Z = abscissa da normal padrão
σ2 = variância populacional
N = tamanho da população
d = erro amostral
- nominal ou ordinal, e a população considerada infinita,

você poderá determinar o tamanho da amostra pela
fórmula:
106
Z2 . p .
qn =
2
p = estimativa da verdadeira proporção de um dos níveis da

variável escolhida. Por exemplo, se a variável escolhida for
parte da empresa, p poderá ser a estimativa da verdadeira
proporção de grandes empresas do setor que está sendo
estudado. p será expresso em decimais (p = 30% → p =
0.30).
q=1− p
d = erro amostral, expresso em decimais. O erro amostral neste

caso será a máxima diferença que o investigador admite
suportar entre π e p, isto é: π− p< d, em que π é a
verdadeira proporção (frequência relativa do evento a ser
calculado a partir da amostra.
- nominal ou ordinal, e a população considerada finita, você

poderá determinar o tamanho da amostra pela fórmula:
Z2 . p . q . N 
n= 2
2 d (N−1) + Z . p .
q
N = tamanho da população
p = estimativa da proporção
q=1− p
d = erro amostral
Estas fórmulas são básicas para qualquer tipo de composição da

amostra; todavia,
107
existem fórmulas específicas segundo o critério de composição da
amostra.
- Se o investigador escolher mais de uma variável, poderá

acontecer de ter que aplicar
mais de uma fórmula, assim deverá optar pelo maior valor de "n".
Quando não tivermos condições de prever o possível valor para p, admita p = 0.50,
pois, dessa forma,
você terá o maior tamanho da amostra, admitindo-se constantes os demais elementos.
7.8 Distribuições amostrais de probabilidade
7.8.1 Distribuição amostral das médias
Se a variável aleatória "x" segue uma distribuição normal:
x ~
N
(µ(x);σ (x)),
2
onde z =
x
−µ(x)
σ(x)
=
µ(x) = µ (a média amostral é igual a média populacional) e σ(x)
σ(x)
(Desvio
n
Padrão Amostral)
7.8.1.1 Caso COM reposição (pop. infinita)
 σ2 (x)
x ~ Nµ(x); n 
7.8.1.2 Caso SEM reposição (pop. finita)
Quando a amostra for > 5% da população  Nn  devemos usar

um fator de correção.
108
 σ2(x) N - n N-n
x ~ Nµ(x); n N -1 , onde N-1 é o fator de correção
Ex1.: Uma população muito grande tem média 20,0 e desvio

padrão 1,4 . Extrai-se uma amostra de 49 observações.
Responda:
a)Qual a média da distribuição amostral ?

b)Qual o desvio padrão da distribuição amostral ?
c) Qual a porcentagem das possíveis médias que diferiram por
mais de 0,2 da média populacional ?
Ex2.: Um processo de encher garrafas de coca-cola dá em média

10% mal cheias com desvio padrão de 30%. Extraída uma
amostra de 225 garrafas de uma sequência de produção de
625, qual a probabilidade amostral das garrafas mal cheias
estar entre 9% e 12%.
O exemplo n o 2 pode ser resolvido usando a distribuição amostral das proporções,

onde p = proporção populacional, p= média da distribuição amostral das proporções.
Logo temos:
7.8.2 Distribuição amostral das proporções
p=p e σp = p(1−p) . N-n,

n N -1
N -n
onde é usado para população
finita. N -1
Ex1: Uma máquina de recobrir cerejas com chocolate é regulada

para produzir um revestimento de (3% em relação ao volume da cereja).
Se o processo segue uma distribuição normal, qual a probabilidade de
extrair uma amostra de 25 cerejas de um lote de 169 e encontrar uma
média amostral superior a 3,4%. R = 0,44828.
7.9 Exercícios
109
1) Uma fabrica de baterias alega que eu artigo de primeira
categoria tem uma vida média de 50 meses, e desvio padrão de
4 meses.
a) Que porcentagem de uma amostra de 36 observações acusaria
vida média no intervalo de um mês em torno da média?
b) Qual será a resposta para uma amostra de 64 observações?
c) Qual seria o percentual das médias amostrais inferior a 49,8
meses com n =100?
2) Um varejista compra copos diretamente da fábrica em grandes

lotes. Os copos são embrulhados individualmente.
Periodicamente o varejista inspeciona os lotes para determinar
a proporção dos quebrados ou lascados. Se um grande lote
contém 10% de quebrados (lascados) qual a probabilidade do
varejista obter numa amostra de 100 copos 17% ou mais
defeituosos?
3) Deve-se extrair uma amostra de 36 observações de uma

máquina de cunhar moedas comemorativas. A espessura média
das moedas é de 0,2 cm, com desvio padrão de 0,01 cm.
a) Que percentagem de médias amostrais estará no intervalo ±
0,004 em torno da média? R = 0.98316
b)Qual a probabilidade de obter uma média amostral que se
afaste por mais de 0,005 cm da média do processo? R =
0.00164
4) Suponha que uma pesquisa recente tenha revelado que 60%

de uma população de adultos do sexo masculino consistam de
não-fumantes. Tomada uma amostra de 10 pessoas de uma
população muito grande, que percentagem esperamos nos
intervalos abaixo:
a) de 50% a 65% b) maior que 53% c) de 65% a 80%
5) Se a vida média de operação de um "flash" é 24 horas, com

distribuição normal e desvio padrão de 3 horas, qual é a
probabilidade de uma amostra de 10 "flashes" retirados de
uma população de 500 "flashes" apresentar vida média que
difira por mais de 30 min. da média. R = 0.60306
8 Estimação de Parâmetros
110
É um processo de indução, na qual usamos dados extraídos de
uma amostra para produzir inferência sobre a população. Esta
inferência só será válida se a amostra for significativa.
- Tipos de Estimações de Parâmetros
i) Estimação Pontual
ii)Estimação Intervalar
8.1 Estimação Pontual
É usada quando a partir da amostra procura-se obter um único

valor de certo parâmetro populacional, ou seja, obter estimativas a
partir dos valores amostrais.
a) Estatísticas
Seja (X1, X2, ..., Xn) uma amostra aleatória e (x1 ,x2, ..., xn) os
valores tomados pela amostra; então y = H(x1 ,x2, ..., xn) é uma
estatística.
Principais estatísticas:
- Média Amostral
- Proporção Amostral
- Variância Amostral
8.2 Estimação Intervalar
Uma outra maneira de se calcular um estimativa de um

parâmetro desconhecido, é construir um intervalo de confiança para
esse parâmetro com uma probabilidade de 1−α (nível de confiança) de
que o intervalo contenha o verdadeiro parâmetro. Dessa maneira α será
o nível de significância, isto é, o erro que se estará cometendo ao
afirmar que o parâmetro está entre o limite inferior e o superior
calculado.
8.2.1 Intervalo de confiança para a média (m) com a

variância (σ2) conhecida.
111
(n > 30 → Z)
Seja X ~ N µ,σ2( )
Como já vimos anteriormente, x (média amostral) tem
distribuição normal de média
σ
µ e desvio padrão n ,ou seja:
 σ2 
X ~ N µ ; 
 n
X −µ
z=
Portanto, tem distribuição N (0,1)
σ n
Então,
( )
P −z α 2 ≤z ≤+zα 2 =1 −α
 
P −zα 2 ≤ ≤+z α 2  =1 −α
 σ n 
 σ σ 
P −zα 2 −X ≤µ ≤ zα 2 −X =1−α
 n n 
+
 σ σ
P X −z ≤µ ≤X +z  =1 −α (Pop. Infinita)
 α 2 n α 2 n
x −µ
Para caso de populações finitas usa-se a

seguinte fórmula:
112
N- n N- n
P X+Z α 2 σ ≤µ≤ Z α 2 σ  =1−α (Pop. Finita)
 n N -1 n N-1
Obs.: Os níveis de confiança mais usados são:
1−α= 90% ⇒ zα2 = ± 1,64

1−α= 95% ⇒ zα2 = ±
1,96 1−α=85% ⇒ zα2 =
1−α= 99% ⇒ zα2 = ± 2,58
Ex.: Seja X a duração da vida de uma peça de equipamento tal

que σ = 5 horas. Admita que 100 peças foram ensaiadas fornecendo uma
duração de vida média de 500 horas e que se deseja obter um intervalo
de 95% para a verdadeira média populacional. R = P (499,02 ó µ ó
500,98) = 95%.
Obs.: Podemos dizer que 95% das vezes, o intervalo acima

contém a verdadeira média populacional. Isto não é o mesmo que
afirmar que 95% é a probabilidade do parâmetro µ cair dentro do
intervalo, o que constituirá um erro, pois µ é um parâmetro
(número) e ele está ou não no intervalo.
8.2.2 Intervalo de confiança para a média (m) com a

variância (σ2) desconhecida
( n ≤ 30)
Neste caso precisa-se calcular a estimativa S (desvio padrão

amostral) a partir dos dados, lembrando que:
∑ ( x − x)
n
i
2
S2 = i=1
onde n -1 = graus
de liberdade n−1
 σ2 
X ~ N µ ; 
 n
= X−µ
Portanto, t tem distribuição N (0,1)
113
S n
t = X −µ . σ = z = N(0,1)
S n S Sσ Sσ
Esta distribuição é conhecida como distribuição "t" de

Student, no caso com
(ϕ = n -1) graus de liberdade
O gráfico da função densidade da variável "t" é simétrico e tem a

forma da normal, porém menos "achatada" sua média vale 0 e a
variância em que ϕ é o grau de liberdade

(ϕ > 2)
X−µ
tϕα, 2 =
S n
Então,
(
P −tϕ,α 2≤ t ≤ +tϕ ,α 2 =1− α)
 s ≤µ ≤ + s 
P X −t ϕ, α 2 X t ϕ, α 2  =1−α
 n n
(Pop.
Infinita)
Para caso de populações finitas usa-se a seguinte fórmula:
114
 S N −n ≤µ ≤ + S N −n 
P  X −t ϕ,α / 2 X t ϕ, α / 2 

 n N −1 n N −1 
=1−α (Pop.
Finita)
Ex.: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída

de uma população aproximadamente normal. Construir um intervalo de
confiança paraµ com um nível de 95%.
xi ∑ n ∑ (x −x)
n i 2
X = = 8 7,
i=1
S2 = i=1
≅4 S≅
2n n −1
ϕ =10-1= 9 ϕ =5%
tϕ,α2 = t 9,25. % = ±2,262
R = P(7 27,≤µ≤1013, ) = 95%
Obs.:Quando n>30 e σ for desconhecido poderemos usar S como

uma boa estimativa de σ. Esta estimação será melhor quanto maior for o
tamanho da amostra.
8.2.3 Intervalo de Confiança para Proporções
Sendo p o estimador de π, onde p segue uma distribuição

normal, logo:
p~ Np; pn.q (pop. infinita)
p~ Np; pn.q  N - nN -


1  (pop. finita)
 pˆ.qˆ
115
logo Z = pσ−pπ onde σpˆ ==Xn
pˆ =número
descaracteriza elementos tica da amostra
P
(ˆp− Z α2 σˆp ≤π≤ ˆp + Zα2 σˆp )= 1−α (Pop. Infinita)
Para caso de populações finitas usa-se a seguinte fórmula:
N − n N − n
Pp− Zα 2 σp N − 1 ≤ π≤ p+Zα 2 σp N − 1  =1−α (Pop.
Finita)
Ex.: Uma centena de componentes eletrônicos foram ensaiados e

93 deles funcionaram mais que 500 horas. Determine um intervalo de
confiança de 95% para a verdadeira proporção populacional sabendo
que os mesmos foram retirados de uma população de 1000
componentes.
8.2.4 Intervalo de Confiança para Variância
Como o estimador de σ2 é S2 pode-se considerar que (

n−12)S2 tem
distribuição Qui σ
- quadrado, ou seja:
S2
X2n−1 ~ Z σ2 ,
logo o intervalo será:
116
χ2inf = χ12− ;ϕ χ2sup =χ2 ;ϕ
Assim temos:
(n−1)S2 (n−1)S2 
P 2 ≤σ ≤ 2 =
2
1−α
 Xsup Xinf 
Ex.: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída

de uma população aproximadamente normal. Construir um intervalo de
confiança para σ2 com um nível de 95%.
8.2.5 Intervalo de Confiança para a diferença Entre duas

Médias:
Usualmente comparamos as médias de duas populações

formando sua diferença:
µ1 − µ2
Uma estimativa pontual desta diferença correspondente:
X1 − X2
a) Variâncias Conhecidas
m1 −m2 =(X1 − X 2 )± Za .(Erro Padrão)
2
Erro Padrão?
117
VAR(X1 − X 2 )
=
(+1) VAR X + (− 1) VAR X
2
1
2
2
σ12 + σ22
=
n1 n2
σ2 σ2
= 1+ 2
logo o erro padrão
n1 n2
 σ21 σ 22 σ12 σ 22 
P  (X1 −X2 )−Z α 2 + ≤(µ1 −µ2 )≤(X1 −X2 )+Z α 2 +  =1 −α
 n n n n 
1 2 1 2
Obs.: se σ1 e σ2 são conhecidas e tem um valor em comum, logo:
1 1
Erro Padrão: σ +
n1 n2
Ex.: Seja duas classes muito grande com desvios padrões σ1 =1,21
e σ2 = 2,13. Extraída uma amostra de 25 alunos da classe 1 obteve-se uma
nota média de 7,8, e da classe 2 foi extraída uma amostra de 20 alunos
obteve-se uma nota média de 6,0. Construir um intervalo de 95% de
confiança para a verdadeira diferença das médias populacionais. R =
(LI=0,753; LS=2,847)
b) Variâncias Desconhecidas
Em geral conhecemos duas variâncias populacionais (σ21 e σ 22). Se

as mesmas são desconhecidas o melhor que podemos fazer é estimá-las
por meio de variâncias amostrais
S21 e S22.
Como as amostras serão pequenas, introduziremos uma fonte de

erro compensada pela distribuição "t":
118
 S2 S2 S2 S2 
P (X1 −X2 )−t α 2 1 + 2 ≤µ1 −µ2 ≤(X1 −X2 )+t α 2 1 + 2 
 n n n n 
1 2 1 2
onde ϕ= n 1 + n 2
−2
Obs.: Se as variâncias populacionais são desconhecidas, mas as

estimativas são iguais,
Poderemos usar para o Erro Padrão o seguinte critério:
Erro Padrão: SC
n11 + n12 onde Sc é o desvio padrão conjunto
= (n1 −1)S12 +(n2 −1)S22
SC n1 + n2 −2
Ex1.: De uma turma (1) foi extraída uma amostra de 6 alunos com
as seguintes alturas: 150, 152, 153, 160, 161, 163. De uma segunda
turma foi extraída uma amostra de 8 alunos com as seguintes alturas:
165, 166, 167, 172, 178, 180, 182, 190. Construir um intervalo de 95%
de confiança para a verdadeira diferença entre as médias populacionais.
Ex2.: De uma máquina foi extraída uma amostra de 8 peças, com

os seguintes diâmetros: 54, 56, 58, 60, 60, 62, 63, 65. De uma segunda
máquina foi extraída uma amostra de 10 peças, com os seguintes
diâmetros: 75, 75, 76, 77, 78, 78, 79, 80, 80, 82. Construir um intervalo
de 99% de confiança para a diferença entre as médias populacionais,
supondo que as máquinas foram construídas pelo mesmo fabricante.
8.2.6 Intervalo de Confiança para a Diferença entre duas

Proporções
 p q p q p q p q 
P  (p1 −p2 )−Z α 2 1 1 + 2 2 ≤π1 −π 2 ≤(p1 −p2 )+Z α 2 1 1 + 2 2  =1 −α
 n1 n2 n1 n2 
Ex.: Em uma pesquisa realizada pelo Instituto Gallup constatou

que 500 estudantes entrevistados com menos de 18 anos, 50%
acreditam na possibilidade de se verificar uma modificação na América,
e que dos 100 estudantes com mais de 24 anos, 69% acreditam nessa
119
modificação. Construir um intervalo de confiança para a diferença entre
as proporções destas subpopulações usando α=5%. R=(LI=0,0893,
LS=0,2905)
8.3 Exercícios
1) Ao se realizar uma contagem de eritrócitos em 144 mulheres

encontrou-se em média 5,35 milhões e desvio padrão 0,4413
milhões de glóbulos vermelhos. Determine os limites de
confiança de 99% para a média populacional.
2) Um conjunto de 12 animais de experiência receberam uma dieta

especial durante 3 semanas e produziram os seguintes aumentos
de peso (g): 30, 22, 32, 26, 24, 40, 34, 36, 32, 33, 28 e 30.
Determine um intervalo de 90% de confiança para a média. R ⇒
X=30.58, S = 5.09,LI = 27.942, LS = 33.218
3) Construa um intervalo de 95 % de confiança para um dos

seguintes casos:
Média σ Tamanho da
Amostral Amostra
a) 16,0 2, 16
0 b)
37,5 3, 36 c)
0 d)
2,1 0, 25
4) 5 Numa tentativa de
0,6 0, 100 melhor o esquema de
1 atendimento, um
médico procurou
estimar o tempo médio que gasta com cada paciente. Uma
amostra aleatória de 49 pacientes, colhida num período de 3
semanas, acusou uma média de 30 min., com desvio padrão de 7
min. Construa um intervalo de 95% de confiança para o
verdadeiro tempo médio de consulta.
5) Solicitou-se a 100 estudantes de um colégio que anotasse suas

despesas com alimentação e bebidas no período de uma semana.
Há 500 estudantes no colégio. O resultado foi uma despesa de
$40,00 com um desvio padrão de $10,00. Construa um intervalo
de 95% de confiança para a verdadeira média.
120
6) Uma amostra aleatória de 100 fregueses da parte da manhã de
um supermercado revelou que apenas 10 não incluem leite em
suas compras.
a) qual seria a estimativa percentual dos fregueses que compram
leite pela parte da manhã. (α = 5%). R LI = 84.12%, LS = 95.88%
b) construir um intervalo de 90% de confiança para a verdadeira
proporção dos fregueses que não compram leite pela manhã. R LI
= 5.08%, LS = 14.92%
7)Uma amostra aleatória de 40 homens trabalhando num grande

projeto de construção revelou que 6 não estavam usando
capacetes protetores. Construa um intervalo de 98% de confiança
para a verdadeira proporção dos que não estão usando capacetes
s
neste projeto. R P = 0.056, LI = 0.02, LS = 0.28
121
8)De 48 pessoas escolhidas aleatoriamente de uma longa fila de
espera de um cinema, 25% acharam que o filme principal
continha demasiada violência.
a) qual deveria ser o tamanho da fila, a partir do qual se pudesse
desprezar o fator de correção finita;
b) construa um intervalo de 98% de confiança para a verdadeira
proporção, se há 100 pessoas na fila;
c) construa um intervalo de 98% de confiança para a verdadeira
proporção, se há 500 pessoas na fila.
9) Em uma fábrica, colhida uma amostra (n = 30) de certa peça,

obtiveram-se as seguintes medidas para os diâmetros:
10 11 11 11 12 12 12 12 13 13
13 13 13 13 13 13 13 13 13 13
14 14 14 14 14 15 15 15 16 16
a) estimar a média e a 13,13 e

variância; R 2,05
b)construir um intervalo de confiança para a média, sendo α = 5%.
(LI = 12.536 e LS = 13.664)
c) construir um intervalo de 95 % de confiança para a média,
supondo que a amostra tenha sido retirada de uma população de
100 peças, sendo α = 5%. (LI = 12.581 e LS =
13.579)
d)Construir um intervalo de confiança para a variância
populacional, sendo α = 5%. (LI = 1.3003 e LS = 3.704)
10) Supondo populações normais, construir um intervalo de

confiança para a média e para a variância ao nível de
significância de 90% para as amostras.
a) 2 3 4 5 5 6 6 7 8 8 9
n = 11
b) 12 12 15 15 16 16 17 18 20 22
22 23 n = 12
c) 25 25 27 28 30 33 34 35 36
n=9
11) Sendo X uma população tal que X ~ N(µ;σ2 ) em que µ e σ² são
desconhecidos.
Uma amostra de tamanho 15 forneceu os seguintes valores ∑X =

i
8,7, e
122
. Determinar um intervalo de confiança de 95% para µ e σ² ,
supondo:
X= ∑X i e S2 = ∑X2i −∑nXi  2
n n−1
12) Dados os seguintes conjuntos de medias, determinar um

intervalo de 99% de confiança para a variância populacional e
para a média populacional.
0.0105; 0,0193; 0,0152; 0,0229; 0,0244; 0,0190; 0,0208; 0,0253;

0,0276
R X=O.0206, LI = 0.01467, LS = 0.026653;

S = 0.0053, LI = 0.00001, LS = 0.000167
13) O tempo de reação a uma injeção intravenosa é em média de

2.1 min., com desvio padrão de 0.1 min., para grupos de 20
pacientes. Construa um intervalo de confiança de 90 % para o
tempo médio para toda a população dos pacientes submetidos ao
tratamento.
14) Uma firma esta convertendo as máquinas que aluga para

uma versão mais moderna. Até agora foram convertidas 40
máquinas. O tempo médio de conversão foi de 24 horas com
desvio padrão de 3 horas. a) determine um intervalo de
confiança de 99 % para o tempo médio de conversão. b) Para
uma amostra de 60 máquinas, como ficaria o intervalo de
confiança de 99 % para o tempo médio de conversão
15) Seis dentre 48 terminais telefônicos dão respostas de

ocupado. Uma firma possui 800 terminais. Construir um
intervalo de confiança de 95 % para a proporção dos terminas
da firma que apresentam sinal de ocupado. R LI = 3.4%, LS = 21.6%
16) Uma amostra de 50 bicicletas de um estoque de 400

bicicletas, acusou 7 com pneus vazios. a) Estime o número de
bicicletas com pneus vazios: b) Construa um intervalo de 99 %
confiança para a população das bicicletas com pneus vazios.
R a) 56; b) LI = 0.021 LS = 0.258
123
17) A média salarial semanal para uma amostra de n = 30
empregados em uma grande firma é X = 180,00 com desvio
padrão S = 14,00. Construa um intervalo de confiança de 99 %
para a média salarial dos funcionários.
18) Uma empresa de pesquisa de mercado faz contato com uma

amostra de 100 homens em uma grande comunidade e verifica
que uma proporção de 0.40 na amostra prefere lâminas de
barbear fabricadas por seu cliente em vez de qualquer outra
marca. Determinar o intervalo de confiança de 95 % para a
proporção de todos os homens na comunidade que preferem a
lâmina do cliente.
19) Uma pequena fábrica comprou um lote de 200 pequenas

peças eletrônicas de um saldo de estoque de uma grande firma.
Para uma amostra aleatória de 50 peças, constatou-se que 5
eram defeituosas. Estimar a proporção de todas as peças que
são defeituosas no carregamento utilizando um intervalo de
confiança de 99 %.
20) Duas amostras de plantas foram cultivadas com dois

fertilizantes diferentes. A primeira amostra oriunda de 200
sementes, acusou altura média de 10,9 cm e desvio padrão 2,0
cm. A segunda amostra, de 100 sementes, acusou uma altura
média de 10,5 cm com desvio padrão de 5,0 cm. Construir um
intervalo de confiança entre as alturas médias das populações ao
nível de 95% de confiança.
21) Uma amostra aleatória de 120 trabalhadores de uma grande

fábrica leva em média 22,0 min. para executar determinado
serviço, com S2 de 4 min2. Em uma segunda fábrica, para
executar a mesma tarefa, uma amostra aleatória de 120
operários, gasta em média 19,0 min com S2 de 10 min2.
Construir um intervalo de 99% de confiança entre as médias das
populações.
22) Extraíram-se amostras independentes de adultos brancos e

pretos, que acusaram os seguintes tempos (em anos) de
escolaridade.
Branco 8 18 10 10 14
Preto 9 12 5 10 14 12 6
Construir um intervalo de 95% de confiança para:
124
a)a média da população branca, e a média da população preta;
b)a diferença entre as médias entre brancos e pretos
23) Em uma amostra aleatória de cinco pessoas, foi medida a

capacidade toráxica antes e após determinado tratamento,
obtendo-se os dados a seguir. Construir um intervalo de 95% de
confiança para a diferença entre as médias antes e depois do
tratamento.
Capacidade
Pessoa Toráxica
Antes Após (Y)
(X)
A 2750 2850
B 2360 2380
C 2950 2930
D 2830 2860
E 2250 2320
24) Extraída duas amostras de professores homens e mulheres,

obteve-se os seguintes resultados quantos aos salários em
milhares de dólares: Construir um intervalo de 95% de confiança
para:
Homens Mulheres
n1 = 25 n2 = 5
X1 = X2 = 11,0
16,0
S1 = 16
2
S22 = 10
a)a média da diferença entre os salários;

b)a média do salário dos homens;
c) a média do salário das mulheres.
25) Em uma pesquisa efetuada em com 1650 americanos foram

consultados sobre o seguinte tema: "A mulher grávida pode
procurar um médico e interromper a gravidez, a qualquer
momento durante os três primeiros meses. É a favor ou contra
esta decisão?" Uma semana mais tarde foram consultados 1650
americanos foram consultados sobre o mesmo assunto , exceto
que a pergunta "a favor do aborto, ao invés de "interromper a
gravidez". As respostas foram as seguintes:
125
Resposta a
Pergunta
A favor Contra Sem opinião
"Interromper a 46% 39% 15%
gravidez"
"A favor do aborto" 41% 49% 10%
a)Seja π1 a proporção dos votantes a favor do 1o caso (interromper)

e π2 a proporção dos votantes a favor do 2 o caso (aborto).
π
Construir um intervalo de 95% de confiança para a diferença 1 -
π
2 . R = LI = 0.01628, LS = 0.08379
b)Repetir a (a) para os votantes que não tiveram opinião. R = LI =

0.0275, LS = 0.0725
26) Numa pesquisa sobre intenção do comprador brasileiro. 30

famílias de uma amostra aleatória de 150 declararam ser uma
intenção comprar um carro novo dentro de um ano. Uma outra
amostra de 160 famílias 25 declararam a mesma intenção.
Construir um intervalo de 99% de confiança para as diferenças
entre as proporções.
R = LI = 0.0727, LS = 0.1527
9 Teste de Hipóteses
Trata-se de uma técnica para se fazer inferência estatística. Ou seja, a

partir de um teste de hipóteses, realizado com os dados amostrais, pode-
se inferir sobre a população.
No caso da inferência através de Intervalo de confiança, busca-se

"cercar" o parâmetro populacional desconhecido. Aqui formula-se uma
hipótese quanto ao valor do parâmetro populacional, e pelos elementos
amostrais faz-se um teste que indicará a ACEITAÇÃO ou REJEIÇÃO da
hipótese formulada.
9.1 Principais Conceitos
126
9.1.1 Hipótese Estatística
Trata-se de uma suposição quanto ao valor de um parâmetro

populacional, ou quanto à natureza da distribuição de uma variável
populacional.
São exemplos de hipóteses estatísticas:
a)A altura média da população brasileira é 1,65 m, isto é: H: µ =

1,65 m;
b)A variância populacional dos salários vale $ 5002, isto é, H: σ2
= 5002 ;
c) A proporção de paulistas fumantes é 25%, ou seja, H: p = 0.25
d)A distribuição dos pesos dos alunos da nossa faculdade é
normal.
9.1.2 Teste de Hipótese
É uma regra de decisão para aceitar ou rejeitar uma hipóteses

estatística com base nos
elementos amostrais.
9.1.3 Tipos de Hipóteses
Designa-se por Ho, chamada hipótese nula, a hipóteses estatística

a ser testada, e por H 1 a hipótese alternativa. A hipótese nula expressa
uma igualdade, enquanto que a hipótese alternativa é dada por uma
desigualdade (≠ , < , >).
Exemplos:
H0:Θ =θ0
H1:Θ≠θ0 Teste Bicaudal ou Bilateral

H0:Θ =θ0
H1:Θ>θ0 Teste Unilateral Direito
127
H 0:Θ =θ0
H1:Θ<θ0 Teste Unilateral Esquerdo
9.1.4 Tipos de erros
Há dois tipos de erro ao testar uma hipótese estatística. Pode-se

rejeitar uma hipóteses quando ela é, de fato verdadeira, ou aceitar uma
hipóteses quando ela é, de fato, falsa. A rejeição de uma hipótese
verdadeira é chamada "erro tipo I". A aceitação de uma hipótese falsa
constitui um "erro tipo II".
As probabilidades desses dois tipos de erros são designados,

respectivamente, por α e β.
A probabilidade α do erro do tipo I é denominada "nível de

significância" do teste.
Os possíveis erros e acertos de um teste estão sintetizados

abaixo:
Realidade
Ho verdadeira Ho falsa
Aceitar Decisão correta (1 - Erro Tipo II (β)
Decisã Ho α)
o Rejeitar Erro Tipo I (α) Decisão Correta (1 -

Ho β)
Observe que o erro tipo I só poderá acontecer se for rejeitado H o

e o erro tipo II quando for aceito Ho.
9.2 Teste de significância
Os testes de Significância considera somente erros do tipo α, pois

são os mais usados
em pesquisas educacionais, socioeconômicas.
O procedimento para realização dos testes de significância é

resumido nos seguintes passo:
128
1o) Enunciar as hipóteses H0 e H1;
2o) fixar o limite do erro α, e identificar a variável do teste;
3o) com o auxílio das tabelas estatísticas, considerando α e a
variável do teste, determinar as RR (região de rejeição) e RA
(região de aceitação) para Ho;
4o) com os elementos amostrais, calcular o valor da variável do
teste;
5o) concluir pela aceitação ou rejeição do H0 pela comparação do
valor calculado no
4o passo com RA e RR.
9.2.1 Teste de significância para a média
1. Enunciar as hipóteses:
µ ≠ µ0 (a)
µ :
H0 : µ = 0 H1 µ > µ0 (b)
µ < µ0 (c)
2. Fixar α. Admitindo:
- Se a variância populacional σ2 for conhecida, a variável teste

será "Z" (n>30);
- Se a variância populacional σ2 for desconhecida, a variável teste
será "t" de Student com ϕ = n -1 (n ≤ 30).
3. Com o auxílio das tabelas "Z" e "t" determinar as regiões RA

e RR;
(a) (b) (c)

4. Calcular o valor da variável:
Zcal = X −σµ0 tcal = X −Sµ0
129
n n
onde: X = média amostral

µ0 = valor da
hipótese nula
5. Conclusão para a situação ( a )
- Se Zcal , não se pode rejeitar Ho.
- Se Zcal ou Zcal ou tcal ou tcal >+t , rejeita-se Ho.
OBS.: Para qualquer tipo de teste de significância devemos

considerar:
- Se a variável teste (calculada) cair dentro da região
de aceitação (RA) não se pode rejeitar Ho;
- Se a variável teste (calculada) cair fora da região
de aceitação (RA) rejeita-se Ho.
Ex.: Os dois registros dos últimos anos de um colégio, atestam

para os calouros admitidos uma nota média de 115 pontos
(teste vocacional). Para testar a hipótese de que a média de
uma nova turma é a mesma, tirou-se, ao acaso, uma amostra
de 20 notas, obtendo-se média 118 e desvio padrão 20.
Admitir α = 5%, para efetuar o teste. (R = aceita-se Ho)
9.2.2 Teste de significância para a proporção
1.Enunciar as hipóteses:
π≠ p0 (a)

Ho : π = po H1: π> p0 (b)
π< p0 (c)
2.Fixar α. Escolhendo a variável normal padrão "Z";
3.Com o auxílio da tabela "Z" determinar as regiões RA e RR;
130
(a) (b) (c)
4.Calcular o valor da variável:
Zcal = fp− .p q0
0 0
n
onde f = Xn
onde: f = freqüência relativa do evento

na amostral X = característica
dentro da amostra po = valor da
hipótese nula
5.Conclusão para a situação (a)
- Se , não se pode rejeitar Ho.
- Se Zcal ou Zcal, rejeita-se Ho.
Ex.: As condições de mortalidade de uma região são tais que a

proporção de nascidos que sobrevivem até 60 anos é de 0,6 .
Testar essa hipótese ao nível de 2%, se
em 1000 nascimentos amostrados aleatoriamente, verificou-
se 530
sobreviventes até 60 anos. (R = rejeita-se Ho)
9.2.3 Teste de significância para a varância
 (a)
Ho : σ2 = σ20 H1: (b)
131

 (c)
2.Fixar α. Escolhendo a variável qui-quadrado com ϕ = n -1.

3.Com o auxílio da tabela "χ2" determinar as regiões RA e RR;
(a) (b) (c)
Para ( a ) temos:χ2inf = χ12− χ2sup =χ2

;ϕ ;ϕ
Para ( b ) temos:χ2sup =χ2α; ϕ
Para ( c ) temos:χ2inf =χ12−α; ϕ
χ2cal = (n −σ120)S2
onde: S2 = variância
amostral σ2 = valor
da hipótese nula
5.Conclusão para a situação (a)
- Se χ2inf ≤χcal ≤χ2sup, não se pode rejeitar Ho.
- Se χ2cal <χ2inf ou χ2cal >χ2sup , rejeita-se Ho.
Ex.: Para testar a hipótese de que a variância de uma população

é 25, tirou-se uma amostra de 25 elementos obtendo-se S 2 =
18,3. Admitindo-se α = 5%, efetuar o teste de significância
unicaudal a esquerda. (R = aceita-se Ho)
132
10.2.4 Teste de significância para igualdade de duas
médias
1o caso) Se as variâncias populacionais σ2 forem conhecidas e

supostamente iguais, independentes e normais, a
variável teste será "Z" (n1+ n2 > 30) ;
µ1 ≠µ2
Ho : µ1 = µ2 ou µ1 - µ2 = d H1:µ1 −µ2 ≠ d
onde d é a diferença admitida
entre as duas médias.
(X − X )−d
1 2
Zcal = σ21 +σ22
n1 n2
5.Conclusão:
Optar pela aceitação ou rejeição de Ho.
Ex.: Um fabricante de pneus faz dois tipos. Para o tipo A, σ =

2500 Km, e para o tipo B, σ = 3000 Km. Um taxi testou 50
pneus do tipo A e 40 pneus do tipo B, obtendo 24000 Km e
26000 Km de duração média dos respectivos tipos. Adotando
um risco de 4% e que existe uma diferença admitida de 200
Km entre as marcas, testar a hipótese de que a vida média
dos dois tipos é a mesma. (R = rejeita-se Ho)
2o caso) Se as variâncias populacionais σ2 forem desconhecidas,

independentes e normais, a variável teste será "t" (n1 +
133
n2 ≤ 30) com ϕ = n1 + n2 -2;
a) As estimativas diferentes
µ µ µ µ µ ≠µ
Ho : 1 = 2 ou 1 - 2 =
H1:µ11 −µ22 ≠
d d
2.Fixar α. Escolhendo a variável "t" de Student;
3.Com o auxílio da tabela "t" determinar as regiões RA e RR;
(X − X )
1 2 −d
tcal = 2 S 22
S1 +
n1
n2
5.Conclusões:
Ex.: Dois tipos de pneus foram testados sob as mesmas

condições meteorológicas. O tipo A fabricado pela fabrica A,
registrou uma média de 80.000 km rodados com desvio
padrão de 5.000 km. em 6 carros amostradas. O tipo B
fabricado pela fábrica B, registrou uma média de 88.000 km
com desvio padrão de 6.500 km em
12 carros amostradas. Adotando α = 5% testar a hipótese da
igualdade das médias.
b) As estimativas iguais
134
µ1 ≠µ2
Ho : µ1 = µ2 ou µ1 - µ2 = d H1:µ1 −µ2 ≠ d

2.Fixar α. Escolhendo a variável "t" de Student;
3.Com o auxílio da tabela "t" determinar as regiões RA e RR;
t cal = (X1 − X2 )−d onde SC = (n1 −1)S12 +(n2 −1)S22

1
Sc . +1 n1 + n2 −2
n1 n2
5.Conclusões:
Ex.: Dois tipos de tintas foram testados sob as mesmas

condições meteorológicas. O tipo A registrou uma média de
80 min para secagem com desvio padrão de 5 min. em cinco
partes amostradas. O tipo B, uma média de 83 min com
desvio padrão de 4 min. em 6 partes amostradas. Adotando α
= 5% testar a hipótese da igualdade das médias. (R = aceita-se
Ho)

proporções
Ho: π1 = π2 H1: π1 ≠ π2
135
Zcal = pp11−−2.pq21−2 onde p1 = Xn11 , p2 = Xn22 , p1−2 = Xn11 +

+Xn22
5.Conclusões:
Ex.: Deseja-se testar se são iguais as proporções de homens e

mulheres que lêem revista e se lembram do determinado
anúncio. São os seguintes os resultados da amostra aleatória
independente de homens e mulheres: Admita α = 10%.
Home Mulhe
ns res
X1 = X2 = 50
70 n1 = n2 =
200 200

variâncias
H0: σ12 =σ22 H
2. Fixar α. Escolhendo a variável "F" com ϕ1 = n1 - 1 graus de

ϕ
liberdade no numerador, e 2 = n2 - 1 graus de liberdade no
denominador.
3. Com o auxílio da tabela "F" determinar as regiões RA e RR;
136
Fsup = Fα(ϕ1,ϕ2)
1
Finf = F1−α(ϕ1,ϕ2 )= (ϕ 2 ,ϕ1)
Fα
4. Calcular o valor da variável:
Fcal = SS2122
5. Conclusões:
Ex.: Dois programas de treinamento de funcionários foram

efetuados. Os 21 funcionários treinados no programa antigo
apresentaram uma variância de 146 pontos em sua taxa de
erro. No novo programa, 11 funcionários apresentaram uma
variância de 200. Sendo α = 10%, pode-se concluir que a
variância é diferente para os dois programas?
9.3 Exercícios
1) O crescimento da indústria da lagosta na Flórida nos últimos

20 anos tornou esse estado americano o 2 o mais lucrativo
centro industrial de pesca. Espera-se que uma recente medida
tomada pelo governo das Bahamas, que proibiu os pescadores
norte americanos de jogarem suas redes na plataforma
continental desse país. Produza uma redução na quantidade
de Kg de lagosta que chega aos Estados Unidos. De acordo
com índices passados, cada rede traz em média 14 Kg de
lagosta. Uma amostra de 20 barcos pesqueiros, recolhida
após a vigência da nova lei, indicou os seguintes resultados,
em Kg (Use α = 5%)
137
7.89 13.29 17.96 15.6 8.89
15.28 16.87 19.68 18.91 12.47
10.93 9.57 5.53 11.57 10.02
8.57 17.96 10.79 19.59 11.06
Estes dados mostram evidências suficientes de estar

ocorrendo um decréscimo na quantidade média de lagostas
pescadas por barco, que chega aos Estados Unidos, depois do
decreto do governo das Bahamas? Teste considerando α =
5%.
(bilateral)
2) Os resíduos industriais jogados nos rios, muitas vezes,

absorvem oxigênio, reduzindo assim o conteúdo do oxigênio
necessário à respiração dos peixes e outras formas de vida
aquática. Uma lei estadual exige um mínimo de 5 p.p.m.
(Partes por milhão) de oxigênio dissolvido, a fim de que o
conteúdo de oxigênio seja suficiente para manter a vida
aquática. Seis amostras de água retiradas de um rio, durante
a maré baixa, revelaram os índices (em partes por milhão) de
oxigênio dissolvido:
4.9 5.1 4.9 5.5 5.0 4.7
Estes dados são evidência para afirmar que o conteúdo de

oxigênio é menor que 5 partes por milhão? Teste considerando
α = 5% e α = 1%.
3) A Debug Company vende um repelente de insetos que alega

ser eficiente pelo prazo de 400 horas no mínimo. Uma análise
de 90 itens aleatoriamente inspecionados acusou uma média
de eficiência de 380 horas.
a)Teste a afirmativa da companhia, contra a alternativa que a

duração é inferior a 400 horas, ao nível de 1%, seu desvio
padrão é de 60 horas.
b)Repita o teste, considerando um desvio padrão populacional de
90 horas.
4) Ao final de 90 dias de um dieta alimentar envolvendo 32

pessoas, constatou-se o seguinte ganhos médio de peso 40 g, e
desvio padrão de 1,378g.
138
a) Supondo que o ganho de peso médio dessas pessoas é de 45 g,
teste a hipótese para α = 5%, se esse valor é o mesmo
(bilateral)
b)Supondo que a variância dessas pessoas é de 1.8 g 2, teste a
hipótese para α = 5%, se esse valor é o mesmo (bilateral).
5) Uma pesquisa feita alega que 15% dos pessoas de uma

determinada região sofrem de cegueira aos 70 anos. Numa
amostra aleatória de 60 pessoas acima de 70 anos constatou-
se que 12 pessoas eram cegas. Teste a alegação para α = 5%
contra p >
139
15%.
6) A tabela abaixo mostra a quantidade de pessoas que obtiveram

o melhor efeito perante a aplicação de duas drogas:
Droga A Droga B
Sexo muscular intravenos muscular Total
a
Masculin 21 10 22 53
o
Feminino 20 12 25 57
Total 41 22 47 110
a) Testar a hipótese de que a proporção de homens submetidos a

droga A é de 35%, sendo α = 3%.
b)Testar a hipótese de que a proporção dos adultos que tiveram
melhor resultado nas aplicações musculares é de 85%, usando
α = 2%.
c) Testar a hipótese de que a proporção de mulheres é de 50%,
usando α = 5%.
d)Testar a hipótese de que a proporção de pessoas submetidos a
droga A é de 65%, usando α = 4%.
7) Um processo de fabricação de arame de aço dá um produto

com resistência média de 200 psi. O desvio padrão é de 20
psi. O engenheiro de controle de qualidade deseja elaborar
um teste que indique se houve ou não variação na média do
processo, usando uma amostra de 25 arames obteve-se uma
média de 285 psi. Use um nível de significância de 5%.
Suponha normal a população das resistências.
8) A DeBug Company vende um repelente para insetos que

alega ser eficiente pelo prazo de 400 horas no mínimo. Uma
análise de 9 itens escolhidos aleatoriamente acusou uma
média de eficiência de 380 horas. a) Teste a alegação da
companhia, contra a alternativa que a duração é inferior a
400 horas no mínimo ao nível de 1%, e o desvio padrão
amostral é de 60 horas. b) Repitas o item (a) sabendo que o
desvio padrão populacional é de 90 horas.
9) Um laboratório de Análises Clínicas realizou um teste de

impurezas em 9 porções de um determinado composto. Os
valores obtidos foram: 10,32; 10,44; 10;56; 10,.60; 10,63;
10,67; 10,7; 10.73; 10,75 mg. a) estimar a média e a
140
variância de impurezas entre as porções. b) Testar a hipótese
de que a média de impureza é de
10.4, usando α = 5%. c) Testar a hipótese de que a variância é um
usando α =
5%.
10) Uma experiência tem mostrado que 40% dos estudantes de

uma Universidade reprovam em pelo menos 5 disciplinas
cursada na faculdade. Se 40 de 90 estudantes fossem
reprovados em mais de 5 disciplinas, poderíamos concluir
quanto a proporção populacional, usando α = 1%.
11) Para verificar a eficácia de uma nova droga foram injetados

doses em 72 ratos, obtendo-se a seguinte tabela:
Sexo Tamanho da Amostra Variância

Machos 41 43.2
Fêmeas 31 29.5
Testar a igualdade das duas variâncias usando α = 10%.
12) Sendo
Amostra 1 n1 = 60 X 1 = 5.71 σ12 = 43

Amostra 2 n2 = 35 X2 = 4.12 σ22 = 28
a)Testar a igualdade das duas médias usando α = 4%.

b)Testar a igualdade das duas variâncias usando α = 5%
13) Na tabela abaixo estão registrados os índices de vendas em
6 supermercados para os produtos concorrentes da marca A
e marca B. Testar a hipótese de que a diferença das médias
no índice de vendas entre as marcas é zero, usando α = 5%.
Supermercad Marca A Marca B

o
1 14 4
2 20 16
3 2 28
4 11 9
5 5 31
6 12 10
141
14) Da população feminina extraiu-se uma amostra resultando:
Renda (em $1000) 10 |--- 25 25 |--- 40 40 |--- 55 55 |--- 70 70 |---85

No de 7 12 10 6 4
mulheres
da população masculina retirou-se uma amostra

resultando:
Renda (em $1000) 10 |--- 25 25 |--- 40 40 |--- 55 55 |--- 70 70 |---85

No de homens 8 15 12 7 3
a) Testar ao nível de 10% a hipótese de que a diferença entre a

renda média dos homens e das mulheres valha $ 5000.
b) Testar ao nível de 5% a hipótese de que a diferença entre as

variâncias valha 0.
15) Uma empresa de pesquisa de opinião seleciona,

aleatoriamente, 300 eleitores de São Paulo e 400 do Rio de
Janeiro, e pergunta a cada um se votará ou não num
determinado candidato nas próximas eleições. 75 eleitores
de SP e 120 do RJ responderam afirmativo. Há diferença
entre as proporções de eleitores favoráveis ao candidato
naqueles dois estados? use α = 5%.
16) Estão em teste dois processos para fechar latas de

comestíveis. Numa seqüência de 1000 latas, o processo 1
gera 50 rejeições, enquanto o processo 2 acusa 200
rejeições. Pode ao nível de 5%, concluir que os dois
processos sejam diferentes?
9.4 Teste do Qui-quadrado c2
Anteriormente foi testado hipóteses referentes a um parâmetro

populacional ou mesmo a comparação de dois parâmetros, ou seja, são
os testes paramétricos. Agora será testado aqueles que não dependem
de um parâmetro populacional, nem de suas respectivas estimativas.
Este teste é chamado de teste do Qui-quadrado.
O teste do Qui-quadrado é usado quando se quer comparar

frequências observadas com frequências esperadas. Divide-se em três
tipos:
142
- Teste de adequação do ajustamento
- Teste de Aderência
- Teste de Independência (Tabela de Contingência)
9.4.1 Procedimentos para a realização de um teste Qui-

quarado (c2)
1o) Determinação das Hipóteses:

Ho: Fo = Fe H 1: F o ≠ F e
2o) Escolha do Nível de Significância (α)
3o) Estatística Calculada χ2cal =∑k (Fo − Fe )2

i=1
o
Fe 4) Estatística Tabelada:
5o) Comparar o χ 2
cal com χ 2
tab e concluir:
6o) Conclusão:
Se χ 2
cal ≤ χ 2
tab → aceita-se Ho
Se χ cal > χ 2tab → rejeita-se Ho

2
9.4.2 Teste de adequação do ajustamento
Suponhamos uma amostra de tamanho n. Sejam E1, E2, ..., Ek, um

conjunto de
143
eventos possíveis da amostra.
Eventos Freq. Obs.

E1 Fo1
E2 Fo2
: :
Ek Fok
Total n
Este teste é indicado para verificar se as frequências observadas

dos k eventos (k
classes em que a variável é dividida) concordam ou não com as
frequências teóricas esperadas.
As frequências esperadas (Fei) são obtidas multiplicando-se o

número total de elementos pela proporção teórica da classe i (n. p i).
Para encontrar o χ cal , necessita-se do nível de Significância (α)
2
e dos graus de
liberdade (ϕ), os quais podem ser obtidos da seguinte forma:
1o) ϕ = k - 1, quando as frequências esperadas puderem ser

calculadas sem que façam estimativas dos parâmetros populacionais a
partir das distribuições amostrais.
2o) ϕ = k - 1 - m, quando para a determinação das frequências

esperadas, m parâmetros tiverem suas estimativas calculadas a partir
das distribuições amostrais. Pearson mostrou que, se o modelo testado
for verdadeiro e se todas as F ei ≤ 5%, estas deverão ser fundidas às
classes adjacentes.
Ex1.: Deseja-se testar se o número de acidentes numa rodovia se

distribui igualmente pelos dias da semana. Para tanto foram
levantados os seguintes dados (α =
5%).
Dia da Semana Dom Seg Ter Qua Qui Sex Sab

No de Acidentes 33 26 21 22 17 20 36
Resolução:
144
Ho: As frequências são iguais em todos os dias
H1:As frequências são diferentes em todos os dias
Dia da Semana Dom Seg Ter Qu Qui Sex Sa k=

a b 7
No de 33 26 21 22 17 20 36 17
Acidentes 5
pi 1/7 1/7 1/7 1/7 1/7 1/7 1/7 ---
Fe = n . pi 25 25 25 25 25 25 25 ---
χ2 = (33− 25)2 + (26 − 25)2 +... + (36− 25)2 =12

calc
25 25 25
χ2cal = 12 χ 2tab = χ25%,6 =12.5
Conclusão: Como o χ2cal < χ2tab, aceita-se Ho, ou seja, para α = 5%,
as frequências podem ser iguais.
Ex2.: O número de livros emprestados por uma biblioteca

durante certa semana está a seguir. Teste a hipótese que o número de
livros emprestados não dependem do dia da semana, com α = 1%.
Dia da Semana Seg Ter Qua Qui Sex

No de Livros 110 135 120 146 114
R = χ2cal = 7.29 ; χ 2tab = χ12%,4 = 13 28.
9.4.3 Teste de aderência
É usada a estatística χ2 quando deseja-se testar a natureza da

distribuição amostral. Por exemplo, quando se quer verificar se a
distribuição amostral se ajusta a um determinado modelo de
distribuição de probabilidade (Normal, Poisson, Binomial, ...), ou seja,
verifica-se a boa ou má, aderência dos dados da amostra do modelo.
Ex1.: O número de defeitos por unidade de uma amostra de 100

aparelhos de TV produzidos por uma linha de montagem
apresentou a seguinte distribuição:
145
No de Defeitos 0 1 2 3 4 5 6 7
N de Aparelhos
o
25 35 18 13 4 2 2 1
Verificar se o número de defeitos por unidade segue

razoavelmente uma distribuição de Poisson, com α = 5%.
Resolução:
Ho: A distribuição do no de defeitos/unidade segue uma Poisson

H1: A distribuição do no de defeitos/unidade não segue uma
Poisson
No de Defeitos 0 1 2 3 4 5 6 7 n
N de Aparelhos
o
25 35 18 13 4 2 2 1 100
pi 0.212 0.32 0.25 0.132 0.051 0.016 0.00 0.001 1.000
9 5 4
Fe = n . pi 21.2 32.9 25.5 13.2 5.1 1.6* 0.4* 0.1* 100
e−µµi
Para calcular pi, temos: pi = (Distribuição
de Poisson) i!
n
∑X .f i i
µ= X = i=1
= 155.
n
e−1.55(1.55)0
p 0= = 0.212 p
0!
e−1.55 (1.55)1
p1 = = 0.329 p
1!
e−1.55(1.55)2
p 2= = 0.255 p
2!
e−1.55 (1.55)3
p 3= = 0.132 p
146
3!
* = Fei ≤ 5%, logo deve ser agrupada com a classe adjacente.
(25− 21.2)2 + (35 − 32.9)2 + ...+ (9 − 7.2)2

=3.474 χcalc2 =
21.2 32.9 7.2
4−5−6−7
k = 5 (número de classes após

agrupamento) ϕ= k −1−m = 5−1−1 = 3 
m =1 (número de estimadores usados) (X)
χ 2tab = χ25%,3 = 7.81
Conclusão: Como o 2
tab , aceita-se Ho, ou seja, para α = 5%,
a distribuição do número de defeitos/unidade pode
seguir uma Distribuição de Poisson.
Ex2.: Verificar se os dados das distribuição das alturas de 100
estudantes do sexo feminino se aproxima de uma
distribuição normal, com α = 5%.
Resolução:
Altura (cm) o
N de Transf. "Z" Prob (área) Fe = n . pi
Estudantes
150 |--- 156 4 -∞ |--- - 0.026 * 2.6
156 |--- 162 12 1.94 0.123 12.3
162 |--- 168 22 -1.94 |--- - 0.295 29.5
168 |--- 174 40 1.04 0.332 33.2
174 |--- 180 20 -1.04 |--- - 0.175 17.5
180 |--- 186 2 0.14 0.048 * 4.8
H
-0.14 |---
o 0.76 :
0.75 |--- A
1.66
1.66 |---
+∞
k=6 100 1.000 100.0
distribuição da altura das estudantes do sexo feminino é normal
147
H1: A distribuição da altura das estudantes do sexo feminino não
é normal
= x −µ
Para calcular pi, temos: Zi (Distribuição Normal Padrão)
S Z2 == −1 04.
∑ f .(X − X)
n
n
i i
∑X .fi i S= i=1
= 6.67 n
µ= X = i=1
=168.96 n −1
Z1 ==−1 94. Z
Z3 == −0.14
χ calc2 = ((4+12) − (2.6+12.3))2 + (22 − 29.5)2 + (40 −33.2)2 + ((20+ 2) −(17.5+

4.8))2 = 3.38
14.929.5 33.2 22.3
1−2 5−6
k = 4 (número de classes após agrupamento)

ϕ=k-1-m=4-1-2=1
m = 2 (número de estimadores usados) (X) (S)
χ 2tab = χ25%,1 = 3 84.
tab , aceita-se Ho, ou seja, para α =
5%, a distribuição da altura das estudantes do sexo
feminino é normal.
148
9.4.4 Tabelas de contingência – Teste de independência
Uma importante aplicação do teste χ2 ocorre quando se quer

estudar a relação entre duas ou mais variáveis de classificação. A
representação das freqüências observadas, nesse caso, pode ser feita
por meio de uma tabela de contingência.
Ho: As variáveis são independentes (não estão associadas)
H1: As variáveis não são independentes (estão associadas)
O número de graus de liberdade é dado por: ϕ = (L - 1) (C - 1),

onde L é o número
de linhas e C o número de colunas da tabela de contingência.
)
k
(F − F )
o e
2
eij = (soma da linha i)(soma da coluna j
F
i=1 Fe total de observações
Obs.: Em tabelas 2 x 2 temos 1 grau de liberdade, por isso utiliza-

se a correção de Yates, onde para n ≥ 50 pode ser omitida.
O teste do χ2 não é indicado em tabelas 2 x 2 nos seguintes

casos:
i) quando alguma freqüência esperada for

menor que 1; ii) quando a freqüência total
for menor que 20 (n ≤ 20);
iii) quando a freqüência total (20 ≤ n ≤ 40) e algumas
freqüências esperadas for menor que 5. Neste caso
aplica-se o teste exato de Fischer.
Ex.: Verifique se há associação entre os níveis de renda e os

municípios onde foram pesquisados 400 moradores. Use α =
1%.
Município Níveis de Renda
A B C D
X 28 42 30 24
Y 44 78 78 76
149
Ho: As variáveis são independentes
H1: As variáveis são dependentes
A B C D Total
()
X 28 42 30 24 124
Y 44 78 78 76 276
Total 72 120 108 100 400
(c)
Fe11 = 124 x72 = 22.32 Fe21 = 276x72 = 49.68

400 400
Fe12 = 124 x120 = 37.2 Fe22 =

276x120 = 82.8
400 400
Fe13 = 124 x108 = 33.48 Fe23 =

276x108 = 74.52
400 400
Fe14 = 124 x100 = 310. Fe24 = 276x100 = 69

400 400
(
χ2calc = 28− 22,.32)2 + (42 −37,2)2 +...+ (76 −69)2 = 5,81
22,32 37,2 69
χ2tab =χ12%;(2−1)(4−1) =χ12%;3 =11,34
tab , aceita-se Ho, ou seja, para α = 1%,
as variáveis são independentes.
Uma medida do grau de relacionamento, associação ou

dependência das classificações
em uma tabela de contingência é dada pelo coeficiente de contingência.
150
C = χ2χ2cal+ n
cal
Quanto maior o valor de C, maior o grau de associação, O

máximo valor de C dependerá do número de linhas e colunas da tabela e
pode variar de 0 (independência) a 1 (dependência total).
9.5 Exercícios
1)Verificar se os dados se ajustam a uma distribuição de Poisson,

α = 2.5%.
No de Acidentes 0 1 2 3 4 5
No de Dias 25 19 10 9 4 3
2)Testar para α = 5% se há alguma relação entre as notas

escolares e o salário.
Salários Notas Escolares
Alta Baixa Média

R = aceita Ho
Alto 18 5 17
Médio 26 16 38
Baixo 6 9 15
3)Determine o valor do coeficiente de contingência considerando
os dados: α = 1%.
Sexo Partido
A B
C = 4% Masculino 50 72
Feminino 29 35
4)Com o objetivo de investigar a relação entre a situação do

emprego no momento em que se aprovou um empréstimo e
saber se o empréstimo está, agora, pago ou não, o gerente de
uma financeira selecionou ao acaso 100 clientes obtendo os
resultados da tabela. Teste a hipótese nula de que a situação
de emprego e a de empréstimo são variáveis independentes,
com α = 5%.
Estado Atual Situação de Emprego

do Empregado Desemprega
R = Aceita Empréstimo do Ho
Em mora 10 8
Em dia 60 22
151
5)A tabela indica o número médio de acidentes por mil
homens/hora da amostra de
50 firmas obtidas de uma indústria específica. A média desta
distribuição é de 2.32 e o desvio padrão de 0.42. Teste a
hipótese nula de que as frequências observadas seguem uma
distribuição normal, com α = 5%.
o o
N de Acidentes N de Firmas
1.5 --- 1.7 3
1.8 --- 2.0 12
2.1 --- 2.3 14
2.4 --- 2.6 9
2.7 --- 2.9 7
3.0 --- 3.2 5
Total 50
R = Aceita Ho
6)Verifique se a distribuição se ajusta a normal. (α = 5%), onde

200 casas de aluguel foram pesquisadas, obtendo-se a seguinte
distribuição:
Classes ($) freq.

observada
250 |--- 2
750 10
750 |--- 1250 26
1250 |--- 1750 45
1750 |--- 2250 60
2250 |--- 2750 37
2750 |--- 3250 13
3250 |--- 3750 5
3750 |--- 4250 2
4250 |--- 4750
Total 200
152
10 REGRESSÃO E CORRELAÇÃO
10.1 Introdução
Muitas vezes é de interesse estudar-se um elemento em relação a

dois ou mais atributos ou variáveis simultaneamente.
Nesses casos presume-se que pelo menos duas observações são
feitas sobre cada elemento da amostra. A amostra consistirá, então, de
pares de valores, um valor para cada uma das variáveis, designadas, X e
Y. Um indivíduo “i” qualquer apresenta o par de valores (X i ; Yi).
Objetivo visado quando se registra pares de valores (observações)
em uma amostra, é o estudo das relações entre as variáveis X e Y.
Para a análise de regressão interessam principalmente os casos
em que a variação de um atributo é sensivelmente dependente do outro
atributo.
O problema consiste em estabelecer a função matemática que
melhor exprime a relação existente entre as duas variáveis.
Simbolicamente a relação é expressa por uma equação de regressão e
graficamente por uma curva de regressão.
10.2 Definição
Constitui uma tentativa de estabelecer uma equação matemática

linear que descreva o
relacionamento entre duas variáveis (uma dependente e outra
independente).
A equação de regressão tem por finalidade ESTIMAR valores de

uma variável, com
base em valores conhecidos da outra.
Ex.: Peso x Idade; Vendas x Lucro; Nota x Horas de Estudo
153
10.3 Modelo de Regressão
yˆ i =α xi + β+εi
yˆi ⇒ valor estimado (variável

dependente); xi ⇒ variável
independente;
α ⇒ coeficiente de regressão
(coeficiente angular); β ⇒ coeficiente
linear; εi ⇒ resíduo.
10.3.1 Pressuposições
Na regressão, os valores de "y" são estimados com base em

valores dados ou conhecidos de "x", logo a variável "y" é chamada
variável dependente, e "x" variável independente.
a) A relação entre X e Y é linear (os acréscimos em X produzem

acréscimos proporcionais em Y e a razão de crescimento é constante).
b) Os valores de X são fixados arbitrariamente (X não é uma variável
aleatória).
c) Y é uma variável aleatória que depende entre outras coisas dos
valores de X.
d) εi é o erro aleatório, portanto uma variável aleatória com distribuição
normal, com média zero e variância σ2. [ εi ~ N (0, σ2)]. εi representa a
variação de Y que não é explicada pela variável independente X.
e) Os erros são considerados independentes.
Ex.: Vendas (x 1000) X Lucro (x100)
Obs. 1 2 3 4 5 6 7 8
Vendas 201 22 30 38 56 60 68 73
5 5 0 0 0 5 5
Lucro 17 20 21 23 25 24 27 27
10.3.1 Gráfico (Diagrama de Dispersão)
Tem como finalidade ajudar na decisão se uma reta descreve

adequadamente ou não o conjunto de dados.
154
Pelo gráfico podemos observar que a possível reta de regressão
terá um coeficiente de regressão (coeficiente linear) positivo.
10.4 Método para estimação dos parâmetros a e b
As estimativas dos parâmetros α e β dadas por “a” e “b”, serão

obtidas a partir de uma amostra de n pares de valores (x i, yi) que
correspondem a n pontos no diagrama de dispersão. Exemplo:
O método mais usado para ajustar uma linha reta para um

conjunto de pontos
(x1,y1), ..., (xn ,yn ) é o Método de Mínimos Quadrados:
O método dos mínimos quadrados consiste em adotar como

estimativa dos parâmetros os valores que minimizem a soma dos
quadrados dos desvios.
10.4.1 Características
1a) A soma dos desvios verticais dos pontos em relação a reta é

zero;
2a) A soma dos quadrados desses desvios é mínima.
Os valores de "a" e "b" da reta de regressão y= a x + b serão:
n n n
n∑xy −∑x∑y
S b = y−a
x
155
 
a= i=1 ∑ n 2 − i = ∑ 1n xi= 1 2 =
Sxyxx n x
i=1  i=1 
Para cada par de valores (xi , yi) podemos estabelecer o desvio:
ei = yi − yˆi = yi −(a+bxi )
Para facilitar os cálculos da reta de regressão, acrescentamos três

novas colunas na tabela dada.
Venda Lucro
Obs. s Xi Yi X 2i X i .Yi
Yi2
1 201 17 40401 289 3417
2 225 20 50625 400 4500
3 305 21 93025 441 6405
4 380 23 14440 529 8740
0
5 560 25 31360 625 1400
0 0
6 600 24 36000 576 1440
0 0
7 685 27 46922 729 1849
5 5
8 735 27 54022 729 1984
5 5
Σ 3691 184 20115 4318 8980
01 2
n n n
a= n∑i=1 x iyi −∑i=1 xi ∑i=12yi =
8 ((898022011501)−()3691−(3691)(184)2) =
0,0159 n  n  8
nxi 
i=1  i=1 
156
b = y−a x = 23-(0,159)(461,38)=15,66
yˆ = 0,0159 x + 15,66
Saída do Statistica
Partindo da reta de regressão podemos afirmar que para uma

venda de 400 mil podemos obter um lucro de y= (0.0159) (400.000) + 15.66
= 22 mil .
Saídas do Statistica
Obs.: Para qualquer tipo de equação de regressão devemos ter

muito cuidado para não extrapolar valores para fora do âmbito dos
dados. O perigo da extrapolação para fora dos dados amostrais, é que a
mesma relação possa não mais ser verificada.
10.5 Decomposição da variância Total
157
A dispersão da variação aleatória “y” pode ser medida através da
soma dos quadrados dos desvios em relação a sua média y. Essa soma
de quadrados será denominada Soma de Quadrados Total (SQTotal).
SQTotal =∑(yi − y)2

i
=1
A SQTotal pode ser decomposta da seguinte forma:
n n n
∑(y − y) =∑(yˆ
i
2
i − y)2 +∑(yi − yˆ i )2
i=1 i=1 i=1
Essa relação mostra que a variação dos valores de Y em torno de sua

média pode ser dividida em duas partes: uma ∑ (yˆ − y) que é explicada
n i
2
pela regressão e outra ∑ (y − yˆ ) ,

n
i i
2
i=1 i=1
devido ao fato de que nem todos os pontos estão sobre a reta de

regressão, que é a parte “não explicada” pela regressão ou variação
residual.
Assim:
SQ. Total = SQRegressão + SQResíduo
SQ Regress ao
A estatística definida por r 2 = ~ , e
denominada coeficiente de
SQTotal
determinação, indica a proporção ou percentagem da variação de Y que
é “explicada” pela regressão.
Note que 0 ≤ r2 ≤ 1.
Fórmulas para cálculo:
n n  n 2
SQTotal = yi  ,
i=1 i=1  i=1 
158
com (n - 1) graus de liberdade.
SQ Regressão = ∑ (ˆy − y) = bn∑ x y −∑ x ∑ y ,

n i
2 n
i i
n
i
n
i
i=1  i=1 i=1 i=1 
com (n - 2) graus de liberdade.

10.6 Análise de Variância da Regressão
A Soma de Quadrados da Regressão (SQRegressão), segue uma

distribuição de χ2
(qui-quadrado) com (1) grau de liberdade, enquanto que a Soma de
Quadrados do Resíduo (SQResíduos) segue a mesma distribuição, porém
com (n - 2) graus de liberdade. Portanto, o quociente
~ ~
SQRegress ao/1 = QMRegress ao ,
SQResiduo/n -2 QMResiduo
segue uma distribuição F de Snedecor com 1 e (n - 2) graus de

liberdade.
Esse fato nos permite empregar a distribuição F de Snedecor

para testar a significância da regressão, através da chamada Análise de
Variância, sintetizada no quadro abaixo:
Análise de Variância
Causas de Variação G.L. SQ QM F

Regressão 1 SQRegressão QMRegress ~ao QMRegress ~ao
1 QMResiduo
Resíduo n-2 SQResíduo QMResíduo ---
n -2
Total n-1 SQTotal --- ---
onde QM representa Quadrado Médio e é obtido pela divisão da Soma

de Quadrados pelos respectivos graus de liberdade.
Para testar a significância da regressão, formula-se as seguintes

hipóteses:
159
H0: β=0 contra H1: β≠0, onde β representa o coeficiente de
regressão paramétrico.
Se o valor de F, calculado a partir do quadro anterior, superar o

valor teórico de F com 1 e (n - 2) graus de liberdade, para o nível de
significância α, rejeita-se H0 e conclui-se que a regressão é significativa.
Se Fcalc. > Fα [1,(n-2)], rejeita-se H0.

Para o exemplo anterior:
Vendas Lucro
Obs. Xi Yi X 2i Yi2 X i .Yi
1 201 17 40401 289 3417
2 225 20 50625 400 4500
3 305 21 93025 441 6405
4 380 23 144400 529 8740
5 560 25 313600 625 14000
6 600 24 360000 576 14400
7 685 27 469225 729 18495
8 735 27 540225 729 19845
Σ 3691 184 2011501 4318 89802
yˆ i = 0,0159xi +15,66
SQRegress ao = a n∑n xiyi −∑n x ∑n yi 

~  
 i=1 i 
~
SQRegress ao = 0,0159[8(89802)−(3691)(184)] = 624,42
n  n 2
SQTotal = n yi 
i=1  i=1 
SQTotal = 8(4318) -(184) 2 = 688,00
Causas de Variação G.L. SQ QM F

Regressão 1 624,42 624,42000 58,93
160
Resíduo 6 63,58 10,59587 ---
Total 7 688,00 --- ---
H 0: β = 0 e H 1: β ≠ 0
Comparando o Fcalc. = 58,93 com o Ftab. = F0,05 (1,6) = 5,99
Conclui-se que a regressão de y sobre x segundo o modelo yˆ i =

0,0159xi +15,66 é significativa ao nível de significância de 5%. Uma vez
estabelecida e testada a equação de regressão, a mesma pode ser usada
para explicar o relacionamento entre as variáveis e também para fazer
previsões dos valores de Y para valores fixados de X.
10.7 Coeficiente de Determinação (r²)
É o grau em que as predições baseadas na equação de regressão

superam as predições baseadas em y, ou ainda é a proporção entre a
variância explicada pela variância total.
Variância Total = soma dos desvios ao quadrado
n n  n 2
VT = SQTotal = yi  ,
i=1 i=1  i=1 
Variância Não-explicada = soma de quadrados dos desvios em

relação a reta y
VÑE = ∑(y − yˆ )
i i
2
i=
Para facilitar os cálculos usaremos:
161
 n n
n
 2
∑ n∑∑xy−2∑ ∑x ∑ y ∑ n 2 n  2  =
SCOVxx.Sxyyy 2 =  i=1 i=1 i=1 
r
 
n n x2 −  n x  n y − y

 i=1  i=1   i=1  i=1  
r2 = = 0.908
O valor de r² varia de 0 a 1, logo o fato de r² = 0.908 (no

exemplo), indica que aproximadamente 91% da variação do lucro estão
relacionados com a variação das vendas, em outras palavras 9% da
variação dos lucros não são explicados pelas vendas.
10.8 Coeficiente de Correlação (r)
Tem como objetivo encontrar o grau de relação entre duas

variáveis, ou seja, um coeficiente de correlação.
Esta é a forma mais comum de análise, envolvendo dados

contínuos, conhecido como "r de Pearson".
10.8.1 Características do “r”
- Pode assumir valores positivos (+) como negativos (-), é

semelhante ao coeficiente
de regressão de uma reta ajustada num diagrama de dispersão;
162
- A magnitude de r indica quão próximos da "reta" estão os
pontos individuais;
- quando o r se aproxima de +1 indica pouca dispersão, e

uma correlação muito forte e positiva;
- quando o r se aproxima de "zero" indica muita dispersão, e

uma ausência de relacionamento;
- quando o r se aproxima de -1 indica pouca dispersão, e uma

correlação muito forte e negativa.
valor de r
-0,5 0 +0,5
-1 +1
Negativa Negativa Negativa Positiva Positiva Positiva forte moderada fraca
fraca moderada forte
10.8.2 Medidas de Correlação
10.8.2.1 Tratamento Qualitativo (correlação momento produto)
Relação entre as variáveis, mediante a observação do diagrama

de dispersão.
10.8.2.2 Tratamento Quantitativo
É o estabelecimento das medidas de correlação.
O valor de "r" pode ser enganoso, na realidade, uma estatística

mais significante é o r² (coeficiente de determinação), que dá o valor
percentual da variação de uma variável explicativa em relação a outra
variável.
 n n n 
 n∑ xy −∑ x ∑ y 
 i=1 i =1 i =1 
S xy
r= =
 n 2  n   n 2  n   S xx .S yy
 n∑ x − ∑ x    n ∑ y − ∑ y  
 i=1  i=1    i=1  i=1  
163
Logo podemos observar que o coeficiente de determinação nos
dá uma base intuitiva para a análise de correlação.
No exemplo temos r = 0.953
Saída do Statistica
150 250 350 450 550 650 750
850 95% confid. Vendas
10.9 Exercícios
Para os dados abaixo:
a)Construa um diagrama de dispersão;

b)Determine a reta de regressão;
c) Faça uma análise de variância do modelo;
d)Calcule o Coeficiente de Explicação;
e)Calcule o Coeficiente de Correlação de Pearson;
f) Interprete os resultados obtidos.
X = 1o Exame e Y = 2 o Exame
Aluno 1 2 3 4 5 6 7 8 9 1
0
Exame 1 82 84 86 83 88 87 85 83 86 8
5
Exame 2 92 91 90 92 87 86 89 90 92 9
164
0
R = y=−0.79 x +157. 25; r² = 53.29%; r = -0.73
X = horas de estudo e Y = Nota da Prova
Aluno 1 2 3 4 5 6 7 8
Horas 2 4 5 5 6 8 9 10
Nota 1 3 6 6 8 7 8 10
R = y= 0.98 x +0.12; r² = 82.99%; r = +0.911
X = Seguro (x 1000 ) e Y = Renda (x100)
Indivíduo 1 2 3 4 5 6 7 8
Seguro 20 16 34 23 27 32 18 22
Renda 64 61 84 70 88 92 72 77
R = y=1.50 x +40.08; r² = 74.3%; r = +0.86
X = Peso do Pai (kg) e Y = Peso do Filho (kg)
Indivídu 1 2 3 4 5 6 7 8 9 10
o
Peso Pai 6 63 67 64 68 62 70 6 68 67
5 6
Peso 6 66 68 65 69 66 68 6 71 67
Filho 8 5
R = y= 0.48 x +35.48; r² = 40.58%; r = +0.637
11 Referências Bibliográficas
165
COSTA NETO, P.L.O.; CYMBALISTA, M. (1994). Probabilidades. São
Paulo: Edgard Blucher.
FONSECA, J.S.; MARTINS, G.A. (1993). Curso de estatística. 4a ed.

São Paulo: Atlas.
LAPONNI, Juan Carlos (1997). Estatística usando o Excel. São Paulo:

Lapponi Treinamento e Editora.
MILONE, G.; ANGELINI, F. (1995). Estatística aplicada. São Paulo:

Atlas.
SNEDECOR, G. W.; COCHRAM, W. G. (1989). Statistical Methods. 8rd

ed. Iowa: Iowa State University Press, 1989.
166

Estatística Basica - Leandro

Enviado por

Direitos autorais:

Formatos disponíveis

Estatística Basica - Leandro

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatística Basica - Leandro

Enviado por

Direitos autorais:

Formatos disponíveis

Graduação

PEDAGOGIA COM EDUCAÇÃO ESPECIAL

DISCIPLINA: ESTATÍSTICA BÁSICA

PROFESSOR: LEANDRO RAMOS FURTADO

5 Probabilidade e variáveis aleatórias

1.1 População x Amostra

• População (N): Conjunto de todos os elementos relativos a um determinado

• Finita - apresenta um número limitado de observações, que é passível de contagem.

• Amostra (n): É um subconjunto da população e deverá ser considerada finita, a

1.2 Censo x Amostragem

• Pesquisa Estatística: É qualquer informação retirada de uma população ou

• Censo: É a coleta exaustiva de informações das "N" unidades populacionais.

• Amostragem: É o processo de retirada de informações dos "n" elementos

1.3 Dado x Variável

• Dados estatísticos: é qualquer característica que possa ser observada ou medida

Nominal: são utilizados símbolos, ou números, para representar determinado

- Quantitativas: São características populacionais que podem ser quantificadas,

1.4 Parâmetros x Estatísticas

• Parâmetros: são medidas populacionais quando se investiga a população em sua

• Estatísticas ou Estimadores: são medidas obtidas da amostra, torna-se possível

Regras: Portaria 36 de 06/07/1965 - INPM ⇒ Instituto Nacional de Pesos e

1a) Se o primeiro algarismo após aquele que formos arredondar for de 0 a 4,

2a) Se o primeiro algarismo após aquele que formos arredondar for de 6 a 9,

4a) Quando, arredondarmos uma série de parcelas, e a soma ficar alterada,

Ex.: 17,4% + 18,4% + 12,3% + 29,7% + 22,2% = 100

17% + 18% + 12% + 30% + 22% = 99%

1.6 Fases do método estatístico

O método estatístico abrange as seguintes fases:

a) Definição do Problema Consiste na:

- formulação correta do problema;

- Como levantar informações;

- Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial).

c) Coleta ou levantamento dos dados

A coleta pode ser: Direta - diretamente da fonte; Indireta

Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no

d) Apuração dos Dados ou sumarização

Apuração: manual, mecânica, eletrônica e eletromecânica.

e) Apresentação dos dados

Esta apresentação pode ser: Tabular (apresentação numérica)

f) Análise e interpretação dos dados

Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado.

2.1 Representação esquemática

• Título: O título deve responder as seguintes questões:

• Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada

• Coluna Indicadora: coluna que contém as discriminações correspondentes aos

Uma série estatística é um conjunto de dados ordenados segundo uma

• Série Temporal ou Cronológica: É a série cujos dados estão dispostos em

• Série Geográfica ou Territorial: É a série cujos dados estão dispostos em

População Urbana do Brasil em 1980 (x 1000)

• Série Específica ou Qualitativa: É a série cujos dados estão dispostos em

População Urbana e Rural do Brasil em 1980 (x 1000)

• Série Mista ou Composta: A combinação entre duas ou mais séries constituem

Local + Época = Série Geográfica Temporal

População Urbana do Brasil por Região de 1940 a 1980 (x 1000)

É o tipo de série estatística na qual permanece constante o fato, o local e a época.

a) Distribuição de Frequência Discreta ou Pontual: É uma série de dados

Notas do Aluno "X" na Disciplina de Estatística segundo critérios

b) Distribuição de Frequências Intervalar: Na distribuição de frequência, os

O tipo de intervalo mais usado é do tipo fechado a esquerda e aberto a direita,

Altura em centímetros de 160 alunos do Curso de Administração da UFSM -