Livro de Probabilidade
Livro de Probabilidade
Livro de Probabilidade
Crditos: 04
Ementa
Conceitos Fundamentais. Distribuio de Frequncia. Tabelas e Grficos. Medidas de Posio e
Disperso. Introduo Probabilidade. Variveis Aleatrias Unidimensionais. Esperana Matemtica.
Distribuies Discretas e Contnuas. Noes Elementares de Amostragem. Estimao Pontual. Intervalos de
Confiana e Testes de Hipteses. Correlao e Regresso.
Descrio
Esta disciplina servir de apoio ao educador em Matemtica no processo de tomada de deciso. Ao
longo do curso o aluno ser apresentado a um leque de mtodos estatsticos, descritivos e inferenciais, com
o intuito facilitar a manipulao e anlise de dados.
Objetivos
Ao final do curso, espera-se que o aluno
1.
2.
Esteja habilitado a reconhecer um grfico, uma tabela estatstica e fazer uma anlise dos
dados ali apresentados;
3.
Saiba fazer uma estimao pontual ou por intervalo de uma mdia ou proporo
populacional;
4.
Tenha criado uma concepo aplicada do conceito de teste de hiptese sobre a mdia e/ou
sobre a proporo populacional, saiba formular tal teste e apresentar concluses sobre o
mesmo.
Probabilidade
Unidade III
Estimao de Parmetros
Intervalos de Confiana para a Mdia Populacional
Determinao do Tamanho da Amostra para estimar mdias
Intervalo de Confiana para uma Proporo Populacional
Determinao do Tamanho da Amostra para estimar Propores
Testes de Hipteses
Conceitos Fundamentais
Definio da Regra de Deciso, Erros e Nvel de Significncia
Testes de Hipteses para a Mdia Populacional
Testes de Hipteses para uma Proporo Populacional
Unidade VI
Conceitos Bsicos
Tipos de Amostragem
Distribuies Amostrais da Mdia e da Proporo
Unidade V
Correlao e Regresso
Correlao: Conceitos
Coeficiente de Correlao: Definio e Teste de Hipteses
Regresso: Conceitos
Regresso Linear Simples: Estimao dos Parmetros
Unidade I:
1. Situando a Temtica
A Estatstica considerada por alguns autores como Cincia no sentido do estudo de uma populao.
considerada como mtodo quando utilizada como instrumento por outra Cincia.
A palavra estatstica frequentemente est associada imagem de aglomerao de nmeros, dispostos
em uma imensa variedade de tabelas e grficos, representando informaes to diversas quanto nascimentos,
mortes, taxas, populaes, rendimentos, dbitos, crditos, etc. Isto devido ao uso comum da palavra
estatstica como sinnimo de dados, como, por exemplo, quando falamos das estatsticas de uma eleio,
estatsticas da sade, estatsticas de acidente de trnsito ou as estatsticas de acidentes de trabalho.
No sentido moderno da palavra, estatstica lida com o desenvolvimento e aplicao de mtodos para
coletar, organizar, analisar e interpretar dados de tal modo que a segurana das concluses baseada nos dados
pode ser avaliada objetivamente por meio de proposies probabilsticas.
O propsito da estatstica no exclusivo de qualquer cincia isolada. Ao contrrio, a estatstica
fornece um conjunto de mtodos teis em toda rea cientfica onde haja a necessidade de se coletar,
organizar, analisar e interpretar dados. Estes mtodos podem ser usados to eficazmente em farmacologia
como em engenharia, em cincias sociais ou em fsica.
2. Problematizando a Temtica
Ao estudarmos fenmenos naturais, econmicos ou biolgicos tais como, a precipitao de chuvas
em uma determinada regio, a evoluo da taxa de inflao em uma regio metropolitana, a influncia das
mars no desenvolvimento de animais marinhos, etc., estamos lidando com experimentos cujos resultados
no conhecemos e desejamos saber se as hipteses que afirmamos so verdadeiras, isto , se os fenmenos
esto ocorrendo como espervamos. Para isto, necessrio que os dados oriundos das observaes possam
nos dar informaes claras e precisas. Estes dados devem ser organizados de forma adequada para podermos
fazer uma anlise crtica e fundamentada do fenmeno.
A partir de agora voc est convidado a participar de uma experincia que consiste em obter um
conjunto de dados, represent-lo em distribuies de frequncia e apresent-lo atravs de tabelas e grficos.
Ver como algumas medidas estatsticas podem nos auxiliar nesta anlise e como utiliz-las.
3. Conhecendo a Temtica
das vezes no conveniente, ou mesmo possvel, realizar o levantamento dos dados referentes a todos os
elementos de uma populao. Portanto, analisamos parte da populao, isto , uma amostra.
Amostra
um subconjunto no vazio ou parte da populao. Duas consideraes devem ser feitas sobre o
estudo amostral dos fenmenos. Uma diz respeito aos cuidados que se deve tomar para assegurar que a
amostra seja representativa da populao. Para atender a essa exigncia, deve-se selecionar os elementos de
forma aleatria, de modo que todo e qualquer elemento da populao tenha a mesma chance de participar da
amostra, a outra diz respeito preciso dos dados coletados, buscando minimizar os erros que poderiam
induzir a concluses equivocadas. O nmero de elementos de uma amostra chamado o tamanho da
amostra, e denotado por n.
Definio 1.1: Parmetro
Uma caracterstica numrica estabelecida para toda uma populao denominada parmetro. So
valores, geralmente desconhecidos (e que portanto tm de ser estimados), que representam certas
caractersticas da populao.
Definio 1.2: Estimador
uma caracterstica baseada em observaes amostrais e usada para indicar o valor de um parmetro
populacional desconhecido.
Definio 1.3: Estimativa
O valor numrico assumido pelo estimador numa determinada amostra denominada estimativa.
Exemplo 1.1:
No fenmeno coletivo eleio para reitor da UFPB, a populao o conjunto de todos os eleitores
habilitados na Universidade. Um parmetro a proporo de votos do candidato A. Uma amostra pode ser
um grupo de 300 eleitores selecionados em toda a UFPB. Um estimador a proporo de votos do
candidato A obtida na amostra. O valor resultante do estimador, a proporo amostral, a estimativa.
Processos Estatsticos de Abordagem
Quando solicitados a estudar um fenmeno coletivo podemos optar entre os seguintes processos
estatsticos:
a) CENSO - avaliao direta de um parmetro, utilizando-se todos os componentes da populao. Entre
as principais caractersticas de um Censo, podemos destacar: admite erro processual zero e tem
confiabilidade 100%, caro, lento e quase sempre desatualizado. Nem sempre vivel.
b) AMOSTRAGEM (INFERNCIA) - avaliao indireta de um parmetro, com base em um
estimador atravs do clculo das probabilidades. Entre as principais caractersticas, podemos
destacar: admite erro processual positivo e tem confiabilidade menor que 100%, barata, rpida e
atualizada. sempre vivel.
Dados Estatsticos
Normalmente, no trabalho estatstico, o pesquisador se v obrigado a lidar com grande quantidade de
valores numricos resultantes de um censo ou de uma amostragem. Estes valores numricos so chamados
dados estatsticos.
No sentido da disciplina, a Estatstica ensina mtodos racionais para a obteno de informaes a
respeito de um fenmeno coletivo, alm de obter concluses vlidas para o fenmeno e tambm permitir
tomada de decises, atravs dos dados estatsticos observados. Desta forma, a estatstica pode ser dividida
em duas reas: Estatstica Descritiva e Estatstica Inferencial.
Estatstica Descritiva
a parte da Estatstica que tem por objetivo descrever os dados observados. A Estatstica Descritiva,
na sua funo de descrio dos dados, tem as seguintes atribuies:
A obteno dos dados estatsticos;
A organizao dos dados;
A reduo dos dados;
A representao dos dados e
A obteno de algumas informaes que auxiliam a descrio do fenmeno observado.
A obteno ou coleta dos dados normalmente feita atravs de um questionrio ou de observao direta de
uma populao ou amostra. A organizao dos dados consiste na ordenao e crtica quanto correo dos
valores observados, falhas humanas, omisses, abandono de dados duvidosos, etc. A reduo dos dados
envolve o entendimento e a compreenso de grande quantidade de dados atravs de simples leitura de seus
valores individuais uma tarefa extremamente rdua e difcil mesmo para o mais experimentado
pesquisador. A representao dos dados compreende de tcnicas para uma melhor visualizao dos dados
estatsticos, facilitando sua compreenso. Por exemplo, os grficos, quando bem representativos, tornam-se
importantes instrumentos de trabalho. ainda atributo da Estatstica Descritiva a obteno de algumas
informaes que sumarizam os dados, facilitando a descrio dos fenmenos observados.
Estatstica Inferencial (ou Indutiva)
a parte da Estatstica que tem por objetivo obter e generalizar concluses para a populao a partir
de uma amostra. Complementando o processo descritivo, a Estatstica Indutiva estuda parmetros a partir do
uso de estimadores usando o clculo das probabilidades, elemento este que viabiliza a Inferncia Estatstica.
Dados ou Variveis Estatsticas
As informaes ou dados caractersticos dos fenmenos ou populaes so denominados variveis
estatsticas ou simplesmente variveis. Conforme suas caractersticas particulares, podem ser classificadas
da seguinte forma:
Quantitativas - So aquelas que podem ser expressas em termos numricos. Em geral so as
resultantes de medies, enumeraes ou contagens. So subdivididas em contnuas e
discretas, conforme abaixo:
o Contnuas - so aquelas que podem assumir qualquer valor num certo intervalo de
medida, podendo ser associados ao conjunto dos nmeros reais, ou seja, um
conjunto no enumervel. Entre outras, enquadram-se nesta categoria as medidas de
tempo, comprimento, espessura, rea, volume, peso, velocidade, dosagem de
hemoglobina no sangue, concentrao de flor na gua oferecida populao, etc.
o Discretas - quando s podem assumir determinados valores num certo intervalo, ou
seja, um conjunto finito ou enumervel. Em geral, representam nmeros inteiros
resultantes de processo de contagem, como o nmero de alunos por sala, de crditos
por disciplinas, de pacientes atendidos diariamente num hospital, etc.
De modo geral, as medies do origem a variveis contnuas e as contagens ou enumeraes, a variveis
discretas. Designamos estas variveis por letras latinas, em geral, as ltimas: X, Y, Z.
Em geral, uma mesma populao pode ser caracterizada por mais de um tipo de varivel. Assim, os inscritos
num vestibular, por exemplo, podem ser contados, medidos ou pesados, podem ser agrupados segundo o
sexo ou rea de estudo e podem ainda ser classificados segundo as notas obtidas nas provas prestadas.
3.2.1 Planejamento
o trabalho inicial de coordenao no qual define-se a populao a ser estudada estatisticamente,
formulando-se o trabalho de pesquisa atravs da elaborao de questionrio, entrevistas, etc.
A organizao do plano geral implica em obter respostas para uma srie tradicional de perguntas,
antes mesmo do exame das informaes disponveis sobre o assunto, perguntas que procuram justificar a
necessidade efetiva da pesquisa, a saber:
- "quem", "o que", "sempre", "por que", "para que", "para quando".
Imaginemos, por exemplo, que o Governo do Estado tenha necessidade de obter informaes acerca
do desempenho em Matemtica dos estudantes matriculados na rede pblica de ensino.
O primeiro trabalho da equipe encarregada da pesquisa, ser evidentemente, o de obter respostas para
aquelas perguntas. Seriam ento:
- Quem deseja as informaes?
- O que devemos perguntar no questionrio?
- A pesquisa ser peridica ou ocasional? Ser executada sempre?
- Por que desejam as informaes?
- Quando dever estar concluda a pesquisa?
- Qual a poca oportuna para a aplicao dos questionrios?
- Para que desejam as informaes?
Ainda na fase do planejamento, temos:
2. Por via indireta - quando inferida de elementos conhecidos (coleta direta) e/ou conhecimento de
outros fenmenos relacionados com o fenmeno estudado. Como exemplo, podemos citar a pesquisa
sobre a mortalidade infantil, que feita atravs de dados colhidos via coleta direta.
Distribuio de Frequncias por Intervalos ou Classes (varivel quantitativa): Constroemse classes de valores, levando em considerao o nmero de valores que pertencem a cada
classe e quando a variabilidade dos dados grande. A construo de tabelas de frequncias
para variveis contnuas necessita de certos cuidados.
Exemplo 1.1 - A tabela 01 apresenta a distribuio de frequncia da varivel PROCEDNCIA, a partir dos
dados do Quadro 1
Quadro 1- Informaes sobre sexo, curso, idade (anos), procedncia, renda familiar, nmero de disciplinas
matriculado(a), peso (kg) e altura (cm) de 46 alunos matriculados na disciplina CLCULO
DAS PROBABILIDADE E ESTATSTICA (CPE) - perodo 97.1 turma 01
O
ID
SEXO
CURSO
IDADE
(Anos)
PROCEDNCIA
RENDA
FAMILIAR
N . DISCIP.
MATRIC.
PESO
(kg)
ALTURA
(cm)
1
2
Fem
Masc
Fsica
Matem.
19
18
Interior
Capital
Mdia
Mdia
6
6
47
75
156
167
Fem
Matem.
18
Outra Regio
Mdia
61
169
Fem
Matem.
18
Capital
Mdia
56
163
Masc
Matem.
18
Capital
Mdia
80
178
Fem
Matem.
20
Interior
Mdia
44
158
Fem
Matem.
20
Interior
Mdia
52
158
Masc
Matem.
19
Capital
Mdia
67
174
Fem
Matem.
19
Outra Regio
Mdia
48
167
10
Masc
Matem.
18
Capital
Mdia
83
180
11
Fem
Matem.
18
Capital
Mdia
53
163
12
Masc
Matem.
21
Outra Regio
Mdia
66,5
175
13
Masc
Matem.
18
Interior
Mdia
78
180
14
Fem
Matem.
18
Interior
No Info.
46
158
15
Fem
Matem.
18
Capital
Mdia
54
160
16
Fem
Matem.
19
Capital
Mdia
56
162
17
Fem
Matem.
19
Capital
Mdia
53
160
18
Fem
Matem.
18
Capital
Mdia
57
164
19
Fem
Fsica
23
Outra Regio
Mdia
53
160
20
Masc
Matem.
18
Interior
Mdia
76
180
21
Masc
Matem.
21
Outra Regio
Mdia
65
171
22
Masc
Matem.
19
Capital
Mdia
78,5
180
23
Masc
Matem.
19
Outra Regio
Mdia
104
183
24
Fem
Matem.
17
Interior
Mdia
47,5
155
25
Masc
Matem.
18
Interior
Baixa
67,5
175
26
Masc
Matem.
19
Outra Regio
Mdia
61
160
27
Masc
Matem.
17
Interior
No Info.
68
169
28
Masc
Matem.
21
Interior
Mdia
75
178
29
Fem
Matem.
18
Interior
Mdia
58
154
30
Masc
Matem.
21
Outra Regio
Mdia
65
165
31
Masc
Matem.
21
Capital
Mdia
67
178
32
Fem
Matem.
18
Capital
Alta
47
167
33
Masc
Matem.
21
Capital
Mdia
69
179
34
Fem
Matem.
19
Outra Regio
Mdia
68
170
35
Masc
Matem.
18
Capital
Mdia
53
166
36
Fem
Matem.
17
Capital
Mdia
51
153
37
Fem
Matem.
19
Capital
Mdia
63
168
38
Masc
Matem.
19
Capital
Mdia
60
166
39
Masc
Matem.
18
Capital
Mdia
72
174
40
Masc
Matem.
21
Interior
Mdia
54
163
41
Masc
Matem.
18
Interior
Baixa
60
165
42
Masc
Matem.
19
Interior
Mdia
75
181
43
Fem
Matem.
18
Capital
Mdia
52
160
44
Masc
Matem.
18
Outra Regio
Mdia
100
175
45
Masc
Matem.
22
Interior
Mdia
80
179
46
Masc
Matem.
21
Interior
Mdia
50
166
AT = X max X min
k n ou k 1 + 3,3 log(n ) , se n 50
6. Calcule o comprimento de cada classe dos dados (h ) :
AT
h=
k
aconselhvel construir classes de mesma amplitude.
7. Efetua-se o AGRUPAMENTO EM CLASSES, calculando os limites de cada classe:
1 Classe:
Limite Inferior: LI 1 = X min
Limite Superior: LS1 = LI 1 + h
2 Classe:
Limite Inferior: LI 2 = LS1
Limite Superior: LS 2 = LI 2 + h
M
i-sima Classe:
Limite Inferior: LI i = LS i 1
Limite Superior: LS i = LI i + h
Continue estes clculos at que seja obtido um intervalo que contenha o maior valor da amostra
( X max ) entre seus limites.
8. Construa a tabela de distribuio de frequncias.
Uma tabela de distribuio de frequncias (por classes ou valores), dever conter as seguintes colunas:
Nmero de ordem de cada classe (i) ou valor;
Limites de cada classe (no caso da distribuio de frequncias por classes)
o As classes so fechadas esquerda e abertas direita.
o As observaes iguais ao limite superior da classe i-1, o qual igual ao limite inferior da
classe i, pertencem classe i. NOTAO: |------.
LI i + LS i
2
Tabulao: contagem dos dados pertencentes a cada classe ou a quantidade de vezes que o valor se
repete.
Frequncia simples ou absoluta (Fi ) da i-sima classe ou do i-simo valor
Observe que:
=n
i =1
i =1
Faci = F1 + F2 + L + Fi
10
Exemplo 1.3 Elabore uma tabela de distribuio de frequncias (dados agrupados em intervalos) da
varivel ALTURA (em cm), dos 46 estudantes de CPE, turma 01 Perodo 07.1, usando-se os dados do
Quadro 1.
Soluo:
Passo 1: Estabelecer o nmero de classes:
Passo 2: Amplitude Total:
Passo 3: Amplitude das Classes:
k 46 7
AT = 183 153 = 30
AT 30
h=
=
4,3
k
7
11
Exemplo 1.4 - Elabore uma tabela de distribuio de frequncias (dados agrupados em intervalos) da
varivel IDADE (em anos) de 33 estudantes de CPE, conforme Dados Brutos abaixo:
22
27
30
36
25
24
25
30
DADOS BRUTOS
23 22 23 26 25 33 23 35
24 22 24 22 24 21 22 28
28 29 24 25 20 27 34 26
22
20
23
25
34
21
24
26
35
Soluo:
Passo 1: Estabelecer o nmero de classes:
Passo 2: Amplitude Total:
Passo 3: Amplitude das Classes:
k 33 6
AT = 36 20 = 16
AT 16
h=
=
2,7
k
6
A Tabela 5, a seguir, um exemplo de como calcular os outros tipos de frequncias a partir da Tabela 3
Exemplo 1.5
Soluo:
Tabela 05 Distribuio de Frequncias das ALTURAS dos 46 Estudantes de CPE, Perodo:
97.1.
Freq. Abs. Freq. Relat. Ponto
Freq. Absoluta Freq. Relativa Freq. Percentual
ALTURA (Xi)
Acum.
Acum.
Mdio
Fi
fi
fi %
Faci
faci
pmi
153,0 |----- 157,3
4
0,087
8,7
4
0,087
155,15
157,3 |----- 161,6
8
0,174
17,4
12
0,261
159,45
161,6 |----- 165,9
7
0,152
15,2
19
0,413
163,75
165,9 |----- 170,2
10
0,217
21,7
29
0,630
168,05
170,2 |----- 174,5
3
0,065
6,5
32
0,695
172,35
174,5 |----- 178,8
6
0,130
13,0
38
0,825
176,65
178,8 |----- 183,1
8
0,174
17,4
46
1,000
180,95
46
1,000
100,0
Total ou
FONTE: Quadro 1
12
Requisitos
A representao grfica de um fenmeno deve obedecer aos seguintes requisitos primordiais:
Simplicidade - indispensvel devido necessidade de levar a uma rpida apreenso do
sentido geral do fenmeno apresentado a fim de no nos perdermos na observao de
mincias de importncia secundria;
Clareza - o grfico deve possibilitar uma correta interpretao dos valores representativos do
fenmeno em estudo;
Veracidade - indispensvel qualquer comentrio, posto que, se no representa uma
realidade, perde o grfico sua finalidade.
Os principais tipos de grficos estatsticos para as distribuies de frequncias so os diagramas,
que so grficos geomtricos de, no mximo duas dimenses. Para sua construo, em geral, fazemos uso s
do sistema cartesiano. Dentre os principais tipos de diagramas, destacamos:
Variveis Qualitativas:
Para representarmos as variveis qualitativas graficamente usamos os grficos de Barras, Colunas,
Setores ou Linha.
Grfico em Barras ou Colunas: a representao de uma srie por meio de retngulos,
dispostos horizontalmente (em barras) ou verticalmente (em colunas);
Grfico de Setores: o grfico que representa as partes de um todo, por setores de um
crculo, visando justamente comparar estas partes entre si em relao ao todo.
Grfico de Linha: til na representao de tabelas ou sries que evoluem ao longo do tempo
(sries temporais), possibilitando a identificao de tendncias.
Exemplo 1.6: Construindo um Grfico de Barras
Interior
Outra Regio
Procedncia
FONTE: Quadro 1
Exemplo 1.7: Construindo um Grfico de Setor
Outra Regio
22%
Interior
35%
FONTE: Quadro 1
13
Capital
43%
Variveis Quantitativas
Discretas:para representarmos as variveis quantitativas discretas graficamente usamos grficos em
Barras ou Colunas;
Contnuas: para representarmos as variveis quantitativas contnuas graficamente usamos o
Histograma ou o Polgono de Frequncias.
Histograma
a representao grfica de uma distribuio de frequncias de varivel quantitativa contnua
(dados agrupados em intervalos) por meio de retngulos justapostos, centrados nos pontos mdios das
classes e cujas reas so proporcionais s frequncias das classes.
Exemplo 1.8: Construindo um Histograma
Distribuio das Alturas dos Estudantes de CPE, Per. 97.1
12
at
lu
o
s
b
A
iac
n
e
u
q
re
F
10
8
6
4
2
0
155.15
159.45
163.75
168.05
172.35
176.65
180.95
Altura (cm)
FONTE: Quadro 1
Polgono de Frequncia
a representao grfica de uma distribuio de frequncias de varivel quantitativa contnua
(dados agrupados em intervalos) por meio de uma linha poligonal fechada ou polgono, cuja rea total
igual do histograma.
Exemplo 1.10: Construindo um Polgono de Frequncias
Distribuio das Alturas dos Estudantes de CPE, Per. 97.1
12
10
Frequencia Absoluta
8
6
4
2
0
150.85
155.15
159.45
163.75
168.05
Altura (cm)
FONTE: Quadro 1
14
172.35
176.65
180.95
185.25
( )
x
X =
Fi
i =1
k
Fi
ou, simplesmente, X =
Fi
i =1
i =1
onde:
xi
X
n
3 + 7 + 8 + 10 + 11
= 7,8
5
2, 3, 8, 8, 5, 2, 2, 2, 8, 5, 3, 8, 2, 2, 5, 8, 2, 5, 8, 2
Ento:
15
x
X=
Fi
i =1
4
n = Fi = 20
90
=
X = 4,5 e
20
i =1
i =1
= n.
i =1
( )
pmi Fi
pm
i =1
i =1
X =
ou, simplesmente, X =
Fi
i =1
onde:
( X
i =1
X = 0.
Yi =
Xi
X
Y = , para c 0 .
c
c
Exemplo 1.13: Utilizando os dados apresentados na Tabela 5, determine a ALTURA MDIA dos 33
estudantes de Estatstica Vital - 97.1 turma 06
ALTURA (Xi)
153,0 |----- 157,3
157,3 |----- 161,6
161,6 |----- 165,9
165,9 |----- 170,2
170,2 |----- 174,5
174,5 |----- 178,8
178,8 |----- 183,1
Total ou
pm
Ento: X =
Fi
i =1
k
7747,50
= 168,42 cm
46
i =1
16
pmi Fi
620,60
1275,60
1146,25
1680,50
517,05
1059,90
1447,60
7747,50
Moda
Notao: Mo
Dado um conjunto ordenado de valores. A moda (so) o(s) valor(es) que ocorre(m) com maior
frequncia no conjunto de dados, ou seja (so) o(s) valor(es) mais frequente(s) do conjunto de dados.
Exemplo 1.14: Determine a moda dos seguintes conjuntos de dados abaixo
a) 2, 2, 3, 3, 5, 5, 8, 8
No existe moda (ou amodal)
b) 2, 2, 3, 5, 5, 5, 8, 8
Mo = 5
c) 2, 2, 2, 3, 3, 5, 5, 5, 8 Mo = 2 e Mo = 5
Observao:
i) A moda de um conjunto de dados pode no existir (figura 1 (a) )
ii) A moda de um conjunto de dados pode no ser nica (figura 1 (c) )
Figura 1: Caracterizao de Dados quanto moda
1
hmo
Mo = Lmo +
1 + 2
onde:
17
A Classe modal ser o intervalo com maior frequencia absoluta (Fi). Neste caso a classe modal (4a) ser
165,9
|----170,2
Lmo = 165,9
, hmo = 4,3 ,
1 = Fmod al Fanterior = 10 7 = 3
2 = Fmod al F posterior = 10 3 = 7 .
1
hmo = 165,9 +
Da, Mo = Lmo +
4,3 = 167,19 cm.
3+ 7
1 + 2
Mediana
Notao: Me
Considere um conjunto de dados ordenado constitudo de n valores. A mediana o valor que divide
o conjunto em duas partes iguais (isto , em duas partes de 50% cada).
1 Caso: n mpar
Para a srie de valores ordenados em ordem crescente de grandeza (isto , um rol), a mediana o
valor central, isto ,
n +1
.
2
2 Caso: n par
Para a srie de valores ordenados em ordem crescente de grandeza (isto , um rol), a mediana a
mdia aritmtica dos valores centrais, isto ,
n n
e + 1.
2 2
n
e, consequentemente, ser esta a classe que conter a
2
Me = LI me
n
Fac ant
+ 2
Fme
hme
onde:
18
Assim, para dados agrupados em intervalos, a mediana obtida atravs de interpolao de acordo com
a frmula dada na figura 3.
Propriedades da Mediana
1. A mediana no influenciada por valores extremos (grandes) de uma srie ou conjunto de dados;
2. A mediana de uma srie de dados agrupados de classes extremas indefinidas pode ser calculada.
Exemplo 1.16: Determinar a ALTURA MEDIANA dos 46 estudantes da turma de CPE, - Perodo: 97.1,
conforme os dados agrupados na tabela 5.
Classe mediana a classe que contm o elemento que est na posio n , ou seja, a classe mediana
a classe que contm o elemento que est na 23 posio. Logo, a classe mediana ser a 4: 165,9 |----- 170,2
(Classe mediana: primeira classe que ultrapassar 50% (n/2) ou mais das observaes)
Fme = 10
LI me = 165,9
Fant = 19
hme = 4,3
Ento:
Me = LI me
n
Fant
+ 2
f me
46
19
hme = 165,9 + 2
4,3 = 165,9 + 1,72 = 167,62 cm.
10
A
B
C
D
====>
====>
====>
====>
7,
5,
4,
0,
7,
6,
5,
5,
7, 7, 7
7, 8, 9
7, 9, 10
10, 10, 10
Para representarmos cada conjunto, podemos calcular a sua respectiva mdia aritmtica, encontrando
X A = XB = XC = XD = 7 .
Vemos assim que, apesar de constitudos de valores diferentes, os grupos revelam uma mesma mdia
aritmtica. Observando-os mais detalhadamente, notamos que em cada grupo, isto , conjunto de dados, os
valores se distribuem diferentemente em relao mdia. Necessitamos assim de uma medida estatstica
complementar para melhor caracterizar cada conjunto apresentado.
As medidas estatsticas responsveis pela variao ou disperso dos valores de um conjunto de dados
so as medidas de disperso ou de variabilidade, onde se destacam a amplitude total, a varincia, o desvio
padro e o coeficiente de variao. Em princpio, diremos que entre dois ou mais conjuntos de dados, o mais
disperso (ou menos homogneo ) aquele que tem a maior medida de disperso.
Amplitude Total
Notao: AT
Medida j apresentada na elaborao de uma distribuio de frequncias com dados agrupados em
classes, definida por:
AT = X max X min ,
onde: X max o maior valor do conjunto de dados e X min o menor valor do conjunto de dados.
19
Varincia
Notao: S 2 a varincia da amostra ou varincia amostral
( )
(x
S2 =
X ) Fi
i =1
n 1
onde:
X a mdia da amostra;
n o tamanho da amostra.
Observao: A equao acima utilizada quando nosso interesse no se restringe descrio dos dados
mas, partindo da amostra, visamos tirar inferncias vlidas para uma respectiva populao.
Distribuio de Frequncias por Classes
Sejam pm1 , pm 2 , K , pmk os pontos mdios das classes, ocorrendo com frequncias F1 , F2 , K , Fk de
k
modo que
( )
i =1
k
( pm
S2 =
X ) Fi
i =1
n 1
onde:
Desvio-Padro
Notao: S o desvio-padro da amostra ou desvio-padro amostral
Varincia
Assim,
S = S2
Coeficiente de Variao
uma medida que expressa a variabilidade em termos RELATIVOS, comparando o desvio-padro
com a mdia:
20
CV =
S
100% , sendo que X 0 .
X
Note que importante expressar a variabilidade em termos relativos porque, por exemplo, um
desvio-padro igual a 1 pode ser muito pequeno se a magnitude dos dados da ordem de 1.000, mas pode ser
considerado muito elevado se esta magnitude for da ordem de 10.
Observe tambm que o coeficiente de variao adimensional e por este motivo permite a
comparao das variabilidades de diferentes conjuntos de dados.
Comentrios sobre as principais Medidas de Tendncia Central e Disperso
1. O conjunto de todos os possveis elementos de uma determinada pesquisa constitui uma populao
estatstica. Sua mdia a mdia populacional, usualmente representada pela letra grega . Na
grande maioria das situaes prticas, a mdia populacional desconhecida e deve ser estimada a
partir de dados amostrais. Se a amostra for extrada de forma adequada, a mdia amostral X uma
boa estimativa de .
2. Comparando a mdia e a mediana, temos que a mediana pouco sensvel presena de valores
muito altos ou muito baixos na amostra, enquanto a mdia j muito sensvel a esta situao. Para
ilustrar o sentido desta afirmao, vamos considerar os dados abaixo:
5
14
47
61
122
620
Me =
47 + 61
= 54
2
X =
Observe que a maior observao (620) exerceu uma grande influncia sobre a mdia somente este
dado maior do que a mdia, o que ento no sintetiza de forma adequada as informaes contidas
na massa de dados. Portanto, neste exemplo, a mediana parece ser a melhor medida para indicar a
localizao dos dados.
De modo geral, quando o histograma construdo para os dados da amostra do tipo assimtrico,
devemos preferir a mediana como medida de tendncia central.
3. A amplitude, apesar de ser muito fcil de calcular, tem a desvantagem de levar em considerao
apenas os dois valores extremos (mximo e mnimo) da massa de dados, desprezando os demais.
4. A varincia populacional representada por 2 . Usualmente, a varincia populacional
desconhecida e deve ser estimada a partir dos dados amostrais. Se a amostra foi extrada de forma
adequada, a varincia amostral S 2 uma boa estimativa de 2 .
5. As medidas X , S 2 e S tomadas na amostra, denominadas ESTATSTICAS, so estimativas dos
PARMETROS POPULACIONAIS , 2 e (supostos desconhecidos).
Exemplo 1.17: Utilizando os dados apresentados na Tabela 5, determine a VARINCIA, o DESVIOPADRO e o COEFICIENTE DE VARIAO DAS ALTURAS dos 46 estudantes de CPE - 97.
ALTURA (Xi)
153,0 |----- 157,3
157,3 |----- 161,6
161,6 |----- 165,9
165,9 |----- 170,2
170,2 |----- 174,5
174,5 |----- 178,8
178,8 |----- 183,1
Total ou
21
pmi Fi
pmi2 Fi
620,60
96286,09
1275,60 203394,42
1146,25 187698,44
1680,50 282408,03
517,05
89113,57
1059,90 187231,34
1447,60 261943,22
7747,50 1308075,10
pmi Fi
k
k
( pmi X )2 Fi pmi2 Fi i =1
n
= i =1
A expresso S 2 = i =1
. Assim,
n 1
n 1
2
pmi Fi
k
2
i =1
(
7747,5)
2
pm
F
1308075,10
i i
3210,83
n
46
S 2 = i =1
=
=
= 71,35 cm 2 .
n 1
46 1
45
Logo,
S = S 2 = 71,35 cm 2 = 8,44 cm
CV =
S
8,44 cm
100% =
100% = 5,01%
X
168,42 cm
Exemplo 1.18: Uma fbrica classifica operrios de acordo com os graus obtidos em testes de aptido. Os
dados so apresentados na distribuio de frequncia abaixo:
Notas Teste Aptido
(Xi)
0 |----- 2
2 |----- 4
4 |----- 6
6 |----- 8
8 |---- 10
Total ou
Fi
Faci
pmi
pmi x
6
10
23
11
8
58
6
16
39
50
58
-
1
3
5
7
9
-
-4,172
-2,172
-0,172
1,828
3,828
( pmi x )2
17,409
4,719
0,030
3,340
16,650
40,149
( pmi x )2 Fi
104,454
47,193
0,684
36,741
117,203
306,276
b) O operrio que tirar nota acima de X + 2 S receber um prmio. Um operrio para receber esta
meno dever ter tirado quanto?
c) Com base nos dados da tabela, a partir de que nota temos 50% dos operrios mais aptos.
Soluo:
5
___
pm F
i
300
= 5,172414
58
i =1
( pm
S2 =
__
X ) 2 Fi
i =1
n 1
306,276
= 5,373 .
57
Desta forma X + 2 S = 9,808, portanto qualquer operrio com nota maior que 9,808 receber o premio.
c) A nota acima da qual esto 50% dos operrios chamada nota mediana, a qual calculada para dados
agrupados em intervalos por:
M d = LMd
n
58
( Fac ant )
( 16)
26
+ 2
hMd = 4 + 2
2 = 4 + = 4 + 1,13 = 5,13 .
FMd
23
23
22
23
Unidade II Probabilidade
1. Situando a Temtica
A teoria das probabilidades o fundamento para a inferncia estatstica. O objetivo desta parte que
o aluno compreenda os conceitos mais importantes da probabilidade.
O conceito de probabilidade faz parte do dia-a-dia dos trabalhadores das rea das cincias exatas,
cincias biolgicas, engenharia, etc., uma vez que seu conceito frequentemente usado na comunicao
diria. Por exemplo, podemos dizer que um aluno tem chance de 70% de ser aprovado em uma determinada
disciplina. Um professor est 90% seguro de que um novo mtodo de ensino proporcione uma melhor
compreenso pelos alunos. Um engenheiro de produo afirma que uma nova mquina reduz em 20% o
tempo de produo de um bem. Tal como mostram os exemplos, as pessoas expressam a probabilidade em
porcentagem. Trabalhando com a probabilidade matemtica mais conveniente express-la como frao (as
porcentagens resultam da multiplicao das fraes por 100).
2. Problematizando a Temtica
O conceito de probabilidade fundamental para o estudo de situaes onde os resultados so
variveis, mesmo quando mantidas inalteradas as condies de sua realizao. Por exemplo, jogando-se um
dado, temos seis resultados possveis de cada vez; a observao do sexo dos candidatos inscritos num
concurso pblico conduz a dois resultados possveis - masculino ou feminino. Em ambos os casos, embora
no sejamos capazes de afirmar de antemo que resultado particular ocorrer, temos condies de descrever
o conjunto de todos os resultados possveis do experimento. A sua repetio continuada mostra uma certa
regularidade nos resultados, o que nos permite estudar o experimento, apesar da incerteza nele presente.
3. Conhecendo a Temtica
3.1 Espaos Amostrais e Eventos
Antes de passarmos definio de probabilidade necessrio fixarmos os conceitos de experimento
aleatrio, espao amostral e evento.
Experimento Aleatrio
o processo da coleta dos dados relativo a um fenmeno que acusa variabilidade em seus resultados.
Um experimento caracteriza-se como aleatrio, em funo de poder ser repetido indefinidamente sob
condies, essencialmente inalteradas, e embora no sejamos capazes de afirmar que resultado particular
ocorrer, seremos sempre capazes de descrever o conjunto de todos os possveis resultados do mesmo.
Espao Amostral ( Notao: S ou (mega) )
o conjunto formado por todos os possveis resultados de um experimento aleatrio.
Eventos ( Notao: A, B. C, ... )
qualquer subconjunto do espao amostral.
3.1.1 Operaes entre Eventos
Combinaes de Eventos
Sejam A e B eventos em um mesmo espao amostral. Temos as definidas as seguintes operaes
entre conjuntos:
24
A B =
INTERSEO
UNIO
EVENTO COMPLEMENTAR
EVENTOS DISJUNTOS
( )
25
P ( A) =
Exemplo 2.1: Em uma seleo para uma vaga de engenheiro mecnico de uma grande empresa verificou-se
que dos 100 candidatos 40 tinham experincia anterior e 30 possuam curso de especializao. Vinte dos
candidatos possuam tanto experincia profissional como tambm algum curso de especializao.
Escolhendo um candidato ao acaso, qual a probabilidade de que:
a) Ele tenha experincia ou algum curso de especializao?
b) Ele no tenha experincia anterior nem curso de especializao?
Soluo
Vamos definir os seguintes eventos:
A = {O candidato possui experincia anterior}
B = {O candidato possui especializao}
Dados: p(A) = 0,4, p(B) = 0,3 p(AB) = 0,2 pede-se as seguintes probabilidades:
a) Ele tenha experincia ou algum curso de especializao
p(AB) = p(A) + p(B) p(AB) = 0,4 + 0,3 0,2 = 0,5
b) Ele no tenha experincia anterior nem curso de especializao?
P(AcBc) = P((AB)C) = 1- P(AB) = 1- [P(A) + P(B) P(AB)] =
= 1 [0,4 + 0,3 0,2] = 1 - 0,5 = 0,5.
3.2.3 Probabilidade Condicional e Independncia de Eventos
Dados dois eventos A e B contidos num espao amostral , muitas das vezes, estamos interessados
na ocorrncia de A dado que o evento B tenha ocorrido.
Para dar consistncia ideia de uma probabilidade condicional, suponhamos que uma organizao
de pesquisa junto a consumidores tenha estudado os servios prestados dentro da garantia por 200
comerciantes de pneus em uma grande cidade, obtendo os resultados resumidos na tabela seguinte:
Vendedores de Pneus
Dentro da Garantia
Total
Bom Servio
Servio Deficiente
Com marca
64
16
80
Sem marca
42
78
120
Total
106
94
200
Selecionado aleatoriamente um desses vendedores de pneus (isto , cada vendedor tem probabilidade de ser
selecionado), constatamos que as probabilidades de se escolher um vendedor de determinada marca (M), um
vendedor que presta bons servios dentro da garantia (Bs), ou um vendedor de marca determinada e que
presta bons servios dentro da garantia (MBs) so:
P( M ) =
80
= 0,40
200
P( Bs) =
106
= 0,53
200
P( M Bs) =
64
= 0,32 .
200
Todas essas probabilidades foram calculadas por meio da definio clssica de probabilidade. Como a
segunda dessas probabilidades P(Bs) prxima a 0,50 (50%), vejamos o que acontece se limitamos a escolha
26
a vendedores de uma marca determinada. Isto reduz o espao amostral s 80 escolhas, correspondentes 1a
linha da tabela. Temos ento, que a probabilidade de se escolher um vendedor que presta bons servios (Bs),
64
sabendo (ou dado) que a marca de pneu vendido pelo mesmo determinada ser de P( Bs | M ) =
= 0,80 ,
80
tendo-se uma melhora em relao a P(Bs) = 0,53 . Note que a probabilidade condicional que obtivemos aqui,
P ( Bs | M ) = 0,80 pode escrever-se como:
P( Bs | M ) =
64
80
200
200
P( M Bs)
P( M )
Teorema da Multiplicao
O resultado a seguir, obtido a partir da definio de probabilidade condicional, fornece a
probabilidade da ocorrncia conjunta de dois eventos A e B, isto , a probabilidade P(AB):
P( A B) = P( A) P(B | A)
ou
P( A B) = P(B) P( A | B)
4 3 2 1
=
6 5 4 5
Exemplo 2.3: Sejam A e B dois eventos tais que P(A) = 0,4 e P(AB) = 0,7. Seja P(B) = p. Para que valor
de p, A e B sero mutuamente exclusivos? Para que valor de p A e B sero independentes?
Soluo:
A
so
mutuamente exclusivos se A B = .
P ( A B ) = P ( A) + P ( B ) 0,7 = 0,4 + p p = 0,7 0,4 = 0,3.
Logo
P( A B) = 0 ,
independentes
P ( A B ) = P ( A) P ( B ) = 0,4 p .
P ( A B ) = P ( A) + P ( B ) P ( A B ) temos que: 0,7 = 0,4 + p 0,4p. Logo, p = 0,5.
Se
so
27
com
isso
Como
UB
= , ou
i =1
seja, os eventos eventos B1, B2, ..., Bk so mutuamente exclusivos. Seja A um evento qualquer associado a ,
ento:
P( Bi | A) =
P( Bi A)
P( A | Bi ).P( Bi )
=
, i = 1,K , k .
P( A)
P ( A | B1 ).P ( B1 ) + K + P ( A | Bk ).P ( Bk )
B4
B1
A
B2
B3
S
Exemplo 2.3: Numa certa turma, 1% dos homens e 4% das mulheres tem menos que 1,60m de altura. Alm
disso, 60% dos estudantes so homens. Considere que um estudante, selecionado aleatoriamente, tem menos
que 1,60m de altura. Qual a probabilidade do estudante ser homem?
Soluo: Sejam os eventos:
A = {estudantes com menos de 1,60m de altura};
M = {estudantes do sexo feminino};
H = {estudantes do sexo masculino}.
Note que os eventos M e H so mutuamente excludentes e representam uma partio do espao amostral ,
ou seja, M H = e M H = . Alm disso, sabemos que o evento A ocorreu, visto que dito que o
estudante possui menos que 1,60m de altura.
Assim, pelo Teorema de Bayes:
P( H | A) =
P ( H A)
P( A | H ).P( H )
0,01 0,60
0,006 3
=
=
=
=
P( A)
P( A | H ).P ( H ) + P( A | M ).P ( M ) 0,01 0,60 + 0,04 0,40 0,022 11
28
Observao:
1. Cada elemento de corresponder a exatamente um valor;
2. Diferentes valores , podem levar a um mesmo valor de X;
3. Nenhum elemento poder ficar sem valor de X.
Definio 3.2: Seja E um experimento e seu espao amostral. Seja X uma varivel aleatria definida em
e seja Rx seu contradomnio. Seja B um evento definido em relao a Rx, isto , B Rx. Ento, define-se o
evento A como
A = { | X ( ) B} = X 1 ( B) .
Assim, o evento A ser constitudo por todos os resultados em para os quais X() B.
Exemplo 3.1: Suponha 2 moedas lanadas e observada a sequncia de caras e coroas obtidas. Considere o
espao amostral associado a este experimento:
29
= p 1 + p 2 + ... + p n + ... = 1
Definio 3.3: (Funo de Distribuio de Probabilidade) - Dada uma varivel aleatria discreta X,
definimos F(x) a funo de distribuio acumulada ou, simplesmente, funo de distribuio (f.d) de X,
dada por:
n
F ( xi ) = P ( X xi ) F ( xi ) = P ( X = xi )
i =1
Exemplo 3.2: Considerando o exemplo 3.1, denote a funo de probabilidade e a funo de distribuio da
varivel aleatria X.
Soluo:
Seja X = nmero de caras obtidas no lanamento de 2 moedas, temos que a varivel aleatria X assume os
seguintes valores, X = {0, 1, 2}.
Temos que,
P(Co,Co) = P(X = 0) = ;
P(Ca,Co) = P(Co,Ca) = P(X = 1) = ;
P(Ca,Ca) = P(X = 2) = .
Denotamos a funo de probabilidade de X por
xi
P(X = xi)
0
1/4
1
1/2
2
1/4
2
1
Exemplo 3.3: Um par de dados lanado. Seja X a varivel aleatria que associa a cada ponto (d1, d2) de
a soma desses nmeros, isto , X(d1, d2) = d1 + d2. Determine a funo de probabilidade de X.
Soluo:
O espao amostral formado de 36 pares ordenados, representando as possibilidades no lanamentos de
dois dados = {(1,1), (1,2), ..., (5,6), (6,6)}.
Ento, a varivel aleatria X = d1 + d2 assume os seguintes valores X = {2, 3, 4, ..., 12}. Por conseguinte, a
funo de probabilidade de X obtida, calculando-se:
P (X = 2) = P(d1=1,d2=1) = 1/6 1/6 = 1/36
P (X = 3) = P(d1=1,d2=2) + P(d1=2,d2=1) = 1/36 + 1/36 = 2/36
30
..
P (X = 12) = P(d1=6,d2=6) = 1/36
Logo, a funo de probabilidade de X ser representada por
xi
2
3
4
5
6
7
8
9
10 11 12
P(X = xi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
3.2. Variveis Aleatrias Contnuas
Uma varivel aleatria dita contnua se o seu contradomnio for um intervalo ou uma unio de subintervalos.
Definio 3.4: Uma varivel aleatria X contnua se existir uma funo f, denominada funo densidade
de probabilidade (fdp) de X, que satisfaa as seguintes condies:
1. f ( x) 0, x R X ;
2.
f ( x)dx = 1 ;
b
Observaes
P (a X b) representa a rea sob a curva da funo densidade de probabilidade f(x).
x0
Para qualquer valor especfico de X, digamos x0, P(X = x0) = 0, pois P ( X = x 0 ) = f ( x)dx = 0 .
x0
Definio 3.5: A definio de funo de distribuio para o caso contnuo dada por
x
F ( x) = P ( X x) = f ( x)dx .
Observao: Seja F(x) a funo de distribuio acumulada de uma varivel aleatria contnua X, com fdp
dF ( x)
f(x). Ento, f ( x ) =
= F ' ( x) , para todo x no qual F(x) seja derivvel.
dx
Exemplo 3.4: Suponha que X uma varivel aleatria contnua com a seguinte fdp:
0 < x <1
2 x ,
.
f ( x) =
0, caso contrario
a) Mostre que f(x) uma fdp;
b) Calcule P(X );
c) Calcule P(X | 1/3 X 2/3)
Soluo:
a) Para que f(x) seja uma fdp basta verificar que
f ( x)dx = 2 xdx = x 2
= 1.
1
= .
0
0
4
c) Aplicando diretamente o conceito de probabilidade condicional, teremos
1/ 2
b) P ( X 1 / 2) =
1/ 2
f ( x)dx =
2 xdx = x 2
1/ 2
31
1/ 2
P (1 / 3 X 1 / 2)
P ( X 1 / 2 | 1 / 3 X 2 / 3) =
=
P (1 / 3 X 2 / 3)
1/ 3
2/3
1/ 3
2 xdx
=
2 xdx
5 / 36 5
= .
1 / 3 12
Exemplo 3.5: Seja a varivel aleatria X com f(x) definida no exemplo 3.4, calcule sua funo de
distribuio acumulada.
Soluo:
F ( x) =
0,
x<0
x
f ( s )ds = f ( s )ds = x 2 ,0 x < 1
0
1,
x 1
= E ( X ) = xi p( xi ) ,
i =1
se a srie
xi p( xi ) convergir, ou seja, xi
i =1
i =1
p( xi ) < .
Seja X uma varivel aleatria contnua com fdp f(x). O valor esperado de X ser definido por
+
= E ( X ) = xf ( x)dx .
E ( X ) = x i p ( x i ) = 0 + 1 + 2 = 1
4 2
4
i =1
Isto representa que, ao lanarmos a moeda 2 vezes esperamos que, em mdia, em um dos lanamentos
aparea Cara.
Exemplo 3.7: Considere a varivel aleatria contnua definida no exemplo 3.4. Obtemos a E(X) por
1
1
2
E ( X ) = x(2 x) dx = 2 x 2 dx =
0
0
3
Um outro parmetro importante que caracteriza uma varivel aleatria a varincia, denotada V(X)
ou . A varincia de uma varivel aleatria uma medida que d a idia de disperso dos valores da
varivel, em relao ao seu valor esperado (mdia).
2
Definio 3.7: (Varincia): Seja uma varivel aleatria X (discreta ou contnua) sua varincia, denotada
V(X) ou 2, definida por:
32
2 = V ( X ) = E [( X ) 2 ] ,
onde = E(X) a mdia de X.
Observaes:
V(X) 0 e mede a variabilidade ou disperso de X em torno da sua mdia ;
V(X) expressa em unidades quadradas (o que torna difcil a sua interpretao);
O Desvio Padro X = V ( X ) mede a disperso absoluta de X, sendo expressa na mesma unidade da
varivel aleatria X.
A definio de varincia de uma varivel aleatria (v.a.) X, pode ser re-escrita por
2 = V ( X ) = E ( X 2 ) [E ( X )]2 ,
onde: E ( X 2 ) = xi2 p ( xi ) .
i =1
,a < x < b
f ( x) = b a
0, c.c
33
1
1 x2
E( X ) = x
dx =
a ba
ba 2
=
a
(b 2 a 2 ) ( a + b)( a b) ( a + b)
=
=
2 (b a )
2(b a )
2
Alm disso,
E( X 2 ) =
x2
1
(b 3 a 3 ) (b a )(b 2 + a 2 + 2ab) (b 2 + a 2 + 2ab )
dx =
=
=
3(b a )
3(b a )
3
ba
Logo,
2
Var ( X ) = E ( X 2 ) [E ( X ) ] =
(b 2 + a 2 + 2ab) ( a + b) 2 (b a ) 2
=
3
4
12
Suponha que realizamos um experimento E, cujo resultado pode ser observado e classificado
como sucesso ou fracasso, caso o evento que nos interessa ocorra ou no, respectivamente. Associe
p, a probabilidade de sucesso, ao evento que nos interessa e 1 p = q, a probabilidade de fracasso.
Definimos, ento, a seguinte varivel aleatria discreta:
0, se ocorrer fracasso
.
X =
1, se ocorrer sucesso
A distribuio de probabilidade de X definida por:
xi
P(X = xi)
0
1p
1
p
Verifica-se facilmente que E(X) = p e V(X) = p(1 p), que so as principais caractersticas da v.a.
X.
Experimentos Binomiais
Um experimento binomial apresenta quatro propriedades:
1. O experimento consiste em uma sequncia de n ensaios idnticos e independentes;
2. Dois resultados so possveis em cada ensaio. Um denominado de sucesso e o outro de fracasso;
34
n
P( X = k ) = p k (1 p ) n k , k = 0,1,K n ,
k
pois, para X = k teremos observado k sucessos, cada um com probabilidade p e consequentemente (n-k)
fracassos, cada um com probabilidade q = 1 p.
Notao: X ~ B (n, p ) , equivalente a dizer que X tem distribuio Binomial com parmetros n e p.
Propriedades
E(X) = np
V(X) = npq
Exemplo 3.9: Dois times de futebol, A e B, jogam entre si 6 vezes. Suponha que as probabilidades de A
ganhar, perder ou empatar sejam as mesmas e permaneam constantes durante as 6 partidas. Encontre a
probabilidade do time A ganhar 4 vezes e calcule a esperana e a varincia.
Soluo
Seja X = {nmero de vezes que o time A ganha}
Note que p = 1/3 (vencer) e que q = 2/3 (perder ou empatar). Alm disso, n = 6.
6
4
Logo, P( X = 4) = (1 / 3) 4 (1 1 / 3) 6 4 = 15 (1 / 3) 4 ( 2 / 3) 2 =
20
0,08 .
243
1
=2 e a
3
1 2 4
= .
3 3 3
varincia V ( X ) = npq = 6
f ( x) =
(x )2
2
exp
, - < x < +, - < < +, > 0.
2
2
2
2
35
Notao: X N ( , 2), ou seja, X tem distribuio normal com mdia e varincia 2. Ou ainda, X
N ( , ) , isto , X tem distribuio normal com mdia e desvio padro .
Distribuio Normal Padro
O clculo direto de probabilidades envolvendo a distribuio normal no um processo elementar.
Notemos, entretanto, que a funo de densidade normal depende de dois parmetros, e , de modo que se
tabelssemos as probabilidades diretamente a partir dessa funo, seriam necessrias tabelas de dupla entrada
para cada valor particular = 0 e = 0, complicando consideravelmente o problema. Recorre-se, por
isso, a uma mudana de varivel, transformando a v.a. X na v.a. Z assim definida:
Z=
Esta nova varivel chama-se varivel normal padronizada, ou reduzida, sendo sua mdia igual a
zero ( = 0) e o seu desvio padro igual um ( = 1).
36
X E( X )
=
=0
E(Z ) = E
=
2
X V (X ) 0
V (Z ) = V
=
=
=1
2
2
A curva normal padro conserva as mesmas propriedades listadas anteriormente. Mediante tal
transformao, basta construirmos uma nica tabela, a da normal reduzida e, atravs dela, obtermos as
probabilidades associadas a todas as distribuies N (, ).
A utilidade notvel da tabulao pela varivel normal padronizada devida ao fato de que, se X
tiver qualquer distribuio normal N(, ), a tabela da distribuio N(0; 1) pode ser empregada para calcular
probabilidades associadas a X,
simplesmente aplicando a transformada para a varivel
Z.
Consequentemente, temos que
b
a
b
a
P( a X b) = P
Z
=
,
onde (z) = P (Z z), a funo de distribuio acumulada de N(0; 1).
Exemplo 3.9: Os salrios mdios dirio dos operrios de uma indstria so distribudos segundo uma
distribuio normal com mdia de R$ 50,00 e desvio padro de R$ 4,00. Encontre a probabilidade de um
operrio ter um salrio dirio abaixo de R$ 52,00.
Soluo
Seja X = o salrio dirio do operrios, estamos interessados em encontrar P (X < 52). Assim,
52
52 50
Atravs da tabela da distribuio normal padro, obtemos a probabilidade de interesse (0,50) = 0,6915 .
Logo, pode-se afirmar que a probabilidade de um operrio apresentar um salrio inferior a R$ 52,00 de
69,15%.
Dica
Trs importantes informaes que iro facilitar o clculo de probabilidades envolvendo a
distribuio normal padro, a partir da tabela que voc baixou na plataforma MOODLE: (i) a
tabela que voc est utilizando apresenta as probabilidades de P(Z z0) = F(z0), ou seja, a funo
de distribuio acumulada. No entanto, esta tabela considera apenas valores positivos para Z. (ii) a
rea total sob a curva equivale a 1. Logo, a metade da curva representa probabilidade igual a 0,5;
(iii) a curva da normal simtrica. Essa propriedade ser bastante til no clculo de
probabilidades onde os valores de Z so negativos, ou seja, P(X x0) = 1 P(X + x0);.
Exerccios
3.1 Cinco por cento dos motoristas de nibus da cidade HH so mulheres. Suponha que 20 motoristas de
nibus so selecionados aleatoriamente para serem entrevistados sobre as condies de trabalho. Qual a
37
probabilidade de que nenhum motorista selecionado seja mulher? Qual a probabilidade de que pelo menos 3
motoristas selecionados sejam mulheres?
3.2 O departamento de Recursos Humanos da empresa FF recebe 25 currculos para diversos cargos, e espera
que a probabilidade de no ocorrer candidatos experientes no grupo seja de 80%. Determine a probabilidade
de no mximo 8 currculos recebidos apresentarem candidatos experientes.
3.3 Uma confeco de roupa masculina suspeita que 35% de sua produo apresenta algum defeito. Se tal
suspeita correta, determine a probabilidade de que, numa amostra de seis peas, sejam encontradas: duas
peas defeituosas; no mnimo trs peas defeituosas; menos que trs peas defeituosas.
3.4 A probabilidade de um atirador acertar o alvo 2/3. Se ele atirar 5 vezes, qual a probabilidade de acertar
exatamente 2 tiros ?
3.5 Suponhamos que a presso sangnea sistlica normal de indivduos com idade entre 15 e 25 anos uma
varivel aleatria com distribuio normal de mdia 120mmHg e desvio padro 8mmHg. Nestas condies,
calcule a probabilidade de um indivduo dessa faixa etria, com presso sangnea sistlica normal
apresentar presso:
a) Inferior a 120mmHg; (R: 0,5)
b) Entre 100 e 110mmHg; (R: 0,0994)
c) Acima de 106mmHg; (R: 0,9599)
d) Abaixo de 136mmHg; (R: 0,9772)
e) Para os 20% dos indivduos que tm as maiores presses sangneas sistlicas, determinar a menor
presso sangnea sistlica. (R: 126,72 mmHg)
f) Para os 18% dos indivduos que tm as menores presso sangneas sistlicas, determinar a maior
presso sangnea sistlica. (R: 112,64 mmHg)
3.6 Acredita-se que as vendas aproximadas do creme dental MM sejam normalmente distribudas, com uma
mdia de 20.000 tubos por semana e um desvio padro de 3.000 tubos por semana. Calcule a probabilidade
de que mais de 22.000 tubos sejam vendidos em qualquer dada semana;
3.7- Os mergulhadores que so membros do Sindicato dos Mergulhadores Profissionais ganham em mdia
U$ 17 por mergulho de alta profundidade. Considere que os dados disponveis indicam que o pagamento seja
distribudo normalmente com desvio padro de U$ 2,25.
a)
Qual a probabilidade de que os salrios estejam entre U$15,00 e U$20,00 por mergulho;
b)
Qual a probabilidade de que os salrios sejam menores que U$12,00 por mergulho;
38
39
1+ 3+ 5
(1 3) 2 + ( 3 3) 2 + (5 3) 2 8
2
E(X) = =
=3 e V(X) = =
= .
3
3
3
40
xi
P( X = xi )
1/9
2/9
3/9
2/9
1/9
2 3
2 1 27
1
= 1 + 2 + 3 + 4 + 5 =
=3= ;
9
9
9
9
9 9
a sua varincia igual varincia da populao dividida pelo tamanho da amostra. Temos que:
2
V ( X ) = E( X 2 ) E( X ) .
1
2
3
2
1
93
Logo, E ( X 2 ) = 12 + 2 2 + 3 2 + 4 2 + 5 2 =
.
9
9
9
9
9
9
8
93
93
93 81 12 4
2
. Tais relaes
32 =
9=
= = = 3=
9
9
9
9 3 2
n
entre e X , e 2 e X2 , observadas no exemplo acima, podem ser generalizadas.
Assim, V ( X ) = E ( X 2 ) E ( X ) =
Usando a teoria das probabilidades possvel mostrar que os seguintes resultados gerais so vlidos
com relao distribuio amostral da mdia. Seja X uma varivel aleatria com valor esperado E(X) = e
varincia V(X) = 2 finita, isto , 0< 2 < . Seja X a mdia desta varivel aleatria, obtida de amostra
aleatria de tamanho n, selecionada com reposio. Ento, temos que:
E( X ) = X = ;
V( X ) = X2 =
2
n
Alm disso, tem-se o resultado conhecido como Teorema Central do Limite: Seja X uma varivel aleatria
com valor esperado E(X) = e varincia V(X) = 2. Para n suficientemente grande,
1 n
X = Xi
n i =1
apresenta, aproximadamente, uma distribuio normal com mdia e varincia
2
X N ,
n
2
n
, Logo,
X
e Z =
N (0,1) .
41
erro padro da mdia, maior ser a diferena entre parmetro e sua estimativa X , calculada a partir da
amostra . Quando n grande
V( X ) =
2 N n
.
, onde N o total de elementos da populao.
n N 1
3) Para valores grandes de n ( n 30) a aproximao da distribuio amostral da mdia X pela distribuio
Normal considerada satisfatria.
Exemplo 4.1 - Os registros de uma agncia de turismo mostram que um turista gastou, durante o ltimo ano,
em mdia = US$800,00, sendo o desvio padro dos gastos igual a = US$80,00. Ache a probabilidade de
que uma amostra de 64 turistas apresente um gasto mdio entre US$770,00 e US$825,00.
Soluo: Considere a varivel X = gastos (em US$). Embora a distribuio de X no seja conhecida, como o
tamanho da amostra n = 64 bastante grande, podemos admitir que a mdia amostral de X segue a
distribuio Normal com parmetros
80
X = = X = 800 e X =
=
= 10 .
n
64
Assim temos que
770
800
X
825
800
= P(3,0 Z 2,5) =
P(770 X 825) = P
10
10
p. q
, onde
n
p.q e
p p
p N p,
Z=
N (0,1) .
n
p.q
n
No caso de uma populao finita de tamanho N e uma amostra sem reposio, recomenda-se o uso do fator
de correo populacional no clculo da varincia de p , sendo expressa por:
p.q N n
V( p ) =
.
n N 1
42
Exemplo 4.2 Suponha que de um grande lote de produo, 10% dos itens produzidos apresentam algum tipo
de defeito. Em uma amostra aleatria de tamanho 60, obtida do lote para inspeo de qualidade, calcule a
probabilidade de ter mais de 15% dos itens defeituosos.
Soluo:
p p 0,15 0,10
P( p > 0,15) = P
>
= P( Z > 1,29) = 1 0,9015 = 0,0985 .
p.q
0,1 0,9
60
n
Se considerarmos um grande nmero de amostras, cada uma contendo 60 itens, em aproximadamente 9,85%
das amostras a proporo de itens defeituosos seria superior a 15%.
Exerccios
4.1 Admita que a aceitao de um grande lote de peas ocorra apenas se o comprimento mdio de 10
peas, retiradas aleatoriamente do lote, estiver entre 5 cm e 10 cm. Sabe-se que o comprimento das peas
uma varivel aleatria com distribuio Normal com mdia = 7,5cm e varincia 2 = 20 cm2. Calcule a
probabilidade do lote ser aceito. (R.: 0,9232)
4.2 Seja X1, X2, ... , Xn uma amostra aleatria de tamanho n obtida de X ~ N( , 2). Qual a
probabilidade da mdia amostral, X , estar compreendida em cada um dos intervalos seguintes?
a) X ;
b) 2 X ;
c) 3 X ;
onde =
. Dica: (a) Calcule P( - X + ).
X
43
4.8 - Uma empresa compra canetas esferogrficas, em grande quantidade, de um certo distribuidor. Antes de
aceitar os lotes remetidos, a empresa faz testes para verificar a sua qualidade. Se uma certa remessa
apresentar 5% de canetas defeituosas, a remessa ser devolvida ao fabricante. Calcule a probabilidade de
que em uma amostra aleatria de 50 canetas, mais do que 7% apresentem defeitos? R.: 0,2578
44
Qual a altura mdia do povo brasileiro? Qual a proporo de pessoas com nvel superior em Joo
Pessoa? A resposta para essas perguntas no so to fceis, mas para respond-las com exatido teramos que
medir todos os cidados brasileiros ou verificar quantos habitantes em Joo Pessoa possuem nvel superior, o
que impossvel. No entanto se coletarmos uma amostra e calcularmos a mdia e a proporo,
respectivamente, ser que essas estimativas esto prximas dos verdadeiros valores populacionais
(parmetros)? Uma outra pergunta seria a seguinte: Se a quantidade mdia de gua ingerida por um ser
humano de 10 litros por semana, os brasileiros bebem muito ou pouca gua? Como responderamos a esta
questo? A resposta para essas questes veremos nessa unidade.
3. Conhecendo a Temtica
3.1. Estimao de Parmetros
H inmeras situaes reais em que se procura determinar valores para quantidades desconhecidas
como mdias e propores. Certamente, de interesse para muitos empresrios saber a quantia mdia gasta
por um turista em sua cidade; um produtor de televiso procura sempre saber qual o ndice de audincia de
determinados programas; um engenheiro de controle de qualidade procura determinar a proporo de itens
produzidos com defeito em uma linha de produo.
A estimao consiste em determinar um valor amostral que substitua o respectivo valor real do
parmetro populacional desconhecido.
3.1.1. Conceitos Fundamentais
Para uma melhor compreenso dos temas mais importantes desta unidade, vamos definir alguns
conceitos fundamentais dentro da inferncia estatstica:
Estimador - uma funo matemtica que leva em considerao os dados amostrais. Como tal
funo calculada baseada em uma amostra, considerada uma varivel aleatria, caracterizada por
uma distribuio de probabilidade. Assim, X =
1 n
xi , onde x1, x2, ... , xn so n valores amostrais,
n i =1
Estimativa - um valor particular do estimador para uma dada amostra coletada. Assim, por
exemplo, para uma dada amostram, X = 3,9kg pode ser uma estimativa para o verdadeiro peso
mdio, desconhecido, de recm-nascidos do sexo feminino em certa localidade.
Estimao por ponto ou Estimao Pontual chamamos de estimao pontual quando, a partir de
uma amostra, um nico valor usado para estimar um parmetro desconhecido. Um estimador
pontual para um parmetro populacional , geralmente representado por . Assim, X , S2, S e p
so estimadores pontuais para os parmetros , 2, e p respectivamente, isto , = X , 2 =S2,
=S e p = p =
x
, onde x = no de elementos da amostra que possuem certa caracterstica de
n
interesse.
45
Quando achamos uma estimativa pontual, ela raramente coincide com o valor real do parmetro.
Uma desvantagem do uso de estimadores pontuais que, se nenhuma informao adicional for dada, no h
maneira de decidir o quo boa a estimativa, pois no temos nenhuma ideia da sua preciso. Um
procedimento mais desejvel para estimao , ento, calcular um intervalo que tenh uma probabilidade
pr-estabelecida de conter o parmetro desconhecido.
A Estimao por intervalo ou Intervalos de Confiana um mtodo de estimao onde, a partir de
uma amostra aleatria, determinamos um intervalo [T1, T2] que contm o verdadeiro parmetro com uma
probabilidade conhecida 1 - , chamada de Grau ou Nvel de Confiana, onde (alfa) a probabilidade
do intervalo no conter o verdadeiro valor do parmetro desconhecido. Assim, se amostras aleatrias, do
mesmo tamanho, so obtidas repetidamente da mesma populao, uma certa percentagem de intervalos
(nvel de confiana) incluir o parmetro populacional desconhecido. Alm disso, veremos que a partir das
estimativas intervalares possvel inferir sobre o quo confiveis so realmente as estimativas pontuais
obtidas.
3.2 Intervalos de Confiana para Mdia Populacional
Um intervalo de confiana para uma mdia especifica um intervalo de valores dentro do qual o
parmetro populacional desconhecido, neste caso a mdia, pode estar. Estes intervalos podem ser usados, por
exemplo, por um fabricante que deseja estimar sua produo mdia diria ou um pesquisador que deseja
estimar o tempo de resposta mdia, por paciente, a uma nova droga.
De modo geral, estamos interessados em encontrar um intervalo na forma
[T1 = X 0 ; T2 = X + 0 ] = [ X 0 ] ,
onde 0 representa a semiamplitude do intervalo de confiana, sendo chamado de Erro de Preciso em
relao a . Portanto, o objetivo encontrar 0, tal que
P (| X |< 0 ) = 1 ,
que equivalente a
P( 0 < X < + 0 ) = 1 .
Note que essa afirmao probabilstica pode ser reescrita por
P( X 0 < < X + 0 ) = 1 .
Em breve, entenderemos a necessidade destas duas ltimas afirmaes probabilsticas.
3.2.1. Intervalos de Confiana para Mdia Populacional Caso 1: 2 conhecida
Suponha que temos uma amostra aleatria de tamanho n, X1, X2, ... , Xn, de uma populao cuja
distribuio normal com mdia e varincia 2. Ento
1 n
2
X =
xi apresenta distribuio X N , e Z = X N (0,1) .
n i =1
n
P( 0 < X < + 0 ) = 1
0
+0
<Z<
) = 1
/ n
/ n
0
0
P(
<Z<
) = 1
/ n
/ n
P ( z / 2 < Z < + z / 2 ) = 1
P(
onde: z / 2 =
/ n
e z / 2 =
0
/ n
f(z)
/2
/2
-z/2
46
z/2
Logo,
0 = z / 2
Assim, note que a partir da expresso acima podemos tambm estimar, por exemplo, o tamanho da amostra
(n) quando 0, z e so conhecidos
n = z / 2
0
) =1 .
n
n
Em outras palavras, isso significa que a probabilidade de que o verdadeiro valor de pertena ao
intervalo
P ( X z / 2
< < X + z / 2
[ X z / 2
; X + z / 2
igual a 1-.
Exemplo 5.1: Para estimar gasto mdio semanal no supermercado A, coletou-se uma amostra aleatria de
16 consumidores, obtendo-se um gasto mdio amostral de X = US$30,00. Supondo uma distribuio
normal para a populao, com desvio padro = US$2,60, obtido de outros estudos similares, calcule um
intervalo de 95% de confiana para estimar o gasto mdio semanal populacional no supermercado A.
Soluo: Temos: = 2,6; n = 16 e X = 30. Para = 5% z/2 = P( Z z / 2 ) = 1,96. Logo, o intervalo de
2,6
= 30 1,27 ou [28,73; 31,27].
16
Observao.: No IC(,95%) = [30 1,27], o valor 1,27 a estimativa do erro para a estimativa. Em outras
palavras, h 95% de probabilidade da estimativa no diferir do verdadeiro valor da mdia () por mais de
1,27.
Dica: Abaixo, seguem os valores mais usados de z/2 tal que P ( Z z / 2 ) = 1 ( / 2) :
z/2
1%
2,57
5%
1,96
10%
1,64
S2 =
(x
x )2
i =1
n 1
Agora, a estatstica
T=
X
~ t ( n1) ,
S/ n
ter distribuio t-Student com n-1 graus de liberdade, e no mais a distribuio normal padro. No
entanto, podemos re-escrever a estatstica T como funo da distribuio normal padro (Z), da seguinte
forma:
47
T=
X
X
=
=Z .
S
S
S
n
n
Logo,
t ( n1, / 2 ) = z / 2
Substituindo z / 2 = t ( n 1, / 2 )
z / 2 = t ( n 1, / 2 )
[ X t ( n 1, / 2 )
S
S
; X + t ( n 1, / 2 )
].
n
n
Logo,
0 = t( n 1, / 2 )
S
.
n
Assim, a partir da expresso acima podemos tambm estimar, por exemplo, o tamanho da amostra (n)
quando 0, z e S so conhecidos.
Exemplo 5.2: Um fiscal de produtos alimentcios seleciona uma amostra aleatria de 16 pacotes de lanche
marca M nas prateleiras de um supermercado. Pesa o contedo de cada pacote, encontrando um peso
mdio X = 170g e um desvio padro S = 5g. O peso lquido indicado em cada pacote 180g. Verifique se
um intervalo com 90% de confiana para o peso mdio lquido verdadeiro abrange o peso lquido
especificado na embalagem. Suponha distribuio normal para a populao.
Soluo: Dados: n = 16, X = 170g e S = 5g. Para = 10% e n = 16 t n 1, / 2 = t n1, 2 = t15;0,05 =1,753,
obtido da tabela da distribuio t-Student, pois a informao que dispomos no problema diz respeito ao
desvio padro amostral.
Logo, o intervalo de confiana para o peso mdio populacional ser denotado por: IC(,90%) =
5
= [170 2,19] ou [167,81; 172,19]. Note que o IC no abrange o peso lquido indicado na
170 1,753
16
embalagem de 180g.
Exemplo 5.3: Em uma amostra de n = 9 testes de consumo, um motor experimental percorreu,
respectivamente, 16, 14, 17, 15, 15, 14, 18, 17 e 18 km com l litro de gasolina (sob condies especficas).
Supondo distribuio normal para a populao, construa um intervalo de 99% de confiana para a distncia
mdia verdadeira do novo motor, com 1 litro de gasolina.
Soluo: Seja X = quilmetros percorridos com 1 litro de gasolina. Temos que n = 9, X = 16km/l e S =
1,581 km/l. Para = 1% e n = 9 t n1, 2 = t8; 0,005= 3,355, obtido da tabela da distribuio t-Student.
1,581
9
48
Exemplo 5.4: Se um pesquisador sabe que uma populao tem distribuio normal com desvio padro =
12. Considerando um nvel de confiana de 95%, encontre o tamanho de amostra necessrio para que a
mdia amostral no se afaste em mais de 2 unidades do verdadeiro valor da mdia populacional.
Soluo: Em nosso problema, observamos que o desvio padro populacional conhecido. Neste caso,
usamos a seguinte expresso para o clculo do tamanho de amostra
n = z / 2
0
12
= 1,96 139 .
n = z / 2
0
2
X ~ N (np , np (1 p ) ) .
Logo,
p =
x
p (1 p ) ,
~ N p,
n
n
visto
p(1 p) . Assim, Z =
X 1
Var ( p ) = Var = 2 np(1 p) =
n
n n
que
X 1
E ( p ) = E = np = p
n n
p p
N (0,1) .
p(1 p)
n
O intervalo que estamos procurando, da forma [ p 0 ] , ser obtido por um caminho semelhante
0 = z / 2
p (1 p )
.
n
Note que a partir da expresso acima tambm podemos o tamanho da amostra (n) quando 0, z e p so
conhecidos.
No entanto, na prtica p desconhecido, sendo substitudo pela proporo amostral p . Tal
substituio encontra justificativa no fato de que se n suficientemente grande para garantir a aproximao
para Normal, a estimativa deve ser razoavelmente prxima do valor real do parmetro. Assim, o intervalo de
confiana para p, ao nvel de confiana 1-, dado por
[ p z / 2
p (1 p )
; p + z / 2
n
p (1 p )
]
n
Exemplo 5.5: Para se avaliar a taxa de desemprego em uma cidade, coletou-se uma amostra aleatria de
1000 habitantes em idade de trabalho e observou-se que 87 eram desempregados. Estimar a percentagem de
desempregados em toda a cidade (populao) atravs de um intervalo de 95% de confiana.
49
Soluo: Temos que n = 1000 e que a proporo amostral de desempregados p = 87 = 0,087 . Logo, q$ =
1000
1 p = 0,913. Para = 5% Z/2 = 1,96.
O intervalo de confiana ser, ento:
IC(p,95%) = [0,087 1,96x
0,087 x 0,913
] = [0,087 0,0175] ou [ 0,0695; 0,1045] ou, ainda, [6,95%;
1000
10,45%].
Exemplo 5.6: Numa pesquisa de mercado, 57 das 150 pessoas entrevistadas preliminarmente afirmaram que
seriam compradoras de certo produto a ser lanado. Essa amostra suficiente para estimar a proporo real
de futuros compradores, com um erro de 4% e confiana de 95%?
Soluo: p = 57 = 0,38 e q$ = 1 p = 0,62; 0 = 0,04; Z/2 = 1,96.
150
2
1,96
Logo, n = / 2 p (1 p ) =
0,38(0,62) 566 .
0,04
0
Como apenas 150 pessoas foram entrevistadas preliminarmente, a amostra no foi suficiente. Sendo
necessrio entrevistar mais 566 - 150 = 416 pessoas.
3.3. Testes de Hipteses
Na estimao de parmetros, foram apresentados procedimentos que permitem definir estimadores
pontuais ou por intervalos de parmetros populacionais. Um outro procedimento de inferncia estatstica o
Teste de Hiptese - tem como objetivo principal verificar, a partir de informaes contidas em uma amostra
aleatria, se hipteses a respeito de parmetros populacionais so ou no verdadeiras. Assim podemos estar
interessados em: verificar uma especificao de qualidade de um produto, testar uma experincia de sucesso
no passado, avaliar uma teoria ou decidir sobre suposies resultantes das observaes. Logo, atravs dos
testes de hipteses podem-se eliminar, tanto quanto possvel, falsas concluses cientficas.
Hiptese Nula (H0) - uma afirmao sobre o parmetro, supostamente verdadeira, que vai ser posta
prova e na qual o teste montado. Em geral, formula-se H0 com o objetivo de rejeit-la, isto , formulamos
H0 contrria ao que suspeitamos que seja verdade. Por exemplo, se um cientista acha que uma nova droga
eficaz para certo tipo de paciente, ento, por contradio, formulamos a hiptese H0 de que a nova droga no
eficaz. Portanto, para provar que o cientista est certo, H0 teria de ser rejeitada. Dessa forma, podemos
pensar que o que estamos interessados deve ser alocado em H1 (Hiptese Alternativa).
Uma possvel representao : H0: = 0 , onde qualquer parmetro.
Hiptese Alternativa (H1) - Hiptese que vai ser comparada hiptese nula, isto , uma afirmao
sobre o parmetro que afirma A hiptese nula H0 falsa.
Se usamos H0: = 0 para representar a hiptese nula, ento podemos usar as seguintes
representaes para as possveis hipteses alternativas:
H1: 0;
H1: < 0;
H1: > 0
50
A aceitao de H0, sendo esta hiptese falsa, possibilita a busca de outros meios de tratamentos, enquanto
que a rejeio de H0, sendo esta verdadeira, exclui a possibilidade de se prosseguir com outras opes para os
pacientes. Logo, desejvel exercer um controle sobre e mant-lo pequeno. Dessa forma, os testes de
hiptese podem ser montados de maneira que, fixado o erro do tipo I, o erro do tipo II seja minimizado
aumentando-se o tamanho da amostra.
Observao: O significado de usado nos Testes de Hipteses totalmente diferente de seu significado na
Estimao por Intervalos. Nos Testes de Hiptese, representa a probabilidade de rejeitar uma hiptese nula
suposta verdadeira, enquanto que na Estimao por Intervalos representa a probabilidade de que os limites
de confiana construdos no contenham o verdadeiro valor do parmetro.
Estatstica do Teste
A deciso de rejeitar ou no a hiptese nula (H0) baseada nos dados amostrais, que so usados para
calcular o valor da Estatstica de Teste e que servir de referncia para a tomada da deciso. Para isso,
divide-se a curva da distribuio amostral da estatstica em duas regies, uma chamada Regio Crtica (ou
Regio de Rejeio de H0), e a outra Regio de No Rejeio de H0. Temos, ento, a seguinte Regra de
Deciso do teste: se o valor calculado da estatstica do teste pertencer regio crtica, rejeita-se H0 em
favor da hiptese alternativa; caso contrrio, H0 no ser rejeitada em relao hiptese alternativa.
Outras definies importantes, necessrias na formulao de um problema de Testes de Hipteses so:
Regio Crtica do Teste - a regio de rejeio de H0, isto , o conjunto de valores de uma
estatstica que determina a rejeio de H0. Rejeitamos a hiptese nula se a estatstica de teste est
na regio crtica, porque isto indica uma discrepncia significativa entre a hiptese nula e os
dados amostrais.
Valor Crtico do Teste: o valor, ou valores, que separa(m) a regio crtica (que levam a
estatstica do teste a rejeitar a hiptese nula) da regio de no rejeio de H0.
51
Teste Unilateral: quando a regio crtica do teste localizada completamente em uma das
extremidades da curva da distribuio amostral da estatstica do teste.
o Teste Unilateral Esquerda: a regio crtica (sombreada) localiza-se no extremo
esquerdo da distribuio.
Hipteses: H0: = 0 vs H1: < 0
o Teste Unilateral Direita: a regio crtica (sombreada) localiza-se no extremo direito da
distribuio.
Hipteses: H0: = 0 vs H1: >
Teste Bilateral: a regio crtica (sombreada) localiza-se nas duas extremidades da distribuio.
Hipteses: H0: = 0 vs H1: 0
A escolha entre usar um teste unilateral e um teste bilateral determinada pelos objetivos do problema, no
qual se deseja verificar uma afirmao a cerca do parmetro populacional.
ZC =
X 0
Note que a estatstica calculada com base nas informaes contidas na amostra.
O prximo passo consiste em fixar o nvel de significncia do teste (). A seguir, apresentamos os valores
mais usados para Z e Z/2.
Z
Z/2
1%
2,33
2,57
5%
1,64
1,96
52
10%
1,28
1,64
Quadro 2: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Mdia Populacional,
considerando 2 conhecido.
Hiptese
Regio Crtica
Regra de Deciso
(sombreada)
(Rejeitar H0)
H0: = 0
H1: 0
Zc -Z/2 ou Zc Z/2
H0: = 0 (*)
H1: < 0
Zc -Z
H0: = 0 (**)
H1: > 0
Zc Z
(*) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0 , com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H0: = 0.
(**) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0 , com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H0: = 0.
Exemplo 5.7: O gerente de uma indstria de carnes enlatadas tem estabelecido a seguinte especificao: um
novilho com 12 meses de vida resulta numa mdia de 250kg de carne. A experincia passada indica que,
mesmo com uma mudana na mdia, o desvio padro permanece ligeiramente constante, em = 18kg. Para
determinar se a especificao est sendo observada, o gerente seleciona uma amostra aleatria com 100
novilhos e obteve uma mdia X =253kg de carne. Realize um teste de hiptese para verificar se houve
mudana na especificao, a um nvel de significncia de 5%.
Soluo:
H0: = 250kg
H1: 250kg (a especificao no est sendo observada)
Temos que = 18kg; n = 100, X = 253kg e = 5%.
Dessa forma, a estatstica do teste Zc =
253 250
= 1,67. Como o teste bilateral, o valor crtico ao nvel
18
100
53
(x
2
S =
x)
i =1
n 1
Dessa forma, a estatstica do teste para mdia populacional quando 2 desconhecida ser expressa por
TC =
X 0
S
Quadro 3: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Mdia Populacional,
considerando 2 desconhecido.
Hiptese
Regio Crtica
Regra de Deciso
(sombreada)
(Rejeitar H0)
H0: = 0
H1: 0
Tc -t(n-1,/2) ou
Tc t(n-1,/2)
H0: = 0 (*)
H1: < 0
Tc -t(n-1,)
H0: = 0 (**)
H1: > 0
Tc t(n-1,)
(*) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0 , com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H0: = 0.
(**) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0 , com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H0: = 0.
Exemplo 5.8: O tempo mdio necessrio para completar uma tarefa era de 15 minutos. Obtm-se uma
amostra aleatria de nove indivduos e, durante o perodo de teste, seus tempos (X) para concluir a tarefa
foram 11, 12, 15, 10, 12, 14, 15, 13 e 15. Assumindo que estes dados vm de uma distribuio normal, teste
a hiptese de que houve alterao no tempo mdio para completar a tarefa. Use um nvel de 5% de
significncia.
Soluo:
H0: = 15min
H1: 15min (houve alterao no tempo mdio)
Com base nas informaes amostrais, temos que n = 9; X = 13min e S = 1,871 min.
54
13 15
= 3,207. Como o teste bilateral , o valor crtico ao
1,871
9
nvel = 5%, sendo n = 9, ser tn-1;/2 = t8;0,025 = 2,306 (obtido da tabela da distribuio t-Student).
Deciso: Como Tc < tn-1;/2, existem evidncias para rejeitar H0. Logo, com base nos dados amostrais e com
5% de significncia podemos rejeitar a hiptese H0, ou seja, existem evidncias para afirmar que os
indivduos apresentaram um tempo mdio para executar a tarefa diferente do que era observado
anteriormente.
n
n
Dessa forma, sob a hiptese H0: p = p0, a estatstica do teste para a proporo populacional p ser
expressa por
p p0
ZC =
~ N (0,1) ,
p0 (1 p0 )
n
que segue uma distribuio normal padro.
Aps fixar o nvel de significncia do teste (), apresentamos a seguir as regies crticas e regras de deciso
para as respectivas hipteses.
Quadro 3: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Proporo
Populacional p.
Hiptese
Regio Crtica
Regra de Deciso
(sombreada)
(Rejeitar H0)
H0: p = p0
H1: p p0
Zc -Z/2 ou Zc Z/2
H0: p = p0 (*)
H1: p < p0
Zc -Z
H0: p = p0 (**)
H1: p > p0
Zc Z
(*) Por simplicidade, excluiu-se a possibilidade p p0 na hiptese nula H0 , com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H0: p = p0.
55
(**) Por simplicidade, excluiu-se a possibilidade p p0 na hiptese nula H0 , com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H0: p = p0.
Exemplo 5.9: Afirma-se que em um alqueire de mas, 10% esto estragadas. De uma amostra aleatria de
150 mas examinadas, 30 estavam estragadas. O que voc conclui sobre a proporo de mas estragadas
em um alqueire a um nvel de 5% de significncia?
Soluo:
H0: p = 0,1
H1: p 0,1
Com base nas informaes amostrais, temos que n = 150 e p = 30/150 = 0,2.
Dessa forma, a estatstica do teste ser ZC =
0,2 0,1
= 4,08. Como o teste bilateral, o valor crtico ao
( 0,1).( 0,9 )
150
Exemplo 5.10: De registros de vendas passadas sabe-se que 30% dos consumidores compram a pasta dental
C. Uma nova propaganda desse produto feita e, para testar sua eficcia, de uma amostra aleatria de 1000
consumidores que viram a propaganda, 334 responderam que compram a pasta dental C. Isso indica que a
nova propaganda foi bem sucedida? Use um nvel de 5% de significncia para testar se a nova propaganda
aumentou a proporo de consumidores da pasta dental C.
Soluo:
H0: p= 0,3
H1: p > 0,3 (a nova propaganda aumentou as vendas da pasta C)
Com base nas informaes amostrais, temos que n = 1000 e p = 334/1000 = 0,334.
Dessa forma, a estatstica do teste ser ZC =
0,334 0,300
= 2,35. De acordo com a hipteses H1, temos
( 0,3).( 0,7 )
1000
que o teste ser unilateral e, portanto, o valor crtico ao nvel = 5% ser Z = 1,64.
Deciso: Como ZC > Z Existem evidncias para rejeitar H0. Logo, com base nos dados amostrais e ao
nvel de 5% de significncia, podemos concluir a nova propaganda aumentou a proporo de consumidores
que compram a pasta dental C.
56
2. Problematizando a Temtica
A correlao e regresso permite-nos investigar uma relao entre duas variveis. O estudo de tal
relao pode ser a resposta a perguntas, tais como: Qual o preo de venda para uma casa com 200m2 ? ou
Pais mais altos tendem a ter filhos mais altos? ou, ainda, De cada unidade adicional de renda quanto, em
mdia, gasto com despesas adicionais com vesturio?. A noo de casualidade est implcita nestas
questes. Por exemplo, o tamanho de uma casa determina, ou contribui, para a definio do preo de venda,
mas no o contrrio. Ao estudar a correlao entre variveis, a determinao da direo da casualidade entre
tais variveis deve ser o primeiro passo ao se analisar dados para o uso dessas tcnicas inferenciais, que sero
melhor discutidas a seguir.
3. Conhecendo a Temtica
3.1. Correlao
O objetivo do estudo da correlao a determinao do grau de relacionamento entre duas variveis.
O termo correlao significa co-relacionamento, sinalizando at que ponto os valores de uma varivel
esto relacionados com os da outra. Caso os pontos das variveis, representados num plano cartesiano (X, Y)
ou grfico de disperso, apresentem uma disperso ao longo de uma reta imaginria, dizemos que os dados
apresentam uma correlao linear.
Diagrama de Disperso
Uma forma de visualizarmos se duas variveis (X,Y) apresentam-se correlacionadas atravs do
diagrama de disperso, onde os valores das variveis so representados por pontos, num sistema cartesiano.
A figura abaixo representa dois exemplos de grficos de disperso. O primeiro grfico apresenta a relao
entre as variveis horas de treinamento e no de acidentes. O segundo grfico relaciona as variveis nota
no vestibulare mdia na graduao.
so
a
t
o
na
eu
dd
a
a
i rg
da
n
M
50
s
te 40
n
e 30
id
c 20
A
10
0
0
10 12
14
16 18
20
4,00
3,75
3,50
3,25
3,00
2,75
2,50
2,25
2,00
1,75
1,50
300 350 400 450 500 550 600 650 700 750 800
Horas de treinamento
Nota no vestibular
57
Correlao
Uma medida do grau e do sinal da correlao linear entre duas variveis (X,Y) dado pelo
Coeficiente de Correlao Linear de Pearson, definido por:
Cov ( X , Y )
,
S X SY
r=
(x
Cov ( X , Y ) =
x )( yi y )
i =1
n 1
Portanto, aps alguma lgebra, possvel denotar o coeficiente de correlao linear pela expresso
abaixo:
i =1
i =1
n xi y i xi y i
i =1
r=
n
n
2
n x i xi
i =1
i =1
n
n
2
n y i yi
i =1
i =1
Este coeficiente adimensional, logo no afetado pelas unidades de medidas das variveis X e Y;
O sinal positivo indica que as variveis so diretamente proporcionais, enquanto que o sinal
negativo indica que a relao entre as variveis inversamente proporcional;
O valor de r estar sempre no intervalo de -1 a 1. Teremos r = +1 se os pontos estiverem
exatamente sobre uma reta ascendente (correlao positiva perfeita). Por outro lado, teremos r = -1
se os pontos estiverem sobre uma reta descendente (correlao negativa perfeita)
-1
ausncia
Sentido: negativa negativa ne gativa
Fora:
forte m oderada fraca
TC = r
n2
~ t ( n 2), / 2 ,
1 r 2
58
Quadro 4: Hipteses, Regio Crtica e Regra de Deciso para a Correlao Linear Populacional
Hiptese
Regio Crtica
Regra de Deciso
(sombreada)
(Rejeitar H0)
H0: = 0
H1: 0
Tc -t(n-2,/2) ou
Tc t(n-2,/2)
Exemplo 6.1: A tabela abaixo apresenta os preos mdios das aes e ttulos divulgados pela Bolsa de Nova
York entre 1950 e 1959. Calcule o coeficiente de correlao de Pearson, interprete o resultado e verifique sua
significncia a nvel de 5%.
Ano
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
Total ()
Aes (X)
35,22
39,87
41,85
43,23
40,06
53,29
54,14
49,12
40,71
55,15
452,64
Ttulos (Y)
102,43
100,43
97,43
97,81
98,32
100,07
97,08
91,59
94,85
94,65
974,66
Soluo:
Para o clculo do coeficiente de correlao r, necessitamos de alguns clculos preliminares a partir da tabela
acima:
Ano
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
Total ()
Aes (x)
35,22
39,87
41,85
43,23
40,06
53,29
54,14
49,12
40,71
55,15
452,64
Ttulos (y)
102,43
100,43
97,43
97,81
98,32
100,07
97,08
91,59
94,85
94,65
974,66
xy
3607,58
4004,14
4077,45
4228,33
3938,70
5332,73
5255,91
4498,90
3861,34
5219,95
44025,03
x2
1240,45
1589,62
1751,42
1868,83
1604,80
2839,82
2931,14
2412,77
1657,30
3041,52
20937,69
y2
10491,90
10086,18
9492,60
9566,80
9666,82
10014,00
9424,53
8388,73
8996,52
8958,62
95086,72
i =1
i =1
n x i y i xi y i
i =1
r=
n
n xi x i
i =1
i =1
n
n y i y i
i =1
i =1
n
59
9 (95086,72) (974,66)
= 0,4561
Conclumos que existe uma correlao negativa entre os preos mdios das aes e de ttulos, ou seja, existe
uma tendncia de baixa nos preos das aes quando se verifica alta nos preos dos ttulos e vice-versa,
embora tal relao no seja acentuada.
Para testar a significncia da correlao, devemos realizar um teste de hipteses para correlao
populacional. As hipteses H0 e H1 so definidas por:
H0: = 0
H1: 0
Com base nas informaes amostrais, temos que n = 9 e r = -0,4561. Dessa forma, a estatstica do teste ser
n2
= 1,4496 . De acordo com a hipteses H1, temos que o teste ser bilateral e, portanto, o
1 r2
valor crtico ao nvel = 5% ser t(n-2,/2) = t(7,0.025) = 2,37.
TC = r
Deciso: Como t(n-2,/2) < TC < t(n-2,/2) No existem evidncias para rejeitar H0. Logo, com base nos
dados amostrais e ao nvel de 5% de significncia, no podemos afirmar que exista uma correlao entre os
preos mdios das aes e dos ttulos entre 1950 e 1959.
3.2. Regresso
Quando analisamos dados que sugerem a existncia de uma relao funcional entre duas variveis,
surge ento o problema de se determinar uma funo matemtica que exprima esse relacionamento, ou seja,
uma equao de regresso.
Portanto, ao imaginar uma relao funcional entre duas variveis, digamos X e Y, estamos
interessados numa funo que explique grande parte da variao de Y por X. Entretanto, uma parcela da
variabilidade de Y no explicada por X ser atribuda ao acaso, ou seja, ao erro aleatrio.
Admitimos que a varivel X seja coletada sem erro, isto , X no ser aleatrio. Enquanto que a
varivel Y apresenta uma variao na qual, acreditamos, que possa ser explicada por X. Essa situao admite
a formulao do problema de modo que uma varivel Y, chamada de varivel resposta ou dependente, seja
apresentada em funo de uma varivel X, denominada de varivel explicativa ou independente.
Formalmente, a anlise de regresso parte de um conjunto de observaes pareadas (x1, y1), (x2, y2),
..., (xn, yn), relativas s variveis X e Y e considera que podemos escrever a relao entre as duas variveis,
da seguinte maneira:
yi = + xi + i,
onde:
o yi a varivel resposta associada i-sima observao de Y;
o xi a i-sima observao do valor fixado para a varivel independente (e no aleatria) X;
o i o erro aleatrio para a i-sima observao, isto , o efeito de fatores que esto afetando a
observao de Y de forma aleatria. Por suposio, consideramos que i ~ N(0,2);
o e so parmetros que precisam ser estimados.
60
SQE = i2 = (y i x i ) 2 = f ( , ). .
Aplicando-se derivadas parciais em relao a e na expresso acima e igualando-se a zero,vamos
encontrar as seguintes estimativas para e , as quais chamaremos de a e b, respectivamente:
b=
n x i yi x i yi
n x i2 ( x i )
a=
b x i
n
y = a + b x ,
e para cada valor xi (i = 1, ..., n) temos, pela equao de regresso, o valor predito:
y i = a + b x i .
A diferena entre os valores observados e os preditos ser chamada de resduo do modelo de regresso,
sendo denotado por:
ei = yi yi .
O resduo relativo i-sima observao (ei) pode ser considerado uma estimativa do erro aleatrio (i), como
ilustrado abaixo.
61
onde y =
y
n
Note que o coeficiente representa a inclinao da reta de regresso. Dessa forma, um teste de
hipteses sobre este parmetro pode ser usado como uma maneira de verificar se a equao de regresso
ajustada com base em dados amostrais estatisticamente significante. Para tanto, vamos definir as hipteses
nula e alternativa por:
H0: = 0
H1: 0.
A estatstica do teste para o coeficiente angular ser expressa por
TC =
n
(y
onde: S b2 =
y i ) 2
i =1
n
|b|
~ t ( n 2), / 2 ,
Sb
(n 2) ( xi x )
i =1
Aps fixar o nvel de significncia do teste (), apresentamos a seguir a regio crtica e a regra de deciso
para o teste bilateral.
Quadro 5: Hipteses, Regio Crtica e Regra de Deciso para a Correlao Linear Populacional
Hiptese
Regio Crtica
Regra de Deciso
(sombreada)
(Rejeitar H0)
H0: = 0
H1: 0
Tc -t(n-2,/2) ou
Tc t(n-2,/2)
62
Exemplo 6.2: A tabela abaixo apresenta os respectivos pesos X e Y de uma amostra de 12 pais e de seus
filhos mais velhos. Determine a reta de regresso e realize um teste de hipteses ao nvel de 5% de
significncia para o coeficiente angular
Soluo:
Para o clculo dos coeficientes de um modelo de regresso, necessitamos de alguns clculos preliminares a
partir da tabela acima:
Peso Pais (X)
65
63
67
64
68
62
70
66
68
67
69
71
= 800
xy
4420
4158
4556
4160
4692
4092
4760
4290
4828
4489
4692
4970
54107
x2
4225
3969
4489
4096
4624
3844
4900
4356
4624
4489
4761
5041
53418
Obtemos os as estimativas dos parmetros do modelo de regresso linear atravs dos coeficientes
b=
a=
n x i y i x i y i
n x ( x i )
2
i
b x i
n
811 (0,4767)800
= 35,82 .
12
Assim, a equao de regresso que relaciona os pesos dos pais e de seus filhos, pode ser denotada por
y = 35,82 + 0,4764 x .
A estatstica do teste para o coeficiente angular ser expressa por
|b|
,
TC =
Sb
63
(y
onde: S b2 =
y i ) 2
i =1
(n 2) ( xi x )
i =1
n
(y
S b2 =
y i ) 2
i =1
n
(n 2) ( xi x ) 2
i =1
Dessa forma, a estatstica do teste ser TC = | 0,4764 | = 2,85 . De acordo com a hipteses H1, temos que o
0,027934
teste ser bilateral e, portanto, o valor crtico ao nvel = 5% ser t(n-2,/2) = t(10,0.025) = 2,23.
Deciso: Como TC > t(n-2,/2) Existem evidncias para rejeitar H0. Logo, com base nos dados amostrais
e ao nvel de 5% de significncia, podemos afirmar que existe uma relao funcional entre os pesos dos pais
e de seus filhos mais velhos.
Por ltimo, o coeficiente de correlao mltiplo pode ser calculado a partir dos dados observados (y) e de
seus respectivos valores preditos ( y ). A tabela abaixo apesenta os clculos necessrios para obter o R2.
Peso Pais (X)
65
63
67
64
68
62
70
66
68
67
69
71
= 800
66,8
65,8
67,7
66,3
68,2
65,4
69,2
67,3
68,2
67,7
68,7
69,6
-
( y y ) 2
0,64
3,06
0,02
1,62
0,40
4,96
2.51
0,10
0.40
0,02
1,23
4,25
19,22
( y y) 2
0,17
2,51
0,17
6,67
2,01
2,51
0,17
6,67
11,67
0,34
0,17
5,84
38,92
(y
(y
y)
y)
19,22
= 0,4938 = 49,38% .
38,92
Isso significa que apenas 49,38% da variao dos pesos dos filhos pode ser explicada pela variao de peso
nos pais.
4. Avaliando o que foi construdo
Ao final desta unidade aprendemos dois importantes conceitos dentro da Estatstica: correlao e
regresso. Ambos os mtodos podem ser aplicadas no processo de tomada de deciso em inmeros
problemas reais. Pratique tais conceitos resolvendo os exerccios propostos no MOODLE. Espero que essa
viagem pelos Mtodos Estatsticos tenha sido bem explorada.
64
5. Referncias Bibliogrficas
FONSECA, J.S., MARTINS, G.A. & TOLEDO, G.L., Estatstica Aplicada, So Paulo, Editora Atlas, 2
ed., 1985.
TRIOLA, M.F, Introduo Estatstica, Livros Tcnicos e Cientficos, 7 ed,, Rio de Janeiro, 1999.
COSTA NETO, P.L., Estatstica, Edgard Blucher, So Paulo, 1977.
MEYER, P.L., Probabilidade: Aplicaes Estatstica, Livros Tcnicos e Cientficos, Editora AS, Rio de
Janeiro, 1983.
65