Inferência Estatística
Inferência Estatística
Inferência Estatística
ES TATSTICA
D E - UFSM
2003
Sum rio
1 Conceitos bsicos
1.1 Populao x Amostra
1.2 Censo x Amostragem
1.3 Dado x Varivel
1.4 Parmetros x estatsticas
1.5 Arredondamento de dados
1.6 Fases do mtodo estatstico
2 Representao tabular
2.1 Representao esquemtica
2.2 Elementos de uma tabela
2.3 Sries estatsticas
2.4 Distribuio de freqncia
3 Representao grfica
3.1 Grficos de Linhas
3.2 Grficos de colunas ou barras
3.3 Grficos circulares ou de Setores (Pie Charts)
3.4 Grfico Pictorial - Pictograma
3.5 Grfico Polar
3.6 Cartograma
3.7 Grficos utilizados para a anlise de uma distribuio de freqncia
4 Medidas descritivas
4.1 Medidas de posio
4.2 Medidas de variabilidade ou disperso
4.3 Medidas de disperso relativas
4.4 Momentos, assimetria e curtose
4.5 Exerccios
5 Probabilidade e variveis aleatrias
5.1 Modelos matemticos
5.2 Conceitos em probabilidade
5.3 Conceitos de probabilidade
5.4 Exerccios
5.5 Teorema de Bayes
5.6 Variveis aleatrias
5.7 Funo de probabilidade
5.8 Exemplos
5.9 Exerccios
6 Distribuies de Probabilidade
6.1 Distribuies discretas de probabilidade
6.2 Exerccios
6.2 Distribuies contnuas de probabilidade
6.4 Exerccios
7 Amostragem
7.1 Conceitos em amostragem
7.2 Planos de amostragem
6.3 Tipos de amostragem
7.4 Amostragem com e sem reposio
7.5 Representao de uma distribuio amostral
7.6 Distribuies amostrais de probabilidade
7.7 Exerccios
7.8 Estatsticas amostrais
7.9 Tamanho da amostra
8 Estimao de parmetros
8.1 Estimao pontual
8.2 Estimao intervalar
8.3 Exerccios
9 Testes de hipteses
9.1 Principais conceitos
8.2 Teste de significncia
9.3 Exerccios
9.4 Testes do Qui-quadrado
9.5 Exerccios
10 Regresso e Correlao
10.1 Introduo
10.2 Definio
10.3 Modelo de Regresso
10.4 Mtodo para estimao dos parmetros e
10.5 Decomposio da varincia Total
10.6 Anlise de Varincia da Regresso
10.7 Coeficiente de Determinao (r)
10.8 Coeficiente de Correlao (r)
10.9 Exerccios
11 Referncias bibliogrficas
1 Conceitos B sicos
1.1 Populao x Amostra
Uma populao pode, mediante processos operacionais, ser considerada infinita, pois a mesma ir depender
do tamanho da amostra. Se a freqncia relativa entre amostra e populao for menor do que 5% ela
considerada infinita, se a freqncia relativa for maior do 5% ela considerada finita.
Varivel: aquilo que se deseja observar para se tirar algum tipo de concluso, geralmente
as variveis para estudo so selecionadas por processos de amostragem. Os smbolos
utilizados para representar as variveis so as letras maisculas do alfabeto, tais como X, Y,
Z, ... que pode assumir qualquer valor de um conjunto de dados. As variveis podem ser
classificadas dos seguintes modos:
3 a) Se o primeiro algarismo aps aquele que formos arredondar for 5, seguido apenas
de zeros, conservamos o algarismo se ele for par ou aumentamos uma unidade se
ele for mpar, desprezando os seguintes.
Ex.: 6,2500 (para dcimos) 6,2
12,350 (para dcimos) 12,4
Se o 5 for seguido de outros algarismos dos quais, pelo menos um diferente de zero, aumentamos uma
unidade no algarismo e desprezamos os seguintes.
Ex.: 8,2502 (para dcimos) 8,3
8,4503 (para dcimos) 8,5
17,4%
18,4%
12,3%
29,7%
22,2%
18%
12%
30%
22%
99%
17%
18%
12%
31%
22%
100%
100%
Produo
9 702
9 332
9 304
9 608
10 562
Populao
3 037
17 568
42 810
11 878
5 115
80 408
Populao
80 408
38 566
118 974
Srie Mista ou Composta: A combinao entre duas ou mais sries constituem novas
sries denominadas compostas e apresentadas em tabelas de dupla entrada. O nome da
srie mista surge de acordo com a combinao de pelo menos dois elementos.
Local + poca = Srie Geogrfica Temporal
Populao Urbana do Brasil por Regio de 1940 a 1980 (x 1000)
Anos
1940
1950
1960
1970
1980
REGIES
NE
SE
S
3 381
7 232
1 591
4 745
10 721
2 313
7 517
17 461
4 361
11 753 28 965
7 303
17 567 42 810
11 878
N
406
581
958
1 624
3 037
CO
271
424
1 007
2 437
5 115
fi
2
3
2
3
5
15
Xi
154
162
170
178
186
194
----
fi
18
25
20
52
30
15
160
Alm da Regra de Sturges, existem outras frmulas empricas para resolver o problema para determinao
do nmero de classes [n(k)], h quem prefira n ( k) n . Entretanto, a verdade que essas frmulas no
nos levam a uma deciso final; esta vai depender na realidade de um julgamento pessoal, que dever estar
ligado a natureza dos dados, procurando, sempre que possvel, evitar classes com freqncias nulas ou
freqncias relativas exageradamente grandes.
A amplitude do intervalo de classe deve ser constante em todo a distribuio de freqncias intervalar.
Amplitude total (H): a diferena entre o limite superior da ltima classe e o limite
inferior da 1 classe, ou a diferena entre ltimo e o primeiro elemento de um conjunto de
dados postos em ordem crescente.
H = L n l1
Ponto mdio de classe (X i): a mdia aritmtica simples do limite inferior com o limite
superior de uma mesma classe.
Xi =
li + Li
2
Quando substituirmos os intervalos de classes pelos pontos mdios (Xi), ter-se- uma distribuio de
freqncia pontual.
n = f i = f 1 + f 2 + ... + f n
i =1
=n
i =1
Freqncia Relativa (fr i): o quociente entre a freqncia absoluta da i-sima classe
com o somatrio das freqncias.
fri =
fi
Obs.:
f
i =1
fr
i=1
=1
Frn = fri = 1
i =1
3 Represen ta o gr fica
Os grficos so uma forma de apresentao visual dos dados. Normalmente, contm
menos informaes que as tabelas, mas so de mais fcil leitura. O tipo de grfico depende da
varivel em questo
3.1 Grficos de Linhas
Usado para ilustrar uma srie temporal.
Produo de Petrleo Bruto no Brasil de 1976 a 1980 (x 1000 m)
11000
10500
10000
Produo
9500
9000
8500
1976
1977
1978
1979
1980
Anos
NE
30000
25000
SE
20000
S
CO
15000
10000
5000
0
1940
1950
1960
1970
10
1980
50000
40000
Pop.
30000
17568
20000
10000
11878
5115
3037
0
N
NE
SE
CO
Regies
As larguras das barras que devero ser todas iguais podendo ser adotado qualquer dimenso, desde que seja
conveniente e desde que no se superponham. O nmero no topo de cada barra pode ou no omitido, se
forem conservados, a escala vertical pode ser omitida.
N
NE
SE
S
CO
1940
1950
1960
1970
11
1980
80000
S
60000
SE
40000
N
NE
20000
0
1940
1950
1960
1970
1980
5115
11878
Regies SE
42810
NE
17568
3037
0
Assim como os grficos de Colunas podem ser construdos grficos de barras comparativas.
3.3 Grficos circulares ou de Setores (Pie Charts)
Representao grfica da freqncia relativa (percentagem) de cada categoria da
varivel. Este grfico utilizado para variveis nominais e ordinais. uma opo ao grfico de
barras quando se pretende dar nfase comparao das percentagens de cada categoria. A
construo do grfico de setores segue uma regra de 3 simples, onde as freqncias de cada
classe correspondem ao ngulo que se deseja representar em relao a freqncia total que
representa o total de 360.
12
Caractersticas:
- A rea do grfico equivale totalidade de casos (360o = 100%);
- Cada fatia representa a percentagem de cada categoria
Populao Urbana e Rural do Brasil em 1980 (x 1000)
32%
Urbana
Rural
68%
1250
1000
750
500
250
0
1968
1974
1980
1986
1990
1994
13
3.631.647
1987
2.473.581
1985
1.277.107
1983
9.645
1979
36%
Internamento em hospital
e uso de drogas relaxantes
Acumpuntura
Hipnose
Injeo de Clonidina, droga que
reduz os efeitos da abstinncia
30%
27%
19,5%
18,5%
Pinus
6,8%
Eucalipto
24,4%
Madeira
nativa
68,8%
14
Meses
Precipitao (mm)
Janeiro
174,8
Fevereiro
36,9
Maro
83,9
Abril
462,7
Maio
418,1
Junho
418,4
Julho
538,7
Agosto
323,8
Setembro
39,7
Outubro
66,1
Novembro
83,3
Dezembro
201,2
Fonte: Base Area de Santa Maria
Mdia = 237,31 mm
15
3.6 Cartograma
a representao de uma carta geogrfica. Este tipo de grfico empregado quando o
objetivo o de figurar os dados estatsticos diretamente relacionados com as reas geogrficas
ou polticas
Dados absolutos (populao) usa-se pontos proporcionais aos dados.
Dados relativos (densidade) usa-se hachaduras.
Exemplo:
Populao da Regio Sul do Brasil - 1990
Estado
Paran
Santa Catarina
Rio Grande do Sul
Fonte: IBGE
Populao (hab.)
9.137.700
4.461.400
9.163.200
rea (m 2)
199.324
95.318
280.674
Densidade
45,8
46,8
32,6
Fonte: IBGE
Fonte: IBGE
16
17
3.6.3 Ogivas
Altura em centmetros de 160 alunos do Curso de Administrao da UFSM 1990
Ogiva Crescente
Ogiva Decrescente
18
19
60
50
40
30
20
10
0
Freqncia
60
50
40
30
20
10
0
20
Quando for em fazer o uso da curva polida convm mostrar as freqncias absolutas, por meio de
um pequeno circulo, de modo que qualquer interessado possa julgar se esse ponto se o ponto
um dado original ou um dado polido.
150
154
158
162
166
170
Altura (cm)
|--|--|--|--|--|--
154
158
162
166
170
174
Xi
152
156
160
164
168
172
----
fi
4
9
11
8
5
3
40
21
fci
(0+ 2 x 4 + 9)/4 = 4,25
(4 + 2 x 9 + 11)/4 = 8,25
(9 + 2 x 11 + 8)/4 = 9,75
(11 + 2 x 8 + 5)/4 = 8,00
(8 + 2 x 5 + 3)/4 = 5,25
(5 + 2 x 3 + 0)/4 = 2,75
---
31
b) Curvas assimtricas
Na prtica, no se encontram distribuies perfeitamente simtricas. As distribuies
obtidas de medidas reais so mais ou menos assimtricas, em relao freqncia mxima.
Assim, as curvas correspondentes a tais distribuies apresentam a cauda de um lado da
ordenada mxima mais longa do que o outro. Se a cauda mais longa fica a direita chamada
assimtrica positiva ou enviesada direita, se a cauda se alonga a esquerda, a curva
chamada assimtrica negativa ou enviesada esquerda.
Assimtrica Positiva
Assimtrica Negativa
32
4 Medidas Descritivas
Tem por objetivo descrever um conjunto de dados de forma organizada e compacta
que possibilita a visualizao do conjunto estudado por meio de suas estatsticas, o que no
significa que estes clculos e concluses possam ser levados para a populao.
Podemos classificar as medidas de posio conforme o esquema abaixo:
4.1 Medidas de Posio
Representativas
Separatrizes
Dominantes
Mdias
Mdia Aritmtica
Mdia Geomtrica
Mdia Harmnica
Mediana
Quartis
Decis
Centis ou Percentis
Moda de Czuber
Moda de King
Moda de Pearson
X=
33
Xi
i =1
ou =
X
i =1
Xw =
Pesos (Wi)
2
3
2
3
10
X .W
i
i =1
i=1
Distribuio de freqncias
- Mdia Aritmtica ( X )
Altura em centmetros de 160 alunos do
Curso de Administrao da UFSM - 1990
Altura (cm)
Xi
fi
Xi . fi
150
158
166
174
182
190
|--|--|--|--|--|--
158
166
174
182
190
198
154
162
170
178
186
194
----
18
25
20
52
30
15
160
2763,0
4037,5
3390,0
9230,0
5565,0
2917,55
27903
X .f
i
X=
i =1
i=1
Xmin. X Xmax.
2 a) A soma algbrica dos desvios calculados entre os valores observados e a mdia
aritmtica igual a zero; desvios = d = x i
n
i =1
i =1
d = ( x i ) = zero
34
3 a) Somando-se ou subtraindo-se todos os valores (Xi) da srie por uma constante "k"
(k 0), a nova mdia aritmtica ser igual a mdia original somada ou subtrada por
esta constante "k".
xi
yi = x i k
Y =Xk
X Y = X k
Y = X k
Xg = n
= n X 1.X 2 . ... .X n
i =1
Dados Tabelados
fi
Xg
i =1
fi
fi
i =1
X1 1 .X2 2 . ....Xn n
i=1
fi
Xg = 10i=1
35
1
n
f i .logXi
fi i =1
= 10 i=1
n
n
i =1
1
Xi
n
1
1
1
+
+ ... +
X1
X2
Xn
Dados Tabelados
n
Xh =
i =1
n
i= 1
fi
fi
Xi
f 1 + f 2 + .. . + f n
f1
f
f
+ 2 + . .. + n
X1
X2
Xn
X X g Xh
i =1
se for mediana
S = 2
i(n + 1)
S
1 i 3
se for quartis
S=4
36
1 i 9
se for decis
S = 10
1 i 99
se for centis
S = 100
Dados Tabelados
b) Distribuio de freqncias pontual: segue a mesma regra usada para dados
no tabelados
c) Distribuio de freqncias intervalar
S i = l Si
i.n
Fant .h
+
f Si
onde:
Si = Md i = 1;
S i = Q i 1 i 3;
Si = Di 1 i 9 ;
Si = C i ou Pi 1 i 99
l Si
i.n
S
posio da separatriz;
Fant
h
fSi
37
a) Dados no tabelados
Ex.: 3
5
1
5
5
4
6
1
5
5
4
7
2
6
6
4
8
2
6
6
5
9
3
7
7
5 6 6 7 8 9
Mo = 4 (unimodal)
10 11 12 13
Mo = / (amodal)
3 3 4 5 5 5
Mo1 = 3 Mo 2 = 5 (bimodal)
7 8 8
Mo = / (amodal)
7 8
Mo1 = 5 Mo2 = 6 Mo3 = 7 (multimodal)
Mo b = X i
b) Distribuio de freqncias intervalar
- Moda de Czuber (Mo c ): O processo para determinar a moda usado por Czuber leva
em considerao as freqncias anteriores e posteriores classe modal.
1
Mo c = lMo +
.h
1 + 2
1 = f Mo f ant
2 = f Mo f pos
onde:
l Mo
fMo
fant
fpos
f pos
Mo k = l Mo +
f +f
ant
pos
38
.h
- Moda de Pearson (Mo p): O processo usado por Pearson pressupe que a
distribuio seja aproximadamente simtrica, na qual a mdia aritmtica e a mediana so
levadas em considerao.
Mop = 3 Md - 2 X
x = Md = Mo
M od a
M e d ian a
M di a
Mo
Md x
x Md
39
Mo
4.1.8 Exerccios
Para os dados abaixo calcule: Md; Q1; Q3 ; D 3; C70
1)
3
10
12
13
15
17
18
21
11
13
14
17
18
19
22
25
2)
Alturas dos alunos da Turma X
no 1o sem. de 1994 - UFSM
Alturas
fi
3)
63
15
75
25
84
30
91
20
90
1
55
30
2
45
70
3
52
40
4
48
60
- Anlise Grfica
H = Xmax Xmin
i =1
mdio
X X = 0 , assim ficando:
i =1
d=
X
i =1
X
=
X 1 X + X2 X +... + X n X
n
41
(f
n
d =
Xi X
i =1
f
i =1
f1 X 1 X + f 2 X 2 X + ... + f n X n X
n
i=1
(X
n
2=
i =1
(X
n
S2 =
X)
X)
i =1
n 1
(X
X ) + ( X 2 X ) + ... + ( X n X )
n
(X
X ) + (X 2 X ) + ... + (X n X )
n 1
f (X
X)
2 =
i =1
f
i =1
f (X
n
S2 =
i =1
i =1
X)
f1 (X 1 X ) + f 2 ( X 2 X ) + ... + f n ( X n X )
2
f1 ( X 1 X ) + f 2 (X 2 X ) + ... + f n (X n X )
2
i =1
i=1
42
(X
n
i =1
X)
(X
n
S=
i =1
X)
(X
X ) + (X 2 X ) + ... + (X n X )
n
(X
X ) + ( X 2 X ) + ... + ( X n X )
n 1
n 1
f (X
n
X)
i =1
f 1 (X 1 X ) + f 2 (X 2 X ) + ... + f n ( X n X )
2
S=
i =1
f
i =1
i =1
X)
i =1
f (X
f1 ( X 1 X ) + f 2 ( X 2 X ) + ... + f n ( X n X )
2
i =1
(n - 1) usado como um fator de correo, onde devemos considerar a varincia amostral como uma
estimativa da varincia populacional.
- Propriedades da Varincia
1) Somando-se ou subtraindo-se uma constante k a cada valor observado a varincia no ser alterada;
2) Multiplicando-se ou dividindo-se por uma constante k cada valor observado a varincia ficar
multiplicada ou dividida pelo quadrado dessa constante.
R
d2
43
forma, essa relao entre a amplitude e o desvio padro de uma amostra que permite fazer
grficos de controle X R .
TABELA 1: - Fatores para construir um grfico de controle
n
2
3
4
5
6
7
8
9
10
d2
1,128 1,693 2,059 2,326
2,534 2,704 2,847 2,970
3,078
n
15
16
17
18
19
20
21
22
234
d2
0,347 3,532 3,532 3,640
3,689 3,735 3,778 3,819
3,858
Fonte: Montgomery, D.C. Statical Quality Control. Nova York, Wyley. 1991.
11
12
3,173 3,258
24
25
3,391 3,391
13
3,336
-----
14
3,407
-----
Relativa
- Varincia relativa
- Coeficiente de Variao (Pearson)
2
S2
ou
2
X2
S
ou x 100
44
mr
mr
X
=
r
i
X f
=
f
r
i
onde:
r um nmero inteiro positivo;
m0 = 1;
m1 = mdia aritmtica.
- Momentos centrados na mdia (Mr)
O momento de ordem r centrado na mdia, definido como:
Mr
Mr
(X
=
X)
(X X)
=
f
i
fi
d
n
r
i
d
n
onde: M0 = 1;
M1 = 0;
M2 = varincia (s2).
45
r
i
fi
r =
onde: s = desvio padro.
Mr
sr
4.4.2 Assimetria
Uma distribuio de valores sempre poder ser representada por uma curva (grfico).
Essa curva, conforme a distribuio, pode apresentar vrias formas. Se considerarmos o valor
da moda da distribuio como ponto de referncia, vemos que esse ponto sempre corresponde
ao valor de ordenada mxima, dando-nos o ponto mais alto da curva representativa da
distribuio considerada, logo a curva ser analisada quanto sua assimetria.
- Distribuio Simtrica: aquela que apresenta a X Mo Md e os quartis Q1 e Q3
eqidistantes do Q2 .
X Mo Md
- Distribuio Assimtrica
Assimtrica Positiva
Assimtrica Negativa
Mo < Md < X
X < Md < Mo
Q 3 + Q 1 2 Md
Q 3 Q1
3 =
M3
s3
simetria;
assimetria fraca;
assimetria forte.
4.4.3 Curtose
J apreciamos as medidas de tendncia central, de disperso e de assimetria. Falta
somente examinarmos mais uma das medidas de uso comum em Estatstica, para se
positivarem as caracterst icas de uma distribuio de valores: so as chamadas Medidas de
Curtose ou de Achatamento, que nos mostra at que ponto a curva representativa de uma
distribuio a mais aguda ou a mais achatada do que uma curva normal, de altura mdia.
- Curva Mesocrtica (Normal): considerada a curva padro.
- Curva Leptocrtica: uma curva mais alta do que a normal. Apresenta o topo
relativamente alto, significando que os valores se acham mais agrupados em torno da moda.
- Curva Platicrtica: uma curva mais baixa do que a normal. Apresenta o topo
achatado, significando que vrias classes apresentam freqncias quase iguais.
47
- Coeficiente de Curtose
K=
Q 3 Q1
2( P90 P10 )
4,2
5,3
6,7
8,3
9,4
4,3
5,5
6,8
8,5
9,4
4,4
5,7
6,9
8,6
9,5
4,5
5,8
7,0
8,8
9,5
4,5
6,0
7,2
8,9
9,6
48
4,6
6,1
7,5
9,0
9,7
5,0
6,3
7,6
9,1
9,8
5,1
6,4
7,7
9,2
9,9
5,2
6,5
7,9
9,3
10,0
154
162
168
173
179
188
194
155
163
169
173
180
189
194
156
163
169
174
182
189
195
158
164
170
174
183
190
197
160
164
170
175
184
191
197
160
165
170
175
185
192
199
161
166
171
176
186
192
200
161
167
171
177
186
192
201
161
167
172
178
187
192
205
52,50
59,00
66,25
78,00
91,35
100,20
53,50
60,30
67,50
80,00
92,10
101,00
54,00
61,50
68,00
81,50
93,20
102,00
54,20
62,00
68,70
82,50
94,00
103,40
55,50
62,90
69,50
83,50
95,25
104,30
49
56,30
63,50
70,00
85,00
96,00
105,00
56,50
64,00
72,00
87,30
97,00
107,00
57,00
64,30
75,00
88,00
98,00
108,00
58,10
65,00
76,50
89,10
99,80
109,10
50
A
_
52
53
A I B , se A e B forem Quaisquer;
P (A I B) = P( A ) . P(B)
Ex.: A e B eventos Quaisquer
S = { 1, 2, 3, 4 }
A = {1, 2 }
B = { 2, 4 }
A I B = { 2}
P(A I B ) = P( A ) . P(B)
P (A ) =
2
4
P( B) =
2
4
P(A I B ) =
1
4
( )
I B)
( B) = P(AP(B)
PA
( )
54
AI BICID =
FIGURA 6.6 - Evento coletivamente exaustivos
55
P(E) =
a
,
a+b
onde os resultados devem ser verossmeis (possvel e verdadeiro) e permite a observao dos
valores da probabilidade antes de ser observado qualquer amostra do evento (E).
5.3.3 Definio Axiomtica
Seja () um experimento, seja (S) um espao amostral associado a (). A cada evento
(E) associa-se um nmero real representado por P(E) e denominaremos de probabilidade de E,
satisfazendo as seguintes propriedades:
a - 0 P(E) 1;
b - P(S) = 1;
c - Se A e B so eventos mutuamente excludentes, ento:
P(A U B) = P(A) + P(B).
d - Se A1, A 2, ..., An so eventos mutuamente excludentes dois a dois, ento:
P(A1 U A 2 U ... U An ) = P(A1) + P(A2) + ... +P(An)
ou
n
P( U A i ) =
i=1
P(A ) .
i
i=1
56
P(A U A ) = P(S)
_
P(A U A ) = P(A) + P( A )
_
P(A) + P( A ) = 1
logo,
_
P(A ) = 1 - P(A).
Teorema 3 - Se A e B so eventos quaisquer, ento:
P(A U B) = P(A) + P(B) - P(A I B)
Prova: Para provar o Teorema 3 devemos transformar A U B em eventos mutuamente
excludentes, conforme a FIGURA 6.
(A U B) = A U (B I A )
57
e
_
B = (A I B) U (B I A )
logo pela propriedade (c) temos:
_
P(A U B) = P[A U (B I A )]
_
( -)
P(B) = P[(A I B) U (B I A )]
_
( --)
58
P(A i I A j ) +
i < j =2
P(A I A
P(A I A
i < j< k = 3
IAk ) +
RESUMO
Mutuamente Excludente s P(A U B) = P(A) + P(B)
U
AIB =
A IB
Independentes P(A I B) = P(A) x P(B)
I
AIB
59
5.4 Exerccios
1) A probabilidade de 3 jogadores marcarem um penalti respectivamente: 2/3; 4/5;
7/10 cobrando uma nica vez.
a) todos acertarem. (28/75)
b) apenas um acertar. (1/6)
c) todos errarem. (1/50)
2) Numa bolsa com 5 moedas de 1,00 e 10 moedas de 0,50. Qual a probabilidade de ao
retirarmos 2 moedas obter a soma 1,50. (10/21)
3) Uma urna contm 5 bolas pretas, 3 vermelhas e 2 brancas. Trs bolas so retiradas.
Qual a probabilidade de retirar 2 pretas e 1 vermelha ?
a) sem reposio (1/4)
b) com reposio (9/40)
4 ) Numa classe h 10 homens e 20 mulheres, metade dos homens e metade das
mulheres possuem olhos castanhos. Ache a probabilidade de uma pessoa escolhida ao
acaso ser homem ou ter olhos castanhos. (2/3)
5) A probabilidade de um homem estar vivo daqui a 20 anos de 0.4 e de sua mulher
de 0.6 . Qual a probabilidade de que:
a) ambos estejam vivos no perodo ? (0.24)
b) somente o homem estar vivo ? (0.16)
c) ao menos a mulher estar viva ? (0.6)
d) somente a mulher estar viva? (0.36)
6) Faa o exerccio anterior considerando 0,5 a chance do homem estar vivo e 0,2 a
chance da mulher estar viva e compara os resultados.
7) Uma urna contm 5 fichas vermelhas e 4 brancas. Extraem-se sucessivamente duas
ficha, sem reposio e constatou-se que a 1 branca.
a) qual a probabilidade da segunda tambm ser branca ? (3/8)
b) qual a probabilidade da 2 ser vermelha ? (5/8)
8) Numa cidade 40 % da populao possui cabelos castanhos, 25% olhos castanhos e
15% olhos e cabelos castanhos. Uma pessoa selecionada aleatoriamente.
a) se ela tiver olhos castanhos, qual a probabilidade de tambm ter cabelos castanhos?
b) se ela tiver cabelos castanhos, qual a probabilidade de ter olhos castanhos ? (3/5)
(3/8)
60
BRASILEIRO
18
20
38
ARGENTINO
12
05
17
URUGUAIO
10
15
25
TOTAL
40
40
80
Mdico
21
12
Engenheiro
13
08
Veterinrio
15
17
61
UA
i =1
= S,
Ai I A j = , i j
j =1
k
( -)
( --)
como
62
P(B I A i )
P A i =
,
B
P(B)
( ---)
Aj
j =1
Exemplo:
U1
U2
U3
Azul
Branca
Preta
Cores
Urna
Escolhe-se uma urna ao acaso e dela extrai-se uma bola ao acaso, verificando-se que
ela branca. Qual a probabilidade dela ter sado da urna:
U1 ?
U2 ?
U3 ?
2) Temos 2 caixas: na primeira h 3 bolas brancas e 7 pretas e na segunda, 1 branca
e 5 pretas. De uma caixa escolhida aleatoriamente, selecionou-se uma bola e verificou-se que
preta. Qual a probabilidade de que tenha sado da primeira caixa ? segunda caixa ?
5.6 Variveis aleatrias
Ao descrever um espao amostral (S) associado a um experimento () especifica-se
que um resultado individual necessariamente, seja um nmero. Contudo, em muitas situaes
experimentais, estaremos interessado na mensurao de alguma coisa e no seu registro como
um nmero.
Definio: Seja () um experimento aleatrio e seja (S) um espao amostral associado ao
experimento. Uma funo de X, que associe a cada elemento s S um nmero
real x(s), denominada varivel aleatria.
63
P(X ) = 1
i =1
F(X) = P( X x i )
Propriedades:
1 a)
F(X) =
P( x )
i
xi x
2 a) F() = 0
3 a) F(+ ) = 1
4 a) P(a < x b) = F(b) F(a)
F(X ) = F(X o )
7 a) F(X) contnua direita xlim
x0
8 a) F(X) descontnua esquerda, nos pontos em que a probabilidade diferente de
zero.
lim F(X) F(X o ), para P(X = xo ) 0
x x 0
65
E( X) = xi P(xi )
i =1
|x | P(x ) < ,
i =1
este
i =1
de X, e denotado por x.
5.7.5 Funo de Probabilidade de uma V.A.C.
No instante em que X definida sobre um espao amostral contnuo, a funo de
probabilidade ser contnua, onde a curva limitada pela rea em relao ao valores de x ser
igual a 1.
P(a x b) = f(x) dx
a
66
Pelo fato de que a rea representa probabilidade, e a mesma tem valores numricos
positivos, logo a funo precisa estar inteiramente acima do eixo das abscissas (x).
Definio: A funo f(x) uma Funo Densidade de Probabilidade (f.d.p.) para uma
V.A.C. X, definida nos reais quando
f (x) 0 ;
f(x) dx = 1 ;
b
P(a x b) = f(x) dx .
a
f ( x) dx
E(X) = x.f(x) dx
-
67
| x | f(x) for
2
x E(X) ) f(x) dx ou V(X) = E(X 2 )
(
V(X) =
E( X)
onde
+
E(X 2 ) = x2 f(x) dx
5.8 Exemplos
- Varivel Aleatria Discreta
Seja X o lanamento de duas moedas e descrever o experimento em funo da
obteno do nmero de caras:
i) determinar a funo de probabilidade e represente graficamente;
ii) construir a funo de repartio e represente graficamente;
iii) Use as propriedades para determinar:
a) P(0 < x < 2); b) P(0 x 1); c) P(0 < x 2); d) F(1); e) F(2)
iv) E(X) e V(X)
i)
Representao grfica
0,6
0,5
0,4
0,3
0,2
0,1
0
0
68
ii)
Representao grfica
F(x) = 0 se x<0
F(X) = 1/4 se 0 x < 1
F(X) = 3/4 se 1 x < 2
F(X) = 1 se x 2
iii)
a) P (0 < x < 2) = F ( 2) F (0) P ( X = 2) = 1
1 1 3
=
4 4 4
b) P(0 x 1) = F(1) F( 0) + P( X = 0) = 4 4 + 4 = 4
3
c) P(0 < x 2) = F( 2) F( 0) = 1 4 = 4
1
d) F(1) = 3/4
e) F(2) = 1
E( X) = xi P(xi ) = 0 . + 1 . + 2 . = 1
4
4
4
i =1
Varincia
2
E(X 2 ) = x 2i P( xi ) = 0 .
i =1
V(X) = E(X 2 ) E( X)
1 2 2
1 6
+1 .
+ 22 .
=
4
4
4 4
= 4 4 = 4 = 0.5
69
ii)
para x<0
F(X ) = 0 dx = 0
[ ]
0
1
x
0
= x2
[ ]
F (X ) = 0 dx + 2x dx + 0 dx = 0 + x 2
70
1
0
+0 =1
Representao grfica
iii)
[ ]
3
8
1
3
1
P x = 14 2 x dx = x2 41 = =
= 0,5
4
4
4
4
16
4
iv) E(X) =
E(X2 ) =
x f(x) dx =
x 2x dx =
x2 f(x) dx =
2 x2 f(x) dx =
x 2 2x dx =
2x 3 f(x) dx =
[ ]
2 31 2
x
=
3
0 3
[ ]
2 41 1
x
=
4
0 2
logo,
V(X) = E(X 2 ) [E(X)] =
2
1 2
9 8
1
=
=
2 3
18
18
5.9 Exerccios
1) Admita que a varivel X tome valore 1, 2 e 3 com probabilidades 1/3, 1/6 e 1/2
respectivamente.
a) Determine sua funo de repartio e represente graficamente.
b) Calcule usando as propriedades:
b.1) a) P(1 < x < 3); b) P(1 x 2); c) P(1 < x 3); d) F(1); e) F(2)
c) E(X) e V(X)
2) No lanamento simultneo de dois dados, considere as seguintes variveis
aleatrias:
71
v) P (Z = 3)
vi) P (A 11)
vii) P (20 Z 35)
viii) P 3,5 < Z < 34)
K
x para x = 1, 3, 5 e 7
a) calcule o valor de k
b) Calcular P(X=5)
c) E(X)
d) V(X)
72
2
5) Seja f (x ) = 2 (1 x ), 0 < x < 1 ,
0, caso contrrio
6) Seja f (x ) = 2 x, 0 x 2 ,
0, caso contrrio
f(x) = 0
f(x) = k
f(x) = k(x - 1)
f(x) = 0
b) Calcule P x 2
c) E(X) e V(X)
73
x<0
0 x < 500
500 x < 1000
x 1000
a) Determine o valor de A.
b) P (250 x 750).
10) Dada a funo de repartio:
F(X) = 0
para x < -1
F(X) =
x +1
2
para -1 x < 1
para x 1
F(X) = 1
1
a) Calcule: P 2 x 2 , b) P(X = 0)
74
n-x fracassos
P(A I A I...I A I A I A I ... I A) = P(A). P(A). ... . P(A ).P(A ). P(A). ... . P(A)
_
P(A).P(A). ... .P(A) . P(A). P(A). ... .P(A ) , onde P(A)= p e P(A ) = q,
1444
424444
3 1444
424444
3
x sucessos
n- x fracassos
75
P(X = x) = p x .q n x .
6.1.1.1 Esperana Matemtica da Distribuio de Bernoulli
E( X) = xi P(xi )
i =1
E( X) = x1 P(x1 ) + x2 P(x 2 )
onde
E (X 2 ) = x 2i P( xi )
i =1
V(X) = p . q
6.1.2 Distribuio Binomial
O termo "Binomial" utilizado quando uma varivel aleatria esta agrupada em duas
classes ou categorias. As categorias devem ser mutuamente excludentes, de modo a deixar bem
claro a qual categoria pertence determinada observao; e as classes devem ser coletivamente
exaustivas, de forma que nenhum outro resultado fora delas possvel
76
n
n!
C n,x = =
x x! (n x)!
logo, a probabilidade de ocorrer x sucessos com n tentativas ser
n
P(X = x) = p x q n x
x
Propriedades necessrias para haver uma utilizao da Distribuio Binomial:
1 a) Nmero de tentativas fixas;
2 a) Cada tentativa deve resultar numa falha ou sucesso;
3 a) As probabilidades de sucesso devem ser iguais para todas as tentativas;
4 a) Todas as tentativas devem ser independentes.
6.1.2.1 Esperana Matemtica de Distribuio Binomial
E( X) = xi P(xi )
i =1
n
E(X) = x. p x q n x
x
como P(X) segue uma Distribuio de Probabilidade, temos:
n
P(X = x i ) = 1 ou p x q n x = 1
i =1
x =1 x
0
logo,
E (X) = x.
n!
p x q n x
x(x - 1)!(n - x)! x =1
(n -1)!
p x q nx , ou seja para s = x - 1 e x = s + 1, temos
(x -1)!(n - x)! x =1
n - 1 s +1 n (s+1)
E(X) = n.
p q
x =1 s
E (X) = n.
77
n - 1 s
E(X) = n.
p .p q (n 1) s
x =1 s
n - 1 s (n1) s
E(X) = n.p
p . q
x =1 s
14 4424443
E(X) = n . p
6.1.2.2 Varincia de uma Distribuio Binomial
V(X) = E(X 2 ) E( X)
onde
E(X 2 ) = x 2i P( xi )
i =1
n!
E(X ) = x.x
p xq n x , para s = x -1 e x = s +1, temos:
n!
E (X 2 ) = ( s + 1)
ps+1 q n ( s +1)
s!(n ( s + 1) )! x =1
(n -1)!
(n - 1)!
E(X 2 ) = s.n
p s .p q n1 s + n
p s. p q n1s
s!(n
1s)!
s!(n
-1s)!
x =1
x =1
1
n
1
E(X 2 ) = n.p s
p s .p q n 1 s +
p s q n 1s
1
x =1
x =1 s
4s44
244 43 1
44
424 44
3
(n1)p
1
2
E(X ) = n. p ( n 1) p + 1
E(X2 ) = n. p ( np p + 1
2
E( X 2 ) = n 2 p 2 np 2 + np
V(X) = n 2 p 2 np 2 + np - (np) 2
V(X) = n. p.(1 - p)
V( X) = n. p.q
78
E(p) = p e V(p) =
p.q
n
logo,
P(x) =
n x x n x
p q .
x!
Se p 0 e n >> x logo, q n x q n = (1 p)
assim,
(n. p) x (1 p) n
x!
x
(n.p)
n( n 1)
P(x) =
1 n.p +
(p) 2 + ...
x!
2 .1
x
2
(n.p)
( n.p)
P(x)
+ ...
1 n.p +
x!
2!
P (x) =
79
(n. p) x e -n.p
x!
Substituindo o valor esperado n.p por e considerando-o como sendo o nmero
mdio de ocorrncia expresso em unidades de tempo, pode-se dizer que a taxa mdia de
falhas (falha / unid. tempo) e t o tempo, logo o nmero mdio de falhas ser t , assim,
P(x) =
xt . e-
x!
fornece a probabilidade de x falhas no perodo de tempo t.
P( x) =
E( X) = xi P(xi )
i =1
e - x
x!
x =1
- x
e
E( X) =
, substituindo s = x -1 e x = s + 1 temos:
x =1 (x - 1)!
e- s+1
E (X) =
s!
x =1
e - s
E(X) =
s!
x =1
1
424
3
E (X) = x
E(x) =
6.1.3.2 Varincia da Distribuio de Poisson
V(X) = E(X 2 ) E( X)
onde
E (X 2 ) = x 2i P( xi )
i =1
E( X 2 ) = x. x
x =1
e - x
, substituindo s = x - 1 e x = s + 1 temos:
x(x - 1)!
80
e - s+1
s!
x =1
e - s
E(X 2 ) = (s +1)
s!
x =1
- s
- s
E(X 2 ) = s
+
s!3 1
x =1
x =4
1 2s!
1
424
4
3
1
E(X)
E (X 2 ) =
(s + 1)
E(X) 2 = 2 +
V(X) = 2 + ( ) 2
V(X) =
6.2 Exerccios
1) Admitindo-se o nascimento de meninos e meninas sejam iguais, calcular a
probabilidade de um casal com 6 filhos ter:
a) 4 filhos e 2 filhas
b) 3 filhos e 3 filhas
2) Em 320 famlias com 4 crianas cada uma, quantas se esperaria que tivessem:
a) nenhuma menina;
b) 3 meninos
c) 4 meninos
3) Um time X tem 2/3 de probabilidade de vitria sempre que joga. Se X jogar 5
partidas, calcule a probabilidade de:
a) X vencer exatamente 3 partidas;
b) X vencer ao menos uma partida;
c) X vencer mais da metade das partidas;
d) X perder todas as partidas;
4) A probabilidade de um atirador acertar um alvo 1/3. Se ele atirar 6 vezes, qual a
probabilidade de:
a) acertar exatamente 2 tiros;
81
82
f(x) = b a
0
se a x b
se x < a ou x > b
E(X) = x f(x) dx
E(X) =
1
dx
b-a
b
1 x2
E(X) =
b - a 2 a
b2 a 2
E (X) =
2(b a)
( b - a) (b + a)
E(X) =
2(b a)
E( X) =
(b + a)
2
83
V(X) = E(X 2 ) E( X)
E(X 2 ) = x 2 f(x) dx
E(X 2 ) = x 2
b
1
dx
b-a
1 b 2
x dx
b - a a
b
1 x3
2
E(X ) =
b-a 3 a
E(X 2 ) =
b3 a 3
E(X ) =
3( b a)
(b - a)(b 2 + ab + a 2 )
E( X 2 ) =
3(b a)
2
b + ab + a 2
2
E( X ) =
3
2
2
b + ab + a 2 b + a
V(X) =
3
2
b2 + ab + a 2 b 2 ab + a 2
V(X) =
3
4
2
2
4b + 4ab + 4a 3b 2 6ab 3a 2
V(X) =
12
b2 2ab + a2
V(X) =
12
2
V(X) =
(b a) 2
12
f(x) =
1
2
1 x
84
, < x < +
f(x) d(x) = 1
x
temos:
+
+
1
2
f(x)
d(x)
=
e
2 dt = I .
Para calcular esta integral usaremos um artifcio, ou seja, no lugar de I usaremos I.
t
s
+
1 + 2
2
I =
e dt . e 2 ds
2
fazendo t =
I =
2
1
2
(t 2 +s 2 )
2
dt ds
introduzindo coordenadas polares para realizar o clculo dessa integral dupla, temos:
s = r cos e t = r sen
conseqentemente o elemento de rea ds dt se torna r dr d.
Como < s < + e < t < + , 0 < r < + e 0 < a < 2 , portanto
1 2
I =
2 0
2
re
r2
2
dr d
r
1 2 2
2
I =
e
d
2 0
0
2
1 2
( 0 1) d
2 0
1
2
I2 =
0
2
I2 =
85
I2 =
1
2 = 1
2
E(X) = x f(x) dx
E(X) = x
1 x
e
dx
2
x
x
fazendo z =
, z =
e x = z +,
1 +
2
E(X) =
(
z
+
)
e
dz
2
z
z
+
+
1
1
2
2
E(X) =
z e dz +
e dz
4243
2 1
42
124
443
zero
um
86
E(X) =
6.3.2.3 Varincia da Distribuio Normal
V(X) = E(X 2 ) E( X)
E(X 2 ) = x 2 f(x) dx
E(X ) = x
2
1 x
e
dx
2
x
x
fazendo z =
, z =
e x = z +,
+
1
2
2
E(X ) =
( z + ) e 2 dz
2
E(X ) =
2
+
1
2 z 2 e 2 dz +
zero
E(X 2 ) =
1
2
z2 e
z
2
dz + 2
z =u
dv = e
du = 1 dz
E(X ) =
2
z2
2
1
2
z e
2
dz
v = e
2
z
2
+
2
2
e dz +
z
E(X 2 ) = 0 + 2
+
1
e 2 dz + 2
4
124
424 44
3
um
E(X ) = +
logo,
2
+
+
1
1
2 z e 2 dz + 2
e
2 dz
4243
1
2
2
1442443
V(X) =
87
um
x
e z ~ N(0,1) temos que
2
1 + z2
f(z) =
e ,
2
88
[ ]
( )
VAR t = 2 t =
, para > 2.
6.4 Exerccios
1) As alturas dos alunos de uma determinada escola so normalmente distribudas
com mdia 1,60 m e desvio padro 0,30 m. Encontre a probabilidade de um aluno
escolhido ao acaso medir:
a) entre 1,50 e 1,80 m
c) menos que 1,48 m
e) menos que 1,70 m
2) A durao de certo componente eletrnico tem mdia 850 dias e desvio padro 45
dias. Qual a probabilidade do componente durar:
a) entre 700 e 1000 dias
b) menos que 750 dias
c) mais que 850 dias
d) Qual deve ser o nmero de dias necessrios para que tenhamos de repor 5% dos
componentes. (R = 776 dias)
3) Um produto pesa, em mdia, 10 g, com desvio padro de 2 g. embalado em
caixas com 50 unidades. Sabe-se que as caixas vazias pesam 500 g, com desviopadro de 25 g. Admitindo-se uma distribuio normal dos pesos e independncia
entre as variveis dos pesos do produto e da caixa, calcule a probabilidade de uma
caixa cheia pesar mais de 1050 g.
Xgeral = 1000, Vgeral = 50Vp + Vc , Sgeral = Vgeral = 28. 73 (R = 0.04093)
89
90
7 Amo st ra ge m
7.1 Conceitos em Amostragem
Inferncia Estatstica - o processo de obter informaes sobre uma populao a
partir de resultados observados ma Amostra.
Amostragem: o processo de retirada de informaes dos "n" elementos amostrais,
na qual deve seguir um mtodo adequado (tipos de amostragem).
91
Aleatoria Simples
Sistematica
- Tipo de Amostragem
Estratificada
por Conglomerados
5 o ) Tamanho da Amostra
Ex.: Moradores de uma Cidade (populao alvo)
prpria
um piso
dois pisos
tres ou mais pisos
n = 50, ento r =
N
= 10, (P.A. de razo 10)
n
92
13
23
33
43
......
a n = a1 + ( n 1). r
7.3.3 Amostragem Estratificada
um processo de amostragem usado quando nos depararmos com populaes
heterogneas, na qual pode-se distinguir subpopulaes mais ou menos homogneas,
denominados estratos.
Aps a determinao dos estratos, seleciona-se uma amostra aleatria de cada uma
subpopulao (estrato).
As diversas subamostras retiradas das subpopulaes devem ser proporcionais aos
respectivos nmeros de elementos dos estratos, e guardarem a proporcionalidade em relao a
variabilidade de cada estrato, obtendo-se uma estratificao tima.
Tipos de variveis que podem ser usadas em estratificao: idade, classes sociais, sexo,
profisso, salrio, procedncia, etc.
7.3.4 Amostragem por Conglomerados (ou Agrupamentos)
Algumas populaes no permitem, ou tornam-se extremamente difcel que se
identifiquem seus elementos, mas podemos identificar subgrupos da populao. Em tais casos,
uma amostra aleatria simples desses subgrupos (conglomerados) podem ser escolhida, e uma
contagem completa deve ser feita no conglomerado sorteado.
Agregados tpicos so: quarteires, famlias, organizaes, agncias, edifcios, etc.
7.4 Amostragem "COM" e "SEM" reposio
Seja "N" o nmero de elementos de uma populao, e seja "n" o nmero de
elementos de uma amostra, ento:
Se o processo de retirada dos elementos for COM reposio (pop. infinita (f 5%) ),
o nmero de amostra s possveis ser:
no de amostras = N n
Se o processo de retirada de elementos for SEM reposio (pop. finita (f > 5%) ), o
nmero de amostras possveis ser:
93
no de amostras = C N , n =
N!
n! (N - n )!
Ex.: Supondo N = 8 e n = 4
com reposio: n o de amostras = N n = 8 4 = 4096
sem reposio: no de amostras = C N ,n =
N!
8!
= C8,4 =
= 70
n ! ( N - n )!
4! 4!
no de amostras = N n = 4 2 = 16
n=2
,}
{11
{2,1}
{3,1}
{4,1}
{1,2}
{2,2}
{3,2}
{4,2}
{1,3}
{2,3}
{3,3}
{4,3}
{1,4}
{2,4}
{3,4}
{4,4}
- (sem reposio)
N = { 1, 2, 3, 4}
n=2
no de amostras = C 4,2 =
4!
=6
2! 2!
{1,2} x = 1,5
{2,2} x = 2,0
{3,2} x = 2,5
{4,2} x = 3,0
{1,3} x = 2,0
{2,3} x = 2,5
{3,3} x = 3,0
{4,3} x = 3,5
94
{1,4} x = 2,5
{2,4} x = 3,0
{3,4} x = 3,5
{4,4} x = 4,0
xi
P(X = xi )
1/16
2/16
3/16
4/16
3/16
2/16
1/16
16/16
1,0
1,5
2,0
2,5
3,0
3,5
4,0
- Grfico
P(X = xi ) =
i =1
40
= 2,5
16
-Varincia
( )
ou VAR( x ) = E x 2 [ E ( x)]2
( ) x P( X = x )
onde E x 2 =
2
i
i=1
95
Z .
n=
96
Z 2 . 2 . N
d 2 ( N 1) + Z2 . 2
Z2 . p$ . q$
d2
d = erro amostral, expresso em decimais. O erro amostral neste caso ser a mxima
diferena que o investigador admite suportar entre e p$ , isto : p$ < d , em que
a verdadeira proporo (freqncia relativa do evento a ser calculado a partir da
amostra.
- nominal ou ordinal, e a populao considerada finita, voc poder
determinar o tamanho da amostra pela frmula:
n=
Z2 . p$ . q$ . N
d 2 ( N 1) + Z2 . p$ . q$
d = erro amostral
Estas frmulas so bsicas para qualquer tipo de composio da amostra; todavia,
existem frmulas especficas segundo o critrio de composio da amostra.
- Se o investigador escolher mais de uma varivel, poder acontecer de ter que aplicar
mais de uma frmula, assim dever optar pelo maior valor de "n".
Quando no tivermos condies de prever o possvel valor para p$ , admita p$ = 0.50, pois, dessa forma,
voc ter o maior tamanho da amostra, admitindo-se constantes os demais elementos.
x (x )
( x)
98
( x)
(Desvio
n
2 ( x)
x ~ N ( x);
n
Quando a amostra for > 5% da populao devemos usar um fator de correo.
N
2 ( x) N - n
N -n
o fator de correo
x ~ N ( x);
, onde
n
N -1
N -1
Ex1 .: Uma populao muito grande tem mdia 20,0 e desvio padro 1,4 . Extrai -se
uma amostra de 49 observaes. Responda:
a) Qual a mdia da distribuio amostral ?
b) Qual o desvio padro da distribuio amostral ?
c) Qual a porcentagem das possveis mdias que diferiram por mais de 0,2 da mdia
populacional ?
Ex2 .: Um processo de encher garrafas de coca-cola d em mdia 10% mal cheias com
desvio padro de 30%. Extrada uma amostra de 225 garrafas de uma sequncia
de produo de 625, qual a probabilidade amostral das garrafas mal cheias estar
entre 9% e 12%.
O exemplo n o 2 pode ser resolvido usando a distribuio amostral das propores, onde p = proporo
populacional, p = mdia da distribuio amostral das propores. Logo temos:
99
onde
p =
p(1 p )
.
n
N-n
,
N -1
N -n
usado para populao finita.
N -1
Ex1: Uma mquina de recobrir cerejas com chocolate regulada para produzir um
revestimento de (3% em relao ao volume da cereja). Se o processo segue uma distribuio
normal, qual a probabilidade de extrair uma amostra de 25 cerejas de um lote de 169 e
encontrar uma mdia amostral superior a 3,4%. R = 0,44828.
7.9 Exerccios
1) Uma fabrica de baterias alega que eu artigo de primeira categoria tem uma vida
mdia de 50 meses, e desvio padro de 4 meses.
a) Que porcentagem de uma amostra de 36 observaes acusaria vida mdia no
intervalo de um ms em torno da mdia ?
b) Qual ser a resposta para uma amostra de 64 observaes?
c) Qual seria o percentual das mdias amostrais inferior a 49,8 meses com n =100?
2) Um varejista compra copos diretamente da fbrica em grandes lotes. Os copos so
embrulhados individualmente. Periodicamente o varejista inspeciona os lotes para
determinar a proporo dos quebrados ou lascados. Se um grande lote contm
10% de quebrados (lascados) qual a probabilidade do varejista obter numa a mostra
de 100 copos 17% ou mais defeituosos?
3) Deve-se extrair uma amostra de 36 observaes de uma mquina de cunhar
moedas comemorativas. A espessura mdia das moedas de 0,2 cm, com desvio
padro de 0,01 cm.
a) Que percentagem de mdias amostrais estar no intervalo 0,004 em torno da
mdia? R = 0.98316
b) Qual a probabilidade de obter uma mdia amostral que se afaste por mais de 0,005
cm da mdia do processo ? R = 0.00164
4) Suponha que uma pesquisa recente tenha revelado que 60% de uma populao de
adultos do sexo masculino consistam de no-fumantes. Tomada uma amostra de
10 pessoas de uma populao muito grande, que percentagem esperamos nos
intervalos abaixo:
a) de 50% a 65%
b) maior que 53%
c) de 65% a 80%
5) Se a vida mdia de operao de um "flash" 24 horas, com distribuio normal e
desvio padro de 3 horas, qual a probabilidade de uma amostra de 10 "flashes"
retirados de uma populao de 500 "flashes" apresentar vida mdia que difira por
mais de 30 min. da mdia. R = 0.60306
100
Seja X ~ N , 2
)
101
e desvio padro
,ou seja:
n
2
X ~ N ;
n
Portanto, z =
X
tem distribuio N (0,1)
n
Ento,
P z 2 z + z 2 = 1
x
P z 2
+z 2 = 1
n
P z 2
X + z 2
X = 1
n
n
P X z 2
X + z 2
= 1 (Pop. Infinita)
n
n
Para caso de populaes finitas usa-se a seguinte frmula:
P X + Z 2
n
N-n
Z2
N -1
n
N-n
= 1 (Pop. Finita)
N -1
1 = 95% z 2 = 1, 96
1 = 99 % z 2 = 2,58
1 = 85% z 2 =
102
Ex.: Seja X a durao da vida de uma pea de equipamento tal que = 5 horas.
Admita que 100 peas foram ensaiadas fornecendo uma durao de vida mdia de 500 horas e
que se deseja obter um intervalo de 95% para a verdadeira mdia populacional. R = P (499,02
500,98) = 95%.
Obs.: Podemos dizer que 95% das vezes, o intervalo acima contm a verdadeira
mdia populacional. Isto no o mesmo que afirmar que 95% a probabilidade do
parmetro cair dentro do intervalo, o que constituir um erro, pois um parmetro
(nmero) e ele est ou no no intervalo.
8.2.2 Intervalo de confiana para a mdia () com a varincia ( 2 )
desconhecida
( n 30)
Neste caso precisa-se calcular a estimativa S (desvio padro amostral) a partir dos
dados, lembrando que:
n
S2 =
(x
i =1
x)
n 1
2
X ~ N ;
n
Portanto, t =
t=
X
tem distribuio N (0,1)
S n
X
z
N ( 0,1)
.
=
=
S
S
S
S n
103
X
S n
t , 2 =
Ento,
P t , 2 t + t , 2 = 1
s
s
P X t , 2
X + t , 2
= 1 (Pop. Infinita)
n
n
Para caso de populaes finitas usa-se a seguinte frmula:
S
P X t , / 2
Nn
S
X + t , / 2
N 1
n
N n
N 1
= 1 (Pop. Finita)
Ex.: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma populao
aproximadamente normal. Construir um intervalo de confiana para com um nvel de 95%.
n
X=
xi
i =1
= 8,7
= 10 -1 = 9
S2 =
(x
i =1
x)
n 1
S 2
= 5%
t , 2 = t 9 , 2.5% = 2,262
R = P( 7,27 10,13) = 95%
104
p$ . q$
p$ ~ N p$ ;
(pop. infinita)
p$ . q$ N - n
p$ ~ N p$ ;
n N - 1
(pop. finita)
p.q
p =
p$
n
logo Z =
onde
caracters tica
p$
X
p = =
N n
N n
P p$ Z 2 $p
p$ + Z 2 $p
= 1 (Pop. Finita)
N 1
N 1
105
( n 1)S2
2
2inf = 2
2sup = 2
1 ;
2
Assim temos:
( n 1)S2
n 1)S2
(
2
P
= 1
2
X2inf
Xsup
Ex.: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma populao
aproximadamente normal. Construir um intervalo de confiana para 2 com um nvel de 95%.
8.2.5 Intervalo de Confiana para a diferena Entre duas Mdias:
Usualmente comparamos as mdias de duas populaes formando sua diferena:
1 2
a) Varincias Conhecidas
1 2 = (X 1 X 2 ) Z .(Erro Padro)
2
Erro Padro?
VAR (X 1 X 2 ) = (+ 1) VAR X1 + ( 1) VAR X 2
2
12 22
+
n1 n2
106
21 22
+
n1 n2
21 22
12 22
P( X1 X2 ) Z 2
+
( 1 2 ) ( X1 X2 ) + Z 2
+
= 1
n1 n 2
n1 n 2
1 1
+
n1 n 2
S2 S2
S2 S2
P( X1 X2 ) t 2 1 + 2 1 2 ( X1 X 2 ) + t 2 1 + 2 onde = n1 + n2 2
n1 n2
n1 n 2
SC =
1 1
+
n1 n2
( n1 1)S12 + ( n2 1)S22
n1 + n2 2
Ex1 .: De uma turma (1) foi extrada uma amostra de 6 alunos com as seguintes
alturas: 150, 152, 153, 160, 161, 163. De uma segunda turma foi extrada uma amostra de 8
alunos com as seguintes alturas: 165, 166, 167, 172, 178, 180, 182, 190. Contruir um intervalo
de 95% de confiana para a verdadeira diferena entre as mdias populacionais.
107
Ex2 .: De uma mquina foi extrada uma amostra de 8 peas, com os seguintes
dimetros: 54, 56, 58, 60, 60, 62, 63, 65. De uma segunda mquina foi extrada uma amostra
de 10 peas, com os seguintes dimetros: 75, 75, 76, 77, 78, 78, 79, 80, 80, 82. Construir um
intervalo de 99% de confiana para a diferena entre as mdias populacionais, supondo que as
mquinas foram construdas pelo mesmo fabricante .
8.2.6 Intervalo de Confiana para a Diferena entre duas Propores
p$ q$
p$ q$
p$ q$
p$ q$
P (p$ 1 p$ 2 ) Z 2 1 1 + 2 2 1 2 ( p$ 1 p$ 2 ) + Z 2 1 1 + 2 2
n1
n2
n1
n2
= 1
Ex.: Em uma pesquisa realizada pelo Instituto Gallup constatou que 500 estudantes
entrevistados com menos de 18 anos, 50% acreditam na possibilidade de se verificar uma
modificao na Amrica, e que dos 100 estudantes com mais de 24 anos, 69% acreditam nessa
modificao. Construir um intervalo de confiana para a diferena entre as propores destas
subpopulaes usando =5%. R=(LI=0,0893, LS=0,2905)
8.3 Exerccios
1) Ao se realizar uma contagem de eritrcitos em 144 mulheres encontrou-se em mdia
5,35 milhes e desvio padro 0,4413 milhes de glbulos vermelhos. Determine os
limites de confiana de 99% para a mdia populacional.
2) Um conjunto de 12 animais de experincia receberam uma dieta especial durante 3
semanas e produziram os seguintes aumentos de peso (g): 30, 22, 32, 26, 24, 40, 34,
36, 32, 33, 28 e 30. Determine um intervalo de 90% de confiana para a mdia.
R X =30.58, S = 5.09,LI = 27.942, LS = 33.218
3) Construa um intervalo de 95 % de confiana para um dos seguintes casos:
a)
b)
c)
d)
Mdia
Amostral
16,0
37,5
2,1
0,6
Tamanho da
Amostra
16
36
25
100
2,0
3,0
0,5
0,1
108
11
13
14
11
13
14
11
13
14
12
13
14
12
13
15
12
13
15
12
13
15
13
13
16
13
13
16
2
12
25
3
12
25
4
15
27
5
15
28
5
16
30
6
16
33
109
6
17
34
7
18
35
8
20
36
8
22
9
22
23
n = 11
n = 12
n=9
X
n
X
X2i n i
e S2 =
n1
13) O tempo de reao a uma injeo intravenosa em mdia de 2.1 min., com desvio
padro de 0.1 min., para grupos de 20 pacientes. Construa um intervalo de confiana
de 90 % para o tempo mdio para toda a populao dos pacientes submetidos ao
tratamento.
14) Uma firma esta convertendo as mquinas que aluga para uma verso mais moderna.
At agora foram convertidas 40 mquinas. O tempo mdio de convers o foi de 24
horas com desvio padro de 3 horas. a) Determine um intervalo de confiana de 99
% para o tempo mdio de converso. b) Para uma amostra de 60 mquinas, como
ficaria o intervalo de confiana de 99 % para o tempo mdio de converso
15) Seis dentre 48 terminais telefnicos do respostas de ocupado. Uma firma possui
800 terminais. Construir um intervalo de confiana de 95 % para a proporo dos
terminas da firma que apresentam sinal de ocupado. R LI = 3.4%, LS = 21.6%
16) Uma amostra de 50 bicicletas de um estoque de 400 bicicletas, acusou 7 com pneus
vazios. a) Estime o nmero de bicicletas com pneus vazios: b) Construa um intervalo
de 99 % confiana para a populao das bicicletas com pneus vazios.
R a) 56; b) LI = 0.021 LS = 0.258
17) A mdia salarial semanal para uma amostra de n = 30 empregados em uma grande
firma X = 180,00 com desvio padro S = 14,00. Construa um intervalo de
confiana de 99 % para a mdia salarial dos funcionrios.
18) Uma empresa de pesquisa de mercado faz contato com uma amostra de 100 homens
em uma grande comunidade e verifica que uma proporo de 0.40 na amostra
prefere lminas de barbear fabricadas por seu cliente em vez de qualquer outra marca.
Determinar o intervalo de confiana de 95 % para a proporo de todos os homens
na comunidade que preferem a lmina do cliente.
110
19) Uma pequena fbrica comprou um lote de 200 pequenas peas eletrnicas de um
saldo de estoque de uma grande firma. Para uma amostra aleatria de 50 peas,
constatou-se que 5 eram defeituosas. Estimar a proporo de todas as peas que so
defeituosas no carregamento utilizando um intervalo de confiana de 99 %.
20) Duas amostras de plantas foram cultivadas com dois fertilizantes diferentes. A
primeira amostra oriunda de 200 sementes, acusou altura mdia de 10,9 cm e desvio
padro 2,0 cm. A segunda amostra, de 100 sementes, acusou uma altura mdia de
10,5 cm com desvio padro de 5,0 cm. Construir um intervalo de confiana entre as
alturas mdias das populaes ao nvel de 95% de confiana.
21) Uma amostra aleatria de 120 trabalhadores de uma grande fbrica leva em mdia
22,0 min. para executar determinado servio, com S2 de 4 min2. Em uma segunda
fbrica, para executar a mesma tarefa, uma amostra aleatria de 120 operrios, gasta
em mdia 19,0 min com S2 de 10 min2. Construir um intervalo de 99% de confiana
entre as mdias das populaes.
22) Extraram-se amostras independentes de adultos brancos e pretos, que acusaram os
seguintes tempos (em anos) de escolaridade.
Branco
Preto
8
9
18
12
10
5
10
10
14
14
12
Capacidade Torxica
Antes (X)
Aps (Y)
2750
2850
2360
2380
2950
2930
2830
2860
2250
2320
111
Mulheres
n2 = 5
X 2 = 11,0
S 22 = 10
A favor
46%
41%
Resposta
Contra
39%
49%
Sem opinio
15%
10%
112
113
Exemplos:
H 0: = 0
H 1: 0
H 0: = 0
H 1: > 0
H 0 : = 0
H 1: < 0
Deciso
Aceitar H o
Deciso correta (1 - )
H o falsa
Erro Tipo II ( )
Rejeitar Ho
Erro Tipo I ( )
Deciso Correta (1 - )
Observe que o erro tipo I s poder acontecer se for rejeitado Ho e o erro tipo II
quando for aceito Ho .
114
H1 : > 0 (b)
< (c)
H 0 : = 0
2. Fixar . Admitindo:
- Se a varincia populacional 2 for conhecida, a varivel teste ser "Z" (n>30);
- Se a varincia populacional 2 for desconhecida, a varivel teste ser "t" de Student
com = n -1 (n 30).
3. Com o auxlio das tabelas "Z" e "t" determinar as regies RA e RR;
(a)
(b)
115
(c)
X 0
t cal =
X 0
S
n
- Se Zcal < Z ou Zcal > +Z ou t cal < t ou t cal > + t , rejeita-se Ho.
2
H1 : > p 0 (b)
< p (c)
Ho : = po
116
(b)
(a)
(c)
f p0
Z cal =
onde f =
p0 . q0
n
X
n
2 20 (a)
H1 : 2 > 20 (b)
2 < 2 (c)
0
Ho : 2 = 20
117
(b)
(a)
(c)
( n 1)S 2
20
118
1 2
H1 :
1 2 d
(X
X2 ) d
21 22
+
n1 n2
5. Concluso:
Optar pela aceitao ou rejeio de Ho .
Ex.: Um fabricante de pneus faz dois tipos. Para o tipo A, = 2500 Km, e para o
tipo B, = 3000 Km. Um taxi testou 50 pneus do tipo A e 40 pneus do tipo B,
obtendo 24000 Km e 26000 Km de durao mdia dos respectivos tipos.
Adotando um risco de 4% e que existe uma diferena admitida de 200 Km entre
as marcas, testar a hiptese de que a vida mdia dos dois tipos a mesma.
(R = rejeita-se Ho )
2 o caso) Se as varincias populacionais 2 forem desconhecidas, independentes e
normais, a varivel teste ser "t" (n1 + n2 30) com = n1 + n2 -2;
a) As estimativas diferentes
1. Enunciar as hipteses:
Ho : 1 = 2 ou 1 - 2 = d
1 2
H1:
1 2 d
119
t cal =
(X
X2 ) d
S21 S22
+
n1 n2
5. Concluses:
Optar pela aceitao ou rejeio de Ho .
Ex.: Dois tipos de pneus foram testados sob as mesmas condies meteorolgicas. O
tipo A fabricado pela fabrica A, registrou uma mdia de 80.000 km rodados com
desvio padro de 5.000 km. em 6 carros amostradas. O tipo B fabricado pela
fbrica B, registrou uma mdia de 88.000 km com desvio padro de 6.500 km em
12 carros amostradas. Adotando = 5% testar a hiptese da igualdade das
mdias.
b) As estimativas iguais
1. Enunciar as hipteses:
1 2
H1:
1 2 d
Ho : 1 = 2 ou 1 - 2 = d
onde d a diferena admitida entre as duas mdias.
2. Fixar . Escolhendo a varivel "t" de Student;
(X
S c.
X2 ) d
1
1
+
n1 n 2
onde S C =
( n1 1)S21 + ( n2 1)S22
n1 + n 2 2
5. Concluses:
Optar pela aceitao ou rejeio de Ho .
Ex.: Dois tipos de tintas foram testados sob as mesmas condies meteorolgicas. O
tipo A registrou uma mdia de 80 min para secagem com desvio padro de 5
min. em cinco partes amostradas. O tipo B, uma mdia de 83 min com desvio
padro de 4 min. em 6 partes amostradas. Adotando = 5% testar a hiptese da
igualdade das mdias. (R = aceita-se Ho )
120
H 1: 1 2
Z cal =
p$ 1 p$ 2
p$ 12 .q$ 12
n
onde p$ 1 =
X1
X
X + X2
, p$ 2 = 2 , p$ 12 = 1
n1
n2
n1 + n 2
5. Concluses:
Optar pela aceitao ou rejeio de Ho .
Ex.: Deseja-se testar se so iguais as propores de homens e mulheres que lem
revista e se lembram do determinado anncio. So os seguintes os resultados da
amostra aleatria independente de homens e mulheres: Admita = 10%.
Homens
X1 = 70
n1 = 200
Mulheres
X2 = 50
n2 = 200
H 0 : 12 = 22
H 1: 21 22
Fsup = F ( 1, 2 )
Finf = F1 ( 1 , 2 ) =
121
1
F ( 2 , 1 )
Fcal =
S21
S22
5. Concluses:
Optar pela aceitao ou rejeio de Ho .
Ex.: Dois programas de treinamento de funcionrios foram efetuados. Os 21
funcionrios treinados no programa antigo apresentaram uma varincia de 146
pontos em sua taxa de erro. No novo programa, 11 funcionrios apresentaram
uma varincia de 200. Sendo = 10%, pode-se concluir que a varincia
diferente para os dois programas?
9.3 Exerccios
1) O crescimento da indstria da lagosta na Flrida nos ltimos 20 anos tornou esse
estado americano o 2o mais lucrativo centro industrial de pesca. Espera -se que
uma recente medida tomada pelo governo das Bahamas, que proibiu os pescadores
norte americanos de jogarem suas redes na plataforma continental desse pas.
Produza uma reduo na quantidade de Kg de lagosta que chega aos Estados
Unidos. De acordo com ndices passados, cada rede traz em mdia 14 Kg de
lagosta. Uma amostra de 20 barcos pesqueiros, recolhida aps a vigncia da nova
lei, indicou os seguintes resultados, em Kg (Use = 5%)
7.89
15.28
10.93
8.57
13.29
16.87
9.57
17.96
17.96
19.68
5.53
10.79
15.6
18.91
11.57
19.59
8.89
12.47
10.02
11.06
122
4.9
5.1
4.9
5.5
5.0
4.7
Estes dados so evidncia para afirmar que o contedo de oxignio menor que 5
partes por milho? Teste considerando = 5% e = 1%.
3) A Debug Company vende um repelente de insetos que alega ser eficiente pelo
prazo de 400 horas no mnimo. Uma anlise de 90 itens aleatoriamente
inspecionados acusou uma mdia de eficincia de 380 horas.
a) Teste a afirmativa da companhia, contra a alternativa que a durao inferior a 400
horas, ao nvel de 1%, seu desvio padro de 60 horas.
b) Repita o teste, considerando um desvio padro populacional de 90 horas.
4) Ao final de 90 dias de um dieta alimentar envolvendo 32 pessoas, constatou-se o
seguinte ganhos mdio de peso 40 g, e desvio padro de 1,378g.
a) Supondo que o ganho de peso mdio dessas pessoas de 45 g, teste a hiptese para
= 5%, se esse valor o mesmo (bilateral)
b) Supondo que a varincia dessas pessoas de 1.8 g2, teste a hiptese para = 5%,
se esse valor o mesmo (bilateral).
5) Uma pesquisa feita alega que 15% dos pessoas de uma determinada regio sofrem
de cegueira aos 70 anos. Numa amostra aleatria de 60 pessoas acima de 70 anos
constatou-se que 12 pessoas eram cegas. Teste a alegao para = 5% contra p >
15%.
6) A tabela abaixo mostra a quantidade de pessoas que obtiveram o melhor efeito
perante a aplicao de duas drogas:
Droga A
Sexo
Masculino
Feminino
Total
Droga B
muscular
intravenosa
muscular
21
20
41
10
12
22
22
25
47
Total
53
57
110
processo, usando uma amostra de 25 arames obteve-se uma mdia de 285 psi. Use
um nvel de significncia de 5%. Suponha normal a populao das resistncias.
8) A DeBug Company vende um repelente para insetos que alega ser eficiente pelo
prazo de 400 horas no mnimo. Uma anlise de 9 itens escolhidos aleatoriamente
acusou uma mdia de eficincia de 380 horas. a) Teste a alegao da companhia,
contra a alternativa que a durao inferior a 400 horas no mnimo ao nvel de
1%, e o desvio padro amostral de 60 horas. b) Repitas o item (a) sabendo que o
desvio padro populacional de 90 horas.
9) Um laboratrio de Anlises Clnicas realizou um teste de impurezas em 9 pores
de um determinado composto. Os valores obtidos foram: 10,32; 10,44; 10;56;
10,.60; 10,63; 10,67; 10,7; 10.73; 10,75 mg. a) estimar a mdia e a varincia de
impurezas entre as pores. b) Testar a hiptese de que a mdia de impureza de
10.4, usando = 5%. c) Testar a hiptese de que a varincia um usando =
5%.
10) Uma experincia tem mostrado que 40% dos estudantes de uma Universidade
reprovam em pelo menos 5 disciplinas cursada na faculdade. Se 40 de 90
estudantes fossem reprovados em mais de 5 disciplinas, poderamos concluir
quanto a proporo populacional, usando = 1%.
11) Para verificar a eficcia de uma nova droga foram injetados doses em 72 ratos,
obtendo-se a seguinte tabela:
Sexo
Machos
Fmeas
Tamanho da Amostra
41
31
Varincia
43.2
29.5
n1 = 60
X 1 = 5.71
12 = 43
Amostra 2
n2 = 35
X 2 = 4.12
22 = 28
124
Marca A
14
20
2
11
5
12
Marca B
4
16
28
9
31
10
No de mulheres
10 |--- 25
25 |--- 40
40 |--- 55
55 |--- 70
70 |---85
12
10
10 |--- 25
25 |--- 40
40 |--- 55
55 | --- 70
70 |---85
15
12
a) Testar ao nvel de 10% a hiptese de que a diferena entre a renda mdia dos
homens e das mulheres valha $ 5000.
b) Testar ao nvel de 5% a hiptese de que a diferena entre as varincias valha 0.
15) Uma empresa de pesquisa de opinio seleciona, aleatoriamente, 300 eleitores de
So Paulo e 400 do Rio de Janeiro, e pergunta a cada um se votar ou no num
determinado candidato nas prximas eleies. 75 eleitores de SP e 120 do RJ
responderam afirmativo. H diferena entre as propores de eleitores favorveis
ao candidato naqueles dois estados? use = 5%.
16) Esto em teste dois processos para fechar latas de comestveis. Numa seqncia
de 1000 latas, o processo 1 gera 50 rejeies, enquanto o processo 2 acusa 200
rejeies. Pode ao nvel de 5%, concluir que os dois processos sejam diferentes?
9.4 Teste do Qui-quadrado 2
Anteriormente foi testado hipteses referentes a um parmetro populacional ou
mesmo a comparao de dois parmetros, ou seja, so os testes paramtricos. Agora ser
testado aqueles que no dependem de um parmetro populacional, nem de suas respectivas
estimativas. Este teste chamado de teste do Qui-quadrado.
O teste do Qui-quadrado usado quando se quer comparar freqncias observadas
com freqncias esperadas. Divide-se em trs tipos:
125
H1: Fo Fe
Estatstica Calculada
4 o) Estatstica Tabelada:
5 o) Comparar o
2cal
2
cal
=
i =1
2tab = 2 ,
6 o) Concluso:
Se
2cal
Se
2cal
126
(Fo
Fe )
Fe
Freq. Obs.
Fo1
Fo2
:
Fok
n
Dom
Seg
Ter
Qua
Qui
Sex
Sab
33
26
21
22
17
20
36
Resoluo:
Ho : As freqncias so iguais em todos os dias
H1 :As freqncias so diferentes em todos os dias
127
Dia da Semana
No de Acidentes
pi
Fe = n . p i
2calc =
Dom
Seg
Ter
Qua
Qui
Sex
Sab
k=7
33
1/7
25
26
1/7
25
21
1/7
25
22
1/7
25
17
1/7
25
20
1/7
25
36
1/7
25
175
25
+ ... +
(36 25) 2
25
---
---
= 12
2cal = 12
Concluso: Como o 2cal < 2tab, aceita-se Ho, ou seja, para = 5%, as freqncias
podem ser iguais.
Ex2.: O nmero de livros emprestados por uma biblioteca durante certa semana est
a seguir. Teste a hiptese que o nmero de livros emprestados no dependem do dia da
semana, com = 1%.
Dia da Semana
No de Livros
Seg
Ter
Qua
Qui
Sex
110
135
120
146
114
25
35
18
13
128
No de Defeitos
No de Aparelhos
25
35
18
13
100
pi
0.212
0.329
0.255
0.132
0.051
0.016
0.004
0.001
1.000
Fe = n . pi
21.2
32.9
25.5
13.2
5.1
1.6*
0.4*
0.1*
100
e i
(Distribuio de Poisson)
i!
n
=X=
e 1. 55 (1.55)
= 0.212
0!
X .f
i
i =1
p0 =
= 1.55
e 1 .55 (1.55)
= 0.051
4!
4
p4 =
e 1.55 (1.55)
p5 =
= 0.016
5!
e 1 .55 (1.55)
p1 =
= 0.329
1!
1
e 1 .55 (1.55)
= 0.255
2!
2
p2 =
e 1. 55 (1.55)
= 0.004
6!
6
p6 =
e 1.55 (1.55)
p3 =
= 0.132
3!
e 1 .55 (1.55)
p7 =
= 0.001
6!
32.9
+ ... +
(9 7.2 )2
.243
1472
= 3.474
4 5 6 7
2tab = 25%, 3 = 7. 81
Concluso: Como o 2cal 2tab , aceita-se Ho, ou seja, para = 5%, a distribuio do
nmero de defeitos/unidade pode seguir uma Distribuio de Poisson.
129
Ex2.: Verificar se os dados das distribuio das alturas de 100 estudantes do sexo
feminino se aproxima de uma distribuio normal, com = 5%.
No de Estudantes
4
12
22
40
20
2
k=6
100
Altura (cm)
Transf. "Z"
Prob (rea)
Fe = n . p i
- |--- -1.94
-1.94 |--- -1.04
-1.04 |--- -0.14
-0.14 |--- 0.76
0.75 |--- 1.66
1.66 |--- +
0.026 *
0.123
0.295
0.332
0.175
0.048 *
2.6
12.3
29.5
33.2
17.5
4.8
1.000
100.0
Resoluo:
Ho : A distribuio da altura das estudantes do sexo feminino normal
H1 : A distribuio da altura das estudantes do sexo feminino no normal
Para calcular pi, temos: Zi =
x
(Distribuio Normal Padro)
S
=X=
2calc =
X i . fi
i =1
f .(X
n
S=
= 168 .96
i =1
X)
n1
= 6.67
Z1 =
156 168. 96
= 1. 94
6. 67
Z4 =
174 168. 96
= 0. 76
6. 67
Z2 =
162 168 . 96
= 1. 04
6. 67
Z5 =
180 168. 96
= 1. 65
6. 67
Z3 =
168 168.96
= 0.14
6. 67
29 .5
1 2
33 .2
22
14444
2.34444
3
= 3.38
5 6
2tab = 25%,1 = 3. 84
Concluso: Como o 2cal 2tab , aceita-se Ho, ou seja, para = 5%, a distribuio da
altura das estudantes do sexo feminino normal.
130
2cal =
(Fo
i =1
Fe )
Fe
Feij =
Obs.: Em tabelas 2 x 2 temos 1 grau de liberdade, por isso utiliza -se a correo de
Yates, onde para n 50 pode ser omitida.
O teste do 2 no indicado em tabelas 2 x 2 nos seguintes casos:
i) quando alguma freqncia esperada for menor que 1;
ii) quando a freqncia total for menor que 20 (n 20);
iii) quando a freqncia total (20 n 40) e algumas freqncias esperadas for
menor que 5. Neste caso aplica-se o teste exato de Fischer.
Ex.: Verifique se h associao entre os nveis de renda e os municpios onde foram
pesquisados 400 moradores. Use = 1%.
Municpio
X
Y
A
28
44
Nveis de Renda
B
C
42
30
78
78
D
24
76
Ho : As variveis so independentes
H1 : As variveis so dependentes
X
Y
Total (c)
Fe11 =
A
28
44
72
B
42
78
120
124 x72
= 22. 32
400
C
30
78
108
Fe21 =
131
D
24
76
100
Total ( l )
124
276
400
276x72
= 49. 68
400
Fe12 =
124x120
= 37. 2
400
Fe22 =
276x120
= 82. 8
400
Fe13 =
124x108
= 33. 48
400
Fe23 =
276x108
= 74. 52
400
Fe14 =
124x100
= 31.0
400
Fe24 =
276x100
= 69
400
2
calc
2
2
(
28 22,.32)
(
42 37, 2)
=
+
22,32
2
(
76 69)
+ ... +
37,2
69
= 5,81
C=
2cal
2cal + n
0
25
1
19
2
10
3
9
4
4
5
3
Alta
18
26
6
Notas Escolares
Baixa
Mdia
5
17
16
38
9
15
132
R = aceita H o
Partido
A
50
29
B
72
35
C = 4%
Situao de Emprego
Empregado
Desempregado
10
8
60
22
R = Aceita H o
No de Firmas
3
12
14
9
7
5
50
R = Aceita Ho
freq. observada
2
10
26
45
60
37
13
5
2
200
133
10 REGRESS O E C ORRELAO
10.1 Introduo
Muitas vezes de interesse estudar-se um elemento em relao a dois ou mais
atributos ou variveis simultaneamente.
Nesses casos presume-se que pelo menos duas observaes so feitas sobre cada
elemento da amostra. A amostra consistir, ento, de pares de valores, um valor para cada uma
das variveis, designadas, X e Y. Um indivduo i qualquer apresenta o par de valores (Xi ; Yi).
Objetivo visado quando se registra pares de valores (observaes) em uma amostra, o
estudo das relaes entre as variveis X e Y.
Para a anlise de regresso interessam principalmente os casos em que a variao de
um atributo sensivelmente dependente do outro atributo.
O problema consiste em estabelecer a funo matemtica que melhor exprime a
relao existente entre as duas variveis. Simbolicamente a relao expressa por uma equao
de regresso e graficamente por uma curva de regresso.
10.2 Definio
Constitui uma tentativa de estabelecer uma equao matemtica linear que descreva o
relacionamento entre duas variveis (uma dependente e outra independente).
A equao de regresso tem por finalidade ESTIMAR valores de uma varivel, com
base em valores conhecidos da outra.
Ex.: Peso x Idade; Vendas x Lucro; Nota x Horas de Estudo
10.3 Modelo de Regresso
yi = xi + + i
y i valor estimado (varivel dependente);
x i varivel independente;
coeficiente de regresso (coeficiente angular);
coeficiente linear;
i resduo.
134
10.3.1 Pressuposies
Na regresso, os valores de "y" so estimados com base em valores dados ou
conhecidos de "x", logo a varivel "y" chamada varivel dependente, e "x" varivel
independente.
a) A relao entre X e Y linear (os acrscimos em X produzem acrscimos proporcionais em
Y e a razo de crescimento constante).
b) Os valores de X so fixados arbitrariamente (X no uma varivel aleatria).
c) Y uma varivel aleatria que depende entre outras coisas dos valores de X.
d) i o erro aleatrio, portanto uma varivel aleatria com distribuio normal, com mdia
zero e varincia 2. [ i ~ N (0, 2)]. i representa a variao de Y que no explicada pela
varivel independente X.
e) Os erros so considerados independentes.
Ex.: Vendas (x 1000) X Lucro (x100)
Obs.
Vendas
Lucro
1
201
17
2
225
20
3
305
21
4
380
23
5
560
25
6
600
24
7
685
27
8
735
27
26
Lucro
24
22
20
18
16
150
250
350
450
550
650
750
850
Vendas
Pelo grfico podemos observar que a possvel reta de regresso ter um coeficiente de
regresso (coeficiente linear) positivo.
135
a=
i=1
i =1
i =1
n xy x y
n
n x x
i =1
i=1
n
Sxy
b = y a x
Sxx
e i = y i yi = yi ( a + bx i )
Para facilitar os clculos da reta de regresso, acrescentamos trs novas colunas na
tabela dada.
Obs.
1
2
3
4
5
6
7
8
Vendas
Xi
201
225
305
380
560
600
685
735
3691
Lucro
Yi
17
20
21
23
25
24
27
27
184
X 2i
Yi2
X i .Yi
40401
50625
93025
144400
313600
360000
469225
540225
2011501
289
400
441
529
625
576
729
729
4318
3417
4500
6405
8740
14000
14400
18495
19845
89802
136
a=
i =1
i =1
i =1
n x i yi x i y i
n
n
n x 2i x i
i =1
i =1
8(89802) (3691)(184)
= 0,0159
2
8(2011501) (3691)
b = y a x = 23 - (0,159)(461,38) = 15,66
y = 0,0159 x + 15,66
Sada do Statistica
28
26
24
Lucro
y = 15,66 + 0,0159 x
22
20
18
16
150
250
350
450
550
650
750
850
Vendas
Partindo da reta de regresso podemos afirmar que para uma venda de 400 mil
podemos obter um lucro de y$ = ( 0. 0159 ) (400.000) + 15.66 = 22 mil .
Sadas do Statistica
Obs.: Para qualquer tipo de equao de regresso devemos ter muito cuidado para
no extrapolar valores para fora do mbito dos dados. O perigo da extrapolao para fora dos
dados amostrais, que a mesma relao possa no mais ser verificada.
137
SQTotal = (y i y)
i =1
i =1
i =1
i =1
2
2
2
( yi y) = (y i y) + ( yi yi )
Essa relao mostra que a variao dos valores de Y em torno de sua mdia pode ser
n
i =1
(y
yi ) ,
2
i =1
devido ao fato de que nem todos os pontos esto sobre a reta de regresso, que a parte no
explicada pela regresso ou variao residual.
Assim:
SQ. Total = SQRegresso + SQResduo
SQRegress ~ao
, e denominada coeficiente de
SQTotal
determinao, indica a proporo ou percentagem da variao de Y que explicada pela
regresso.
A estatstica definida por r 2 =
Note que 0 r2 1.
Frmulas para clculo:
2
n
SQTotal = ( yi y) = n y yi ,
i =1
i =1
i =1
n
2
i
SQ Regresso =
( y
i =1
n
n
n
2
y) = b n x i yi x i y i ,
i =1
i =1
i =1
138
Regresso
G.L.
1
SQ
SQRegresso
Resduo
n- 2
SQResduo
Total
n- 1
SQTotal
QM
QMRegress ~
ao
1
QMResduo
n -2
---
F
QMRegress ~
ao
QMResiduo
-----
onde QM representa Quadrado Mdio e obtido pela diviso da Soma de Quadrados pelos
respectivos graus de liberdade.
Para testar a significncia da regresso, formula-se as seguintes hipteses:
H0: =0 contra H1: 0, onde representa o coeficiente de regresso paramtrico.
Se o valor de F, calculado a partir do quadro anterior, superar o valor terico de F
com 1 e (n - 2) graus de liberdade, para o nvel de significncia , rejeita -se H0 e conclui -se que
a regresso significativa.
Se Fcalc. > F [1,(n-2)], rejeita-se H0.
139
Lucro
Obs.
Xi
Yi
X 2i
Yi2
X i .Yi
1
2
3
4
5
6
7
8
201
225
305
380
560
600
685
735
3691
17
20
21
23
25
24
27
27
184
40401
50625
93025
144400
313600
360000
469225
540225
2011501
289
400
441
529
625
576
729
729
4318
3417
4500
6405
8740
14000
14400
18495
19845
89802
yi = 0,0159x i + 15,66
n
n
n
SQRegress ~
a o = a n x i y i x i y i
i =1
i =1
i =1
SQRegress~
a o = 0,0159[8(89802) (3691)(184)] = 624,42
n
n
SQTotal = n y 2i y i
i =1
i=1
Regresso
Resduo
Total
G.L.
1
6
7
SQ
624,42
63,5 8
688,00
QM
624,42000
10,59587
---
F
58,93
-----
H0: = 0 e H1: 0
Comparando o Fcalc. = 58,93 com o Ftab. = F0,05 (1,6) = 5,99
Conclui-se que a regresso de y sobre x segundo o modelo yi = 0,0159x i + 15,66
significativa ao nvel de significncia de 5%. Uma vez estabelecida e testada a equao de
regresso, a mesma pode ser usada para explicar o relacionamento entre as variveis e tambm
para fazer previses dos valores de Y para valores fixados de X.
140
Sadas do Statistica
n
VT = SQTotal = ( yi y) = n y yi ,
i =1
i =1
i =1
n
2
i
(y
yi )
i =1
n
n
n
n xy x y
COVxy
i=1
i =1
i =1
r2 =
=
Sxx. Syy
n 2 n 2 n 2 n 2
n x x n y y
i =1 i=1
i =1
i=1
r2 =
[8(89802) - (3691)(184)]2
= 0.908
141
Sadas do Statistica
valor de r
-0,5
+0,5
-1
+1
Negativa Negativa Negativa
forte
moderada fraca
142
r=
n
n
n
n xy x y
Sxy
i =1
i =1
i =1
=
S xx .Syy
n 2 n n 2 n
n x x n y y
i =1 i =1
i =1
i =1
Logo podemos observar que o coeficiente de determinao nos d uma base intuitiva
para a anlise de correlao.
No exemplo temos r = 0.95 3
Sada do Statistica
LUCRO = 15,660 + ,01591 * VENDAS
Correlao: r = ,95295
28
26
Lucro
24
22
20
18
16
150
250
350
450
550
Vendas
143
650
750
850
Regression
95% confid.
10.9 Exerccios
Para os dados abaixo:
a) Construa um diagrama de disperso;
b) Determine a reta de regresso;
c) Faa uma anlise de varincia do modelo;
d) Calcule o Coeficiente de Explicao;
e) Calcule o Coeficiente de Correlao de Pearson;
f) Interprete os resultados obtidos.
X = 1o Exame e Y = 2 o Exame
Aluno
Exame 1
Exame 2
1
82
92
2
84
91
3
86
90
4
83
92
5
88
87
6
87
86
7
85
89
8
83
90
9
86
92
10
85
90
1
2
1
2
4
3
3
5
6
4
5
6
5
6
8
6
8
7
7
9
8
8
10
10
6
32
92
7
18
72
1
20
64
2
16
61
3
34
84
4
23
70
5
27
88
8
22
77
1
65
68
2
63
66
3
67
68
4
64
65
5
68
69
6
62
66
144
7
70
68
8
66
65
9
68
71
10
67
67
145